監控工程萬(wàn)建電子介紹監控知識
作者: 發(fā)布日期:2018-03-07 點(diǎn)擊次數:683
監控工程萬(wàn)建電子介紹監控知識:
1、監控方法
1.了解監控對象:我們要監控的對象你是否了解呢?比如CPU到底是如何工作的?
2.性能基準指標:我們要監控這個(gè)東西的什么屬性?比如CPU的使用率、負載、用戶(hù)態(tài)、內核態(tài)、上下文切換。
3.報警閾值定義:怎么樣才算是故障,要報警呢?比如CPU的負載到底多少算高,用戶(hù)態(tài)、內核態(tài)分別跑多少算高?
4.故障處理流程:收到了故障報警,那么我們怎么處理呢?有什么更高效的處理流程嗎?
2、監控核心
1.發(fā)現問(wèn)題:當系統發(fā)生故障報警,我們會(huì )收到故障報警的信息
2.定位問(wèn)題:故障郵件一般都會(huì )寫(xiě)某某主機故障、具體故障的內容,我們需要對報警內容進(jìn)行分析,比如一臺服務(wù)器連不上:我們就需要考慮是網(wǎng)絡(luò )問(wèn)題、還是負載太高導致長(cháng)時(shí)間無(wú)法連接,又或者某開(kāi)發(fā)觸發(fā)了防火墻禁止的相關(guān)策略等等,我們就需要去分析故障具體原因。
3.解決問(wèn)題:當然我們了解到故障的原因后,就需要通過(guò)故障解決的優(yōu)先級去解決該故障。
4.總結問(wèn)題:當我們解決完重大故障后,需要對故障原因以及防范進(jìn)行總結歸納,避免以后重復出現。