華為MA5600故障處理常用方法
華為MA5600處理故障時可以采用多種故障定位方法。在實際的故障定位過程中,各種定位方法往往可交叉使用,互為補充。
為提高效率,實際操作過程中,華為MA5600故障處理遵循由外到內(nèi)、由大到小的原則,即先查看外部線纜連接是否牢靠、各指示燈狀態(tài)是否正常,然后通過控制臺查看系統(tǒng)的整體運行狀態(tài),最后再查看各個模塊的運行狀態(tài)。
故障定位的各個過程及其常用的方法如表1所示
表1 故障處理流程圖 | ||
故障定位過程 | 常用方法 | 其它方法 |
排除外部設(shè)備故障 | · 對比分析 · 互換分析 · 儀表測試 · 協(xié)議分析 | · 告警分析 · 性能分析 |
故障定位到具體設(shè)備 | · 分段處理 · 配置數(shù)據(jù)分析 | · 告警分析 · 性能分析 |
故障定位到單板 | · 分段處理 · 替換分析 · 儀表測試 | 協(xié)議分析 |
配置數(shù)據(jù)分析
重配置不當(dāng)、擴(kuò)容配置不當(dāng)、過往配置遺留的問題隱患等都是導(dǎo)致MA5600故障的原因之一,因此定位和排除故障時有必要對配置數(shù)據(jù)進(jìn)行檢查分析。維護(hù)工程師必須掌握不同業(yè)務(wù)功能的配置方法、實現(xiàn)原理,從而掌握不同故障現(xiàn)象需要重點檢查哪些配置數(shù)據(jù),防止盲目定位,降低故障處理效率。
告警分析
通過分析告警信息,能找到部分故障的原因,或配合其他方法共同定位故障原因。
告警是故障或者事件發(fā)生的重要提示信息,告警信息包含故障或異?,F(xiàn)象的具體描述、可能的原因、修復(fù)建議等,涉及硬件、鏈路、業(yè)務(wù)、CPU占用率等各個方面,信息豐富、全面,是進(jìn)行故障分析和定位的重要依據(jù)之一。
當(dāng)華為MA5600系統(tǒng)出現(xiàn)故障時,請查看系統(tǒng)是否有告警上報。如果系統(tǒng)有告警上報,則分析出同本故障相關(guān)的告警,然后根據(jù)告警參數(shù)的指導(dǎo)清除這些告警,進(jìn)而清除故障。
對比分析
對比分析是指將故障的部件或現(xiàn)象與正常的部件或現(xiàn)象進(jìn)行比較分析,找出不同點,從而判斷問題的所在。如:業(yè)務(wù)故障時的線路參數(shù)與業(yè)務(wù)正常時進(jìn)行對比、同等地位的設(shè)備間進(jìn)行對比。對比分析適用于故障單一的場合。
互換分析
在更換備件后仍不能定位故障時,可以使用互換分析法定位和排除故障。
互換是指將處于正常狀態(tài)的部件(如單板、線纜等)與可能故障的部件對調(diào),通過比較對調(diào)后二者運行狀況的變化,確定故障的范圍或故障點。此方法適用于:
· 在更換部件后,仍然不能確定故障范圍或故障點的場合。
· 故障復(fù)雜的場合。
注意:互換操作具有一定的風(fēng)險。例如:將短路的單板換到正常的機框中有可能造成正常機框損壞。因此,使用互換方法必須謹(jǐn)慎,確保不會導(dǎo)致新故障。
分段處理
在故障可能原因復(fù)雜,涉及到多個環(huán)節(jié)時,使用分段處理的方法逐個排除可能產(chǎn)生故障的環(huán)節(jié),最終定位故障點。
進(jìn)行分段處理的前提是確定可能產(chǎn)生故障的環(huán)節(jié),然后運用合適的定位手段(如:各種環(huán)回操作、配置數(shù)據(jù)分析等)進(jìn)行逐個排查。因此,本操作對維護(hù)工程師技能有一定要求:
· 對華為MA5600/MA5603的系統(tǒng)結(jié)構(gòu)和功能特性原理有深入的了解。
· 對可能導(dǎo)致業(yè)務(wù)故障的各個環(huán)節(jié)全面了解。
· 熟練掌握環(huán)回、配置數(shù)據(jù)分析等故障診斷操作。
· 熟練使用測試儀器。
說明:分段處理往往涉及整個組網(wǎng)的各個環(huán)節(jié),建議按照先遠(yuǎn)程處理后近端處理、由最可能原因到次要原因、由簡單到復(fù)雜的順序進(jìn)行不同環(huán)節(jié)的排查,以降低故障處理成本,提高故障處理效率。
協(xié)議分析
協(xié)議分析主要用于當(dāng)MA5600/MA5603與上層設(shè)備的對接出現(xiàn)問題時定位和排除故障,是定位故障的重要手段。
協(xié)議分析是指通過信令跟蹤、捕獲數(shù)據(jù)包(即通常所說的“抓包”)等手段對故障進(jìn)行分析的方法。協(xié)議分析要求維護(hù)工程師對協(xié)議有深入的了解,掌握各種協(xié)議報文的交互流程,從而能夠從捕獲的報文中找出故障的真正原因。
例如:某用戶不能點播組播節(jié)目,通過抓包分析發(fā)現(xiàn),BRAS丟棄了該用戶發(fā)出的IGMP報文。
儀表測試
儀表測試法是指使用各種儀器、儀表取得實際的各種性能參數(shù),對照正常的參數(shù)值來定位和排除故障。儀器、儀表以直觀、量化的數(shù)據(jù)直接反映設(shè)備運行狀態(tài),在故障處理過程中有著不可替代的作用。
在故障處理中常用的儀器、儀表包括:
· 萬用表
· 線路測試儀
· 光功率計
· 光衰減器
性能分析
性能分析是指通過MA5600/MA5603提供的性能統(tǒng)計手段,對發(fā)生故障的業(yè)務(wù)進(jìn)行性能指標(biāo)的分析,從而定位故障原因。
針對不同的故障類別,需要查看不同的統(tǒng)計信息,這要求維護(hù)工程師:
· 熟悉系統(tǒng)的結(jié)構(gòu)和運行機制。
· 了解系統(tǒng)能夠提供哪些統(tǒng)計信息。
· 了解如何查看、分析統(tǒng)計信息。
例如:在以太網(wǎng)端口模式下,使用display port statistics命令查詢以太網(wǎng)端口的統(tǒng)計信息,根據(jù)以太網(wǎng)端口的統(tǒng)計信息判斷設(shè)備運行是否正常:
· 如果發(fā)現(xiàn)CRC錯誤幀增長很快,說明設(shè)備之間可能存在鏈路異常、端口協(xié)商不正確或端口物理故障。
· 如果發(fā)現(xiàn)存在大量的丟棄幀,說明對接設(shè)備發(fā)送的流量超過了端口的接收能力。