問題描述
某局OSN2500設備,板位配置為:6、7、13槽位為ssn2PQ1,8槽位為ssn1EFT8,9、10槽位為SSQ5CXLL16,在11槽位和12槽位分別擴容ssn1slq4板,插入任意一塊ssn1slq4單板后,設備其他單板均出現BD_STATUS、COMMUN_FAIL等告警,承載業務故障。
處理過程
1、擴容單板故障,但擴容兩塊單板同時故障,可能性不大;
2、分析數據,發現每次故障時10槽位的備用CXL板都有復位現象,懷疑是該單板故障導致;同時分析黑匣子數據,發現8槽位EFT板數據通信異常,也可能是該板導致接口故障;
3、由于設備前期有過高溫經歷,懷疑可能母板是否由于高溫導致接觸不良。
4、電源問題,現場通過兩個UPM-GIE4805S給設備進行供電。
根因
UPM電源輸出連線錯誤
解決方案
1、現場處理,首先拔出10槽位的CXL板,擴容SLQ4,發現均可以正常擴容,說明SLQ4單板正常;更換10槽位的CXL板,插入單板后,故障重現,說明10槽位的CXL板正常;
2、更換8槽位EFT板,現象依舊;
3、更換設備機框,現象依舊;
4、逐個插拔單板測試,未發現單板異常,同時測試發現8槽位EFT或10槽位CXL或9槽位CXL只要有一塊單板不插入,設備均可以正常工作。
5、分析設備功耗,根據目前插板情況,設備實際功耗為236W,查閱UPM-GIE4805S資料,4805單模塊帶負載能力為270W,完全可以滿足設備功率需求。
6、關閉設備PIU的一路供電,發現設備無法正常工作,好多單板不啟動;關閉另外一路PIU供電,現象一樣,判斷可能是客戶外電問題或外置的UPM故障。
7、查看客戶外部供電,客戶外部供電同時給其他交換機、路由器及MSAP供電均正常,判斷應該是UPM問題。拆除UPM檢查,發現在UPM側電源輸出連線錯誤,UPM側共有三個輸出端子,分別為LOAD1(負載1接口)、LOAD2(負載2接口)、BAT(蓄電池接口),現場將設備電源接入到了BAT接口,該接口的輸出電流指標≤3A,因此無法滿足設備功率需求,將設備電源接入到LOAD1口后,設備工作正常,問題解決。