問題描述
OSN1500設備更換83槽位PCXL單板后,上報NESOFT_MM告警。在網管查詢主控板版本,都為5.36.30.15P01。
用:hbu-get-backup-info查詢,返回 Backup-Info : 0x00000002 ,主備同步失敗。
NESOFT_MM參數為:0x02,0x03,0x00,0x08,0xFF
處理過程
原因一:主備板上當前運行的軟件版本不一致。
原因二:主控板的主備區中(OFS1和OFS2)的軟件版本不一致。
原因三:主備板上對板的對應目錄下沒有同名文件。
解決方案
1、查詢NESOFT_MM告警意義
根據OSN1500告警資料,發現該設備告警意義為主備主控板的NeSoft和Platform不一致。
2、用命令行查詢兩塊主控的版本:
:sftm-get-testver:82
VERSION-INFORMATION(INCLUDING-PATCH-INFORMATION)
NESOFTNAME VER DATE STATE TEST-VERSION-INFO
NFS 5.36.30.15P01 20100220 Running T02
NSF1 5.36.30.15P01 20100220 active T02
NSF2 5.36.30.15P01 20100220 inactive T02
INI1 5.36.30.15P01 20091218 active T02
INI2 5.36.30.15P01 20091218 inactive T02
BIOS 08.09.04 20100716 inactive T01
ExtBIOS 09.09.04 20091218 active T01
Logic (U1028)120
LogicE01 (U1033)300
DRV V1.02 20090515 active T04
Total records :10
:sftm-get-testver:83
VERSION-INFORMATION(INCLUDING-PATCH-INFORMATION)
NESOFTNAME VER DATE STATE TEST-VERSION-INFO
NFS 5.36.30.15P01 20100220 Running T02
NSF1 5.36.30.15P01 20100220 active T02
NSF2 5.36.30.15P01 20100220 inactive T02
INI1 5.36.30.15P01 20091218 active T02
INI2 5.36.30.15P01 20091218 inactive T02
BIOS 08.09.03 20091218 inactive T01
ExtBIOS 09.09.04 20091218 active T01
Logic (U1028)120
LogicE01 (U1033)300
DRV V1.02 20090515 active T04
Total records :10
發現主備主控查詢出來的軟件版本是一致的,但基礎BIOS不一致。查詢版本配套表,基礎BIOS應該為08.09.03。
3、使用Navigator查看兩套主機軟件
:sftm-show-dir:82,"/ofs1/hwx"
:sftm-show-dir:82,"/ofs2/hwx"
:sftm-show-dir:83,"/ofs1/hwx"
:sftm-show-dir:83,"/ofs2/hwx"
:sftm-show-dir:82,"/ofs1/fpga"
:sftm-show-dir:82,"/ofs2/fpga"
:sftm-show-dir:83,"/ofs1/fpga"
:sftm-show-dir:83,"/ofs2/fpga"
等命令分別查詢主備主控的OSF1、OSF2目錄下的hwx,fpga文件夾,對比發現82槽主主控/ofs2/hwx下比83槽備主控對應目錄少了一個sccpkg.ini文件。查詢版本配套表和其他正常的網元,發現該文件應該要存在。
問題定位
OSN1500B 82槽位主控osf2/hwx內文件與83槽位不一致。82槽位基礎BIOS不是配套表要求版本。
處理方法
使用Toolkit重新對82槽的PCXL軟件包進行板級加載,然后再將基礎BIOS降級到08.09.03。觀察一段時間后,告警不再上報。問題解決。
建議與總結
1、NESOFT_MM告警并非只有主備主控版本不一致才上報,文件巡檢時發現目錄下文件不一樣也會上報該告警,處理時需要仔細分析告警參數。
2、公司備件有可能和在網運行版本不一致,更換備件時需要注意。