問題描述
OSN3500部分版本,在如下任意一個場景下,都會導致主控反復重啟(一般是12分鐘左右復位一次):
場景1,OSN3500擴展子架上面的單板曾經或現在使能了告警反轉功能;
場景2,OSN3500網元主子架上面的物理單板和邏輯單板不一致,且該單板設置過或正使能了告警反轉功能。
告警信息
主控反復重啟(一般是12分鐘左右復位一次),可通過errlog命令查詢。
處理過程
判斷方法:
該問題可以通過errlog和dbms-query:"alminv.dbf",drdb兩條命令進行判斷
1,如果errlog里面發現有如下記錄,基本可以判斷為該問題導致:
fatal task errorcode=1, Line 2069 in alm_char.cpp:TA
2,再使用:dbms-query:"alminv.dbf",drdb命令進行查詢,在以下的反饋結果中,"4d"和"57"表示存在
上面的場景1,"ff"表示存在上面的場景2
:dbms-query:"alminv.dbf",drdb
ALMINV.DBF
record num BID OPPORT PATH ALLOW
1 ff 01 0001 01
2 05 02 0001 01
3 05 03 0001 01
4 05 04 0001 01
5 05 05 0001 01
6 4d 06 0001 01
7 57 07 0001 01
緊急解決:
方法1,如果現網上面告警反轉功能還是使能,可以關閉該告警反轉功能后,更換一塊全新的主控板(如果現網上面是雙主控,需要將雙主控全部拔掉),然后使用T2000進行配置數據上載;
方法2,在網元正常運行時,檢查到告警反轉數據庫有擴展子架槽位的BID情況下,需要刪除掉告警的反轉數據庫,避免復位后出現網元反復復位,執行下面操作恢復。
:dbms-get-autobackup //(1)
:dbms-set-autobackup:disable; // 查詢(1)的結果為enable,才設置為disable
:dbms-get-cyclebackup //(2)
:dbms-set-cyclebackup:disable;// 查詢(2)的結果為enable,才設置為disable
:dbms-delete:"alminv.dbf",drdb
:dbms-copy-all:drdb,fdb0
:dbms-copy-all:drdb,fdb1
:dbms-query:"alminv.dbf",fdb0
:reset
:dbms-query:"alminv.dbf",drdb
:dbms-set-autobackup:enable; // 查詢(1)結果為enable,需要恢復回原來的狀態
:dbms-set-cyclebackup:enable; // 查詢(2)結果為enable,需要恢復回原來的狀態
方法3:升級到解決了該問題的如下版本:
V版本 T版本
OSPV100R007C03 T15及以后版本
OSPV100R008 B01D及以后版本
OSPV100R009 B01D及以后版本
根因
該問題為平臺版本缺陷,涉及到的平臺版本為:
OSPV100R007C02T18D02及以前版本
OSPV100R007C03T13D02及以前版本
OSPV100R008B01C及以前版本
OSPV100R009B01C及以前版本
平臺版本可以通過命令行: sys-get-ptsoftver進行查詢;
注:該問題不止影響OSN 3500產品,其它光網絡產品如果使用了以上平臺,都存在該問題隱患
建議與總結
對于該問題,如果在以上版本,建議不在擴展子架上面設置告警反轉功能;
該問題影響使用了以上平臺版本的所有光網絡設備。