問題描述(故障現象)
某本地環2上的162個基站業務中斷4分鐘。通過查詢網管歷史告警和操作日志,發現14點45分時有網管管理用戶對S385網元的8和9號槽位時鐘板進行了復位,間隔時間為九秒鐘,當單板復位完成后所有業務恢復正常。
原因分析
結合客戶端日志與網管操作日志分析:
現場一admin用戶,所在IP:192.7.1.4,在2012-05-1714:46:19網管操作下發了一次復位8#SC板的操作。緊接著在9s后的14:46:28又對9號槽位的sc板進行了單板復位操作。此時8#槽位的交叉板還沒有完全運行起來,9#槽位的交叉板又復位,導致業務中斷。以下是復位的記錄:
2012-05-1714:46:19,921INFO[com.zte.ican.pal.config.boardcommonconfigmaintenance.view.TAbsResetBoardPanel]LLHobj:SC[0-1-8-2]
2012-05-1714:46:28,296INFO[com.zte.ican.pal.config.boardcommonconfigmaintenance.view.TAbsResetBoardPanel]LLHobj:SC[0-1-9-2]
ZXMP S385設備的時鐘板復位時會將CS板一同復位?,F場在2塊CS板復位的情況下,業務肯定會中斷。
在2012-05-17的操作日志里我們還發現在2012-05-1714:27:30到2012-05-1714:32:18之間進行了13個325網元的主備SC板復位,均為網管操作下發。
解決方案
建議復位設備的交叉板時,先把業務倒換到保護單板后再復位,等待3分鐘單板復位完成后再操作另外一塊單板,否則就會引起該網元上的業務中斷。