問題描述
某OSN1500B網元未做操作的情況下出現如下告警,需要查出告警原因。
235439 10 BD_STATUS MJ end 2013-03-11 02:30:59 2013-03-11 02:31:42 0xff 0xff 0xff 0xff 0xff
235440 18 BD_STATUS MJ end 2013-03-11 02:31:13 2013-03-11 02:32:05 0xff 0xff 0xff 0xff 0xff
235441 19 BD_STATUS MJ end 2013-03-11 02:31:13 2013-03-11 02:32:05 0xff 0xff 0xff 0xff 0xff
單板信息如下:
:cfg-get-board;
INSTALLED-BOARD
BID BD-TYPE ACTIVE-STATE
3 ssr1sld4 active
4 ssq1sl4 active
5 ssq1sl4 active
6 ssr2PD1 active
7 ssr2pd1 active
8 ssr2pd1 active
10 aux active
11 ssn1slq1 active
12 ssn1slq1 active
13 ssr1sld4 active
15 ssn1d12s active
17 ssn1d12s active
18 piu active
19 piu active
20 ssr1fan active
80 ssq2ecxl active
81 ssq2ecxl active
82 GSCC active
83 gscc active
Total records :19
BD_STATUS
處理過程
由于OSN1500網元(包括1500A和1500B)子架空間有限,所以PIU板的在位線是經過AUX送到主控的,這樣AUX軟復位會導致PIU同時上報BD_STATUS告警。這是OSN1500的硬件特性。
根因
OSN1500網元PIU的在位線是經過AUX送到主控的,這樣AUX軟復位會導致PIU同時上報BD_STATUS告警的。
解決方案
1、首先懷疑是bd_status告警的已知問題:在位線抖動。根據相關案例排查排除掉。
2、由于PIU是同時上報,同時消失,不可能是兩塊PIU同時出現硬件問題報不在位。
3、觀察10#板AUX的告警時間和PIU的告警時間在上報時間和結束時間似有一點聯系。
4、查看AUX的errlog.log日志,發現當天有軟復位記錄,時間上同上報BD_STATUS告警的時間一致。
2013-03-10 [18:31:00] 0x0a 0xf0000010 0x00000001
由此可知道AUX上報BD_STATUS是因為發生了軟復位。
5、那么PIU為什么上報BD_STATUS呢,和AUX有什么聯系呢?查詢資料后得知原因,1500網元PIU的在位線是經過AUX送到主控的,這樣AUX軟復位會導致PIU同時上報BD_STATUS告警的。