• 您好!歡迎進入深圳市華訊佳科技有限公司官網!

  • 15088181811
您當前所處位置: 首頁 > 新聞資訊 > 華為案例

OSN3500為何SNCP正常誤碼倒換了BIP_SD告警仍上報了36秒鐘

發布人:華訊佳 發布時間:2021-11-15 瀏覽數:

問題描述

A-B-C-A三個OSN7500設備組10G速率SNCP環,主環方向為A->B->C,其中A通過無保護鏈下帶A',C通過無保護鏈下帶C',A'、C'都是OSN3500設備,所有網元的主機版本為5.**.18.50P01,某日B收A方向光路衰減突變,導致B收A方向光板閃報了6秒鐘的B3_SD告警,從網管的異常事件中看C站點同時也發生了SNCP誤碼倒換,但C'網元支路板卻上報了35~37秒的BIP_SD告警,同時用戶交換側也反饋業務也出現了幾秒鐘的中斷。


告警信息

B3_SD、BIP_SD


處理過程

1、檢查C站點SNCP屬性設置,都已經打開了SD誤碼倒換,排除SD倒換開關未設造成業務中斷;

2、檢查網管異常事件,用戶反饋有中斷的業務當時都已經發生了SNCP誤碼倒換,當前所有業務都工作在SNCP備用通道上,排除SNCP監測點異常;

3、查詢誤碼的檢測原理,發現VC12級別業務的SD檢測條件是“在40S的滑動窗口內,平均誤碼率超過10-6才上報BIP_SD告警”,而SD告警的消失條件為“在40S的滑動窗口內,平均誤碼率小于10-7 SD告警結束”,VC4級別業務的SD檢測條件與2M業務類似,只是滑動窗口為10S;

4、我們假定一條2M業務出現10-5誤碼率,那從誤碼開始出現到上報SD告警,中間需要4S時間(因為只有至少持續4S,除以40S后才能不低于10-6),而當業務出現10-5的誤碼率時,是很可能造成業務中斷的;如果要求從誤碼出現的100MS內上報SD告警,則要求這100MS內的平均誤碼率不低于4*10-4;

5、40秒內平均誤碼率的計算公式=(40S內總誤碼數量)/(40S內傳送的總BIT數量),誤碼數量與性能中統計的誤碼個數相同(因為采用BIP2誤碼校驗,實際誤碼數量很可能比性能中統計的誤碼數量更大),40S內總BIT數量=40(時間)×8000(1秒8000幀)×35(一個VC12 35個字節)×8(一個字節8bit)=89600000, 如果要達到SD的條件,89600000×10-6約等于90,也就是40S內超過90個誤碼才會達到BIPSD條件;同理40S內低于9個誤碼SD告警才會消失;

6、通過調節可調光衰進行實驗驗證,發現在不同的調節方法下,在實際誤碼消失后,SD告警的持續時間有長有短,一般在出現誤碼后慢慢降低可調光衰的衰減,在誤碼消失后SD告警的持續時間比較短,在出現誤碼后迅速降低可調光衰的衰減,SD告警的持續時間就比較長,最長時間可在誤碼消失后仍持續40S,實驗結果與理論推斷一致;

7、由于現場故障只出現了一次,且不具備再次測試的條件,我們無法判斷現場到底是誤碼出現多長時間后才上報了SD告警并觸發SNCP倒換,也無法判斷故障發生時的誤碼率到底是多少,但從當時上報了SD告警并發生了sncp誤碼倒換判斷,SNCP倒換是正常的。但從上面的理論中可以確認,對于誤碼倒換,是無法保證不中端業務的,除非對接設備能給出更寬的保證業務不中端的范圍,比如交換機保證“在45S的滑動窗口內,平均誤碼率超過10-6才中斷業務”,目前看對接設備不能保證上面的條件;

8、既然如此,為何不把SD的檢測窗口縮短,比如縮短到1S,當然這樣設置是能更快的觸發倒換,但如果檢測周期只有一秒,根據上面的計算公式,當1S內大于等于3個誤碼時,就會觸發SD倒換,這樣可能造成頻繁的倒換,另外縮短檢測周期對設備的硬件性能要求也更高,硬件未必能夠承受。


根因

VC12級別業務的SD檢測條件是“在40S的滑動窗口內,平均誤碼率超過10-6才上報BIP_SD告警”,而SD告警的消失條件為“在40S的滑動窗口內,平均誤碼率小于10-7 SD告警結束”,VC4/MS/RS級別業務的SD檢測條件與2M業務類似,只是滑動窗口為10S。

不同門限、不同級別業務的滑動窗口周期如下:

檢測器門限 STM-N/VC-4-Xc/VC-4/VC-3級別業務  VC-2VC-12/VC-11級別業務

10-3 10 ms 40 ms

10-4 100 ms 400 ms

10-5 1 s 4 s

10-6 10 s 40 s

10-7 100 s 400 s

10-8 1000 s 4000 s

10-9 10000 s 


建議與總結

誤碼倒換是不能完全保證不中端業務的,即便我們將SD門限設置成10-7,但檢測周期同時被拉長到了400S,需要在400S內平均誤碼率超過10-7才上報SD告警,但如果誤碼集中在某個時間段,還是可能造成實際業務已中斷、但傳輸設備還未達到倒換的門限,所以不要隨意向用戶承諾傳輸設備可以保證誤碼倒換不中端業務;如果用戶非要承諾,至少也要對接先給出類似承諾:“在40S的滑動窗口內,如果平均誤碼率不超過10-6不會中斷業務”。


午夜无码电影888不卡