利用主動/被動保障改進故障隔離
當網絡中的某個地方出問題時,我們通常稱之為“事件”或“缺陷”,這聽起來似乎沒什么危害,畢竟只是發(fā)生了一些“事件”而已,沒什么大不了的,不是嗎?但出于某種原因,客戶并不會如此看待問題。服務遭受的一次小干擾或不怎么好的體驗都可能讓客戶存疑。隨著5G帶來爆炸性的需求、更高的客戶期待以及更甚于從前的復雜性,挑戰(zhàn)只會變得越來越嚴峻。那么,您又如何確保自己能夠準確捕捉性能問題,并在問題升級成危機之前排除缺陷隱患呢?
希望您通過我們的“5G變革需要自動化保障”系列連載與我們共同踏上探索的旅程,并共同理解5G所帶來的挑戰(zhàn)以及一些有效的全新測試方法,如:自動化保障、5G網絡切片的質量監(jiān)控,以及自動化變化管理等,F在,我們將了解一下可以幫助運營商探測和隔離自動化網絡中各類缺陷的多種方法。
自動化保障的兩種模式
在之前的文章中,我們已經介紹了自動化保障,此篇會講解另外層面的細節(jié)。自動化保障包含兩個主要的虛擬化保障功能類別:主動保障和被動保障。從設計上來說,兩個類別的虛擬化功能都能與網絡無縫集成(即編排),實現缺陷探測和解決過程的自動化。先來了解每種方法的優(yōu)點和弱點,以及為什么兩種方法對于5G都具有至關重要的意義。

被動保障
是確認網絡健康情況的傳統(tǒng)方法。虛擬和物理網絡功能、DPI(深層包檢測)探測器和協(xié)議探測器可以被動監(jiān)控網絡中的信令和用戶流量,而被動保障正是通過它們來采集遙測數據。我們還可以從其它的用戶數據源采集數據,例如向運營商通報用戶狀態(tài)及使用網絡情況的記賬記錄等。
優(yōu)點:被動保障會從所有使用服務的運營商客戶那里采集數據。這種方法尤其適用于確定有多少客戶受到了問題的影響。由于此方法要處理海量的數據,因此最適合探測關聯(lián)統(tǒng)計數據所指示的問題,這些數據來自多種數據源,如信令流量、用戶層分組報頭和網絡組件計數器等。當某項新功能、切片或服務已經啟動,而流量水平仍保持最低水平時,被動保障最能發(fā)揮自身的效力。
局限性:被動保障能夠為探測重大問題提供有價值的深入認知。但網絡的真實使用情況千差萬別,網絡或服務性能中的微小變化都可能源于出現差異的流量水平、地理流量分布中的變化,或是所用應用組合的差別。這些微小的性能變化也可能源于一些其它的網絡缺陷,而這些缺陷在被動保障所依賴的關聯(lián)高級別數據中并未顯現出來,直到升級為嚴重問題時才可能為人所知。
由于被動保障的安裝和分析過程都非常昂貴,運營商需要權衡將監(jiān)控功能布置在何處,通常是將探測器部署在網絡的關鍵組成部分中。如果想在任何時間對所有的流量、網絡中的所有部署進行監(jiān)控,則不符合成本效益原則。因此,當問題在某個特定的時間發(fā)生時,運營商可能并沒有將問題的所在點涵蓋在內。
要想準確地體會真實的用戶體驗,僅依靠信令和統(tǒng)計數據并非完全不可能,但卻非常困難。例如,如果只收集網絡核心數據,無法準確理解客戶在遙遠端點處的真實體驗。
更重要的是,被動保障依靠的是網絡和服務使用時生成的數據。正如其名,它是“被動”的,只會等到客戶使用網絡時才能發(fā)揮作用,在用戶創(chuàng)建流量前的啟動階段,或對于那些關鍵且始終在線但大多處于非活動狀態(tài)的服務(如物聯(lián)網警報和公共安全網絡),此方法并不是很有幫助。
主動保障
是被動保障的一種完美補充。主動保障也被稱為主動測試,它包含一個主動保障控制器和一些虛擬測試代理(VTA)。在控制器的指導下,這些VTA可以仿真出網絡的某些部分、終端用戶設備和具體應用的使用情況,創(chuàng)建出少量合成流量并將其注入網絡中。這些合成流量使主動保障系統(tǒng)能夠在網絡中不存在實際用戶流量的情況下對網絡的性能進行評估。因此,當您首次啟動某項功能,希望確保公共安全網絡的正確運行,或者需要隔離某項復雜的問題時,主動保障便是最理解的選擇。

在使用主動保障時,可以向網絡中嵌入已知數量的合成流量,可以容易地測量端點輸出的流量。還記得嗎?我們已經知道用戶流量變化多端的特性會導致不確定性,其中的微小性能波動既可能是正,F象,也可能是真實問題的前兆。通過向網絡中嵌入已知流量,主動保障便可以幫助執(zhí)行基準測試,并在一定的時間里對性能的精細變化加以跟蹤,將正常的變化與重大問題區(qū)分開。
此外,我們可以將VTA實例化到網絡中的某個特定部分中運行測試,然后取消該代理的實例。整個過程都非常簡單且成本效益極高。VTA可以嵌入網絡中的任意位置,可以在不同的位置執(zhí)行類似的測試。通過VTA的連續(xù)運行,確保關鍵鏈路和服務的可用性和性能水平。
由于使用的是已知合成流量,主動保障不僅可以幫助運營商查找復雜的問題,還可以提供用戶層性能的完整可視性,以及客戶真實的端對端服務體驗,而這在被動保障中都是無法想象的。
- 在網絡搭建完成并開始運行時對性能進行監(jiān)控
- 跟蹤包含連貫流量流的服務和鏈路
- 探測重大問題并確定有多少用戶受到了影響
- 查找網絡中高優(yōu)先級部分的問題
主動保障為被動保障提供補充:
- 在客戶使用開始之前對啟動后的性能加以評估
- 連續(xù)檢查關鍵服務和鏈路,如:物聯(lián)網警報傳感器、冗余網絡鏈路或公共安全網絡,無需考慮使用水平如何
- 以前瞻方式查明微小問題,防止升級為重大問題
- 獲得用戶端對端性能和服務體驗的完整可視性
- 在網絡中任意部分查找復雜的問題,采用虛擬化方式并注入流量
- 性能挑戰(zhàn)不斷增長,測試工具持續(xù)更新
的確,網絡自動化、5G,以及饑渴的消費者使用的高帶寬占用的數據密集型應用都使數據需求如滾雪球般地增長,對業(yè)界帶來了前所未有的挑戰(zhàn)。通過深思熟慮的組合方式使用被動保障和主動保障,運營商可以確保自己滿足客戶的需求,并且兌現高質量體驗的承諾。