中國的互聯網業務蓬勃發展,網絡流量增長迅猛,每18個月增長3倍。而集成電路上可容納的晶體管數目每18個月增加一倍,因此,流量增長的速度超過了受摩爾定律限制的路由器的發展速度,骨干網由此進入后摩爾時代... 文/蔡濤 王凱
后摩爾時代的骨干網,面臨著巨大的擴容壓力,這是運營商面臨的第一道坎;骨干網容量擴大后,一旦發生故障,影響會更加廣泛,可靠性成為第二道坎;此外,網絡不斷擴容帶來運維的復雜度增加。運營商應該如何邁過這三道坎?
流量激增,擴容壓力大
視頻等寬帶業務的開展,使用戶對于互聯網帶寬的需求持續增長,骨干網容量的壓力日益顯著。然而,運營商擴容骨干網的投資是一筆不菲的數目。同時,每兆比特的ARPU值不斷下降已成為趨勢,而一部分互聯網應用甚至分流現有電信業務的利潤,這讓運營商無法有足夠的投資動力。
如何減少骨干網的擴容壓力呢?提升節點能力、優化網絡架構、對網絡進行多層協同規劃,或許是可行的措施和選擇。
提升節點能力
最傳統且直接的網絡擴容方式,是升級端口速率、提高設備容量。目前40G已經開始商用,隨著業務流量的繼續增長,100G也逐漸成為業界關注的熱點。端口速率的升級必然要求設備容量提升,T比特級的路由器和OTN設備應運而生。然而,上述的擴容方式會導致核心節點容量壓力大、成本高。因此,運營商除了提升節點能力之外,還要從網絡架構優化的角度,考慮擴大骨干網容量。
優化網絡架構
傳統的層次化網絡是一種比較經濟的建網模式。網絡流量小的時候,路由器可以通過統計復用的方式,實現流量的收斂,并解決全互聯帶來的擴展性問題。然而隨著網絡流量的增長,核心路由器面臨頻繁擴容的壓力,從而制約網絡的發展。而且在骨干網中,有50%以上的流量是中轉流量。該流量經過多次路由器轉發,消耗了大量昂貴的路由器端口,層次化的建網模式將不再經濟。
當兩個路由器之間的流量接近鏈路帶寬時,再通過中間的路由器收斂是沒有意義的,因此可以采用路由器之間直連的方式。當中間的匯聚路由器被取代后,網絡的層次就減少了。當骨干網的路由器之間只有一跳的時候,網絡就實現了徹底的扁平化。
打個比方,在層次化網絡中,業務流量在路由器上是逐跳轉發的,每個報文的轉發就像十字路口的車輛按照紅綠燈指示調度,流量小的時候有較好的性能。而路由器之間通過光層建立的直連鏈路,就像是立交橋,沒有紅綠燈的存在,可以實現大顆粒業務的快速調度,即使流量大,也能保證較好的性能。
路由器之間直連,簡化了網絡架構,減少了擴容壓力,節省了互聯成本,增強了網絡的擴展性,并減小了網絡時延及抖動,提高了業務質量。
以中國電信的ChinaNet骨干網為例,將其流量大的接入節點(比如湖南)逐步提升為類核心點的扁平化進程已經顯現出明顯的經濟效益。2010年已完成從9個核心節點到15個節點的擴展,未來將會擴展更多的類核節點,逐漸向扁平化的骨干網演進。
多層協同規劃
流量的增長要求網絡向扁平化演進,如何有步驟高效地演進呢?
ChinaNet骨干網的扁平化是基于人的觀測和經驗。為了提高準確性和效率,業界目前關注通過多層規劃的方式實現網絡扁平化部署。運營商在網絡部署或網絡優化時,根據多層規劃工具的結果,在路由器之間建立直連鏈路。
傳統的網絡規劃是逐層規劃,路由器網絡和傳輸網絡是分別規劃的。由于互通的信息有限,導致全網規劃的結果不是最經濟的。另外,有些運營商認為,在網絡中應盡量減少昂貴的路由器端口的使用。一方面,是由于路由器的成本比較高;另一方面,并不是所有的流量都需要經過核心路由器處理,通過在邊緣路由器之間建立直達鏈路,可以減少核心路由器的端口,從而節省設備成本。
多層規劃就是把路由器網絡和傳輸網絡同時進行規劃,這樣可以在網絡中合理地配置資源,小顆粒業務通過核心路由器調度,利用統計復用提升效率,大顆粒業務在光層直接傳送,從而提升整網的效率。通過多層規劃工具來實現網絡扁平化的部署,比基于經驗的方式更準確、更高效,并支持網絡的逐步演進。同時,多層規劃工具能夠有效地支撐整網TCO分析,并通過增量規劃簡化擴容的復雜度。
以某運營商的骨干網為例。該骨干網由106個節點構成,其中包括20個核心節點,86個匯接節點。假設節點間的波長帶寬都是10G,業務矩陣按照每年60%遞增速度考慮,隨著流量的增加,扁平化建網和層次化建網的成本差越來越大,到第八年時,扁平化建網的成本只有層次化建網的61.62%。通過多層規劃工具,原來需要幾個月才能完成的規劃任務可以在幾天內完成。
由于網絡規劃有一定的周期,而數據業務具有很強的突發性,因此網絡存在動態規劃的需求。動態規劃需要增加流量檢測、多層PCE、Bypass服務器等,存在大量標準化的工作,還比較遙遠。而結合流量檢測和網管操作的半自動網絡扁平化方式,是一種比較可行的選擇。
故障波及范圍廣,影響客戶忠誠度
40G已經開始商用,40G鏈路上承載著成千上萬的業務,鏈路故障將影響眾多的業務,客戶的忠誠度由此大打折扣。如何提升骨干網的可靠性,是運營商面臨的又一挑戰。
隨著路由器故障恢復和保護技術的不斷發展,理論上路由器已能實現當網絡發生故障時對業務的保護。但是在實際部署時,由于傳輸資源受限而難以配置快速保護恢復的路徑,并且在傳輸鏈路故障時,會引起路由層面的大量告警及路由振蕩,對路由器沖擊很大。
ASON通過光層的快速重路由可以解決傳送網的多點故障,但是缺少和路由器的配合,可能存在保護不成功或多重保護的情況。若通過GMPLS UNI接口和路由器配合,可以實現多層網絡的協同保護,一方面可以加快業務的保護速度,另一方面可以節省過多的保護資源。另外,在進行多層的網絡規劃時,通過共享風險鏈路組的約束,可以提高骨干網的可靠性。
運維難,海量告警故障難排除
假設一個運營商每天在波分層面的告警有6千多個,而到了路由器層面,告警將成倍遞增,變成2萬多個。如此海量的告警導致根源告警被淹沒,快速及時找到告警根源將變得非常困難。這是因為一個傳送層的告警通常會在IP層產生10倍以上的告警,而且IP網和傳送網是由不同的部門管理維護,很難知道IP層和傳送層之間的承載關系,以及IP層和傳送層之間告警的關聯關系。通過IP和光層的協同運維,以及一個統一的數據庫,可以方便地維護IP和光層的承載關系及告警的關聯關系,能夠屏蔽掉大量的衍生告警,快速地找到根源告警,將故障定位時間由幾個小時縮短到幾分鐘。
通過統一網管及GMPLS UNI,又可以實現業務的快速部署,將業務開通的時間由數月縮短到幾天,從而更快地響應客戶、贏得市場。
綜上所述,在流量以超摩爾定律增長的情況下,不僅需要提升單節點的能力,而且還要從網絡架構的角度優化網絡;在扁平化架構的趨勢下,IP和光多層協同規劃工具可以指導扁平化網絡的部署,提升網絡的效率,降低網絡成本;而多層協同的保護和運維則大幅提升網絡的可靠性和運維的效率,降低運維成本。因此IP和光在流量、保護、運維方面的協同,是應對后摩爾時代骨干網挑戰的最佳選擇。