摘要:提出了通信保障應急預案的場景概念,并通過分析嚴重影響通信系統的災害性事件及其對通信系統的影響程度,歸納為不同的場景,再將各種可能的事件置于相應的場景中,提出了5大場景預案核心環節和災后快速業務評估方法,為編制有針對性的、多專業立體聯動的通信保障預案提供了有效方法奠定基礎,使得預案更具有可操作性,有效降低了通信系統因火災等嚴重災害性事件中斷或阻斷的時長,從而可更有效保障國家和社會各項工作的順利執行。
1 引言
我國是災害頻發、災害面廣、災害損失嚴重的國家,自2001年美國紐約“911”恐怖襲擊,2006年臺南地震,2008年中國南方冰災、汶川特大地震,2009年“莫拉克”風暴及殃及全球多個國家的“非典”、甲型H1N1流感等一系列嚴重事件之后,我國對建立社會公共安全體系的重視程度大大提高,國家已經把社會公共安全應對體系作為事關國家安危的重要課題來抓。通信行業作為國民經濟中舉足輕重的基礎行業,直接影響到國家各項工作的順利部署與開展,且通信(如電話,短信,郵件,QQ,MSN等)已成為人們日常溝通中最為常用的手段之一,與日常生活息息相關。因此基礎通信網的通信保障是國家突發事件應急管理體系的一個有機組成部分,也是國家突發事件應急保障的關鍵環節。
目前,電信行業作為通信運營的主體,一般采用分專業分網絡管理,因此在編制具體應急預案時,一般采用分專業分網絡制定應急預案,以指導在故障或災害發生時本專業網絡的通信保障實施。這種傳統應急預案,對于應對只影響單專業的突發災害事件是必要的,也是有效的,比如單條國際、國內光纜中斷,單個國際、國內傳輸節點中斷和單個交換、數據、移動等節點中斷等單專業故障。但在現實情況下,一個突發災害事件,比如事故災難(樞紐樓火災、洪水、地震、地陷等)、公共衛生事件、社會安全事件、突發話務高峰等,同時對多個專業的網絡同時造成重大影響。對于如何協同應對多專業重大故障,如何分工協調,能恢復多少業務,需要多少資源等系列問題,傳統應急預案都難以解決。只有將突發事件置于具體的場景中,評估網絡與業務受損情況,事先討論制定可操作的流程,一旦假設場景類的突發事件發生后,電信運營商各責任主體才清楚如何分工、協同應急處置,從而有效地應對各種各樣的突發事件,大大降低網絡、業務和客戶在突發災害事件發生后的損失。
2 場景概念
在探討通信保障應急預案之前,首先明確一些相關的基本概念(見圖1)。

圖1 通信保障應急預案中場景的概念
(1)應急:應急是一種要求立即采取行動(超出了一般工作程序范圍)的狀態,以避免事故的發生或減輕事故的后果。應急可以定義為啟動應急響應計劃的任何狀態。
(2)預案:為進行危機管理提前制定的操作計劃。
(3)應急通信保障:當通信網設施遭受破壞、性能降級、異常高話務量或特殊通信保障任務情況下,使用應急通信方式恢復國際、國家、地區或本地的通信能力。
(4)場景:這里的場景為對通訊系統正常通訊造成中斷的重大事件或重要活動,每一個事件的描述必然包括時間/時期t,地點l,事件類型/原因r,損失或破壞d。四個維度不同數值的組合就構成了研究的特定場景,用Ci表示第i個場景(i=1,2,……,m),Ci=f(t,l,r,d)。這里的一個場景就對應一個突發事件和重要活動。
2008北京奧運會信息系統就選取了500個場景,并針對性地進行了模擬演練,比如硬件故障、軟件錯誤、體育項目變更、用戶投訴、人員問題、安全攻擊、網絡中斷、停電等等。對于電信運營商,網絡覆蓋范圍廣、承載關聯錯綜復雜,承載的業務顆粒度、業務類型、客戶重要性等差異性大,因此涉及的場景遠比一個重大活動的信息系統要復雜得多。
3 場景選擇方法
某一區域為了更好地應對某一類型的突發事件,有必要選擇出具有代表性的場景來編制預案,由于場景具有多維度的問題,不可能把所有場景全部遍歷,只能選擇一些小概率中的大概率事件為代表。為了選擇出具有代表性的場景,用場景差異度來衡量場景間的差異大小,對于差異度在一定范圍內的場景,可以選擇其中一個或幾個來代表其他場景。場景的差異度對于不同運營模式單位有所不同,可結合本單位網絡與運維模式的特點,根據場景的發生概率、原因、時間、地域以及破壞程度等,選取一些典型的場景。
通過分析嚴重影響通信系統的災害性事件及其對通信系統的影響程度,歸納為不同的場景。為了編制實用的應急預案,建議選取影響重大、涉及多專業的場景為案例編制應急預案,比如樞紐樓失效場景、區域性災害場景等等。對于這些需要多個專業聯動、復雜且影響面大的場景都可從容應對,對于其他影響小或涉及專業少的相似突發事件也可以可迎刃而解。
4 場景預案核心環節
在面向場景的應急指揮和預案編制過程中,最為關鍵的是處理好需要哪些應急人員(Who)、哪些物資(What,內部和外部)、采取何種應急手段(How)、如何上報與發布信息(Information Release)等方面的關系,這些構成了重大場景下應急保障措施的重要環節(見圖2)。

圖2 場景應急預案的五大應急通信核心環節
下面探討在應急指揮或預案編制過程中各環節應該著重考慮的主要方面。
4.1 應急團隊
(1)明確向上匯報流程:包括向地市、省公司、集團公司相關領導匯報,向相關主管政府部門匯報等。
(2)評估受損業務:根據受損的系統,評估受損業務及其影響面。
(3)制定聯動應急恢復優選方案,并明確在預案實施過程中應注意的事項,以便參照實施。
(4)明確應急建設的原則,即根據應急需要及其評估結果,應急建設相關光纜線路并應急購買設備。
4.2 內部資源需求
(1)明確假設場景下需要向政府等有關部門申請的資源,如根據地理條件和現有資源,確定是否需要申請空閑地方做臨時機房等。
(2)明確假設場景下人力資源需求,包括業務調度和應急建設等人力資源。(3)明確假設場景下物資資源需求:包括應急調度所需的光纜建設和設備調配或購買,其中設備部分需要明確系統設備廠家、設備數量、板卡類型數量、軟件版本,以及所需光纜類型等。
(3)梳理假定場景下可能影響到的重要大客戶和公眾客戶電路資料。
(4)明確假定場景下應急搶修所需支撐物資(如食品、飲用水、車輛),以及相關安全措施。
4.3 外部資源需求
(1)明確假定場景下需要的支撐單位以及要求(如相關設備廠家立即到現場進行支撐),并提供應急建設的相關設備。
(2)明確假定場景下要求搶修所需的工程建設人員到位的時限。
(3)明確假定場景下需要向政府申請的資源清單,如有必要向公安消防等相關政府部門申請配合應急搶修等。
4.4 信息發布
(1)根據主管政府部門最新要求和企業規范,明確假定場景下匯報搶修進度的時限和內容要求,為了避免引起不必要的問題,必須統一口徑。
(2)根據集團和政府相關部門的要求,明確假定場景下需要提供相關信息。
(3)明確假定場景下給領導匯報流程,即應急搶修負責人員定期通過電話、郵件等多種方式向集團相關領導匯報搶修情況。
(4)明確假定場景下由集團統一對媒體發布災難性破壞的相關信息。
4.5 客戶關系
(1)明確要求假定場景下受損系統的前端大客戶經理通報業務受損情況。
(2)明確在預案實施期間由專人負責反饋大客戶故障申告單。
(3)針對公眾電話受損客戶,由于申告量多,由客服人員按照統一口徑直接回復。
(4)如果災情嚴重,周邊電話很難在短時間內修復,應為公眾客戶提供免費的愛心電話。
(5)由于網絡原因,導致部分用戶造成一些損失,并帶來一定的不方便性,適當減免部分話費,加強人文關懷。
如果上述5大核心環節在編制場景預案時都已經明確了,災后應急響應時就可有條不紊地實施,保證應急處置時臨危不亂、決策有據、指揮有力、反應快速,有效提高了應急效率,減少網絡和業務受損。
5 重大場景下業務評估方法
當發生突發事件場景后,快速評估本次突發事件對網絡和業務的影響及影響范圍是應急調度與指揮的重要基礎。如果無法快速、準確給出受損狀況,就無法掌握應急所需的資源以及應急實施后的預期效果,因而,應急是盲目的。為此,本文進一步對重大場景下業務評估的方法與模型進行了研究,并提出基于網絡承載關系的災后業務快速評估方法。
根據電信網的現狀,本文提出網絡與業務承載關系(見圖3)。各層級的評估方法如下:

圖3 電信運營企業業務與網絡承載關系圖
(1)設施層:包括機房、設備、板卡、管道及電源配套等。
火災等災害一般直接破壞設施層的物理設備,設施層的影響容易評估,比如樞紐樓火災,受損對象就是樞紐樓內的設備(傳輸、交換、數據、移動等)和進出管道。
(2)線路層:包括光纜、通信電纜。
光纜是通信的主要媒介,承載大量的通信業務,而電纜主要承載接入業務。在假定場景下,線路層的影響容易評估,比如樞紐樓火災,受損對象就是在樞紐樓落地或過路的光纜、通信電纜。
(3)承載層:包括傳輸承載系統和數據承載系統。
傳輸以DWDM和SDH為主,數據以ATM,精品數據網,普通互聯網為主。在本層中,承載關系復雜,起了承上啟下的關鍵作用。在假定場景下,承載層的影響很難評估,假如樞紐樓火災,受損對象不僅是在樞紐樓落地的系統,還包括大量承載在受損線路或系統的系統。比如判斷某一中繼電路是否受損,首先看其設備端口是否受損,然后看承載該電路的SDH系統各段是否受損(還需考慮是否帶保護,保護是否有效),承載上述SDH系統的DWDM系統各段是否受損(如果該SDH系統承載在DWDM系統中),最后看承載上述SDH系統或DWDM系統的光纜各段是否受損。為了保證分析的準確性和提高效率,需根據承載關系從下往上進行逐層分析,即分受損光纜承載的DWDM系統,受損DWDM系統承載的SDH和數據網中繼,SDH系統承載的ATM中繼。
(4)業務層:包括承載業務的專業網絡或中繼電路。
根據業務覆蓋范圍和容災備份情況進行評估,比如樞紐樓火災,受損對象就是在某個區域某一業務的受損范圍和程度,依賴于承載該業務的中繼電路受損比例和容災能力。
基于上述方法,可分析出網絡與業務的具體損失,再根據業務的覆蓋范圍、業務類型、客戶類型等多維度進行歸納分析,從而提煉結論,供應急調度與指揮參考。
本文提出的基于網絡承載關系的災后業務快速評估方法分析,準確地梳理業務的承載關系,再根據業務的重要性,自上而下分析得出該場景下各個承載系統、光纜的重要性,并以業務保障優先為原則,提出切實可行快速應急恢復方案。面對重大災害時,電信運營商可做到心中有數、遇事不慌、有條不紊、快速應急,為有效縮短應急響應時間、降低各類災害對中國電信網絡與業務的負面影響奠定基礎,從而可更有效保障國家和社會各項工作的順利執行。
6 結束語
本文提出的場景模式編制應急預案,可協同應對復雜的多專業重大故障,使多專業可分工協調、統一規劃,避免各專業不應急、不同步。只有將突發事件置于具體的場景中,編制出來的應急預案才具有可操作性,當災難事件發生后,參照相似場景預案實施,有效提高了應急響應的效率,從而大大降低網絡、業務和客戶的損失,也為國家應對突發災害事件提供了有力的通訊保障。