馮 超
(廣東省電力通信有限公司,廣東廣州510600)
摘 要:有效的網(wǎng)絡(luò)管理是通信行業(yè)高效發(fā)展的必備手段。從當(dāng)前網(wǎng)絡(luò)管理需求和技術(shù)現(xiàn)狀出發(fā),介紹和分析了電力通信網(wǎng)絡(luò)管理系統(tǒng)的建設(shè)目標(biāo)和體系結(jié)構(gòu),提出以選擇簡單網(wǎng)絡(luò)管理協(xié)議(SNMP)和面向?qū)ο蟮募夹g(shù)為佳,未來的網(wǎng)絡(luò)管理系統(tǒng)應(yīng)具有人工智能的功能,可分層分范圍。
關(guān)鍵詞:網(wǎng)絡(luò)管理系統(tǒng) 體系結(jié)構(gòu) 分布式
網(wǎng)絡(luò)管理是電信行業(yè)中十分重要但又尚未成熟的課題,尤其在廣東省電力系統(tǒng)通信網(wǎng)絡(luò)中,相對于通信設(shè)備來說,網(wǎng)絡(luò)管理更是一個薄弱環(huán)節(jié)。我們現(xiàn)有的管理系統(tǒng)都屬于電路監(jiān)控系統(tǒng),它們基于每一條傳輸電路本身。當(dāng)通信系統(tǒng)由很多不同電路設(shè)備組成時,管理就變得零散:每時每刻有許多監(jiān)視屏幕要注意盯著,分析統(tǒng)計要逐條電路進(jìn)行,如果還需要做更高層的應(yīng)用管理,那就更困難了。顯然,這樣的系統(tǒng)需要整合,需要一個更高層的平臺開展管理。隨著網(wǎng)絡(luò)范圍的擴展和不同功能業(yè)務(wù)的出現(xiàn),以及對經(jīng)濟效益的管理控制,建立一個有效的網(wǎng)絡(luò)管理系統(tǒng),是發(fā)展的必然方向。
1 建設(shè)網(wǎng)絡(luò)管理系統(tǒng)的目標(biāo)
總的來說,用戶和網(wǎng)絡(luò)經(jīng)營者對網(wǎng)絡(luò)的要求是有效、可靠和經(jīng)濟。為了滿足這個要求,整個信息產(chǎn)業(yè)在迅猛地發(fā)展,為廣大用戶提供既高效又經(jīng)濟的通信手段,而相對于通信網(wǎng)絡(luò)本身的發(fā)展建設(shè),網(wǎng)絡(luò)管理要滿足上述要求,無論在理論上,還是在實踐上都遠(yuǎn)遠(yuǎn)滯后。通信網(wǎng)絡(luò)設(shè)備的更新?lián)Q代很快,通信設(shè)備功能復(fù)雜和規(guī)格不統(tǒng)一,生產(chǎn)廠商多,網(wǎng)絡(luò)管理的行業(yè)標(biāo)準(zhǔn)不完善,管理需求的不斷變化和發(fā)展,使得網(wǎng)絡(luò)管理系統(tǒng)建設(shè)不可能一步到位。對于省級電力通信系統(tǒng),網(wǎng)絡(luò)如何管理是一個新課題,必然有一個逐步認(rèn)識和發(fā)展的過程。近期我們希望能達(dá)到以下幾個主要目標(biāo):
a)為沒有管理系統(tǒng)的網(wǎng)絡(luò)提供管理功能。交換網(wǎng)絡(luò)和計算機網(wǎng)絡(luò)設(shè)備在建設(shè)的時候都沒有考慮管理系統(tǒng),隨著運行方式的改革(例如從星型匯接變?yōu)榉謱訁R接)和重要性的提高,需要增加網(wǎng)絡(luò)管理能力 。
b) 對各種零散設(shè)備進(jìn)行管理。網(wǎng)絡(luò)中必然存在大量不同功能的設(shè)備,例如電源、空調(diào)、消防設(shè)備以及各類接口設(shè)備,通信電路監(jiān)控設(shè)備一般不對它們進(jìn)行管理,但是在運行中,它們的作用和重要性往往不低于電路本身,這就需要有手段將它們管理起來。
c) 替代通信電路原有的監(jiān)控系統(tǒng)。經(jīng)過十幾年的使用,一些通信電路自帶的監(jiān)控系統(tǒng)已經(jīng)損壞,不可修復(fù),需要有新的監(jiān)控手段。
d) 在原有監(jiān)控系統(tǒng)的基礎(chǔ)上提高管理能力。過去的監(jiān)控系統(tǒng)往往只是注重監(jiān)視功能,不能提供性能管理和后臺應(yīng)用管理的功能。我們希望新的網(wǎng)絡(luò)管理系統(tǒng)不僅僅能夠彌補這些缺陷,而且要求它打破物理網(wǎng)絡(luò)的封閉結(jié)構(gòu),改變多管理系統(tǒng)之間互通性差而造成低效和復(fù)雜的管理環(huán)境,提供一些新的功能,例如一段電路中斷后對其它傳輸電路或通信方式產(chǎn)生的影響及其屏蔽。
e)降低網(wǎng)絡(luò)運行成本。減少現(xiàn)在運行中需要大量人工介入處理的、簡單的和重復(fù)的工作,例如一些工作紀(jì)錄和單據(jù)的自動生成、統(tǒng)計以及傳送。
f)滿足不同人群對管理網(wǎng)絡(luò)的不同要求。管網(wǎng)絡(luò)的與管設(shè)備的要求不同,管資源、管財務(wù)、管運行的要求不同,不同通信專業(yè)的要求也會不同,例如某點失效可能引起不同范圍和不同專業(yè)通信人員的重復(fù)檢查和處理判斷,以至擴大故障影響等。
g)具備開放性,為未來順利接入新增設(shè)備打下良好基礎(chǔ)。
2 網(wǎng)絡(luò)管理系統(tǒng)的體系結(jié)構(gòu)
要實現(xiàn)上述目標(biāo),就需要在網(wǎng)絡(luò)管理系統(tǒng)的體系結(jié)構(gòu)和管理信息結(jié)構(gòu)等方面作出很大改進(jìn)。
2.1 主從式
現(xiàn)在我們使用的管理系統(tǒng)屬于主從式體系結(jié)構(gòu),所有的設(shè)備和電路都由后臺直接操縱,所有的應(yīng)用管理也是在同一個后臺上進(jìn)行。這種高度集中的系統(tǒng)存在著以下問題:
a)由一個網(wǎng)管核心負(fù)責(zé)收集、分析所有被管資源的狀態(tài)信息,并進(jìn)行相應(yīng)管理,造成網(wǎng)管站工作負(fù)擔(dān)過重,沒有充分發(fā)揮網(wǎng)絡(luò)的分布計算資源優(yōu)勢。
b)所有的網(wǎng)絡(luò)管理數(shù)據(jù)都必須傳送給網(wǎng)管站分析處理,這樣易在管理者端形成通信瓶頸,如果是網(wǎng)絡(luò)規(guī)模小,設(shè)備不多則自然采用集中式的管理,但是當(dāng)網(wǎng)絡(luò)具有幾百個節(jié)點,輪詢一遍就需要花費很長的時間,顯然不可能做到對網(wǎng)絡(luò)實時監(jiān)控。
c)當(dāng)網(wǎng)絡(luò)出現(xiàn)故障,尤其是后臺失效的時候,會造成全網(wǎng)失控。
d)由于系統(tǒng)規(guī)模和應(yīng)用越來越復(fù)雜,加上用戶需求的改變,現(xiàn)行的網(wǎng)絡(luò)管理平臺不易擴展升級。
e)由于網(wǎng)絡(luò)采用不同廠商的網(wǎng)絡(luò)、協(xié)議、操作系統(tǒng)和數(shù)據(jù)庫,網(wǎng)管人員不得不分別借助各種孤立的管理工具來監(jiān)視和控制網(wǎng)絡(luò)的運行和管理各種信息服務(wù)。這給網(wǎng)管人員帶來了額外負(fù)擔(dān),給有效地管理好網(wǎng)絡(luò)帶來很大的困難。比如,有些電路是由不同廠家設(shè)備駁接而成的,如果要計算全電路運行率,就需要在各自的管理設(shè)備上分別進(jìn)行,且由于計算方法不同,其結(jié)果可能產(chǎn)生差異。
f)目前網(wǎng)絡(luò)管理的重心仍然放在管理網(wǎng)絡(luò)的硬件設(shè)備上,缺乏真正有效的包括各種應(yīng)用服務(wù)的集成網(wǎng)絡(luò)管理。
2.2 分布式
當(dāng)前,計算機網(wǎng)絡(luò)技術(shù)的發(fā)展為我們解決上述問題鋪平了道路,采用客戶-服務(wù)器這樣一種成熟的結(jié)構(gòu)來實現(xiàn)網(wǎng)絡(luò)管理系統(tǒng)的分布式管理方式,已經(jīng)成為網(wǎng)絡(luò)管理系統(tǒng)建設(shè)的共同模式。網(wǎng)絡(luò)管理系統(tǒng)是以中央平臺為中心的,各種管理應(yīng)用集中在平臺之中,并與被管數(shù)據(jù)和安裝在設(shè)備中的控制功能分開,它由四部分組成:被管設(shè)備的代理、管理站、管理信息庫和網(wǎng)絡(luò)管理協(xié)議。
2.2.1 代理
各種通信設(shè)備和各條電路是被管設(shè)備,由代理按照它們各自的特點、需求進(jìn)行分管,并將采集的數(shù)據(jù)儲存在自己的數(shù)據(jù)庫中。例如話音交換網(wǎng)主要管理內(nèi)容是話務(wù)量、信號資源、迂回分配和呼通率,傳輸設(shè)備則主要側(cè)重于與中斷和誤碼有關(guān)的傳輸質(zhì)量管理,它們的管理內(nèi)容有極大的差異,試圖將它們從一個歸口進(jìn)行管理必然為縱橫交錯的問題所困擾,由代理按照它們不同的特點分別進(jìn)行信息采集、分析和存儲管理,再將有共性的、上層應(yīng)用需要用到的數(shù)據(jù)提取出來,這不僅能解決眼前的實際需要,也為將來新增設(shè)備提供了采用模塊解決的可擴展方案。
2.2.2 管理站
管理站是聯(lián)接管理人員與網(wǎng)絡(luò)管理系統(tǒng)的界面,它實際上是一臺運行特殊管理軟件的計算機,管理人員對網(wǎng)絡(luò)的各種操作,以及網(wǎng)絡(luò)管理系統(tǒng)主動和被動產(chǎn)生的各種信息需要告知管理人員,均通過管理站完成。管理站也允許有多個,分別按照不同的應(yīng)用和管理需求來配置。例如監(jiān)視網(wǎng)絡(luò)的值班人員,可以通過運行圖形界面來定位設(shè)備的管理站監(jiān)管網(wǎng)絡(luò),一旦網(wǎng)絡(luò)發(fā)生故障,可以快速地通過圖形界面定位故障點,檢修人員則可以通過運行表格的管理站來接受故障檢修任務(wù)。
2.2.3 管理信息庫
管理信息庫顧名思義是存儲網(wǎng)絡(luò)運作信息的地方,有靜態(tài)的也有動態(tài)的。各個代理也可以有自己的管理信息庫,存放所代理范圍內(nèi)的運作數(shù)據(jù),這視設(shè)備現(xiàn)狀和管理需求而定,例如同步數(shù)字系列(SDH)電路本身就有管理系統(tǒng)和數(shù)據(jù)庫,并能夠與外部互相傳遞數(shù)據(jù)。
2.2.4 網(wǎng)絡(luò)管理協(xié)議
網(wǎng)絡(luò)管理協(xié)議定義了管理者(管理站和中心管理信息庫)與被管代理間的通信方法,規(guī)定了管理信息庫的儲存結(jié)構(gòu)、信息庫中關(guān)鍵字的含義以及各種事件的處理方法。如何選擇網(wǎng)絡(luò)管理協(xié)議取決于網(wǎng)絡(luò)的大小以及擴展、管理要求的復(fù)雜與否和當(dāng)前設(shè)備所采用的網(wǎng)絡(luò)管理協(xié)議的趨勢。簡單網(wǎng)絡(luò)管理協(xié)議(SNMP)、公共管理協(xié)議(CMIP)和電信管理網(wǎng)(TMN)是三種研究得較多的網(wǎng)絡(luò)管理協(xié)議,其中的SNMP由于秉承了因特網(wǎng)TCP/IP協(xié)議使用有效和簡單的特點,在目前的設(shè)備中應(yīng)用最為普遍。我們現(xiàn)在的網(wǎng)絡(luò)規(guī)模在300個節(jié)點左右,相當(dāng)一部分的設(shè)備本身就帶有SNMP協(xié)議,并且如何對整個網(wǎng)絡(luò)進(jìn)行綜合管理的研究才起步,采用CMIP和TMN等大而全又復(fù)雜的協(xié)議,會因為經(jīng)驗和應(yīng)用不足而使開發(fā)工作進(jìn)展緩慢 ,耗資也將與收益極不相符,以SNMP作為主要協(xié)議比較符合我們的網(wǎng)絡(luò)現(xiàn)狀和管理要求,投入費用也不至于太大。
3 管理信息結(jié)構(gòu)
網(wǎng)絡(luò)管理協(xié)議中的管理信息結(jié)構(gòu),定義了各個角色所管理的信息庫中信息結(jié)構(gòu)和數(shù)據(jù)類型。為什么需要規(guī)范管理信息結(jié)構(gòu)呢?它之所以在我們過去傳統(tǒng)的集中式管理系統(tǒng)中不顯得重要,是因為集中式管理只有一個數(shù)據(jù)庫和管理后臺,只有放射型的信息收集處理,所以它不需要交換信息的協(xié)議平臺,這是它功能和應(yīng)用難以擴展的致命之處。分布式網(wǎng)絡(luò)管理系統(tǒng)中的每個角色需要與其它角色交換信息,要使大家都能解析交換的信息,定義信息的規(guī)則是必不可少的。例如微波設(shè)備的無線組件、中頻組件或復(fù)接器等實體,對它們的命名是面向過程還是面向?qū)ο蟆⑷绾尾拍芪ㄒ坏乇蛔R別、它們的工作狀態(tài)變化如何讀取,需要用命名規(guī)則和數(shù)據(jù)語法來規(guī)范。另外為了擴展應(yīng)用,還應(yīng)該給每個實體賦予類或?qū)傩裕橹笇?dǎo)這些工作如何進(jìn)行給出模板和指南。在上面的例子中,信號的流程從無線組件、中頻組件到復(fù)接器 ,當(dāng)然也可以逆轉(zhuǎn),僅考慮信號流向可以采用面向過程命名,但是復(fù)接器的故障還將影響各種用戶,那么在跨專業(yè)的管理應(yīng)用時就帶來很多的困難 。面向?qū)ο蟮募夹g(shù)具有抽象性、封裝性、繼承性和同質(zhì)異構(gòu)性 ,在設(shè)備種類繁多、廠商眾多,管理要求多樣化的網(wǎng)絡(luò)環(huán)境下,在克服復(fù)雜性方面有很大的優(yōu)勢,理所當(dāng)然成為網(wǎng)絡(luò)管理系統(tǒng)的信息管理技術(shù)。
4 安全問題
網(wǎng)絡(luò)管理系統(tǒng)的安全問題也應(yīng)該予以注意,因為一方面在網(wǎng)絡(luò)運行中,網(wǎng)絡(luò)管理的重要性日益體現(xiàn) ,系統(tǒng)本身的運行可靠性必須予以重視,對系統(tǒng)的重要部分采用冗余技術(shù)是需要考慮的;另一方面系統(tǒng)本身是一個網(wǎng)絡(luò)平臺結(jié)構(gòu),存在內(nèi)外交換管理信息的必要及渠道,包括遠(yuǎn)程上網(wǎng),對系統(tǒng)不正常的操縱和數(shù)據(jù)的存取會危害通信網(wǎng)絡(luò)正常運行。SNMP協(xié)議可以提供訪問控制、隱私和認(rèn)證服務(wù),目前的情況下,我們只是對系統(tǒng)的訪問進(jìn)行控制,隨著應(yīng)用的不斷深化和廣泛,就有必要提供隱私和認(rèn)證服務(wù)。比如將網(wǎng)絡(luò)運行信息傳送到相應(yīng)的單位,應(yīng)該得到認(rèn)證回答,作為網(wǎng)絡(luò)維護(hù)質(zhì)量和計算費用的依據(jù)。
5 結(jié)束語
人工智能(專家知識)是我們最希望得到的系統(tǒng)功能,龐大的網(wǎng)絡(luò)、繁多的參數(shù)和數(shù)據(jù)、日益增長的復(fù)雜性、保證管理的實時性和處理網(wǎng)絡(luò)問題的連貫性,都要求網(wǎng)絡(luò)管理系統(tǒng)越來越多地基于知識。基于目前的研究開發(fā)水平,我們不期望全面引入人工智能來管理網(wǎng)絡(luò),只是在隔離和診斷故障等方面具備一定程度的人工智能,提高網(wǎng)絡(luò)實時維護(hù)水平。