馮超
(廣東省電力通信有限公司,廣東廣州510600)
摘 要:有效的網(wǎng)絡(luò)管理是通信行業(yè)高效發(fā)展的必備手段。從當(dāng)前網(wǎng)絡(luò)管理需求和技術(shù)現(xiàn)狀出發(fā),介紹和分析了電力通信網(wǎng)絡(luò)管理系統(tǒng)的建設(shè)目標(biāo)和體系結(jié)構(gòu),提出以選擇簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(SNMP)和面向?qū)ο蟮募夹g(shù)為佳,未來的網(wǎng)絡(luò)管理系統(tǒng)應(yīng)具有人工智能的功能,可分層分范圍。
關(guān)鍵詞:網(wǎng)絡(luò)管理系統(tǒng) 體系結(jié)構(gòu) 分布式
網(wǎng)絡(luò)管理是電信行業(yè)中十分重要但又尚未成熟的課題,尤其在廣東省電力系統(tǒng)通信網(wǎng)絡(luò)中,相對(duì)于通信設(shè)備來說,網(wǎng)絡(luò)管理更是一個(gè)薄弱環(huán)節(jié)。我們現(xiàn)有的管理系統(tǒng)都屬于電路監(jiān)控系統(tǒng),它們基于每一條傳輸電路本身。當(dāng)通信系統(tǒng)由很多不同電路設(shè)備組成時(shí),管理就變得零散:每時(shí)每刻有許多監(jiān)視屏幕要注意盯著,分析統(tǒng)計(jì)要逐條電路進(jìn)行,如果還需要做更高層的應(yīng)用管理,那就更困難了。顯然,這樣的系統(tǒng)需要整合,需要一個(gè)更高層的平臺(tái)開展管理。隨著網(wǎng)絡(luò)范圍的擴(kuò)展和不同功能業(yè)務(wù)的出現(xiàn),以及對(duì)經(jīng)濟(jì)效益的管理控制,建立一個(gè)有效的網(wǎng)絡(luò)管理系統(tǒng),是發(fā)展的必然方向。
1 建設(shè)網(wǎng)絡(luò)管理系統(tǒng)的目標(biāo)
總的來說,用戶和網(wǎng)絡(luò)經(jīng)營(yíng)者對(duì)網(wǎng)絡(luò)的要求是有效、可靠和經(jīng)濟(jì)。為了滿足這個(gè)要求,整個(gè)信息產(chǎn)業(yè)在迅猛地發(fā)展,為廣大用戶提供既高效又經(jīng)濟(jì)的通信手段,而相對(duì)于通信網(wǎng)絡(luò)本身的發(fā)展建設(shè),網(wǎng)絡(luò)管理要滿足上述要求,無論在理論上,還是在實(shí)踐上都遠(yuǎn)遠(yuǎn)滯后。通信網(wǎng)絡(luò)設(shè)備的更新?lián)Q代很快,通信設(shè)備功能復(fù)雜和規(guī)格不統(tǒng)一,生產(chǎn)廠商多,網(wǎng)絡(luò)管理的行業(yè)標(biāo)準(zhǔn)不完善,管理需求的不斷變化和發(fā)展,使得網(wǎng)絡(luò)管理系統(tǒng)建設(shè)不可能一步到位。對(duì)于省級(jí)電力通信系統(tǒng),網(wǎng)絡(luò)如何管理是一個(gè)新課題,必然有一個(gè)逐步認(rèn)識(shí)和發(fā)展的過程。近期我們希望能達(dá)到以下幾個(gè)主要目標(biāo):
a)為沒有管理系統(tǒng)的網(wǎng)絡(luò)提供管理功能。交換網(wǎng)絡(luò)和計(jì)算機(jī)網(wǎng)絡(luò)設(shè)備在建設(shè)的時(shí)候都沒有考慮管理系統(tǒng),隨著運(yùn)行方式的改革(例如從星型匯接變?yōu)榉謱訁R接)和重要性的提高,需要增加網(wǎng)絡(luò)管理能力 。
b) 對(duì)各種零散設(shè)備進(jìn)行管理。網(wǎng)絡(luò)中必然存在大量不同功能的設(shè)備,例如電源、空調(diào)、消防設(shè)備以及各類接口設(shè)備,通信電路監(jiān)控設(shè)備一般不對(duì)它們進(jìn)行管理,但是在運(yùn)行中,它們的作用和重要性往往不低于電路本身,這就需要有手段將它們管理起來。
c) 替代通信電路原有的監(jiān)控系統(tǒng)。經(jīng)過十幾年的使用,一些通信電路自帶的監(jiān)控系統(tǒng)已經(jīng)損壞,不可修復(fù),需要有新的監(jiān)控手段。
d) 在原有監(jiān)控系統(tǒng)的基礎(chǔ)上提高管理能力。過去的監(jiān)控系統(tǒng)往往只是注重監(jiān)視功能,不能提供性能管理和后臺(tái)應(yīng)用管理的功能。我們希望新的網(wǎng)絡(luò)管理系統(tǒng)不僅僅能夠彌補(bǔ)這些缺陷,而且要求它打破物理網(wǎng)絡(luò)的封閉結(jié)構(gòu),改變多管理系統(tǒng)之間互通性差而造成低效和復(fù)雜的管理環(huán)境,提供一些新的功能,例如一段電路中斷后對(duì)其它傳輸電路或通信方式產(chǎn)生的影響及其屏蔽。
e)降低網(wǎng)絡(luò)運(yùn)行成本。減少現(xiàn)在運(yùn)行中需要大量人工介入處理的、簡(jiǎn)單的和重復(fù)的工作,例如一些工作紀(jì)錄和單據(jù)的自動(dòng)生成、統(tǒng)計(jì)以及傳送。
f)滿足不同人群對(duì)管理網(wǎng)絡(luò)的不同要求。管網(wǎng)絡(luò)的與管設(shè)備的要求不同,管資源、管財(cái)務(wù)、管運(yùn)行的要求不同,不同通信專業(yè)的要求也會(huì)不同,例如某點(diǎn)失效可能引起不同范圍和不同專業(yè)通信人員的重復(fù)檢查和處理判斷,以至擴(kuò)大故障影響等!
g)具備開放性,為未來順利接入新增設(shè)備打下良好基礎(chǔ)。
2 網(wǎng)絡(luò)管理系統(tǒng)的體系結(jié)構(gòu)
要實(shí)現(xiàn)上述目標(biāo),就需要在網(wǎng)絡(luò)管理系統(tǒng)的體系結(jié)構(gòu)和管理信息結(jié)構(gòu)等方面作出很大改進(jìn)。
2.1 主從式
現(xiàn)在我們使用的管理系統(tǒng)屬于主從式體系結(jié)構(gòu),所有的設(shè)備和電路都由后臺(tái)直接操縱,所有的應(yīng)用管理也是在同一個(gè)后臺(tái)上進(jìn)行。這種高度集中的系統(tǒng)存在著以下問題:
a)由一個(gè)網(wǎng)管核心負(fù)責(zé)收集、分析所有被管資源的狀態(tài)信息,并進(jìn)行相應(yīng)管理,造成網(wǎng)管站工作負(fù)擔(dān)過重,沒有充分發(fā)揮網(wǎng)絡(luò)的分布計(jì)算資源優(yōu)勢(shì)。
b)所有的網(wǎng)絡(luò)管理數(shù)據(jù)都必須傳送給網(wǎng)管站分析處理,這樣易在管理者端形成通信瓶頸,如果是網(wǎng)絡(luò)規(guī)模小,設(shè)備不多則自然采用集中式的管理,但是當(dāng)網(wǎng)絡(luò)具有幾百個(gè)節(jié)點(diǎn),輪詢一遍就需要花費(fèi)很長(zhǎng)的時(shí)間,顯然不可能做到對(duì)網(wǎng)絡(luò)實(shí)時(shí)監(jiān)控。
c)當(dāng)網(wǎng)絡(luò)出現(xiàn)故障,尤其是后臺(tái)失效的時(shí)候,會(huì)造成全網(wǎng)失控。
d)由于系統(tǒng)規(guī)模和應(yīng)用越來越復(fù)雜,加上用戶需求的改變,現(xiàn)行的網(wǎng)絡(luò)管理平臺(tái)不易擴(kuò)展升級(jí)。
e)由于網(wǎng)絡(luò)采用不同廠商的網(wǎng)絡(luò)、協(xié)議、操作系統(tǒng)和數(shù)據(jù)庫(kù),網(wǎng)管人員不得不分別借助各種孤立的管理工具來監(jiān)視和控制網(wǎng)絡(luò)的運(yùn)行和管理各種信息服務(wù)。這給網(wǎng)管人員帶來了額外負(fù)擔(dān),給有效地管理好網(wǎng)絡(luò)帶來很大的困難。比如,有些電路是由不同廠家設(shè)備駁接而成的,如果要計(jì)算全電路運(yùn)行率,就需要在各自的管理設(shè)備上分別進(jìn)行,且由于計(jì)算方法不同,其結(jié)果可能產(chǎn)生差異。
f)目前網(wǎng)絡(luò)管理的重心仍然放在管理網(wǎng)絡(luò)的硬件設(shè)備上,缺乏真正有效的包括各種應(yīng)用服務(wù)的集成網(wǎng)絡(luò)管理。
2.2 分布式
當(dāng)前,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展為我們解決上述問題鋪平了道路,采用客戶-服務(wù)器這樣一種成熟的結(jié)構(gòu)來實(shí)現(xiàn)網(wǎng)絡(luò)管理系統(tǒng)的分布式管理方式,已經(jīng)成為網(wǎng)絡(luò)管理系統(tǒng)建設(shè)的共同模式。網(wǎng)絡(luò)管理系統(tǒng)是以中央平臺(tái)為中心的,各種管理應(yīng)用集中在平臺(tái)之中,并與被管數(shù)據(jù)和安裝在設(shè)備中的控制功能分開,它由四部分組成:被管設(shè)備的代理、管理站、管理信息庫(kù)和網(wǎng)絡(luò)管理協(xié)議。
2.2.1 代理
各種通信設(shè)備和各條電路是被管設(shè)備,由代理按照它們各自的特點(diǎn)、需求進(jìn)行分管,并將采集的數(shù)據(jù)儲(chǔ)存在自己的數(shù)據(jù)庫(kù)中。例如話音交換網(wǎng)主要管理內(nèi)容是話務(wù)量、信號(hào)資源、迂回分配和呼通率,傳輸設(shè)備則主要側(cè)重于與中斷和誤碼有關(guān)的傳輸質(zhì)量管理,它們的管理內(nèi)容有極大的差異,試圖將它們從一個(gè)歸口進(jìn)行管理必然為縱橫交錯(cuò)的問題所困擾,由代理按照它們不同的特點(diǎn)分別進(jìn)行信息采集、分析和存儲(chǔ)管理,再將有共性的、上層應(yīng)用需要用到的數(shù)據(jù)提取出來,這不僅能解決眼前的實(shí)際需要,也為將來新增設(shè)備提供了采用模塊解決的可擴(kuò)展方案。
2.2.2 管理站
管理站是聯(lián)接管理人員與網(wǎng)絡(luò)管理系統(tǒng)的界面,它實(shí)際上是一臺(tái)運(yùn)行特殊管理軟件的計(jì)算機(jī),管理人員對(duì)網(wǎng)絡(luò)的各種操作,以及網(wǎng)絡(luò)管理系統(tǒng)主動(dòng)和被動(dòng)產(chǎn)生的各種信息需要告知管理人員,均通過管理站完成。管理站也允許有多個(gè),分別按照不同的應(yīng)用和管理需求來配置。例如監(jiān)視網(wǎng)絡(luò)的值班人員,可以通過運(yùn)行圖形界面來定位設(shè)備的管理站監(jiān)管網(wǎng)絡(luò),一旦網(wǎng)絡(luò)發(fā)生故障,可以快速地通過圖形界面定位故障點(diǎn),檢修人員則可以通過運(yùn)行表格的管理站來接受故障檢修任務(wù)。
2.2.3 管理信息庫(kù)
管理信息庫(kù)顧名思義是存儲(chǔ)網(wǎng)絡(luò)運(yùn)作信息的地方,有靜態(tài)的也有動(dòng)態(tài)的。各個(gè)代理也可以有自己的管理信息庫(kù),存放所代理范圍內(nèi)的運(yùn)作數(shù)據(jù),這視設(shè)備現(xiàn)狀和管理需求而定,例如同步數(shù)字系列(SDH)電路本身就有管理系統(tǒng)和數(shù)據(jù)庫(kù),并能夠與外部互相傳遞數(shù)據(jù)。
2.2.4 網(wǎng)絡(luò)管理協(xié)議
網(wǎng)絡(luò)管理協(xié)議定義了管理者(管理站和中心管理信息庫(kù))與被管代理間的通信方法,規(guī)定了管理信息庫(kù)的儲(chǔ)存結(jié)構(gòu)、信息庫(kù)中關(guān)鍵字的含義以及各種事件的處理方法。如何選擇網(wǎng)絡(luò)管理協(xié)議取決于網(wǎng)絡(luò)的大小以及擴(kuò)展、管理要求的復(fù)雜與否和當(dāng)前設(shè)備所采用的網(wǎng)絡(luò)管理協(xié)議的趨勢(shì)。簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(SNMP)、公共管理協(xié)議(CMIP)和電信管理網(wǎng)(TMN)是三種研究得較多的網(wǎng)絡(luò)管理協(xié)議,其中的SNMP由于秉承了因特網(wǎng)TCP/IP協(xié)議使用有效和簡(jiǎn)單的特點(diǎn),在目前的設(shè)備中應(yīng)用最為普遍。我們現(xiàn)在的網(wǎng)絡(luò)規(guī)模在300個(gè)節(jié)點(diǎn)左右,相當(dāng)一部分的設(shè)備本身就帶有SNMP協(xié)議,并且如何對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行綜合管理的研究才起步,采用CMIP和TMN等大而全又復(fù)雜的協(xié)議,會(huì)因?yàn)榻?jīng)驗(yàn)和應(yīng)用不足而使開發(fā)工作進(jìn)展緩慢,耗資也將與收益極不相符,以SNMP作為主要協(xié)議比較符合我們的網(wǎng)絡(luò)現(xiàn)狀和管理要求,投入費(fèi)用也不至于太大。
3 管理信息結(jié)構(gòu)
網(wǎng)絡(luò)管理協(xié)議中的管理信息結(jié)構(gòu),定義了各個(gè)角色所管理的信息庫(kù)中信息結(jié)構(gòu)和數(shù)據(jù)類型。為什么需要規(guī)范管理信息結(jié)構(gòu)呢?它之所以在我們過去傳統(tǒng)的集中式管理系統(tǒng)中不顯得重要,是因?yàn)榧惺焦芾碇挥幸粋(gè)數(shù)據(jù)庫(kù)和管理后臺(tái),只有放射型的信息收集處理,所以它不需要交換信息的協(xié)議平臺(tái),這是它功能和應(yīng)用難以擴(kuò)展的致命之處。分布式網(wǎng)絡(luò)管理系統(tǒng)中的每個(gè)角色需要與其它角色交換信息,要使大家都能解析交換的信息,定義信息的規(guī)則是必不可少的。例如微波設(shè)備的無線組件、中頻組件或復(fù)接器等實(shí)體,對(duì)它們的命名是面向過程還是面向?qū)ο、如何才能唯一地被識(shí)別、它們的工作狀態(tài)變化如何讀取,需要用命名規(guī)則和數(shù)據(jù)語法來規(guī)范。另外為了擴(kuò)展應(yīng)用,還應(yīng)該給每個(gè)實(shí)體賦予類或?qū)傩,并為指?dǎo)這些工作如何進(jìn)行給出模板和指南。在上面的例子中,信號(hào)的流程從無線組件、中頻組件到復(fù)接器,當(dāng)然也可以逆轉(zhuǎn),僅考慮信號(hào)流向可以采用面向過程命名,但是復(fù)接器的故障還將影響各種用戶,那么在跨專業(yè)的管理應(yīng)用時(shí)就帶來很多的困難 。面向?qū)ο蟮募夹g(shù)具有抽象性、封裝性、繼承性和同質(zhì)異構(gòu)性,在設(shè)備種類繁多、廠商眾多,管理要求多樣化的網(wǎng)絡(luò)環(huán)境下,在克服復(fù)雜性方面有很大的優(yōu)勢(shì),理所當(dāng)然成為網(wǎng)絡(luò)管理系統(tǒng)的信息管理技術(shù)。
4 安全問題
網(wǎng)絡(luò)管理系統(tǒng)的安全問題也應(yīng)該予以注意,因?yàn)橐环矫嬖诰W(wǎng)絡(luò)運(yùn)行中,網(wǎng)絡(luò)管理的重要性日益體現(xiàn) ,系統(tǒng)本身的運(yùn)行可靠性必須予以重視,對(duì)系統(tǒng)的重要部分采用冗余技術(shù)是需要考慮的;另一方面系統(tǒng)本身是一個(gè)網(wǎng)絡(luò)平臺(tái)結(jié)構(gòu),存在內(nèi)外交換管理信息的必要及渠道,包括遠(yuǎn)程上網(wǎng),對(duì)系統(tǒng)不正常的操縱和數(shù)據(jù)的存取會(huì)危害通信網(wǎng)絡(luò)正常運(yùn)行。SNMP協(xié)議可以提供訪問控制、隱私和認(rèn)證服務(wù),目前的情況下,我們只是對(duì)系統(tǒng)的訪問進(jìn)行控制,隨著應(yīng)用的不斷深化和廣泛,就有必要提供隱私和認(rèn)證服務(wù)。比如將網(wǎng)絡(luò)運(yùn)行信息傳送到相應(yīng)的單位,應(yīng)該得到認(rèn)證回答,作為網(wǎng)絡(luò)維護(hù)質(zhì)量和計(jì)算費(fèi)用的依據(jù)。
5 結(jié)束語
人工智能(專家知識(shí))是我們最希望得到的系統(tǒng)功能,龐大的網(wǎng)絡(luò)、繁多的參數(shù)和數(shù)據(jù)、日益增長(zhǎng)的復(fù)雜性、保證管理的實(shí)時(shí)性和處理網(wǎng)絡(luò)問題的連貫性,都要求網(wǎng)絡(luò)管理系統(tǒng)越來越多地基于知識(shí);谀壳暗难芯块_發(fā)水平,我們不期望全面引入人工智能來管理網(wǎng)絡(luò),只是在隔離和診斷故障等方面具備一定程度的人工智能,提高網(wǎng)絡(luò)實(shí)時(shí)維護(hù)水平。