安徽省電話交換技術支援中心 張昱 劉偉 鄭連城
摘 要 給出了一種適應市縣一體化改革的電信動力及環境集中監控系統——TELPOW的解決方案。重點介紹TELPOW系統的系統結構、組網方案、功能設置以及關鍵部分的設計思想。該系統可與電信本地網網管系統有機地融合,在綜合電信網管的實施上進行了初步探索。
關鍵詞 集中監控 維護體制 采集設備 設備類 信號類
1 引言
——為了提高全省電信系統各通信局(站)的通信機房動力及環境集中監控的水平,保證動力設備的正常運轉,確保通信暢通和電信生產安全,安徽省郵電管理局(以下簡稱省管局)和科大恒星公司合作開發了電信動力及環境集中監控系統,并在蕪湖市本地網試點,系統于1999年8月通過驗收,現正向其他地市推廣。
2 TELPOW系統的系統結構
——電源監控系統是對電源系統和空調系統的各個設備進行遙測、遙信和遙控,達到實時監視系統和設備的運行狀態,記錄和處理相關數據,及時發現故障并發出告警,對智能設備能通過本系統進行遠程控制,從而實現通信局(站)的少人或無人值守,提高供電系統的可靠性和通信設備的安全性。由于該系統是對本地網網管和集中監控系統功能擴展和完善,因此應盡量利用已有的網絡平臺和硬件資源。使其能和 TEDCOM系統(安徽省本地電話網網管和集中監控系統)統一維護和管理,從而能投資省、見效快地在全省各個本地網中推廣使用。
2.1 TELCOM系統結構簡介
——已有的TELCOM系統為兩級三層客戶機/服務器(Client/Server)體系結構,“兩級”表示省、地市兩級網管系統,“三層”是將應用功能分為表示層、功能層和數據層3部分。
——地市級網管系統的組織模式為“操作終端—服務器—接口機—交換機”。其中接口機負責實現對交換機的數據采集和人機命令的發送及命令結果的回收;同時還肩負報告分析及向服務器發送關鍵數據。一臺接口機可以連接若干臺交換機。在一個本地網內,接口機有多臺,一般分布在交換機機房近端。接口機與服務器以及操作終端與服務器之間的通信方式為符合TCP/IP標準的自定義數據包。
2.2 TELPOW系統結構設計
——為利用已有的網絡平臺和硬件資源,同時滿足技術規范中SC、SS、SU和SM的分級結構,我們將TELPOW系統(電信動力及環境集中監控系統)的結構設計如下:
——1)系統仍為兩級三層客戶機/服務器體系,與TELCOM系統共用網絡平臺和服務器。服務器為雙機熱備,平時TELECOM 和TELPOW分別獨自運行在兩個不同的機器上;當其中一個機器出現故障時,其所運行的系統自動切換到另一機器上,形成兩個機器互為主備份的格局。
——2)對于技術規范中 SC、SS、SU和SM的分級結構,本系統不是從物理結構上劃分,而是在統一的本地網“操作終端— 服務器—接口機”的模式下進行邏輯上的劃分,即由軟件處理這種分級的不同功能需求。
——3)利用TELCOM系統的接口機實現對監控項目的數據采集與控制。由于目前TELCOM系統的接口機基本分布在交換機機房近端,而監控設備與交換機房基本上是在一個地理位置的,因此利用TELECOM系統的接口機可以節省硬件的投資,更好地發揮它的作用。當然,對于沒有TELCOM系統接口機的通信局站還是需要額外購買相關的硬件設備。
——4)接口機對監控信號的采集與控制是通過其他廠家的采集設備間接實現的。這樣做的原因主要有以下考慮。
——·目前市面上的采集設備產品比較成熟可靠,而開發研制采集設備的周期比較長,引入其他廠家的采集設備可以在短時間內完成監控系統的研制工作:
——·不同廠家對同一種設備的協議解析程度不同,從而造成它們提供的可采集或監控的項目不完全一樣,而隨著時間的推移,它們對設備的協議解析能力會不斷提高。本系統盡力將這種因廠家造成的差異封裝在應用層以下。
2.3 TELPOW系統的組網方式
——本地網中操作終端、服務器、接口機的組網方式同TELCOM系統一樣,最終形成廣域網。廣域網的拓撲結構沒有具體要求,只是要求它們之間的通信方式符合TCP/IP標準。這里重點敘述接口機到監控設備的連接方式。安徽省電信管理局選定的采集設備是中達和華為兩家公司的產品。下面僅介紹它們與接口機的連接方式,如圖1、2所示。
2.3.1 中達的采集設備與監控設備連接
——在中達公司提供的產品中,BCMS為電池監控專用模塊;RTU為現場傳統設備采集模塊;UPC為萬用型智能協議轉換器,負責對智能設備的協議轉換。在一個通信局站(SU)內。可通過這些模塊實現對局站內監控項目的采集、控制,所有這些模塊通過RS232/485串口和接口機連接。
2.3.2 華為的采集設備與監控設備連接
——在華為公司提供的產品中,AMS-1為智能設備處理機,它可作為SU級采集設備和智能接口設備的管理器,通過 RS232/485串口和接口機連接。華為對于非智能設備的采集方法是:通過電池監測儀BMS-1對電池組進行數據采集;通過油機監測儀GMS-1或數據采集器PMC-2、PMC-3對非智能油機進行數據采集;對于其他非智能設備,則通過PMC-2或PMC-3進行數據采集。
——需要指出的是,SU 中采集模塊的多少并不一定相同,這取決于該sU希望采集的信號點數以及所選擇的采集模塊類型。
3 關鍵問題及其解決策略
——在明確系統的總體結構后,如何提供靈活的、適應全省各地的、安全可靠的監控手段是本系統設計和實現的關鍵。下面列舉部分關鍵問題及其解決策略。
3.1 監控項目的確定
——通過比較技術規范中所列的監控項目以及中達、華為兩家采集設備可采集到的監控項目,我們發現它們之間并不完全一致,這主要受到監控設備本身以及協議解析程度的影響。現有的一些電源監控系統往往將所能監控的項目靜態地定義在程序中,這種做法顯然不適應本系統的處理要求。因為:
——①安徽各地市、各局站需要監控的項目不可能完全一樣;
——②對于尚未解析的設備監控項目,今后不便于擴展;
——③部分監控項目具有多級概念,如整流器輸出電流分系統、架電流、組電流和模塊電流等幾級,具體的級數和每一級的數量在不同局站是不完全一樣的;
——④需要適應今后技術規范對監控項目范圍的變化等。
——為此我們設計了一種靈活的監控項目處理方法,這里只簡要敘述其思想。
——(1)監控設備類的概念
——首先監控項目是按監控對象分別定義的。在本監控系統中,所監控的對象包括通信電源、空調及機房環境。由于電源部分涉及的設備種類繁多,而不同局站因規模、選型等原因會造成其設備情況不一樣,為此,我們可將監控對象分類(如電源設備可根據其供電體系進行分類),大類進一步細分為小類,一些小類還可進一步分成若干子類。對于監控設備的定義必須先選定其所屬
的設備子類/小類,監控設備的編號中蘊涵其所屬設備類的信息。由于設備類的信息定義在表中,因此可以適應不同本地網提出的不同分類要求。
——(2)信號類的概念
——引入監控設備類后,可以缺省地定義該類設備的監控項目,我們稱之為信號類。信號類引入的目的是確定該類信號的基本屬性,提供用戶配置的缺省值。監控項目可分為模擬量、狀態量、控制量及告警量。其中模擬量是系統的遙測量,狀態量及告警量是系統的遙信量,控制量是系統的遙控量。對于告警量,一般是指模擬量或狀態量為某種異常情況。因此,在信號類中沒有必要給出告警量的類的定義,而是提供較為靈活的配置畫面讓用戶去配置。另外,為便于擴充。又引入“其他模擬量”、“其他狀態量”、“其他控制量”。類似地,信號類的定義也在表中,可以根據情況進行調整。
——(3)信號
——按照上述方法,用戶可以從已有的信號類中選擇配置指定設備的模擬量、狀態量和控制量,并可在已配的模擬量、狀態量基礎上配置告警量。對于遙測和遙信的項目,可以直接通過采集設備采集,也可通過配置的推測公式由其他項目推測而出。
3.2 監控的實時性
——本系統監控的實時性一方面取決于采集設備的性能,另一方面則在于本系統的處理策略。這里只談后者的處理方法。關鍵的步驟有:
——(1)接口機定時輪回地向各個地址發送數據請求,收取應答數據。數據請求的方法一般是在第一次采集時或與采集設備通信恢復后發全取命令,而其余情況一般只取變化的。當與某采集設備通信異常時,需生成一個該采集設備通信異常的信號用于向服務器報告。
——(2)接口機端對于采集到的數據要進行預處理,即將采集數據整理成正常數字格式,乘以換算比率,加上偏移量,得到真實值。這樣可節省服務器的負擔。
——(3)采集分析與上發分開處理之間通過文件接口。這樣,當接口機和服務器發生通信異常時,采集分析仍正常進行,其數據寫入臨時文件,當然文件的大小是有限制的:一旦恢復通信,則上發處理程序即可將臨時文件中的數據上發。
——(4)服務器對收到的采集數據還需進一步分析,其目的主要是根據已有采集數據,計算推測點的數據,判別采集或推測得到的數據是否有告警。
——(5)為使客戶端能及時地了解遙測、遙信的信息,在服務器端設置共享內存,用于存放當前的告警信息(告警板)以及各個信號的最近值。
——(6)可以為每一設備配置維護人員的BP機號碼,實現在告警發生時的自動尋呼功能。
3.3 監控的層次及內容
——根據監控的角度不同,可將本地網監控層次分為按設備類和按局房兩大類,整個監控層次組織成樹形結構。在設備類監控方式下,節點順序依次為地市(SC)→市縣(SS)→局站(SU)→設備大類(如交流供電系統)→設備小類(如低壓配電)(→設備子類(如計量柜))→設備;在局房監控方式下,節點的順序依次為地市→市縣→局站→局房→設備。在每一層均提供圖形和列表兩種監控方式,兩者可隨意切換;上下層之間可以相互遷移。在各層都會將最新告警的簡要信息以狀態條的方式顯示在畫面下方,每層的監控內容有所側重。
——(1)地市級:主要反映所轄市縣的一般、重要、緊急各級告警的數目、最高級別告警等;
——(2)市縣級:主要反映下屬局站的通信狀態、各級告警數目、最高級別告警等;
——(3)局站級:主要反映該局站下所有已配置設備的告警情況(圖形方式通過設備圖標的狀態及設備連接圖上的動畫直觀地反映;列表方式下則以具體的數值給出);
——(4)設備類級:主要反映該設備類下的所有設備的告警情況(信息同(3));
——(5)局房級:主要反映所選局房內的所有設備的告警情況(信息同(3));
——(6)設備級:反映該設備的所有信號的當前狀況。
3.4 統計查詢的處理
——考慮到庫表容量的問題。對于監控項目動態信息的記錄是非周期的。只反映變化的情況,這樣給統計查詢增加了很大的難度。當查詢跨多個局、多個設備、多個信號、多個時間段或時刻,再有求最大、最小值等的復雜要求時,如處理不當則會導致查詢周期過長,用戶意見很大。為此,我們的處理策略如下。
——(1)首先確定待查的設備列表、信號列表及時間段列表。
——(2)分析時間段列表條件,解析成若干個時間段,有以下幾種可能:
——a)按時間段查詢,保持不動;
——b)按時刻查& 無時間間隔,則解析成若干個起始和終了時間都為該時刻的時間段;
——c)按時刻查 & 有時間間隔,按照時間段查詢,再按照時刻進行抽取。
——(3)按照時間段進行循環處理,同時進行多局、同類設備、多個信號查詢,查詢結果放在內存中。
——(4)將內存中的返回結果進行過濾、合并并重新排序(局號、設備、信號、時間),根據查詢類型確定取最大、最小值。
——(5)根據初始的查詢條件以及(4)中的結果,構造查詢結果集。
3.5 靈活的圖形監控界面
——從3.3中已看出本系統提供多層監視圖,其中設備連接圖在各個局站是不太相同的。為此,我們制作一個圖形編輯工具,將它嵌入在配置管理里。通過它可以從已配置的設備、信號中途取構圖要件,再加上圖標、線型、顏色、注釋、動畫等的處理,最終會將圖中的信息點與某些監控項目關聯起來。實時監控則按配置管理所做的圖形要求實現監控項目的圖形顯示。目前本系統能處理的動畫包括,油箱→油機的油路、油機→設備的電路、蓄電池的充放電、空調的動/停、ATS
的狀態、油機切換屏的狀態等。
4 結束語
——由于本系統建立在 “采集設備—接口機—服務器—操作終端”模式的多層客戶機/服務器的系統結構上,系統從邏輯上提供SC、SS、SU、SM的分級功能,這一模式可適應多種維護體制。從實際運行的情況來看,它完全能適應由原先的市縣分別維護管理到現在的市縣一體化維護管理體制的過渡。從與本地網網管系統TELCOM的綜合網管來看,由于在本地網引入雙機熱備的服務器。兩個系統可以較好地運行且互不影響,并且用戶只須在自己聯網的操作終端上分別安裝兩個系統的客戶端軟件,便可在自己的權限范圍內同時使用兩個系統,實現對本地網網管與電信動力及環境監控的綜合網管功能。