楊 志
電力行業(yè)運(yùn)維現(xiàn)狀
隨著信息技術(shù)在電力行業(yè)經(jīng)營(yíng)管理中的廣泛應(yīng)用,信息安全問題越來越顯得重要。電力系統(tǒng)信息安全問題威脅到電力系統(tǒng)的安全、穩(wěn)定、經(jīng)濟(jì)、優(yōu)質(zhì)的運(yùn)行,影響著數(shù)字電力系統(tǒng)信息化的實(shí)現(xiàn)進(jìn)程。
經(jīng)過近幾年的信息化安全建設(shè),相關(guān)電力部門都已經(jīng)建設(shè)了完備的基礎(chǔ)網(wǎng)絡(luò),同時(shí)實(shí)施了一些防御安全系統(tǒng)(防火墻,網(wǎng)絡(luò)版防毒系統(tǒng)),為電力部門的信息安全保證起了很大的作用。但是隨著電力部門對(duì)信息化的依賴程度不斷提高,光憑借單純的防御安全系統(tǒng),并不足以保證企業(yè)的各個(gè)系統(tǒng)正常運(yùn)行,例如,各種平臺(tái)如操作系統(tǒng)和數(shù)據(jù)庫的運(yùn)行,直接影響到業(yè)務(wù)系統(tǒng)的正常運(yùn)作,很多業(yè)務(wù)系統(tǒng)出現(xiàn)的各類故障都是因?yàn)榛A(chǔ)信息平臺(tái)引起的。這些系統(tǒng)的運(yùn)行參數(shù)需要被統(tǒng)一監(jiān)控管理,一旦出現(xiàn)異常情況,需要第一時(shí)間通知系統(tǒng)管理人員,把故障隱患及時(shí)排除,使企業(yè)的損失降到最低。
另一方面,隨著桌面機(jī)的大量部署,桌面設(shè)備帶來很大的安全隱患,一方面一些安全設(shè)置不高的機(jī)器一旦感染病毒木馬,會(huì)嚴(yán)重影響整個(gè)企業(yè)的網(wǎng)絡(luò)安全,另一方面,桌面機(jī)的用戶又缺乏計(jì)算機(jī)的安全防范技術(shù),需要系統(tǒng)管理員提供更好的技術(shù)支持。
另外,電力部門大多擁有數(shù)量眾多且分散的PC機(jī),在實(shí)際工作中,維護(hù)和管理起來非常困難,特別是沒有任何技術(shù)手段支持,僅靠現(xiàn)有有限人員進(jìn)行人工的管理和維護(hù),想要把這項(xiàng)工作做好,幾乎是不可能的事 情,所以工作往往停留在對(duì)問題的緊急響應(yīng)方面,顯得極為被動(dòng)
基于以上的現(xiàn)狀分析,有必要建立一套完善的IT運(yùn)維管理系統(tǒng),使得信息管理部門能隨時(shí)掌握了解企業(yè)信息平臺(tái)發(fā)生的各種情況,在第一時(shí)間感知系統(tǒng)出現(xiàn)的故障和問題,同時(shí)應(yīng)建立響應(yīng)的快速反應(yīng)計(jì)劃,在出現(xiàn)故障的時(shí)候迅速采取措施,恢復(fù)網(wǎng)絡(luò)或系統(tǒng)的正常運(yùn)行。
電力行業(yè)IT運(yùn)維管理解決方案
根據(jù)電力部門的實(shí)際網(wǎng)絡(luò)監(jiān)控需要,廣通推出了Broadview IT運(yùn)維管理平臺(tái),以管理電力部門的網(wǎng)絡(luò)環(huán)境,保障其正常運(yùn)轉(zhuǎn);同時(shí)桌面管理兼顧了電力部門內(nèi)網(wǎng)的PC機(jī)監(jiān)控,有效規(guī)范了上網(wǎng)行為,從終端設(shè)備做好安全防范,確保網(wǎng)絡(luò)系統(tǒng)安全無憂。
一.網(wǎng)絡(luò)管理確保電力網(wǎng)絡(luò)不斷
1 、基礎(chǔ)網(wǎng)絡(luò)監(jiān)控系統(tǒng)
信息傳輸網(wǎng)絡(luò)如同高速公路一樣重要,各種資源通過網(wǎng)絡(luò)進(jìn)行輸送信息和數(shù)據(jù),網(wǎng)絡(luò)出現(xiàn)故障,尤其是中心交換設(shè)備出現(xiàn)故障時(shí),企業(yè)信息處理將處于癱瘓的境地,這也是使用IT運(yùn)維管理系統(tǒng)的原因。針對(duì)防火墻安全防御層的軟件硬件的監(jiān)控,將其納入IT運(yùn)維管理系統(tǒng)中,其實(shí)現(xiàn)方式是,對(duì)于支持SNMP的設(shè)備,通過SNMP獲取其運(yùn)行的狀態(tài)和性能信息,另外,各個(gè)系統(tǒng)配置各自的報(bào)警,將其轉(zhuǎn)發(fā)到 信息資產(chǎn)綜合管理系統(tǒng)中,這樣可以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)層從普通交換機(jī)路由器到安全防御設(shè)備的全面監(jiān)控。
2、主機(jī)操作系統(tǒng)監(jiān)控系統(tǒng)
包括主機(jī)硬件部分及其操作系統(tǒng),如磁盤陣列和WINDOWS 2003 SERVER等,這類信息資源與網(wǎng)絡(luò)同樣重要,只不過他的影響有時(shí)候是局部的,一臺(tái)財(cái)務(wù)服務(wù)器的癱瘓不會(huì)影響到OA系統(tǒng)的運(yùn)行,但是對(duì)于財(cái)務(wù)部門將是災(zāi)難性的,所以對(duì)于服務(wù)器的操作系統(tǒng),IT運(yùn)維管理系統(tǒng)都做到了全面監(jiān)控。
IT運(yùn)維管理系統(tǒng)主要管理Windows的可用性和性能:監(jiān)控性能統(tǒng)計(jì)數(shù)據(jù),如CPU利用率、內(nèi)存利用率、磁盤利用率和應(yīng)答時(shí)間。監(jiān)控Windows系統(tǒng)中運(yùn)行的進(jìn)程:如果Windows系統(tǒng)或該系統(tǒng)中任何指定的屬性出現(xiàn)問題,將基于所配置的閾值生成通知和告警;基于配置自動(dòng)執(zhí)行操作;即刻呈現(xiàn)性能圖表和報(bào)表;基于可用性、健康狀況和連接時(shí)間分組和顯示報(bào)表;提供歷史的和當(dāng)前的Windows性能指標(biāo),以便了解特定時(shí)間段內(nèi)的性能狀態(tài);監(jiān)控整體的CPU利用情況,并顯示哪些進(jìn)程正在消耗多少CPU資源;監(jiān)控內(nèi)存使用情況并檢測(cè)內(nèi)存消耗大戶。
3、數(shù)據(jù)庫監(jiān)控系統(tǒng)
電力部門目前絕大部分的應(yīng)用系統(tǒng)都依賴數(shù)據(jù)庫系統(tǒng),從OA到輔助設(shè)計(jì),核心的業(yè)務(wù)系統(tǒng)更是如此。數(shù)據(jù)庫里保存著信息系統(tǒng)最核心的資源:企業(yè)的數(shù)據(jù),所以一個(gè)正常運(yùn)行的數(shù)據(jù)庫尤為重要。
電力部門信息系統(tǒng)的運(yùn)行依賴多種執(zhí)行關(guān)鍵業(yè)務(wù)的服務(wù)器來保障業(yè)務(wù)的順暢運(yùn)行,但通常情況下會(huì)出現(xiàn)故障時(shí)間或應(yīng)答時(shí)間延長(zhǎng),這都將影響到最終用戶以及自身的業(yè)務(wù)進(jìn)展。電力部門所需要的就是一個(gè)能夠監(jiān)控其網(wǎng)絡(luò)中所有應(yīng)用和服務(wù)的監(jiān)控軟件。
IT運(yùn)維管理系統(tǒng)的數(shù)據(jù)庫管理功能有助于在關(guān)鍵數(shù)據(jù)庫出現(xiàn)的性能問題影響到最終用戶之前快速檢測(cè)、診斷和解決這些問題。同時(shí)能在影響到業(yè)務(wù)可用性之前將問題通知數(shù)據(jù)庫管理人員和使用人員。
4、綜合監(jiān)控告警平臺(tái)
以上所述是各個(gè)子系統(tǒng)的功能。這些子系統(tǒng)監(jiān)視各自領(lǐng)域的參數(shù),根據(jù)事先配置的頻率將各項(xiàng)參數(shù)值提交到綜合監(jiān)控告警平臺(tái)。IT運(yùn)維管理系統(tǒng)負(fù)責(zé)接受各個(gè)系統(tǒng)(包括各類監(jiān)控系統(tǒng)和各類成熟的網(wǎng)管系統(tǒng))的告警信息,根據(jù)配置數(shù)據(jù)庫,將告警路由到相關(guān)的告警方式上(如短信,郵件,傳真,執(zhí)行外部程序或者聲光電告警)同時(shí)根據(jù)事先配置的關(guān)聯(lián)策略,將某種故障可能引發(fā)的其他的故障實(shí)現(xiàn)報(bào)告給相關(guān)管理員。
各種豐富多樣,高效的告警方式,包括:短消息方式,通過省局網(wǎng)絡(luò)通道將故障信息發(fā)送到相關(guān)管理員的手機(jī)上;本地聲音告警,本地播放告警信息,如警報(bào)聲或者事先錄制好的語音告警;警燈告警,可以接到值班室或者其他地方,將一些重大事故,如火警等通知值班人員。
二.桌面管理確保數(shù)據(jù)不丟、系統(tǒng)不癱
IT運(yùn)維管理系統(tǒng)在主要從資產(chǎn)管理、桌面管理、補(bǔ)正管理等方面管理電力部門的設(shè)備,通過以上功能實(shí)現(xiàn)資產(chǎn)明確,輕松管控內(nèi)網(wǎng)安全,實(shí)現(xiàn)高效、批量安裝軟件、補(bǔ)丁等。
1、 資產(chǎn)管理
資產(chǎn)管理包括所有IT相關(guān)的硬件軟件的資產(chǎn)清單,匯總,報(bào)表及異常情況報(bào)告等管理。資產(chǎn)管理作為桌面管理的一個(gè)部分,但是又不僅包括PC機(jī)的管理。資產(chǎn)管理功能從以下兩個(gè)方面予以實(shí)現(xiàn):
一是管理的資產(chǎn)類別,包括PC機(jī)、交換機(jī)、服務(wù)器等硬件和操作系統(tǒng)、應(yīng)用軟件等軟件這兩個(gè)方面。資產(chǎn)管理不僅可以實(shí)時(shí)監(jiān)視資產(chǎn)的當(dāng)前運(yùn)行狀況,資產(chǎn)變動(dòng),而且對(duì)于一些非IT的設(shè)備,或者一些無法直接獲取數(shù)據(jù)的設(shè)備也應(yīng)納入管理范圍,允許用戶手工增加編輯這些設(shè)備。對(duì)于資產(chǎn)的類別,IT運(yùn)維管理系統(tǒng)也應(yīng)允許用戶自由添加,編輯和刪除類別信息,如可以允許用戶增加一個(gè)“存儲(chǔ)陣列柜”的資產(chǎn)類別,用戶可以自己編輯相關(guān)的屬性。這樣可以實(shí)現(xiàn)一個(gè)完整的資產(chǎn)管理。
二是基于生命周期的資產(chǎn)管理,資產(chǎn)的生命周期,主要是指資產(chǎn)的采購,入庫,領(lǐng)用,正常使用,維修,庫存,報(bào)廢等一系列資產(chǎn)的生命狀態(tài)。資產(chǎn)是個(gè)動(dòng)態(tài)的概念,我們要隨時(shí)掌握當(dāng)前有哪些設(shè)備是正常運(yùn)行的,哪些處于維修或者庫存狀態(tài)。基于生命周期的管理可以全面的考查資產(chǎn)的全面信息。
2、桌面安全管理
桌面的安全包括如下方面內(nèi)容:
桌面的補(bǔ)丁管理:桌面系統(tǒng)大多為WINDOWS平臺(tái),因?yàn)椴僮飨到y(tǒng)本身的原因,系統(tǒng)需不斷的更新補(bǔ)丁和服務(wù)包才能處于一個(gè)相對(duì)安全的狀態(tài),桌面的補(bǔ)丁管理包括補(bǔ)丁的檢測(cè),補(bǔ)丁內(nèi)容的查詢,補(bǔ)丁安裝情況的檢測(cè),補(bǔ)丁的自動(dòng)分發(fā)安裝等。
桌面的漏洞管理:桌面系統(tǒng)會(huì)因?yàn)橐恍┯脩襞渲玫脑颍斐蔀楝F(xiàn)的漏洞,如管理員的口令設(shè)置的過與簡(jiǎn)單甚至為空,不必要的共享,系統(tǒng)的注冊(cè)表出現(xiàn)一些危險(xiǎn)的起動(dòng)項(xiàng)信息。
桌面運(yùn)行狀態(tài):桌面系統(tǒng)在運(yùn)行的時(shí)候,也許會(huì)突然出現(xiàn)流量增大的現(xiàn)象,大多是中了木馬病毒,這樣對(duì)整個(gè)系統(tǒng)是嚴(yán)重的危險(xiǎn),需要及時(shí)發(fā)現(xiàn)處理。
IT運(yùn)維管理系統(tǒng)能夠快速定位全網(wǎng)范圍內(nèi),使用網(wǎng)絡(luò)流量最多或者突然增長(zhǎng)的設(shè)備,隨時(shí)可以監(jiān)視網(wǎng)絡(luò)資源的使用,確保不被亂用濫用。系統(tǒng)應(yīng)展現(xiàn)一段時(shí)間,使用網(wǎng)絡(luò)帶寬最高的多0臺(tái)設(shè)備清單,應(yīng)該可以分析占用帶寬的協(xié)議類型。
3、軟件分發(fā)
軟件分發(fā)是桌面管理模塊的一個(gè)重要功能,實(shí)施以后,電力部門的批量軟件安裝工作可以大為節(jié)省。對(duì)于軟件分發(fā),應(yīng)該通過軟件倉庫將常用的軟件和定制的軟件上傳到里面。軟件分發(fā)應(yīng)支持標(biāo)準(zhǔn)的微軟安裝包的格式(MSI)。軟件分發(fā)應(yīng)記錄分發(fā)的結(jié)果,可以查詢哪些設(shè)備成功的安裝,哪些出現(xiàn)故障。
由上可看出,電力行業(yè)需要集網(wǎng)絡(luò)管理與桌面管理于一體的IT運(yùn)維平臺(tái)管理工具,Broadview IT運(yùn)維平臺(tái)完全滿足了管理需要,為電力行業(yè)提供了優(yōu)質(zhì)、全面的IT運(yùn)維解決方案。