進入新的世紀之后,高等學(xué)校對于校園網(wǎng)絡(luò)系統(tǒng)的依賴程度日益加強,隨之出現(xiàn)了網(wǎng)絡(luò)規(guī)模不斷擴張的現(xiàn)象。校園網(wǎng)絡(luò)中心的地位隨著系統(tǒng)規(guī)模的擴大,成為了廣大教職員工、管理人員的關(guān)注焦點。隨著而來的一個現(xiàn)象是,越來越多的網(wǎng)絡(luò)故障處理使得網(wǎng)管人員整日疲于奔命,越來越頻繁的網(wǎng)絡(luò)攻擊行為使得購置了昂貴網(wǎng)絡(luò)防護設(shè)備的校園網(wǎng)不堪一擊。如何提高網(wǎng)絡(luò)管理效率,如何快速恢復(fù)因攻擊而癱瘓的系統(tǒng),成為高校網(wǎng)管人員急切解決的技術(shù)難題。如何盡量減少停機率,如何變被動式的網(wǎng)絡(luò)管理為系統(tǒng)主動承擔(dān)起可能的網(wǎng)絡(luò)管理責(zé)任,體現(xiàn)了運維管理技術(shù)的軟件系統(tǒng)的興起正在為網(wǎng)管人員提供理想的解決問題的策略。本文結(jié)合幾所高校實施北塔運維管理的經(jīng)驗,談一談高校運維管理的實施策略。
1.應(yīng)該尊重運維管理的規(guī)律
運維管理是IT管理的重要組成部分,從確保系統(tǒng)運行的角度來說,運維管理幾乎是整個IT管理的全部。調(diào)查幾所高校的網(wǎng)絡(luò)主管之后,筆者得出了一個重要的結(jié)論,尊重運維管理的內(nèi)在規(guī)律是調(diào)高運維效果的根本保障。
IT運維管理的核心和重點部分分成兩大部分,即IT業(yè)務(wù)系統(tǒng)和運維人員。具體包括七個子系統(tǒng):設(shè)備管理、數(shù)據(jù)管理、內(nèi)容管理、資源資產(chǎn)管理、信息安全管理和日常工作管理等。其中設(shè)備管理負責(zé)對校園網(wǎng)絡(luò)的網(wǎng)絡(luò)設(shè)備、服務(wù)器設(shè)備、操作系統(tǒng)運行狀況等方面進行監(jiān)控,并對各種應(yīng)用支撐軟件,如數(shù)據(jù)庫、中間件、群件以及各種通用或特定服務(wù)的監(jiān)控管理,如郵件系統(tǒng)、DNS、Web等的監(jiān)控與管理;數(shù)據(jù)/存儲/容災(zāi)管理則負責(zé)對系統(tǒng)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)進行統(tǒng)一的存儲、備份和恢復(fù);業(yè)務(wù)管理則負責(zé)對學(xué)校核心業(yè)務(wù)系統(tǒng)運行情況的監(jiān)控與管理;目錄/內(nèi)容管理主要負責(zé)學(xué)校需要統(tǒng)一發(fā)布的公共信息的管理;資源資產(chǎn)管理負責(zé)管理學(xué)校IT系統(tǒng)的資源資產(chǎn)情況,并與學(xué)校財務(wù)部門進行數(shù)據(jù)交互,這一項目在參與調(diào)研的多數(shù)學(xué)校沒有實施;信息安全管理包含校園網(wǎng)絡(luò)系統(tǒng)的安全組織方式、通信與運營安全、訪問控制等方面的管理;日常工作管理則用于規(guī)范和明確運維人員的崗位職責(zé)和工作安排、提供績效考核量化依據(jù),進而完善IT運維管理,提高網(wǎng)絡(luò)信息部門的服務(wù)水平。
要尊重運維管理的規(guī)律,就是要求網(wǎng)絡(luò)管理人員做到變被動管理為主動管理,最大限度發(fā)揮運維管理系統(tǒng)的作用,盡量做到少停機或在不停機的狀態(tài)下完成網(wǎng)絡(luò)運維工作。即使必須停機的情況下,也要做到在停機之前檢查所有環(huán)節(jié)是否正常,并在可能的前提下對系統(tǒng)進行備份。狀況排除之后,在首次啟動機器之前,要先落實設(shè)備不能正常啟動時,可以保證能得到供應(yīng)商的服務(wù)支持,多數(shù)情況下這類服務(wù)需要付出足夠的服務(wù)費用。參與調(diào)查的一些學(xué)校,有2/3的學(xué)校因為拒絕付出服務(wù)費用而在系統(tǒng)出現(xiàn)故障的時候,供應(yīng)商拒絕提供免費的及時服務(wù)響應(yīng),這是需要引起各高校重視的。
尊重運行維護的基本規(guī)律是非常重要的維護理念,尤其是與網(wǎng)絡(luò)中心有直接責(zé)任的一些部門的主管,面臨運維管理和行政管理沖突時,要說服自己理解網(wǎng)絡(luò)運維的規(guī)律,為網(wǎng)絡(luò)系統(tǒng)的安全,有時行政管理要有所讓步。
2.重視BSM
從單臺設(shè)備的管理過渡到目前以整體系統(tǒng)運維,IT運維管理經(jīng)歷了漫長的發(fā)展歷程。然而隨著高校網(wǎng)絡(luò)規(guī)模和信息化水平的不斷提升,單純的設(shè)備管理或者人工管理模式顯然不能滿足高校對網(wǎng)絡(luò)整體性能和穩(wěn)定性的要求,專家們由此提出了業(yè)務(wù)服務(wù)管理是IT運維管理的終極目標的全新理念,也就是今天我們常說的BSM。
高等學(xué)校的運維管理中,涉及到的業(yè)務(wù)服務(wù)項目包括教務(wù)管理、行政管理、信息查詢管理等諸多方面。為了更好地運營維護好IT系統(tǒng),網(wǎng)絡(luò)中心需要進行全新的管理變革,啟動IT運維管理系統(tǒng),可以自動管理全校的IT資源,并可直觀顯示設(shè)備及網(wǎng)絡(luò)鏈路的負載或通斷狀態(tài);需要將終端設(shè)備的IP和MAC地址進行綁定,便于管理人員迅速定位地址盜用、沖突以及非法設(shè)備上網(wǎng)的問題;還需要直觀的數(shù)據(jù)流量分析,以便查找異常數(shù)據(jù)流量,為正常的教學(xué)工作提供穩(wěn)定的支持;同時提供網(wǎng)絡(luò)預(yù)警功能,對設(shè)備狀態(tài)、應(yīng)用服務(wù)端口狀態(tài)、數(shù)據(jù)包傳輸情況進行預(yù)警設(shè)置,并能以聲音或者短信的方式告知網(wǎng)絡(luò)系統(tǒng)管理員。運維平臺系統(tǒng)可以進行流程化的管理,管理員應(yīng)該以郵件的形式將故障處理結(jié)果告知需要服務(wù)的用戶。
在設(shè)備選型方面應(yīng)該選擇思科等品牌的網(wǎng)絡(luò)設(shè)備,服務(wù)器等關(guān)鍵部件也應(yīng)選擇國內(nèi)外知名的品牌,如IBM、HP、DELL、浪潮、聯(lián)想等等。運維系統(tǒng)軟件也要選擇北塔等知名品牌的產(chǎn)品。設(shè)備選型確定后,系統(tǒng)安裝應(yīng)該進行有關(guān)網(wǎng)絡(luò)性能的測試,以保證運維系統(tǒng)對常規(guī)的網(wǎng)絡(luò)運營效率不產(chǎn)生明顯的影響。最后一個環(huán)節(jié)是做好用戶的培訓(xùn),使用戶理解運維系統(tǒng)的工作程序,使運維系統(tǒng)最大程度地發(fā)揮其效能。比如在用戶網(wǎng)絡(luò)系統(tǒng)發(fā)生故障時,網(wǎng)管軟件第一時間發(fā)出告警,通過性能分析能夠發(fā)現(xiàn)當前設(shè)備的異常,進而關(guān)聯(lián)設(shè)備的物理拓撲圖,并在物理拓撲圖上確定其告警的重要等級,如果緊急故障則需要迅速排除,以保障用戶網(wǎng)絡(luò)系統(tǒng)的正常,通過在設(shè)備的面板圖上進行直接的操作可以極大的節(jié)省處理故障時間,有效提高用戶的日常工作效率。
3.北塔運維系統(tǒng)應(yīng)用分析
以圖1中的網(wǎng)絡(luò)拓撲結(jié)構(gòu)為例我們分析應(yīng)用了北塔運維系統(tǒng)的一些常見問題。選擇適合的IT運維產(chǎn)品是問題解決的前提,應(yīng)該根據(jù)學(xué)校的IT規(guī)模決定選擇適合的IT基礎(chǔ)設(shè)施管理產(chǎn)品。選擇的重點應(yīng)該是底層監(jiān)控,因為只有做好了底層監(jiān)控,對數(shù)據(jù)進行歸并分析,才能為更高層的流程化管理以及學(xué)校日常業(yè)務(wù)管理提供數(shù)據(jù)支持。一些大而全的產(chǎn)品實施起來對管理人員的技術(shù)以及管理水平都有較高的要求,而這些對于那些網(wǎng)絡(luò)信息部門只有10人以下的學(xué)校來說,選擇國產(chǎn)IT運維品牌,如北塔軟件這樣的國內(nèi)廠商,才是恰當?shù)倪x擇。
除此之外,還要由長遠的發(fā)展目標。很多學(xué)校認為,購置了IT運維軟件,以后就無需過度關(guān)注IT運維問題了,事實上IT系統(tǒng)和業(yè)務(wù)應(yīng)用是動態(tài)發(fā)展變化的,架構(gòu)的調(diào)整,規(guī)模的擴大等等都對運維管理軟件和管理人員提出更高的要求,對IT運維軟件的更新升級,或者實施新的IT運維管理平臺都是學(xué)校信息化領(lǐng)導(dǎo)需要不斷去考慮的問題。隨著技術(shù)的發(fā)展,網(wǎng)絡(luò)運維管理已經(jīng)上升到一個全面、綜合的發(fā)展階段,其管理的范疇已經(jīng)不僅僅局限于對于網(wǎng)絡(luò)、設(shè)備的管理,用戶所需要的網(wǎng)管就是全面、綜合性的網(wǎng)管,即從設(shè)備到線路,從機房環(huán)境到應(yīng)用服務(wù),再到整體的網(wǎng)絡(luò)性能,這是新一代網(wǎng)絡(luò)運維管理軟件的特征,也是運維管理人員必須理解的網(wǎng)絡(luò)運維管理的真諦。
經(jīng)過多家采用北塔運維產(chǎn)品的高校認為,北塔BTNM網(wǎng)絡(luò)管理系統(tǒng)可以全面解決高校的網(wǎng)絡(luò)信息系統(tǒng)運維管理問題,具體體現(xiàn)在:(1)層次化部署,統(tǒng)一式管理。通過分層管理,信息中心通過使用BTNM產(chǎn)品,在網(wǎng)絡(luò)管理中心可以直接調(diào)閱所有下屬部門的網(wǎng)絡(luò)實時物理拓撲結(jié)構(gòu),包括設(shè)備負載情況、端口狀態(tài),故障日志等等。各層次相對獨立,上級部門可以對下級部門進行管理,保證了網(wǎng)絡(luò)管理的統(tǒng)一性和完整性。(2)準確定位、報警及時。BTNM提供故障預(yù)警管理,通過設(shè)置“閾值”,可以監(jiān)測設(shè)備運行是否超負載、線路流量是否正常、端口是否異常錯包等現(xiàn)象,并可以準確定位故障位置。(3)分級管理。BTNM為學(xué)校網(wǎng)管提供多用戶多角色管理,包括系統(tǒng)用戶管理、角色管理、角色權(quán)限分配、操作審記和日志管理等功能,不同的管理人員賦予了不同級別的權(quán)限,為主管領(lǐng)導(dǎo)查看網(wǎng)絡(luò)整體運行情況以及進一步采取網(wǎng)絡(luò)架構(gòu)優(yōu)化調(diào)整提供了數(shù)據(jù)參考。(4)協(xié)同運維管理。通過北塔業(yè)務(wù)流程管理系統(tǒng),建立網(wǎng)絡(luò)運維知識庫,保障了網(wǎng)絡(luò)正常運行,通過系統(tǒng)定義全網(wǎng)管理人員在網(wǎng)絡(luò)運維中的不同職能,為實現(xiàn)協(xié)同運維管理提供了規(guī)范的流程。
4.結(jié)束語
運維管理是提高高校網(wǎng)絡(luò)性能的必備保障,已經(jīng)成為諸多高校舍得花費成本建設(shè)的網(wǎng)絡(luò)信息系統(tǒng)的重要組成部分。通過筆者的調(diào)研,經(jīng)過實踐的用戶普遍認為,運維管理系統(tǒng)的實施可以有效解決網(wǎng)絡(luò)管理中存在的各類問題,降低了網(wǎng)絡(luò)運維成本,為用戶提供了性價比優(yōu)良、符合管理要求的運維工具。網(wǎng)絡(luò)管理員該系統(tǒng)可以及時發(fā)現(xiàn)故障位置,及時排除故障原因,確保為廣大教師和行政管理人員提供安全、穩(wěn)定的網(wǎng)絡(luò)環(huán)境。