然而,眾多企業(yè)都提出要提高自己的IT運維管理水平,但究竟該怎樣去做,卻缺乏清晰有效的途徑和標(biāo)準。IT運維管理人員到底做的如何?業(yè)務(wù)運行狀態(tài)正在什么水平?這些問題的答案“口說無憑”,終究要拿出“證據(jù)”才能證明IT運維管理的價值已經(jīng)得到提升。
BSM可讓IT運維管理的價值“透明化”
責(zé)備、被投訴在傳統(tǒng)IT部門最常見不過了。IT系統(tǒng)速度越來越慢,不可預(yù)期的宕機,對縱向業(yè)務(wù)的服務(wù)可用性管理依然困擾著IT部門。IT部門常常會聽到:我們都承認IT部門的態(tài)度是好了不少,可故障解決不了,業(yè)務(wù)部門能不向我這里投訴嗎?你提交的報告確實顯示你們縮短了故障響應(yīng)時間,可為什么還是故障頻發(fā)?你們敢肯定網(wǎng)絡(luò)平均響應(yīng)時間已經(jīng)達到了服務(wù)水平了嗎,可我在系統(tǒng)里查訂單怎么越來越慢?
面對業(yè)務(wù)部門日漸增加的需求,努力的CIO疑惑卻又增多了不少:我已經(jīng)使用了先進的IT監(jiān)控工具,利用ITIL的流程也越來越嚴謹,卻還是有內(nèi)部用戶不滿意、領(lǐng)導(dǎo)不滿意,我應(yīng)該如何考核現(xiàn)在的IT服務(wù)能力?而增加預(yù)算、改善服務(wù)流程,乃至業(yè)務(wù)創(chuàng)新,我又該從何入手呢?
作為國內(nèi)領(lǐng)先的IT運維管理專家,北塔軟件認為:“超越了IT基礎(chǔ)層面的監(jiān)控管理;同時源于ITIL、又高于ITIL的BSM則是應(yīng)對以上挑戰(zhàn)最好的方法。BSM是更高層的概念,不僅僅是工具化和流程化,它使得業(yè)務(wù)和IT方面保持一致性或者是建立管理的關(guān)聯(lián)。就像馬路上的電子屏幕一樣,用綠色和紅色表示暢通和擁堵,BSM就是通過透明化的方式,為IT部門和業(yè)務(wù)部門建立一個共同關(guān)聯(lián)的平臺進行交互。“
另外,為了尋求以上問題的答案,我們還對許多已經(jīng)成功實施BSM管理模式的企業(yè)進行了調(diào)查,而這種“透明化”著實會讓IT與業(yè)務(wù)部門都舉雙手通過。首先,因為業(yè)務(wù)系統(tǒng)的管理工作是標(biāo)準化的,人為的因素會降到很低,而企業(yè)實現(xiàn)了流程化管理就能顯著降低人為因素對企業(yè)IT系統(tǒng)的影響。其次,在這個基礎(chǔ)上,BSM能夠進一步讓業(yè)務(wù)管理的流程透明化,使IT與業(yè)務(wù)有交互,從而將IT系統(tǒng)對業(yè)務(wù)系統(tǒng)的支撐完全體現(xiàn)出來。當(dāng)然,那些能夠托起IT運維管理價值的數(shù)據(jù)還會被再挖掘,它們會被明智的用戶用于企業(yè)決策,當(dāng)作加強企業(yè)核心競爭的力量。
BSM有助數(shù)據(jù)挖掘 IT運維管理也有“BI”
時至今日,通過BSM的最佳實踐告訴我們一個道理:BSM實現(xiàn)是循序漸進的,不是一蹴而就的,企業(yè)的所有業(yè)務(wù)都需要運行在完善的IT基礎(chǔ)設(shè)施之上。因此對業(yè)務(wù)的管理自然要從最底層的基礎(chǔ)設(shè)施管理做起,然后逐步去實現(xiàn)流程化管理,并最終實現(xiàn)對業(yè)務(wù)的高效運維。在這一系列的BSM落地工作中,會產(chǎn)生、積累下一些重要的業(yè)務(wù)數(shù)據(jù),而BSM管理的另一重要領(lǐng)域恰恰是對這些數(shù)據(jù)的匯總與分析。
要站在BSM的高崗上,歷史數(shù)據(jù)分析、趨勢分析和服務(wù)質(zhì)量的改進等缺一不可,而這些都需要通過對不同報表的分析來取得決策依據(jù)。針對這種需求,北塔軟件在其推出的北塔BTIM(Betasoft Integrated Management,IT綜合管理軟件)平臺中提供了全方位報表、數(shù)據(jù)分析、決策支撐功能。這包括:利用詳細的流程報表實現(xiàn)整體業(yè)務(wù)執(zhí)行情況,以及概率化分析“工序瓶頸”;SLA和業(yè)務(wù)決策報表;業(yè)務(wù)關(guān)聯(lián)報表;績效管理報表等等。
以業(yè)務(wù)關(guān)聯(lián)報表為例,IT管理人員可以從報表中關(guān)注設(shè)備和資源、業(yè)務(wù)的可用性,并根據(jù)性能數(shù)據(jù)分析報表對系統(tǒng)進行TopN排序。通過對歷史數(shù)據(jù)的分析,聚焦未解決故障、重大故障次數(shù)、Mean Time To Repair(平均恢復(fù)時間) 、Mean Time Between Failure(故障平均時間)等方面,并且可以按照事件的嚴重級別和優(yōu)先級進行分析統(tǒng)計。其次,還可以利用這些數(shù)據(jù)對業(yè)務(wù)趨勢進行分析,由特定時間段內(nèi)的歷史數(shù)據(jù)分析出預(yù)測曲線。最終,通過業(yè)務(wù)運行率報表提供的業(yè)務(wù)系統(tǒng)運行分析和性能報告,運維管理人員能夠根據(jù)這些報告準確評估整個業(yè)務(wù)系統(tǒng)運行情況,及時發(fā)現(xiàn)故障隱患和評估威脅,為IT投資決策提供參考依據(jù)。
眾所周知,數(shù)據(jù)挖掘是從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中發(fā)現(xiàn)并提取隱藏在其中的信息或知識的過程,目的是幫助分析人員尋找數(shù)據(jù)間潛在的關(guān)聯(lián),發(fā)現(xiàn)忽略的要素,而這些信息對預(yù)測趨勢和決策行為是十分有用的,所以它屬于決策支持系統(tǒng)的范疇。而IT部門一直在玩著《勇敢者的游戲》,是不是有可能利用BSM這步棋創(chuàng)造出IT運維管理的BI(BI,商業(yè)智能 Business Intelligence)呢?而答案就在BSM不斷實踐的路上。