隨著計算機以及網絡技術的飛速發展,計算機承載的應用軟件日趨復雜,業務系統的健康運行成為衡量IT系統運行質量的重要考量因素,相應的應用監控已經成為當前系統監控工程中一項核心任務。應用監控主要是針對企業的業務軟件的監控。通過應用監控,企業可以從業務角度,更加直接地發現問題。如果業務軟件運行不正常或停止,即使基礎架構部分(支撐應用軟件的網絡、主機、數據庫、中間件軟件等軟硬件基礎設施)運行再好,對于整個系統來講都是致命的問題。如何做好應用監控已經成為監控運維領域的下一個重要方向。
北京聯華信的TeaView一體化綜合監控平臺,可以很好的支持企業業務監控。
1. 應用監控的常規劃分
應用監控主要從用戶感受角度去監測一個系統是否正常,因此,其監控內容一般劃分為如下幾方面:
n 最終用戶體驗監控
針對應用提供的各項功能(交易),從應用系統使用者的用戶體驗角度,監測應用提供的各項功能的系統響應,典型的為端到端響應監控。
n 用戶自定義事務處理性能剖析監控
按照應用系統開發者定義的事務處理邏輯,穿越組成應用系統的業務軟件的各個組件、支撐業務軟件的各基礎架構元素,對該事務的各子處理性能情況開展跟蹤。
n 應用組件深入監控
對組成應用系統的一些關鍵元素的深入監測,以便進一步確定性能問題的根本原因。如:數據庫、應用服務器中間件、消息中間件、甚至包括網絡基礎架構的一些元素等。
n 應用監控性能數據的綜合分析
前三個方面所采集的大量監控數據,經過各種關聯、過濾、聚合等統計分析,輔助定位系統故障、發現性能瓶頸,為性能調優、容量規劃等提供依據。
2. 應用監控的主要內容
按照上述思路,應用監控的主要內容可歸納為如下:
2.1. 聯機處理監控
2.1.1. 業務功能的用戶感受度監控
n 交易響應時間監控
監控典型交易、關鍵交易響應時間。采用模擬交易方式,模擬典型交易、關鍵交易,監控聯機交易的響應時間。
n 交易可用性監控
監控典型交易、關鍵交易是否可用。采用模擬交易方式,模擬典型交易、關鍵交易,監控響應時間是否超過可忍受時間極限,相應結果是否正確。
2.1.2. 應用系統整體服務狀況監控
n 交易量監控
監控不同時段內的交易量。
n 交易成功率監控
監控典型交易、關鍵交易的成功率。通過數據庫交易記錄、交易日志等監控并計算交易成功率,當過低時報警。
n 交易流量監控
監控典型交易、關鍵交易在不同時段的交易流量。通過監控交易請求隊列消息數進行監控。
n 在線用戶數
監控應用在線用戶數。
2.1.3. 聯機應用各組成部分監控
n 網絡監控
監控主機間聯通狀態
n 應用進程監控
1、應用進程啟動、正常停止、異常停止時間
2、進程名稱、數量情況
3、僵死進程情況
4、進程間通信狀態
n 隊列監控
監控消息隊列長度是否超長
n 日志監控
監控日之內異常信息、報警信息、日志的增長情況等。日志可以是文件形式、數據庫記錄形式。
n 應用數據監控
關鍵表訪問量監控。關鍵表記錄、關鍵字段變化情況監控。
2.2. 批處理監控
2.2.1. 批處理完成質量監控
n 完成時間監控
聯機批量的完成時間是否超過預計時間。
n 成功率
批量的處理成功率、各種失敗狀態占比。
2.2.2. 批處理過程監控
n 上游數據源監控
上游系統提供數據(數據文件)到達時間是否及時,數據種類是否齊全,數據量大小是否合理。
n 批處理開始時間
批量處理開始時間、超過預定時間報警。
n 批處理關鍵點監控
關鍵步驟開始時間、結束時間是否在計劃范圍內,可通過批處理日志、數據庫關鍵表記錄監控進行。
n 批處理結束時間
批處理全部結束時間是否在計劃范圍內。
n 批處理過程故障情況
批量中斷情況、批量錯誤信息監控,可通過批處理日志、數據庫關鍵表、關鍵記錄監控進行。
3. 應用監控常規方法
從技術理論上講,信息系統內任何對象的監測采集,不外乎采用兩種辦法:一種是基于該對象對外主動提供的監測指標/特征進行監測;另一種是通過該監控對象所處的外圍環境的一些特征進行間接監測,判斷該對象的運行狀態。
北京聯華信科技有限公司開發研制的TeaView 一體化綜合監控平臺的通用監控模型,提供了豐富的設備連接方式,通過配置方式可自定義監控設備、監控指標、采集方式等。在實際中,通過靈活地使用這些特點,可以廣泛地應用于應用監控。
盡管應用的種類千差萬別,但對每個應用而言,從監控角度,都可將其整體或部分視為管理對象,都可抽象出屬性和事件。因此,可以采取以下常規手段:
l 通過應用管理接口實施監控
對于提供管理接口的應用,按照TeaView監控模型,通過配置方式,實現對管理接口的訪問,從而將應用視為管理對象進行監控,管理對象的屬性則取決于應用管理接口所暴露的參數。完成配置,經過平臺注冊,即可將應用程序作為管理對象實施監控管理,獲取屬性和事件。在監控平臺,還可針對屬性設置告警事件、嚴重事件等級。
l 通過應用日志監控
按照TeaView監控模型,通過配置方式,將日志文件的監控作為屬性添加到封裝的管理對象中,獲得事件信息。
l 通過靈活使用第三方渠道獲得管理對象的屬性、事件
在應用系統安全約束許可條件下,通過間接等價方式,靈活使用第三方渠道獲得管理對象的屬性、事件。
如:對于基于應用中間件開發的應用程序,可通過監控需求分析,確定能夠間接體現應用程序監控特征的中間件屬性、事件,并實施監控;
又如:可通過對操作系統屬性、數據庫表的關鍵狀態位等屬性的監控,間接獲取應用程序監控特征。
總之:對不同應用,均可通過不同方法將其納入TeaView監控平臺,實施統一的監控。