如果你有10臺Web服務器,每臺的 CPU和內存使用率只有15%至20%,那么從實際應用情況來看,這些系統是處于空閑的,在白白浪費著數據中心的資源。這些低負載的服務器實際可以用兩臺 高可用的服務器進行整合,將平均利用率維持在65%至75%,對于數據中心而言具有很多的好處:降低服務器數量、降低能耗、降低維護管理開支等等。
下面有五個參考步驟,可以幫助你將負載整合,提高數據中心的應用效率:
1、收集數據
第一個步驟是需要收集系統性能數據,這個步驟需要較長的時間來執行,因為我們不能用 某一時間點的性能數據作為參考,而需要了解性能趨勢的全貌。我們需要收集足夠的數據來觀察每小時的趨勢、每天甚至每個月的趨勢,一年的數據收集時間是更加 合適的。如果之前已經有了這些數據,那么可以進入到下一步:數據分析。
如果還沒有收集系統性能數據,那么就需要從現在開始來進行這個關鍵的步驟了。現在有很多工具可以用來收集數據,比如免費、開源的Orca,是這類工具中 比較好的一個。如果時間允許,在進行下一個數據分析的步驟前,至少要進行兩周的數據收集工作。
2、數據分析
在收集了足夠的數據后,然后需要進行的是數據的分析。同樣,這些工作可以通過工具進 行,如Orca提供了一個強大而形象的分析工具,每小時、每天、每周、每月、每季度、每年的系統性能數據可以清晰用圖表顯示,非常之觀,你不再需要用計算 器來計算上升還是下降的趨勢。
我們需要關注四個主要的性能方 面:CPU、內存、網絡和磁盤。對于CPU利用率,需要檢查用戶和系統進程使用的CPU總量,以及特定時間段內的空閑時間。內存統計在不同的操作系統間有 很大的不同,很難一概而論,Pages in和Pages out,加上Swap in和Swap out,可以對內存性能進行快速的概覽。網絡性能衡量網絡數據的進出能力,即吞吐量。對于大多數系統來說,磁盤性能要遠比磁盤空間更重要,因為磁盤空間可 以輕易的擴充。察看磁盤每秒的讀寫能力,特別對于磁盤密集型應用,如數據庫,可以告訴你是否需要更換更快速的硬盤,比如更改RAID策略,或采用基于 SAN的存儲來改善存儲性能。
- CPU-用戶、系統和空 閑
- Memory-Pages in/out和Swap in/out
- Network-輸入/輸出(bits /sec)
- Disk-每秒讀寫能力
如果系統利用率有0至50%的空閑,就可以考慮整合,空閑在50% 至70%之間,如果負載兼容的話,就應該實施整合了。兼容的負載表示負載可以互補,比如,高CPU利用率的負載可以和高磁盤讀寫的負載相配合,就像一臺 Web服務器和一臺數據庫服務器整合為一臺單獨的服務器。
3、 起草計劃
通過數據的分析可以明確哪些負載 的系統可以進行整合,系統可以運行多個Web服務的實例、多哥數據庫和網絡服務、以及多用戶存儲應用等等。負載整合中有兩個基本原則是需要遵循的:一組相 似的負載或者互補的負載。
整合相似負載是將盡可能多的空閑負 載集中到一臺系統上,當然,還需要一臺系統進行容錯。整合互補負載,如Web/database,也是為了充分利用系統資源。
4、實施計劃
將現有負載拷貝到新的整合系統,并保持雙方并行運行一段時間,這樣可以發現計劃中的 問題,并避免整合系統出現問題導致業務失效。
5、 評估結果
在整合系統上安裝性能收集軟件來 評估整合的效果,當然,可以想象的是,相比之前的利用率,現在的整合系統利用率會更高,可以接受的利用率數字可以超過80%,峰值接近100%。注意系統 的等待狀態和過長的交換等待,這可以指出一些性能問題。如果遇到了性能問題,需要擴展配置或重新配置負載整合。
負載整合可以提高數據中心效率、降低能源消耗和維護的復雜度,這項工作可能會推遲將 基礎設施轉移到虛擬化架構的時間。降低服務器數量,將負載整合,對于降低數據中心預算也很有意義。當然,要建立更高能效的數據中心還需要很多步驟,這五個 步驟也僅僅是個開始。