前言 :
目前主流的服務器外形從架構上來說無非就是塔式和機架兩種。塔式服務器專為需要卓越性能的企業精心設計,塔式服務器充足的空間可以安裝更多的CPU、內存,可以安裝各種全高的擴張卡、存儲陣列所用的大量硬盤,以及配備更多的冗余單元。而機架式服務器則占據更小的空間,使用標準的機架外形,單位體積內可以提高更多的計算能力,從而降低了成本。因為主機托管費用根據體積來計算的,托管塔式服務器非常昂貴,所以選擇一款機架式服務器是非常必要的。對于企業內服務器,使用塔式則可以取得更好的性能。
498)this.style.width=498;" border=0>
機架式服務器也有多種規格,例如1U(高4.45cm)、2U、4U、6U、8U等。通常1U的機架式服務器最節省空間,但性能和可擴展性較差,適合一些業務相對固定的使用領域。服務器通常用于托管,因此選擇信息服務企業(如ISP/ICP/ISV/IDC)就顯得尤為重要,特別是機房是否具備嚴密的保安措施、良好的冷卻系統、多重備份的供電系統等成為了考量一個機房優越的重要標準;但是帶寬則算是所有資源里最重要的一項。
498)this.style.width=498;">
價格僅供參考
由于中國電信擁有了絕大部分的帶寬,將服務器托管在電信的機房當然是首選。但電信機房的承重壓力也使得其“門檻”愈來愈高,不是簡單托管費可以解決。
據了解,由于廣州本地電信的機房托管的機器數目不斷增加,供電負載已經不能滿足服務器數目的需求,服務器用電和機房散熱用電產生沖突。在還沒擴建好更強供電系統前,電信機房方面從功耗方面下手,對托管的機器開機運行的時候都進行功耗的測試,對于電流需求大于0.8A即功率大于180W左右的服務器拒絕供托管服務。
498)this.style.width=498;" border=0>
以單核心的處理器為例,AMD的Opteron以及Intel的Xeon目前單個處理器的滿載功耗已經接近100w,而AMD由于內核的設計優勢,其滿載功耗相對會低一點。若一個2U的服務器,兩個處理器加上硬盤以及其他散熱系統,180W這個門檻實在太高,很多的機器功耗都大大高于該要求。我們今天就利用相關的測試儀器對Intel跟AMD的2U服務器平臺進行一次詳細的功耗測試對比。在本次的測試中,我們會利用專用的儀器配合有負載功率顯示的電源進行測試,確保測試數據的準確性。我們選用了兩款價格定位完全一樣,并且其實際的效能也相對接近的機型進行測試。
致榮 ZR Power D7C :
498)this.style.width=498;" border=0>
在這次測試中,我們采用了國內著名的服務器供應商致榮所提供的設備來完成我們這次的測試。Intel的平臺方面,我們采用的是致榮 Power D7C的2U服務器,服務器的面板提供了6個可熱插拔SCSI硬盤托架,有面板的右側則為CDROM以及軟驅設備。
致榮 Power D7C | |
CPU |
Intel Xeon Nocona 2.8G 2m Cache x2 |
主板 |
Intel E7520BD2S |
內存 |
Infineon PC3200 ECC Registered 1G x2 |
硬盤 |
Maxtor ATLAS 10K V 73G x1 |
軟驅 |
Floppy 1.44m x1 |
光驅 |
24x CDROM x1 |
顯卡 |
Integrated ATI RAGE XL SVGA PCI video controller |
網卡 |
Integrated Intel 82541PI Gigabit Ethernet Controller Integrated Marvell Yukon EC88E8050 PCI-Express Gigabit Ethernet Controller |
其他 |
Integrated Silicon Image SI3114 SATA RAID Controller |
電源 |
510watt(MAX) Power Switch x1 |
首先來看看這款機器的具體配置,這款機型采用了Intel支持64位功能的Nocona核心Xeon處理器,新核心的Nocona Xeon處理器采用90納米制程技術制作,前端總線提高至800MHz,二級緩存升級為2m,它整合Demand Based Switching (DBS)技術,使得處理器能做到在空閑時自動降低處理器的倍頻、前端總線頻率和電壓,來達到節能和降低發熱量的目的,但需要主板的配合才能支持該功能。 Nocona具備Intel Extended Memory 64技術(,提供64位的內存尋址能力,讓用戶體驗64位的運算能力,同時又能高效率地執行現今市面上所有的32位應用程序,帶來更高的應用程序彈性。此外,英特爾超線程技術的改良能提升多重線程程序的性能,而Streaming SIMD Extensions 3指令集則針對媒體與游戲等應用改進線程的同步運作效率,提高系統的響應速度。
498)this.style.width=498;" border=0>
此外,和老至強一樣,Nocona也支持Hyper-Threading技術。超線程技術通過在處理器上復制體系結構狀態,同時共享一組處理器的執行資源,可實現線程級并行處理。因為通常的CPU的執行單元并不是任何時候都100%滿負荷運轉的,總有一些資源處于空閑狀態,Hyper- Threading的本質就是提高CPU執行單元的利用效率,并將其轉換為實際運算能力的提高。超線程技術增強設計用于改進多線程應用的性能,同時擴展的 SIMD流指令擴展3能夠顯著改進線程同步性能,從而可為諸如媒體和游戲等應用帶來出色的系統響應能力。Nocona同時支持2個CPU SMP對稱多處理,在系統內最多可以模擬出4個處理器。若還需要更多的處理能力,則需要使用更加昂貴的Nocona MP,可以實現4路或者更多路的SMP。
498)this.style.width=498;" border=0>
我們從硬件上的額定功率粗略地統計一下整機的功耗水平。由于兩顆處理器的發熱并不少,加上機房的散熱條件比較惡劣,因此機箱內部的散熱系統并不可馬虎了事,這款機型配備了4把電流為0.66A的機箱風扇,也就是這把風扇加起來的峰值功率已經達到31W左右,而處理器的兩個散熱風扇電流為0.78A,因此這兩個風扇的峰值功率18W左右,由于CPU的散熱器支持溫控功能,因此其實際的功耗會相對低一點。單個Xeon處理器滿載時候的峰值功率約為85W左右,而兩個加起來則約為170W。而單個的萬轉SCSI硬盤加上熱插拔模塊的功率約為20W左右。Intel的服務器主板功耗約為30W左右。兩條容量為 1G的DDR400內存功耗約為20W。軟驅加上CDROM驅動器的功耗約為15W左右。統計起來,整機的峰值理論功耗達到了304W,遠遠超出了電信機房所限制的180W水平。
致榮 ZR Power K8222D :
498)this.style.width=498;" border=0>
再來看看AMD的平臺,我們采用的是致榮的型號為Power K8222D的2U服務器,服務器的面板結構和Intel的D7C較為類似,同樣提供了6個可熱插拔SCSI硬盤托架,有面板的右側則為CDROM以及軟驅設備。
致榮 Power II K8 | |
CPU |
AMD Opteron 242 SledgeHammer 1m Cache x2 |
主板 |
TYAN Thunder K8S Pro (S2880) |
內存 |
Infineon PC3200 ECC Registered 1G x2 |
硬盤 |
Maxtor ATLAS 10K V 73G x1 |
軟驅 |
Floppy 1.44m x1 |
光驅 |
24x CDROM x1 |
顯卡 |
Integrated ATI RAGE XL SVGA PCI video controller |
網卡 |
Integrated Broadcom BCM5704C dual-channel GbE LAN |
其他 |
Integrated Promise PDC20378 SATA/SATA RAID |
電源 |
510watt(MAX) Power Switch x1 |
這臺致榮的Power K8222D 2U服務器采用的為AMD Opteron 242處理器,該處理器的核心代號為SledgeHammer,該核心相比起目前Athlon64的制作工藝相對落后一點,仍然采用0.13微米的工藝制作,二級緩存的容量為1m。其發熱量相比起先前幾款Opteron略小,這就允許CPU能夠搭配較為便宜的鋁制散熱器,而先前的幾款Opteron處理器必須使用厚厚的銅底座散熱器才能穩定工作,與此對照的是Intel Xeon處理器必須使用的純銅制散熱片加上大功率的風扇才能控制其較大的發熱,這也從另外一方面反映出Intel相比起AMD的功耗要大一點。
498)this.style.width=498;" border=0>
AMD強調TPI(True Performance Initiative)有助于用戶注重系統的整體性能,而不再僅僅把CPU的時鐘速度作為衡量計算機性能的唯一標準,因此AMD的處理器實際頻率相比起 Intel的要低得多,而實際得效能表現卻并不落后。每塊Opteron處理器都具有屬于自己的內存控制器,都可以管理自己的內存bank,這意味著多塊 CPU不用再為爭奪前斷總線或內存容量而苦苦爭斗,也就是說, Opteron 系統的可伸縮性非常大。在多Opteron 處理器系統中,由于每塊CPU擁有自己的內存帶寬,從理論上說,兩塊CPU將擁有兩倍的內存帶寬(10.6 GB/s),四塊CPU將擁有四倍的內存帶寬(21.3 GB/s),依次類推。
498)this.style.width=498;" border=0>
我們再來從硬件上的額定功率粗略地統計一下整機的功耗水平。該箱體得內部結構與我們剛才接受的Intel平臺較為類似,機箱內部的散熱系統同樣配備了4 把電流為0.66A的機箱風扇,也就是這把風扇加起來的峰值功率已經達到31W左右,而處理器的兩個散熱風扇電流為0.68A,因此這兩個風扇的峰值功率 16W左右,由Opteron的處理器發熱較少,因此其對散熱風扇的要求也低一點。單個Opteron處理器滿載時候的峰值功率約為80W左右,而兩個加起來則約為160W。而單個的萬轉SCSI硬盤加上熱插拔模塊的功率約為20W左右。TYAN的服務器主板功耗約為30W左右。兩條容量為1G的 DDR400內存功耗約為20W。軟驅加上CDROM驅動器的功耗約為15W左右。統計起來,整機的峰值理論功耗達到了292W,同樣也是遠遠超出了電信機房所限制的180W水平。關于這兩款機器的實際功耗表現,我們接下來會做更為詳細的測試。
測試說明 :
498)this.style.width=498;" border=0>
我們采用了AcBel 550W的電源代替機器原配的電源進行測試,主要是由于AcBel的這款電源提供了可視化的LCD面板,該面板采用數字化設計,玩家可通過液晶顯示屏讀取電源供應器里的各項數據,當然包括了我們最主要的功耗數值讀取了。而由于電源內部的散熱風扇以及面板也需要電力的支持,我們把電源內部風扇的轉速調至最低的水平,這部分的功耗約為5W左右,因此測試的數據約有5W左右的誤差。
498)this.style.width=498;">
Intel雙Xeon運行4個SuperPI時滿載的截圖
498)this.style.width=498;" border=0>
498)this.style.width=498;">
AMD雙Opteron運行4個SuperPI時滿載的截圖
除此之外,我們也采用了另外一種方式對服務器的功耗進行檢測。我們利用上圖的交直流鉗型測試表直接對連接電源插座與主機電源的導線電流進行測試,該測試儀器實際上就是一個電流表,對單根導線內通過的電流進行量度,如上圖所示,量度出來的數據為0.85A安培,也就是說此時電源消耗的功率為 220V*0.85A=187W。
測試數據列表 :
測試平臺 比較 |
Power D7C Intel Xeon |
Power K8222D AMD Opteron | ||||||
測試狀態 |
風扇全開 |
關閉機箱風扇 |
風扇全開 |
關閉機箱風扇 | ||||
測試方式 |
電流表 |
電源 |
電流表 |
電源 |
電流表 |
電源 |
電流表 |
電源 |
開機狀態 |
1.02A |
218W |
0.83A |
194W |
0.94A |
208W |
0.89A |
197W |
系統空閑 狀態 |
0.77A |
182W |
0.68A |
158W |
0.91A |
192W |
0.78A |
168W |
文件復制 狀態 |
0.81A |
194W |
0.76A |
170W |
0.94A |
204W |
0.84A |
180W |
CPU滿載 狀態 |
1.20A |
254W |
1.05A |
230W |
1.06A |
216W |
0.94A |
192W |
整機滿載 狀態 |
1.25A |
266W |
1.13A |
242W |
1.09A |
218W |
0.96A |
197W |
而由于兩款機型的散熱系統所耗費的功率甚大,4把機箱風扇理論的峰值達到了31W,因此我們在功率測試中會劃分為兩部份比較,分別是風扇全開以及關閉機箱風扇兩組數據。而在測試中,我們會對機器的5種情況進行功耗的測試,分別為開機狀態、進入系統后空閑的狀態、在系統中僅進行文件的復制狀態、在系統中模擬CPU滿載的狀態以及模擬整機滿載的狀態。在開機的一瞬間,對電源要求的功耗是最大的,因此這也是我們的測試對比重點;而在系統空閑的狀態下,我們可以比較一下擁有DBS動態節電技術的Xeon處理器相比起這款由于主板不能提供支持而不能實現Power Now技術的Opteron有何優越性;在系統進行單一的文件復制,也就是模擬服務器最頻繁的動作,對數據的讀取與寫入時功耗的比較;而模擬CPU滿載,我們利用到4個SuperPI進行運算;而整機滿載的模擬,我們通過4個SuperPI加上文件的復制與寫入進行測試。
從測試數據我們可以了解到,在開機狀態、進入系統后空閑的狀態以及在系統中僅進行文件的復制狀態中,Intel的Xeon平臺功耗都有著一定的優勢,功耗相比起AMD的Opteron要少5~10W左右。實際上主要是由于在這三個狀態之下對CPU的占用率都幾乎等于零,而Intel Nocona核心的Xeon所擁有的Demand Based Switching (DBS)技術的功效也因此而體現出來,DBS技術可以根據CPU的實際使用情況有效地減少CPU的功耗以及發熱。而這款Opteron 242處理器由于主板無法提供Power Now技術的支持,因此我們也無法開啟AMD的Power Now節電技術,因此在這部分AMD的Opteron 242功耗明顯較大。
498)this.style.width=498;" border=0>
能源利用率,誰壓著誰?
而在系統中模擬CPU滿載的狀態以及模擬整機滿載的狀態下,也體現出了Nocona核心的Xeon處理器缺點,當處理器全速運行之后,其功耗以及因而帶來的發熱問題十分嚴重,由于Nocona核心與桌面平臺Prescott核心的Pentium4處理器架構十分類似,只是Prescott的核心被屏蔽掉某些功能而已。在我們熟悉的桌面平臺上,Prescott核心的Pentium4處理器由于發熱以及功耗的問題也因此而走到了盡頭,而回到服務器領域上同樣采用NetBurst架構的Nocona核心Xeon也存在同樣的問題。較高的工作頻率并沒有為Intel帶來更多的性能優勢,其性能與我們這次對比的 Opteron 242好不到哪里,而從測試的數據我們可以了解到,AMD Opteron平臺的功耗要比效能相仿的Intel Xeon平臺低40~50W左右,發熱也相對地減少很多。
在目前的服務器市場上,AMD的Opteron處理器與Intel的Xeon 之間的競爭已經轉移到雙核心的架構之上。雙核心的處理器可以用于1到8路服務器和1到4路工作站解決方案。適于采用這款處理器的行業有跨國企業,中小企業,以及政府/教育機構;希望提高數據庫處理事務的速度,或者通過電子商務式應用支持更多用戶的企業;需要迅速的圖形響應(例如CAD和DCC)的客戶;需要為金融建模和科學應用執行大運算量任務的行業等。作為一個服務器方案,雙核心的處理器通過內部的調整其性能也得到了接近兩倍的提升。換個角度說,就是一臺服務器使用兩個雙核的處理器則可以對抗4路的服務器,當然實際上也會有一點的性能損失,但其性能已經是十分接近。AMD在Intel的雙核心Xeon 到來半年前向服務器市場推出了雙核心Opteron處理器,同時AMD憑借其處理器的性價比,無遺會為其帶來更多的客戶。無論怎樣,可以看到AMD跟 Intel未來的雙核處理器發展計劃中對功耗的控制都十分注重,在性能提升的情況下,處理器的功耗卻有所降低,尤其是Intel方面,采用了全新的架構設計的處理器,其性能也是值得我們期待的。