總部位于颶風多發區密西西比州的百年機構漢考克銀行常常自夸道,就算惡劣天氣影響了正常業務,它們也會是最后一個關閉并且是首家開放的機構。這一說法在2005年卡特里娜颶風席卷密西西比海岸時得到了最嚴峻的考驗。“我們損失慘重,”銀行IT服務董事Ron Milliet說。
分布于4個站點,覆蓋全國150多個網點的漢考克IT部門受到了巨大損傷,當然,可能還會更糟。事后,銀行發現一小部分虛擬化服務器(卡特里娜襲擊時該項目剛剛開始),可以在數小時內恢復,而物理服務器則需要數天,Milliet說。許多重要服務器在24小時內開始正常工作。
至此以后,虛擬化漸漸成為人們關注的焦點,但它對于重新思考災難恢復和業務連續性戰略計劃的企業CIO們而言只是一個創新的工具。包括WAN優化和基于電子郵件備份的應用技術都能夠降低恢復時間、減少成本、最重要的是提高大災后業務繼續發展的信心。雖然高質量的舊磁帶依然是備份材料的主要媒介,但是CIO們還是在尋找可以克服老媒介局限性的新型技術。
CIO們不僅僅要采取新的災難恢復技術,“他們還要自己摸索怎么樣的災難恢復方案能夠改善整個商業構架,”Forsythe解決方案集團業務連續性解決方案主任Michael croy說。這就可能意味著,例如,分配IT資產能源,將產能過剩工作與備份或鏡像站點合并,或將過剩的資源作為軍事災難恢復的一部分。
因為有豐富的新型災難恢復策略可用,用戶處在一個能夠最大限度降低開支、靈活選擇非現場恢復服務提供商等狀態的前所未有的自主地位,例如:SunGard數據系統公司、IBM公司等,Croy說。
虛擬化解決方案
如果從賭徒的目光去看一家賭場,看到的僅僅是老虎機、賭輪、酒吧和餐廳。但是對于IT工作人員來說,同樣的賭場則變成一條數據和應用程序的河流,因為它必須保持每天24小時數據輪轉,沒有任何推托借口。
位于大西洋城的Borgata酒店賭場和水療中心一直使用一種傳統的磁帶備份系統,它“緩慢而不一致”,娛樂中心副總裁John Forelli說,“我們位于一個勞動力密集型的手動世界中”。
此外,這款磁帶系統需要備份大量的網絡資源,由于這家2000間客房的酒店需要24小時營業,很難找到合適的時間,在不影響酒店整體工作表現的前提下來進行服務器數據備份,Forelli說。
2006年,在娛樂中心開張3年后,管理層決定利用VMware虛擬化其Windows服務器,并且利用Double-Take軟件公司的備份軟件提高系統備份和恢復任務效率。
Double-Take備份軟件通過77個虛擬生產機器恢復某個單一物理受災目標或者在斷電等情況下自動保存數據(自動切換至備份系統)。一旦儲備制度被激活,相應的應用服務就開始工作在某個相關的虛擬機災難恢復站點,當然,用戶也可以自動定義其工作流程,Forelli說。
此外,由于該款軟件著眼于數據的字節水平以及逐步的復寫,對網絡頻寬要求較小。“這是一款自動、快速、可控軟件,”他說。
簡單是虛擬化在災難恢復應用中如此受歡迎的原因之一。“ Windows系統則很難恢復,” Gartner的分析師公司Donna Scott說。
對于漢考克銀行來說,卡特里娜的教訓就是虛擬化等同于快速恢復、減少企業硬件和電力的開支??梢酝茰y該公司的許多構架都將面向虛擬環境(除一個基于大型機的銀行體系)。銀行采用5臺運行VMware構架的刀片服務器取代了原有的55物理服務器,此舉單從成本上來說就節省15萬美元的服務器硬體開支,Milliet說。一個潛在的缺點,“我們把許多雞蛋放在了同一個籃子里,一個壞主板可以在同一時間拖垮大量的虛擬機,”他說。為了避免這種災難,漢考克采用的是一旦發現危險,能夠將VM工作自動切換到另一個物理服務器的軟件。
智能WAN技巧
目前,眾多公司都在尋求能夠在網絡中提供大量數據的解決方案, WAN優化就是他們最明智的備選技術。它可以用來提高系統日常性能以及備份和恢復操作速度。
Cubist制藥公司過去采用的傳統災難恢復方式,需要將數據備份到磁帶上,為此他們需要一天或者更多的工作時間才能恢復網站----等待可用機器、重復累贅的恢復。 “沉悶、呆板、不靈活,”位于馬薩諸塞州的列克星敦公司高級電腦操作經理Michael Geldart評價道。
Geldart不僅僅關心他的災難恢復策略,他還要留心公司總部與意大利分部之間的大量數據傳輸。
此外,公司管理層還需要利用相同的WAN線路召開電視會議以及IP語音通話。這些都需要較大帶寬,Geldart說“然而,這是一個非常昂貴的工程”。
現在,Cubist公司已經采用了虛擬化,“我們最希望獲得的就是 [虛擬]機器和其他復制網站之間的快速映射過程,”他說。
此外,公司還決定與Riverbed科技公司一起推進steelhead WAN的優化、加速實施應用。而與意大利連接的主要應用中,它需要加速的是Exchange 2003、微軟網絡/CIFS、災難恢復連結、FTP和NFS,Geldart說。如果還有位于外地的第三方供應商提供設備備份,那么災難恢復時間將會大大減少。這是因為現在的數據復制和燒錄都采用現場磁盤陣列,去除了從磁帶再存儲需求,這是之前災難恢復最費時的一個部分,Geldart說。
縱然如此,磁帶還是非常有用的。他補充道,它提供的檢索歷史數據能力,也應當作為復寫失敗的備份。
有趣的是,由第三方運營商提供的簡易非現場災難恢復計劃在廠商部署各自設備時還引起了一些爭執。“廠商的初步反應是大腦一片空白,”Geldart說。但是接下來,“他們徹底打破了原有模式”。 (出于安全考慮,Cubist公司沒有透露恢復站點供應商名稱)。
Forsythe公司的Cory對以上所述表示贊同。這個領域的供應商,例如SunGard公司,正在變得更加靈活、更具競爭力,他說。不過,這些公司仍然需要降低成本,變得更加靈活,并且擴大產品線“更好的滿足業務需求”。
電子郵件應用提供
多年來,災難發生后的電子郵件備份一直是一個費時費力的項目,Gartner分析公司Scott說。但是現在一項應用正在使它變得與其他主要郵件服務器更容易復制交流。
位于巴爾的摩的Miles & Stockbridge PC律師事務CIO Ken Adams說,他的公司曾試圖將Exchange服務器聚合在一起,但是后來發現這項策略對于工程師來說太過復雜,它涉及繁雜的人事管理以及硬件、授權的大幅支出。“我們只是一家律師事務所,而不是一個技術公司,”他說。
盡管如此,該公司還是將600個左右的電子郵件賬戶制定成關鍵任務,所以完善的解決辦法不得不有。Adams最終跳槽到設計連續性備份Exchange服務器的Teneros公司。該公司的設備都是基于IP,并且在生產或者災難恢復站點均易于安裝,Adams說。
公司的調整之一是:Blackberry和Good Link服務器市場逐漸下滑。由于Teneros還需監測和保持其用具,Adam的IT小組還是面臨挑戰。
預算安排規則
盡管災害規劃需要你的高度重視,這并不意味著要你破產??ㄌ乩锬蕊Z風過后,漢考克“為DR打開了支票簿,” Milliet說。“但是現在,我們要合理化開支,使其具有更高的商業價值”。
方法之一,在日常行動中整合災難恢復需要,Cubist公司就是通過優化其WAN網絡。
對于大規模調整,漢考克的管理層意識到,在颶風多發地帶,僅有一個單一、集中的呼叫中心是非常不明智的,因此它架設了第二個呼叫中心。因此它在災難恢復中獲得良好口碑,能夠提供完善的客戶服務:新設施還減少了正常運作期間顧客的來電等待時間。