在最近對云計算的所有關注中,存儲更多地被視為基礎平臺。時至今日,許多云計算提供的僅僅局限于CPU 內核的集合,定量的內存分配,低轉速存儲,或者還有一些面向互聯網的IP技術。近來,出現了有趣的與云計算和存儲相關的高級技術,特別是使用Web Services訪問方式,使得訪問存儲不再受限于設備文件或者NFS加載點。
典型的數據存儲和管理的"企業級特征"在IT架構創新上不斷推成出新。存儲架構師意識到這些特征對于關 鍵業務和生產應用非常重要,但目前的云計算還缺乏這些特征。本篇白皮書的目標是描述企業云計算中存儲必備的9個要素。

要素1:性能
性能需要付出成本。在一個架構良好的應用里,性能和成本處于平衡狀態。達到這點的關鍵是使用合適的技術 去匹配企業業務應用的性能,首先要求將企業的業務語言轉換成IT模式。因為這種轉換困難,通常企業止步于靜態的IT架構,無法應對業務變化著的性能需求。 企業云計算提供了一個更能應對變化著的性能需求的平臺。
在早期的云計算平臺里,存儲I/O一般都會有較高的延遲。這是因為廠商注意到使云計算的數據更容易訪 問,但沒注意到提高與性能、帶寬和IOPS相關的服務級別。有兩個原因導致延遲較高:訪問的模式和類型,以及存儲分布的配置。
訪問模式包括位于OSI模型物理層之上的多層協議的組合(如SOAP, NFS, TCP, IP和FCP)。數據訪問包括共享的物理服務層(如以太網)和幾個協議層(如SOAP或NFS),一般比專門的物理層(如FC)產生更多的延遲。市場上大 多數云計算平臺包括Internet的數據訪問,產生了更多的數據訪問延遲。
對于存儲介質,大多數云計算的市場在RAID或JBOD配置中使用SATA磁盤。因為SATA(有段時 間被視為近線磁盤)的性能一般比企業磁盤(一般指FC盤)稍差一些,導致存儲設備的性能低于應用的需求。
當你采用低性能存儲介質的相對低帶寬和高延遲的訪問模式時,使用整個存儲子系統的企業無法支持更多的關 鍵業務應用的需求。其結果是,這種方案通常僅適用于測試和開發。
相比來說,企業云計算平臺需要提供更多不同性能存儲層的選擇。當性能需求的變化時,例如,應用從測試遷 移到生產環境,存儲平臺應該能使用這種變化。理想的企業云計算的存儲應該有多種性能區,能夠被調整,以提供合適的I/O性能級別給業務性能的需求。
最后,為了滿足企業高端存儲的性能需求,云計算方案必須采用高于或者目前正在使用的企業級技術。一般使 用FC SAN。此外,如何使用技術與技術本身同等重要。在一個系統管理環境里,企業級需求下的虛擬機配置必須能夠持續提供高性能。
要素2:安全性
安全性和虛擬化通常被視為相互矛盾的。畢竟 虛擬化使得應用從物理硬件和網絡邊界中解放出來。安全性,換而言之,就是建立邊界。企業需要考慮虛擬化設計的初始架構。
在大多數云計算市場里,無論公有的還是私有的,數據安全性都是基于信任的,這信任通常都在管理程序里。 當多數虛機共享物理LUN,CPU和內存時,由管理程序確保數據是否毀壞或者被錯誤的虛機訪問。這與集群服務器多年來面臨的基本挑戰相同。任何也許需要接 管進程的物理服務器必須能訪問數據/應用/操作系統的權限。例如,為了主機外備份,LUN也許需要映射給公共的備份服務器。
在企業云計算中,有兩種方式去保護業務數據。第一種涉及系統程序管理安全。主要的目標是:系統盡可能少 地被使用,避免任何虛擬機被其他虛擬機造成負面的影響。企業也需要保護LUN被其他服務器訪問,如同主機外備份服務器。
其他需要注意的地方是數據通道。企業必須注意只能給需要維護必要功能的物理服務器提供訪問路徑。這可以 通過NPIV(SAN N端口 ID虛擬化)使用得Zoning、LUN Masking、訪問列表、權限配置來完成。
要素3:自動ILM存儲
信息生命周期管理(ILM)曾經成為非常有效的市場行為的重心,被那些出售分層存儲的廠商所推崇。雖然 ILM本質上非常簡單 - 存儲的成本與數據的業務價值相匹配,實際的挑戰來自于真正的執行效果,眾多所謂的ILM方案,粒度都不夠細,難以達到這樣的目標。
今天,傳統的ILM并沒有部署到市場上的大多數云計算平臺中。原因有兩個,第一,在許多云計算中,大部 分磁盤介質采用處于典型ILM方案中的最低層存儲,這樣就沒法把數據往更底層遷移,ILM也就無法部署。第二,許多企業不需要為云計算常用的計算類型而更 長時間地管理數據,因為傳統云計算通常用于功能測試/開發、概念驗證(POC)、Web服務器測試等。考慮到多種因素,實施ILM策略所需細粒度的復雜性 和成本與經濟節省的云計算不相符。
根據一些行業報告,70%的數據是靜態的。通過將合適的數據存儲在合適的介質上,企業能削減成本。他們 能意識到通過部署云平臺能節省成本,在云計算中實施ILM帶來的經濟效益意義重大。但前提是無需中斷應用,而且不能增加不必要的操作復雜性。
為了做到這些,企業必須使用基于策略的塊級ILM方法,無論訪問方式和應用類型。通過在數據塊一級跟蹤 數據的屬性,就無需在操作系統這一級執行數據歸檔或數據遷移。這種方法還能獨立于操作系統類型,且獨立于用于存儲數據的訪問方式。它不僅在保持性能(所有 的數據寫入都在高速層完成)的同時優化存儲的成本,而且通過將不使用的數據塊沉淀到低速層減少電能的消耗。這很合理,因為近線存儲僅消耗企業存儲的大約 20%的能耗。為此,要做到真正適合企業級應用的自動分級存儲,卷級或文件級數據遷移無法勝任,顆粒度必須細化到數據塊級。只有數據塊級的數據遷移才可能 獨立于操作系統類型,且獨立于存儲數據的訪問方式,做到對應用支持的隨需相應。
要素4:存儲訪問模式
訪問存儲空間有三種主流方式:基于數據塊(FC SAN或iSCSI)、基于文件(CIFS/NFS)、或通過Web服務。基于塊和文件的訪問方式在企業應用中最常見,能更好地控制性能、可用性和安全 性。在這點上,市場上大多數云計算平臺利用Web服務的接口,如SOAP和REST(代表性狀態傳輸)訪問數據。雖然,這是最靈活的方式,但有性能的影 響。理想的情況是,企業云提供全部的三種訪問存儲的方式來支持不同應用架構。
要素5:可用性
IT架構的維護窗口被大量的縮減,因為企業需要支持在不同時區的用戶并保證全天候的可用性。雖然服務級 別協議(SLA)一般與可用性密不可分,從業務角度看,它難以衡量,因為有著多種架構的復合SLA的重疊。
在前面提到,在市場上大多數云計算平臺中,I/O性能最先得到考慮。如果云平臺依賴于不被內部IT集團 管理的部分架構,那么冗余的架構部分和途徑是減少停機風險的最佳方式。雖然,云存儲服務提供商在考慮成本的同時繼續增加可用性,但是目前市場上的服務級別 協議不能滿足企業關鍵應用的需求。
在高端的企業級云計算中,存儲系統夠出來企業內的企業級存儲方案,包括多路徑、控制器、不同的光纖網、 RAID技術、端到端的架構控制/監控,和成熟的變更管理過程。在低端的企業級云計算中,存儲可用性與今天市場上云計算平臺的服務水平相當。為了提供企業 需要的服務水平,企業級云存儲供應商必須利用健全的架構設計和被充分驗證過的創新技術。
要素6:主數據保護
主數據指的是在線運行的數據。主數據能夠采用單一技術,或者結合多種技術進行保護。一些常用的方法包 括:RAID保護、多份拷貝、遠程復制、快照、和持續數據保護。
在市場上大多數云計算平臺里,主數據保護的問題常常留給用戶。今天,很少發現上述的方法在大眾云計算平 臺中使用,因為技術的復雜性和成本。有一些大眾云存儲方案通過維護數據的多份拷貝來保護主數據,整個系統運行沒有RAID保護的存儲里,以此降低成本。
企業級云的主數據保護應該基于內部企業級方案。當方案的業務影響分析(BIA)需要時,例如快照和容災 等可靠的技術應該就緒。
內部企業方案和企業云存儲的主要差別在于,主數據保護在方案中是如何綁定的。為了延續根據需要部署云環 境的經驗,各種選項必須打包,這樣服務能自動部署。其結果是,將一系列綁定的選項打包,能夠應對大量需求。也許不存在可以利用快照、遠程復制等與客戶需求 相匹配的技術。無論如何,多數用戶將意識到,常常需要犧牲靈活性去獲取在企業云中其它的管理好處。
要素7:次級數據保護
次級數據來源于主數據的歷史拷貝來形成備份。這種數據保護意味著減少數據損壞,恢復被刪除或被寫覆蓋的 數據,為了業務或法規的需要將數據長期保存。典型的方案常包括備份軟件和幾類存儲媒介。數據重復刪除也許能被用上,但這在關系到數據隔離的多用戶環境下, 可能產生些問題。
有些商業和公共領域上的方案,被加入到大眾云存儲中,以完成次級數據保護。但大眾云計算平臺的供應商很 少將這些與在線存儲一并打包。雖然原因各異,但在許多情況下,與恢復時間和保留期相關的服務水平(SLA)問題很難處理。
無論方案是私有的還是多客戶云平臺,管理手段、可見性和恢復的服務水平是次級數據保護的關鍵。一旦提交 恢復請求,恢復的啟動應該直接而且能夠自動完成。用戶應該能掌控可預見的恢復性能水平(恢復的數據GB/時長),而且應該能從一個簡短的選項列表中選擇保 留的時長。最后,用戶應該能檢查那些在線備份的狀態。因為頻度和保留期決定了存儲備份所需的資源 - 也就是成本 - 客戶應該能夠在線觀察資源使用狀況和收費情況,以免在結賬時感到意外。
要素8:存儲的靈活適應性
存儲的靈活適應性是指能夠根據業務的需要的變化做到存儲資源的隨需響應。歸根結底,它取決于操作系統對 存儲變化的檢查能力和所使用的訪問方式。
在這里討論的9個要素里,這一點是大眾型云計算平臺做得最好的要素。大多數方案都有按照預先設計的數 量,逐漸增加存儲的能力。刪除空間也是一個選項,通常用于卷或加載點。如上所述,操作系統對存儲變化的應對能力通常是個局限。
支持企業云需求的存儲需要能靈活擴展,需按照客戶能理解的方式計費。雖然增加和刪除存儲空間非常重要, 用戶傾向于僅為其用到的空間付費。他們也希望在基于Web的管理方式下,具有調整和生成使用狀況報表的功能。這種功能幫助他們控制成本,提供業務規劃的智 能。
要素9:存儲報表
當公司考慮將其全部或部分IT架構外包的時候,經常顧慮的是這些特定技術的不可見性。客戶需要包括從容 量和性能角度了解運行環境的狀態。為了達到這個目的,通過用戶管理界面,輸出豐富的存儲報表成為必須,使得客戶對于存儲高效的運行充滿信心。
在市場上云計算平臺里,與存儲相關的報表是最基本的工具。許多提供商提供標準的報表來使用,在一些場合 下,他們也提供基本的性能評估工具,或者來自提供商,或者來自共享廠商,或者是第三方工具。
企業云比傳統企業存儲有優勢,傳統企業存儲常常導致客戶使用單一存儲廠商的方案。這使得報表非常簡單, 因為數據不用像來自多廠商平臺那樣,需要進行翻譯,才能生成一份統一外觀的報表。有關歷史和實時使用情況的詳細信息,連同一些關鍵性能指標 - 歷史的或實時的 - 應該可通過用戶管理界面7x24小時實時查看。最終,為了減少企業對失去控制的擔憂,云計算的提供商應該具備更綜合性、更精確的報表能力,尤其是對于存儲 系統使用情況的可見性。
結論
一個強健的企業級云不應該只片面關注CPU、內存、磁盤、和IP地址分配,在規劃企業級云計算平臺策略 時,應該包括本文所提到的9大要素。這樣,企業才能擁更完備的云計算平臺來支持業務運行。