2007年已經(jīng)過了一半,存儲器管理人員決心致力于研究重復(fù)數(shù)據(jù)刪除技術(shù)的益處。
聯(lián)邦儲備銀行的存儲工程師Michael Thomas在近期一個存儲問題會議上說,“現(xiàn)在我不會購買一款
很容易就可以看出其中的原因。最新的虛擬磁帶庫包括重復(fù)數(shù)據(jù)刪除功能,通過復(fù)制冗余備份數(shù)據(jù)給用戶減少了約49/50的存儲痕跡。這樣,每十億字節(jié)存儲量的成本節(jié)約是巨大的。 IDC的分析師Robert Amatruda說,“隨著重復(fù)數(shù)據(jù)刪除技術(shù)的出現(xiàn),當(dāng)今的虛擬磁帶庫經(jīng)濟可與磁帶相比。”GlassHouse技術(shù)有限公司的數(shù)據(jù)保護服務(wù)的副總裁Curtis Preston估計,一個中等規(guī)模的磁帶庫成本大約在每十億字節(jié)4到11美元之間,不包括壓縮和重復(fù)數(shù)據(jù)刪除的磁盤價格在大約每十億字節(jié)3美元到11美元之間。 虛擬磁帶庫供應(yīng)商估計大約一年內(nèi):每周進行完全備份,每十天的進行日常增量備份,這樣,一個1000兆的數(shù)據(jù)需要53兆字節(jié)的容量來進行數(shù)據(jù)保護。隨著存儲能力以這樣的速度增長,此類費用的增加令人震驚。 重復(fù)數(shù)據(jù)刪除產(chǎn)品的發(fā)展幫用戶限制了這一增長。這一產(chǎn)品的主要供應(yīng)商有:Data Domain有限公司, Diligent技術(shù)公司, ExaGrid, FalconStor軟件公司, Network Appliance公司, NEC公司,昆騰公司, Sepaton and Symantec公司。EMC公司收購了Avamar技術(shù)公司,并計劃通過于今年末發(fā)布備份軟件包來合并其dedupe技術(shù)。日立數(shù)據(jù)系統(tǒng)公司聯(lián)合了Diligent技術(shù)公司;IBM公司則聯(lián)合了NetApp公司。 Taneja集團的創(chuàng)建者和顧問Arun Taneja說,“重復(fù)數(shù)據(jù)刪除技術(shù)的好處很多。”然而,他說不同的重復(fù)數(shù)據(jù)刪除方法和因而減少的數(shù)據(jù)比例是不清楚的。用戶應(yīng)該采用他們自身的數(shù)據(jù)集合徹底檢測產(chǎn)品。 Motorola公司的IT基礎(chǔ)結(jié)構(gòu)工程師Guna Shankar Selvaraj說,他的公司正在對Data Domain產(chǎn)品進行評估,但是這些產(chǎn)品仍處于非常早期的階段。 相似地,聯(lián)邦儲備銀行的Thomas說他在購買產(chǎn)品之前會將檢測所有數(shù)據(jù)重復(fù)刪除產(chǎn)品六到八個月。“我想知道多少產(chǎn)品的副本將被保留,以及在被刪除之后情況如何等等,整體狀況如何非常重要。” 另一個關(guān)注數(shù)據(jù)在進行完重復(fù)刪除后的恢復(fù)的用戶是Richard Dearmon——UIC醫(yī)療中心的企業(yè)存儲工程師。他說,“我想購買這一產(chǎn)品,但是我并不清楚二級和三級副本將會被如何處理。”用戶期望評估這一技術(shù),但是仍有很多問題存在。 CitiStreet公司在Sepaton的虛擬磁帶庫中保存了50 TB的備份數(shù)據(jù),采用了重復(fù)數(shù)據(jù)刪除產(chǎn)品后,備份數(shù)據(jù)集合由縮減比例為56比1。公司現(xiàn)在已經(jīng)進行了幾個月的產(chǎn)品檢測,并計劃在七月底投入生產(chǎn)。存在一些最初的性能挑戰(zhàn),這些挑戰(zhàn)CitiStreet在Sepaton的幫助下可以消除。“他們的重復(fù)數(shù)據(jù)刪除產(chǎn)品對用戶來說像個黑箱。”據(jù)CitiStreet公司全球基礎(chǔ)下部構(gòu)造建設(shè)的副總裁Jeff Machols說,現(xiàn)在其作用像廣告。隨著數(shù)據(jù)的較少,CitiStreet公司可以得到長期的在線保持,而不需要擔(dān)心磁帶存儲。“我們可以保持至少一年在線數(shù)據(jù)的價值以進行備份和恢復(fù),我們不擔(dān)心這些數(shù)據(jù)被轉(zhuǎn)移到其他存儲設(shè)備。” 有很多現(xiàn)實問題會減緩重復(fù)數(shù)據(jù)刪除產(chǎn)品被采用。用戶所關(guān)注的是重復(fù)數(shù)據(jù)刪除、加密技術(shù)以及壓縮技術(shù)如何以協(xié)調(diào)的方式協(xié)同工作。 Motorola公司的Selvaraj說,“有時這些功能會出現(xiàn)會出現(xiàn)不協(xié)調(diào),因此了解數(shù)據(jù)的整體狀況就很重要,因為不是所有的重復(fù)數(shù)據(jù)都能被很好的刪除。” 另一個關(guān)注是動力消耗問題,因為越來越多的存儲器聯(lián)網(wǎng)。我們與用戶討論因為動力消耗的問題:哪家企業(yè)最近不得不關(guān)閉一些Data Domain機箱。因為這個話題比較敏感,這一企業(yè)希望匿名。 “產(chǎn)品運行狀況很好,但接著設(shè)備管理人員走了進來說道‘要么你決定關(guān)閉那臺機器,要么我將拔掉插頭,因為公司的能源緊張。”Data Domain設(shè)備是數(shù)據(jù)中心最后進入最先出去的。“為了節(jié)能,我們采用磁帶。” 很不明白為什么存儲設(shè)備管理人員受當(dāng)前的能源影響這么大,但是問題在所有IT部門都顯示了出來。根據(jù)最近Gartner公司的報告,“到2008年,當(dāng)前50%的數(shù)據(jù)中心將沒有足夠的能源和冷卻能力以達(dá)到高密度設(shè)備的需求。”2009年,Gartner公司說能源支出將成為世界70%的數(shù)據(jù)中心設(shè)備的第二大運營費用。 |
||