我們也來做個相同的游戲,想想如果沒有便宜的存儲介質(zhì)存在的話,今天的存儲將會如何?換句話說,如果硬盤驅(qū)動器在過去的20年間沒有經(jīng)歷容量的大規(guī)模提升和價格的大幅下跌,一切將會怎樣?
當硬盤容量成為限制或者需要大量成本的時候,我們也許會更加注意數(shù)據(jù)管理。數(shù)據(jù)管理工作將會和現(xiàn)在大不相同,數(shù)據(jù)保存和數(shù)據(jù)凈化的過程和能力將比現(xiàn)有的功能強大的多。對于企業(yè)來說,只有真實有用的數(shù)據(jù)需要保存,或許支持電子證供,滿足法規(guī)遵從也就不算是一個挑戰(zhàn)性的任務(wù)了。
現(xiàn)實的情況是,由于今天我們有大量廉價的硬盤空間,現(xiàn)在我們對于存儲這件事已經(jīng)樂此不疲了,拼命地把磁盤空間用各種各樣的數(shù)據(jù)填滿,在索引和分類等領(lǐng)域的應(yīng)用也越來越多。
而由于受到法規(guī)遵從和控制數(shù)據(jù)運行成本的雙重驅(qū)動,如今的企業(yè)都在努力更好地控制數(shù)據(jù),雖然最初的嘗試只是在電子郵件方面。
在企業(yè)試圖進行數(shù)據(jù)控制和管理的時候,企業(yè)會發(fā)現(xiàn)由于牽扯到大量的無組織數(shù)據(jù),實際操作過程中還存在大量風險,雖然我們也有可能大幅度降低存儲這些數(shù)據(jù)所需要的容量規(guī)模。每一家企業(yè)都有大量的無組織的文件系統(tǒng)數(shù)據(jù),其中有很多數(shù)據(jù)已經(jīng)是歷史久遠的了,也可以說幾乎沒有什么存在的價值了。
但是我們該如何分辨這些沒有價值的數(shù)據(jù)和一些關(guān)鍵的業(yè)務(wù)數(shù)據(jù)呢?為了對歸檔的電子郵件能夠成功訪問,廠商們提供了產(chǎn)品的增強版本可以重新部署文件數(shù)據(jù)到價格相對低廉的存儲媒介上,并可以在需要的情況下能夠隨時訪問得到數(shù)據(jù)。
不過,這種功能很大程度上是受元數(shù)據(jù)屬性驅(qū)動的——文件類型,所有者,最后訪問時間等等——而不取決于數(shù)據(jù)自身的價值,因此,只能解決一部分的問題。
基于實際內(nèi)容而做的分類是常常會出問題的,但是滿足數(shù)據(jù)真實性的需要非常重要。有些企業(yè)使用專門的文件管理程序,一本厚厚的使用手冊將十分有效,但是這種程序一般都價格不菲而且很復(fù)雜。過去的幾年間,也有一些面世的產(chǎn)品是基于內(nèi)容的對無組織數(shù)據(jù)的索引和分類。經(jīng)過了發(fā)展成熟的過程,人們現(xiàn)在開始高度關(guān)注這些技術(shù),特別是在那些對于法規(guī)遵從有嚴格要求的環(huán)境中。
無組織數(shù)據(jù)的全面管理實際上需要以下三個方面的有機結(jié)合:用戶的標簽和分類,索引和自動內(nèi)容分類,以及基于元數(shù)據(jù)的重定位。雖然這三個方面所占的比例由于企業(yè)需求的不同也會有所不同,我們要明確的是無組織數(shù)據(jù)的問題不能再被人們所忽略了。
拋棄大量的無價值的、無條例的無組織數(shù)據(jù),保留和控制最為關(guān)鍵的業(yè)務(wù)數(shù)據(jù),將成為我們的下一項挑戰(zhàn)。