隨著近年來國內(nèi)各行業(yè)信息化技術(shù)的發(fā)展,以及信息化體系在國民經(jīng)濟的日臻重要的地位和影響力,信息系統(tǒng)自身的安全運行日益成為各企業(yè)決策層的目光聚焦點。尤其是國內(nèi)和國際的一系列安全事件和自然災(zāi)害頻發(fā)的現(xiàn)實,使得人們再也不能對于企業(yè)自身的命脈---數(shù)據(jù)和連續(xù)運行能力無動于衷。信息系統(tǒng)的安全受到的威脅自然會導(dǎo)致“維穩(wěn)”的努力受到威脅,而此后必然會傳導(dǎo)到外部和社會,信息化系統(tǒng)災(zāi)難導(dǎo)致的嚴(yán)重后果不可小視。建設(shè)一個能夠有效防范各種災(zāi)難威脅的信息化系統(tǒng)對于社會的和諧和穩(wěn)定以及避免群體事件的發(fā)生都將是一個功在千秋的舉措。
但是,往往事與愿違,當(dāng)很多人們著手開始甚至于花費了巨額成本完成了各種目標(biāo)的災(zāi)難防御體系的建設(shè)之后,卻出現(xiàn)了“有災(zāi)無備”,對災(zāi)難不免疫的不良后果,其投資損耗和社會影響都難以估算。近期,國內(nèi)出現(xiàn)了典型的類似事例,例如一些企業(yè)在建設(shè)災(zāi)備系統(tǒng)之后,甚至于通過了國家有關(guān)部門的《內(nèi)控規(guī)范》和《應(yīng)急預(yù)案》演練之后,仍然發(fā)生了難以預(yù)料的災(zāi)難后果,往往一個小小的故障就可以導(dǎo)致長時間的業(yè)務(wù)停頓,令人對于應(yīng)急響應(yīng)體系的建設(shè)標(biāo)準(zhǔn)產(chǎn)生了疑問,更不要談啟動災(zāi)備中心運行業(yè)務(wù),那似乎成了很多人的擺設(shè),問題出在了哪?
這里面,我們需要對于災(zāi)備建設(shè)的決策者們說,這就是災(zāi)備建設(shè)的有效性問題.養(yǎng)兵千日用兵一時,缺乏有效性的災(zāi)備系統(tǒng)其后果難以預(yù)料,不僅達不到保障運行和災(zāi)難防范的目標(biāo),其自身對于業(yè)務(wù)系統(tǒng)的影響也開始產(chǎn)生副作用。近年來,許多行業(yè)的災(zāi)備體系的規(guī)劃者們都在向筆者詢問,如何建立災(zāi)備體系?到底是災(zāi)備技術(shù)路線重要還是災(zāi)備流程的嚴(yán)密組織重要?如何選擇適合的災(zāi)備技術(shù)路線?災(zāi)備建設(shè)就是簡單的建設(shè)一個異地災(zāi)備中心嗎?
首先,災(zāi)備系統(tǒng)的有效性問題涉及到災(zāi)備建設(shè)的實際目標(biāo)和符合目標(biāo)的災(zāi)備技術(shù)路線,其次,認(rèn)識災(zāi)備系統(tǒng)的有效性問題人們必須領(lǐng)悟到一個更深層次的道理:災(zāi)備系統(tǒng)的建設(shè)要求災(zāi)難防御全方位,不能只防小概率的自然災(zāi)害,更要防止概率大的設(shè)備故障和邏輯故障,嚴(yán)密的多方位防護網(wǎng)才是取勝之道。具體來說,建設(shè)一個永不失靈的災(zāi)難防御體系,需要踏踏實實地進行以下環(huán)節(jié)的研究:
1) 防御災(zāi)難的目標(biāo)要細化
不能僅籠統(tǒng)的說大災(zāi)防御,而對于各種設(shè)備和網(wǎng)絡(luò)的易發(fā)事故卻缺少針對性,甚至于認(rèn)為備份系統(tǒng)就已經(jīng)完成了這類防御目標(biāo),這只能說繼續(xù)走著傳統(tǒng)失靈的眾多災(zāi)備建設(shè)的老路。在一些傳統(tǒng)的早期災(zāi)備系統(tǒng)建設(shè)中,的的確確只有大災(zāi)的應(yīng)急機制,而根本沒有把頻發(fā)的故障列入防御目標(biāo),這本身已經(jīng)造成了我國許多災(zāi)備建設(shè)的資金浪費,導(dǎo)致必須推到重建災(zāi)備系統(tǒng),或者重復(fù)投資建立更高級的防護體系。在信息系統(tǒng)的安全事故中,比較容易導(dǎo)致災(zāi)備體系不作為的事故往往是: 數(shù)據(jù)庫系統(tǒng)癱瘓無法運行、數(shù)據(jù)文件損壞或者丟失、存儲設(shè)備故障等等,在我國,已經(jīng)有多個企業(yè)領(lǐng)教了這類故障的破壞力。
2) 建設(shè)分層次的恢復(fù)體系
以往,人們往往認(rèn)為,建設(shè)異地災(zāi)備中心,就是什么故障都在異地運行或者恢復(fù)。這著實是一個特大的誤區(qū)。人們必須知道,異地災(zāi)備中心,其建設(shè)宗旨只能是大災(zāi)的防御,啟用異地災(zāi)備中心,不僅要經(jīng)過嚴(yán)格的業(yè)務(wù)連續(xù)性流程的審核(例如預(yù)警機制和宣告機制),而且要動用大量的災(zāi)備中心處理人員,數(shù)據(jù)向生產(chǎn)中心的恢復(fù)也是復(fù)雜而漫長的過程。而部分災(zāi)備技術(shù)路線還不能保證啟動的應(yīng)用系統(tǒng)的數(shù)據(jù)一致性和完整性,這也是很多完成建設(shè)的企業(yè)一般不啟動災(zāi)備中心或者恐懼災(zāi)備中心啟動的重要原因。而各類易發(fā)的故障(例如邏輯故障、設(shè)備故障),如果其恢復(fù)依賴在災(zāi)備中心的啟動和修復(fù)上,無疑是風(fēng)險放大、家丑外揚之舉,恢復(fù)的效果也根本無法預(yù)料。這就是故障發(fā)生后,災(zāi)備系統(tǒng)不作為的眾多因素之一。
怎么辦? 根本解決就在于啟動先進的災(zāi)備技術(shù)路線,完成分層次的恢復(fù)體系,就是設(shè)備故障(包括邏輯故障)本地修復(fù)、系統(tǒng)災(zāi)難異地啟動這十四字方針。
目前,部分先進的災(zāi)備技術(shù)(如飛康的持續(xù)數(shù)據(jù)保護災(zāi)備技術(shù))具備瞬間的本地修復(fù)能力,這樣,就可以在極短的時間完成設(shè)備故障的應(yīng)急響應(yīng) (一般甚至于可以達到幾秒鐘)。對于業(yè)務(wù)體系而言,業(yè)務(wù)連續(xù)性的保證化解了內(nèi)部故障帶來的可能造成的巨大社會風(fēng)險和經(jīng)濟風(fēng)險(例如大量的索賠等)
3) 修復(fù)技術(shù)采用先驗證技術(shù)
以往,人們認(rèn)識的修復(fù)技術(shù)往往是“回存” 技術(shù),就是要把備份數(shù)據(jù)介質(zhì)倒回生產(chǎn)系統(tǒng)中,然后等待恢復(fù)的效果和業(yè)務(wù)的啟動,這種技術(shù)存在眾多風(fēng)險,首先是在漫長的數(shù)據(jù)恢復(fù)之前,完全無法預(yù)料恢復(fù)時間和恢復(fù)可靠性。其次,一旦恢復(fù)成功,卻發(fā)現(xiàn)恢復(fù)的數(shù)據(jù)并非自己需要的時間點,或者需要的數(shù)據(jù)不存在,這已完全無法回退到初始狀態(tài),系統(tǒng)將進入更為嚴(yán)重的不可控狀態(tài)。在這類技術(shù)中,業(yè)務(wù)連續(xù)性根本就不在考慮范圍,人們盼著數(shù)據(jù)能夠回來就已經(jīng)興高采烈了,哪里還能奢望瞬間業(yè)務(wù)繼續(xù)運行呢?
目前,許多行業(yè)的領(lǐng)導(dǎo)者已經(jīng)將目光延伸到先驗證的災(zāi)難恢復(fù)技術(shù)上,這類技術(shù)的特點就是在出現(xiàn)數(shù)據(jù)損壞時,可以立即提供原格式的數(shù)據(jù)時間點供驗證,業(yè)務(wù)系統(tǒng)立即運行,在確保了業(yè)務(wù)連續(xù)性的極為重要的目標(biāo),此后,可以利用其余空閑時段,再行修復(fù)生產(chǎn)設(shè)備。這一體系被稱為“先生產(chǎn),后修復(fù)”。
4) 注重傳輸帶寬的研究
異地容災(zāi)的一個重要領(lǐng)域就是傳輸帶寬技術(shù),這一技術(shù)的不足往往可以導(dǎo)致由于帶寬不足造成數(shù)據(jù)延遲過大,造成災(zāi)備中心數(shù)據(jù)不可用等等。許多災(zāi)備技術(shù)路線都在傳輸帶寬的精簡技術(shù)上練內(nèi)功,比拼能力,這是十分正確的。有效的精簡帶寬傳輸技術(shù)能夠使得災(zāi)備建設(shè)的成本大為降低,也可以使災(zāi)備中心的數(shù)據(jù)實時性大為提高,對于數(shù)據(jù)向生產(chǎn)中心的恢復(fù)也能獲得十分有效的速度提升。
從上所述,災(zāi)備技術(shù)路線的選擇和詳細和完善的建設(shè)目標(biāo),是災(zāi)備系統(tǒng)建設(shè)的兩大籌碼,直接影響到災(zāi)備建設(shè)的最終效果,考慮的不周和缺陷將直接導(dǎo)致災(zāi)難或故障發(fā)生時業(yè)務(wù)系統(tǒng)心臟的長時間停轉(zhuǎn)(不作為),從而引發(fā)眾人的更多質(zhì)疑,不是已經(jīng)建立了備份系統(tǒng)了嗎?不是已經(jīng)通過應(yīng)急預(yù)案的內(nèi)審了嗎?這種質(zhì)疑當(dāng)然會令最初的建設(shè)者們十分難堪。所以,選擇具備先進性和有效性的災(zāi)備技術(shù)路線(例如前述的飛康持續(xù)數(shù)據(jù)保護技術(shù)等),將能夠帶領(lǐng)人們克服以往對于災(zāi)難和故障的恐懼,提升人們的信心,災(zāi)難對于人們的心里恐嚇將會蕩然無存,信息化系統(tǒng)也將駛向安全和平穩(wěn)的康莊大道。