EDI6600FF 系列是一款高性能的光纖通道存儲產品 ,EDI6600FF 的一個磁盤子系統可支持 14 個磁盤 , 當需要更多存儲容量時,可通過連接最多 8 個子系統,達到 112 個硬盤的總容量。
本案例是由一個主柜和三個擴展柜組成的 4 組 raid5
故障描述:
由于 Raid 卡硬件設備故障,導致 4 組 Raid5 中的 3 組在系統上識別不了。陣列中的數據非常重要,即便更換 Raid 卡,重新配置 raid 信息,也不能保證數據安全。經再三考慮,客戶決定先尋找一種相對安全的方法,把數據都備份出來,然后才決定更換硬件設備。
解決方案:
面對眼前的 42 塊從陣列中拔下來的光纖接口的大小為 146GB 的硬盤,技術工程師如果沒有豐富的經驗和深厚的數據恢復知識,一是不能平靜自己,二是不能說服客戶。護航時代的小伙子們從容接下了這個項目。
第一步、確定磁盤分組 硬盤是從 1-42 編號,第一組、第二組、第三組故障 Raid5 都是由 14 塊盤組成。每組 raid 中的 14 塊盤并不是一個節點中的 14 塊盤,而是幾個節點中的盤都有,幸好硬件工程師在配置 raid 的時候做了詳細的記錄,省了從 42 塊盤中分析哪 14 塊盤是一組 raid5 的時間, raid5 磁盤分組確認順利完成。
第二步、分析底層數據走向 這一步是 raid 數據恢復最關鍵的一步,其實只要分析出一組 raid5 的數據組合規律,其它兩組也就順理成章的出來。有了經驗以后, raid5 是最常見也是比較容易分析的,它不像 HP RAID ADG 、 Raid1+e 、 Raid1 擴展等那樣難。技術工程師很快就分析出數據組合規律。
第三步、重組數據 如果說分析數據走向是關鍵一步的話,那么重組數據就是最核心的技術了。護航時代擁有自主知識產權的“護航艦” Raid 數據重組軟件,可以重組任何一款 Raid 數據。有些數據恢復公司每當遇到一種算法較為復雜 raid ,借助市面上的數據恢復軟件沒法做到的,就認為是不可修復的。其根本就是不專業的技術,用二流的免費的或者國外破解版的數據恢復軟件去恢復高端 raid 故障,只能是碰碰運氣,根本沒有理論和技術支撐。“護航艦” raid 恢復技術,從理論上可以證明哪些故障是可救的,哪些是不可救的。
實際操作中遇到的問題:
天有不測風云,人有禍福旦夕。在數據恢復過程中,數據還沒展現在你的眼前之前,你千萬不能說 OK ,因為在這里頭的不確定因素較多。原本以為第一組故障 raid 重組很順利,沒想到這 14 塊盤中有一塊盤識別不正常,然后我們缺這個塊盤進行數據重組,沒想到組合到 70GB 的時候發現有一塊盤有大量物理壞道,我們只能終止程序。當發現 raid5 中有兩塊及兩塊以上的盤出現物理故障,數據恢復到這個階段人的心情是最郁悶和難受的。但是憑經驗,我們決定對有壞道的硬盤單獨做個鏡像,然后用鏡像文件重組。實在不行,就只能搶修不能識別的那塊盤了。最后終于克服了所有困難,成功恢復出所有的數據。
小結:
在高端存儲設備出現故障時,首先要想到的是數據的重要性,其實這就是一種思想認識和備份意識。如果數據非常重要,我們建議不要在故障設備上作任何夸張的操作(指的是 Rebuild 、初始化、同步數據、重配 raid 等),這些操作都是比較致命的,是不可逆的。要尋求專業的數據恢復公司,給您提供合理的恢復方案,您才能放心的把您的硬盤送上手術臺。那些非專業公司,如果要求您提供陣列卡或者服務器做恢復的話,您應該考慮其技術的可靠性。