我愿意和讀者們共享自己的經驗和秘訣。
窺視網管員的工具包
真正的硬件工具
每個網管員由于各自實際情況不同,隨身攜帶的真正的硬件工具也未必相同。我的硬件工具包包括:螺絲刀、網卡、牙醫鏡和微型手電筒、線纜測試儀、錄音設備等東西。下面我講一下這些工具都干什么用。
螺絲刀:這個工具毋庸多言,就是拆開機箱用的。但有些服務器,比如早期的Compaq服務器(現在很少見了,說實話我也幾乎沒有見到過),這個螺絲刀就必須是Compaq(Toex)螺絲刀,其末端是星形的,普通的十字螺絲刀是不能使用的。
網卡:用于在工作站或服務器上修復常見的問題,有時候可以用來確認原來的網卡是否有問題。
牙醫鏡和微型手電筒:這是個組合工具,可以讓我在緊急時很容易看到組件的反面和主板。
線纜測試儀:用于網絡布線的故障和測試定位,如果線纜測試儀很高級,可對線纜進行周期性檢測,確保布線系統的質量。在評估認證后,將電纜測試儀存儲的測試結果復制到計算機上并打印出來,作為網絡布線基準文檔。
錄音設備:相信讀者看到這設備肯定驚訝得下巴都掉了……其實,我也是從歷次的教訓中獲取的經驗。還記得有多少次在一個復雜的故障檢修過程中一次又一次執行相同的步驟和操作嗎?就好比在家中丟失了東西以后在已經找過的地方反復搜尋,這合理嗎?我是從第一分鐘起,將我所采用的每一個步驟口述到錄音設備中,這種記錄能使我回顧所采用的方法,并決定是否還要遵循檢修的路徑以及結果的本質。我之所以采用口述的方式,而不是用紙筆來記錄故障檢修的過程就是因為:厭倦!人們往往可以手寫記錄下故障檢修過程的前面幾個步驟,或者前面幾個小時所采用的步驟,但會隨著時間的推移,厭倦會導致這種工作的中斷:所采用的步驟沒有記錄或者是跳過了記錄。而口述是一種相對比較輕松的記錄故障檢修過程的工作,能記錄下自始至終的每一步。
其他的工具,要視乎你的工具包是否還有額外的空間,以及你實際的情況,比如,昂貴的FLUKE網絡測試儀器,并不是每個人都會配備的。
軟件工具包
網管員可以根據自己的習慣、愛好等選擇適合自己的軟件工具包,軟件工具包的形式可以是LiveCD或者集成了維修工具的Windows PE啟動光盤,也可以是別的光盤,我用的Windows PE啟動光盤是深山紅葉工具光盤,很好用,網絡上有很多與之相類似的工具光盤。Live Cd我選擇的是Knoppix漢化版,Live CD的選擇有很多,比如Trinity Rescue Kit等等,都可以作為急救用的Live CD。
現在閃存容量越來越大了,加之現在的新電腦都支持從閃存啟動系統,我們完全可以制作成Live USB,在一定程度上比Live CD更為靈活。即使不做Live USB,也可以把常用的工具拷貝到閃存內,以備急需。關于這方面可以參考我在2007年5期《電腦自做》第96-101頁刊登的《閃存擴展 隨心而動》文章。
還有一些驅動軟盤,雖說現在軟盤和軟驅近乎絕跡了,但有些場合還是需要的,比如RAID驅動程序等等。
雜項
其他還有一些亂七八糟的東西,我帶的就有小門墊、工作服、套衫、休閑鞋、巧克力什么的。很驚訝吧?嗯。我帶的小門墊的真實作用是在擁擠的服務器房繞電纜的時候,我跪在上面用來保護我的膝蓋。而不是跪下向客戶和管理人員請罪,哈哈!
很多公司對員工的著裝有很嚴格的要求,必須穿正式的服裝,不能穿休閑的,那么在臟亂的庫房和機房里,這一身正式的、嚴肅的服裝是不是很讓你為難?我帶一套工作服、套衫、休閑鞋就是為了應付這種窘境的。
巧克力是干什么的?不怕各位笑話,我這人有時候有點膽怯,面對未知的故障的時候有時會感到恐懼,這時候吃點巧克力能提高血糖幫助消除恐懼感。
筆記本
從一定意義來說,它可以說是工作日志。你可以用紙媒介的本子來記筆記,也可以用電子版形式的,只要能達到目的就好,我用的是電子文檔。筆記本對于我來說,它的作用就是告訴我:出現問題時,哪些發生了變化。
當出現一個新的問題時,所要問的第一件事往往就是出現問題之前,是否有什么變化。
任何網絡操作系統都是一個有問題的系統,有時因為一些不能解釋的原因,甚至大部分無害的變化都有可能變得一團糟。如果你的筆記本,記錄了每個服務器、每個設備所有變化的詳細日志,能節省你用在故障檢修上的數個小時。作為我來講,我有每個服務器單獨的Excel電子表格,記錄了安裝新軟件包、安排重新啟動與否、添加新驅動器或者別的軟件等等,還有時間、日期、服務器每次變化的屬性。
如果在本周對服務器所做的更改,在下周引起了問題,那么你的筆記本就將發揮非常大的作用。
筆記本對于任何故障的成功解決非常重要。一個人對管理機器明晰,而他的同事卻什么都不懂,這就毫無意義了。我認為,這是一種非常危險的處境,特別是問題中的任務對網絡的安全至關重要。如果一旦這個人發生意外,其余的人該怎么辦呢?
從實踐經驗來看,隨著新過程的發展將其文檔化的做法是值得鼓勵的。我就有過這種經歷:曾經完美處理過一些事情,但僅僅過了一個月之后就遺忘了!這時候我多么希望自己以前就記錄到筆記本上啊!這種情況經常會發生。
實際上,根據我的經驗,當出現問題時,不論是打印驅動程序被破壞,還是客戶端連不上網絡,都應該記筆記。十有八九在開始進行之前,當處理問題之后,回到辦公室就會忘記自己做了什么。
想象一下,如果處理問題時和不斷升級必須有一段停機時間,回想使用的規程可能沒有歸檔,會怎么樣呢?
筆記的歸檔也很重要。雖然歸檔的內容有一些可能會過時了,比如Windows NT,但無論什么方法,都要保存起來。一些詳細任務可能再次適用于當前的網絡。另外,當按照新規程部署或者進行Beta測試時,歸檔就更為重要。如果堅持這種做法,這樣任何人走入服務器機房都可以按照歸檔的筆記執行任務,這對網絡管理工作不是很好嗎?
故障檢修秘訣
Hello,現在我們終于到達了文章最重要的部分。
我的心得