當(dāng)前網(wǎng)絡(luò)迅速發(fā)展,并承載了許多重要的商業(yè)應(yīng)用和服務(wù),同時(shí)網(wǎng)絡(luò)用戶也越來(lái)越多。在這種網(wǎng)絡(luò)環(huán)境下,網(wǎng)絡(luò)工程師除了要完成諸如將設(shè)備添加至網(wǎng)絡(luò)的簡(jiǎn)單任務(wù)外,更多時(shí)候他們還需要去即時(shí)處理和解決一些復(fù)雜的網(wǎng)絡(luò)問(wèn)題,以保證網(wǎng)絡(luò)正常快速地運(yùn)行。
本文討論了技術(shù)人員經(jīng)常可能遇到的十個(gè)網(wǎng)絡(luò)問(wèn)題,并介紹了它們的現(xiàn)象、原因和解決辦法。
問(wèn)題 1 : 端口無(wú)法連接網(wǎng)絡(luò)
現(xiàn)象:將電腦、電話、無(wú)線接入點(diǎn)或打印機(jī)插入墻壁上的網(wǎng)絡(luò)插孔,而網(wǎng)絡(luò)連接不正常。交換機(jī)端口的連接指示燈和網(wǎng)卡的連接指示燈都不亮。
原因:若沒(méi)有修復(fù)墻壁插孔上的網(wǎng)絡(luò)連接,則時(shí)常會(huì)發(fā)生掉線或無(wú)法連接的問(wèn)題。在許多企業(yè)中,只有那些經(jīng)常使用的連接才被修復(fù)。當(dāng)移動(dòng)了辦公室或會(huì)議室后,有時(shí)會(huì)發(fā)現(xiàn)那些不常使用的網(wǎng)絡(luò)插孔并沒(méi)有被測(cè)試過(guò),或是那些無(wú)法連接的插孔可能是由于登記錯(cuò)誤導(dǎo)致的。此外,交換機(jī)端口可能被強(qiáng)制關(guān)閉。
解決辦法:檢查和確認(rèn)交換機(jī)端口是否已被激活,且網(wǎng)絡(luò)連接已被修復(fù)過(guò)。當(dāng)任何設(shè)備被移動(dòng)到辦公室時(shí),請(qǐng)務(wù)必對(duì)新的網(wǎng)絡(luò)連接進(jìn)行測(cè)試,確保他們能夠正常工作。就IP電話而言,也有可能是電話的電源供應(yīng)不足。
問(wèn)題 2: 無(wú)法獲取到 IP地址
現(xiàn)象:網(wǎng)絡(luò)癱瘓或出現(xiàn)故障而不能正常運(yùn)行。操作系統(tǒng)可能會(huì)提示客戶端當(dāng)前無(wú)法從DHCP服務(wù)器獲取到IP地址。檢查網(wǎng)卡的狀態(tài)后,發(fā)現(xiàn)沒(méi)有分配IP地址。
原因:沒(méi)有收到來(lái)自DHCP服務(wù)器分配的IP地址。DHCP服務(wù)器的IP地址耗盡、服務(wù)器的服務(wù)癱瘓了、終端設(shè)備可能被配置為使用靜態(tài)IP地址而不是通過(guò)DHCP分配、終端設(shè)備的DHCP請(qǐng)求從來(lái)沒(méi)有到達(dá)服務(wù)器端,這些都可能導(dǎo)致客戶端無(wú)法獲取到IP地址。
尤其是如果一個(gè)新的設(shè)備配置一個(gè)虛擬局域網(wǎng)(VLAN),沒(méi)有建立與服務(wù)器的服務(wù)請(qǐng)求連接時(shí),設(shè)備肯定不能獲取到IP地址。即將一個(gè)新設(shè)備配置到一個(gè)VLAN時(shí),若沒(méi)有將DHCP請(qǐng)求中繼到DHCP服務(wù)器,就會(huì)導(dǎo)致請(qǐng)求不能發(fā)送到DHCP服務(wù)器端。
解決辦法:關(guān)鍵問(wèn)題是多少用戶出現(xiàn)了同樣的問(wèn)題,一個(gè)用戶還是多個(gè)用戶?如果只有一個(gè)用戶受到影響,那么請(qǐng)確認(rèn)該客戶端的網(wǎng)絡(luò)設(shè)置是否配置為使用動(dòng)態(tài)主機(jī)配置協(xié)議(DHCP)。
下一步,檢查交換機(jī)的端口被劃分到哪個(gè)VLAN,檢查屬于該VLAN的其他設(shè)備能否獲取到IP地址。如果他們也不能獲取到IP地址,問(wèn)題原因可能是路由器沒(méi)有將DHCP請(qǐng)求轉(zhuǎn)發(fā)到DHCP服務(wù)器。如果多個(gè)子網(wǎng)內(nèi)的許多設(shè)備都出現(xiàn)了這個(gè)問(wèn)題,那么可能是DHCP服務(wù)器出現(xiàn)了問(wèn)題,即服務(wù)器的DHCP服務(wù)可能沒(méi)有運(yùn)行,或者它的IP地址已經(jīng)耗盡。
問(wèn)題 3 :無(wú)法連接到應(yīng)用服務(wù)器
現(xiàn)象:當(dāng)用戶試圖打開(kāi)一個(gè)應(yīng)用程序時(shí),系統(tǒng)可能會(huì)提示無(wú)法連接到該應(yīng)用程序服務(wù)器。當(dāng)使用電子郵件應(yīng)用或客戶關(guān)系管理(CRM)應(yīng)用時(shí)可能會(huì)出現(xiàn)這種問(wèn)題。反映到服務(wù)臺(tái)的常見(jiàn)投訴是網(wǎng)絡(luò)癱瘓了,而這可能并不是真正的原因。
原因:許多原因都可能導(dǎo)致客戶端無(wú)法連接到應(yīng)用服務(wù)器。關(guān)鍵是需要詢(xún)問(wèn)用戶這個(gè)問(wèn)題是經(jīng)常發(fā)生,還是斷斷續(xù)續(xù)發(fā)生?如果用戶終端已獲取了一個(gè)正確的IP地址,那么可能是用戶和服務(wù)器間的路由有問(wèn)題。這種情況下,可以通過(guò)一個(gè)簡(jiǎn)單的ping測(cè)試來(lái)驗(yàn)證。如果連接時(shí)斷時(shí)續(xù),則可能是由于服務(wù)器太繁忙,而不能及時(shí)響應(yīng)客戶端的請(qǐng)求所導(dǎo)致的。
解決辦法:如果使用ping測(cè)試后發(fā)現(xiàn)路由沒(méi)有問(wèn)題,那么請(qǐng)檢查服務(wù)器的負(fù)載和資源。檢查服務(wù)器是否正忙于執(zhí)行一個(gè)諸如備份的任務(wù)?如果不是這樣的話,請(qǐng)檢查客戶端和服務(wù)器之間的網(wǎng)絡(luò)負(fù)荷,且側(cè)重關(guān)注廣域網(wǎng)連接(如果有的話)。
通常,客戶端和服務(wù)器之間的網(wǎng)絡(luò)利用率過(guò)高也可能導(dǎo)致客戶端能連接到應(yīng)用服務(wù)器。最好的辦法是使用一個(gè)SNMP工具來(lái)監(jiān)測(cè)這些鏈路上的網(wǎng)絡(luò)使用率。另外,尋找所有交換機(jī)和路由器上的以太網(wǎng)錯(cuò)誤,這些錯(cuò)誤可能導(dǎo)致客戶端與服務(wù)器間的數(shù)據(jù)包丟失。
問(wèn)題 4:VLAN配置錯(cuò)誤
現(xiàn)象:當(dāng)在網(wǎng)絡(luò)上建立諸如無(wú)線寬帶或IP電話的新服務(wù)時(shí),通常要用VLAN來(lái)隔離其與其他用戶間的流量。這就要求對(duì)承載這些服務(wù)的交換機(jī)端口配置正確的VLAN.如果VLAN配置不正確,那么這個(gè)服務(wù)可能無(wú)法正常運(yùn)行。IP電話如果沒(méi)有經(jīng)來(lái)電管理設(shè)備注冊(cè)授權(quán)過(guò),那么連接到該電話的個(gè)人電腦可能就無(wú)法連接到關(guān)鍵服務(wù)器,或者無(wú)線用戶可能沒(méi)有獲取到適于該無(wú)線環(huán)境的正確IP地址。
原因:沒(méi)有對(duì)承載這些服務(wù)連接的交換機(jī)進(jìn)行正確配置。也許在公司內(nèi)部并沒(méi)有溝通好配置哪些端口來(lái)支持新服務(wù)。
解決辦法:通過(guò)測(cè)試,驗(yàn)證該端口支持哪些VLAN.若條件允許,使用一個(gè)VLAN標(biāo)簽生成特定VLAN的業(yè)務(wù),檢查這個(gè)端口上是否配置了VLAN.通過(guò)檢查DHCP服務(wù)器提供的IP地址,來(lái)確定VLAN配置在了哪些端口上。另外,檢查交換機(jī)的配置來(lái)驗(yàn)證VLAN配置。
問(wèn)題 5: 雙工方式不匹配
現(xiàn)象:網(wǎng)絡(luò)能夠連接,而雙工方式不匹配,會(huì)導(dǎo)致網(wǎng)絡(luò)性能很差。這種情況下,交換機(jī)和網(wǎng)卡的鏈路指示燈都是亮著的。而網(wǎng)絡(luò)性能卻受到很大的影響,吞吐量會(huì)下降到100Kbps或者更低水平。
原因:網(wǎng)絡(luò)連接的一側(cè)設(shè)備工作在全雙工(能夠同時(shí)發(fā)送和接收數(shù)據(jù))模式下,而另一側(cè)的設(shè)備工作在半雙工(在同一時(shí)刻只能執(zhí)行發(fā)送或接收)模式。全雙工側(cè)的設(shè)備不需要等待即可不斷發(fā)送數(shù)據(jù),不論對(duì)方能否收到數(shù)據(jù)它都會(huì)發(fā)送。
半雙工側(cè)設(shè)備在發(fā)送前必須等待,直到它不接收數(shù)據(jù)才能開(kāi)始發(fā)送。這意味著全雙工側(cè)設(shè)備有可能會(huì)中斷半雙工方的數(shù)據(jù)傳輸,造成半雙工側(cè)中止傳輸。如果傳輸被中止,將需要重傳這個(gè)數(shù)據(jù)幀。這將大大減少半雙工側(cè)設(shè)備所能使用的帶寬。
解決辦法:一般情況下,若網(wǎng)絡(luò)兩側(cè)設(shè)備的雙工方式不相互匹配,采取的常用辦法就是把網(wǎng)絡(luò)連接的一側(cè)設(shè)備(通常是交換機(jī))強(qiáng)制配置為全雙工,而讓另一側(cè)設(shè)備(例如個(gè)人電腦)配置為自適應(yīng)網(wǎng)絡(luò)鏈路狀態(tài)。
理想的情況是:自適應(yīng)功能能夠確認(rèn)對(duì)方的全雙工設(shè)置,并與這個(gè)鏈路設(shè)置相匹配。然而事實(shí)卻未必如此。被強(qiáng)制設(shè)置為全雙工模式的設(shè)備不再發(fā)送正確的信號(hào)。而網(wǎng)絡(luò)另一側(cè)的設(shè)備恰恰需要這些信號(hào)來(lái)確定鏈路的速度和雙工方式,以及自適應(yīng)對(duì)方鏈路設(shè)置。
因此,在這種情況下,需要自適應(yīng)鏈路的設(shè)備不得不去猜測(cè)鏈路的雙工方式。在不能確認(rèn)雙工方式的情況下,自適應(yīng)功能將默認(rèn)鏈路狀態(tài)為半雙工方式。這就是大多情況下,網(wǎng)絡(luò)發(fā)生雙工方式不匹配的主要原因。為了解決這個(gè)問(wèn)題,需要將網(wǎng)絡(luò)上所有的連接都設(shè)置為自適應(yīng)——除非你確實(shí)有別的原因。 在這些事件中,如交換機(jī)間的連接,一定要將兩側(cè)設(shè)備設(shè)置為全雙工。
問(wèn)題 6:應(yīng)用性能緩慢
現(xiàn)象: 應(yīng)用程序運(yùn)行緩慢。它可能在某一界面上凍結(jié)或在訪問(wèn)數(shù)據(jù)時(shí)停止運(yùn)行。通常情況下,網(wǎng)絡(luò)鏈路狀態(tài)不佳是造成這些問(wèn)題的主要原因。
原因: 確定網(wǎng)絡(luò)應(yīng)用程序的性能問(wèn)題可以幫助服務(wù)器維護(hù)人員定位問(wèn)題源。許多問(wèn)題都可能導(dǎo)致應(yīng)用程序運(yùn)行緩慢。其中最常見(jiàn)的原因是在服務(wù)器在生產(chǎn)時(shí)間進(jìn)行備份操作,數(shù)據(jù)庫(kù)服務(wù)器的響應(yīng)緩慢,以及網(wǎng)絡(luò)中丟包情況較嚴(yán)重。對(duì)于一位網(wǎng)絡(luò)技術(shù)員來(lái)說(shuō),最重要的事情就是首先確定是服務(wù)器還是網(wǎng)絡(luò)造成了響應(yīng)速度緩慢。
要確定這一點(diǎn),可以從一個(gè)客戶端捕獲流量。尋找客戶端和服務(wù)器之間的任何重傳數(shù)據(jù)包。如果存在重傳現(xiàn)象,則表示網(wǎng)絡(luò)傳輸過(guò)程中有數(shù)據(jù)包丟失,這會(huì)嚴(yán)重影響應(yīng)用程序的性能。如果客戶端和服務(wù)器之間不存在任何重傳,問(wèn)題可能出在服務(wù)器上,這種情況下可以嚴(yán)格監(jiān)測(cè)服務(wù)器。
解決辦法: 在追蹤一個(gè)故障時(shí),雖然數(shù)據(jù)包分析儀的使用比較困難,他們往往都配有簡(jiǎn)單計(jì)數(shù)器,可以顯示TCP重傳。使用該計(jì)數(shù)器可以幫助我們確定客戶端和服務(wù)器之間的網(wǎng)絡(luò)是否存在數(shù)據(jù)包丟失的現(xiàn)象。
查找客戶端和服務(wù)器之間的任何交換機(jī)和路由器的以太網(wǎng)錯(cuò)誤(幀檢測(cè)序列錯(cuò)誤,校準(zhǔn)錯(cuò)誤或碰撞),這些錯(cuò)誤都能引起丟包現(xiàn)象。如果沒(méi)有錯(cuò)誤,則觀察廣域網(wǎng)上是否有因鏈路利用率過(guò)高而導(dǎo)致的丟包現(xiàn)象。
問(wèn)題 7 : 打印故障
現(xiàn)象:有時(shí)候也會(huì)出現(xiàn)打印故障。打印機(jī)也許沒(méi)有問(wèn)題,而發(fā)送到打印機(jī)上的任務(wù)可能不能正常執(zhí)行。
原因: 首先需要確定是否只有一位用戶遇到了這個(gè)問(wèn)題,還是幾位用戶都遇到了同樣的問(wèn)題。如果只有一位用戶遇到了,那么可能是他的電腦沒(méi)有正確連接到打印服務(wù)器。如果不是這個(gè)原因,則可能是客戶端與打印機(jī)間的網(wǎng)絡(luò)連接有故障。數(shù)據(jù)包丟失可能會(huì)導(dǎo)致打印問(wèn)題,打印機(jī)上的網(wǎng)絡(luò)連接故障也可能會(huì)引起打印問(wèn)題。
解決辦法: 檢查打印機(jī)的配置,確保它有一個(gè)正確的IP地址,并且可以連接到打印服務(wù)器(如果打印服務(wù)器和打印機(jī)是分離開(kāi)的)。有時(shí),更新打印機(jī)驅(qū)動(dòng)程序也能夠解決打印問(wèn)題。總體來(lái)說(shuō),需要確保打印機(jī)是網(wǎng)絡(luò)可達(dá)的,以及所有打印機(jī)驅(qū)動(dòng)程序是最新的。
問(wèn)題 8:電纜故障
現(xiàn)象: 客戶的電腦終端能夠連接到網(wǎng)絡(luò),網(wǎng)絡(luò)性能卻很差。電腦終端可能根本無(wú)法連接網(wǎng)絡(luò)。
原因: 在當(dāng)今網(wǎng)絡(luò),千兆鏈路連接到桌面系統(tǒng)是常見(jiàn)的。千兆鏈路需要四對(duì)電纜,所以任何性能低于5類(lèi)線的電纜都不能支撐千兆連接。對(duì)于比較老舊的建筑物,必須考慮到這個(gè)問(wèn)題。另外,任何數(shù)量的電纜如果退捻(通常靠近RJ- 45端口或接線板)可能會(huì)導(dǎo)致信號(hào)的損失。這將導(dǎo)致交換機(jī)端口或網(wǎng)卡出現(xiàn)幀檢測(cè)序列錯(cuò)誤(FCS)。
解決辦法: 當(dāng)出現(xiàn)由于電纜問(wèn)題造成的網(wǎng)絡(luò)故障時(shí),大多數(shù)情況下,都需要更換電纜。如果是由于電纜無(wú)捻導(dǎo)致的,那么重新加捻電纜一般能夠解決這個(gè)問(wèn)題。當(dāng)需要承載如千兆鏈路或以太網(wǎng)供電的新技術(shù)時(shí),必須使用5類(lèi)電纜或者更好的電纜。
問(wèn)題 9: DNS 故障
現(xiàn)象: 用戶不能訪問(wèn)互聯(lián)網(wǎng)或關(guān)鍵應(yīng)用。可能是網(wǎng)絡(luò)癱瘓了。
原因: 問(wèn)題可能歸咎于域名服務(wù)(DNS)故障。客戶端無(wú)法根據(jù)服務(wù)器的IP地址解析出服務(wù)器的名稱(chēng),所以發(fā)送不了連接請(qǐng)求。在客戶端配置了錯(cuò)誤的DNS服務(wù)器通常會(huì)導(dǎo)致這個(gè)問(wèn)題,客戶端發(fā)送的DNS請(qǐng)求不屬于服務(wù)器的數(shù)據(jù)庫(kù),或者網(wǎng)絡(luò)中會(huì)有數(shù)據(jù)包丟失。DNS是一個(gè)基于UDP的協(xié)議,所以丟失的數(shù)據(jù)包也不會(huì)重傳,因此會(huì)導(dǎo)致DNS故障。
解決辦法: 檢查客戶端的配置和設(shè)置的DNS服務(wù)器。如果服務(wù)器配置錯(cuò)誤,則在客戶端上更改所設(shè)置的服務(wù)器,或在提供域名服務(wù)的服務(wù)器上調(diào)整配置。
多次重復(fù)測(cè)試DNS服務(wù)器與客戶端間的連接,確認(rèn)之間是否有因數(shù)據(jù)包丟失而導(dǎo)致響應(yīng)時(shí)延的情況。如果有數(shù)據(jù)包丟失,請(qǐng)檢查客戶端和服務(wù)器間的以太網(wǎng)錯(cuò)誤。捕獲失敗的DNS請(qǐng)求,確認(rèn)是否有來(lái)自服務(wù)器的DNS響應(yīng)。最好是能夠啟動(dòng)一個(gè)工具,該工具能夠不斷測(cè)試DNS服務(wù)器,并在有問(wèn)題時(shí)產(chǎn)生告警。
問(wèn)題 10:客戶端不能連接無(wú)線網(wǎng)絡(luò)
癥狀: 客戶端能夠檢測(cè)到無(wú)線接入點(diǎn),但是不能接入無(wú)線網(wǎng)絡(luò)。
原因:安全認(rèn)證、無(wú)線信道干擾和信號(hào)盲區(qū)可能會(huì)導(dǎo)致這個(gè)問(wèn)題。由于無(wú)線信號(hào)是不可見(jiàn)的,如果沒(méi)有專(zhuān)業(yè)無(wú)線工具的幫助,就很難追蹤到這些問(wèn)題。
解決辦法:使用一個(gè)無(wú)線監(jiān)測(cè)工具測(cè)量受影響地區(qū)的信號(hào)強(qiáng)度,如果可能的話,進(jìn)行實(shí)地勘察,找出該地區(qū)的惡意接入點(diǎn)或不明接入點(diǎn)。可能是由于無(wú)線信道重疊而產(chǎn)生干擾信號(hào),從而影響了接入無(wú)線網(wǎng)絡(luò)的用戶感知。
檢查周?chē)渌尤朦c(diǎn)產(chǎn)生的干擾信號(hào),或者其他干擾設(shè)備(如微波爐、無(wú)繩電話)產(chǎn) 生的噪聲。監(jiān)控客戶端試圖進(jìn)行關(guān)聯(lián)連接的接入點(diǎn),密切關(guān)注連接失敗出在哪個(gè)步驟——關(guān)聯(lián)、認(rèn)證還是授權(quán)。
總結(jié)
我們列出了技術(shù)人員在當(dāng)前網(wǎng)絡(luò)中經(jīng)常可能遇到的10個(gè)問(wèn)題。在多數(shù)情況下,能夠?qū)?wèn)題定位到一個(gè)或多個(gè)事情上,并很快解決問(wèn)題。
請(qǐng)將常見(jiàn)問(wèn)題的解決辦法記錄下來(lái),與其他技術(shù)人員分享,從而也能快速解決故障。如果有合適工具配合的話,就能快速簡(jiǎn)單地定位和解決問(wèn)題,及時(shí)恢復(fù)網(wǎng)絡(luò)的正常運(yùn)行。