簡介
網絡術語
常見的測試丢包的方法是通過使用PING命令進行測試,Request timed out表示此刻發生丢包故障。
Reply from220.181.6.19:bytes=32time=10ms TTL=55類似顯示表示數據傳輸正常。另外,還可以通過一些工具軟件進行測試。
查看
一、首先使用Win+R組合快捷打開,運行對話框,然後在打開後面輸入命名cmd并點擊“确定”進入;
二、打開CMD命令窗口後,鍵入命名:ping遊戲服務器IP或網址-t,比如小編要測試,自己電腦訪問網頁看是否有延時、丢包現象,可以直接ping https://guanjia.qq.com/-t輸入完成後,按“回車鍵”确認運行,就可以看到結果了;
三、Ping程序開始測試網絡延遲一段時間之後,按下組合快捷鍵Ctrl+C就可以停止測試,并得出計網絡延時統計算結果了;
原因
物理線路故障
網管員發現廣域網線路時通時斷,發生這種情況時,有可能是線路出現故障,也可能是用戶方面的原因。
由物理線路引起的丢包現象還有很多,如光纖連接問題,跳線沒有對準設備接口,雙絞線及RJ-45接頭有問題等。另外,通信線路受到随機噪聲或者突發噪聲造成的數據報錯誤,射頻信号的幹擾和信号的衰減等都可能造成數據包的丢失。我們可以借助網絡測試儀來檢查線路的質量。
設備故障
設備故障主要是指設備硬件方面的故障,不包含軟件配置不當造成的丢包。如網卡是壞的,交換機的某個端口出現了物理故障,光纖收發器的電端口與網絡設備接口,或兩端設備接口的雙工模式不匹配。
例如交換機端口的光纖模塊故障造成的丢包現象。交換機接收到的數據包在轉發過程中不會被發送出去,也不會被丢棄。它們将會堆積在動态緩存中,永遠無法發送出去,等到緩存中堆積滿了,就會造成交換機死機的現象。最終結果是,數據包無法到達目的主機。
網絡擁塞
網絡擁塞造成丢包率上升的原因很多,主要是路由器資源被大量占用造成的。
應用中遇到的造成網絡擁塞的情況還有很多,如大量的UDP流量、大量的組播流、廣播包穿越路由器,路由器配置了IP NAT并且有很多DNS包穿越路由器等。上述情況造成網絡擁塞後,通信雙方采取流量控制,丢棄不能傳輸的包。
路由錯誤
網絡路徑錯誤也會導緻數據包不能到達目的主機,如主機的默認路由配置錯誤,主機發出的訪問其他網絡的數據包會被網關丢棄。但此類丢包屬于正常情況下的丢包,是意料之中的,不會對網絡造成影響。
其中,由網絡擁塞原因導緻的丢包,有一部分是通信雙方采取流量控制而主動丢棄的,這部分被主動丢棄的數據包就稱為棄包。丢包和棄包的概念通常用作丢包率和棄包率,應用于衡量網絡的性能指标中。丢失的數據包數量占發送數據包的比率稱為丢包率,丢棄的數據包數量占發送數據包的比率稱為棄包率。丢包率和棄包率的值一定程度上體現了網絡性能。
處理方法
1、故障分析
Ping丢包是指Ping報文在網絡中傳輸,由于各種原因(如線路過長、網絡擁塞等)而産生部分Ping報文丢棄的現象。在使用Ping命令,出現Ping丢包的現象時,第一步需要确定Ping丢包的網絡位置,其次是确定Ping丢包的故障原因,然後依據定位的故障原因再進行解決。n
确認Ping丢包的網絡位置時一般采用逐段Ping的方法,可以将Ping丢包故障最終确定在直連網段之間。确認Ping丢包的故障原因一般采用流量統計的方法,通過流量統計可以知道丢棄報文的具體位置、判斷故障原因。n
導緻Ping丢包的原因非常多,也非常複雜,實際故障定位中需要綜合考慮各種因素。本文檔針對常見Ping丢包故障分析,總結出以下幾種常見故障:物理環境故障;網絡環路;ARP問題;ICMP問題。n
需要注意并不是Ping丢包就一定表示網絡質量差,某些情況下雖然Ping丢包,但是業務是正常的。分析Ping丢包時注意以下兩點:當設備對報文進行硬件轉發,速度非常快,就不會丢包。例如,Ping設備端口下挂的電腦。當報文需要CPU進行處理時,CPU繁忙就會丢包。例如:Ping設備上的IP地址。n
為了防止網絡攻擊對設備造成影響,設備具有CPU保護功能,對于超過CPCAR(Control Plane Committed Access Rate)值的ARP、ICMP等報文進行丢棄,造成Ping丢包現象。此種現象不影響業務的正常運行。
2、Ping丢包故障定位
3、Ping丢包故障現象n
C:Users>ping-n100,192.168.4.41n
正在Ping192.168.4.41具有32字節的數據:
請求超時。n
請求超時。n
來自192.168.4.41的回複:字節=32時間<1ms TTL=128n
來自192.168.4.41的回複:字節=32時間<1ms TTL=128n
192.168.4.41的Ping統計信息:n
數據包:已發送=100,已接收=80,丢失=20(20%丢失),n
往返行程的估計時間(以毫秒為單位):n
最短=0ms,最長=0ms,平均=0ms
4、Ping丢包故障定位n
依據故障發生的可能原因進行故障定位,故障定位方法如下:
1、配置Ping多包。n
為了持續複現丢包現象,以便于故障處理,需要持續發送Ping報文。可以配置Ping的-c count參數,發送多個Ping報文。n
2、縮小故障範圍。n
當在PC上直接Ping IP地址192.168.4.41丢包時,直接判定故障出現的原因将非常的困難。此時可以先縮小故障範圍,在PC上分别Ping SwitchA、SwitchB、SwitchC和SwitchD,通過Ping結果可以判斷出哪一段網絡出現故障。本例假設PC上Ping SwitchB時也出現丢包,則可以初步判斷丢包發生在SwitchA和SwitchB直連網段之間。n
3、配置流量統計。
通過縮小故障範圍最終将故障定位在SwitchA和SwitchB之間,為了進一步确認故障點,需要在SwitchA和SwitchB上配置流量統計功能,觀察丢包情況。具體理論統計配置方法請參考各設備的說明手冊。n
4、分析統計結果。n
在SwitchA上持續Ping SwitchB。n
如果離開SwitchA的報文數目多餘進入SwitchB的報文數目,說明傳輸鍊路上存在丢包,請依照後面介紹的物理鍊路故障引起ping丢包進行處理。n
如果離開SwitchA的報文數目等于進入SwitchB的報文數目,但是離開SwitchB的報文數目少于進入SwitchB報文數目,說明SwitchB上存在丢包。引起SwitchB設備丢包可能原因分為網絡環路和ICMP問題。n
登錄設備,續查看CPU和接口利用率是否很高、查看是否出現MAC地址漂移。如果出現利用率高或MAC地址漂移現象,請依照後面的網絡環路引起ping丢包進行處理。n
登錄設備,查看是否有ICMP報文被丢棄、查看ICMP報文限速的配置是否過小。如果出現報文被丢棄或ICMP報文限速配置得很小,請依照後面介紹的ICMP問題引起ping丢包進行處理。n
如果離開SwitchA的報文數目少于Ping發送的報文數目,說明SwitchA上丢包。引起SwitchA丢包可能原因分為網絡環路和ARP問題。登錄設備,查看CPU和接口利用率的情況,查看是否出現MAC地址漂移,如果出現利用率高或MAC地址漂移現象,請依照後面介紹的網絡環路引起ping丢包進行處理。n
5、物理鍊路故障引起ping丢包分析n
通過Ping丢包故障定位思路可以判斷出是否由于物理鍊路故障引起的丢包。物理鍊路故障常見以下原因:n
計算機網卡有問題、設備接口不正常、線纜接頭接觸不良或松脫、網線過長或出現破損、光纖彎曲度過大、光模塊收發的光功率過低、電口協商不一緻,如一端自協商一端非自協商。在實際環境中設備未接地導緻靜電不能釋放、風扇損壞導緻設備過熱等物理環境問題也會引起Ping丢包。n
物理鍊路故障可以通過觀察發現,如光纖彎曲度過大、物理連接線過長、設備或者電腦網卡指示燈顯示不正常等。針對物理鍊路故障,故障的解決的辦法一般是更換物理器件,器件更換後故障即可恢複。
6、網絡環路故障引起ping丢包分析n
以太網交換網絡中為了進行鍊路備份,提高網絡可靠性,通常會使用冗餘鍊路。但是使用冗餘鍊路會在交換網絡上産生環路,引發廣播風暴以及MAC地址表不穩定等故障現象,從而導緻用戶通信質量較差,甚至通信中斷。網絡環路會導緻設備CPU和端口利用率高,Ping報文被丢棄。