典型的网络故障分析、检测与排除

典型的网络故障分析、检测与排除
摘要:
网络故障极为普遍,故障种类也十分繁杂。如果把网络故障的常见故障进行归类查找,那么无疑能够迅速而准确的查找故障根源,解决网络故障。文章主要就网络常见故障的分类诊断及排除进行了阐述。根据网络故障的性质把网络故障分为物理故障与逻辑故障。其物理故障也就是网络设备的故障。其逻辑故障是网络中配置管理的错误。也可根据网络故障的对象把网络故障分为线路故障、路由故障和主机故障。本文主要介绍路由器故障、配置故障、及连接故障的诊断与排除。通过运用工具和方法分析出导致网络故障的主要原因,及解决方法。
关键词:计算机网络,网络故障,分析诊断,物理类故障,逻辑类故障
 
 
引言
  计算机网络故障是与网络畅通相对应的一概念,计算机网络故障主要是指计算机无法实现联网或者无法实现全部联网。引起计算机网络故障的因素多种多样但总的来说可以分为物理故障与逻辑故障,或硬件故障与软件故障。采取有效的故障防预措施网络故障目前已经成为影响计算机网络使用稳定性的重要因素之一,加强对计算机网络故障的分析和网络维护已经成为网络用户经常性的工作之一。及时进行网络故障分析和网络维护也已经成为保障网络稳定性的重要方式方法。本文从实际出发,即工作中遇到的网络故障,描述了通过运用网络知识进行故障排除。按照故障现象―>故障分析-->故障解决的研究路线阐述了如何在实际中排除网络故障,及其在网络安全的应用中的重要性。
本文着重讲解了网络故障的排除方法,通过运用解决问题的策略与排除故障的思路在故障现场很快的检测出是属于哪种故障然后再基于故障提出方案给予解决。
正文:
一、网络故障
(一)物理类故障
物理故障,是指设备或线路损坏、插头松动、线路受到严重电磁干扰等情况。比如说,网络中某条线路突然中断,这时网络管理人员从监控界面上发现该线路流量突然掉下来或系统弹出报警界面,这时首先用ping检查线路在网络管理中心这端的端口是否连通,如果不连通,则检查端口插头是否松动,如果松动则插紧,再用ping检查,如果连通如故障解决。这时须把故障的特征及其解决步骤详细记录下来。也有可能是线路远离网络管理中心的那端插头松动,则需要通知对方进行解决。另一种常见的物理故障就是网络插头误接。这种情况经常是没有搞清网络插头规范或没有弄清网络拓扑规划的情况下导致的。比如说网络插头都有一些规范,只有搞清网线中每根线的颜色和意义,才能做出符合规范的插头,否则就会导致网络连接出错。另一种情况,比如两个路由器直接连接,这时应该让一台路由器的出口连接另一路由器的入口,而这台路由器的入口连接另一路由器的出口才行,这时制作的网线就应该满足这一特性,否则也会导致网络误解。不过像这种网络连接故障显得很隐蔽,要诊断这种故障没有什么特别好的工具,只有依靠经验丰富的网络管理人员了。
1.线路故障
在日常网络维护中,线路故障的发生率是相当高的,约占发生故障的70%。线路故障通常包括线路损坏及线路受到严重电磁干扰。
排查方法:假如是短距离的范围内,判定网线好坏简单的方法是将该网络线一端插入一台确定能够正常连入局域网的主机的RJ45插座内,另一端插入确定正常的HUB端口,然后从主机的一端Ping线路另一端的主机或路由器,根据通断来判定即可。假如线路稍长,或者网线不方便调动,就用网线测试器测量网线的好坏。假如线路很长,比如由邮电部门等供给商提供的,就需通知线路提供商检查线路,看是否线路中间被切断。对于是否存在严重电磁干扰的排查,我们可以用屏蔽较强的屏蔽线在该段网路上进行通信测试,假如通信正常,则表明存在电磁干扰,注重远离如高压电线等电磁场较强的物件。假如同样不正常,则应排除线路故障而考虑其他原因。
2.端口故障
端口故障通常包括插头松动和端口本身的物理故障。
排查方法:此类故障通常会影响到与其直接相连的其他设备的信号灯。因为信号灯比较直观,所以可以通过信号灯的状态大致判定出故障的发生范围和可能原因。也可以尝试使用其它端口看能否连接正常。
3.主机物理故障
网卡故障,笔者把其也归为主机物理故障,因为网卡多装在主机内,靠主机完成配置和通信,即可以看作网络终端。此类故障通常包括网卡松动,网卡物理故障,主机的网卡插槽故障和主机本身故障。
排查方法:对于网卡松动、主机的网卡插槽故障最好的解决办法是更换网卡插槽。对于网卡物理故障的情况,如若上述更换插槽始终不能解决问题的话,就拿到其他正常工作的主机上测试网卡,如若仍无法工作,可以认定是网卡物理损坏,更换网卡即可。
网络硬件故障的分析与诊断方法
网络中的硬件故障比较复杂,现就日常工作中常见的网络连线问题和网卡问题来进行探讨。如,网线至交换机或集线器之间的故障分析与诊断方法,故障诊断:通过看网卡指示灯集线器指示灯。首先,检查网线是否插好;其次,若有数台工作站同时出现网络故障,则有可能是连接这些计算机的交换机或集线器出故障。如,网卡故障,故障分析:这是最常发生的问题。如网卡设置错误,网卡在安装过程中是否正确地设置中断号,I/0端口地址,驱动程序是否出错,网卡是否出故障等。
(二)逻辑类故障
逻辑故障中的最常见情况是配置错误,也就是指因为网络设备的配置错误而导致的网络异常或故障。
1、一些重要进程或端口关闭
一些有关网络连接数据参数得重要进程或端口受系统或病毒影响而导致意外关闭。比如,路由器的SNMP进程意外关闭,这时网络治理系统将不能从路由器中采集到任何数据,因此网络治理系统失去了对该路由器的控制。或者线路中断,没有流量。
排查方法:用Ping线路近端的端口看是否能Ping通,Ping不通时检查该端口是否处于down的状态,若是说明该端口已经给关闭了,因而导致故障。这时只需重新启动该端口,就可以恢复线路的连通。
2、主机逻辑故障
主机逻辑故障所造成网络故障率是较高的,通常包括网卡的驱动程序安装不当、网卡设备有冲突、主机的网络地址参数设置不当、主机网络协议或服务安装不当和主机安全性故障等。
(1)网卡的驱动程序安装不当。网卡的驱动程序安装不当,包括网卡驱动未安装或安装了错误的驱动出现不兼容,都会导致网卡无法正常工作。
排查方法:在设备治理器窗口中,检查网卡选项,看是否驱动安装正常,若网卡型号前标示出现“!”或“X”,表明此时网卡无法正常工作。解决方法很简单,只要找到正确的驱动程序重新安装即可。
(2)网卡设备有冲突。网卡设备与主机其它设备有冲突,会导致网卡无法工作。
排查方法:磁盘大多附有测试和设置网卡参数的程序,分别查验网卡设置的接头类型、IRQ、I/O端口地址等参数。若有冲突,只要重新设置(有些必须调整跳线),或者更换网卡插槽,让主机认为是新设备重新分配系统资源参数,一般都能使网络恢复正常。
(3)主机的网络地址参数设置不当。主机的网络地址参数设置不当是常见的主机逻辑故障。比如,主机配置的IP地址与其他主机冲突,或IP地址根本就不在于网范围内,这将导致该主机不能连通。
排查方法:查看网络邻居属性中的连接属性窗口,查看TCP/IP选项参数是否符合要求,包括IP地址、子网掩码、网关和DNS参数,进行修复。
(4)主机网络协议或服务安装不当。主机网络协议或服务安装不当也会出现网络无法连通。主机安装的协议必须与网络上的其它主机相一致,否则就会出现协议不匹配,无法正常通信,还有一些服务如“文件和打印机共享服务”,不安装会使自身无法共享资源给其他用户,“网络客户端服务”,不安装会使自身无法访问网络其他用户提供的共享资源。再比如E-mail服务器设置不当导致不能收发E-mail,或者域名服务器设置不当将导致不能解析域名等。
排查方法:在网上邻居属性或在本地连接属性窗口查看所安装的协议是否与其他主机是相一致的,如TCP/IP协议,NetBEUI协议和IPX/SPX兼容协议等。其次查看主机所提供的服务的相应服务程序是否已安装,假如未安装或未选中,请注重安装和选中之。注重有时需要重新启动电脑,服务方可正常工作。
典型案例:
(1)计算机在局域网中能看到其他计算机,可就是上不了网。计算机的设置和其它计算机一样,网关、DNS服务器地址、IP地址设置都正确,网卡也没有故障。
故障分析:既然可以在网络中看到其它计算机,说明网络连接和网络协议的安装是正确的。如果确认IP地址信息设置无误,可以试着PING一下网络内的其他计算机、默认网关、外部WEB网站的IP地址和DNS。
①如果PING不通网络内的计算机,说明IP地址信息设置有问题,或者没有正确安装TCP/IP协议。
②如果PING不通默认网关,说明IP地址信息中有关默认网关的设置是错误的,应当认真检查该项设置。
③如果PING不通外部WEB网站的IP地址(要先使用连接正常的计算机进行测试,确认可以PING通该IP地址),说明IP地址信息中默认网关的设置是错误的,或者没有安装代理服务器软件,或者在代理服务器或宽带路口上作了限制,不允许该IP地址或MAC地址访问网络。
④如果以上PING测试全部通过,仍然无法访问WEB网站,查看Internet Explorer 的局域网设置。依次选择“工具”―“Internet选项”―“连接”―“局域网设置”命令,取消“自动检测设置”复选框。如果采用宽带路由器,或者ICS、SyGate等网关类代理服务器共享Internet连接,取消选中“为LAN设置代理服务器”复选框。如果使用WinGate作为代理服务器,则应当选中该复选框,并输入代理服务器的IP地址及使用的端口号。
(5)主机安全性故障。主机故障的另一种可能是主机安全故障。通常包括主机资源被盗、主机被黑客控制、主机系统不稳定等。
排查方法:主机资源被盗,主机没有控制其上的finger,RPC,rlogin等服务。攻击者可以通过这些进程的正常服务或漏洞攻击该主机,甚至得到管理员权限,进而对磁盘所有内容有任意复制和修改的权限。还需注重的是,不要轻易的共享本机硬盘,因为这将导致恶意攻击者非法利用该主机的资源。
(6)网络配置故障的分析与诊断
故障分析:网络配置故障就是由网络中的各项配置不当而产生的故障。它是一种较复杂的现象,不但要检查服务器的各项配置、工作站的各项配置,还要根据出现的错误信息和现象查出原因。如,域名、计算机名和地址故障的分析与诊断。故障分析:在实际工作中经常会出现在“网上邻居”中看不到其它计算机或只能看到部分计算机,无法找到指定的计算机等现象。故障诊断:检查网络中每个域、每台计算机的名称是否唯一;检查网络中的计算机名是否和域名或工作组名重复,使用TCP/IP时,检查分配给网络适配器的IP地址有无重复。在如协议故障的分析与诊断,故障分析:确认您所使用的协议与网络上其它计算机使用的协议相同。否则,将看不到网络上其它计算机。在配置和使用TCP/IP协议时的主要问题是IP地址、子网掩码和路由问题。IP地址的分配复杂,分配不好,容易造成网络混乱。
计算机无法上网故障排除案例
对于某台联网计算机上不了网的故障,首先要分别确定此计算机的网卡安装是否正确,是否存在硬件故障,网络配置是否正确在实际工作中我们一般采用Ping本机的回送地址(127.0.0.1)来判断网卡硬件安装和TCP/IP协议的正确性。 如果能Ping通,即说明这部分没有问题。如果出现超时情况,则要检查计算机的网卡是否与机器上的其它设备存在中断冲突的问题。通过查看系统属性中的设备管理器,查看是否在网络适配器的设备前面有黄色惊叹号或红色叉号,如有则说明硬件的驱动程序没有安装成功,可删除后重新安装。另外,要确保TCP/IP协议安装的正确性,并且要绑定在你所安装的网卡上。如果重新安装后还是Ping不通回送地址,最好换上一块正常的网卡试一试。如果在局域网中划分了VLAN,那么连在不同VLAN中的计算机都有各自不同的IP地址、子网掩码和网关。要在机器的网络属性中设定的IP地址等数据与连接的VLAN相匹配,否则将出现网络不通的情况。当确保了计算机的硬件设备和网络配置正确后,接着就要查看计算机与交换机之间的双绞线,交换机的RJ45端口或交换机的配置是否有问题。此时我们要Ping上网计算机所在VLAN的网关,不通的话就要分段检查上面所说的各项。
最简单的方法是检查双绞线,用线缆测试仪检测双绞线是否断开。双绞线没有问题,就要查看交换机的端口是否坏了。交换机的参数配置表也是网络管理员必备的资料之一,并且随着网络用户的变化要不断地修改,检测到此,如果端口指示灯不亮,就只能是端口损坏了,可以把跳线接到正常使用的端口上排除其它原因。
主机被黑客控制,会导致主机不受操纵者控制。通常是由于主机被安置了后门程序所致。发现此类故障一般比较困难,一般可以通过监视主机的流量、扫描主机端口和服务、安装防火墙和加补系统补丁来防止可能的漏洞。
主机系统不稳定,往往也是由于黑客的恶意攻击,或者主机感染病毒造成。通过杀毒软件进行查杀病毒,排除病毒的可能。或重新安装操作系统,并安装最新的操作系统的补丁程序和防火墙、防黑客软件和服务来防止可能的漏洞的产生所造成的恶性攻击。
逻辑链路故障诊断应用最多的工具,大多还是Windows内置的一些工具。其中,使用使用频率最高的就是PING 命令、Tracert命令和 ipconfig了。
Ping 命令主要用于测试是否发生逻辑链路故障,以及定位链路故障的位置。使用Ping 命令基本可以判断故障是发生在本地计算机,还是发生在接入交换机;是发生在汇聚交换机,还是发生在核心交换机。Tracert命令主要用于追踪路由,多用于比较复杂的网络结构中,可以大致定位故障发生的路由或三层设备。IPCONFIG 命令则主要用于显示本地计算机的IP地址信息,可以查看IP地址信息设置是否正确无误。
二 交换机故障
(一)硬件故障
硬件故障主要指交换机电源、背板、模块、端口等部件的故障,可以分为以下几类。
1、电源故障:
由于外部供电不稳定,或者电源线路老化或者雷击等原因导致电源损坏或者风扇停止,从而不能正常工作。由于电源缘故而导致机内其他部件损坏的事情也经常发生。
如果面板上的POWER指示灯是绿色的,就表示是正常的;如果该指示灯灭了,则说明交换机没有正常供电。这类问题很容易发现,也很容易解决,同时也是最容易预防的。
针对这类故障,首先应该做好外部电源的供应工作,一般通过引入独立的电力线来提供独立的电源,并添加稳压器来避免瞬间高压或低压现象。如果条件允许,可以添加UPS(不间断电源)来保证交换机的正常供电,有的UPS提供稳压功能,而有的没有,选择时要注意。在机房内设置专业的避雷措施,来避免雷电对交换机的伤害。现在有很多做避雷工程的专业公司,实施网络布线时可以考虑。
2、端口故障:
这是最常见的硬件故障,无论是光纤端口还是双绞线的RJ-45端口,在插拔接头时一定要小心。如果不小心把光纤插头弄脏,可能导致光纤端口污染而不能正常通信。我们经常看到很多人喜欢带电插拔接头,理论上讲是可以的,但是这样也无意中增加了端口的故障发生率。在搬运时不小心,也可能导致端口物理损坏。如果购买的水晶头尺寸偏大,插入交换机时,也容易破坏端口。此外,如果接在端口上的双绞线有一段暴露在室外,万一这根电缆被雷电击中,就会导致所连交换机端口被击坏,或者造成更加不可预料的损伤。
一般情况下,端口故障是某一个或者几个端口损坏。所以,在排除了端口所连计算机的故障后,可以通过更换所连端口,来判断其是否损坏。遇到此类故障,可以在电源关闭后,用酒精棉球清洗端口。如果端口确实被损坏,那就只能更换端口了。
(3)模块故障:
交换机是由很多模块组成,比如:堆叠模块、管理模块(也叫控制模块)、扩展模块等。这些模块发生故障的机率很小,不过一旦出现问题,就会遭受巨大的经济损失。如果插拔模块时不小心,或者搬运交换机时受到碰撞,或者电源不稳定等情况,都可能导致此类故障的发生。
当然上面提到的这3个模块都有外部接口,比较容易辨认,有的还可以通过模块上的指示灯来辨别故障。比如:堆叠模块上有一个扁平的梯形端口,或者有的交换机上是一个类似于USB的接口。管理模块上有一个CONSOLE口,用于和网管计算机建立连接,方便管理。如果扩展模块是光纤连接的话,会有一对光纤接口。
在排除此类故障时,首先确保交换机及模块的电源正常供应,然后检查各个模块是否插在正确的位置上,最后检查连接模块的线缆是否正常。在连接管理模块时,还要考虑它是否采用规定的连接速率,是否有奇偶校验,是否有数据流控制等因素。连接扩展模块时,需要检查是否匹配通信模式,比如:使用全双工模式还是半双工模式。当然如果确认模块有故障,解决的方法只有一个,那就是应当立即联系供应商给以更换。
(4)背板故障:
交换机的各个模块都是接插在背板上的。如果环境潮湿,电路板受潮短路,或者元器件因高温、雷击等因素而受损都会造成电路板不能正常工作。比如:散热性能不好或环境温度太高导致机内温度升高,指使元器件烧坏。
在外部电源正常供电的情况下,如果交换机的各个内部模块都不能正常工作,那就可能是背板坏了,遇到这种情况即使是电器维修工程师,恐怕也无计可施,惟一的办法就是更换背板了。
(5)线缆故障:
其实这类故障从理论上讲,不属于交换机本身的故障,但在实际使用中,电缆故障经常导致交换机系统或端口不能正常工作,所以这里也把这类故障归入交换机硬件故障。比如接头接插不紧,线缆制作时顺序排列错误或者不规范,线缆连接时应该用交叉线却使用了直连线,光缆中的两根光纤交错连接,错误的线路连接导致网络环路等。
(二)软件故障
交换机的软件故障是指系统及其配置上的故障,它可以分为以下几类。
1、系统错误:
交换机系统是硬件和软件的结合体。在交换机内部有一个可刷新的只读存储器,它保存的是这台交换机所必需的软件系统。这类错误也和我们常见的Windows、Linux一样,由于当时设计的原因,存在一些漏洞,在条件合适时,会导致交换机满载、丢包、错包等情况的发生。所以交换机系统提供了诸如Web、TFTP等方式来下载并更新系统。当然在升级系统时,也有可能发生错误。
对于此类问题,我们需要养成经常浏览设备厂商网站的习惯,如果有新的系统推出或者新的补丁,请及时更新。
2、配置不当:
初学者对交换机不熟悉,或者由于各种交换机配置不一样,管理员往往在配置交换机时会出现配置错误。比如VLAN 划分不正确导致网络不通,端口被错误地关闭,交换机和网卡的模式配置不匹配等原因。这类故障有时很难发现,需要一定的经验积累。如果不能确保用户的配置有问题,请先恢复出厂默认配置,然后再一步一步地配置。
3、密码丢失:
这可能是每个管理员都曾经经历过的。一旦忘记密码,都可以通过一定的操作步骤来恢复或者重置系统密码。有的则比较简单,在交换机上按下一个按钮就可以了。而有的则需要通过一定的操作步骤才能解决。
此类情况一般在人为遗忘或者交换机发生故障后导致数据丢失,才会发生。
4、外部因素:
由于病毒或者黑客攻击等情况的存在,有可能某台主机向所连接的端口发送大量不符合封装规则的数据包,造成交换机处理器过分繁忙,致使数据包来不及转发,进而导致缓冲区溢出产生丢包现象。还有一种情况就是广播风暴,它不仅会占用大量的网络带宽,而且还将占用大量的CPU处理时间。网络如果长时间被大量广播数据包所占用,正常的点对通信就无法正常进行,网络速度就会变慢或者瘫痪。一块网卡或者一个端口发生故障,都有可能引发广播风暴。由于交换机只能分割冲突域,而不能分割广播域(在没有划分VLAN 的情况下),所以当广播包的数量占到通信总量的30%时,网络的传输效率就会明显下降。总的来说软件故障应该比硬件故障较难查找,解决问题时,可能不需要花费过多的金钱,而需要较多的时间。最好在平时的工作中养成记录日志的习惯。每当发生故障时,及时做好故障现象记录、故障分析过程、故障解决方案、故障归类总结等工作,以积累自己的经验。比如有时在进行配置时,由于种种原因,当时没有对网络产生影响或者没有发现问题,但也许几天以后问题就会逐渐显现出来。如果有日志记录,就可以联想到是否前几天的配置有错误。由于很多时候都会忽略这一点,以为是在其他方面出现问题,当走了许多弯路之后,才找到问题所在。所以说记录日志及维护信息是非常必要的。
故障分析排除
对于同时有一批计算机上不了网的故障,首先要找到这些计算机的共性,如是不是属于同一VLAN或接在同一交换机上的,若这些计算机属于同一VLAN,且属于计算机分别连接于不同的楼层交换机,那么检查一下路由器上是否有acl限制,在路由器上对该VLAN的配置是否正确,路由协议(如我局的OSPF协议)是否配置正确。若这些计算机属于同一交换机,则应到机房检查该交换机是否有电源松落情况,或该交换机CPU负载率是否很高,与上一级网络设备的链路是否正常。通常某交换机连接的所有电脑都不能正常与网内其它电脑通讯,这是典型的交换机死机现象,可以通过重新启动交换机的方法解决。如果重新启动后故障依旧,则检查一下那台交换机连接的所有电脑,看逐个断开连接的每台电脑的情况,慢慢定位到某个故障电脑,会发现多半是某台电脑上的网卡故障导致的。故障通常使交换机的某个端口变得非常缓慢,最后导致整台交换机或整个堆叠慢下来。通过控制台检查交换机的状态,发现交换机的缓冲池增长得非常快,达到了90%或更多。原因及解决方法为:首先应该使用其它电脑更换这个端口上原来的连接,看是否由这个端口连接的那台电脑的网络故障导致的,也可以重新设置出错的端口并重新启动交换机。
三、路由器故障
(一)物理故障
路由器的安装和使用注意事项应该严格按照安装手册进行。安装前应检查安装场所的温湿度、洁净度、静电、干扰、防雷击等要求是否满足;安装后应检查电源的输入电压幅值、频率、中性点的连接及保护地、接地电阻等是否满足要求。
以下是使用路由器需要注意的几点故障:
(1)、安装后无法使用
*线路连接问题。如线路阻抗不匹配 线序连接错误、中间传输设备故障。
*与其它设备配合有问题。
*接口配置问题。
*电源或接地不符合要求。
*在安装过程也要考虑模块接口电缆所支持的最大传输长度、最大速率等因素。
(2)、使用过程中发生故障
*电源、接地和防护方面不符合要求,在有电压漂移或雷击时造成器件损坏。
*传输线受到干扰。
*中间传输设备故障。
*环境的温湿度、洁净度、静电等指标超出使用范围。
在故障定位的过程中,可把不必要的相连设备先去掉,缩小故障定位的范围,从而有利于快速准确地定位故障。
1. 串口故障排除
串口出现连通性问题时,为了排除串口故障,一般是从show interface serial命令开始,分析它的屏幕输出报告内容,找出问题之所在。串口报告的开始提供了该接口状态和线路协议状态。接口和线路协议的可能组合有以下几种:
(1)串口运行、线路协议运行,这是完全的工作条件。该串口和线路协议已经初始化,并正在交换协议的存活信息。
(2)串口运行、线路协议关闭,这个显示说明路由器与提供载波检测信号的设备连接,表明载波信号出现在本地和远程的调制解调器之间,但没有正确交换连接两端的协议存活信息。可能的故障发生在路由器配置问题、调制解调器操作问题、租用线路干扰或远程路由器故障,数字式调制解调器的时钟问题,通过链路连接的两个串口不在同一子网上,都会出现这个报告。
(3)串口和线路协议都关闭,可能是电信部门的线路故障、电缆故障或者是调制解调器故障。
(4)串口管理性关闭和线路协议关闭,这种情况是在接口配置中输入了shutdown命令。通过输入no shutdown命令,打开管理性关闭。接口和线路协议都运行的状况下,虽然串口链路的基本通信建立起来了,但仍然可能由于信息包丢失和信息包错误时会出现许多潜在的故障问题。正常通信时接口输入或输出信息包不应该丢失,或者丢失的量非常小,而且不会增加。如果信息包丢失有规律性增加,表明通过该接口传输的通信量超过接口所能处理的通信量。解决的办法是增加线路容量。查找其他原因发生的信息包丢失,查看show interface serial命令的输出报告中的输入输出保持队列的状态。当发现保持队列中信息包数量达到了信息的最大允许值,可以增加保持队列设置的大小。
2.以太接口故障排除
以太接口的典型故障问题是:带宽的过分利用;碰撞冲突次数频繁;使用不兼容的��类型。使用show interface ethernet命令可以查看该接口的吞吐量、碰�H冲突、信息包丢失、和��类型的有关内容等。
(1)通过查看接口的吞吐量可以检测网络的利用。如果网络广播信息包的百分比很高,网络性能开始下降。光纤网转换到以太网段的信息包可能会淹没以太口。互联网发生这种情况可以采用优化接口的措施,即在以太接口使用no ip route-cache命令,禁用快速转换,并且调整缓冲区和保持队列。
(2)两个接口试图同时传输信息包到以太电缆上时,将发生碰�H。以太网要求冲突次数很少,不同的网络要求是不同的,一般情况发现冲突每秒有3、5次就应该查找冲突的原因了。碰�H冲突产生拥塞,碰�H冲突的原因通常是由于敷设的电缆过长、过分利用、或者“聋”节点。以太网络在物理设计和敷设电缆系统管理方面应有所考虑,超规范敷设电缆可能引起更多的冲突发生。
(3)如果接口和线路协议报告运行状态,并且节点的物理连接都完好,可是不能通信。引起问题的原因也可能是两个节点使用了不兼容的��类型。解决问题的办法是重新配置使用相同��类型。如果要求使用不同��类型的同一网络的两个设备互相通信,可以在路由器接口使用子接口,并为每个子接口指定不同的封装类型。
(二)配置故障
逻辑故障中的最常见情况是配置错误,也就是指因为网络设备的配置错误而导致的网络异常或故障。
1、路由器逻辑故障
路由器逻辑故障通常包括路由器端口参数设定有误,路由器路由配置错误、路由器CPU利用率过高和路由器内存余量太小等。
排查方法:路由器端口参数设定有误,会导致找不到远端地址。用Ping命令或用Traceroute命令,查看在远端地址哪个节点出现问题,对该节点参数进行检查和修复。
路由器路由配置错误,会使路由循环或找不到远端地址。比如,两个路由器直接连接,这时应该让一台路由器的出口连接到另一路由器的入口,而这台路由器的入口连接另一路由器的出口才行,这时制作的网线就应该满足这一特性,否则也会导致网络错误。该故障可以用Traceroute工具,可以发现在Traceroute的结果中某一段之后,两个IP地址循环出现。这时,一般就是线路远端把端口路由又指向了线路的近端,导致IP包在该线路上往返反复传递。解决路由循环的方法就是重新配置路由器端口的静态路由或动态路由,把路由设置为正确配置,就能恢复线路了。
路由器CPU利用率过高和路由器内存余量太小,导致网络服务的质量变差。比如路由器内存余量越小丢包率就会越高等。检测这种故障,利用MIB变量浏览器较直观,它收集路由器的路由表、端口流量数据、计费数据、路由器CPU的温度、负载以及路由器的内存余量等数据,通常情况下网络治理系统有专门的治理进程,不断地检测路由器的关键数据,并及时给出报警。解决这种故障,只有对路由器进行升级、扩大内存等,或者重新规划网络拓扑结构。
故障与排错
想要明确的给“故障”和“排错”下个定义想来并不是一件容易的事,路由器的“故障”总是多种多样的,造成某种故障现象的原因也是多种多样的。有的场合要迅速地找到故障并加以排除,其要求是相当严格的。有些现象是设备在正常运行中出现故障的,另外一种情况就是当我们在实施某种应用,已经完成了配置,但却得不到预期的效果。我们把解决这些问题的方法叫做排错技术。因为它和路由器的配置是不一样的,所以排错技术需要在维护和管理路由器的过程中慢慢积累才能有所提高。一个系统化的故障处理技术就是合理地一步一步找出故障原因并加以解决。
思路
(1)路由器状态
弄清楚路由器发生故障时处于什么状态,才能进行下一步操作。最直接的方法就是观察路由器上各种指示灯的工作状态,如果你不知道他具体代表什么意思,可以查看相应的用户手册。使用命令行界面和路由器直接对话能够得到更详细的信息,常见的路由器都可以使用“show”或“display”就可以显示路由器当前的工作状态和配置信息。总之弄清状况是一个最基本的要求。
(2)正常情况应该得到什么结果
你首先应该明确你想让路由器做什么,并按照你的想法来配置路由器,以确认路由器应该可以实现什么功能。例如,你应该能ping通指定接口的地址吗?一个广播网上OSPF所有邻居应该是Full吗?在你调试完路由器后应该对这些问题能够正确回答,确认你想要的东西。
(3)可能造成某种错误的原因
回答这个具有挑战性的问题光有勇气是不够的,更需要学识和经验。无论那种错误现象,其原因可能有多种,可能是一种故障,也可能是多种故障叠加。当然,对原因的全面可靠列举,需要对特定网络和设备的状况做全面的了解。你的知识水平和经验在此展露无遗。
(4)排除假象,寻找真凶
对于一个故障,形成它的“原因”会有很多种,但并不意味着所有“原因”都发生问题。所以排除法就是最好的排错选择,我们可以归纳出下面的这种过程框图对它加以回答。
网络环境变得复杂后,病毒攻击已经成为路由器排错和维护不得不考虑的因素。病毒和非法报文通过路由器转发,会占用路由器的大量资源。如果路由器的CPU 使用率过高,数据包丢包率高,你可以断开本地局域网,通过抓包等手段来判断是否有本地攻击的情况发生。根据这些攻击报文的特定在路由器上使用访问控制过滤非法数据包,一般会起到一定的效果。当然,最根本的解决方法是对本地计算机进行彻底地杀毒,但工作量也是巨大的。
Sniffer(嗅探器)是一种常用的收集有用数据方法,这些数据可以是用户的帐号和密码,可以是一些商用机密数据等等。Snifffer可以作为能够捕获网络报文的设备,ISS为Sniffer这样定义:Sniffer是利用计算机的网络接口截获目的地为其他计算机的数据报文的一种工具。Sniffer的正当用处主要是分析网络的流量,以便找出所关心的网络中潜在的问题。例如,假设网络的某一段运行得不是很好,报文的发送比较慢,而我们又不知道问题出在什么地方,此时就可以用嗅探器来作出精确的问题判断。
四、无线网络的故障
基于IEEE 802.11标准的WLAN逐渐进入主流网络,使得针对无线网络的故障诊断和安全保障变得与有线网络一样重要。
支持多种模式的分析仪可以扫描所有802.11频段,包括2.4GHz和5GHz频段中的所有通道,并以图形化的形式显示,从这些图表中可以查看配置是否合理、SNR信噪比是多少、可以利用的带宽会有多少及其他相关问题。如果某个AP出现突出流量,可能是因为有很多客户端正在通过这个AP上网;另一方面,也可能是某种特别的应用或协议正在大量占用带宽。技术人员携带无线分析仪可以搜索“发送流量最多者”,快速判断是否有MP3下载、BT下载等应用,这些在无线网络中是需要禁止的应用。
当一个无线网络发生问题时,你应该首先从几个关键问题入手进行排错。一些硬件的问题会导致网络错误,同时错误的配置也会导致网络不能正常工作。以下介绍一些无线网络排错的方法和技巧。
硬件排错
当只有一个接入点以及一个无线客户端出现连接问题时,我们可能会很快的找到出有问题的客户端。但是当网络非常大时,找出问题的所在可能就不是那么容易了。
在大型的无线网络环境中,如果有些用户无法连接网络,而另一些客户却没有任何问题,那么很有可能是众多接入点中的某个出现了故障。一般来说,通过察看有网络问题的客户端的物理位置,你就能大概判断出是哪个接入点出现问题。当所有客户都无法连接网络时,问题可能来自多方面。如果你的网络只使用了一个接入点,那么这个接入点可能有硬件问题或者配置有错误。另外,也有可能是由于无线电干扰过于强烈,或者是无线接入点与有线网络间的连接出现了问题。
检查接入点的可连接性
要确定无法连接网络问题的原因,首先需要检测一下网络环境中的电脑是否能正常连接无线接入点。简单的检测方法是在你的有线网络中的一台电脑中打开命令行模式,然后ping无线接入点的IP地址,如果无线接入点响应了这个ping命令,那么证明有线网络中的电脑可以正常连接到无线接入点。如果无线接入点没有响应,有可能是电脑与无线接入点间的无线连接出现问题,或者是无线接入点本身出现了故障。要确定到底是什么问题,你可以尝试从无线客户端ping无线接入点的IP地址,如果成功,说明刚才那台电脑的网络连接部分可能出现了问题,比如网线损坏。
如果无线客户端无法ping到无线接入点,那么证明无线接入点本身工作异常。你可以将其重新启动,等待大约五分钟后再通过有线网络中的电脑和无线客户端,利用ping命令察看它的连接性。
如果从这两方面ping无线接入点依然没有响应,那么证明无线接入点已经损坏或者配置错误。此时你可以将这个可能损坏了的无线接入点通过一段可用的网线连接到一个正常工作的网络,你还需要检查它的TCP/IP配置。之后,再次在有线网络客户端ping这个无线接入点,如果依然失败,则表示这个无线接入点已经损坏。这时你就应该更换新的无线接入点了。
配置问题
无线网络设备本身的质量一般还是可以信任的,因此最大的问题根源一般来自设备的配置上,而不是硬件本身。知道了这一点,我们下面就来看看几种常见的由于错误配置而导致的网络连接故障。
测试信号强度
如果你可以通过网线直接ping到无线接入点,而不能通过无线方式ping到它,那么基本可以认定无线接入点的故障只是暂时的。如果经过调试,问题还没有解决,那么你可以检测一下接入点的信号强度。虽然对于我们来说,还没有一个标准的测量无线信号强度的方法,但是大多数无线网卡厂商都会在网卡上包含某种测量信号强度的机制。无线路由器的位置摆放不当是造成信号微弱的直接原因。解决办法很简单:第一、放置在相对较高的位置上;第二、摆放的放置与接收端不应间隔较多水泥墙壁;第三、尽量放置在使用端的中心位置。
试试改变频道
如果经过测试,你发现信号强度很弱,但是最近又没有做过搬移改动,那么可以试着改变无线接入点的频道并通过一台无线终端检验信号是否有所加强。由于在所有的无线终端上修改连接频道是一项不小的工程,因此你首先应该在一台无线终端上测试,证明确实有效后才可以大面积实施。有时候无线网络的故障可能由于一个很细微的动作而突然好转,例如关断手机。
检验SSID
不久前,我带着我的笔记本去朋友家工作。由于朋友家也采用了无线网络,因此我决定连接到他的网络。回到家后,我并没有再用这台笔记本。过了两周,当我再打开笔记本后,发现它无法连接到我的无线网络了。很快我就找到了问题的根源:我忘记重新将服务区标识符(SSID,Service Set Identifier )修改回我自己的网络标识了。记住,如果你的SSID没有正确的指定网络,那么你的笔记本根本不会ping到无线接入点,它会忽略无线接入点的存在,按给定的SSID来搜索对应的接入点。
检验WEP密钥
检查WEP加密设置。如果WEP设置错误,那么你也无法从无线终端ping到无线接入点。不同厂商的无线网卡和接入点需要你指定不同的WEP密钥。比如,有的无线网卡需要你输入十六进制格式的密钥,而另一些则需要你输入十进制的密钥。同样,有些厂商采用的是40位和64位加密,而另一些厂商则只支持128位加密方式。要让WEP正常工作,所有的无线客户端和接入点都必须正确匹配。很多时候,虽然无线客户端看上去已经正确的配置了WEP,但是依然无法和无线接入点通信。在面对这种情况时,我一般都会将无线接入点恢复到出厂状态,然后重新输入WEP配置信息,并启动WEP功能。
DHCP 配置问题
另一个让你无法成功的访问无线网络的原因可能是由DHCP配置错误引起的。网络中的DHCP服务器可以说是你能否正常使用无线网络的一个关键因素。
很多新款的无线接入点都自带DHCP服务器功能。一般来说,这些DHCP服务器都会将192.168.0.x这个地址段分配给无线客户端。而且DHCP接入点也不会接受不是自己分配的IP地址的连接请求。这意味着具有静态IP地址的无线客户端或者从其它DHCP服务器获取IP地址的客户端有可能无法正常连接到这个接入点。
对于这种情况,有两种解决方法:
禁用接入点的DHCP服务,并让无线客户端从网络内标准的DHCP服务器处获取IP地址。
修改DHCP服务的地址范围,使它适用于你现有的网络。
这两种方法都是可行的,不过具体还要看你的无线接入点的固件功能。很多无线接入点都允许你采用其中一种方法,而能够支持这两种方法的无线接入点很少。
多个接入点的问题
设想一下假如有两个无线接入点同时按照默认方式工作。在这种情况下,每个接入点都会为无线客户端分配一个192.168.0.X的IP地址。由此产生的问题是,两个无线接入点并不能区分哪个IP是自己分配的,哪个又是另一个接入点分配的。因此网络中早晚会产生IP地址冲突的问题。要解决这个问题,你应该在每个接入点上设定不同的IP地址分配范围,以防止地址重叠。
结论
  计算机网络技术发展迅速,网络故障也十分复杂,上述概括了常见的几类故障及其排查方法。针对具体的诊断技术,但是具体情况要具体分析,这些经验就需要长期的积累了。建议在网络维护中的还需要注重以下几个方面:
第一,建立完整的组网文档,以供维护时查询。如系统需求分析报告、网络设计总体思路和方案、网路拓扑结构的规划、网络设备和网线的选择、网络的布线、网络的IP分配,网络设备分布等等。
第二,做好网络维护日志的良好习惯,尤其是有一些发生概率低但危害大的故障和一些概率高的故障,对每台机器都要作完备的维护文档,以有利于以后故障的排查。这也是一种经验的积累。
第三,提高网络安全防范意识,提高口令的可靠性,并为主机加装最新的操作系统的补丁程序和防火墙、防黑客程序等来防止可能出现的漏洞
网络发生故障是不可避免的。网络建成运行后,网络故障诊断是网络管理的重要技术工作。搞好网络的运行管理和故障诊断工作,提高故障诊断水平需要注意以下几方面的问题:认真学习有关网络技术理论;清楚网络的结构设计,包括网络拓朴、设备连接、系统参数设置及软件使用;了解网络正常运行状况、注意收集网络正常运行时的各种状态和报告输出参数;熟悉常用的诊断工具,准确的描述故障现象。
致谢
在本次毕业设计中,我学到了很多东西。老师认真负责的工作态度,严谨的治学精神和深厚的理论水平都使我收益匪浅。他无论在理论上还是在实践中,都给与我很大的帮助,使我得到不少的提高这对于我以后的工作和学习都有一种巨大的帮助,感谢他耐心的辅导。另外,其它同学也给于我很大的帮助,帮助我解决了不少的难点,使得论文能及时完成,谢谢你们!
参考文献
[1] Eric Maiwald,网络安全基础教程,清华大学出版社,2005年7月.
[2] 尹勇、方宝红,网络组建、维护与故障处理300问,电子工业出版社,2005年4月.
[3] 远望图书部,网络医院,人民交通出版社,2007年1月.
[4] 朱建军、熊兵,网络安全防范手册,人民邮电出版社,2007年7月.
[5] 李福亮,网络故障现场处理实践,电子工业出版社,2007年3月.
[6] 刘晓辉,网管从业宝典―故障排除经典案例,重庆大学出版,2007年4月.
[7] 成兴,网络入侵防范的理论与实践,机械工业出版社,2006年9月.
[8] 姚福亮,网络安全完全解决方案,电子工业出版社,2003年1月.
[9] 谢科青、冷健、熊伟,计算机网络安全技术教程,机械工业出版社,2007年1月.
[10]【美】Robert J.Shimonski,Sniffer Pro 网络优化与故障检修手册,电子工业出版社,2005年9月
附件清单
该系统的程序设计源代码、安装及运行说明、用户操作手册及其他软件文档见光盘。
 

你可能感兴趣的