网络故障排除(通用9篇)
现代网络的复杂多样性, 对网络维护人员来说, 能够正确地维护网络, 并确保出现故障之后能够迅速、准确地定位问题并排除故障是一个很大的挑战。排除网络故障要求我们对网络协议和技术有着深入的理解, 更重要的是在排除故障的过程中遵循一个系统的方法, 将一个复杂的问题隔离、分解或缩减排错范围。从而修复网络。即故障排除系统化。
故障排除系统化是合理地地、一步一步找出故障原因, 并解决故障的总体原则。它的基本思想是系统的, 将可能的故障原因所构成的一个大集合缩减成几个小的子集, 从而使问题的复杂度迅速下降。可以遵循如下的流程进行。
1、确定问题确定现象, 定位问题。当分析网络故障时, 首先要清楚故障现象。应该详细说明故障的症状和潜在的原因。为此, 要确定故障的具体现象, 然后确定造成这种故障现象的原因的类型。这一步的目的是搜集有助于查找故障原因的更详细的信息。
2、收集因素使用工具进行相关测试, 并向用户、网络管理员、管理者和其他关键人物提一些和故障有关的问题。广泛的从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。这一步的目的是确定“真正的”和“全部的”问题是什么。
3、考虑可能原因通过集中思考缩小问题的可能性, 根据收集到的情况考虑可能的故障原因。可以根据有关情况排除某些故障原因。这一步的目的是确定问题和什么有关。
4、创建计划根据最后的可能的故障原因, 建立一个诊断计划。开始仅用一个最可能的故障原因进行诊断活动, 这样可以容易恢复到故障的原始状态。确定为解决问题已经做了什么。采用分割解决问题的方法。将可能的原因列出来, 每次仅变更一个变量, 这样看出它引起的变化。确定任何特殊的资源需求, 对可能性进行排序。这样可以从最有可能的解决方案开始。
5、执行计划逐步执行计划, 一次只改变一个因素, 测量结果;总是保持一个回滚计划。确保不让情况更糟或增加另外的问题。
6、测试结果确定永久的解决了问题还是执行了一个临时方案。如果没有解决问题, 执行行动计划的下一项。总是在重复过程或准备执行下一个计划前撤消以前的改变。
7、记录记录每一步和最终的解决方案, 以提高自己支持网络的能力。在实践的应用中, 对网络所有的问题或故障进行记录, 如果要解决的问题以前发生过, 并且曾经记录过, 那么解决问题就比较简单。下面介绍一个排除故障的实例, 使用系统的方法排除故障。
在拓扑图中的网络中, 用户主机A无法访问FTP服务器。
解决方案:
1.确定问题:主机A无法登陆FTP服务器。
2.收集因素:收集事实的过程要求询问许多关于用户和设备的问题。只要具有系统的方法论, 在收集事实时, 就能够对问题分开对待。在问题中, 主机A不能登陆FTP服务器, 首先可以通过主机APING或TRACERT网络的FTP和WEB服务器。若PING不成功, 就可以测试源和目的之间的物理层、数据链路层/网络层。若PING成功, 就可以在网络层以上测试。具体收集的结果如下:
A.主机A可以PING通主机B、R1的E0口、FTP和WEB服务器, 以及172.16.4.0上的所有主机。
B.主机A可以TRACERT拓扑图中的本地网络和远程网络上的所有主机。
C.主机A和主机B不能登陆FTP和WEB服务器。
D.其它远程主机和路由器能够登陆FTP和WEB服务器。
3.考虑可能原因:缩小事实和可能性。问题为主机A不能登陆FTP服务器。因为其它远程主机能够登陆FTP服务器, 所以问题不在FTP服务器上。因为主机A可以PING通FTP服务器, 所以问题不在物理层和数据链路层。问题更像是网络172.16.1.0脱离了R1。
4. 创建计划:从最可能的的原因开始, 一次只改变一个变量, 尽可能的缩小问题的范围。因为网络172.16.1.0中的所有主机都受到影响, 根据上一步的判断R1是很有可能的目标。行动计划应该对R1进一步的调查。记录下将要进行的每一步操作。
5. 执行计划:查看R1的相关信息。发现设备的路由没有问题, 而在控制列表中发现如下信息:
访问控制列表中有主机A无法登陆FTP服务器的原因。通过进一步的检查发现控制列表别应用在R1的S0口的出方向上。删除掉这个控制列表进行下一步测试, 看问题是否解决。在本例中, 删除掉控制列表后, 主机A能够登陆FTP服务器了。但是, 在此, 不能根据控制列表完全了解这个网络的访问控制需求, 所以, 需要和相关人员沟通了解网络需求再制定新的控制列表。既新的问题:根据需求制定访问控制。收集事实:除主机C (IP:172.16.1.13) 不能登陆FTP服务器, 外其它主机能够登陆FTP服务器, 同时允许所有主机可以PING和TRACERT其他网络。因为已经知道是需要修改控制列表, 所以制定行动计划:在R1上创建新的控制列表。
说明:FTP服务器地址为172.16.3.13/24
把新的控制列表应用起来, 遵循对源端附近进行数据过滤, 把控制列表放在E0上:
6. 观察结果:
对新的控制列表进行测试, 确定主机A和主机B可以PING通并登陆FTP服务器。确保主机C可以PING和TRACERT但无法登陆FTP服务。解决了问题并且没有产生新的问题。另外, 保存配置并且记录发现的东西。
7. 记录解决过程:
记录整个问题的解决过程, 为以后处理问题提供参考。
上述论文是讲述使用系统的方法来排除网络故障, 当然, 除使用上述流程来排除网络故障外还有很多其它方法。不管采用什么模型/方法, 只要采用系统的步骤都可以缩小问题范围。最后分析并解决问题。
摘要:网络故障排除不能去猜测和主观臆测, 遵循一个系统的方法对故障排除非常重要。
关键词:排除故障,解决方法,OSI,模型,流程图,拓扑图
参考文献
Network Security Principles and Practices Saadat Malik人民邮电出版社2003年8月出版
Routing TCP/IP VolumeⅠ, Second Edition Jeff Doyle, Jen-nifer Carroll人民邮电出版社2007年1月出版
【关键词】网络故障 硬件 软件 排除方法
【中图分类号】TP393【文献标识码】A【文章编号】1672-5158(2013)02-0376-01
新疆巴音郭楞电视台组建了多套小型局域网,规模都不是很大,有索贝的媒资新闻制作网和老的对等制作网等,也遇见了很多网络问题,但由于网络协议和网络设备的复杂性,许多故障解决起来也绝非像解决单机故障那么简单,当网络遭遇故障时,最困难的不是修复网络故障本身,而是如何迅速地查出故障所在,并确定发生的原因。对于我们广电技术人员来说,首先要有一个清晰的排障思路,另外,经验也是非常重要的。
虽然网络的故障原因多种多样,但总是以某种症状表现出来,而故障症状包括一般性症状和较特殊的症状,我们应该对每一个症状都能使用特定的故障诊断工具或者方法来查找出一个或多个故障原因。
首先要确定故障的具体现象,然后确定造成这种故障现象的原因和类型。例如,某台单机访问其他的工作站时提示网速从千兆掉到百兆,有时甚至到10兆。首先观察网络是联通的,观察网卡闪烁也正常,替换一根其他正常的网线网速正常为千兆,用此根网线连接其他的工作站,工作也正常,据此怀疑是水晶头不匹配的原因造成,但重新制作水晶头后依然有此现象,后发现使用的此类水晶头都有此类问题,用千兆网络经常掉到百兆的带宽,甚至有时直接会断网。在此提醒大家千兆的网络对水晶头的要求很高,不要去选择那些质量没有保证的水晶头。这是硬件不合格造成的网络故障却不容易发现,我们也是在多次的故障查找中才发现此类问题。又如,某次单位停电,我台制作机房安装了UPS系统,但由于操作人员的失误造成切回市电时瞬间断路后又开始送电,造成网络中心机房服务器全部重启,后经检查发现媒资出入库系统出现问题,多次重新启动软件后也无法恢复,经向厂家询问后发现在媒资系统的设备管理器中用户管理的设备有问题,本来是两个用户管理两个迁移设备,但断电重启后造成用户管理设备重复,无法正确管理设备,造成迁移无法正常进行,后对多余的用户进行删除后恢复正常。这提示我们,有时看着是硬件的问题却可能造成软件的故障,我们应该对整个系统必须准确的了解和把握,这样才能发现问题的关键,从而顺利的解决问题。
其次,收集对于可能造成故障原因的信息,向使用者、网络管理员、管理者和其他关键人物提出一些和故障有关的问题。例如,在对等网中新安装了某台工作站的杀毒软件后,其他机器都无法访问此单机,提示无权使用网络资源。出现此问题后,因安装杀毒软件不是网管本人安装,此前网络正常,安装后才出现此问题,但网管本人并不知情,经询问相关制作人员和部门领导,怀疑是杀毒软件的问题,经检查后发现杀毒软件屏蔽了其他所有的网络用户的访问权限,通过禁用网络监控功能后恢复正常,这提醒我们在重新安装杀毒软件或其他应用软件时,一定要注意看它是否对网络等资源进行监控,是否禁用了某些功能,这也会导致网络出现异常。
第三,根据收集到的各类情况考虑可能的故障原因。可以根据有关情况排除某些故障原因。例如,在内部的对等网中连接了多台交换机,某几台机器总是有时能连通,有时无法访问其他的机器,由于此网络是台内自己建设连接的,考虑的只是能共享资源即可,连接时也没有使用三层交换机,只是简单的把交换机用网线连接了起来,结果造成网络中多台机器无法共享,后通过检查,把交换机的连接线改为了不交叉的双绞线接法,尽量少的级联交换机后,基本能保证正常的使用,这就进一步提醒我们,对网络连通的问题应尽量先从硬件开始,在硬件确定没有问题后再去考虑软件的问题。
第四,根据最后可能的故障原因,建立一个诊断计划或者还原办法,尤其是对最可能的网络故障原因进行诊断和处理,这样可以更容易修复网络的故障。例如:网络中某台单机怀疑中了病毒,我们图省事直接通过系统还原恢复了系统,这之后此单机可正常连接网络,但到了第二天还是无法连接,提示网络重名。当笔者看到此提示时,才想起使用的还原文件是其他单机的GHOST文件,还原后只改了本机的IP地址,没有改变本地计算机名导致的错误,后修改了本地计算机名后才恢复正常。这提醒我们,在还原系统时一定要注意一些细节,这样才能使网络达到稳定的运行。
第五,执行诊断计划,认真做好每一步测试和观察,直到故障症状消失。例如,我台索贝非编制作网中的外网文稿系统出现错误,无法登陆文稿系统。检查此单机文稿系统,发现登陆外网打开网页基本正常,仅登陆文稿提示出错,检查网线连接也都正常,后经系统还原仅正常了两天后又出现此问题,经询问索贝工程师,建议我们重新安装系统,然后再安装软件后恢复正常。这提示我们,连接外网的电脑应关闭系统的自动更新功能,由网管统一进行系统更新,因为在系统自动更新的过程中,可能会破坏专业软件所要求的系统环境,从而导致网络无法连接。
第六,每改变一个参数都要确认其结果,分析结果确定问题是否可以解决,如果没有解决,继续下去,直到解决。例如,我台索贝非编制作网在上载节目时总是出现屏幕闪绿,经检查信号源在非编端输出的信号无问题,视频信号没有闪绿,此时怀疑是播出系统的上载机采集卡有问题,换了一台没有问题的上载机后问题依旧,检查视频线后,传送的信号也没有问题,这难住了我们,后咨询播出系统的厂家询问此问题,厂家明确告诉我们可能是两套机器电源不共地的问题,在模拟信号的表现是有网纹干扰,而数字SDI的信号表现就是闪绿,我们调整了电源,两套系统接地改为相同后此现象消失。这提示我们在一个机房有多套电源系统时,对不共地的现象要保持高度的注意,因为这种现象不仅对视音频信号有干扰,对网络信号的连接也会造成影响。
在日新月异的现代生活中,“网事”如风,上网已成了当代人生活的主流.在网络中出现的各种各样的故障,也给人们带来了不少烦恼,往往解决一个复杂的网络故障需要广泛的网络知识与丰富的.工作经验.下面,我们根据网络故障的性质不同把网络故障分为物理故障与逻辑故障,以日常所见问题为例,分类列述解决方案,相信对网络爱好者及网络管理人员有一定的帮助.
作 者:田照俊 作者单位:信阳师范学院,464000 刊 名:计算机时代 英文刊名:COMPUTER ERA 年,卷(期): “”(2) 分类号: 关键词:
通过无线路由器进行无线上网,已经变得逐步普及起来;不过,在无线上网的过程中,我们常常会遭遇到各式各样的网络故障,这些网络故障严重影响了正常的上网效率。事实上,我们只要在平时加强排查,及时总结各种常见网络故障的排除经验,相信日后我们一定能成为一名管理无线网络的行家里手!
排查连接线路,解决只发不收故障
查看无线网络连接状态信息时,我们有时会看到无线网络可以对外发送信息,但无法从外部接收信息,这种单向通信的方式显然会影响我们正常的无线访问操作。当不幸遭遇到无线网络单向通信的麻烦时,我们可以按照如下思路进行逐一排查:
首先要保证无线网络连接线路处于通畅状态。在查看线路是否处于连通状态时,我们可以先打开IE浏览器,并在弹出的浏览窗口地址栏中输入路由器默认使用的IP地址(该地址一般能够从路由器的操作说明书中查找到),之后正确输入路由器登录帐号,打开路由器的后台管理界面;接着在该管理界面中执行ping命令,来ping一下本地Internet服务商提供的DNS服务器地址,要是目标地址能够被ping通的话,那就表明路由器设备到Internet服务商之间的线路连接处于畅通状态,要是目标地址无法被ping通的话,那说明路由器内部的部分参数可能没有设置正确,这时我们就必须对路由器内部的配置参数进行一下逐一检查。
在确认路由器内部配置参数都正确的前提下,我们可以在局域网中找一台网络配置正确、上网正常的工作站,并在该工作站中执行ping命令,来来ping一下路由器使用的IP地址,要是该地址可以被正常ping通的话,那就意味着局域网内部的线路连接也处于畅通状态,要是 ping不通路由器使用的IP地址时,那我们就有必要检查本地工作站使用的网络参数与路由器使用的网络参数是否相符合,也就是说它们的地址参数是否处于同一网段内。要是上面的各个地址都能被顺利ping通,但无线网络连接仍然处于只发不收的状态时,那我们不妨重点检查一下本地工作站的DNS参数以及网关参数设置是否正确,在确认这些参数正确后,我们还需要再次进入到路由器后台管理界面,从中找到NAT方面的参数设置选项,并检查该选项配置是否正确;在进行这项参数检查操作时,我们重点要检查一下其中的NAT地址转换表中是否有内部网络地址的转译条目,要是没有的话,那无线网络连接只发不收故障多半是由于 NAT配置不当引起的,这时我们只要将内部网络地址的转译条目正确添加到NAT地址转换表中就可以了。
排查连接方式,解决间歇断网故障
在本地局域网通过无线路由器接入到Internet网络中的情形下,要是局域网中的工作站经常出现一会儿能正常上网、一会儿又不能正常上网的故障现象时,我们首先需要确保工作站与无线路由器之间的上网参数一定要正确,在该基础下就应该重点检查无线路由器的连接方式是否设置得当。通常情况下,无线路由器设备一般能支持三种或更多种连接方式,不过默认状态下多数无线路由器设备会使用“按需连接,在有访问数据时自动进行连接”这种连接方式,换句话说就是每隔一定的时间无线路由器设备会自动检测此时是否有线路空载,要是成功连接后该设备并没有侦察到线路中有数据交互动作的话,它将会把处于连通状态的无线连接线路自动断开。为此,当我们在实际上网的过程中,经常遇到间歇断网故障现象时,我们可以尝试进入到无线路由器后台管理设置界面,找到连接方式设置选项,并查看该选项的参数是否已经被设置为了“自动连接,在开机和断线后进行自动连接”,要是不正确的话,必须及时将连接方式修改过来,最后在后台管理界面中执行保存操作,将前面的参数修改操作保存成功,最后重新启动一下无线路由器设备,相信这样多半能解决无线网络间歇断网故障。
当然,通过上面的设置仍然不能解决间歇断网故障现象时,我们需要检查一下本地无线局域网中是否存在网络病毒攻击,因为一旦ARP网络受到病毒非法攻击的话,也有可能出现间歇断网故障;此时我们不妨在本地工作站系统中,打开本地连接属性设置窗口,然后进入到网卡设备的属性设置界面,在该界面中尝试修改一下网卡使用的IP地址,看看在新的IP地址条件下,间歇断网故障是否还能出现,要是该故障继续出现的话,我们一定要借助专业的抗病毒攻击的工具软件来保护无线局域网了。
排查连接位置,解决上网迟钝故障
根据网络故障的性质可以把网络故障分为物理故障与逻辑故障, 也可以根据网络故障的对象把网络故障分为线路故障、路由故障和主机故障。
一、物理故障
物理故障, 一般是指网络线路或网络设备损坏、插头松动、线路受到严重电磁干扰等情况。
(一) 网络线路故障
在日常网络维护工作中, 网络线路出现故障的机率是非常高的, 约占所发生故障的60%-70%。网络线路故障通常包括线路损坏及线路受到严重电磁干扰等情况。
诊断与排除方法:首先Ping 127.0.0.1来检查本机网卡和网络协议工作是否正常;如果正常, 则Ping同一网段里其他连网正常的机器, 测试连通性, 如果不能连通, 则检查网络线路。如果通信线路比较短, 判断网线好坏的最简单的方法是将该网络线一端插入一台确定能够正常连入局域网的主机的RJ45插座内, 另一端插入确定正常的交换机端口, 然后从主机的一端Ping线路另一端的主机或路由器, 根据是否连通来判断网络线路是否正常。如果网络线路较长, 或者网线不方便移动, 用网线测试仪器测量网线的好坏。如果本局网所有计算机到外网的线路都不通, 确认是连接外网的通信线路出问题, 就需通知ISP检查线路, 看是否是通向外网的线路某点被切断。
对于是否存在严重电磁干扰的排查, 我们可以用屏蔽较强的屏蔽线在该段网络线路上进行通信测试, 如果通信正常, 则表明存在电磁干扰, 但要远离高压电线等电磁场较强的物件。如果网络故障仍然存在, 则应排除线路故障而考虑从其他方面查找故障原因。
(二) 端口故障
端口故障通常包括接头松动和端口本身的物理故障, 这是最常见的硬件故障, 无论是光纤端口还是双绞线的RJ-45端口, 在插拔接头时一定要小心。如果不小心把光纤插头弄脏, 可能导致光纤端口污染而不能正常通信。如果购买的水晶头尺寸偏大, 插入交换机时, 也容易破坏端口。此外, 如果接在端口上的双绞线有一段暴露在室外, 万一这根电缆被雷电击中, 就会导致所连交换机端口被击坏, 或者造成更加不可预料的损伤。
诊断与排除方法:此类故障往往可以首先通过观察信号灯的状态大致判断出故障的发生范围和最可能的原因。在排除了端口所连计算机的故障后, 可以通过更换所连端口, 来判断其是否损坏。遇到此类故障, 可以在电源关闭后, 用电脑清洗液清洗端口。如果端口确实被损坏, 那就只能更换端口了。
(三) 交换机或路由器故障
交换机或路由器故障在此是指物理损坏, 无法工作, 导致网络不通。
诊断与排除方法:通常最简易的方法是替换排除法, 如果一个交换机上连接的所有用户都无法正常通信, 首先应判断交换机可能出现故障, 用工作正常的交换机替换, 如果网络恢复正常, 则确定交换机出现故障。如果一个交换机上有个别或者少数几个用户不能正常通信, 应查找端口或线路故障, 用正常的端口来替换故障用户的端口, 如网络恢复正常则确定端口出现故障。如果路由器所连接的整个网段无法正常通信, 首先查看路由器配置, 如果配置正常, 则查看路由器指示灯, 判断发生故障的可能原因。如果仍然无法查找故障原因, 可以用好的路由器替换, 如果网络恢复正常, 则判定路由器出现故障。
(四) 网卡和主机故障
网卡是主机和网络设备连接的桥梁, 网卡多装在主机内的扩展槽中, 靠主机完成配置和通信。网卡松动, 网卡物理故障, 主机的网卡插槽故障和主机本身故障都会造成网络不通。
诊断与排除方法:有些场合, 主机经常移动位置, 网线经常插拔, 很容易造成网卡松动, 只需将网卡从新插紧就可以解决问题。如果网卡插紧后故障仍然存在, 更换网卡插槽, 如果通信正常, 则判定网卡插槽故障。如果更换网卡插槽后仍不能解决问题, 将网卡拿到其他正常工作的主机上测试网卡, 如仍无法工作, 则可以认定是网卡物理损坏, 更换网卡即可。
二、逻辑故障
逻辑故障中的最常见情况是配置错误, 也就是指因为网络设备的配置错误而导致的网络异常或故障。
(一) 网卡和主机逻辑故障
主机逻辑故障所造成网络故障率是非常高的, 通常包括网卡的驱动程序安装不正确、网卡设备有冲突、网络协议或服务安装不正确、网络地址参数设置不正确和主机安全性故障等。
1. 网卡驱动程序安装不正确。
网卡的驱动程序安装不正确, 包括网卡驱动程序未安装或安装了错误的驱动, 都会导致网卡无法正常工作。
诊断与排除方法:在设备管理器窗口中, 检查网卡选项, 看是否驱动安装正常, 若网卡型号前标示出现"!"或"X", 表明此时网卡无法正常工作。解决方法很简单, 卸载错误的驱动程序, 找到正确的驱动程序重新安装即可。
2. 网卡设备有冲突。
网卡设备与主机其它设备有冲突, 也会导致网卡无法工作。
诊断与排除方法:分别查看网卡设置的接头类型、IRQ、I/O端口地址等参数。若有冲突, 只要重新设置 (有些必须调整跳线) , 或者更换网卡插槽, 让主机认为是新设备重新分配系统资源参数, 一般都能使网络恢复正常。
3. 网络协议或服务安装不正确。
网络协议或服务安装不正确也会出现网络无法连通。主机安装的协议必须与网络上的其它主机相一致, 否则就会出现协议不匹配, 无法正常通信, 还有一些服务如"文件和打印机共享服务", 不安装会使自身无法共享资源给其他用户, 再如"网络客户端服务", 不安装会使自身无法访问网络其他用户提供的共享资源等。
诊断与排除方法:在网上邻居属性或在本地连接属性窗口查看所安装的协议是否与其他主机是相一致的, 如TCP/IP协议, NetBEUI协议和IPX/SPX兼容协议等。其次查看主机所提供的服务的相应服务程序是否已安装, 如果未安装或未选中, 请注意安装和选中之。注意有时需要重新启动电脑, 所安装的协议和服务才可以正常工作。
4. 网络地址参数配置错误。
主机的网络地址参数配置错误是常见的主机逻辑故障。比如, 主机配置的IP地址与其他主机冲突, IP地址参数中的IP、子网掩码、网关、DNS中有一个或者几个参数出现错误, 这都将导致该主机不能连通。
诊断与排除方法:查看网络邻居属性中的连接属性窗口, 查看TCP/IP选项中IP地址、子网掩码、网关和DNS等参数是否符合要求, 也可以用Ipconfig/all网络命令查看各项参数。如果参数不正确, 进行重新配置。
5. 主机安全性故障。
主机故障的另一种可能是主机安全故障。通常包括主机资源被盗、主机被黑客控制、主机系统不稳定等。
诊断与排除方法:主机资源被盗, 主机没有控制其上的finger, RPC, rlogin等服务。攻击者可以通过这些进程的正常服务或漏洞攻击该主机, 甚至得到管理员权限, 进而对磁盘所有内容有任意复制和修改的权限。还需注意的是, 不要轻易的共享本机硬盘, 因为这将导致恶意攻击者非法利用该主机的资源。
主机被黑客控制, 会导致主机不受操纵者控制。通常是由于主机被安置了后门程序所致。发现此类故障一般比较困难, 一般可以通过监视主机的流量、扫描主机端口和服务、安装防火墙和加补系统补丁来防止可能的漏洞。
主机系统不稳定, 往往也是由于黑客的恶意攻击, 或者主机感染病毒造成。通过杀毒软件进行查杀病毒, 排除病毒的可能。或重新安装操作系统, 并安装最新的操作系统的补丁程序和防火墙、防黑客软件和服务来防止可能的漏洞的产生所造成的恶性攻击。
(二) 路由器逻辑故障
路由器逻辑故障通常包括路由器端口参数设定有误, 路由器的路由配置错误、路由器CPU利用率过高和路由器内存余量太小等。
诊断与排除方法:路由器端口参数设定有误, 会导致找不到远端地址。用Ping命令或用Traceroute命令, 查看在远端地址哪个节点出现问题, 对该节点参数进行检查和修复。
路由器路由配置错误, 会使路由循环或找不到远端地址。此类故障可以用Traceroute工具, 可以发现在Traceroute的结果中某一段之后, 两个IP地址循环出现。这时, 一般就是线路远端把端口路由又指向了线路的近端, 导致IP包在该线路上来回反复传递。解决路由循环的方法就是重新配置路由器端口的静态路由或动态路由, 把路由设置为正确配置, 就能恢复线路了。
(三) 一些重要进程或端口关闭
一些有关网络连接数据参数得重要进程或端口受系统或病毒影响而导致意外关闭, 此类故障也不在少数。比如, 路由器的SNMP进程意外关闭, 这时网络管理系统将不能从路由器中采集到任何数据, 因此网络管理系统失去了对该路由器的控制。或者线路中断, 没有流量;或者交换机的端口意外关闭或阻塞, 导致通信中断。
诊断与排除方法:Ping线路近端的端口看是否能Ping通, Ping不通时检查该端口是否处于down的状态, 若是down状态说明该端口已经给关闭了, 因而导致故障。如果端口状态没有关闭, 但是是阻塞状态, 端口也无法正常通信, 这时只需重新启动该端口, 就可以恢复线路的连通。
三、结束语
网络发生故障是不可避免的。网络建成运行后, 网络故障诊断是网络治理的重要技术工作。针对具体的诊断技术, 总体来说是遵循先软后硬、先局部再整体的原则, 但是具体情况要具体分析, 有些很容易就能判定故障原因, 有些还需要借助工具来测试才能判定故障原因, 这些经验就依赖于您长期的经验积累了。
摘要:随着网络技术的不断发展, 信息传输量的不断加大, 计算机网络的故障也越来越多, 故障情况也十分复杂。网络故障诊断和排除是管好、用好网络, 使网络发挥最大作用的重要技术工作之一。本文主要对网络常见故障的诊断和排除进行阐述。
关键词:网络故障,故障诊断,物理故障,逻辑故障
参考文献
[1].Greg Tomsho.网络维护和故障诊断指南[M].北京:清华大学出版, 2003.
[2].Robert J.shimonski网络优化及故障检修[M].北京:电子工业出版社, 2004.
[3].Stephen J.Bigelow计算机网络故障排除与维护实用大全[M].北京:中国铁道出版社, 2006.
【摘要】网络故障极为普遍,网络故障的种类也多种多样,要在网络出现故障时及时对出现故障的网络进行维护,以最快的速度恢复网络的正常运行,掌握一套行之有效的网络维护理论、方法和技术是关键。就网络中常见故障进行分类,并对各种常见网络故障提出相应的解决方法。
【关键词】网络故障 网络维护 分类 解决办法
【中图分类号】TP393 【文献标识码】A 【文章编号】1672-5158(2013)01—0147-01
随着计算机的广泛应用和网络的日趋流行,功能独立的多个计算机系统互联起来,互联形成日渐庞大的网络系统。计算机网络系统的稳定运转已与功能完善的网络软件密不可分。计算机网络系统,就是利用通讯设备和线路将地理位置不同的、信息交换方式及网络操作系统等共享,包括硬件资源和软件资源的共享:因此,如何有效地做好本单位计算机网络的日常维护工作,确保其安全稳定地运行,这是网络运行维护人员的一项非常重要的工作。
在排除比较复杂网络的故障时,我们常常要从多种角度来测试和分析故障的现象,准确确定故障点。
一、分析模型和方法
(一)七层的网络结构分析模型方法
从网络的七层结构的定义和功能上逐一进行分析和排查,这是传统的而且最基础的分析和测试方法。这里有自下而上和自上而下两种思路。自下而上是:从物理层的链路开始检测直到应用。自上而下是:从应用协议中捕捉数据包,分析数据包统计和流量统计信息,以获得有价值的资料。
(二)工具型分析方法
工具型分析方法有强大的各种测试工具和软件,它们的自动分析能快速地给出网络的各种参数甚至是故障的分析结果,这对解决常见网络故障非常有效。
(三)综合及经验型分析方法靠时间、错误和成功经验的积累
在大多数的阿络维护工作人员的工作中是采用这个方法的,再依靠网管和测试工具迅速定位网络的故障。
二、计算机无法上网故障排除
1、对于某台联网计算机上不了网的故障,首先要分别确定此计算机的网卡安装是否正确,是否存在硬件故障,网络配置是否正确在实际工作中我们一般采用Ping本机的回送地址(127.0.0.1)来判断网卡硬件安装和TCP/IP协议的正确性。
如果能Ping通,即说明这部分没有问题。如果出现超时情况,则要检查计算机的网卡是否与机器上的其它设备存在中断冲突的问题。通过查看系统属性中的设备管理器,查看是否在网络适配器的设备前面有黄色惊叹号或红色叉号,如有则说明硬件的驱动程序没有安装成功,可删除后重新安装。另外,要确保TCP/IP协议安装的正确性,并且要绑定在你所安装的网卡上。如果重新安装后还是Ping不通回送地址,最好换上一块正常的网卡试一试。
当确保了计算机的硬件设备和网络配置正确后,接着就要查看计算机与交换机之间的双绞线,交换机的RJ45端口或交换机的配置是否有问题。此时我们要Ping上网计算机所在VLAN的网关,不通的话就要分段检查上面所说的各项。
最简单的方法是检查双绞线,用线缆测试仪检测双绞线是否断开。双绞线没有问题,就要查看交换机的端口是否坏了。交换机每一个端口都有状态指示灯以询问一下其它网管人员就可以排除了,如果不放心可以对照查看。交换机的参数配置表也是网络管理员必备的资料之一,并且随着网络用户的变化要不断地修改,检测到此,如果端口指示灯不亮,就只能是端口损坏了,可以把跳线接到正常使用的端口上排除其它原因,确定是端口的问题。
2、一批联网计算机上不了网对于同时有一批计算机上不了网的故障,首先要找到这些计算机的共性,如是不是属于同一VLAN或接在同一交换机上的,若这些计算机属于同一VLAN,且属于计算机分别连接于不同的楼层交换机,那么检查一下路由器上是否有acl限制,在路由器上对该VLAN的配置是否正确,路由协议(如我局的OSPF协议)是否配置正确。若这些计算机属于同一交换机,则应到机房检查该交换机是否有电源松落情况,或该交换机CPU负载率是否很高,与上一级网络设备的链路是否正常。
通常某交换机连接的所有电脑都不能正常与网内其它电脑通讯,这是典型的交换机死机现象,可以通过重新启动交换机的方法解决。如果重新启动后故障依旧,则检查一下那台交换机连接的所有电脑,看逐个断开连接的每台电脑的情况,慢慢定位到某个故障电脑,会发现多半是某台电脑上的网卡故障导致的。
故障通常是交换机的某个端口变得非常缓慢,最后导致整台交换机或整个堆叠慢下来。通过控制台检查交换机的状态,发现交换机的缓冲池增长得非常快,达到了90%或更多。原因及解决方法为:首先应该使用其它电脑更换这个端口上原来的连接,看是否由这个端口连接的那台电脑的网络故障导致的,也可以重新设置出错的端口并重新启动交换机,个别时候,可能是这个端口损坏了。
三、故障定位及排除的常用方法
(一)告警性能分析法
通过网管获取告警和性能信息进行故障定位。我们单位使用了深信服网络网管,可以对全单位的网络设备进行管理,平时多观察各设备CPU负载率和各线路的流量。当有人反映不能连接至网络或网速很慢时,可通过网管观察计算机与交换机的连接情况,是否有时断时通的现象,交换机CPU负载率是否很高,线路流量是否很大。通过观察设备端口状态,分析和观察交换机哪个端口所接的计算机发包量不太正常。
(二)查看网络设备日志法
经常看一下网络设备的日志,分析设备状况。我曾经通过showlonging命令观察到4006交换机下连的2950交换机经常每隔7小时down掉,然后又up,因时间间隔较长,单位人员未感觉网络中断,在此期间我们检查并确定了光缆、光收发器、网线、交换机配置、交换机端口均正常,后来的间隔时间由原来的7小时减为7分钟。由此我们立即判定2950交换机本身有故障,马上将已准备好的备用交换机换上,从而减少了处理故障的时间,并在最短时间内恢复网络。
(三)替换法
替换法就是使用一个工作正常的物体去替换一个工作不正常的物体,从而达到定位故障、排除故障的目的。这里的物件可以是一段线缆、一个设备和一块模块。
(四)配置数据分析法
查询、分析当前设备的配置数据,通过分析以上的配置数据是否正常来定位故障。若配置的数据有错误,需进行重新配置。
四、结束语
计算机网络技术发展迅速,网络故障也十分复杂,本文介绍了常见的几类故障及其维护方法。为了在网络出现故障时及时对网络进行维护,以最快的速度恢复网络的正常运行,在网络维护中还需要注意以下几个方面:
1、建立完整的组网文档,以供维护时查询。如系统需求分析报告、网络设计总体思路和方案、网路拓扑结构的规划、网络设备和网线的选择、网络的布线、网络的IP分配,网络设备分布等等。
2、做好网络维护日志的良好习惯,尤其是有一些发生概率低但危害大的故障和一些概率高的故障,对每台机器都要作完备的维护文档,以有利于以后故障的排查。这也是一种经验的积累。
3、提高网络安全防范意识,提高口令的可靠性,并为主机加装最新的操作系统的补丁程序和防火墙、防黑客程序等来防止可能出现的漏洞。
参考文献
[1]黄中伟.计算机网络管理与安全技术[M]。北京:人民邮电出版社,2007
故障现象:有一块硕泰克主板,使用两年多后突然点不亮了,表现为当打开电源开关后,电源风扇,cpu风扇都在转,但是光驱,硬盘没有反映,等上几分钟后机子才能加电启动,启动后一切正常,重新启动也没有问题,但是一关闭电源,再开就要象上面一样等上几分钟。开始以为是电源问题,替换后故障依旧。更换主板后一切正常,说明是主板有问题。板子是笔者的一个朋友的,所以让笔者检查一下,看能不能修。
故障排除:从故障现象分析,主板在加上电后可以正常工作,说明主板芯片是好的,问题可能出在主板的电源部分上。但是电源风扇和CPU风扇可以运转正常,说明总的供电正常。加电运行几分钟后断电,经闻无异味,手摸电源部分的电子元件(主要是电容,电感,电源稳压IC),发现CPU旁的几个电容,电感温度极高。
大家知道,电解电容长期在高温下工作会造成电解质变质,从而容量会变化。所以笔者初步判断是这两个电容有问题。找到了故障,于是我立刻就赶到电子市场去买采购元件。并仔细的将损坏的电容焊下,将新买回来的电容重新焊上去。
焊好了电容,笔者没有装CPU,先加电试,试了几分钟,温度正常。于是加上CPU,加电,屏幕立刻就亮了。于是我多试了几次,并注意了电容的温度。电容的温度正常,但是从加电到点亮比正常情况好象慢了几秒,估计还有其它的电容有问题,于是仔细检查,发现一个4500F电容也有些变质。为了彻底排除问题,于是跑到市场中买回一个同型号的电容,将其更换上去。开机测试,这样连续拷机几个小时都没有出现问题,到此就算是修好了!一块主板几百元,而两个电容才2元,所以维修是相当有价值的。
故障总结:一般情况下如果主板出现了问题,大部分原因便是主板上的部分电容老化或损坏,因此我们在维修时可以先从检查电容入手,仔细排查,最终找到问题根源。另外,需要提醒大家的是,由于我们在排除电容老化时最直接的方法是用手检查电容的温度,而电子元件就怕静电,因此在用手接触主板上的电容元器件时,一定要先彻底的放掉身上的静电,最直接的方法便是洗手或用手接触金属,有条件的可以带防静电腕环。
二、主板防病毒未关闭,导致系统无法安装
故障现象:一台老Celeron配置的机器,在安装Windows98时,发现在安装初始阶段屏幕上突然出现一个黑色矩形区域,像是有什么提示,随后就停止安装了,
调整显示器亮度和对比度开关也无效,感觉和病毒有关。用杀毒软件查杀病毒,并没有发现任何病毒。
故障排除:这类故障一般情况下是由于某些配件发热量过大所造成的,打开机箱仔细检查,并没有发热量过大的现象。看来电脑的硬件没有问题。会不会机器中毒了呢?在DOS下利用最新的杀毒软件对电脑进行全面杀毒后再次安装系统,故障依旧。
会不会是主板的病毒防侵功能在做怪了,于是查看主板的使用说明,发现这款主板的确具备这一功能。进入了CMOS设置程序,将BIOSFeaturesSetup(BIOS功能设置)中的VirusWarning(病毒警告)选项由Enabled(允许)设置成Disabled(禁止)后,重装Windows98获得成功。
故障分析:此现象比较容易出现在新购主板中,因为它们的BIOS中的防病毒设置大多默认设置为Enabled,所以会出现无法安装系统的问题。此问题严格地讲,不应算主板故障。但往往许多用户不是很注意,导致频频发生。www.pcpxp.com供稿
三、主板温控失常引发主板假死
故障现象:笔者采用的是华硕的主板,由于华硕的主板上有智能监控芯片,可对CPU温度进行监视,于是在购该主板时,另购了一根2Pin的温度监控线,插于CPU插槽旁的JTP针脚上。后来在一次玩游戏过程中,机器突然蓝屏,重启后等到光驱、硬盘自检完后显示器居然不亮了。由于之前报告蓝屏错误,起初以为是内存出错,后来更换内存后依然无效
这到底是怎么回事呢?于是笔者按照最小硬件排除法,将光驱、主板、硬盘等一一取下更换后进行测试,结果还是无济于事。是不是CPU烧毁了呢?于是笔者又开始怀疑CPU故障,借来朋友的一块CPU换了再试,故障依旧。难道是主板有毛病了,百般无奈下,笔者重点开始检查主板,突然发现原来接在主板上的温控线脱落,掉在主板上难道是温度监控线导致的故障吗?重新连接温度监控线后,再开机居然一切正常了。
风力发电机组故障排除
伴随着风机种类和数量的增加,新机组的不断投运,旧机组的不断老化,风机的日常运行维护也是越来越重要。现在就风机的运行维护作一下探讨。
一.运行风力发电机组的控制系统是采用工业微处理器进行控制,一般都由多个CPU并列运行,其自身的抗干扰能力强,并且通过通信线路与计算机相连,可进行 远程控制,这大大降低了运行的工作量。所以风机的运行工作就是进行远程故障排除和运行数据统计分析及故障原因分析。
1.远程故障排除风机的大部分故障都可以进行远程复位控制和自动复位控制。风机的运行和电网质量好坏是息息相关的,为了进行双向保护,风机设置了多重保护 故障,如电网电压高、低,电网频率高、低等,这些故障是可自动复位的。由于风能的不可控制性,所以过风速的极限值也可自动复位。还有温度的限定值也可自动 复位,如发电机温度高,齿轮箱温度高、低,环境温度低等。风机的过负荷故障也是可自动复位的。除了自动复位的故障以外,其它可远程复位控制故障引起的原因 有以下几种:
(1)风机控制器误报故障;
(2)各检测传感器误动作;
(3)控制器认为风机运行不可靠。
2.运行数据统计分析对风电场设备在运行中发生的情况进行详细的统计分析是风电场管理的一项重要内容。通过运行数据的统计分析,可对运行维护工作进行考核 量化,也可对风电场的设计,风资源的评估,设备选型提供有效的理论依据。每个月的发电量统计报表,是运行工作的重要内容之一,其真实可靠性直接和经济效益 挂钩。其主要内容有:风机的月发电量,场用电量,风机的设备正常工作时间,故障时间,标准利用小时,电网停电,故障时间等。风机的功率曲线数据统计与分 析,可对风机在提高出力和提高风能利用率上提供实践依据。例如,在对国产化风机的功率曲线分析后,我们对后三台风机的安装角进行了调节,降低了高风速区的 出力,提高了低风速区的利用率,减少了过发故障和发电机温度过高故障,提高了设备的可利用率。通过对风况数据的统计和分析,我们掌握了各型风机随季节变化 的出力规律,并以此可制定合理的定期维护工作时间表,以减少风资源的浪费。
3.故障原因分析我们通过对风机各种故障深入的分析,可以减少排除故障的时间或防止多发性故障的发生次数,减少停机时间,提高设备完好率和可利用率。如对 150kW风机偏航电机过负荷这一故障的分析,我们得知有以下多种原因导致该故障的发生,首先机械上有电机输出轴及键块磨损导致过负荷,偏航滑靴间隙的变 化引起过负荷,偏航大齿盘断齿发生偏航电机过负荷,在电气上引起过负荷的原因有软偏模块损坏,软偏触发板损坏,偏航接触器损坏,偏航电磁刹车工作不正常 等。又如,在对Jacobs系列风机控制电压消失故障分析中,我们采用排除实验法,将安全链当中有可能引起该故障的测量信号元件用信号继电器和短接线进行 电路改造,最终将故障原因定位在过速压力开关的整定上,将该故障的发生次数减少,提高了设备使用率,减少了闸垫的更换次数,降低了运行成本。
二.维护风力发电机是集电气、机械、空气动力学等各学科于一体的综合产品,各部分紧密联系,息息相关。风力机维护的好坏直接影响到发电量的多少和经济效益 的高低;风力机本身性能的好坏,也要通过维护检修来保持,维护工作及时有效可以发现故障隐患,减少故障的发生,提高风机效率。风机维护可分为定期检修和日 常排故维护两种方式。
1.风机的定期检修维护定期的维护保养可以让设备保持最佳期的状态,并延长风机的使用寿命。定期检修维护工作的主要内容有:风机联接件之间的螺栓力矩检查(包括电气连接),各传动部件之间的润滑和各项功能测试。风机在正常运行中时,各联接部件的螺栓长期运行在各种振动的合力当中,极易使其松动,为了不使其 在松动后导致局部螺栓受力不
广州绿欣风力发电机提供更多绿色环保服务请登录查询
现象一:声音能够正常播放,但是会不时的传出“噼哩叭啦”的噪音。
朋友反映他的电脑使用耳机时没有其他杂音,只是使用音箱时会不定期地发出“噼哩叭啦”的噪音,有时时间长一些,有时时间短一些,然后就正常。刚开始也怀疑是音频信号插头接触不好,但是也重新拔插过,换过线还是没有解决问题。他把音箱拿到我家试用了一下,发觉一点问题都没有,声音很正常。比较前后的差别,只有插座不一样。这时我突然想起,我办公室里的电源插座,因为质量不好,接触不牢,电压一会儿强一会儿弱,总导致台灯一会儿亮,一会儿暗。由此推断的话,我怀疑是朋友家的电源插座质量低劣,内部使用的磷铜片质量不好,弹性差。长时间使用后导致接触不好,一会儿接触一会儿断开,这时音箱的电源就一会儿通,一会断。因为电源内部有大容量的滤波电容,就导致功放电路的供电电压一会高一会低,声音的强弱就有明显变化。同时,因为在通断的瞬间会有电流通断的干扰信号窜入放大电路,从而导致了其他噪音的出现。
解决办法:更换新的质量优良的电源插座。
小编按:碰上类似问题时,如果自己不能判断,最好也是请熟悉的朋友来帮忙看一下,如果贸然拿出去维修,很多奸商都会借口说音箱修好了,然后趁机收钱。
现象二:声音能够正常播放,但是如果调整重低音)时,喇叭时就会传出“霹雳啪啦”的噪音,根本没法忍受。
有时候一些音箱在使用时会有“霹雳啪啦”的杂音,特别是旋转重低音旋钮时,情况会更加严重。因为是旋转BASS旋钮引起的,可以肯定是BASS电位器损坏。大多数音箱的音量调节和重低音调节,都使用的是电位器来改变信号的强弱,除了新出的数字调音的电位器。电位器是通过一个活动触点改变在碳阻片上的位置来改变电阻值的大小。随着使用时间的增长,电位器内会有灰尘或杂质落入,电位器的触点也可能会氧化生锈,造成接触不实,这时在调整音量是就会有“霹雳啪啦”的噪音出现。
解决办法:对于这种问题处理起来很简单,更换一个新的电位器就可以,花费不会超过2元钱。不过,最简单的处理办法,就是打开机箱,把电位器后面的四个压接片打开,取下电位器的活动触点,用无水酒精清洗碳阻片,再在碳阻片上滴一滴机油,把电位器按原来位置装好就可以解决噪音问题。此外,也可以自己检查音箱的左右声道的簧片是不是分离的,有时候簧片错位,也会造成这种“霹雳啪啦”的噪音。我们只要用尖嘴镊子轻轻拔正,再按原位装回就可以了。如果是调整音量时有类似的噪音,也可按此法修理。
现象三:声音播放正常,但是一个喇叭声音大,一个喇叭声音小。如果用手向一侧用力掰音量电位器,这时两个声道的音量就一样大。
这例故障类似第二种,也是音量电位器的问题。因为音量电位器左右声道是各自独立的。因为簧片使用时间过久,其中内侧的簧片弹性过弱,不能与碳阻片紧密接触。
解决办法:依据上述办法,将电位器的共地端连通,即可排除故障。
现象四:打开音箱的电源开关,喇叭没有正常开机时应该发出的轻微“砰”的一声开机声。打开MP3播放器,调整音量,音箱也没有任何声音。
这种故障比较常见,开机后音箱没有声音。我们应该如何判断音箱是不是真的坏了呢?首先,在给音箱加电之前,把音量旋钮开到最大位置,在打开电源开关时,注意音箱是否有“砰”的一声。如果有,就说明音箱没有什么问题,电源是好的,没有声音可能是声卡的驱动程序错误,也可能是被静音了或音量过小,再者就是信号线插头没有插接好,或者信号线断线。当然,这种故障还有更复杂的情况,那就是音箱内部温度过高,造成了音箱内的电源变压器的温度保险烧毁了。
解决方法:针对以上各种情况,我们可以采取相应的措施。如果是声卡的驱动程序有问题,那我们可以去网上下载一个最新的驱动程序,比如驱动之家(http://www.mydrivers.com),根据你的声卡品牌和型号去下载相应的最新驱动,然后在控制面板→系统→硬件→设备管理器中点击声卡选择“更新驱动程序”,按提示操作即可。现在大部分的驱动程序都是以可执行文件形式发布的,下载完之后只需直接执行就可以替换原来的驱动程序了,更加省事;如果是静音或者是音量过小,只需在控制面板→声音和音频设备中将静音去除或者调大音量即可;如果是信号线的问题,那么更加简单了,重新插一下,或者是重新购买一根信号线插上即可;如果是电源变压器的温度保险熔断了,那么可以拆开音箱后盖,然后取出变压器,将外层的初级线圈凸出的那个地方外面的塑料薄膜拆开,会看见一个白色的小方块,这就是温度保险电阻,你可以把这个保险电阻的两端直接短路即可了,不过这样一来就要在使用中注意散热,不要使用时间过长了,要不然,你就得拿到外面的维修点去更换一个这样的保险电阻,才几块钱而已。
现象五:一开机,就“嗡嗡”直响,无论怎么调整音量,噪音都不能消除。
这种情况一般都是因为长时间使用,再加上音箱是封闭的,热量散不出去,内部温度过高,造成功放集成块过热而损坏。实际上,正品的功放集成电路都带有温度保护功能,当过热时,功放集成电路会自动停止输出,当温度降下来后,能够自动恢复工作。但是一些音箱生产厂家为了降低生产成本,使用的不是大厂家名牌的集成电路,而使用的是一些小厂仿制的集成电路,质量低劣。
【网络故障排除】推荐阅读:
排除路由器网络故障10-19
无线网络故障实例分析11-28
投影机常见故障排除法11-25
天然气汽车常见故障及排除流程图05-30
浅谈计算机网络维护及故障处理方法10-18
电梯故障通告06-19
内存故障07-15
道岔故障07-19
电路故障11-10
基站故障分析11-18