CN102638375A - 一种网络故障识别方法及装置 - Google Patents

一种网络故障识别方法及装置 Download PDF

Info

Publication number
CN102638375A
CN102638375A CN201210126809XA CN201210126809A CN102638375A CN 102638375 A CN102638375 A CN 102638375A CN 201210126809X A CN201210126809X A CN 201210126809XA CN 201210126809 A CN201210126809 A CN 201210126809A CN 102638375 A CN102638375 A CN 102638375A
Authority
CN
China
Prior art keywords
equipment
confirm
network failure
peripheral equipment
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210126809XA
Other languages
English (en)
Inventor
王川江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Star Net Ruijie Networks Co Ltd
Original Assignee
Beijing Star Net Ruijie Networks Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Star Net Ruijie Networks Co Ltd filed Critical Beijing Star Net Ruijie Networks Co Ltd
Priority to CN201210126809XA priority Critical patent/CN102638375A/zh
Publication of CN102638375A publication Critical patent/CN102638375A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供一种网络故障识别方法及装置,包括:在接收到第一设备第一端口下线事件时确定产生了网络故障,并根据第一设备第一端口下线事件触发对网络故障的分析。在分析时,根据网络拓扑关系,对第一端口连接的第二设备进行连通性检测,在判断出该第二设备处于连通状态时,确定该网络故障的根源为第一设备第一端口与第二设备之间的连接链路,而在判断出该第二设备处于不连通状态时,确定该网络故障的根源为第二设备。从而在发生端口下线告警事件时,根据网络拓扑关系,针对指定设备进行故障分析,无需针对全部告警事件进行故障分析,也无需针对全网链路进行故障分析,可以有效提高网络故障识别速度,并可以节约系统资源。

Description

一种网络故障识别方法及装置
技术领域
本发明涉及通信领域,尤其涉及一种网络故障识别方法及装置。
背景技术
随着计算机网络技术的快速发展,以及互联网(Internet)和内联网(Intranet)的日益普及,人们越来越多地依赖网络处理日常工作和事务。一旦网络故障不能及时修复,可能带来很大损失,甚至造成灾难性后果。如何使所维护的网络尽量不出现故障,出现故障之后迅速、准确地定位并排除故障,对网络维护和网络管理来说是很大的挑战。
在一个大型网络中,如果某一设备A发生故障,可能会伴随其他多个设备也发生故障,而这些其他设备发生的故障是由于设备A故障而产生的不同表象,解决了设备A的故障,则这些其他设备的故障将随之消除。因此,网管系统需要进行网络故障识别,从而分辨出根源网络故障是设备A产生的,其他设备产生的故障为衍生网络故障,实现网络故障的准确定位,并可以根据定位出的根源网络故障进行故障排除。
一般的,网管系统可以通过设备轮询方式,如,可以通过手动触发或定义计划任务的方式,对网络中的每个设备进行轮询检查。根据对轮询得到的告警事件进行分析来识别网络故障。当然,网管系统也可以接收网络设备主动上报的告警事件(陷阱报文(TRAP)事件),通过对TRAP事件的分析进行网络故障识别。
随着网络规模的逐渐庞大,网络设备上报给网管系统的告警事件数量也急巨上升,网管系统需要从众多的告警事件中分辨关键的告警事件来准确识别网络故障中的根源网络故障。若发生网络故障,网管系统会在几乎同一时刻,收到大量的告警事件,需要占用网管系统大量的时间和资源去分析、筛选告警事件,从中获取核心的告警事件,以便进行根源网络故障准确识别。且通过轮询方式得到告警事件需要网管系统进行轮询,存在消耗系统资源的问题,并由于轮询方式存在轮询周期,必然会导致网络故障识别的及时性受到影响。
现有的网络故障识别方法中,不管网管系统是主动轮询获得告警事件还是被动接收设备推送的TRAP事件,网络故障分析方法主要包括以下两种:
(1)预先定义告警事件相关性规则或告警事件关联库。在本方法中,可以对告警事件之间的关联关系预先设置。如可以预先设置告警事件A与告警事件B存在父子关系。将预先设置的告警事件之间的关联关系保存到告警事件树中,当产生一个告警事件时,根据告警事件树可以分析得到相关联的告警事件,并可以分析得出根源网络故障和衍生网络故障。
(2)基于全网链路的分析方法。本方法主要通过全网链路遍历,根据所有链路设备节点上的告警事件,分析得到告警事件关联及网络故障根源等等。
针对第一种方法,该方法的缺点是,告警事件相关性规则或告警事件关联库预置不灵活,只适用于单个设备告警问题,对复杂多变的网络环境无法适用。例如,配置了设备A为设备C的下联设备,如果发现设备C宕机,则可以推导得到设备A无法连通,但如果网络环境发生了变化,设备A不再为设备C的下联设备,但由于配置的告警事件相关性规则或告警事件关联库未发生改变,会造成设备A的告警误报的问题。
针对第二种方法,该方法的缺点是,全网遍历链路消耗系统资源,网络故障分析速度慢。
发明内容
本发明实施例提供一种网络故障识别方法及装置,用于提高网络故障识别的速度,并节约系统资源。
一种网络故障识别方法,所述方法包括:
接收第一设备推送的第一设备第一端口下线事件;
根据网络拓扑关系确定第一设备第一端口连接的第二设备,通过连通性检测判断所述第二设备的状态;
在通过连通性检测判断所述第二设备处于连通状态时,确定根源网络故障为第一设备第一端口与第二设备之间的连接链路产生的,在通过连通性检测判断所述第二设备处于不连通状态时,确定根源网络故障为第二设备产生的。
一种网络故障识别装置,所述装置包括:
接收模块,用于接收第一设备推送的第一设备第一端口下线事件;
识别模块,用于根据网络拓扑关系确定第一设备第一端口连接的第二设备,通过连通性检测判断所述第二设备的状态,在通过连通性检测判断所述第二设备处于连通状态时,确定根源网络故障为第一设备第一端口与第二设备之间的连接链路产生的,在通过连通性检测判断所述第二设备处于不连通状态时,确定根源网络故障为第二设备产生的。
根据本发明实施例提供的方案,可以在接收到第一设备第一端口下线事件时确定产生了网络故障,并根据第一设备第一端口下线事件触发对网络故障的分析。在分析时,根据网络拓扑关系,对第一设备第一端口连接的第二设备进行连通性检测,在判断出该第二设备处于连通状态时,确定该网络故障的根源为第一设备第一端口与第二设备之间的连接链路,而在判断出该第二设备处于不连通状态时,确定该网络故障的根源为第二设备。根据本方案,可以在发生端口下线告警事件时,根据网络拓扑关系,针对指定设备进行故障分析,由于无需针对全部告警事件进行故障分析,也无需针对全网链路进行故障分析,因此,可以有效提高网络故障识别速度,并可以节约系统资源。同时,由于本方案通过接收到的设备主动推送的告警事件触发网络故障分析,无需进行设备故障轮询,还可以进一步减少由于主动轮询造成的系统资源占用,并消除由于轮询周期的存在造成的网络故障识别的及时性受到影响的问题。
附图说明
图1为本发明实施例一提供的网络故障识别方法的步骤流程图;
图2为本发明实施例二提供的网络拓扑示意图;
图3为本发明实施例二提供的网络故障识别方法的步骤流程图;
图4为本发明实施例三提供的网络故障识别装置的结构示意图。
具体实施方式
基于拓扑图的网络可视化管理方式由于能直观地反映网络的拓扑结构,为设备管理、故障管理,网络性能监控等方面提供了可视化的展现方法。在拓扑图上可以展示网络中真实存在的网络设备以及网络设备之间的连接,并可以呈现网络设备的异常状况(告警)、链路上的流量信息和异常状况(例如链路中断)等信息。当前网络拓扑图仅用来展示告警或其他信息,未充分使用网络拓扑关系来分析告警的关联性。随着拓扑发现算法的不断完善,拓扑链路发现越来越准确,通过拓扑链路关系来分析网络故障的条件已经具备。本发明实施例就是提供了一种基于拓扑链路关系来分析网络故障的方法。
下面结合说明书附图和各实施例对本发明方案进行说明。
实施例一、
本发明实施例一提供一种网络故障识别方法,该方法的步骤流程可以如图1所示,包括:
步骤101、接收告警事件。
在本实施例中,可以实时监控网络中的告警事件,在接收到端口下线(DOWN)事件时,确定产生了网络故障,并触发对网络故障的分析来识别网络故障。因此,本步骤可以包括,接收第一设备推送的第一设备第一端口下线事件。
在本步骤中,接收设备主动推送的告警事件,而不是通过系统轮询的方式获得告警事件,能够及时发现告警事件,从而使得后续能够及时识别、排除网络故障。
且在本步骤中,针对设备端口下线告警事件进行网络故障分析,可以避免针对全部告警事件进行网络故障分析导致的网络故障识别复杂度高、速度慢、系统资源占用严重的问题。
步骤102、确定下线端口关联设备。
在本步骤中,可以根据网络拓扑关系确定第一设备第一端口连接的第二设备,从而后续可以通过对第二设备的状态检测,确定网络故障的根源。
当然,由于本步骤需要利用网络拓扑关系确定下线端口连接的第二设备,必然在本步骤之前已经建立了网络拓扑关系。较优的,在本实施例中,可以在步骤101之前,构建网络拓扑关系。具体的,可以利用拓扑发现技术构建网络拓扑关系,拓扑发现技术可以是通过路由表确认三层链路关系,和/或通过交换机(或网桥)的媒体连接控制(MAC,Media Access Control)地址转发表确认二层链路关系。则在本步骤中,可以根据构建的网络拓扑关系来确定下线端口连接的第二设备。
当然,由于网络拓扑关系可能发生变化,例如,网络中新加入一个设备,因此,构建网络拓扑关系可以是周期性进行,或者是在满足设定条件时进行的。通过不断更新的网络拓扑关系,可以提高构建的网络拓扑关系的准确性,从而提高网络故障识别的准确性。
步骤103、确定根源网络故障。
在本步骤中,可以通过连通性检测判断所述第二设备的状态,并可以根据该状态确定网络故障的根源。其依据为:由于第一设备可以发送告警事件,因此,第一设备没有发生不连通的故障。而由于第一设备第一端口为下线状态,如果第二设备可以连通,则说明必然是第一设备第一端口与第二设备之间的连接链路出现了故障,且该连接链路即为网络故障的根源,此时可以跳转执行步骤105。而如果第二设备无法连通,则可以确认是第二设备发生了故障,且第二设备即为网络故障的根源,此时可以继续执行步骤104。
因此,可以在通过连通性检测判断所述第二设备处于连通状态时,确定根源网络故障为第一设备第一端口与第二设备之间的连接链路产生的,在通过连通性检测判断所述第二设备处于不连通状态时,确定根源网络故障为第二设备产生的,从而实现根源网络故障的识别。
进一步的,在确定根源网络故障之后,可以生成告警事件(可以标识为根源告警)。即在本实施例中,即使部分告警事件没有产生,也可以确定根源网络故障,并可以推导生成告警事件,从而无需在该部分告警事件生成后,根据该部分告警事件来确定根源网络故障,进一步提高网络故障识别的及时性。
步骤104、确定衍生网络故障。
如果确定第二设备发生了故障,则可以继续确定受第二设备故障影响,发生故障的设备,即可以继续确定网络中发生的衍生网络故障。
在本步骤中,可以根据网络拓扑关系确定第二设备连接的周边设备,所述周边设备可以理解为位于第二设备周围的设备,通过连通性检测判断每个所述周边设备的状态,根据该状态确定该周边设备是否产生了衍生网络故障,从而实现衍生网络故障的识别。具体的,可以在该周边设备处于不连通状态时,确定该周边设备产生了衍生网络故障,在该周边设备处于连通状态时,确定该周边设备没有产生衍生网络故障。
较优的,为了提高衍生网络故障确定的效率,可以通过以下方式来确定设备是否发生了衍生网络故障:
根据网络拓扑关系确定以第二设备为起点的每条拓扑路径上,与第二设备连接的每个周边设备;
在每条拓扑路径上,按照由近及远与第二设备连接的顺序,依次对每个周边设备进行连通性检测,判断该周边设备是否处于连通状态;
在判断出一个周边设备处于不连通状态时,确定该周边设备产生了衍生网络故障,并继续对下一个周边设备进行连通性检测,否则,在判断出一个周边设备处于连通状态时,确定该周边设备没有产生衍生网络故障,停止对下一个周边设备进行连通性检测并确定该拓扑路径上通过该周边设备与第二设备连接的周边设备未产生衍生网络故障。
通过此种方式来确定发生衍生网络故障的设备,如果在每条拓扑路径上检测出处于连通状态的设备,即可以确定第二设备故障不再导致该拓扑路径上的其他设备产生衍生网络故障,可以无需再对该拓扑路径上的未进行连通性检测其他设备进行连通性检测,因此可以无需对第二设备的每个周边设备进行连通性检测,从而进一步减少衍生网络故障识别所需的时间。
当然,针对第一设备通过第一端口与第二设备直接连接的拓扑路径,由于第一设备可以推送告警事件,必然处于连通状态,因此在本实施例中,可以无需对该拓扑路径上的设备进行连通性检测,从而进一步减少衍生网络故障识别所需的时间。
与步骤103类似,本步骤中,在确定衍生网络故障之后,可以生成告警事件(可以标识为衍生告警)。即在本实施例中,即使部分告警事件没有产生,也可以确定衍生网络故障,并可以推导生成告警事件,从而无需在该部分告警事件生成后,根据该部分告警事件来确定衍生网络故障,进一步提高网络故障识别的及时性。
步骤105、确定故障消除。
进一步的,在本实施例中,可以实时监控网络中的告警事件,在接收到端口上线(UP)事件时,确定网络故障消除,此时可以认为通过消除故障使得处于下线状态的端口更新至上线状态。本步骤包括,接收第一设备推送的第一设备第一端口上线事件。根据接收到的第一端口上线事件,确定第一端口下线事件对应的根源网络故障和衍生网络故障消除。
当然,在确定故障消除后,可以清除对应的告警事件。具体的,可以根据网络拓扑关系,对对应的根源网络故障告警事件和衍生网络故障告警事件进行清除,从而减少系统中保存的告警事件的数量,避免告警风暴的产生。
需要说明的是,实施例一中提供的方案,可以通过公有的简单网络管理协议(SNMP,Simple Network Management Protocol)管理信息库(MIB)技术来实现,从而使得实施例一提供的方案具有通用性,不依赖于任何厂商私有的协议和私有的MIB实现,只要网络内的设备实现了标准的MIB,即可以实现本发明实施例一提供的方案,因此本方案还具有适用性广泛的优点。
下面通过实施例二对本发明实施例一的方案进行详细说明。
实施例二、
在本实施例中,需要构建网络拓扑图,通过设备自动发现,网络拓扑发现,构建的网络拓扑图可以如图2所示。针对如图2所示的网络拓扑示意图,本发明实施例二提供一种网络故障识别方法,本方法的执行主体可以理解为网络故障识别装置,该装置可以独立于网络拓扑中的设备,也可以位于网络拓扑中的一个正常工作的设备上,该方法的步骤流程可以如图3所示,包括:
步骤201、接收告警事件。
在本步骤中,可以实时监控网络中的告警事件,当接收到某设备端口下线(down)事件或某设备端口上线(UP)事件时,启动告警分析。
在接收到某设备端口下线事件(下面以下线端口为设备D的D1端口为例进行说明)时,继续执行步骤202;
在接收到某设备端口上线事件时,跳转执行步骤205;
步骤202、确定下线端口关联设备。
在下线端口为设备D的D1端口时,根据如图2所示的网络拓扑关系,可以确定D1端口连接的第二设备为设备C。
步骤203、确定根源网络故障。
在本步骤中,可以通过连通性检测判断设备C的状态,在通过连通性检测判断设备C处于连通状态时,确定根源网络故障为第一设备第一端口与第二设备之间的连接链路产生的(即D1-C1链路),在通过连通性检测判断设备C处于不连通状态时,确定根源网络故障为设备C产生的。
如果确定根源网络故障为设备C产生的,可以继续执行步骤204,否则,可以跳转执行步骤205。
步骤204、确定衍生网络故障。
根据网络拓扑关系,以设备C为起点的拓扑路径为4条,本实施例中,可以不对设备C、设备D所在的拓扑路径上的设备进行连通性检测。因此,可针对设备C为起点的其他3条拓扑路径进行故障识别。
首先,可以确定与设备C直接连接的设备包括设备A,设备B,设备E(连接链路分别为C3-A1、C4-B1、C2-E1)。
然后,可以通过连通性检测,逐个判断设备A、设备B,设备E的连通状态。在设备A、设备B,设备E中存在处于不连通状态的设备时,沿该设备与设备C所在拓扑路径,继续按照由近及远与设备C连接的顺序,依次通过连通性检测,判断该拓扑路径上其他设备的连通状态,直到在该拓扑路径上检测到处于连通状态的设备。例如,在判断出设备E处于不连通状态时,继续判断设备F是否处于连通状态,如果设备F处于不连通状态,继续判断设备B是否处于连通状态。并可以确定处于不连通状态的设备产生了衍生网络故障。否则,在设备A、设备B,设备E均处于连通状态时,可以确定没有设备受到设备C的故障影响,均没有产生衍生网络故障。
当然,考虑到不同拓扑路径上可能存在相同的设备,为了进一步提高故障识别的效率,还可以保存针对每个设备的连通性检测结果,在设定时长内可以无需对该设备进行重复的连通性检测,而可以根据保存的连通性检测结果来判断该设备的连通状态。
以针对设备C、设备B所在的拓扑路径上的设备进行连通性检测为例,如果对设备B进行连通性检测,确定设备B连通,说明设备B无故障,即可以确定设备C的故障不会影响设备B,不会使得设备B产生衍生故障。如果确定设备B不连通,则可确定设备B受到设备C故障影响无法连通,产生了衍生故障,并可以产生设备B不连通的告警事件,该告警事件可以标识为衍生告警。
步骤205、确定故障消除。
如果接收到某设备端口上线事件(即该设备端口从下线状态更新为上线状态),此时,可以确定该设备端口下线事件对应的故障消除。并可以清除对应的告警事件。具体的,可以根据网络拓扑关系,查找对应的告警事件并清除。该告警事件可以是根据该端口的下线事件推导得到并生成的,当然,该告警事件也可以是设备由于该端口的下线事件自动生成的。
与本发明实施例一和实施例二基于同一发明构思,提供以下的装置。
实施例三、
本发明实施例三提供一种网络故障识别装置,该装置的结构可以如图4所示,包括:
接收模块11用于接收第一设备推送的第一设备第一端口下线事件;识别模块12用于根据网络拓扑关系确定第一设备第一端口连接的第二设备,通过连通性检测判断所述第二设备的状态,在通过连通性检测判断所述第二设备处于连通状态时,确定根源网络故障为第一设备第一端口与第二设备之间的连接链路产生的,在通过连通性检测判断所述第二设备处于不连通状态时,确定根源网络故障为第二设备产生的。
所述装置还包括拓扑构建模块13:
拓扑构建模块13用于在接收模块接收第一设备推送的第一设备第一端口下线事件之前,利用拓扑发现技术构建网络拓扑关系。
识别模块12还用于根据网络拓扑关系确定第二设备连接的周边设备,通过连通性检测判断每个所述周边设备的状态,在该周边设备处于不连通状态时,确定该周边设备产生了衍生网络故障,在该周边设备处于连通状态时,确定该周边设备没有产生衍生网络故障。
识别模块12具体用于根据网络拓扑关系确定以第二设备为起点的每条拓扑路径上,与第二设备连接的每个周边设备,在每条拓扑路径上,按照由近及远与第二设备连接的顺序,依次对每个周边设备进行连通性检测,判断该周边设备是否处于连通状态,在判断出一个周边设备处于不连通状态时,确定该周边设备产生了衍生网络故障,并继续对下一个周边设备进行连通性检测,否则,在判断出一个周边设备处于连通状态时,确定该周边设备没有产生衍生网络故障,停止对下一个周边设备进行连通性检测并确定该拓扑路径上通过该周边设备与第二设备连接的周边设备未产生衍生网络故障。
接收模块11还用于接收第一设备推送的第一设备第一端口上线事件;识别模块12还用于根据该上线事件,确定所述根源网络故障和所述衍生网络故障消除。
本发明实施例一~实施例三提供的方案基于设备主动发送的端口上线、下线告警事件,可以快速、精确地推导得到根源网络故障及衍生网络故障,解决了网络故障识别不及时、准确性较差的问题。并可以在故障消除时,及时地对冲清除掉对应的告警事件,减少告警事件的数量,减少告警风暴的产生。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种网络故障识别方法,其特征在于,所述方法包括:
接收第一设备推送的第一设备第一端口下线事件;
根据网络拓扑关系确定第一设备第一端口连接的第二设备,通过连通性检测判断所述第二设备的状态;
在通过连通性检测判断所述第二设备处于连通状态时,确定根源网络故障为第一设备第一端口与第二设备之间的连接链路产生的,在通过连通性检测判断所述第二设备处于不连通状态时,确定根源网络故障为第二设备产生的。
2.如权利要求1所述的方法,其特征在于,接收第一设备推送的第一设备第一端口下线事件之前,所述方法还包括:
利用拓扑发现技术构建网络拓扑关系。
3.如权利要求1所述的方法,其特征在于,在确定根源网络故障为第二设备产生的时,所述方法还包括:
根据网络拓扑关系确定第二设备连接的周边设备,通过连通性检测判断每个所述周边设备的状态,在该周边设备处于不连通状态时,确定该周边设备产生了衍生网络故障,在该周边设备处于连通状态时,确定该周边设备没有产生衍生网络故障。
4.如权利要求3所述的方法,其特征在于,根据网络拓扑关系确定第二设备连接的周边设备,具体包括:
根据网络拓扑关系确定以第二设备为起点的每条拓扑路径上,与第二设备连接的每个周边设备;
通过连通性检测判断每个所述周边设备的状态,在该周边设备处于不连通状态时,确定该周边设备产生了衍生网络故障,在该周边设备处于连通状态时,确定该周边设备没有产生衍生网络故障,具体包括:
在每条拓扑路径上,按照由近及远与第二设备连接的顺序,依次对每个周边设备进行连通性检测,判断该周边设备是否处于连通状态;
在判断出一个周边设备处于不连通状态时,确定该周边设备产生了衍生网络故障,并继续对下一个周边设备进行连通性检测,否则,在判断出一个周边设备处于连通状态时,确定该周边设备没有产生衍生网络故障,停止对下一个周边设备进行连通性检测并确定该拓扑路径上通过该周边设备与第二设备连接的周边设备未产生衍生网络故障。
5.如权利要求3或4所述的方法,其特征在于,所述方法还包括:
接收第一设备推送的第一设备第一端口上线事件;
根据该上线事件,确定所述根源网络故障和所述衍生网络故障消除。
6.一种网络故障识别装置,其特征在于,所述装置包括:
接收模块,用于接收第一设备推送的第一设备第一端口下线事件;
识别模块,用于根据网络拓扑关系确定第一设备第一端口连接的第二设备,通过连通性检测判断所述第二设备的状态,在通过连通性检测判断所述第二设备处于连通状态时,确定根源网络故障为第一设备第一端口与第二设备之间的连接链路产生的,在通过连通性检测判断所述第二设备处于不连通状态时,确定根源网络故障为第二设备产生的。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:
拓扑构建模块,用于在接收模块接收第一设备推送的第一设备第一端口下线事件之前,利用拓扑发现技术构建网络拓扑关系。
8.如权利要求6所述的装置,其特征在于,识别模块,还用于根据网络拓扑关系确定第二设备连接的周边设备,通过连通性检测判断每个所述周边设备的状态,在该周边设备处于不连通状态时,确定该周边设备产生了衍生网络故障,在该周边设备处于连通状态时,确定该周边设备没有产生衍生网络故障。
9.如权利要求8所述的装置,其特征在于,识别模块,具体用于根据网络拓扑关系确定以第二设备为起点的每条拓扑路径上,与第二设备连接的每个周边设备,在每条拓扑路径上,按照由近及远与第二设备连接的顺序,依次对每个周边设备进行连通性检测,判断该周边设备是否处于连通状态,在判断出一个周边设备处于不连通状态时,确定该周边设备产生了衍生网络故障,并继续对下一个周边设备进行连通性检测,否则,在判断出一个周边设备处于连通状态时,确定该周边设备没有产生衍生网络故障,停止对下一个周边设备进行连通性检测并确定该拓扑路径上通过该周边设备与第二设备连接的周边设备未产生衍生网络故障。
10.如权利要求8或9所述的装置,其特征在于,
接收模块,还用于接收第一设备推送的第一设备第一端口上线事件;
识别模块,还用于根据该上线事件,确定所述根源网络故障和所述衍生网络故障消除。
CN201210126809XA 2012-04-26 2012-04-26 一种网络故障识别方法及装置 Pending CN102638375A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210126809XA CN102638375A (zh) 2012-04-26 2012-04-26 一种网络故障识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210126809XA CN102638375A (zh) 2012-04-26 2012-04-26 一种网络故障识别方法及装置

Publications (1)

Publication Number Publication Date
CN102638375A true CN102638375A (zh) 2012-08-15

Family

ID=46622628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210126809XA Pending CN102638375A (zh) 2012-04-26 2012-04-26 一种网络故障识别方法及装置

Country Status (1)

Country Link
CN (1) CN102638375A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103986604A (zh) * 2014-05-23 2014-08-13 华为技术有限公司 网络故障定位方法和装置
CN105099734A (zh) * 2014-05-05 2015-11-25 中国移动通信集团山东有限公司 一种故障提示方法及装置
CN106571938A (zh) * 2015-10-09 2017-04-19 腾讯科技(深圳)有限公司 一种基于访问链路的告警检测方法和装置
CN106888131A (zh) * 2017-04-26 2017-06-23 上海优刻得信息科技有限公司 云计算环境下的用户网络问题诊断方法、装置、以及系统
CN107864096A (zh) * 2017-10-31 2018-03-30 新华三技术有限公司 路径调整方法及装置
CN108616423A (zh) * 2018-04-26 2018-10-02 新华三技术有限公司 一种脱网设备监测方法以及装置
CN108737173A (zh) * 2018-05-17 2018-11-02 武汉微创光电股份有限公司 一种网络告警过滤方法及系统
CN109088793A (zh) * 2018-08-20 2018-12-25 北京百度网讯科技有限公司 用于检测网络故障的方法和装置
CN109617760A (zh) * 2018-12-08 2019-04-12 中国科学院长春光学精密机械与物理研究所 一种基于snmp的光电经纬仪状态监测方法和装置
CN112564992A (zh) * 2019-09-25 2021-03-26 中盈优创资讯科技有限公司 基于多重判定的接入网设备脱网判定方法及系统
CN112994910A (zh) * 2019-12-13 2021-06-18 中盈优创资讯科技有限公司 网络端口告警信息的处理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6829641B2 (en) * 1995-11-16 2004-12-07 Peregrine Systems, Inc. Method of determining the topology of a network of objects
CN101697565A (zh) * 2009-10-23 2010-04-21 中兴通讯股份有限公司 故障检测方法和装置
CN101931982A (zh) * 2010-08-18 2010-12-29 北京星网锐捷网络技术有限公司 一种网络故障定位方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6829641B2 (en) * 1995-11-16 2004-12-07 Peregrine Systems, Inc. Method of determining the topology of a network of objects
CN101697565A (zh) * 2009-10-23 2010-04-21 中兴通讯股份有限公司 故障检测方法和装置
CN101931982A (zh) * 2010-08-18 2010-12-29 北京星网锐捷网络技术有限公司 一种网络故障定位方法及装置

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105099734A (zh) * 2014-05-05 2015-11-25 中国移动通信集团山东有限公司 一种故障提示方法及装置
WO2015176603A1 (zh) * 2014-05-23 2015-11-26 华为技术有限公司 网络故障定位方法和装置
CN103986604A (zh) * 2014-05-23 2014-08-13 华为技术有限公司 网络故障定位方法和装置
CN106571938A (zh) * 2015-10-09 2017-04-19 腾讯科技(深圳)有限公司 一种基于访问链路的告警检测方法和装置
CN106888131B (zh) * 2017-04-26 2019-06-28 优刻得科技股份有限公司 云计算环境下的用户网络问题诊断方法、装置、以及系统
CN106888131A (zh) * 2017-04-26 2017-06-23 上海优刻得信息科技有限公司 云计算环境下的用户网络问题诊断方法、装置、以及系统
CN107864096A (zh) * 2017-10-31 2018-03-30 新华三技术有限公司 路径调整方法及装置
CN107864096B (zh) * 2017-10-31 2020-02-14 新华三技术有限公司 路径调整方法及装置
CN108616423B (zh) * 2018-04-26 2020-12-08 新华三技术有限公司 一种脱网设备监测方法以及装置
CN108616423A (zh) * 2018-04-26 2018-10-02 新华三技术有限公司 一种脱网设备监测方法以及装置
CN108737173A (zh) * 2018-05-17 2018-11-02 武汉微创光电股份有限公司 一种网络告警过滤方法及系统
CN109088793A (zh) * 2018-08-20 2018-12-25 北京百度网讯科技有限公司 用于检测网络故障的方法和装置
CN109088793B (zh) * 2018-08-20 2022-02-25 北京百度网讯科技有限公司 用于检测网络故障的方法和装置
CN109617760A (zh) * 2018-12-08 2019-04-12 中国科学院长春光学精密机械与物理研究所 一种基于snmp的光电经纬仪状态监测方法和装置
CN112564992A (zh) * 2019-09-25 2021-03-26 中盈优创资讯科技有限公司 基于多重判定的接入网设备脱网判定方法及系统
CN112994910A (zh) * 2019-12-13 2021-06-18 中盈优创资讯科技有限公司 网络端口告警信息的处理方法及装置

Similar Documents

Publication Publication Date Title
CN102638375A (zh) 一种网络故障识别方法及装置
CN110661669B (zh) 一种基于icmp、tcp、udp协议的网络设备的网络拓扑自动发现方法
US20200106662A1 (en) Systems and methods for managing network health
CN105165054B (zh) 网络服务故障处理方法,服务管理系统和系统管理模块
CN109768880B (zh) 一种面向电力监控系统的网络拓扑远方可视化监测方法
CN101459534B (zh) 一种树状网络的网络拓扑收集方法和网络设备
Lou et al. Mining dependency in distributed systems through unstructured logs analysis
CN108494747B (zh) 数字化变电站流量异常检测方法、电子设备及计算机存储介质
US9369377B2 (en) System analyzer and method for analyzing an impact of a change in a component of a distributed control system
JP4491308B2 (ja) ネットワーク監視方法及びその装置
JP4612525B2 (ja) ネットワーク障害部位特定装置および方法
CN112291075B (zh) 网络故障定位方法、装置、计算机设备及存储介质
CN105183619A (zh) 一种系统故障预警方法和系统
CN110752959A (zh) 一种智能变电站过程层物理链路故障定位系统
CN115150252A (zh) 一种网络故障检测方法、系统及设备
CN102377610B (zh) 简单网络管理协议自动化测试系统及其方法
CN101252477A (zh) 一种网络故障根源的确定方法及分析装置
CN107005440B (zh) 一种链路故障定位的方法、装置及系统
Imran et al. Application-centric recovery algorithm for wireless sensor and actor networks
CN106612213B (zh) 设备测试方法及装置
CN108616423B (zh) 一种脱网设备监测方法以及装置
CN106896792B (zh) 数据同步方法及装置
CN108683517B (zh) 一种基于机器学习的运维机器人网络故障检测系统
US10432451B2 (en) Systems and methods for managing network health
CN112994947A (zh) 一种网络运维方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120815