CN102158360B - 一种基于时间因子因果关系定位的网络故障自诊断方法 - Google Patents

一种基于时间因子因果关系定位的网络故障自诊断方法 Download PDF

Info

Publication number
CN102158360B
CN102158360B CN 201110082515 CN201110082515A CN102158360B CN 102158360 B CN102158360 B CN 102158360B CN 201110082515 CN201110082515 CN 201110082515 CN 201110082515 A CN201110082515 A CN 201110082515A CN 102158360 B CN102158360 B CN 102158360B
Authority
CN
China
Prior art keywords
fault
network
failure
enter step
diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201110082515
Other languages
English (en)
Other versions
CN102158360A (zh
Inventor
魏蛟龙
曹扬
李东皤
罗玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN 201110082515 priority Critical patent/CN102158360B/zh
Publication of CN102158360A publication Critical patent/CN102158360A/zh
Application granted granted Critical
Publication of CN102158360B publication Critical patent/CN102158360B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提出一种基于时间因子因果关系定位的网络故障自诊断方法,实时进行网络状态监控和性能分析,在网络发生故障时,通过时间因子因果关系算法,定位出网络故障点,并提供故障检测机制以及恢复策略的方法。本发明解决了目前网络故障管理中存在的故障现象繁多、种类混杂、原因查找困难等问题,整个诊断流程自动进行,减少了人工干预,简化了以往网络故障诊断需要人工进行大量分析、排查的处理过程,节省了时间,提高了诊断效率。

Description

一种基于时间因子因果关系定位的网络故障自诊断方法
技术领域
本发明涉及计算机网络,特别是涉及一种基于时间因子因果关系定位的网络故障自诊断方法
背景技术
随着Internet的发展和普及,计算机网络已经在社会经济的各个领域发挥着不同的作用。社会经济的快速发展越来越离不开Internet的发展,许多部门和单位都建立了自己的网络,它们对网络的依赖程度日益增高。与此同时,网络的规模日趋扩大,结构也日趋复杂。
正是由于网络规模的扩大和网络在相关领域发挥的重要作用,当网络发生故障或者存在隐患时,如何快速监测到故障并定位出故障源,然后进行诊断分析,得到网络故障发生的原因和恢复的方法,在目前的通信网络中显得极其重要。网络故障自诊断面临的一些问题包括:(1)计算机网络规模越来越大,承载的业务也越来越复杂。大规模的网络故障关系的复杂性导致了故障原因和故障现象之间的对应关系更加模糊,加大了故障诊断的难度;(2)网络设备的复杂性也提高了故障诊断的难度。一是网络设备数量和功能都越来越多;二是设备供应商众多,标准不一;(3)新的数字通信网拥有多种业务,使用了更多的传输技术。这些新的传输技术给网络故障诊断提出了更多的要求。
网络故障诊断应该实现三方面的目的:确定网络的故障点,恢复网络的正常运行;发现网络规划和配置中欠佳之处,改善和优化网络的性能;观察网络的运行状况,及时预测网络通信质量。网络故障诊断一般从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题的根源,排除故障,恢复网络正常运行。
目前大部分网络故障诊断方法都是采用人工排查,或者借助一些计算机网络管理工具,收集网络的相关信息,然后人工分析和解决问题。例如针对硬件故障,可以用ping命令检查一端到另一端的线路连通性;针对路由故障,可以用traceroute命令检查路由配置参数。另外可以使用某些网络管理软件对网络的某些参数进行监控,如网络流量、丢包率等,但是大部分网络管理软件只是提供给用户网络的信息,并不进行故障的检测和诊断,因此仍然需要用户自己进行分析和排查,增加了故障修复的时间,降低了故障诊断效率。
因此,迫切需要设计并开发一种网络故障自诊断方法与系统,实现信息采集、网络状态监控、故障定位、故障检测和故障恢复策略整个流程的自动化和智能化,减轻网络管理人员负担,提高故障诊断效率。
发明内容
本发明的目的在于提供一种基于时间因子因果关系定位的网络故障自诊断方法,自动完成从众多故障现象中找出故障原因,定位故障点,进行故障诊断这一完整自诊断流程。
一种基于时间因子因果关系定位的网络故障自诊断方法,包括以下步骤:
(1)实时采集网络状态信息;
(2)若网络状态信息表明网络出现故障,进入步骤(3);
(3)若网络故障为链路连通性故障,则进入步骤(4),否则,进入步骤(5);
(4)对链路连通性故障进行定位,具体为:
(41)令出现的故障序列AS={(a1,t1),(a2,t2)…(an,tn)},所有可能发生的故障集合ANU,初始化故障源集合S和临时故障集合S′为空集,(ai,ti)表示在ti时刻产生故障ai,i=1,…,n;
(42)若AS中(ai,ti)的ai不存在于ANU中,则将(ai,ti)加入S,进入步骤(45),否则,进入步骤(43);
(43)若S′中存在(ai,t′i),则进入步骤(44),否则,将(ai,ti)添加到S′中,进入步骤(45);
(44)若ti>t′i,则t′i=ti,进入步骤(45),否则,保持t′i不变,进入步骤(45);
(45)若AS中存在两个或两个以上的故障at1,…,atm一起会导致其它故障,则将其构成的故障组合(at,tt)加入S′,at={at1,…,atm},m为构成该故障组合的故障总数,tt为at1,…,atm中的最大故障产生时刻,进入步骤(46),否则,直接进入步骤(46);
(46)若S′中存在故障(ap,tp)和(aq,tq),故障ap是故障aq产生的原因且tq-tp>0,则认为(aq,tq)为非故障源;
(47)将S′中组合故障及非故障源以外的故障加入S;
(5)对S中的网络故障作检测诊断,给出故障恢复策略。
进一步地,采用被动监测和主动轮询的混合方式采集网络状态信息。
本发明的技术效果体现在:本发明提出了一种基于时间因子因果关系定位的网络故障自诊断方法,通过将网络信息采集、网络故障告警发现和网络故障定位检测整个流程进行接口配置管理,实现了网络故障管理的流程自动化,同时使用了基于规则推理的专家知识库来进行故障检测,实现了故障管理的智能化。通过使用该方法和系统,可以减轻网络故障管理需要依赖人工分析计算的程度,提高网络故障管理的效率,节省网络故障管理中不必要的开支。
附图说明
图1是本发明模块架构图。
图2是本发明步骤流程图。
图3是本发明一个网络实例示意图。
图4是本发明另一个网络实例示意图。
图5是本发明故障定位的一个因果关系图实例。
图6是本发明的网络故障检测所使用的基于规则推理的专家知识库结构图。
具体实施方式
下面结合附图对本发明作进一步的描述。
图1是本发明的基于时间因子因果关系定位的网络故障自诊断模块架构图。按照分层思想进行架构,最底层是信息采集层,中间层是信息处理层,最上层是信息显示层。数据流的方向,即信息传递的方向,是从最底层向最上层传递。
信息采集层的功能是采集网络状态以及性能信息。具体实施时,被管理设备需要安装SNMP协议,即Simple Network Management Protocol(简单网络管理协议),当被管理设备启动SNMP代理后,代理会自动收集和统计本设备的相关网络信息,存放在设备的MIB(Management Information Base,管理信息库)中。系统管理站通过被动监听的方式接收来自被管理设备发生故障时产生的Trap告警报文,同时,管理站通过主动轮询的方式向被管理设备发送ICMP和SNMP报文,获取网络中设备的状态信息。网络性能指标测量模块使用SNMP协议获取被管理设备的相关性能信息,如设备接口数据传输速率、丢包率、错误率等,供系统用户了解网络实时状况。信息采集层采集到的一些信息作为数据存入到系统数据库中。信息采集层通过采集网络状态信息,及时发现网络中的故障,以故障告警的形式传递给信息处理层。
信息处理层的功能是对出现的网络故障告警信息进行故障定位和故障检测。故障定位模块是可裁剪的,当故障为链路连通性故障时,则需使用该模块。故障定位的功能是从众多的网络故障现象中根据故障之间的因果关系定位出故障源。故障检测则使用基于规则推理的专家知识库方法,找出网络故障发生的原因和故障修复建议。
信息显示层的功能是将采集到的网络信息、发现的网络故障以及故障定位、故障检测诊断的结果显示在系统的用户界面,供网络管理人员及时了解网络运行状态、发生的网络故障以及如何应对措施,保证网络的正常稳定运行。进一步的,针对网络性能指标的测量,如网络接口数据速率、数据包错误率、丢失率等,用户界面将以曲线的形式实时动态地显示,便于网络管理人员清楚地了解网络性能状况。
图2是本发明的网络故障自诊断方法的基本流程,具体实施步骤如下:
(1)启动网络自诊断系统并加载网络中的设备信息,用户可以对网络中的设备进行管理,如添加设备、修改设备、删除设备等。然后系统从MIB(网络管理信息库)中收集数据并进行网络状态监测。
(2)网络状态信息监测包括对网络实时性能的监测,监测到的网络性能指标实时测量结果被送到用户界面显示。
(3)根据网络状态监测收集的数据,系统判断网络是否触发故障告警信息。若没有触发告警信息,系统则将网络状态信息直接显示在用户界面。
(4)若触发告警信息,系统首先对故障分类。对于非物理链路连通性故障,系统直接进行故障检测,对于物理链路连通性故障,首先进行故障定位。物理链路连通性故障是指由于网络设备出现硬件异常导致的网络链路无法连通故障,例如:路由器突然断电,网线断裂,都可能导致网络链路无法连通。
(5)对于物理链路连通性故障,若用户开启了自动定位功能,则系统加载故障因果关系图,进行故障定位,然后对故障源进行故障检测;若用户没有开启自动定位功能,则系统直接对这些物理链路连通性故障进行故障检测。
(6)故障检测是指依靠故障诊断与恢复策略实例库,使用基于规则推理的专家知识库方法,对网络中出现的故障进行原因检测,更进一步地可给出相应的恢复策略。系统通过故障检测,得出故障发生的原因,然后根据具体情况给出故障恢复策略建议。故障恢复策略建议是指根据具体的故障类型和内容,给出解决故障的方法或建议。
(7)最后,系统把采集的网络信息以及故障诊断信息显示在用户界面,供用户了解网络实时动态,整个诊断流程至此结束。
另外,本发明的基于时间因子因果关系定位的网络故障自诊断方法,核心的模块有:网络状态信息采集模块、网络性能指标测量模块、故障定位模块和故障检测模块。下面针对这四个模块,给出详细的实施方法和步骤。
模块1(网络状态信息采集)具体实施方法:
下面结合图3详细说明网络状态信息采集的实施方法。图3给出了实际中的一个被管理网络实例,其中包含故障自诊断系统、主机PC、交换机、服务器和路由器。本发明的故障自诊断系统可以监测到每个设备的端口情况。
网络状态信息采集可以使用三种方式:
(1.1)监听来自被管理设备主动发出的Trap告警
告警是在系统处于异常状态时由网管代理发出的通知信息,通常以SNMP-TRAP(陷阱)报文的形式发出,用来向管理系统提供某些重要的事件。SNMP协议支持的Trap类型共有7种。接收Trap使用多线程技术,即开始接收Trap时,启动一个线程专门用来接收Trap即TrapLThreadProc线程,并采用非阻塞方式,否则程序将等待Trap到来,在没有接收到Trap之前,程序不响应任何消息。在监听线程中,启动回调函数对接收到的Trap进行解析。
在图3中,当路由器-4的某个端口发生故障,如接口硬件损坏,则路由器-4可以向故障诊断系统发送一个Trap告警,报告该端口出现故障。
(1.2)主动发送ICMP报文获取网络故障信息
在第(1.1)方式中,Trap类型有限,并且某些情况下,被管理设备出现故障后无法发出Trap,如突然断电,网卡彻底损坏,线路断开等硬件故障。此时,通过ICMP探测网络中的设备,根据响应情况收集分析此类故障。
ICMP方式用来检查网络的连通性,主要针对硬件故障。由于硬件故障具有紧耦合性,故障因果性很强,某根链路断开可能导致一个网段中的主机全部失去响应,路由器的某个端口失效也有可能导致类似的现象。因此需要对网络的硬件故障进行定位。
图3中,如果路由器-1与交换机-1之间的链路断开,则路由器-1将无法发送Trap告警,此时,故障诊断系统向路由器-1发送ICMP请求报文将超时,因此故障诊断系统可以判断路由器-1附近出现了连通故障。
(1.3)SNMP轮询方式(Polling)
ICMP主要测试网络线路的连通性。为了获取更详细的设备信息,可以采用SNMP轮询方式。由于每台代理主机上的MIB记录了设备的许多信息,可以通过SNMP轮询的方式可以收集到设备的大量信息。
如MIB中的System组记录了系统的描述、运行时间、提供的服务,Interface组记录了接口的数量、类型、状态、数据速率、发送和接收的数据包、出现错误的数据包、被丢弃的数据包等。另外还有at、ip、udp、tcp组等。从这些MIB信息中我们获取的大多是性能上的参数,如接口速率、利用率、误码率等。因此,采用SNMP轮询的方式主要是发现网络中的软故障,即性能故障。
图3中,路由器是一个很重要的设备,故障诊断系统可以通过SNMP协议轮询这些路由器,从而及时获取路由器的状态信息,探测网络故障。
模块2(网络性能指标测量)具体实施方法:
网络性能指标测量利用SNMP协议收集各个设备的接口信息、性能参数,并把这些数据作为网络性能的统计信息显示出来。
网络性能指标测量的实现分成三个步骤:
(2.1)收集使用数据:网络信息采集是网络性能指标测量的基础,主要方式是基于MIB轮询。利用SNMP协议提供的操作获取MIB信息。
(2.2)分析数据:采集来的原始数据并不能给用户提供直观的网络信息,因此需要利用一定的算法对这些原始数据进行分析,并显示,同时给予动态实时刷新支持。
(2.3)设置阈值:可以选择对错误率、平均利用率和总吞吐量等项设置阈值。一旦阈值设定,当网络性能指标达到一个特定的上限时,就发出告警信息。
阈值设定的重要性在于,通过用户根据性能指标所定义的阈值信息,一旦系统实时测量的数据量超过阈值,即可触发报警,从而与整个网络监控、诊断体系密切结合起来。
模块3(故障定位)具体实施方法:
由于网络的互联性和开放性,网络故障之间存在着一定的因果关系,单一的网络故障可能导致大量的故障现象,因此不能独立的看待网络中产生的故障告警,而是要将告警联系起来才能找到故障真正的源头。故障定位就是利用故障告警之间的因果特性,从众多的故障告警中定位出故障源。
具体实施时,故障定位主要针对网络物理链路连通性故障,采用基于时间因子因果关系的方法,该功能可以由系统用户选择是否使用。如果用户开启了该功能,则系统会自动对链路故障进行故障定位,否则,系统不进行故障定位。具体实施步骤如下:
步骤3.1)根据整个网络的物理拓扑结构,确定网络链路连通性故障之间的因果关系图;
步骤3.2)网络故障诊断系统根据收集到的故障的特征,提取网络物理链路连通性故障集合,作为故障定位方法的输入数据;
步骤3.3)故障定位方法根据网络链路连通性故障之间的因果关系,从输入的故障集合中删除冗余的故障,这些冗余故障是由其他故障引起的,删除冗余故障后,剩余的故障就是故障定位的结果,也就是故障源。
下面结合图3详细说明故障定位的一个实例。具体故障定位流程如下:
(1)根据网络拓扑图结构,确定故障因果关系如下:
R1.交换机-1不可达导致服务器-1不可达;
R2.交换机-1不可达导致路由器-1不可达;
R3.路由器-1不可达导致路由器-2不可达;
R4.路由器-1不可达导致路由器-3不可达;
R5.路由器-2不可达导致交换机-2不可达;
R6.路由器-2不可达导致交换机-3不可达;
R7.路由器-3不可达导致路由器-4不可达;
R8.交换机-2不可达导致服务器-2不可达;
R9.交换机-3不可达导致PC-1不可达;
R10.交换机-3不可达导致服务器-3不可达;
R11.路由器-4不可达导致PC-2不可达;
R12.路由器-4不可达导致服务器-4不可达;
(“不可达”是指故障诊断系统无法连接到该设备或端口)
(2)网络故障诊断系统收集到连通性故障,例如,(路由器-2,13:41:20)、(交换机-2,13:41:24)、(服务器-2,13:41:30)、(交换机-3,13:41:42)、(PC-1,13:41:56)、(服务器-3,13:42:03)。故障(ai,ti)表示在ti时刻产生故障ai,例如:(路由器-2,13:41:20)表示在下午13时42分03秒路由器-2设备发生故障。
(3)故障定位方法将故障序列“(路由器-2,13:41:20)、(交换机-2,13:41:24)、(服务器-2,13:41:30)、(交换机-3,13:41:42)、(PC-1,13:41:56)、(服务器-3,13:42:03)”作为输入,利用查找算法从(1)中的因果关系中搜索,根据因果关系R5、R6、R8、R9、R10,网络诊断系统收集的链路连通故障可以得到精简,最终定位出网络故障源为“路由器-2出现故障”。
通过上述方法,减少了系统捕获到的冗余故障信息,简化了故障管理的复杂性,有利于快速找到故障发生的源节点。
基于时间因子因果关系的故障定位算法,能够处理故障组合的情况,即两个或两个以上故障一起发生导致其他故障,而且,引入时间因子,能够处理不同时刻重复故障告警的情况,增加了故障定位算法的准确性。如果令故障定位算法中所有时间因子都取相同的值T0,那么故障定位算法也可以处理没有时间因子的故障,使得上述算法具有良好的兼容性。
对于上面的实例,由于网络拓扑比较简单,没有出现故障组合的情况。另外,上述实例也没有出现不同时刻重复故障的情况,因此,故障定位规则相对比较简单。为了进一步验证基于时间因子因果关系的故障定位算法的准确性和灵活性,下面结合图4、图5详细说明基于时间因子因果关系的故障定位算法的另一个实例。
基于时间因子因果关系的故障定位算法中,时间关系是指时间先后顺序(时刻t1、t2)。我们在故障序列AS={a1,a2…am}中增加时刻元素,即AS={(a1,t1),(a2,t2)…(an,tn)},(ai,ti)表示故障ai发生在时刻ti。故障因果关系集合ANRU={e:ai→aj,i,j∈[1,m]},只有当故障ai先于aj发生时,“故障aj由ai引发”的因果关联关系才存在。
根据图4描述的网络拓扑图,分析得到故障关联关系图5,其中所有可能发生的故障集合ANU={a1、a2、a3、a4、a5、a6、a7、a8、a2,5、a3,4},其中a1表示路由器-1发生故障,a2表示路由器-2发生故障,a3表示路由器-3发生故障,a4表示路由器-4发生故障,a5表示路由器-5发生故障,a6表示服务器-1发生故障,a7表示服务器-2发生故障,a8表示服务器-3发生故障,a2,5表示a2、a5两个故障一起发生,a3,4表示a3、a4两个故障一起发生;故障因果关系集合{a1→a2,a1→a3,a1→a6,a2,5→a4,a4→a7,a3,4→a5,a5→a8},其中ai→aj表示故障ai是故障aj产生的原因;
预定时段T内监测到故障序列AS={(a2,0)、(a3,2)、(a4,4)、(a5,5)、(a7,11)、(a8,12)、(a8,14)、(a10,18)、(a3,20)、(a4,22)},其中a10是一个未知设备的故障。故障序列的时间因子以序列中最早发生的故障时间为参考点。下面描述基于时间因子因果关系的故障定位算法的实施过程。
以因果关系图实例和故障序列作为输入,按照基于时间因子因果关系的故障定位算法进行故障定位。算法流程中得到的故障源集合S和临时故障集合S′见表4-1所述。其中以a′形式表示标记有“非故障源”的故障。
表4-1基于时间因子因果关系的故障定位算法输出
Figure BDA0000053506210000131
依据表4-1中可以看出算法从原始故障序列{(a2,0)、(a3,2)、(a4,4)、(a5,5)、(a7,11)、(a8,12)、(a8,14)、(a10,18)、(a3,20)、(a4,22)}共10个故障中最后定位的故障源集合为{(a2,0)、(a3,20)、(a10,18)},减少了故障数目。
模块4(故障检测)具体实施方法:
故障检测可采用基于案例的推理、基于规则的推理、神经网络、贝叶斯网络等方法,本发明故障检测使用基于规则推理的专家知识库方法对网络发生的故障进行原因诊断和恢复建议。图6给出了基于规则推理系统的结构图。该推理系统由三部分组成:工作存储器(Working Memory)、推理引擎(Inference Engine)和知识库(Knowledge Base)。三个组成部分所处的三个层次分别代表了数据层、控制层和知识层。
工作存储区通过具体的网络管理协议,如SNMP/CMIP,收集被监视网络的各种信息,其中包括网络拓扑信息和被监视对象的状态信息。当网络中发生故障时,工作存储区通过分析这些信息识别出网络进入错误状态。
知识库中包含从领域专家那里得到的专家知识。知识库有两个功能:(1)尽可能地确定网络中到底发生了什么问题:(2)当某一特定问题发生时,指出系统所要执行的动作。知识库中的专家知识是基于规则的,即所有知识都采用“if-then”或者“condition-action”规则集的形式。
与知识库合作的推理引擎将目前网络的状态与知识库中规则的条件部分进行比较,以决定该规则是否被采用。当条件满足时,输出规则的后项。在最简单的情况下,一条规则就可以判断出网络故障的根源。实际上这种情况十分少见,多数时候推理引擎需要将当前得到的结论再作为条件在知识库中进行多次推理,最终得出故障结论。
故障检测的具体实施步骤如下:
步骤4.1)根据网络常见故障,建立故障检测诊断所需要的专家知识库,里面存放常见的网络故障现象、故障原因和故障恢复方法;
步骤4.2)系统将收集到的故障告警信息作为故障检测诊断方法的输入数据,送入工作内存;
步骤4.3)故障检测诊断模块在得到工作内存中的故障信息后,将故障信息与专家知识库中的规则的条件部分进行比较,直到找出满足条件的规则,即找到故障原因和故障恢复策略建议。

Claims (2)

1.一种基于时间因子因果关系定位的网络故障自诊断方法,包括以下步骤:
(1)实时采集网络状态信息;
(2)若网络状态信息表明网络出现故障,进入步骤(3);
(3)若网络故障为链路连通性故障,则进入步骤(4),否则,进入步骤(5);
(4)对链路连通性故障进行定位,具体为:
(41)令出现的故障序列AS={(a1,t1),(a2,t2)(an,tn)},所有可能发生的故障集合ANU,初始化故障源集合S和临时故障集合S'为空集,(ai,ti)表示在ti时刻产生故障ai,i=1,,n;
(42)若AS中(ai,ti)的ai不存在于ANU中,则将(ai,ti)加入S,进入步骤(45),否则,进入步骤(43);
(43)若S'中存在(ai,ti'),则进入步骤(44),否则,将(ai,ti)添加到S'中,进入步骤(45);
(44)若ti>ti',则ti'=ti,进入步骤(45),否则,保持ti'不变,进入步骤(45);
(45)若AS中存在两个或两个以上的故障at1,,…,atm一起会导致其它故障,则将其构成的故障组合(at,tt)加入S',at={at1,…,atm},m为构成该故障组合的故障总数,tt为at1,…,atm中的最大故障产生时刻,进入步骤(46),否则,直接进入步骤(46);
(46)若S'中存在故障(ap,tp)和(aq,tq),故障ap是故障aq产生的原因且tq-tp>0,则认为(aq,tq)为非故障源;
(47)将S'中组合故障及非故障源两者以外的故障加入S;
(5)对S中的网络故障作检测诊断,给出故障恢复策略。
2.根据权利要求1所述的网络故障自诊断方法,其特征在于,采用被动监测和主动轮询的混合方式采集网络状态信息。
CN 201110082515 2011-04-01 2011-04-01 一种基于时间因子因果关系定位的网络故障自诊断方法 Expired - Fee Related CN102158360B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110082515 CN102158360B (zh) 2011-04-01 2011-04-01 一种基于时间因子因果关系定位的网络故障自诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110082515 CN102158360B (zh) 2011-04-01 2011-04-01 一种基于时间因子因果关系定位的网络故障自诊断方法

Publications (2)

Publication Number Publication Date
CN102158360A CN102158360A (zh) 2011-08-17
CN102158360B true CN102158360B (zh) 2013-10-30

Family

ID=44439561

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110082515 Expired - Fee Related CN102158360B (zh) 2011-04-01 2011-04-01 一种基于时间因子因果关系定位的网络故障自诊断方法

Country Status (1)

Country Link
CN (1) CN102158360B (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611568B (zh) * 2011-12-21 2016-03-30 华为技术有限公司 一种故障业务路径诊断方法及装置
CN103248505B (zh) * 2012-02-08 2016-01-20 迈普通信技术股份有限公司 基于视图的网络监控方法及装置
CN103368664A (zh) * 2012-03-31 2013-10-23 中兴通讯股份有限公司 微波链路状态的检测方法及微波系统、网元、网管设备
CN103378982A (zh) * 2012-04-17 2013-10-30 深圳市腾讯计算机系统有限公司 互联网业务运行监测方法和系统
CN103391207B (zh) * 2012-05-08 2016-11-16 上海富欣智能交通控制有限公司 异构的故障管理系统
CN104065501A (zh) * 2013-03-22 2014-09-24 中兴通讯股份有限公司 一种网管系统中网络故障定位的方法及装置
CN103457792B (zh) * 2013-08-19 2017-02-08 大唐移动通信设备有限公司 一种故障检测方法和装置
CN104734871A (zh) * 2013-12-20 2015-06-24 中兴通讯股份有限公司 一种实现故障定位的方法及装置
CN104796273B (zh) * 2014-01-20 2018-11-16 中国移动通信集团山西有限公司 一种网络故障根源诊断的方法和装置
CN103812728B (zh) * 2014-02-13 2018-06-19 普联技术有限公司 一种网络诊断方法、系统及路由器
CN104503423A (zh) * 2014-11-21 2015-04-08 河南中烟工业有限责任公司 基于profinet的工业以太网控制系统故障诊断方法
CN104486096A (zh) * 2014-11-21 2015-04-01 河南中烟工业有限责任公司 基于工业以太网故障诊断方法中决策树的推理方法
CN105991340B (zh) * 2015-03-06 2020-01-10 腾讯科技(深圳)有限公司 一种故障访问链路筛选方法及装置
CN104794013B (zh) * 2015-03-20 2018-03-13 百度在线网络技术(北京)有限公司 定位系统运行状态、建立系统运行状态模型的方法及装置
CN105187249B (zh) 2015-09-22 2018-12-07 华为技术有限公司 一种故障恢复方法及装置
CN105468703B (zh) * 2015-11-18 2019-05-21 章斌 一种原因追溯方法
CN107800555B (zh) * 2016-09-05 2023-01-24 中兴通讯股份有限公司 业务诊断方法及装置
CN107181623A (zh) * 2017-06-29 2017-09-19 国家电网公司 信息网络设备故障处理方法和装置
CN109361530B (zh) * 2018-08-22 2021-08-24 武汉慧联无限科技有限公司 远距离低功耗无线网络系统的网络质量分析模型实现方法
CN109639475A (zh) * 2018-12-06 2019-04-16 国网甘肃省电力公司信息通信公司 基于关联图的网络自诊断故障定位方法
CN111181812B (zh) * 2020-01-03 2022-04-08 四川新网银行股份有限公司 基于网络流量的链路故障检测方法
CN113810239A (zh) * 2020-06-15 2021-12-17 深信服科技股份有限公司 数据中心网络故障检测方法、装置、设备及存储介质
CN112231523B (zh) * 2020-10-20 2024-01-16 广州知图科技有限公司 一种基于有向无环图的网络故障定位排查方法及系统
CN114885355A (zh) * 2021-02-05 2022-08-09 华为技术有限公司 发送或展示网络检测结果的方法和装置
CN113176469A (zh) * 2021-03-12 2021-07-27 国网内蒙古东部电力有限公司电力科学研究院 基于多智能体和火电机组集群仿真的输电网架恢复方法
CN113721581A (zh) * 2021-07-20 2021-11-30 深圳市风云实业有限公司 一种基于关键路径的故障诊断显示装置及方法
CN114363149B (zh) * 2021-12-23 2023-12-26 上海哔哩哔哩科技有限公司 故障处理方法及装置
CN115022153B (zh) * 2022-06-07 2024-04-23 中国工商银行股份有限公司 故障根因分析方法、装置、设备和存储介质
CN115396320B (zh) * 2022-08-10 2023-07-28 中国联合网络通信集团有限公司 端口连接关系的确定方法、装置、设备及存储介质
CN115442247B (zh) * 2022-11-03 2023-03-24 湖南警云智慧信息科技有限公司 一种采用人工智能数据处理运维箱
CN116545961B (zh) * 2023-07-03 2023-09-15 明阳时创(北京)科技有限公司 一种网络交换机集群智能检测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1529455A (zh) * 2003-09-29 2004-09-15 港湾网络有限公司 网络故障实时相关性分析方法及系统
CN101022366A (zh) * 2007-03-21 2007-08-22 Ut斯达康通讯有限公司 一种故障关联分析系统以及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1529455A (zh) * 2003-09-29 2004-09-15 港湾网络有限公司 网络故障实时相关性分析方法及系统
CN101022366A (zh) * 2007-03-21 2007-08-22 Ut斯达康通讯有限公司 一种故障关联分析系统以及方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
基于事件关联技术的互联网故障诊断研究;张文雯;《中国优秀硕士学位论文全文数据库 信息科技辑 》;20041215(第4期);全文 *
张文雯.基于事件关联技术的互联网故障诊断研究.《中国优秀硕士学位论文全文数据库 信息科技辑 》.2004,(第4期),全文.
石磊.网络故障定位与检测技术研究.《中国优秀硕士学位论文全文数据库 信息科技辑》.2007,(第1期),第三章3.2.2-3.2.4.
第9页第13-14行
第9页第18行-第10页第18行.
网络故障定位与检测技术研究;石磊;《中国优秀硕士学位论文全文数据库 信息科技辑》;20070115(第1期);第三章3.2.2-3.2.4 *

Also Published As

Publication number Publication date
CN102158360A (zh) 2011-08-17

Similar Documents

Publication Publication Date Title
CN102158360B (zh) 一种基于时间因子因果关系定位的网络故障自诊断方法
Shaikh et al. OSPF Monitoring: Architecture, Design, and Deployment Experience.
JP5840788B2 (ja) 根本原因分析のための方法、装置、および通信ネットワーク
CN104270268B (zh) 一种分布式系统网络性能分析及故障诊断方法
US8499204B2 (en) Method and apparatus for maintaining the status of objects in computer networks using virtual state machines
US7069480B1 (en) Method and apparatus for identifying problems in computer networks
US7296194B1 (en) Method and apparatus for maintaining the status of objects in computer networks using virtual state machines
CN109544349A (zh) 一种基于网络资产信息采集方法、装置、设备及存储介质
CN105282772A (zh) 无线网数通设备监控系统及设备监控方法
CN102868553B (zh) 故障定位方法及相关设备
CN106789177A (zh) 一种网络故障处理的系统
CN101667941A (zh) 链路性能的检测方法及装置
CN105721184A (zh) 一种网络链路质量的监控方法及装置
CN104219091A (zh) 一种网络运行故障检测系统及其方法
CN107947998A (zh) 一种基于应用系统的实时监测系统
CN111698127A (zh) 一种网络内设备的状态监控系统、方法和装置
CN107635003A (zh) 系统日志的管理方法、装置及系统
CN112333020B (zh) 一种基于五元组的网络安全监测及数据报文解析系统
CN110113205A (zh) 一种基于软件定义网络技术的网络排障系统及其工作方法
CN103888300A (zh) Web服务系统中网络故障分析系统与方法
CN102045186B (zh) 一种事件分析方法及系统
CN117459365A (zh) 故障原因确定方法、装置、设备及存储介质
Varga et al. Integration of service-level monitoring with fault management for end-to-end multi-provider ethernet services
Appleby et al. Yemanja—A layered fault localization system for multi-domain computing utilities
CN114285780B (zh) 一种基于优先级队列的雷达网络测试系统及测试方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131030

Termination date: 20200401

CF01 Termination of patent right due to non-payment of annual fee