CN113037564B - 一种网络故障诊断方法及装置 - Google Patents

一种网络故障诊断方法及装置 Download PDF

Info

Publication number
CN113037564B
CN113037564B CN202110328040.9A CN202110328040A CN113037564B CN 113037564 B CN113037564 B CN 113037564B CN 202110328040 A CN202110328040 A CN 202110328040A CN 113037564 B CN113037564 B CN 113037564B
Authority
CN
China
Prior art keywords
alarm information
information
fault
alarm
merging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110328040.9A
Other languages
English (en)
Other versions
CN113037564A (zh
Inventor
王明辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
New H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Technologies Co Ltd filed Critical New H3C Technologies Co Ltd
Priority to CN202110328040.9A priority Critical patent/CN113037564B/zh
Publication of CN113037564A publication Critical patent/CN113037564A/zh
Application granted granted Critical
Publication of CN113037564B publication Critical patent/CN113037564B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供了一种网络故障诊断方法及装置,应用于网络通信技术领域,上述方法包括:获得告警信息。基于告警信息中包含的信息,根据预设的表征告警信息间关联关系的关联规则,对所获得的告警信息进行关联性分析,得到告警信息间具有关联关系的告警信息组。对告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果。根据合并处理结果,获得对目标故障进行故障诊断的结果,其中,目标故障为:直接触发告警信息组中各告警信息生成的网络故障。应用本发明实施例提供的方案能够提高故障诊断的效率。

Description

一种网络故障诊断方法及装置
技术领域
本发明涉及网络通信技术领域,特别是涉及一种网络故障诊断方法及装置。
背景技术
网络通信系统中一般包含交换机、路由器等通信设备,这些通信设备在工作过程中可能会出现运行异常,导致通信网络发生故障,从而影响网络通信质量。为便于工作人员排除网络故障,在出现网络故障后,通信设备一般会生成告警信息并且将告警信息记录于网络日志中。这样工作人员可以根据网络日志中记录的告警信息进行故障诊断,排除网络故障。
但当网络日志中记录的告警信息数量较多时,工作人员需要对大量告警信息进行分析,才能完成网络故障诊断,导致故障诊断的效率较低。
发明内容
本发明实施例的目的在于提供一种网络故障诊断方法及装置,以提高故障诊断的效率。具体技术方案如下:
第一方面,本发明实施例提供了一种网络故障诊断方法,所述方法包括:
获得告警信息;
基于所述告警信息中包含的信息,根据预设的表征告警信息间关联关系的关联规则,对所获得的告警信息进行关联性分析,得到告警信息间具有关联关系的告警信息组;
对所述告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果;
根据合并处理结果,获得对目标故障进行故障诊断的结果,其中,所述目标故障为:直接触发所述告警信息组中各告警信息生成的网络故障。
本发明的一个实施例中,在所述获得告警信息之后,所述方法还包括:
针对每一告警信息,根据预设的日志模板,确定以下信息中的至少一种:该告警信息的故障类型、故障级别、以及所述告警信息影响的业务;
其中,日志模板中包括告警信息与故障类型和\或故障级别和\或告警信息影响的业务的对应关系。
本发明的一个实施例中,所述对所述告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果,包括:
根据所述告警信息组中告警信息间的关联关系,获得反映根源性故障的根源告警信息,其中,所述根源性故障为:触发所述告警信息组中各告警信息生成的故障;
确定所述根源告警信息中包含的各项信息的取值,作为对所述告警信息组中各告警信息内包含的各项信息进行合并处理的合并处理结果。
本发明的一个实施例中,所述对所述告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果,包括:
针对告警信息中包含的每一项信息,对该信息的各项取值在所述告警信息组内各告警信息中出现的频次进行统计,按照统计结果对该信息进行合并处理,得到该项信息的合并处理结果。
本发明的一个实施例中,所述获得告警消息,包括:
获得原始告警信息;
选择生成原始告警信息的通信设备之间具有拓扑关系和/或生成时间属于预设时间段内的原始告警信息,作为告警信息。
本发明的一个实施例中,所述对目标故障进行故障诊断的结果中,还包括:
反映根源性故障的根源告警信息、表示所述根源性故障是引发目标故障的原因的根因概率。
第二方面,本发明实施例提供了一种网络故障诊断装置,所述装置包括:
信息获得模块,用于获得告警信息;
信息组获得模块,用于基于所述告警信息中包含的信息,根据预设的表征告警信息间关联关系的关联规则,对所获得的告警信息进行关联性分析,得到告警信息间具有关联关系的告警信息组;
信息合并模块,用于对所述告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果;
结果获得模块,用于根据合并处理结果,获得对目标故障进行故障诊断的结果,其中,所述目标故障为:直接触发所述告警信息组中各告警信息生成的网络故障。
本发明的一个实施例中,所述装置还包括:
信息确定模块,用于针对每一告警信息,根据预设的日志模板,确定以下信息中的至少一种:该告警信息的故障类型、故障级别、以及所述告警信息影响的业务;
其中,日志模板中包括告警信息与故障类型和\或故障级别和\或告警信息影响的业务的对应关系。
本发明的一个实施例中,所述信息合并模块,具体用于:
根据所述告警信息组中告警信息间的关联关系,获得反映根源性故障的根源告警信息,其中,所述根源性故障为:触发所述告警信息组中各告警信息生成的故障;
确定所述根源告警信息中包含的各项信息的取值,作为对所述告警信息组中各告警信息内包含的各项信息进行合并处理的合并处理结果。
本发明的一个实施例中,所述信息合并模块,具体用于:
针对告警信息中包含的每一种信息,对该信息的各项取值在所述告警信息组内各告警信息中出现的频次进行统计,按照统计结果对该信息进行合并处理,得到该项信息的合并处理结果。
本发明的一个实施例中,所述信息获得模块,具体用于:
获得原始告警信息;
选择生成原始告警信息的通信设备之间具有拓扑关系和/或生成时间属于预设时间段内的原始告警信息,作为告警信息。
本发明的一个实施例中,所述对目标故障进行故障诊断的结果中,还包括:
反映根源性故障的根源告警信息、表示所述根源性故障是引发目标故障的原因的根因概率。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的方法步骤。
第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面任一所述的方法步骤。
本发明实施例有益效果:
本发明实施例通过获得各条告警信息,并基于告警信息中包含的信息,根据预设的表征告警信息间关联关系的关联规则,对告警信息进行关联性分析,得到告警信息间具有关联关系的告警信息组。对告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果,根据合并处理结果,获得对目标故障进行故障诊断的结果。
由以上可见,由于告警信息组中包含的告警信息之间具有关联关系,因此可以认为触发生成告警信息组中包含的告警信息的目标故障之间存在关联关系,所以可以对告警信息组中具有关联关系的各告警信息内包含的信息进行合并处理,得到的各项信息的合并处理结果可以代表上述告警信息组中的各条告警信息。进一步的可以认为根据合并处理结果得到的故障诊断的结果可以代表告警信息组中的各条告警信息,故障诊断结果可以反映触发生成各告警信息的各目标故障。上述进行故障诊断的过程不需要工作人员对大量告警信息进行分析,因此可以提高故障诊断的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的第一种网络故障诊断方法的流程示意图;
图2为本发明实施例提供的一种故障诊断的结果示意图;
图3为本发明实施例提供的第二种网络故障诊断方法的流程示意图;
图4为本发明实施例提供的第三种网络故障诊断方法的流程示意图;
图5为本发明实施例提供的第四种网络故障诊断方法的流程示意图;
图6为本发明实施例提供的第五种网络故障诊断方法的流程示意图;
图7为本发明实施例提供的第一种网络故障诊断装置的结构示意图;
图8为本发明实施例提供的第二种网络故障诊断装置的结构示意图;
图9为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员基于本申请所获得的所有其他实施例,都属于本发明保护的范围。
由于现有技术中进行故障诊断的效率较低,为了解决这一问题,本发明实施例提供了一种网络故障诊断方法及装置。
本发明的一个实施例中,提供了一种网络故障诊断方法,上述方法包括:
获得告警信息。
基于上述告警信息中包含的信息,根据预设的表征告警信息间关联关系的关联规则,对所获得的告警信息进行关联性分析,得到告警信息间具有关联关系的告警信息组。
对上述告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果。
根据合并处理结果,获得对目标故障进行故障诊断的结果。其中,上述目标故障为:直接触发上述告警信息组中各告警信息生成的网络故障。
由以上可见,由于告警信息组中包含的告警信息之间具有关联关系,因此可以认为触发生成告警信息组中包含的告警信息的目标故障之间存在关联关系,所以可以对告警信息组中具有关联关系的各告警信息内包含的信息进行合并处理,得到的各项信息的合并处理结果可以代表上述告警信息组中的各条告警信息。进一步的可以认为根据合并处理结果得到的故障诊断的结果可以代表告警信息组中的各条告警信息,故障诊断结果可以反映触发生成各告警信息的各目标故障。上述进行故障诊断的过程不需要工作人员对大量告警信息进行分析,因此可以提高故障诊断的效率。
下面通过具体的实施例对本发明实施例提供的网络故障诊断方法及装置进行说明。
具体的,本发明实施例的执行主体可以是通信网络中的服务器。
参见图1,为本发明实施例提供的第一种网络故障诊断方法的流程示意图,上述方法包括以下步骤S101-S104。
S101:获得告警信息。
其中,可以获得上述通信网络中的各通信设备的网络日志,从而获得网络日志中包含的原始告警信息,作为上述告警信息。上述告警信息可以是累计得到的预设数量条告警信息,也可以是在预设时长内得到各条告警信息。具体的,可以通过SNA(SystemsNetwork Architecture,网络体系结构)的514端口,使用rsyslog工具采集上述告警信息。
另外,可以对接收到的原始告警信息进行信息处理,上述原始告警信息中包含“message”字段,“message”字段以一个字符串的形式表示,其中包含大量信息,可以按照预设信息模板对原始告警信息中包含的“message”字段中包含的信息进行拆分处理,得到新的字段,从而得到上述告警信息,上述告警信息中包含原始告警信息中包含的字段以及新的字段。
例如,上述预设信息模板中可以包含"category"字段、"subcategory"字段、"version"字段等。
本发明的一个实施例中,可以采用logstash对接收到的告警信息进行信息解析。
再者,可以对接收到的原始告警信息进行数据清洗,即可以对上述原始告警信息进行去重处理,也可以确定上述原始告警信息中不完整的信息和/或错误的信息,去除所确定的信息或对所确定的信息进行数据修复,得到上述告警信息。
具体的,可以采用现有技术中常见的方式对原始告警信息进行数据清洗,本发明实施例对此不再赘述。
S102:基于上述告警信息中包含的信息,根据预设的表征告警信息间关联关系的关联规则,对所获得的告警信息进行关联性分析,得到告警信息间具有关联关系的告警信息组。
其中,上述告警信息中可以包含触发生成告警信息的目标故障发生的时间、发生上述目标故障的通信设备、上述目标故障的持续时间、发生上述目标故障的网络接口、上述目标故障的故障类型、表示上述目标故障严重程度的故障级别、上述目标故障所影响的业务等。
具体的,根据预设的关联规则不同,对所获得告警信息进行关联性分析时使用的信息不同。所获得的告警信息可以被划分成为一个或多个告警信息组。
另外,上述告警信息中包含的信息可以为原始告警信息中携带的信息、对上述原始告警信息进行解析得到的信息,也可以为人工赋值的信息等。
具体的,上述关联规则可以为:由同一通信设备生成的告警信息之间具有设备关联关系,则可以根据告警信息中包含的通信设备信息,得到由同一通信设备生成的告警信息组成的告警信息组。
上述关联规则也可以为:生成时间之间的时间差小于预设时间差的告警信息之间具有时间关联关系,则可以根据告警信息中包含的生成时间信息,得到由生成时间之间的时间差小于预设时间差的告警信息组成的告警信息组。
上述关联规则也可以为:具有父子关系的告警信息间存在关联关系,其中,上述父子关系中:触发子告警信息生成的网络故障由触发父告警信息生成的网络故障引发。则可以预设父子关系的关联规则,根据告警信息反映的故障的故障类型,确定存在父子关系的告警信息。
例如,可以预先设置反映的故障为物理层收发器断开PHY_UPDOWN类型的告警信息是反映的故障为链路断开LINK_UPDOWN类型的告警信息的父告警信息,反映的故障为LINK_UPDOWN类型的告警信息是反映的故障为开放式最短路径优先协议邻居状态改变OSPF_NBR_CHG类型的告警信息的父告警信息,反映的故障为OSPF_NBR_CHG类型的告警信息是反映的故障为最短路径优先协议邻居状态改变原因OSPF_NBR_CHG_REASON类型的告警信息的父告警信息,反映的故障为OSPF_NBR_CHG类型的告警信息也是反映的故障为最短路径优先协议邻居断开OSPF_LAST_NBR_DOWN类型的告警信息的父信息。
上述关联规则也可以为:具有频次关系的告警信息间存在关联关系,其中,上述频次关系中:各告警信息反映的目标故障相同,也就是由同一故障直接触发生成的各告警信息之间存在频次关系。则可以预先设置频次关系的关联规则,根据告警信息反映的故障的故障类型,确定故障类型相同的告警信息之间存在频次关系。
例如,可以认为所反映的故障的故障类型均为LINK_UPDOWN类型的告警信息之间存在频次关系。
上述关联规则还可以为:具有同源关系的告警信息间存在关联关系,其中,上述同源关系中:各告警信息反映的目标故障由同一根源性故障引发。则可以预先设置同源关系的关联规则,根据告警信息反映的故障的故障类型,确定故障类型符合关联规则的告警信息之间存在同源关系。
例如,由前文描述可知,故障类型为OSPF_NBR_CHG类型的故障可以引发OSPF_NBR_CHG_REASON类型的故障以及OSPF_LAST_NBR_DOWN类型的故障。因此可以认为所反映故障的故障类型为OSPF_NBR_CHG_REASON类型的告警信息与所反映故障的故障类型为OSPF_LAST_NBR_DOWN类型的告警信息之间存在同源关系。
此外,上述关联规则还可以是其他基于告警信息中包含的信息设定的规则,本发明实施例对此不再赘述。
S103:对上述告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果。
具体的,进行合并处理的信息可以为上述告警信息中包含的所有信息,也可以为上述告警信息中包含的部分信息,进行合并处理的信息可以包括:直接触发生成告警信息的目标故障发生的时间、发生上述目标故障的通信设备、上述目标故障的持续时间、发生上述目标故障的网络接口、上述目标故障的故障类型、表示上述目标故障严重程度的故障级别、上述目标故障所影响的网络业务等。
另外,由于上述告警信息组中包含的告警信息之间存在关联关系,因此可以认为上述各告警信息反映的目标故障之间同样存在关联关系,可以对上述告警信息内包含的各项信息进行合并处理,则合并处理结果可以反映各目标故障。
本发明的一个实施例中,可以通过步骤S103A-S103B,或步骤S103C对目标故障的信息进行合并处理,本发明实施例对此暂不详述。
S104:根据合并处理结果,获得对目标故障进行故障诊断的结果。
具体的,可以直接将合并处理结果作为上述故障诊断的结果,也可以选择部分合并处理结果作为上述故障诊断的结果,还可以将上述合并处理结果作为故障诊断的结果的一部分。
另外,故障诊断的结果中还可以包括:反映根源性故障的根源告警信息、表示所述根源性故障是引发目标故障的原因的根因概率。
其中,上述根源性故障为:触发上述告警信息组中各告警信息生成的根源性故障。上述根源性故障可以是上述目标故障,也就是直接触发生成上述告警信息的故障,也可以是引发上述目标故障的故障,也就是间接触发生成上述告警信息的故障。
本发明的一个实施例中,可以通过步骤S103A确定上述根源性故障,在此暂不详述。
此外,上述根因概率的取值可以是工作人员设定的,也可以计算当前的根源告警信息与历史根源告警信息之间的相似度,将相似度最高的历史根源告警信息的历史根因概率作为当前的根源告警信息的根因概率。
参见图2,为本发明实施例提供的一种故障诊断的结果示意图。
图中的“路由中断”与“链路down”是对告警信息影响的业务进行合并处理得到的合并处理结果,级别为对告警信息中的故障级别合并处理得到的合并处理结果,告警名称为上述根源告警信息的名称,疑似根因概率为上述根源告警信息反映的故障是根源性故障的概率。
由以上可见,由于告警信息组中包含的告警信息之间具有关联关系,因此可以认为触发生成告警信息组中包含的告警信息的目标故障之间存在关联关系,所以可以对告警信息组中具有关联关系的各告警信息内包含的信息进行合并处理,得到的各项信息的合并处理结果可以代表上述告警信息组中的各条告警信息。进一步的可以认为根据合并处理结果得到的故障诊断的结果可以代表告警信息组中的各条告警信息,故障诊断结果可以反映触发生成各告警信息的各目标故障。上述进行故障诊断的过程不需要工作人员对大量告警信息进行分析,因此可以提高故障诊断的效率。
参见图3,为本发明实施例提供的第二种网络故障诊断方法的流程示意图,与前述图1所示的实施例相比,在上述步骤S101之后,还包括步骤S105。
S105:针对每一告警信息,根据预设的日志模板,确定以下信息中的至少一种:该告警信息的故障类型、故障级别、以及上述告警信息影响的业务。
其中,日志模板中包括告警信息与故障类型和\或故障级别和\或告警信息影响的业务的对应关系。
具体的,对于故障类型,上述日志模板中可以直接包含上述告警信息与故障类型之间的对应关系,因此可以直接根据上述日志模板确定上述告警信息对应的故障类型。
另外,上述日志模板中也可以包含告警信息与问题归属和/或问题类型的对应关系,从而可以根据上述日志模板确定告警信息对应的问题归属和/或问题类型,进而获得上述告警信息对应的故障类型。
例如,上述问题归属可以分为设备问题、协议问题、网络问题、Overlay问题、业务问题。
如,上述日志模板中可以包含:反映通信设备的硬件相关的问题或者只在单个通信设备上体现问题的告警信息对应设备问题,反映网络拓扑和转发路径相关的问题的告警信息对应网络问题,反映通信设备自身运行的协议如路由协议、地址解析协议、链路汇聚控制协议等的问题的告警信息对应协议问题。反映Overlay网络如Vxlan(VirtualeXtensible Local Area Network,虚拟可扩展局域网)隧道、多协议标签交换、SR-TE(Segment Routing-Traffic Engineering,分段路由流量工程)隧道等问题的告警信息对应协议问题。反映应用和用户以及会话等的问题以及网络外围的服务器、虚拟机、容器等问题的告警信息可以对应协议问题。
另外,上述问题类型可以分为性能类问题、容量类问题、状态类问题、策略类问题、连接类问题等。
上述日志模板中可以包含:反映性能对象指标相关问题的告警信息对应性能类问题,反映资源容量相关问题的告警信息对应容量类问题,反映分析对象处于某种状态问题的告警信息对应状态类问题,反映由网络攻击产生的问题或在网络策略选择的过程中产生的问题的告警信息对应策略类问题,反映在网络接入或者会话连接的过程中产生的问题的告警信息对应连接类问题。
在通过问题归属确定故障类型的情况下,可以直接将确定得到的问题归属确定为上述故障类型。
在通过问题类型确定故障类型的情况下,可以直接将确定得到的问题类型确定为上述故障类型。
在通过问题归属与问题类型共同确定故障类型的情况下,可以分别确定故障所属的问题归属与问题类型,将所确定的问题归属与问题类型共同作为上述故障类型。例如,在问题归属方面告警信息所反映的故障属于网络类问题,在问题类型方面告警信息所反映的故障属于状态类问题,则可以认为上述故障的故障类型为网络状态类。
此外,上述故障级别的信息取值可以为:致命、严重、紧急、重要、一般等。
例如,交换机故障对网络的影响程度往往大于路由器故障对网络的影响程度,因此上述日志模板包含的对应关系可以为:交换机生成的告警信息对应的故障级别为严重,路由器生成的告警信息对应的故障级别为重要。
再者,对于告警信息影响的业务的信息取值可以为:路由终端、链路down等。
由以上可见,通过上述日志模板可以确定上述告警信息对应的故障类型、故障级别以及告警信息影响的业务,而上述故障类型、故障级别以及告警信息影响的业务往往为故障诊断过程中着重注意的信息。因此确定出各条告警信息的故障类型、故障级别以及告警信息影响的业务信息,可以便于得到故障诊断的结果。
参见图4,为本发明实施例提供的第三种网络故障诊断方法的流程示意图,与前述图1所示的实施例相比,上述步骤S103可以通过以下步骤S103A-S103B实现。
S103A:根据上述告警信息组中告警信息间的关联关系,获得反映根源性故障的根源告警信息。
具体的,在上述告警信息组中的告警信息之间存在时间关联关系的情况下,各告警信息的生成时间的时间差小于预设时间差,可以将生成时间最早或最晚的告警信息作为根源告警信息。
在上述告警信息组中的告警信息之间存在设备关联关系的情况下,生成各告警信息的设备之间存在拓扑关系,在拓扑关系中位于前端的设备发生故障较易于导致位于后端的设备发生故障,因此可以将位于拓扑关系中首位置处的设备生成的告警信息作为上述根源告警信息。
本发明的一个实施例中,也可以通过以下步骤A-步骤C中的任意一种,获得反映根源性故障的根源告警信息。
步骤A:在上述告警信息组中告警信息间存在父子关系的情况下,将父告警信息确定为上述根源告警信息。
具体的,在告警信息间存在父子关系的情况下,由于子告警信息所反映的故障是由父告警信息所反映的故障引发的,因此若上述父告警信息所反映的故障被排除,则在大多数情况下上述告警信息组中各告警信息反映的故障可以被排除,因此可以将上述父告警信息作为上述根源告警信息,用于代表上述告警信息组中各告警信息。
步骤B:在上述告警信息组中告警信息间存在频次关系的情况下,派生用于反映目标故障的上述根源告警信息。
本发明的一个实施例中,在告警信息间存在频次关系的情况下,各告警信息所反映的目标故障相同,也就是可以认为同一目标故障多次发生,触发告警信息组中的多个告警信息生成。因此可以派生用于反映目标故障的根源告警信息,若上述根源告警信息所反映的目标故障被排除,则在大多数情况下上述告警信息组中各告警信息反映的故障可以被排除,因此上述根源告警信息可以用于代表上述告警信息组中各告警信息。
具体的,由于上述告警信息所反映的目标故障相同,也就是上述告警信息对应的故障类型相同,因此派生出的根源告警信息的故障类型可以为上述告警信息对应的故障类型。
并且可以对告警信息组内各告警信息中各项信息分别进行统计,将出现频次最高的信息取值分别确定为所派生的根源告警信息中各项信息的取值。也可以针对告警信息中的各项信息分别预先设置信息取值的优先级,将所派生的根源告警信息中各项信息的取值确定为上述告警信息组内各告警信息中出现过的、优先级较高的取值。
步骤C:在上述告警信息组中告警信息间存在同源关系的情况下,派生用于反映根源性故障的上述根源告警信息。
本发明的一个实施例中,在上述告警信息组中告警信息间存在同源关系的情况下,各告警信息反映的故障由同一根源性故障引发,因此可以派生出反映上述根源性故障的根源性故障告警信息,若上述根源告警信息所反映的根源性故障被排除,则在大多数情况下上述告警信息组中各告警信息反映的故障可以被排除,因此所派生出的根源告警信息可以用于代表上述告警信息组中各告警信息。
具体的,所派生出的根源告警信息的故障类型可以是预设的、上述告警信息组中告警信息反映的故障的故障类型对应的根源性故障类型。例如,故障类型为OSPF_NBR_CHG类型的故障可以引发OSPF_NBR_CHG_REASON类型的故障以及OSPF_LAST_NBR_DOWN类型的故障,因此,在上述告警信息组中告警信息反映的故障的故障类型是OSPF_NBR_CHG_REASON类型与OSPF_LAST_NBR_DOWN类型的情况下,所派生出的根源性故障的故障类型为OSPF_NBR_CHG类型。
S103B:确定上述根源告警信息中包含的各项信息的取值,作为对上述告警信息组中各告警信息内包含的各项信息进行合并处理的合并处理结果。
具体的,由于上述根源告警信息可以代表上述告警信息组中各告警信息,因此上述根源告警信息中包含的各项信息可以代表上述告警信息组中各告警信息中包含的信息。所以可以将上述根源告警信息中包含的信息作为上述合并处理结果。
由以上可见,可以确定引发上述告警信息组中各告警信息所反映的目标故障的根源性故障,由于上述根源性故障是引发上述目标故障的原因,因此上述根源性故障可以代表上述目标故障,则反映上述根源性故障的根源告警信息可以代表上述告警信息组中的各告警信息。所以可以将上述根源告警信息中包含的各项信息作为上述合并处理结果。
参见图5,为本发明实施例提供的第四种网络故障诊断方法的流程示意图,与前述图1所示的实施例相比,上述步骤S103可以通过以下步骤S103C实现。
S103C:针对告警信息中包含的每一种信息,对该信息的各项信息取值在上述告警信息组内各告警信息中出现的频次进行统计,按照统计结果对该信息进行合并处理,得到该项信息的合并处理结果。
其中,上述告警信息中包括以下信息中的至少一种:上述告警信息反映的目标故障的故障类型、表示上述告警信息反映的目标故障严重程度的故障级别、上述告警信息反映的目标故障所影响的业务。
具体的,对于每一项信息,可以将出现的频次最高的信息取值作为该项信息的合并处理结果。另外,也可以预先设置各项信息取值的优先级,将信息取值中出现的频次大于0且优先级最高的信息取值作为所对应的信息的合并处理结果。
例如,对于故障级别而言,可以认为所表示的故障级别越高的信息取值的优先级越高,如“致命”的优先级高于“严重”,“严重”的优先级高于“紧急”,“紧急”的优先级高于“重要”,“重要”的优先级高于“一般”。则可以选择出现的频次大于0且表示的故障级别最高的故障级别的信息取值作为上述故障级别的合并处理结果。
由以上可见,对告警信息组中各告警信息中各信息的信息取值出现的频次进行统计,可以确定各信息的各项信息取值的出现情况,根据所确定的出现情况可以得到上述合并处理结果。因此上述合并处理结果能够表示各项信息取值的出现情况,使得上述合并处理结果能够代表上述告警信息组中各告警信息的信息取值。
参见图6,为本发明实施例提供的第五种网络故障诊断方法的流程示意图,与前述图1所示的实施例相比,上述步骤S101可以通过以下步骤S101A-S101B实现。
S101A:获得原始告警信息。
其中,上述原始告警信息可以是网络日志中包含的告警信息,也可以是对网络日志中包含的告警信息进行信息处理后得到的告警信息,还可以对上述网络日志中包含的告警信息进行数据清洗后得到的信息。
具体的,对网络日志中包含的告警信息进行信息处理与数据清洗的方式与前述步骤S101描述的内容相似,本发明实施例对此不再赘述。
S101B:选择生成原始告警信息的通信设备之间具有拓扑关系和/或生成时间属于预设时间段内的原始告警信息,作为告警信息。
其中,可以根据原始告警信息中包含的表示生成该原始告警信息的通信设备的信息,确定生成该原始告警信息的通信设备。其中,上述表示生成该原始告警信息的通信设备的信息可以以通信设备的编号、名称、地址等形式表示。
另外,可以根据原始告警信息中包含的表示该原始告警信息生成时间的信息,确定该原始告警信息的生成时间。
具体的,由于若一个故障发生之后没有得到排除,则该故障可能在短时间内持续发生,那么反映同一故障的告警信息可能会在短时间内生成多次。并且一个故障发生之后,在短时间内可能进一步导致其他故障发生,因此在短时间内可能会生成能够反映由该故障引发的其他故障的告警信息。所以生成时间相近的告警信息之间存在关联关系的可能性较大,在原始告警信息中选择生成时间属于预设时间段内的原始告警信息,作为告警信息,可以使得所得到的告警信息之间存在关联关系的可能性较大。
另外,由于若一个设备发生故障,则可能会导致与其直接或间接具有拓扑关系的其他设备发生故障。例如,交换机发生故障可能会导致与该交换机相连的路由器无法进行数据传输,进一步的导致与该路由器相连的用户设备也无法进行数据传输。因此若生成原始告警信息的通信设备之间具有拓扑关系,则原始告警信息之间存在关联关系的可能性较高。所以选择生成原始告警信息的通信设备之间具有拓扑关系的原始信息,作为告警信息,可以使得所得到的告警信息之间存在关联关系的可能性较大。
由以上可见,上述告警信息是对原始告警信息进行筛选得到的,筛选得到的告警信息之间时间差较小,或生成告警信息的通信设备之间存在拓扑关系。因此上述告警信息之间存在关联关系的可能性较高,也就较易于根据关联规则查找到告警信息之间的关联关系,较易于确定上述告警信息组。
与前述网络故障诊断方法相对应,本发明还提供了一种网络故障诊断装置。
参见图7,为本发明实施例中提供的第一种网络故障诊断装置的结构示意图,上述装置包括:
信息获得模块701,用于获得告警信息;
信息组获得模块702,用于基于所述告警信息中包含的信息,根据预设的表征告警信息间关联关系的关联规则,对所获得的告警信息进行关联性分析,得到告警信息间具有关联关系的告警信息组;
信息合并模块703,用于对所述告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果;
结果获得模块704,用于根据合并处理结果,获得对目标故障进行故障诊断的结果,其中,所述目标故障为:直接触发所述告警信息组中各告警信息生成的网络故障。
由以上可见,由以上可见,由于告警信息组中包含的告警信息之间具有关联关系,因此可以认为触发生成告警信息组中包含的告警信息的目标故障之间存在关联关系,所以可以对告警信息组中具有关联关系的各告警信息内包含的信息进行合并处理,得到的各项信息的合并处理结果可以代表上述告警信息组中的各条告警信息。进一步的可以认为根据合并处理结果得到的故障诊断的结果可以代表告警信息组中的各条告警信息,故障诊断结果可以反映触发生成各告警信息的各目标故障。上述进行故障诊断的过程不需要工作人员对大量告警信息进行分析,因此可以提高故障诊断的效率。
参见图8,为本发明实施例中提供的第二种网络故障诊断装置的结构示意图,与前述图7所示的实施例相比,所述装置还包括:
信息确定模块705,用于针对每一告警信息,根据预设的日志模板,确定以下信息中的至少一种:该告警信息的故障类型、故障级别、以及所述告警信息影响的业务;
其中,日志模板中包括告警信息与故障类型和\或故障级别和\或告警信息影响的业务的对应关系。
由以上可见,通过上述日志模板可以确定上述告警信息对应的故障类型、故障级别以及告警信息影响的业务,而上述故障类型、故障级别以及告警信息影响的业务往往为故障诊断过程中着重注意的信息。因此确定出各条告警信息的故障类型、故障级别以及告警信息影响的业务信息,可以便于得到故障诊断的结果。
本发明的一个实施例中,上述信息合并模块703,具体用于:
根据所述告警信息组中告警信息间的关联关系,获得反映根源性故障的根源告警信息,其中,所述根源性故障为:触发所述告警信息组中各告警信息生成的故障;
确定所述根源告警信息中包含的各项信息的取值,作为对所述告警信息组中各告警信息内包含的各项信息进行合并处理的合并处理结果。
由以上可见,可以确定引发上述告警信息组中各告警信息所反映的目标故障的根源性故障,由于上述根源性故障是引发上述目标故障的原因,因此上述根源性故障可以代表上述目标故障,则反映上述根源性故障的根源告警信息可以代表上述告警信息组中的各告警信息。所以可以将上述根源告警信息中包含的各项信息作为上述合并处理结果。
本发明的一个实施例中,上述信息合并模块703,具体用于:
针对告警信息中包含的每一种信息,对该信息的各项取值在所述告警信息组内各告警信息中出现的频次进行统计,按照统计结果对该信息进行合并处理,得到该项信息的合并处理结果。
由以上可见,对告警信息组中各告警信息中各信息的信息取值出现的频次进行统计,可以确定各信息的各项信息取值的出现情况,根据所确定的出现情况可以得到上述合并处理结果。因此上述合并处理结果能够表示各项信息取值的出现情况,使得上述合并处理结果能够代表上述告警信息组中各告警信息的信息取值。
本发明的一个实施例中,上述信息获得模块701,具体用于:
获得原始告警信息;
选择生成原始告警信息的通信设备之间具有拓扑关系和/或生成时间属于预设时间段内的原始告警信息,作为告警信息。
由以上可见,上述告警信息是对原始告警信息进行筛选得到的,筛选得到的告警信息之间时间差较小,或生成告警信息的通信设备之间存在拓扑关系。因此上述告警信息之间存在关联关系的可能性较高,也就较易于根据关联规则查找到告警信息之间的关联关系,较易于确定上述告警信息组。
本发明的一个实施例中,对目标故障进行故障诊断的结果中,还包括:
反映根源性故障的根源告警信息、表示所述根源性故障是引发目标故障的原因的根因概率。
本发明实施例还提供了一种电子设备,如图9所示,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信,
存储器903,用于存放计算机程序;
处理器901,用于执行存储器903上所存放的程序时,实现上述网络故障诊断方法任一所述的方法步骤。
应用本发明实施例提供的电子设备进行网络故障诊断时,由于告警信息组中包含的告警信息之间具有关联关系,因此可以认为触发生成告警信息组中包含的告警信息的目标故障之间存在关联关系,所以可以对告警信息组中具有关联关系的各告警信息内包含的信息进行合并处理,得到的各项信息的合并处理结果可以代表上述告警信息组中的各条告警信息。进一步的可以认为根据合并处理结果得到的故障诊断的结果可以代表告警信息组中的各条告警信息,故障诊断结果可以反映触发生成各告警信息的各目标故障。上述进行故障诊断的过程不需要工作人员对大量告警信息进行分析,因此可以提高故障诊断的效率。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述网络故障诊断方法任一所述的方法步骤。
执行本发明实施例提供的计算机可读存储介质中存储的计算机程序进行网络故障诊断时,由以上可见,由于告警信息组中包含的告警信息之间具有关联关系,因此可以认为触发生成告警信息组中包含的告警信息的目标故障之间存在关联关系,所以可以对告警信息组中具有关联关系的各告警信息内包含的信息进行合并处理,得到的各项信息的合并处理结果可以代表上述告警信息组中的各条告警信息。进一步的可以认为根据合并处理结果得到的故障诊断的结果可以代表告警信息组中的各条告警信息,故障诊断结果可以反映触发生成各告警信息的各目标故障。上述进行故障诊断的过程不需要工作人员对大量告警信息进行分析,因此可以提高故障诊断的效率。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述网络故障诊断方法任一所述的方法步骤。
执行本发明实施例提供的计算机程序进行网络故障诊断的情况下,由以上可见,由于告警信息组中包含的告警信息之间具有关联关系,因此可以认为触发生成告警信息组中包含的告警信息的目标故障之间存在关联关系,所以可以对告警信息组中具有关联关系的各告警信息内包含的信息进行合并处理,得到的各项信息的合并处理结果可以代表上述告警信息组中的各条告警信息。进一步的可以认为根据合并处理结果得到的故障诊断的结果可以代表告警信息组中的各条告警信息,故障诊断结果可以反映触发生成各告警信息的各目标故障。上述进行故障诊断的过程不需要工作人员对大量告警信息进行分析,因此可以提高故障诊断的效率。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质和计算机程序产品而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种网络故障诊断方法,其特征在于,所述方法包括:
获得告警信息;
基于所述告警信息中包含的信息,根据预设的表征告警信息间关联关系的关联规则,对所获得的告警信息进行关联性分析,得到告警信息间具有关联关系的告警信息组;
对所述告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果;
根据合并处理结果,获得对目标故障进行故障诊断的结果,其中,所述目标故障为:直接触发所述告警信息组中各告警信息生成的网络故障;
所述对所述告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果,包括:
根据所述告警信息组中告警信息间的关联关系,获得反映根源性故障的根源告警信息,其中,所述根源性故障为:触发所述告警信息组中各告警信息生成的故障;确定所述根源告警信息中包含的各项信息的取值,作为对所述告警信息组中各告警信息内包含的各项信息进行合并处理的合并处理结果。
2.根据权利要求1所述的方法,其特征在于,在所述获得告警信息之后,所述方法还包括:
针对每一告警信息,根据预设的日志模板,确定以下信息中的至少一种:该告警信息的故障类型、故障级别、以及所述告警信息影响的业务;
其中,日志模板中包括告警信息与故障类型和\或故障级别和\或告警信息影响的业务的对应关系。
3.根据权利要求1所述的方法,其特征在于,所述对所述告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果,包括:
针对告警信息中包含的每一项信息,对该信息的各项取值在所述告警信息组内各告警信息中出现的频次进行统计,按照统计结果对该信息进行合并处理,得到该项信息的合并处理结果。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述获得告警信息,包括:
获得原始告警信息;
选择生成原始告警信息的通信设备之间具有拓扑关系和/或生成时间属于预设时间段内的原始告警信息,作为告警信息。
5.根据权利要求1-3中任一项所述的方法,其特征在于,所述对目标故障进行故障诊断的结果中,还包括:
反映根源性故障的根源告警信息、表示所述根源性故障是引发目标故障的原因的根因概率。
6.一种网络故障诊断装置,其特征在于,所述装置包括:
信息获得模块,用于获得告警信息;
信息组获得模块,用于基于所述告警信息中包含的信息,根据预设的表征告警信息间关联关系的关联规则,对所获得的告警信息进行关联性分析,得到告警信息间具有关联关系的告警信息组;
信息合并模块,用于对所述告警信息组中各告警信息内包含的各项信息进行合并处理,得到各项信息的合并处理结果;
结果获得模块,用于根据合并处理结果,获得对目标故障进行故障诊断的结果,其中,所述目标故障为:直接触发所述告警信息组中各告警信息生成的网络故障;
所述信息合并模块,具体用于:
根据所述告警信息组中告警信息间的关联关系,获得反映根源性故障的根源告警信息,其中,所述根源性故障为:触发所述告警信息组中各告警信息生成的故障;确定所述根源告警信息中包含的各项信息的取值,作为对所述告警信息组中各告警信息内包含的各项信息进行合并处理的合并处理结果。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
信息确定模块,用于针对每一告警信息,根据预设的日志模板,确定以下信息中的至少一种:该告警信息的故障类型、故障级别、以及所述告警信息影响的业务;
其中,日志模板中包括告警信息与故障类型和\或故障级别和\或告警信息影响的业务的对应关系。
8.根据权利要求6所述的装置,其特征在于,所述信息合并模块,具体用于:
针对告警信息中包含的每一种信息,对该信息的各项取值在所述告警信息组内各告警信息中出现的频次进行统计,按照统计结果对该信息进行合并处理,得到该项信息的合并处理结果。
9.根据权利要求6-8中任一项所述的装置,其特征在于,所述信息获得模块,具体用于:
获得原始告警信息;
选择生成原始告警信息的通信设备之间具有拓扑关系和/或生成时间属于预设时间段内的原始告警信息,作为告警信息。
10.根据权利要求6-8中任一项所述的装置,其特征在于,所述对目标故障进行故障诊断的结果中,还包括:
反映根源性故障的根源告警信息、表示所述根源性故障是引发目标故障的原因的根因概率。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法步骤。
CN202110328040.9A 2021-03-26 2021-03-26 一种网络故障诊断方法及装置 Active CN113037564B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110328040.9A CN113037564B (zh) 2021-03-26 2021-03-26 一种网络故障诊断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110328040.9A CN113037564B (zh) 2021-03-26 2021-03-26 一种网络故障诊断方法及装置

Publications (2)

Publication Number Publication Date
CN113037564A CN113037564A (zh) 2021-06-25
CN113037564B true CN113037564B (zh) 2022-07-22

Family

ID=76472613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110328040.9A Active CN113037564B (zh) 2021-03-26 2021-03-26 一种网络故障诊断方法及装置

Country Status (1)

Country Link
CN (1) CN113037564B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114978862B (zh) * 2022-06-21 2024-03-12 浪潮通信信息系统有限公司 传输网络的故障风险分析方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018010176A1 (zh) * 2016-07-15 2018-01-18 华为技术有限公司 获取故障信息的方法及设备
CN109787817A (zh) * 2018-12-28 2019-05-21 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) 网络故障诊断方法、装置和计算机可读存储介质
CN111010297A (zh) * 2019-12-04 2020-04-14 国网山东省电力公司信息通信公司 电力通信网支持跨专业故障的智能分析方法及系统
CN112286987A (zh) * 2020-10-21 2021-01-29 国网电力科学研究院武汉南瑞有限责任公司 基于Apriori算法的电力物联异常告警压缩方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7237138B2 (en) * 2000-05-05 2007-06-26 Computer Associates Think, Inc. Systems and methods for diagnosing faults in computer networks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018010176A1 (zh) * 2016-07-15 2018-01-18 华为技术有限公司 获取故障信息的方法及设备
CN109787817A (zh) * 2018-12-28 2019-05-21 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) 网络故障诊断方法、装置和计算机可读存储介质
CN111010297A (zh) * 2019-12-04 2020-04-14 国网山东省电力公司信息通信公司 电力通信网支持跨专业故障的智能分析方法及系统
CN112286987A (zh) * 2020-10-21 2021-01-29 国网电力科学研究院武汉南瑞有限责任公司 基于Apriori算法的电力物联异常告警压缩方法

Also Published As

Publication number Publication date
CN113037564A (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
EP3882773B1 (en) Method and system for automatic real-time causality analysis of end user impacting system anomalies using causality rules and topological understanding of the system to effectively filter relevant monitoring data
EP3379419B1 (en) Situation analysis
US11657309B2 (en) Behavior analysis and visualization for a computer infrastructure
US8583779B2 (en) Root cause analysis approach with candidate elimination using network virtualization
US6941367B2 (en) System for monitoring relevant events by comparing message relation key
JP5385982B2 (ja) 障害の根本原因に対応した復旧方法を表す情報を出力する管理システム
US8370466B2 (en) Method and system for providing operator guidance in network and systems management
CN113328872B (zh) 故障修复方法、装置和存储介质
EP3327637B1 (en) On-demand fault reduction framework
Wang et al. Efficient alarm behavior analytics for telecom networks
JP2017509262A (ja) ネットワーク障害のトラブルシューティング・オプションの識別
EP3232620B1 (en) Data center based fault analysis method and device
CN113268399B (zh) 一种告警处理方法、装置和电子设备
US10884805B2 (en) Dynamically configurable operation information collection
JP2007148728A (ja) ポリシ制御方法、装置及びプログラム
CN113037564B (zh) 一种网络故障诊断方法及装置
CN110943887A (zh) 探针调度方法、装置、设备和存储介质
JP2014053658A (ja) 障害部位推定システムおよび障害部位推定プログラム
JP2017199250A (ja) 計算機システム、データの分析方法、及び計算機
CN112887208B (zh) 一种路由泄露检测方法、装置及设备
JP2020042507A (ja) 診断装置
Kobayashi et al. amulog: A general log analysis framework for comparison and combination of diverse template generation methods
US10432451B2 (en) Systems and methods for managing network health
AT&T Title for USENIX Conference Paper: Sample First Page
US7558770B2 (en) Method and system to detect application non-conformance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant