CN110149223A - 故障定位方法和设备 - Google Patents

故障定位方法和设备 Download PDF

Info

Publication number
CN110149223A
CN110149223A CN201910387483.8A CN201910387483A CN110149223A CN 110149223 A CN110149223 A CN 110149223A CN 201910387483 A CN201910387483 A CN 201910387483A CN 110149223 A CN110149223 A CN 110149223A
Authority
CN
China
Prior art keywords
alarm
network node
network
node
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910387483.8A
Other languages
English (en)
Other versions
CN110149223B (zh
Inventor
王瑜
赵越
周莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201910387483.8A priority Critical patent/CN110149223B/zh
Publication of CN110149223A publication Critical patent/CN110149223A/zh
Application granted granted Critical
Publication of CN110149223B publication Critical patent/CN110149223B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种故障定位方法和设备。该方法包括:根据告警数据,确定告警次数最多的第一网络节点;根据所述第一网络节点,确定与所述第一网络节点置信度最高的第二网络节点;根据所述第一网络节点和所述第二网络节点,确定所述第一网络节点所在的第一网络拓扑层和所述第二网络节点所在的第二网络拓扑层;在所述第一网络拓扑层和所述第二网络拓扑层中确定故障网络节点。和现有技术中凭借人工经验定位故障网络节点的方法相比,提高了定位准确度。

Description

故障定位方法和设备
技术领域
本发明涉及通信领域,尤其涉及一种故障定位方法和设备。
背景技术
对运营商来说,通信网络管理是确保通信网络能够高效、可靠和低成本运行的重要环节。通信网络存在网络节点规模大、网络复杂度高以及网络异构性强等特点,以至于网络中任何一个节点发生故障时其他网络节点都有可能受到影响和波及,从而产生大量的冗余告警。如何根据海量的告警数据对发生故障的根源节点进行精准高效的定位,对网络维护成本及缩短故障影响至关重要。
传统的故障定位方法为,工作人员依据经验对告警数据进行分析,根据分析结果定位发生故障的根源节点。然而,依据经验定位得到的根源故障节点准确度低。
发明内容
本发明提供一种故障定位方法和设备。用于解决现有技术中依据经验定位得到的根源故障节点准确度低的问题。
第一方面,本发明提供一种故障定位方法,包括:
根据告警数据,确定告警次数最多的第一网络节点;
根据所述第一网络节点,确定与所述第一网络节点置信度最高的第二网络节点;
根据所述第一网络节点和所述第二网络节点,确定所述第一网络节点所在的第一网络拓扑层和所述第二网络节点所在的第二网络拓扑层;
在所述第一网络拓扑层和所述第二网络拓扑层中确定故障网络节点。
可选的,所述在所述第一网络拓扑层和所述第二网络拓扑层中确定故障网络节点,包括:
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点的告警次数;
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点与所述第一网络节点的置信度;
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点的告警级别;
根据所述告警次数、所述置信度和所述告警级别,确定所述故障网络节点。
可选的,所述根据告警数据,确定告警次数最多的第一网络节点,包括:
对告警数据进行预处理,得到告警事务数据库;
根据所述告警事务数据库,获取每个告警网络节点的频繁项集;
根据每个告警网络节点的频繁项集,确定所述告警次数最多的第一网络节点。
可选的,所述对告警数据进行预处理,得到告警事务数据库,包括:
分别删除告警数据中无法识别的告警数据和缺失目标告警信息的告警数据,并对告警数据中存在缺失的告警数据进行填充,得到预处理后的告警数据;
将所述预处理后的告警数据按照时间段划分至N个告警事务中,每个告警事务对应M个告警数据,所述N个告警事务和N个告警事务对应的告警数据构成所述告警事务数据库,其中,M和N均为大于等于1的整数。
可选的,所述根据所述告警事务数据库,获取每个告警网络节点的频繁项集,包括:
根据所述告警事务数据库,计算每个告警网络节点的支持度;
根据所述支持度,对每个告警事务对应的M个告警数据重新排序,得到更新后的告警事务数据库;
根据所述更新后的告警事务数据库,采用频繁模式树FP-tree算法确定每个告警网络节点的频繁项集。
可选的,所述根据所述第一网络节点,确定与所述第一网络节点置信度最高的第二网络节点,包括:
获取每个告警网络节点与所述第一网络节点同时发生告警的次数;
根据所述第一网络节点发生告警的次数,以及每个告警网络节点与所述第一网络节点同时发生告警的次数,确定与所述第一网络节点置信度最高的第二网络节点。
可选的,所述告警数据中的告警信息包括:网络节点标识、网络节点类型标识和告警发生时间。
第二方面,本发明提供一种故障定位装置,包括:
第一确定模块,用于根据告警数据,确定告警次数最多的第一网络节点;
第二确定模块,用于根据所述第一网络节点,确定与所述第一网络节点置信度最高的第二网络节点;
第三确定模块,用于根据所述第一网络节点和所述第二网络节点,确定所述第一网络节点所在的第一网络拓扑层和所述第二网络节点所在的第二网络拓扑层;
第四确定模块,用于在所述第一网络拓扑层和所述第二网络拓扑层中确定故障网络节点。
可选的,所述第四确定模块,具体用于:
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点的告警次数;
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点与所述第一网络节点的置信度;
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点的告警级别;
根据所述告警次数、所述置信度和所述告警级别,确定所述故障网络节点。
可选的,所述第一确定模块,具体用于:
对告警数据进行预处理,得到告警事务数据库;
根据所述告警事务数据库,获取每个告警网络节点的频繁项集;
根据每个告警网络节点的频繁项集,确定所述告警次数最多的第一网络节点。
可选的,所述第一确定模块,具体用于:
分别删除告警数据中无法识别的告警数据和缺失目标告警信息的告警数据,并对告警数据中存在缺失的告警数据进行填充,得到预处理后的告警数据;
将所述预处理后的告警数据按照时间段划分至N个告警事务中,每个告警事务对应M个告警数据,所述N个告警事务和N个告警事务对应的告警数据构成所述告警事务数据库,其中,M和N均为大于等于1的整数。
可选的,所述第一确定模块,具体用于:
根据所述告警事务数据库,计算每个告警网络节点的支持度;
根据所述支持度,对每个告警事务对应的M个告警数据重新排序,得到更新后的告警事务数据库;
根据所述更新后的告警事务数据库,采用频繁模式树FP-tree算法确定每个告警网络节点的频繁项集。
可选的,所述第二确定模块,具体用于:
获取每个告警网络节点与所述第一网络节点同时发生告警的次数;
根据所述第一网络节点发生告警的次数,以及每个告警网络节点与所述第一网络节点同时发生告警的次数,确定与所述第一网络节点置信度最高的第二网络节点。
可选的,所述告警数据中的告警信息包括:网络节点标识、网络节点类型标识和告警发生时间。
第三方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述故障定位方法。
第四方面,本发明提供一种服务器,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来实现上述故障定位方法。
本发明提供的故障定位方法和设备,在得到通信网络的告警数据后,先根据该告警数据,确定告警次数最多的第一网络节点;然后确定与该第一网络节点置信度最高的第二网络节点;进而根据第一网络节点和第二网络节点,确定第一网络节点所在的第一网络拓扑层和第二网络节点所在的第二网络拓扑层了;最后在第一网络拓扑层和第二网络拓扑层中确定故障网络节点。和现有技术中凭借人工经验定位故障网络节点的方法相比,提高了定位准确度。
附图说明
图1为本发明提供的故障定位方法的实施例一的流程示意图;
图2为本发明提供的故障定位方法的实施例二的流程示意图;
图3为本发明提供的故障定位方法的实施例三的流程示意图;
图4为本发明提供的一条件模式树的示意图;
图5为本发明提供的另一条件模式树的示意图;
图6为本发明提供的又一条件模式树的示意图;
图7为本发明提供的故障定位装置的结构示意图;
图8为本发明提供的服务器的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
通信网络中网路节点规模巨大,当通信网络中任何一个网络节点发生故障时,其他网络节点都有可能受到影响和波及,从而产生大量的冗余告警。现有技术中,工作人员依据经验对告警数据进行分析,然后根据分析结果定位发生故障的根源节点。然而,告警数据体量巨大,现有技术的这种故障定位方法效率较低,且依靠人工经验定位得到的根源故障节点准确度不高。
为了解决现有技术存在的上述技术问题,本发明提供一种故障定位方法,在得到通信网络的告警数据后,先根据该告警数据,确定告警次数最多的第一网络节点;然后确定与该第一网络节点置信度最高的第二网络节点;进而根据第一网络节点和第二网络节点,确定第一网络节点所在的第一网络拓扑层和第二网络节点所在的第二网络拓扑层了;最后在第一网络拓扑层和第二网络拓扑层中确定根源故障节点。
由于,告警次数最多的网络节点有可能是根源故障节点,也有可能是与根源故障节点存在强相关关系的网络节点。因此,根源故障节点存在于告警次数最多的网络节点所在的网络拓扑层,或者存在于与告警次数最多的网络节点置信度最高的网络节点所在的网络拓扑层的可能性很大,本发明提供的上述故障定位方法,在确定告警次数最多的第一网络节点,以及与第一网络节点置信度最高的第二网络节点后,提取出这两个网络节点所在的网络拓扑层,并在这两个网络节点所在的网络拓扑层定位故障网络节点,可提高故障定位准确度,并且和人工定位根源故障节点相比,提高了定位效率。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图1为本发明提供的故障定位方法的实施例一的流程示意图。本实施例提供的故障定位方法,可以通过软件、硬件或者软硬件结合的方式实现。如图1所示,本实施例提供的故障定位方法,可以包括:
S101、根据告警数据,确定告警次数最多的第一网络节点。
可选的,在得到通信网络的告警数据后,可通过告警相关性分析来确定告警次数最多的第一网络节点。
可选的,告警数据中的告警信息包括:网络节点标识、网络节点类型标识和告警发生时间等。
S102、根据所述第一网络节点,确定与所述第一网络节点置信度最高的第二网络节点。
可选的,确定第二网络节点的一种可实现方式为:首先,获取每个告警网络节点与所述第一网络节点同时发生告警的次数;然后,根据所述第一网络节点发生告警的次数,以及每个告警网络节点与所述第一网络节点同时发生告警的次数,确定与所述第一网络节点置信度最高的第二网络节点。
可选的,可采用如下公式计算置信度:
其中,{A→B}表示网络节点A和网络节点B之间的置信度,事件{A,B}发生次数表示网络节点A和网络节点B同时发生告警的次数,岁件{A}发生次数表示网络节点A发生告警的次数。
具体的,在S101确定了告警次数最多的第一网络节点后,可采用上述公式计算每个告警节点与第一网络节点的置信度,并将计算出来的与第一网络节点的置信度最高的网络节点确定为第二网络节点。
举例来说,假设S101确定的告警次数最多的第一网络节点为网络节点A,通信网络中出现告警的网络节点还包括:网络节点B、网络节点C、网络节点D……等,分别计算这些网络节点与网络节点A的置信度,假设经计算,网络节点B与网络节点A的置信度最大,则将网络节点B确定为第二网络节点。
S103、根据所述第一网络节点和所述第二网络节点,确定所述第一网络节点所在的第一网络拓扑层和所述第二网络节点所在的第二网络拓扑层。
通信网络中,网络拓扑层的结构是已知的,各网络拓扑层中网络节点的分布也是已知的,在S102和S103确定第一网络节点和第二网络节点后,可根据该第一网络节点确定第一网络节点所在的第一网络拓扑层,根据第二网络节点确定第二网络节点所在的第二网络拓扑层。
S104、在所述第一网络拓扑层和所述第二网络拓扑层中确定故障网络节点。
可选的,可先找出第一网络拓扑层和第二网络拓扑层中所有告警网络节点,然后调取第一网络拓扑层和第二网络拓扑层中所有告警网络节点的告警数据,根据调取到的每个告警网络节点的告警数据,判断对应的告警网络节点是否为故障网络节点。
本实施例提供的故障定位方法,在得到通信网络的告警数据后,先根据该告警数据,确定告警次数最多的第一网络节点;然后确定与该第一网络节点置信度最高的第二网络节点;进而根据第一网络节点和第二网络节点,确定第一网络节点所在的第一网络拓扑层和第二网络节点所在的第二网络拓扑层了;最后在第一网络拓扑层和第二网络拓扑层中确定故障网络节点。和现有技术中凭借人工经验定位故障网络节点的方法相比,提高了定位准确度。
下面结合具体的实施例对上述实施例中在第一网络拓扑层和第二网络拓扑层中确定故障网络节点的过程进行详细描述。图2为本发明提供的故障定位方法的实施例二的流程示意图。如图2所示,本实施例提供的故障定位方法,可以包括:
S201、根据告警数据,确定告警次数最多的第一网络节点。
S202、根据所述第一网络节点,确定与所述第一网络节点置信度最高的第二网络节点。
S203、根据所述第一网络节点和所述第二网络节点,确定所述第一网络节点所在的第一网络拓扑层和所述第二网络节点所在的第二网络拓扑层。
其中,S201-S203的实现方式可参见上述实施例S101-S103,本发明对此不再赘述。
S204、分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点的告警次数。
S205、分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点与所述第一网络节点的置信度。
S206、分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点的告警级别。
S207、根据所述告警次数、所述置信度和所述告警级别,确定所述故障网络节点。
可选的,在S203确定了第一网络节点所在的第一网络拓扑层和第二网络节点所在的第二网络拓扑层后,先找出第一网络拓扑层和第二网络拓扑层中所有发生告警的告警网络节点,然后统计这些告警网络节点中每个告警网络节点的告警次数、计算每个告警网络节点与第一网络节点的置信度以及统计每个告警网络节点的告警级别,最后根据每个告警网络节点的这三个参数确定故障网络节点。
下面通过举例对上述S204-S207的过程进行说明:
假设第一网络节点所在的第一网络拓扑层为拓扑层A,第二网络节点所在的第二网络拓扑层为拓扑层B。并且经统计后得到,拓扑层A中发生告警的告警网络节点有:告警网络节点A1、告警网络节点A2、告警网络节点A3…告警网络节点An,拓扑层B中发生告警的告警网络节点有:告警网络节点B1、告警网络节点B2、告警网络节点B3…告警网络节点Bn。
一方面,分别对拓扑层A中告警网络节点A1、告警网络节点A2、告警网络节点A3…告警网络节点An的告警次数进行统计,同样的,分别对拓扑层B中告警网络节点B1、告警网络节点B2、告警网络节点B3…告警网络节点Bn的告警次数进行统计。
另一方面,分别计算拓扑层A中告警网络节点A1、告警网络节点A2、告警网络节点A3…告警网络节点An与第一网络节点的置信度,同样的,分别计算拓扑层B中告警网络节点B1、告警网络节点B2、告警网络节点B3…告警网络节点Bn与第一网络节点的置信度。
再一方面,分别对拓扑层A中告警网络节点A1、告警网络节点A2、告警网络节点A3…告警网络节点An的告警级别进行统计,同样的,分别对拓扑层B中告警网络节点B1、告警网络节点B2、告警网络节点B3…告警网络节点Bn的告警级别进行统计。可选的,此处的告警级别可以是告警网路节点发生的多次告警的平均级别。
在得到拓扑层A和拓扑层B中每个告警网络节点的上述三个参数后,可采用如下方式确定根源故障节点:
一种可实现的方式为:将拓扑层A和拓扑层B中上述三个参数对应的值均为最高的告警网络节点确定为根源故障节点。比如:经比较,拓扑层A中告警网络节点A2的告警次数相较于拓扑层A和拓扑层B其他告警网络节点最高,并且告警网络节点A2与第一网络节点的置信度相较于拓扑层A和拓扑层B其他告警网络节点也最高,并且告警网络节点A2的告警级别相较于拓扑层A和拓扑层B其他告警网络节点也最高,则可直接将告警网络节点A2确定为根源故障节点。
另一种可实现的方式为:设定次数阈值M、置信度阈值N以及级别阈值P,将拓扑层A和拓扑层B中所有告警网络节点的上述三个参数与对应阈值进行比较,将上述三个参数均大于对应阈值的告警网络节点作为候选故障节点,然后对候选故障节点进行进一步排查,得到根源故障节点。比如:经比较,拓扑层A中告警网络节点A1和告警网络节点A2,以及拓扑层B中告警网络节点B3对应的上述三个参数均大于对于的阈值,则可将警网络节点A1、告警网络节点A2和告警网络节点B3作为候选故障节点,然后对警网络节点A1、告警网络节点A2和告警网络节点B3做进行进一步排查,从而得到根源故障节点。
本实施例提供的故障定位方法,对如何在第一网络拓扑层和第二网络拓扑层中确定故障网络节点的实现方式进行了详细描述,本实施例提供的这种根源故障节点的定位方法,和现有技术中依据人工经验定位故障节点的方法相比,提高了定位准确度。
下面结合具体的实施例对上述实施例中如何根据告警数据,确定告警次数最多的第一网络节点的实现方式进行详细描述。图3为本发明提供的故障定位方法的实施例三的流程示意图。如图3所示,本实施例提供的故障定位方法,可以包括:
S301、对告警数据进行预处理,得到告警事务数据库。
可选的,可通过如下步骤对告警数据进行预处理,得到告警事务数据库:
步骤A、分别删除告警数据中无法识别的告警数据和缺失目标告警信息的告警数据,并对告警数据中存在缺失的告警数据进行填充,得到预处理后的告警数据。
其中,无法识别的告警数据指的是关键信息无法识别的告警数据,比如包括:无法识别网络节点标识的告警数据或者无法识别告警类型标识的告警数据等。
其中,缺失目标告警信息的告警数据可以包括:缺失网络节点标识的告警数据、缺失告警类型标识的告警数据以及缺失时间标识的告警数据。
其中,对告警数据中存在缺失的告警数据进行填充可以为:根据告警数据中存在的字段推导出缺失的字段,根据推到出的字段将存在缺失的告警数据补齐。比如:通信网络中有些网络节点的英文标识不全,可根据网络节点的中文标识将英文标识补全。
步骤B、将所述预处理后的告警数据按照时间段划分至N个告警事务中,每个告警事务对应M个告警数据,所述N个告警事务和N个告警事务对应的告警数据构成所述告警事务数据库,其中,M和N均为大于等于1的整数。
具体的,先将所有告警数据按照时间顺序排序,然后将排序后的告警数据按照时间段划分至N个告警事物中,每个时间段对应各一个时间窗口。
举例来说,假设一段时间内的所有告警数据按照时间顺序排序后表示为:i1,i2,i5,i2,i4,i2,i3,i1,i2,i4,i1,i3,i2,i3,i1,i3,i1,i2,i3,i5,i1,i2,i3;其中ii的下标为网络节点的标识,比如i1表示网络节点1的告警数据。参见表1所示,将上述按照时间顺序排序后的告警数据按照某一时间窗口划分到9个告警事物中,9个告警事物分别为t1,t2,…,t9。这9个告警事务和9个告警事务对应的告警数据构成了告警事务数据库。
表1
告警事务ID 告警数据列表
t<sub>1</sub> i<sub>1</sub>,i<sub>2</sub>,i<sub>5</sub>
t<sub>2</sub> i<sub>2</sub>,i<sub>4</sub>
t<sub>3</sub> i<sub>2</sub>,i<sub>3</sub>
t<sub>4</sub> i<sub>1</sub>,i<sub>2</sub>,i<sub>4</sub>
t<sub>5</sub> i<sub>1</sub>,i<sub>3</sub>
t<sub>6</sub> i<sub>2</sub>,i<sub>3</sub>
t<sub>7</sub> i<sub>1</sub>,i<sub>3</sub>
t<sub>8</sub> i<sub>1</sub>,i<sub>2</sub>,i<sub>3</sub>,i<sub>5</sub>
t<sub>9</sub> i<sub>1</sub>,i<sub>2</sub>,i<sub>3</sub>
S302、根据所述告警事务数据库,获取每个告警网络节点的频繁项集。
可选的,可通过如下步骤获取每个告警网络节点的频繁项集:
步骤A、根据所述告警事务数据库,计算每个告警网络节点的支持度。
步骤B、根据所述支持度,对每个告警事务对应的M个告警数据重新排序,得到更新后的告警事务数据库。
其中,告警网络节点的支持度指的是该告警网络节点出现告警的次数。以表1为例,网络节点1的告警数据i1分别在t1、t4、t5、t7、t8和t9中各出现一次,即网络节点1的告警次数为6次,则网络节点1的支持度为6。同理可以统计得到,参见表2所示,网络节点2的支持度为7,网络节点3的支持度为6,网络节点4的支持度为2,网络节点5的支持度为2。
表2
告警网络节点 支持度
网络节点2 7
网络节点1 6
网络节点3 6
网络节点4 2
网络节点5 2
得到每个告警网络节点的支持度的大小后,将每个告警事务对应的各告警数据按照支持度大小重新进行排序,比如:对于表1中的告警事务t1,其对应的告警数据按照时间顺序排序为i1,i2,i5,将这三个告警数据按照表2中支持度从大到小排序则为i2,i1,i5,同理对其他告警事务对应的告警数据进行排序可得到表3所示结果,图3中的告警事务以及对应的告警数据构成了更新后的告警事务数据库。
表3
告警事务ID 告警数据列表
t<sub>1</sub> i<sub>2</sub>,i<sub>1</sub>,i<sub>5</sub>
t<sub>2</sub> i<sub>2</sub>,i<sub>4</sub>
t<sub>3</sub> i<sub>2</sub>,i<sub>3</sub>
t<sub>4</sub> i<sub>2</sub>,i<sub>1</sub>,l<sub>4</sub>
t<sub>5</sub> i<sub>1</sub>,i<sub>3</sub>
t<sub>6</sub> i<sub>2</sub>,i<sub>3</sub>
t<sub>7</sub> i<sub>1</sub>,l<sub>3</sub>
t<sub>8</sub> i<sub>2</sub>,i<sub>1</sub>,i<sub>3</sub>,i<sub>5</sub>
t<sub>9</sub> i<sub>2</sub>,i<sub>1</sub>,i<sub>3</sub>
步骤C、根据所述更新后的告警事务数据库,采用频繁模式树FP-tree算法确定每个告警网络节点的频繁项集。
下面通过举例对本步骤中确定频繁项集的过程进行说明:
设定支持度阈值为2,以表3中网络节点5为例,构建网络节点5的条件模式树,包含告警数据i5的事务项有t1={i2,i1,i5},t8={i2,i1,,i3,i5},参见图4所示,使用告警数据i5的祖先路径构建条件模式树。
由图4所示条件模式树可以看出,告警数据i3的支持度计数不满足支持度阈值,将告警数据i3节点去掉,条件模式树成为单路径的模式树,其为最终告警数据i5的频繁模式树,其模式后缀为i5,取条件模式树中所有告警数据与告警数据i5的组合,可得到告警数据i5的频繁项集{i1,i5:2},{i2,i5:2}和{i1,i2,i5:2}。其中,后面的数字2为对应频繁项集的支持度。
上述网络节点5的条件模式树为单一路径,不需要进行递归挖掘既可得到频繁项集,然而一般情况需要递归挖掘,下面以网络节点3为例进行说明,构建告警数据i3的条件模式树,包含告警数据i3的告警事务有t3={i2,i3},t5={i1,i3},t6={i2,i3},t7={i1,i3},t8={i2,i1,,i3,i5},t9={i2,i1,i3},使用告警数据i3的祖先路径构建条件模式树,如图5所示。该条件模式树的后缀为i3,i3与告警数据列表中的节点合并可得频繁项{i2,i3:4},{i1,i3:4}。
告警数据i3的条件模式树并非单路径,所得到的频繁项集并非包含告警数据i3的所有情况,因此需进行递归挖掘,在图5所示条件模式树基础上考虑告警数据i1的条件模式树,如图6所示。图6所示条件模式树的后缀是{i1,i3},对图6所示告警网络节点进行合并,则可得频繁项集{i2,i1,i3:2}。至此,可得到所有包含告警数据i3的频繁项集,以及各项集的支持度计数。
S303、根据每个告警网络节点的频繁项集,确定所述告警次数最多的第一网络节点。
可选的,在S302得到每个告警网络节点的频繁项集的基础上,可根据每个告警网络节点的频繁项集的支持度计数确定告警次数最多的第一网络节点,比如可将频繁项集的累计支持度值最大的告警网络节点确定为第一网络节点。
S304、根据所述第一网络节点,确定与所述第一网络节点置信度最高的第二网络节点。
S305、根据所述第一网络节点和所述第二网络节点,确定所述第一网络节点所在的第一网络拓扑层和所述第二网络节点所在的第二网络拓扑层。
S306、在所述第一网络拓扑层和所述第二网络拓扑层中确定故障网络节点。
其中,S304-S306的实现方式可参见上述实施例,本发明在此不再赘述。
本实施例提供的故障定位方法,描述了如何根据告警数据,确定告警次数最多的第一网络节点的实现方式,为后续以第一网络节点为依据确定根源故障节点的过程提供的依据。
图7为本发明提供的故障定位装置的结构示意图。如图7所示,本实施例提供的故障定位装置,包括:
第一确定模块701,用于根据告警数据,确定告警次数最多的第一网络节点;
第二确定模块702,用于根据所述第一网络节点,确定与所述第一网络节点置信度最高的第二网络节点;
第三确定模块703,用于根据所述第一网络节点和所述第二网络节点,确定所述第一网络节点所在的第一网络拓扑层和所述第二网络节点所在的第二网络拓扑层;
第四确定模块704,用于在所述第一网络拓扑层和所述第二网络拓扑层中确定故障网络节点。
可选的,所述第四确定模块704,具体用于:
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点的告警次数;
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点与所述第一网络节点的置信度;
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点的告警级别;
根据所述告警次数、所述置信度和所述告警级别,确定所述故障网络节点。
可选的,所述第一确定模块701,具体用于:
对告警数据进行预处理,得到告警事务数据库;
根据所述告警事务数据库,获取每个告警网络节点的频繁项集;
根据每个告警网络节点的频繁项集,确定所述告警次数最多的第一网络节点。
可选的,所述第一确定模块701,具体用于:
分别删除告警数据中无法识别的告警数据和缺失目标告警信息的告警数据,并对告警数据中存在缺失的告警数据进行填充,得到预处理后的告警数据;
将所述预处理后的告警数据按照时间段划分至N个告警事务中,每个告警事务对应M个告警数据,所述N个告警事务和N个告警事务对应的告警数据构成所述告警事务数据库,其中,M和N均为大于等于1的整数。
可选的,所述第一确定模块701,具体用于:
根据所述告警事务数据库,计算每个告警网络节点的支持度;
根据所述支持度,对每个告警事务对应的M个告警数据重新排序,得到更新后的告警事务数据库;
根据所述更新后的告警事务数据库,采用频繁模式树FP-tree算法确定每个告警网络节点的频繁项集。
可选的,所述第二确定模块702,具体用于:
获取每个告警网络节点与所述第一网络节点同时发生告警的次数;
根据所述第一网络节点发生告警的次数,以及每个告警网络节点与所述第一网络节点同时发生告警的次数,确定与所述第一网络节点置信度最高的第二网络节点。
可选的,所述告警数据中的告警信息包括:网络节点标识、网络节点类型标识和告警发生时间。
本实施例提供的故障定位装置,可用于执行上述任一实施例描述的故障定位方法,其实现原理和技术效果类似,在此不再赘述。
图8为本发明提供的服务器的硬件结构示意图。如图8所示,本实施例的服务器可以包括:
存储器801,用于存储程序指令。
所述处理器802,用于在所述程序指令被执行时实现上述任一实施例描述的故障定位方法,具体实现原理可参见上述实施例,本实施例此处不再赘述。
本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例描述的故障定位方法。
本发明还提供一种程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得服务器实施上述任一实施例描述的故障定位方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种故障定位方法,其特征在于,包括:
根据告警数据,确定告警次数最多的第一网络节点;
根据所述第一网络节点,确定与所述第一网络节点置信度最高的第二网络节点;
根据所述第一网络节点和所述第二网络节点,确定所述第一网络节点所在的第一网络拓扑层和所述第二网络节点所在的第二网络拓扑层;
在所述第一网络拓扑层和所述第二网络拓扑层中确定故障网络节点。
2.根据权利要求1所述的方法,其特征在于,所述在所述第一网络拓扑层和所述第二网络拓扑层中确定故障网络节点,包括:
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点的告警次数;
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点与所述第一网络节点的置信度;
分别确定所述第一网络拓扑层和所述第二网络拓扑层中每个告警网络节点的告警级别;
根据所述告警次数、所述置信度和所述告警级别,确定所述故障网络节点。
3.根据权利要求1所述的方法,其特征在于,所述根据告警数据,确定告警次数最多的第一网络节点,包括:
对告警数据进行预处理,得到告警事务数据库;
根据所述告警事务数据库,获取每个告警网络节点的频繁项集;
根据每个告警网络节点的频繁项集,确定所述告警次数最多的第一网络节点。
4.根据权利要求3所述的方法,其特征在于,所述对告警数据进行预处理,得到告警事务数据库,包括:
分别删除告警数据中无法识别的告警数据和缺失目标告警信息的告警数据,并对告警数据中存在缺失的告警数据进行填充,得到预处理后的告警数据;
将所述预处理后的告警数据按照时间段划分至N个告警事务中,每个告警事务对应M个告警数据,所述N个告警事务和N个告警事务对应的告警数据构成所述告警事务数据库,其中,M和N均为大于等于1的整数。
5.根据权利要求4所述的方法,其特征在于,所述根据所述告警事务数据库,获取每个告警网络节点的频繁项集,包括:
根据所述告警事务数据库,计算每个告警网络节点的支持度;
根据所述支持度,对每个告警事务对应的M个告警数据重新排序,得到更新后的告警事务数据库;
根据所述更新后的告警事务数据库,采用频繁模式树FP-tree算法确定每个告警网络节点的频繁项集。
6.根据权利要求4所述的方法,其特征在于,所述根据所述第一网络节点,确定与所述第一网络节点置信度最高的第二网络节点,包括:
获取每个告警网络节点与所述第一网络节点同时发生告警的次数;
根据所述第一网络节点发生告警的次数,以及每个告警网络节点与所述第一网络节点同时发生告警的次数,确定与所述第一网络节点置信度最高的第二网络节点。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述告警数据中的告警信息包括:网络节点标识、网络节点类型标识和告警发生时间。
8.一种故障定位装置,其特征在于,包括:
第一确定模块,用于根据告警数据,确定告警次数最多的第一网络节点;
第二确定模块,用于根据所述第一网络节点,确定与所述第一网络节点置信度最高的第二网络节点;
第三确定模块,用于根据所述第一网络节点和所述第二网络节点,确定所述第一网络节点所在的第一网络拓扑层和所述第二网络节点所在的第二网络拓扑层;
第四确定模块,用于在所述第一网络拓扑层和所述第二网络拓扑层中确定故障网络节点。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
10.一种服务器,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来实现权利要求1-7任一项所述的方法。
CN201910387483.8A 2019-05-10 2019-05-10 故障定位方法和设备 Active CN110149223B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910387483.8A CN110149223B (zh) 2019-05-10 2019-05-10 故障定位方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910387483.8A CN110149223B (zh) 2019-05-10 2019-05-10 故障定位方法和设备

Publications (2)

Publication Number Publication Date
CN110149223A true CN110149223A (zh) 2019-08-20
CN110149223B CN110149223B (zh) 2022-04-15

Family

ID=67594206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910387483.8A Active CN110149223B (zh) 2019-05-10 2019-05-10 故障定位方法和设备

Country Status (1)

Country Link
CN (1) CN110149223B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189736A (zh) * 2018-08-01 2019-01-11 中国联合网络通信集团有限公司 一种告警关联规则的生成方法和装置
CN111193605A (zh) * 2019-08-28 2020-05-22 腾讯科技(深圳)有限公司 一种故障定位方法、装置及存储介质
CN111740868A (zh) * 2020-07-07 2020-10-02 腾讯科技(深圳)有限公司 告警数据的处理方法和装置及存储介质
CN112512072A (zh) * 2020-10-12 2021-03-16 中国联合网络通信集团有限公司 VoLTE网络故障预测方法及设备
CN112653587A (zh) * 2019-10-12 2021-04-13 北京奇艺世纪科技有限公司 一种网络连通状态检测方法及装置
CN114050974A (zh) * 2021-10-15 2022-02-15 中国联合网络通信集团有限公司 一种拓扑准确度的确定方法、装置及计算机可读存储介质
CN115914009A (zh) * 2021-08-10 2023-04-04 中国移动通信集团江苏有限公司 ToB专网业务质量测试方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100011410A1 (en) * 2008-07-10 2010-01-14 Weimin Liu System and method for data mining and security policy management
CN104038375A (zh) * 2014-06-30 2014-09-10 成都广达电子股份有限公司 一种广电接入网络告警处理分析系统及其分析方法
CN104158682A (zh) * 2014-08-08 2014-11-19 深圳供电局有限公司 一种基于贡献度的同步数字体系sdh故障定位方法
CN108768753A (zh) * 2018-06-26 2018-11-06 腾讯科技(深圳)有限公司 告警源的定位方法、装置、存储介质及电子装置
CN109189736A (zh) * 2018-08-01 2019-01-11 中国联合网络通信集团有限公司 一种告警关联规则的生成方法和装置
CN109358602A (zh) * 2018-10-23 2019-02-19 山东中创软件商用中间件股份有限公司 一种故障分析方法、装置及相关设备
CN109412867A (zh) * 2018-12-06 2019-03-01 国家电网有限公司信息通信分公司 一种告警关联合并方法、装置、系统、设备和存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100011410A1 (en) * 2008-07-10 2010-01-14 Weimin Liu System and method for data mining and security policy management
CN104038375A (zh) * 2014-06-30 2014-09-10 成都广达电子股份有限公司 一种广电接入网络告警处理分析系统及其分析方法
CN104158682A (zh) * 2014-08-08 2014-11-19 深圳供电局有限公司 一种基于贡献度的同步数字体系sdh故障定位方法
CN108768753A (zh) * 2018-06-26 2018-11-06 腾讯科技(深圳)有限公司 告警源的定位方法、装置、存储介质及电子装置
CN109189736A (zh) * 2018-08-01 2019-01-11 中国联合网络通信集团有限公司 一种告警关联规则的生成方法和装置
CN109358602A (zh) * 2018-10-23 2019-02-19 山东中创软件商用中间件股份有限公司 一种故障分析方法、装置及相关设备
CN109412867A (zh) * 2018-12-06 2019-03-01 国家电网有限公司信息通信分公司 一种告警关联合并方法、装置、系统、设备和存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189736A (zh) * 2018-08-01 2019-01-11 中国联合网络通信集团有限公司 一种告警关联规则的生成方法和装置
CN111193605A (zh) * 2019-08-28 2020-05-22 腾讯科技(深圳)有限公司 一种故障定位方法、装置及存储介质
CN112653587A (zh) * 2019-10-12 2021-04-13 北京奇艺世纪科技有限公司 一种网络连通状态检测方法及装置
CN111740868A (zh) * 2020-07-07 2020-10-02 腾讯科技(深圳)有限公司 告警数据的处理方法和装置及存储介质
CN111740868B (zh) * 2020-07-07 2023-12-15 腾讯科技(深圳)有限公司 告警数据的处理方法和装置及存储介质
CN112512072A (zh) * 2020-10-12 2021-03-16 中国联合网络通信集团有限公司 VoLTE网络故障预测方法及设备
CN112512072B (zh) * 2020-10-12 2023-07-07 中国联合网络通信集团有限公司 VoLTE网络故障预测方法及设备
CN115914009A (zh) * 2021-08-10 2023-04-04 中国移动通信集团江苏有限公司 ToB专网业务质量测试方法及系统
CN114050974A (zh) * 2021-10-15 2022-02-15 中国联合网络通信集团有限公司 一种拓扑准确度的确定方法、装置及计算机可读存储介质
CN114050974B (zh) * 2021-10-15 2023-06-23 中国联合网络通信集团有限公司 一种拓扑准确度的确定方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN110149223B (zh) 2022-04-15

Similar Documents

Publication Publication Date Title
CN110149223A (zh) 故障定位方法和设备
CN109859054B (zh) 网络社团挖掘方法、装置、计算机设备及存储介质
CN110166264B (zh) 一种故障定位方法、装置及电子设备
CN110995482B (zh) 告警分析方法、装置、计算机设备及计算机可读存储介质
US9983941B2 (en) Method and apparatus for recovering data
CN110535702A (zh) 一种告警信息处理方法及装置
CN113497726B (zh) 告警监控方法、系统、计算机可读存储介质及电子设备
CN112953738B (zh) 根因告警的定位系统、方法、装置、计算机设备
CN109816535A (zh) 欺诈识别方法、装置、计算机设备及存储介质
CN109981326B (zh) 家庭宽带感知故障定位的方法及装置
CN101997709A (zh) 一种根告警数据分析的方法及其系统
CN111814999A (zh) 一种故障工单生成方法、装置、设备
CN113259176B (zh) 一种告警事件分析方法和装置
CN106878038A (zh) 一种通信网络中故障定位方法及装置
CN113469578A (zh) 基于多目标优化的业务策略生成方法、装置及系统
CN112784025B (zh) 一种目标事件的确定方法和装置
CN114202206A (zh) 系统异常根因分析方法及装置
Zhou et al. An adaptive minimum spanning tree test for detecting irregularly-shaped spatial clusters
CN117421188A (zh) 告警定级方法、装置、设备及可读存储介质
CN111162945B (zh) 一种告警关联关系的确定方法、装置、设备及存储介质
CN112306820A (zh) 一种日志运维根因分析方法、装置、电子设备及存储介质
CN116668264A (zh) 一种告警聚类的根因分析方法、装置、设备及存储介质
CN115514627A (zh) 一种故障根因定位方法、装置、电子设备及可读存储介质
CN114629776B (zh) 基于图模型的故障分析方法及装置
CN108229585A (zh) 一种日志的归类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant