CN106878038A - 一种通信网络中故障定位方法及装置 - Google Patents

一种通信网络中故障定位方法及装置 Download PDF

Info

Publication number
CN106878038A
CN106878038A CN201510918671.0A CN201510918671A CN106878038A CN 106878038 A CN106878038 A CN 106878038A CN 201510918671 A CN201510918671 A CN 201510918671A CN 106878038 A CN106878038 A CN 106878038A
Authority
CN
China
Prior art keywords
alarm
candidate
father
frequent item
inquiry table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510918671.0A
Other languages
English (en)
Other versions
CN106878038B (zh
Inventor
赫彩凤
彭馨玮
田光见
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510918671.0A priority Critical patent/CN106878038B/zh
Publication of CN106878038A publication Critical patent/CN106878038A/zh
Application granted granted Critical
Publication of CN106878038B publication Critical patent/CN106878038B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Monitoring And Testing Of Exchanges (AREA)

Abstract

本发明公开了一种通信网络中故障定位方法及装置,用于解决现有技术中存在的故障定位准确性低的问题。该方法包括:生成至少一个第一告警频繁项集;获取候选父告警查询表;候选父告警查询表中包括若干候选父告警、候选父告警的互斥关系标识以及候选父告警的优先级;在至少一个第一告警频繁项集中确定出存在与候选父告警查询表中包括的候选父告警相同的告警作为候选父告警;根据候选父告警查询表在各个存在候选父告警的第一告警频繁项集中确定不包括存在互斥关系的候选父告警的第二告警频繁项集;根据确定出的每个第二告警频繁项集中的各个候选父告警在候选父告警查询表中对应的优先级选择一个候选父告警作为父告警;根据父告警确定故障点。

Description

一种通信网络中故障定位方法及装置
技术领域
本发明涉及网络监控技术领域,尤其涉及一种通信网络中故障定位方法及装置。
背景技术
通信网络由多种类型的网元设备组成,不同网元之间相互协作完成通信功能;各个网元又包含不同组件,协同实现该网元的主要功能。这种网元组件之间、网元之间的相互依赖关系使得当某一网元或者组件发生故障告警时,会引发相应的一系列不同类型的告警,形成告警风暴。例如,网元x出现故障,可能会发送两条告警,一条告警是连接失败,另一个告警是数据丢包;在故障没有解决前,网元x会在每次试图发送信息,并且失败时发送同样的故障告警,那么就会有持续不断的告警发出。如果将这些海量告警信息全都上报给网络维护人员,网络人员需要一项一项去处理,既增加工作成本,又影响网络设备的修复效率。
因此现有技术中提出基于数据挖掘技术的通信告警关联规则分析,可通过分析告警事务数据,挖掘告警关联规则,揭示出隐含在海量原始告警数据中的有意义的知识和告警关联性,更加全面和系统的解释网络故障及性能问题,使得网管人员能快速的进行故障定位并进一步做出故障决策和预测。虽然通用型的数据挖掘算法理论上能够挖掘出所有的频繁项集,进而获得其中的关联规则;但是通过这种方式得到的关联规则仅能体现统计意义上发生的规律,并不完全作为维护的规则使用,相对来说,使用该关联规则来定位故障准确性不高。
发明内容
本发明实施例提供一种通信网络中故障定位方法及装置,用于解决现有技术中存在的故障定位准确性低的问题。
第一方面,本发明实施例提供了一种通信网络中故障定位方法,包括:
获取待处理的告警数据,将所述告警数据处理得到至少一个第一告警频繁项集,每个第一告警频繁项集中包括若干个告警;
获取候选父告警查询表;
其中,所述候选父告警查询表中包括若干候选父告警、用于标识具有互斥关系的一对候选父告警的互斥关系标识以及不存在互斥关系的各个候选父告警的优先级,每个候选父告警是对历史工单中具有相同告警类型的告警数据统计得到的一个告警,所述历史工单记录有历史出现且经过维护的告警;
在所述至少一个第一告警频繁项集中确定出存在与所述候选父告警查询表中包括的候选父告警相同的告警,并作为所述至少一个第一告警频繁项集的候选父告警;
根据所述候选父告警查询表包含的互斥关系标识,在各个存在候选父告警的第一告警频繁项集中确定不包括存在互斥关系的候选父告警的第二告警频繁项集;
针对各个第二告警频繁项集分别执行:根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警;
根据在各个第二告警频繁项集中分别选择出的父告警确定故障点。
结合第一方面,在第一方面的第一种可能的实现方式中,所述候选父告警查询表通过如下方式生成:
提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警;
统计每种告警类型下的告警出现的次数,并基于统计的次数确定所述每种告警类型对应的候选父告警的优先级;
查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表;所述专家知识库中记录有存在互斥关系的各对告警。
结合第一方面,在第一方面的第二种可能的实现方式中,所述候选父告警查询表通过如下方式生成:
提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警;
根据专家知识库记载的告警等级分别确定各个候选父告警的优先级;
查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表;所述专家知识库中记录有所有告警对应的告警等级,以及存在互斥关系的各对告警。
结合第一方面和第一方面的第一种至第二种可能的实现方式中的任意一种,在第一方面的第三种可能的实现方式中,所述将所述告警数据处理得到至少一个第一告警频繁项集,包括:
将所述告警数据处理得到至少一个第三告警频繁项集;
在所述至少一个第三告警频繁项集中确定包括的告警数量大于数量阈值的至少一个第一告警频繁项集。
结合第一方面和第一方面的第一种至第三种可能的实现方式中的任意一种,在第一方面的第四种可能的实现方式中,在根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警之后,还包括:
将每个第二告警频繁项集中的除选择的所述父告警以外的其他告警作为所述父告警的子告警,并基于所述每一个父告警及其子告警的关系形成父子告警关联规则。
第二方面,本发明实施例提供了一种通信网络中故障定位装置,包括:
频繁项挖掘模块,用于获取待处理的告警数据,将所述告警数据处理得到至少一个第一告警频繁项集,每个第一告警频繁项集中包括若干个告警;
父告警生成模块,用于获取候选父告警查询表;
其中,所述候选父告警查询表中包括若干候选父告警、用于标识具有互斥关系的一对候选父告警的互斥关系标识以及不存在互斥关系的各个候选父告警的优先级,每个候选父告警是对历史工单中具有相同告警类型的告警数据统计得到的一个告警,所述历史工单记录有历史出现且经过维护的告警;在所述频繁性挖掘模块处理得到的所述至少一个告警频繁项集中确定出存在与所述候选父告警查询表中包括的候选父告警相同的告警,并作为所述至少一个第一告警频繁项集的候选父告警;根据所述候选父告警查询表包含的互斥关系标识,在各个存在候选父告警的第一告警频繁项集中确定不包括存在互斥关系的候选父告警的第二告警频繁项集;针对各个第二告警频繁项集分别执行:根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警;
故障定位模块,用于根据所述父告警生成模块在各个第二告警频繁项集中分别选择出的父告警确定故障点。
结合第二方面,在第二方面的第一种可能的实现方式中,还包括:
候选父告警查询表生成模块,用于通过如下方式生成所述候选父告警查询表:
提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警;
统计每种告警类型下的告警出现的次数,并基于统计的次数确定所述每种告警类型对应的候选父告警的优先级;
查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表;所述专家知识库中记录有存在互斥关系的各对告警。
结合第二方面,在第二方面的第二种可能的实现方式中,还包括:
候选父告警查询表生成模块,用于通过如下方式生成所述候选父告警查询表:
提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警;
根据专家知识库记载的告警等级分别确定各个候选父告警的优先级;
查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表;所述专家知识库中记录有所有告警对应的告警等级,以及存在互斥关系的各对告警。
结合第二方面和第二方面的第一种至第二种可能的实现方式中的任意一种,在第二方面的第三种可能的实现方式中,所述频繁项挖掘模块,在将所述告警数据处理得到至少一个第一告警频繁项集,具体用于:
将所述告警数据处理得到至少一个第三告警频繁项集;
在所述至少一个第三告警频繁项集中确定包括的告警数量大于数量阈值的至少一个第一告警频繁项集。
结合第二方面和第二方面的第一种至第三种可能的实现方式中的任意一种,在第二方面的第四种可能的实现方式中,所述父告警生成模块,在根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警之后,还用于:
将每个第二告警频繁项集中的除选择的所述父告警以外的其他告警作为所述父告警的子告警,并基于所述每一个父告警及其子告警的关系形成父子告警关联规则。
本发明实施例提供的方案对大量的告警数据处理得到至少一个第一告警频繁项集,所述告警频繁项集中包括若干告警;然后获取候选父告警查询表;候选父告警查询表中包括若干候选父告警以及用于标识具有互斥关系的一对候选父告警的互斥关系标识以及不存在互斥关系的各个候选父告警的优先级,每个候选父告警是对所述历史工单中具有相同告警类型的告警数据统计得到的一个告警,所述历史工单记录有历史出现且经过维护的告警;由于候选父告警查询表记录有告警之间的互斥关系,并且包括有根据历史出现且经过维护的告警确定的候选父告警,因此能够反映告警之间的业务关系以及具有可维护性。在所述至少一个告警频繁项集中确定出存在与所述候选父告警查询表中包括的候选父告警相同的告警,并作为所述至少一个第一告警频繁项集的候选父告警;根据所述候选父告警查询表包含的互斥关系标识,在各个存在候选父告警的第一告警频繁项集中确定不包括存在互斥关系的候选父告警的第二告警频繁项集;针对各个第二告警频繁项集分别执行:根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警;根据在各个第二告警频繁项集中分别选择出的父告警确定故障点。因此,本发明实施例提供的方案能够反映告警之间业务之间的关系,并且依据业务关系选择关键的能够确定故障点的告警,提高了故障定位的准确性。
附图说明
图1为本发明实施例提供的通信网络的故障定位装置示意图;
图2为本发明实施例提供的通信网络的故障定位装置中各模块实现故障定位的流程图;
图3为本发明实施例提供的通信网络的故障定位方法流程图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
通信网路中一个故障可能会产生成千上万的告警。许多的告警虽然发生在不同组件或网元设备上,发生时间具有先后顺序,但这些告警之间实际上存在相关性,许多告警由同一个告警引发的,或者相关联的告警中某一个告警对整个流程的影响性更高需要优先处理。基于告警之间存在的关联关系将大量告警合并成一条或者几条告警规则,网络维护人员可以基于这些相关性提炼出来少量的告警规则,有针对性的进行故障排查,快速定位或者解决故障。
本发明实施例提供一种通信网络中故障定位方法及装置,用于解决现有技术中存在的故障定位准确性低的问题。本发明实施例提供的方案对大量的告警数据处理得到至少一个第一告警频繁项集,所述告警频繁项集中包括若干告警;然后获取候选父告警查询表;候选父告警查询表中包括若干候选父告警以及用于标识具有互斥关系的一对候选父告警的互斥关系标识以及不存在互斥关系的各个候选父告警的优先级,每个候选父告警是对所述历史工单中具有相同告警类型的告警数据统计得到的一个告警,所述历史工单记录有历史出现且经过维护的告警;由于候选父告警查询表记录有告警之间的互斥关系,并且包括有根据历史出现且经过维护的告警确定的候选父告警,因此能够反映告警之间的业务关系以及具有可维护性。在所述至少一个告警频繁项集中确定出存在与所述候选父告警查询表中包括的候选父告警相同的告警,并作为所述至少一个第一告警频繁项集的候选父告警;根据所述候选父告警查询表包含的互斥关系标识,在各个存在候选父告警的第一告警频繁项集中确定不包括存在互斥关系的候选父告警的第二告警频繁项集;针对各个第二告警频繁项集分别执行:根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警;根据在各个第二告警频繁项集中分别选择出的父告警确定故障点。因此,本发明实施例提供的方案能够反映告警之间业务之间的关系,并且依据业务关系选择关键的能够确定故障点的告警。提高了故障定位的准确性。
本发明实施例适用的应用场景包括但不仅限于同一网元产生的海量告警、同域中,包括无线域、分组交换(英文:Packet Switch,简称:PS)域或者电路交换(英文:Circuit Switched,简称:CS)域等等,不同网元产生的海量告警、不同域内多个网元产生的海量告警等分析场景。其中,方法和装置是基于同一发明构思的,由于方法及装置解决问题的原理相似,因此装置与方法的实施可以相互参见,重复之处不再赘述。
参见图1,为本发明实施例提供的通信网络中故障定位装置示意图。该通信网络中故障定位装置具体可以由网管系统实现,还可以是设置于网管系统的一个设备完成,本发明实施例对此不作具体限定。
通信网络中故障定位装置包括如下模块:
频繁项挖掘模块101,父告警生成模块102,以及故障定位模块103。还可以包括候选父告警查询表生成模块104。则通信网络的故障定位装置中各模块实现故障定位的流程图如图2所示。
下面对具体的故障定位流程作如下描述。
频繁项挖掘模块101具体用于对告警数据处理得到告警频繁项集。本发明实施例为了与后续提到的告警频繁项集区分,经过频繁项挖掘模块101处理得到的告警频繁项集称为第一告警频繁项集。该频繁项挖掘模块101可以使用现有频繁项挖掘算法对获取到的待处理的网络告警数据进行分析处理得到至少一个第一告警频繁项集。每个第一告警频繁项集中包括若干个告警。
在具体实现时,仅需要输入原始的待处理的网络告警数据,则输出若干个第一告警频繁项集。
例如:原始的待处理的网络告警数据如表1所示。每一行表示一条告警数据,每列表示告警的属性,包括:序列号、节点、告警类型、发生时间等等。
表1
输出的第一告警频繁项集中,每一行表示一个告警频繁项集,每个告警频繁项集的大小表示该告警频繁项集中包括的告警数量。所需要的告警频繁项集的大小可以按照实际业务的需求指定。告警频繁项集的元素为告警类型,一个告警频繁项集合中的告警表示在统计意义上频繁共同发生的。
频繁项挖掘模块101具体通过如下方式实现对获取到的待处理的网络告警数据进行分析处理得到至少一个第一告警频繁项集:
A1:设置时间窗口阈值,经待处理的网络告警数据按照告警发生的时间进行分组,发生在同一时间窗口的告警组成一组。
由于移动互联网设备的告警是不间断的实时发生的,因此很难确定一个完整的告警序列的开始时间和结束时间,如果随意的获取,很可能将本来一个完整的告警序列拆分成部分。为了最大程度上保证时间框中取得完整的告警序列数据,可以设置前一个时间窗口与后一个时间窗口在时间上互有重叠。
A2:对每一组内的告警数据进行去重,得到不重复的告警类型组成的事务型数据。因此若干个告警对应一个事务。
具体的,将每一组内不同时间发生的同一告警仅保留一个告警,其余的从该组内删除。
A3:对上述得到的事务型数据依据现有的频繁性挖掘算法,得到预先设置的支持度阈值的至少一个第一告警频繁项集。
如果某个告警频繁项集中的告警数量较少,则提供的有效信息较少,因此可以预先设置数量阈值,若确定某个告警频繁项集中的告警数量小于数量阈值,则将该告警频繁项集删除,或者不予考虑。
则所述将所述告警数据处理得到至少一个第一告警频繁项集,可以通过如下方式实现:将所述告警数据处理得到至少一个第三告警频繁项集;在所述至少一个第三告警频繁项集中确定包括的告警数量大于数量阈值的至少一个第一告警频繁项集。
那么在步骤C中,对上述得到的事务型数据依据现有的频繁性挖掘算法,得到预先设置的支持度阈值的至少一个第三告警频繁项集,在所述至少一个第三告警频繁项集中确定包括的告警数量大于数量阈值的至少一个第一告警频繁项集。
本发明实施例中第一、第二等等是在数量上对告警频繁项集进行区分,并不对告警频繁项集中具体内部实质内容进行限定。
父告警生成模块102,用于确定父告警。
在父告警生成模块102中预先输入候选父告警查询表以及由频繁项挖掘模块输出至少一个第一告警频繁项集,则父告警生成模块102输出从每一个对所述至少一个第一告警频繁项集处理得到的告警频繁项集中选择出的父告警。
父告警生成模块102确定父告警时,具体可以通过如下方式实现:
B1,获取候选父告警查询表。
其中,所述候选父告警查询表中包括若干候选父告警、用于标识具有互斥关系的一对候选父告警的互斥关系标识以及不存在互斥关系的各个候选父告警的优先级,每个候选父告警是对历史工单中具有相同告警类型的告警数据统计得到的一个告警,所述历史工单记录有历史出现且经过维护的告警。
具体的对历史工单中具有相同告警类型的告警数据统计得到的一个告警,并对该告警进行标识作为候选父告警。本发明实施例中同一个告警类型的告警可以认为是同一个告警,仅仅是在发生时间上不同。
本发明实施例中通信网络中故障定位装置还可以包括候选父告警查询表生成模块104。
候选父告警查询表可以是由候选父告警查询表生成模块104基于历史工单以及专家知识库生成。所述专家知识库中记录有存在互斥关系的各对告警。
则可以在候选父告警查询表生成模块104中输入历史工单以及专家知识库,则可以输出候选父告警查询表。
历史工单的告警数据具体可以是以表格的形式存储的。每一行表示一个工单记录,每一个工单包括该维护的告警的告警类型(AlarmName)、编号(ID)等等。
专家知识库中维护了各种告警类型的告警之间的业务上的互斥关系。比如移动网络的电路交换域中,告警“M3UA Route Unavailable”与告警“GTPCTunnel Path Broken”在业务逻辑上时不可能同时出现的。
候选父告警查询表生成模块104在生成候选父告警查询表时,可以通过如下方式实现:
第一种实现方式:
C1,提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警。
C2,统计每种告警类型下的告警出现的次数,并基于统计的次数确定所述每种告警类型对应的候选父告警的优先级。
具体的,出现次数高的则优先级高。可以设置次数阈值,哪种告警类型下的告警出现的次数大于第一次数阈值,则设置该告警的优先级为Y1,哪种告警类型的告警出现的次数大于第二次数阈值且不大于第一次数阈值,则设置该告警的优先级为Y2,其余的告警设置优先级为Y3,优先级Y1、Y2、Y3的顺序为Y1>Y2>Y3。
C3,查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表。
第二种实现方式:
D1,提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警。
D2,根据专家知识库记载的告警等级分别确定各个候选父告警的优先级。
所述专家知识库中记录有所有告警对应的告警等级。
等级较高的告警则优先级高,等级较低的告警则优先级低。比如专家知识库中记录的告警等级包括“严重”、“重要”以及“一般”3个告警等级。则“严重”对应的告警的优先级设置为Y1,“重要”对应的告警的优先级设置为Y2,“一般”对应的告警的优先级设置为Y3。
D3,查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表;
通过专家知识库对存在互斥关系的每对候选父告警进行标识,不互斥的父告警保持优先级顺序。
通过上述方式生成的候选父告警查询表可以通过如下表2表示。AlarmName标识候选父告警的类型,SN是序列号,该序列号反应候选父告警的优先级以及业务逻辑关系。如1.1比1.1.1、1.2以及1.3的优先级高,1.1.1与1.2、1.3在业务逻辑上互斥,不能同时出现,1.1与2.0以及3.0在业务逻辑上互斥。
表2
SN AlarmName
1.1 M3UA Destination Entity Inaccessible
1.1.1 SCCP DPC Prohibited
1.2 M3UA Route Unavailable
1.3 M3UA Signaling Link Failed
2.0 GTPC Tunnel Path Broken
3.0 License Feature Expired
B2,在所述频繁性挖掘模块处理得到的所述至少一个告警频繁项集中确定出存在与所述候选父告警查询表中包括的候选父告警相同的告警,并作为所述至少一个第一告警频繁项集的候选父告警。
具体的,确定一个第一告警频繁项集不包括任何一个告警与与所述候选父告警查询表中包括的候选父告警相同,则该第一告警频繁项不予考虑。
B3,根据所述候选父告警查询表包含的互斥关系标识,在各个存在候选父告警的第一告警频繁项集中确定不包括存在互斥关系的候选父告警的第二告警频繁项集。
具体的,确定一个第一告警频繁项集中包括的候选父告警存在互斥关系,则该第一告警频繁项集无效,不予考虑。本发明实施例中将全部有效的第一告警频繁项集称为第二告警频繁项集。
B4,针对各个第二告警频繁项集分别执行:根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警。
具体的,一个第二告警频繁项集若包括一个候选父告警,则将该候选父告警作为父告警。若存在两个或者两个以上的候选父告警,将优先级高的候选父告警作为父告警。
可选的,若有在两个或者两个以上的第二告警频繁项集选择出父告警相同,则将该两个或者两个以上的第二告警频繁项集合并为一个告警频繁项集。重复的告警仅留下一个。
可选地,父告警生成模块102在根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警之后,将每个第二告警频繁项集中的除选择的所述父告警以外的其他告警作为所述父告警的子告警,并基于所述每一个父告警及其子告警的关系形成父子告警关联规则。
故障定位模块103,用于根据所述父告警生成模块在各个第二告警频繁项集中分别选择出的父告警确定故障点。
分析所述父告警生成模块产生的所有父告警,从中提炼出至少一个关键告警。根据该至少一个关键告警的告警类型、告警时间以及告警发生的位置信息来确定故障点以及可能的故障原因,并对该故障点进行维护。在维护后,可以将维护的告警保存到历史工单中,从而能够对历史工单的数据进行实时的更新,保证确定的父告警的时效性,能够适应网络的调整。
本发明实施例提出一种通信网络中故障定位的装置,自动确定父告警,并根据父告警进行故障定位,减少了人工的操作,提高了效率。传统的通过频繁项挖掘得到的告警关联关系只是表示这些告警统计上出现在一起的规律,没有体现告警之间在业务上的逻辑关系,不能当做运维的规则。而该装置生成的父告警能够反应告警的业务逻辑,是告警压缩、网管派单、故障定位等多种业务的基础,可以支撑这些网络运维业务的有效开展。候选父告警查询表能够随着历史工单的更新进行自适应调整,保证规则的时效性,适应网络的调整。
本发明实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
本发明实施例提供的通信网络中故障定位的装置可以包括处理器,具体可以是将上述各个模块均可以集成在一个处理器中,该处理器可以是中央处理单元(英文:Central Process Unit,简称CPU)。该装置还包括存储器,则存储器用于存储处理器执行的程序代码,可以是易失性存储器(英文:volatilememory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以是非易失性存储器(英文:non-volatile memory),例如只读存储器(英文:read-only memory,缩写:ROM),快闪存储器(英文:flash memory),硬盘(英文:hard disk drive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD)、或者存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是上述存储器的组合。并且存储器中存储有历史工单、专家知识库。该装置还包括通信接口,用于实时的更新历史工单。本发明实施例中不限定上述部件之间的具体连接介质。
基于与通信网络中故障定位方法对应的实施例同样的发明构思,本发明实施例还提供了一种通信网络中故障定位方法,如图3所示,该方法包括如下流程:
S301,获取待处理的告警数据,将所述告警数据处理得到至少一个第一告警频繁项集。
每个第一告警频繁项集中包括若干个告警;
S302,获取候选父告警查询表。
其中,所述候选父告警查询表中包括若干候选父告警、用于标识具有互斥关系的一对候选父告警的互斥关系标识以及不存在互斥关系的各个候选父告警的优先级,每个候选父告警是对历史工单中具有相同告警类型的告警数据统计得到的一个告警,所述历史工单记录有历史出现且经过维护的告警。
S303,在所述至少一个告警频繁项集中确定出存在与所述候选父告警查询表中包括的候选父告警相同的告警,并作为所述至少一个第一告警频繁项集的候选父告警。
S304,根据所述候选父告警查询表包含的互斥关系标识,在各个存在候选父告警的第一告警频繁项集中确定不包括存在互斥关系的候选父告警的第二告警频繁项集。
S305,针对各个第二告警频繁项集分别执行:根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警。
S306,根据在各个第二告警频繁项集中分别选择出的父告警确定故障点。
可选的,所述候选父告警查询表通过如下方式生成:
第一种实现方式:
提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警;
统计每种告警类型下的告警出现的次数,并基于统计的次数确定所述每种告警类型对应的候选父告警的优先级;
查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表;所述专家知识库中记录有存在互斥关系的各对告警。
第二种实现方式:
提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警;
根据专家知识库记载的告警等级分别确定各个候选父告警的优先级;
查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表;所述专家知识库中记录有所有告警对应的告警等级,以及存在互斥关系的各对告警。
可选的,所述将所述告警数据处理得到至少一个第一告警频繁项集,可以通过如下方式实现:
将所述告警数据处理得到至少一个第三告警频繁项集;
在所述至少一个第三告警频繁项集中确定包括的告警数量大于数量阈值的至少一个第一告警频繁项集。
可选的,在根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警之后,还包括:
将每个第二告警频繁项集中的除选择的所述父告警以外的其他告警作为所述父告警的子告警,并基于所述每一个父告警及其子告警的关系形成父子告警关联规则。
本发明实施例提出的方案,自动确定父告警,并根据父告警进行故障定位,减少了人工的操作,提高了效率。传统的通过频繁项挖掘得到的告警关联关系只是表示这些告警统计上出现在一起的规律,没有体现告警之间在业务上的逻辑关系,不能当做运维的规则。而本发明实施例的方案中生成的父告警能够反应告警的业务逻辑,是告警压缩、网管派单、故障定位等多种业务的基础,可以支撑这些网络运维业务的有效开展。候选父告警查询表能够随着历史工单的更新进行自适应调整,保证规则的时效性,适应网络的调整。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种通信网络中故障定位方法,其特征在于,包括:
获取待处理的告警数据,将所述告警数据处理得到至少一个第一告警频繁项集,每个第一告警频繁项集中包括若干个告警;
获取候选父告警查询表;
其中,所述候选父告警查询表中包括若干候选父告警、用于标识具有互斥关系的一对候选父告警的互斥关系标识以及不存在互斥关系的各个候选父告警的优先级,每个候选父告警是对历史工单中具有相同告警类型的告警数据统计得到的一个告警,所述历史工单记录有历史出现且经过维护的告警;
在所述至少一个第一告警频繁项集中确定出存在与所述候选父告警查询表中包括的候选父告警相同的告警,并作为所述至少一个第一告警频繁项集的候选父告警;
根据所述候选父告警查询表包含的互斥关系标识,在各个存在候选父告警的第一告警频繁项集中确定不包括存在互斥关系的候选父告警的第二告警频繁项集;
针对各个第二告警频繁项集分别执行:根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警;
根据在各个第二告警频繁项集中分别选择出的父告警确定故障点。
2.如权利要求1所述的方法,其特征在于,所述候选父告警查询表通过如下方式生成:
提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警;
统计每种告警类型下的告警出现的次数,并基于统计的次数确定所述每种告警类型对应的候选父告警的优先级;
查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表;所述专家知识库中记录有存在互斥关系的各对告警。
3.如权利要求1所述的方法,其特征在于,所述候选父告警查询表通过如下方式生成:
提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警;
根据专家知识库记载的告警等级分别确定各个候选父告警的优先级;
查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表;所述专家知识库中记录有所有告警对应的告警等级,以及存在互斥关系的各对告警。
4.如权利要求1至3任一项所述的方法,其特征在于,所述将所述告警数据处理得到至少一个第一告警频繁项集,包括:
将所述告警数据处理得到至少一个第三告警频繁项集;
在所述至少一个第三告警频繁项集中确定包括的告警数量大于数量阈值的至少一个第一告警频繁项集。
5.如权利要求1至4任一项所述的方法,其特征在于,在根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警之后,还包括:
将每个第二告警频繁项集中的除选择的所述父告警以外的其他告警作为所述父告警的子告警,并基于所述每一个父告警及其子告警的关系形成父子告警关联规则。
6.一种通信网络中故障定位装置,其特征在于,包括:
频繁项挖掘模块,用于获取待处理的告警数据,将所述告警数据处理得到至少一个第一告警频繁项集,每个第一告警频繁项集中包括若干个告警;
父告警生成模块,用于获取候选父告警查询表;在所述频繁性挖掘模块处理得到的所述至少一个第一告警频繁项集中确定出存在与所述候选父告警查询表中包括的候选父告警相同的告警,并作为所述至少一个第一告警频繁项集的候选父告警;根据所述候选父告警查询表包含的互斥关系标识,在各个存在候选父告警的第一告警频繁项集中确定不包括存在互斥关系的候选父告警的第二告警频繁项集;针对各个第二告警频繁项集分别执行:根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警;
其中,所述候选父告警查询表中包括若干候选父告警、用于标识具有互斥关系的一对候选父告警的互斥关系标识以及不存在互斥关系的各个候选父告警的优先级,每个候选父告警是对历史工单中具有相同告警类型的告警数据统计得到的一个告警,所述历史工单记录有历史出现且经过维护的告警;
故障定位模块,用于根据所述父告警生成模块在各个第二告警频繁项集中分别选择出的父告警确定故障点。
7.如权利要求6所述的装置,其特征在于,还包括:
候选父告警查询表生成模块,用于通过如下方式生成所述候选父告警查询表:
提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警;
统计每种告警类型下的告警出现的次数,并基于统计的次数确定所述每种告警类型对应的候选父告警的优先级;
查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表;所述专家知识库中记录有存在互斥关系的各对告警。
8.如权利要求6所述的装置,其特征在于,还包括:
候选父告警查询表生成模块,用于通过如下方式生成所述候选父告警查询表:
提取所述历史工单中出现的所有告警类型,并将分别归属每种告警类型的所有告警中的一个告警作为候选父告警;
根据专家知识库记载的告警等级分别确定各个候选父告警的优先级;
查询专家知识库,对存在互斥关系的每对候选父告警分别进行标识形成互斥关系标识,从而得到所述候选父告警查询表;所述专家知识库中记录有所有告警对应的告警等级,以及存在互斥关系的各对告警。
9.如权利要求6至8任一项所述的装置,其特征在于,所述频繁项挖掘模块,在将所述告警数据处理得到至少一个第一告警频繁项集,具体用于:
将所述告警数据处理得到至少一个第三告警频繁项集;
在所述至少一个第三告警频繁项集中确定包括的告警数量大于数量阈值的至少一个第一告警频繁项集。
10.如权利要求6至9任一项所述的装置,其特征在于,所述父告警生成模块,在根据确定出的每个第二告警频繁项集中的各个候选父告警在所述候选父告警查询表中对应的优先级,选择一个候选父告警作为父告警之后,还用于:
将每个第二告警频繁项集中的除选择的所述父告警以外的其他告警作为所述父告警的子告警,并基于所述每一个父告警及其子告警的关系形成父子告警关联规则。
CN201510918671.0A 2015-12-10 2015-12-10 一种通信网络中故障定位方法及装置 Active CN106878038B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510918671.0A CN106878038B (zh) 2015-12-10 2015-12-10 一种通信网络中故障定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510918671.0A CN106878038B (zh) 2015-12-10 2015-12-10 一种通信网络中故障定位方法及装置

Publications (2)

Publication Number Publication Date
CN106878038A true CN106878038A (zh) 2017-06-20
CN106878038B CN106878038B (zh) 2020-02-21

Family

ID=59177963

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510918671.0A Active CN106878038B (zh) 2015-12-10 2015-12-10 一种通信网络中故障定位方法及装置

Country Status (1)

Country Link
CN (1) CN106878038B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110300011A (zh) * 2018-03-23 2019-10-01 中国移动通信集团有限公司 一种告警根因定位方法、装置和计算机可读存储介质
CN112988525A (zh) * 2021-03-22 2021-06-18 新华三技术有限公司 一种告警关联规则的匹配方法及装置
CN113568991A (zh) * 2021-09-22 2021-10-29 北京必示科技有限公司 一种基于动态风险的告警处理方法及系统
CN113890814A (zh) * 2021-09-22 2022-01-04 联通(广东)产业互联网有限公司 故障感知模型构建和故障感知方法与系统、设备、介质
CN114389960A (zh) * 2022-01-04 2022-04-22 烽火通信科技股份有限公司 一种网络业务性能采集上报的方法和系统
WO2023045417A1 (zh) * 2021-09-24 2023-03-30 中兴通讯股份有限公司 一种故障知识图谱构建方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6353902B1 (en) * 1999-06-08 2002-03-05 Nortel Networks Limited Network fault prediction and proactive maintenance system
CN102098175A (zh) * 2011-01-26 2011-06-15 浪潮通信信息系统有限公司 一种移动互联网告警关联规则获取方法
CN102111296A (zh) * 2011-01-10 2011-06-29 浪潮通信信息系统有限公司 基于最大频繁项集的通信告警关联规则挖掘方法
CN104239437A (zh) * 2014-08-28 2014-12-24 国家电网公司 一种面向电网调度的智能告警分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6353902B1 (en) * 1999-06-08 2002-03-05 Nortel Networks Limited Network fault prediction and proactive maintenance system
CN102111296A (zh) * 2011-01-10 2011-06-29 浪潮通信信息系统有限公司 基于最大频繁项集的通信告警关联规则挖掘方法
CN102098175A (zh) * 2011-01-26 2011-06-15 浪潮通信信息系统有限公司 一种移动互联网告警关联规则获取方法
CN104239437A (zh) * 2014-08-28 2014-12-24 国家电网公司 一种面向电网调度的智能告警分析方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110300011A (zh) * 2018-03-23 2019-10-01 中国移动通信集团有限公司 一种告警根因定位方法、装置和计算机可读存储介质
CN112988525A (zh) * 2021-03-22 2021-06-18 新华三技术有限公司 一种告警关联规则的匹配方法及装置
CN112988525B (zh) * 2021-03-22 2022-07-22 新华三技术有限公司 一种告警关联规则的匹配方法及装置
CN113568991A (zh) * 2021-09-22 2021-10-29 北京必示科技有限公司 一种基于动态风险的告警处理方法及系统
CN113890814A (zh) * 2021-09-22 2022-01-04 联通(广东)产业互联网有限公司 故障感知模型构建和故障感知方法与系统、设备、介质
CN113890814B (zh) * 2021-09-22 2023-09-19 联通(广东)产业互联网有限公司 故障感知模型构建和故障感知方法与系统、设备、介质
WO2023045417A1 (zh) * 2021-09-24 2023-03-30 中兴通讯股份有限公司 一种故障知识图谱构建方法及装置
CN114389960A (zh) * 2022-01-04 2022-04-22 烽火通信科技股份有限公司 一种网络业务性能采集上报的方法和系统
CN114389960B (zh) * 2022-01-04 2023-11-28 烽火通信科技股份有限公司 一种网络业务性能采集上报的方法和系统

Also Published As

Publication number Publication date
CN106878038B (zh) 2020-02-21

Similar Documents

Publication Publication Date Title
CN106878038A (zh) 一种通信网络中故障定位方法及装置
CN110661659B (zh) 一种告警方法、装置、系统及电子设备
CN109684181B (zh) 告警根因分析方法、装置、设备及存储介质
US11087329B2 (en) Method and apparatus of identifying a transaction risk
CN102340415B (zh) 一种服务器集群系统的监控方法和一种服务器集群系统
AU2019201687B2 (en) Network device vulnerability prediction
CN110445665B (zh) 基于改进gsp的电力通信网络告警关联挖掘方法
CN110278211A (zh) 一种基于区块链的数据检验方法及装置
CN110166290A (zh) 基于日志文件的告警方法及装置
CN110351150A (zh) 故障根源确定方法及装置、电子设备和可读存储介质
CN104021195B (zh) 基于知识库的告警关联分析方法
CN107171819A (zh) 一种网络故障诊断方法及装置
CN105095048A (zh) 一种基于业务规则的监控系统告警关联处理方法
CN105159964A (zh) 一种日志监控方法及系统
CN103220173A (zh) 一种报警监控方法及监控系统
CN110046073A (zh) 一种日志采集方法及装置、设备、存储介质
CN112416724A (zh) 告警处理方法、系统、计算机设备和存储介质
CN109981326B (zh) 家庭宽带感知故障定位的方法及装置
CN106254137A (zh) 监管系统的告警根源分析系统及方法
CN112559237B (zh) 运维系统排障方法、装置、服务器和存储介质
CN102664760A (zh) 一种通信系统中的告警方法、设备及通信系统
US20230040635A1 (en) Graph-based impact analysis of misconfigured or compromised cloud resources
CN103248522B (zh) 一种性能数据的上报方法及装置
CN104639386A (zh) 故障定位系统和方法
CN114172921A (zh) 一种调度录音系统的日志审计方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant