CN102291247A - 告警关联图生成方法、装置及关联告警确定方法、装置 - Google Patents

告警关联图生成方法、装置及关联告警确定方法、装置 Download PDF

Info

Publication number
CN102291247A
CN102291247A CN2010102118086A CN201010211808A CN102291247A CN 102291247 A CN102291247 A CN 102291247A CN 2010102118086 A CN2010102118086 A CN 2010102118086A CN 201010211808 A CN201010211808 A CN 201010211808A CN 102291247 A CN102291247 A CN 102291247A
Authority
CN
China
Prior art keywords
alarm
incidence relation
association
type
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102118086A
Other languages
English (en)
Inventor
林伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2010102118086A priority Critical patent/CN102291247A/zh
Priority to PCT/CN2010/077229 priority patent/WO2011157012A1/zh
Publication of CN102291247A publication Critical patent/CN102291247A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种告警关联图生成方法,包括:根据网络设备拓扑图依次确定存在物理连接的两个拓扑节点;分别获取所述两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警;根据告警属性对具有关联关系的告警进行分类,组成各告警类型的告警集合;当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率超出第一预设机率值时,确定第一告警类型的告警集合与第二告警类型的告警集合存在关联关系,并将其显示在告警关联图上。本发明还公开一种告警关联图生成装置、一种告警关联图生成方法及一种关联告警确定装置。采用本发明可以简单、直接地反映告警之间的关联关系,且不受限于网络规模,易于扩展。

Description

告警关联图生成方法、装置及关联告警确定方法、装置
技术领域
本发明实施例涉及网络管理技术领域,尤其是涉及该领域中的告警关联图生成方法、告警关联图生成装置以及关联告警确定方法、关联告警确定装置。
背景技术
随着通信网络技术的迅速发展,通信业务越来越丰富,从最初的电报、电话业务,发展到IP(Internet Protocol,互联网协议)、多媒体等业务。通信业务的多样化,伴随而来的是通信网络中的设备种类呈现多样化,导致后续对通信网络的管理和维护变得越来越困难。
在通信网络中,各个网络设备间存在关联关系,当其中一个网络设备发生故障时,会上报告警,与发生故障的网络设备间存在关联关系的网络设备也会上报相关告警。由此可以看出,告警之间的关联性,对于整个网络的管理显得尤为重要,例如,一个告警关联的一个简单应用,可以从海量的告警中找到根源告警,即找到故障的根本原因。
现有的告警关联分析技术主要是通过规则对告警关联进行分析,但是规则需要预定义,若一个告警能够引起关联告警的连锁反应,就需要对应建立多个规则,不同告警间的关联关系确定起来复杂度高,直观性差,而网络规模在不断扩展,规则数目必然相应增多,对网络的维护难度较大。
发明内容
本发明实施例提供了一种告警关联图生成方法,用以简单、直接地反映告警之间的关联关系,且不受限于网络规模,易于扩展,包括:
根据网络设备拓扑图依次确定存在物理连接的两个拓扑节点;
分别获取所述两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警;
根据告警码和/或告警级别对具有关联关系的告警进行分类,并标识为不同的告警类型,组成各告警类型的告警集合;
当计算出的每个告警类型的告警集合与另一告警类型的告警集合间的关联关系出现的机率超出第一预设机率值时,确定该告警类型的告警集合与另一告警类型的告警集合存在关联关系,并将其显示在告警关联图上。
本发明实施例还提供了一种应用告警关联图进行关联告警确定的方法,用以简单、直接地反映告警之间的关联关系,且不受限于网络规模,易于扩展,包括:
当网络设备发生告警时,确定该告警的告警类型;
在已生成的告警关联图中查找与该告警的告警类型相同的告警集合相关联的其他告警类型的告警集合,所述告警关联图包括各告警类型的告警集合间的关联关系;
在相关联的告警类型的告警集合包含的告警中,确定出与该告警相关联的告警。
本发明实施例还提供了一种告警关联图生成装置,用以简单、直接地反映告警之间的关联关系,且不受限于网络规模,易于扩展,包括:
第一确定单元,用于根据网络设备拓扑图依次确定存在物理连接的两个拓扑节点;
获取单元,用于分别获取所述两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警;
分类单元,用于根据告警属性对具有关联关系的告警进行分类,组成各告警类型的告警集合;
显示单元,用于当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率超出第一预设机率值时,确定第一告警类型的告警集合与第二告警类型的告警集合存在关联关系,并将其显示在告警关联图上。
本发明实施例还提供了一种应用告警关联图生成装置进行关联告警确定的装置,用以简单、直接地反映告警之间的关联关系,且不受限于网络规模,易于扩展,包括:
第二确定单元,用于当网络设备发生告警时,确定该告警的告警类型;
查找单元,用于在已生成的告警关联图中查找与该告警的告警类型相同的告警集合相关联的其他告警类型的告警集合,告警关联图包括各告警类型的告警集合间的关联关系;
第三确定单元,用于在相关联的告警类型的告警集合包含的告警中,确定出与该告警相关联的告警。
根据本发明实施例提供的方法,当网络设备发生告警时,确定该告警的告警类型,在已生成的告警关联图中查找与该告警的告警类型相同的告警集合相关联的其他告警类型的告警集合,告警关联图包括各告警类型的告警集合间的关联关系,在相关联的每个告警类型的告警集合包含的告警中,确定出与该告警相关联的告警。本发明实施例提供的关联告警确定方法,利用告警关联图确定与发生的告警关联的其他告警,告警关联图利用其图像显示的特性,能够直白、有效地反映不同告警类型的告警集合的关联关系,在接收到告警后,直接参考告警关联图,而不需要通过预定义的规则对告警关联进行分析,能够简单、有效地反映告警之间的关联关系,确定与接收的告警相关联的其他告警,降低告警间关联关系确定的复杂度;由于告警关联图不依赖于网元,不是通过网元内部程序硬编码实现的,而是可以根据实际情况修改的,因此,在网络扩展或缩小时,均可以根据网络中网络设备的增多或减少对其进行修改,不受限于网络规模,易于扩展,利用告警关联图可以更加准确,快速地找出源头故障。
附图说明
图1为本发明实施例提供的关联告警确定方法的流程图;
图2为本发明实施例提供的告警关联图;
图3为本发明实施例提供的关联告警确定方法中告警关联图的生成方法的流程图;
图4为本发明实施例提供的告警管理系统的连接关系图;
图5为本发明实施例提供的告警关联图生成方法的流程图;
图6为本发明实施例提供的第一种关联告警确定装置的结构示意图;
图7为本发明实施例提供的第二种关联告警确定装置的结构示意图;
图8为本发明实施例提供的第三种关联告警确定装置的结构示意图;
图9为本发明实施例提供的第四种关联告警确定装置的结构示意图;
图10为本发明实施例提供的第一种告警关联图生成装置的结构示意图;
图11为本发明实施例提供的第二种告警关联图生成装置的结构示意图。
具体实施方式
现有技术中提到的告警关联分析技术通过预定义的规则对告警关联进行分析,在规则较多的情况下,不同告警间的关联关系确定起来复杂度较高,难以实现,直观性差,且规则数目增多会导致对网络的维护难度增大,为解决现有的告警关联分析技术存在的上述技术问题,本发明实施例提供了一种关联告警确定方法,利用告警关联图确定与发生的告警关联的其他告警,告警关联图能够简单、有效地反映告警之间的关联关系,且不受限于网络规模,易于扩展,可以更加准确,快速地找出源头故障。
本发明实施例提供的关联告警确定方法的具体处理流程如图1所示:
步骤101、当网络设备发生告警时,确定该告警的告警类型;
步骤102、在已生成的告警关联图中查找与该告警的告警类型相同的告警集合相关联的其他告警类型的告警集合,告警关联图包括各告警类型的告警集合间的关联关系;
步骤103、在相关联的告警类型的告警集合包含的告警中,确定出与该告警相关联的告警。
实施时,告警具有多种告警属性,例如,可以根据告警码、告警级别、告警发生时间、告警恢复时间等多个告警属性参数分为不同的告警类型,每个告警均有自身的告警类型,步骤101在实施时,当网络设备发生告警时,首先要确定该告警的告警类型,例如,是严重告警还是提醒类告警,具体的告警类型根据实际情况而定。
步骤102在实施时,在已生成的告警关联图中查找与该告警的告警类型相同的告警集合相关联的其他告警类型的告警集合,告警关联图包括各告警类型的告警集合间的关联关系,为更形象更直白地对告警关联图进行说明,请参见图2,图2反映了不同告警类型的告警之间的关联关系,即,每个告警集合中只有一个告警,具体的,本例中,包括0、A、B、C、D和E六类告警类型的告警,且0、A、B、C、D和E类告警所属网络设备间存在拓扑关系。在具体实施时,每个告警集合中可以有一个告警,也可以有多个告警,也可能不存在该类型的告警,具体的根据事际情况而定。
根据图2可以不需要通过预定义的规则对告警关联进行分析,而能够直白地从图像上获得各告警间的关联关系,当网络中不同网络设备发出多个告警时,能够直白地获知不同告警间的关联关系,降低告警间关联关系确定的复杂度。
实施时,告警关联图的生成方法有多种,例如,按照二叉树原理生成告警关联图,也可以根据不同告警的告警级别生成告警关联图,还可以利用其他原理生成告警关联图,本发明实施例提供了一种较优的告警关联图的生成方法,具体处理流程如图3所示,包括:
步骤301、根据网络设备拓扑图依次确定存在物理连接的两个拓扑节点;
步骤302、分别获取两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警;
步骤303、根据告警码和/或告警级别对具有关联关系的告警进行分类,并标识为不同的告警类型,组成各告警类型的告警集合;
步骤304、当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率超出第一预设机率值时,确定第一告警类型的告警集合与第二告警类型的告警集合存在关联关系,并将其显示在告警关联图上。
实施时,网络设备具有的告警通常包括两部分,一部分是已处理完毕的告警,通常存储在历史告警数据库中,另一部分是尚未处理完毕的告警,通常存储在当前告警缓存中,在生成告警关联图时,对历史告警数据库和当前告警缓存中的数据均进行分析。
在一个实施例中,步骤302在实施时,分别获取两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警,具体包括:获取两个拓扑节点当前具有的所有告警,分析第一个拓扑节点具有的告警与第二个拓扑节点具有的告警在时间上的伴随关系,查找其中具有关联关系的告警。
实施时,分析第一个拓扑节点具有的告警与第二个拓扑节点具有的告警在时间上的伴随关系,查找其中具有关联关系的告警,具体的处理流程如下:
计算第一个拓扑节点具有的第一告警与第二个拓扑节点具有的第二告警间的告警发生时间差及告警恢复时间差,告警发生时间差为第二告警的发生时间与第一告警的发生时间的差值,告警恢复时间差为第二告警的恢复时间与第一告警的恢复时间的差值;
当告警发生时间差大于0小于预设发生时间差、告警恢复时间差大于0小于预设恢复时间差且第一告警的告警级别不小于第二告警的告警级别时,确定第一告警与第二告警间具有关联关系。
现以一个具体的实例对告警关联图的生成进行具体说明:
假设当前拓扑节点为A,具有告警a,假设告警a的告警发生时间为Ta,告警恢复时间Ta2,告警级别为Sa,如果与拓扑节点A关联的拓扑节点B具有告警b,其告警发生时间为Tb,告警恢复时间为Tb2,告警级别为Sb,若0<Tb-Ta<m,0<Tb2-Ta2<n(m为预设发生时间差,n为预设恢复时间差),且Sa>=Sb,则认为告警a和告警b存在关联,告警b伴随着告警a的产生而产生,恢复而恢复;
采用上述方法计算节点A的所有告警和节点B的所有告警,找到具有关联关系的告警,提炼分类TA和TB,然后根据分类条件计算关联关系出现的机率,如果机率大于r(r为第一预设机率值,假设为90%,当然也可以是其他值),则认为TA类型的告警和TB类型的告警有关联关系。
步骤302在实施时,一个告警类型的告警集合与另一告警类型的告警集合间的关联关系出现的机率的计算方法为:满足一个告警类型的告警集合的告警数量作为分母,该告警集合中与另一个告警类型的告警集合间存在关联关系的告警的数目作为分子,计算得到的数值即为计算出的机率。
在一个实施例中,计算得到的两类告警类型的告警集合间的关联关系的机率与第二预设机率值(通常指实际机率)可能存在一定的偏差,当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率与第二预设机率值不符时,根据第二预设机率值对计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率进行调整,例如,若第二预设机率值小于计算出的机率,则将计算出的机率调低,同理,若第二预设机率值大于计算出的机率,将计算出的机率调高。
在本发明实施例中,为使得根据告警关联图获取的关联关系更加准确,需要周期性更新告警关联图,更新的周期可以是一个小时,一天,也可以是一个月,具体的更新时间根据具体情况而定。通常以一天为周期,以满足准确性的要求。
在告警关联图更新后,当网络设备发生新的告警时,利用更新后的告警关联图查找与新的告警的告警类型相同的告警集合相关联的其他告警类型的告警集合;在相关联的每个告警类型的告警集合包含的告警中,确定出与新的告警相关联的告警。
实施时,应用本发明实施例提供的关联告警确定方法,可以创建一个告警管理系统,包括以下部分:网络设备、当前告警缓存、历史告警数据库、告警关联图、告警关联关系分析引擎、告警分析引擎、用户界面,具体连接关系请参见图4,各部分的功能如下:
网络设备:网络设备在本系统中是被管理的设备,当网络设备运行出现故障时,将产生告警,告警上报到网管系统中;
历史告警数据库:保存网络设备已产生的所有历史告警数据;
告警关联关系分析引擎:对历史告警数据库和当前告警缓存中的数据进行分析,以得到告警关联关系;
网络设备拓扑图:根据网络设备物理位置关系建立的一种位置关系图;
告警关联图:用于保存分析得到告警关联关系;
当前告警缓存:保存网络设备产生的当前告警,当前告警即尚未被处理的告警,当前告警对应的设备故障尚未被消除;
告警分析引擎:告警分析引擎根据告警关联图对当前告警缓存中的告警数据进行分析处理,以找出根源告警;
用户界面:呈现给用户的告警界面,该界面中显示告警关联图和根源告警,以方便网络维护人员维护查看、分析关联图上的关联关系,以及定位故障。
采用如图4所示的告警管理系统时,其具体的关联告警确定方法的流程如下:
第一步:使用当前告警缓存与历史告警数据库来收集网络设备产生的告警数据;
第二步:对告警数据进行分析挖掘,基于网络设备拓扑图,找出告警数据间的关联关系;
第三步:使用告警数据间的关联关系生成告警关联图;
第四步:采用生成的告警关联图,对网络中的当前告警进行分析处理,以找出根源告警,快速定位故障原因;
第五步:对新产生的当前告警和历史告警挖掘分析,重复第二步和第三步,获取关联关系,不断修正告警关联图,实现自动学习的功能,以提高准确性。
采用本发明实施例提供的关联告警确定方法,现以一具体实施说明如何确定关联告警,参见图2,A、B、C、D、E、0类告警所属网络设备存在拓扑关联,根据箭头指向方向,被指向的告警伴随着指向它的告警的发生而发生的机率大于第一预设机率值,比如A类型告警发生,D类型告警必然发生的概率是98%。
基于同一发明构思,本发明实施例还提供了一种告警关联图生成方法,具体处理流程如图5所示,包括:
步骤501、根据网络设备拓扑图依次确定存在物理连接的两个拓扑节点;
步骤502、分别获取两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警;
步骤503、根据告警码和/或告警级别对具有关联关系的告警进行分类,并标识为不同的告警类型,组成各告警类型的告警集合;
步骤504、当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率超出第一预设机率值时,确定第一告警类型的告警集合与第二告警类型的告警集合存在关联关系,并将其显示在告警关联图上。
在一个实施例中,步骤503在实施时,分别获取两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警,具体的处理流程如下:
计算第一个拓扑节点具有的第一告警与第二个拓扑节点具有的第二告警间的告警发生时间差及告警恢复时间差,告警发生时间差为第二告警的发生时间与第一告警的发生时间的差值,告警恢复时间差为第二告警的恢复时间与第一告警的恢复时间的差值;
当告警发生时间差大于0小于预设发生时间差、告警恢复时间差大于0小于预设恢复时间差且第一告警的告警级别不小于第二告警的告警级别时,确定第一告警与第二告警间具有关联关系。
在一个实施例中,计算得到的两类告警类型的告警集合间的关联关系的机率与第二预设机率值(通常指实际机率)可能存在一定的偏差,当计算出的该告警类型的告警集合与另一告警类型的告警集合间的关联关系出现的机率与第二预设机率值不符时,根据第二预设机率值对计算出的该告警类型与另一告警类型间的关联关系出现的机率进行调整,例如,若第二预设机率值小于计算出的机率,则将计算出的机率调低,同理,若第二预设机率值大于计算出的机率,将计算出的机率调高。
基于同一发明构思,本发明实施例还提供了一种关联告警确定装置,具体结构如图6所示,包括:
第二确定单元601,用于当网络设备发生告警时,确定该告警的告警类型;
查找单元602,用于在已生成的告警关联图中查找与该告警的告警类型相同的告警集合相关联的其他告警类型的告警集合,告警关联图包括各告警类型的告警集合间的关联关系;
第三确定单元603,用于在相关联的告警类型的告警集合包含的告警中,确定出与该告警相关联的告警。
在一个实施例中,如图7所示,查找单元602可以包括:
第一确定子单元701,用于根据网络设备拓扑图依次确定存在物理连接的两个拓扑节点;
获取子单元702,用于分别获取所述两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警;
标识子单元703,用于根据告警码和/或告警级别对具有关联关系的告警进行分类,并标识为不同的告警类型,组成各告警类型的告警集合;
显示子单元704,用于当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率超出第一预设机率值时,确定第一告警类型的告警集合与第二告警类型的告警集合存在关联关系,并将其显示在告警关联图上。
在一个实施例中,如图8所示,获取子单元702具体包括:
计算模块801,用于计算第一个拓扑节点具有的第一告警与第二个拓扑节点具有的第二告警间的告警发生时间差及告警恢复时间差,告警发生时间差为第二告警的发生时间与第一告警的发生时间的差值,告警恢复时间差为第二告警的恢复时间与第一告警的恢复时间的差值;
确定模块802,用于当告警发生时间差大于0小于预设发生时间差、告警恢复时间差大于0小于预设恢复时间差且第一告警的告警级别不小于第二告警的告警级别时,确定第一告警与第二告警间具有关联关系。
在一个实施例中,如图7所示装置,显示子单元704还可以用于:当计算出的该告警类型的告警集合与另一告警类型的告警集合间的关联关系出现的机率与第二预设机率值不符时,根据第二预设机率值对计算出的该关联关系出现的机率进行调整。
在一个实施例中,如图9所示,关联告警确定装置还可以包括:
更新单元901,用于周期性更新告警关联图;
查找单元602进一步用于:当网络设备发生新的告警时,利用更新后的告警关联图查找与新的告警的告警类型相同的告警集合相关联的其他告警类型的告警集合;
第三确定单元603进一步用于:在相关联的每个告警类型的告警集合包含的告警中,确定出与新的告警相关联的告警。
基于同一发明构思,本发明实施例还提供了一种告警关联图生成装置,具体结构如图10所示,包括:
第一确定单元1001,用于根据网络设备拓扑图依次确定存在物理连接的两个拓扑节点;
获取单元1002,用于分别获取两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警;
分类单元1003,用于根据告警属性对具有关联关系的告警进行分类,并标识为不同的告警类型,组成各告警类型的告警集合;
显示单元1004,用于当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率超出第一预设机率值时,确定第一告警类型的告警集合与第二告警类型的告警集合存在关联关系,并将其显示在告警关联图上。
在一个实施例中,分类单元1003具体用于:根据告警码和/或告警级别对具有关联关系的告警进行分类。
在一个实施例中,获取单元1002具体用于:获取所述两个拓扑节点当前具有的所有告警,分析第一个拓扑节点具有的告警与第二个拓扑节点具有的告警在时间上的伴随关系,查找其中具有关联关系的告警。
在一个实施例中,如图11所示,获取单元1002具体包括:
计算子单元1101,用于计算第一个拓扑节点具有的第一告警与第二个拓扑节点具有的第二告警间的告警发生时间差及告警恢复时间差,告警发生时间差为第二告警的发生时间与第一告警的发生时间的差值,告警恢复时间差为第二告警的恢复时间与第一告警的恢复时间的差值;
第二确定子单元1102,用于当告警发生时间差大于0小于预设发生时间差、告警恢复时间差大于0小于预设恢复时间差且第一告警的告警级别不小于第二告警的告警级别时,确定第一告警与第二告警间具有关联关系。
在一个实施例中,如图10所示装置,显示单元1004还可以用于:当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率与第二预设机率值不符时,根据第二预设机率值对计算出的该关联关系出现的机率进行调整。
根据本发明实施例提供的方法,当网络设备发生告警时,确定该告警的告警类型,在已生成的告警关联图中查找与该告警的告警类型相同的告警集合相关联的其他告警类型的告警集合,告警关联图包括各告警类型的告警集合间的关联关系,在相关联的每个告警类型的告警集合包含的告警中,确定出与该告警相关联的告警。本发明实施例提供的关联告警确定方法,利用告警关联图确定与发生的告警关联的其他告警,告警关联图利用其图像显示的特性,能够直白、有效地反映不同告警类型的告警集合的关联关系,在接收到告警后,直接参考告警关联图,而不需要通过预定义的规则对告警关联进行分析,能够简单、有效地反映告警之间的关联关系,确定与接收的告警相关联的其他告警,降低告警间关联关系确定的复杂度;由于告警关联图不依赖于网元,不是通过网元内部程序硬编码实现的,而是可以根据实际情况修改的,因此,在网络扩展或缩小时,均可以根据网络中网络设备的增多或减少对其进行修改,不受限于网络规模,易于扩展,利用告警关联图可以更加准确,快速地找出源头故障。
进一步,为保证根据告警关联图获取的关联关系的准确性,本发明实施例中,周期性更新告警关联图。
进一步,通过对已有的告警数据的分析挖掘生成告警关联图,通过告警关联图包含的关联关系,可以直观地为用户提供决策依据,比如用来查找根源告警;告警关联图为维护人员提供了直观的关联关系,根据需要,可以动态纠错关联关系;并且告警关联图是通过网络设备拓扑关系来生成的,在关联关系查找、定位时,能够更加有效;通过关联关系链的遍历,可以在较低的计算复杂度的情况下确定根源告警;告警关联图能够根据最新的告警数据不断自动学习,使得关联关系更加准确,根源告警的查找和分析也会更加准确。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种告警关联图生成方法,其特征在于,包括:
根据网络设备拓扑图依次确定存在物理连接的两个拓扑节点;
分别获取所述两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警;
根据告警属性对具有关联关系的告警进行分类,组成各告警类型的告警集合;
当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率超出第一预设机率值时,确定第一告警类型的告警集合与第二告警类型的告警集合存在关联关系,并将其显示在告警关联图上。
2.如权利要求1所述的方法,其特征在于,根据告警属性对具有关联关系的告警进行分类,具体包括:
根据告警码和/或告警级别对具有关联关系的告警进行分类。
3.如权利要求1所述的方法,其特征在于,分别获取所述两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警,具体包括:
获取所述两个拓扑节点当前具有的所有告警,分析第一个拓扑节点具有的告警与第二个拓扑节点具有的告警在时间上的伴随关系,查找其中具有关联关系的告警。
4.如权利要求3所述的方法,其特征在于,分析第一个拓扑节点具有的告警与第二个拓扑节点具有的告警在时间上的伴随关系,查找其中具有关联关系的告警,具体包括:
计算第一个拓扑节点具有的第一告警与第二个拓扑节点具有的第二告警间的告警发生时间差及告警恢复时间差,所述告警发生时间差为第二告警的发生时间与第一告警的发生时间的差值,所述告警恢复时间差为第二告警的恢复时间与第一告警的恢复时间的差值;
当告警发生时间差大于0小于预设发生时间差、告警恢复时间差大于0小于预设恢复时间差且第一告警的告警级别不小于第二告警的告警级别时,确定第一告警与第二告警间具有关联关系。
5.如权利要求1所述的方法,其特征在于,确定第一告警类型的告警集合与第二告警类型的告警集合存在关联关系之后,将其显示在告警关联图上之前,还包括:
当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率与第二预设机率值不符时,根据第二预设机率值对计算出的该关联关系出现的机率进行调整。
6.一种应用权利要求1-5任一项生成的告警关联图进行关联告警确定的方法,其特征在于,包括:
当网络设备发生告警时,确定该告警的告警类型;
在已生成的告警关联图中查找与该告警的告警类型相同的告警集合相关联的其他告警类型的告警集合,所述告警关联图包括各告警类型的告警集合间的关联关系;
在相关联的告警类型的告警集合包含的告警中,确定出与该告警相关联的告警。
7.一种告警关联图生成装置,其特征在于,包括:
第一确定单元,用于根据网络设备拓扑图依次确定存在物理连接的两个拓扑节点;
获取单元,用于分别获取所述两个拓扑节点当前具有的所有告警,查找其中具有关联关系的告警;
分类单元,用于根据告警属性对具有关联关系的告警进行分类,组成各告警类型的告警集合;
显示单元,用于当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率超出第一预设机率值时,确定第一告警类型的告警集合与第二告警类型的告警集合存在关联关系,并将其显示在告警关联图上。
8.如权利要求7所述的装置,其特征在于,所述分类单元具体用于:根据告警码和/或告警级别对具有关联关系的告警进行分类。
9.如权利要求7所述的装置,其特征在于,所述获取单元具体用于:获取所述两个拓扑节点当前具有的所有告警,分析第一个拓扑节点具有的告警与第二个拓扑节点具有的告警在时间上的伴随关系,查找其中具有关联关系的告警。
10.如权利要求9所述的装置,其特征在于,所述获取单元具体包括:
计算子单元,用于计算第一个拓扑节点具有的第一告警与第二个拓扑节点具有的第二告警间的告警发生时间差及告警恢复时间差,所述告警发生时间差为第二告警的发生时间与第一告警的发生时间的差值,所述告警恢复时间差为第二告警的恢复时间与第一告警的恢复时间的差值;
第二确定子单元,用于当告警发生时间差大于0小于预设发生时间差、告警恢复时间差大于0小于预设恢复时间差且第一告警的告警级别不小于第二告警的告警级别时,确定第一告警与第二告警间具有关联关系。
11.如权利要求7所述的装置,其特征在于,所述显示单元还用于:当计算出的第一告警类型的告警集合与第二告警类型的告警集合间的关联关系出现的机率与第二预设机率值不符时,根据第二预设机率值对计算出的该关联关系出现的机率进行调整。
12.一种应用权利要求7-11任一项的告警关联图生成装置进行关联告警确定的装置,其特征在于,包括:
第二确定单元,用于当网络设备发生告警时,确定该告警的告警类型;
查找单元,用于在已生成的告警关联图中查找与该告警的告警类型相同的告警集合相关联的其他告警类型的告警集合,告警关联图包括各告警类型的告警集合间的关联关系;
第三确定单元,用于在相关联的告警类型的告警集合包含的告警中,确定出与该告警相关联的告警。
CN2010102118086A 2010-06-18 2010-06-18 告警关联图生成方法、装置及关联告警确定方法、装置 Pending CN102291247A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2010102118086A CN102291247A (zh) 2010-06-18 2010-06-18 告警关联图生成方法、装置及关联告警确定方法、装置
PCT/CN2010/077229 WO2011157012A1 (zh) 2010-06-18 2010-09-21 告警关联图生成方法、装置及关联告警确定方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102118086A CN102291247A (zh) 2010-06-18 2010-06-18 告警关联图生成方法、装置及关联告警确定方法、装置

Publications (1)

Publication Number Publication Date
CN102291247A true CN102291247A (zh) 2011-12-21

Family

ID=45337371

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102118086A Pending CN102291247A (zh) 2010-06-18 2010-06-18 告警关联图生成方法、装置及关联告警确定方法、装置

Country Status (2)

Country Link
CN (1) CN102291247A (zh)
WO (1) WO2011157012A1 (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440730A (zh) * 2013-07-22 2013-12-11 清华大学 一种基于数据提取的关联报警的识别方法
CN104065496A (zh) * 2013-03-18 2014-09-24 中国移动通信集团设计院有限公司 网络拓扑图的生成方法及装置
CN104518905A (zh) * 2013-10-08 2015-04-15 华为技术有限公司 一种故障定位方法及装置
CN106330533A (zh) * 2016-01-21 2017-01-11 华南师范大学 一种大规模网络告警实时拓扑建立方法
CN108737173A (zh) * 2018-05-17 2018-11-02 武汉微创光电股份有限公司 一种网络告警过滤方法及系统
CN108829794A (zh) * 2018-06-04 2018-11-16 北京交通大学 基于区间图的告警分析方法
CN108900353A (zh) * 2018-07-18 2018-11-27 平安科技(深圳)有限公司 故障告警方法及终端设备
CN108964960A (zh) * 2017-05-27 2018-12-07 阿里巴巴集团控股有限公司 一种告警事件的处理方法及装置
CN109450677A (zh) * 2018-10-29 2019-03-08 中国联合网络通信集团有限公司 一种根源故障的定位方法和装置
CN109951306A (zh) * 2017-12-20 2019-06-28 中国移动通信集团湖北有限公司 告警的处理方法、装置、设备及介质
CN111147300A (zh) * 2019-12-26 2020-05-12 北京神州绿盟信息安全科技股份有限公司 一种网络安全告警置信度评估方法及装置
CN111193627A (zh) * 2019-12-31 2020-05-22 中国移动通信集团江苏有限公司 信息处理方法、装置、设备及存储介质
CN112583644A (zh) * 2020-12-14 2021-03-30 华为技术有限公司 告警处理方法、装置、设备及可读存储介质
CN113844976A (zh) * 2021-09-10 2021-12-28 北京声智科技有限公司 告警数据的处理方法、装置、计算机设备和存储介质
CN114500229A (zh) * 2021-12-30 2022-05-13 国网河北省电力有限公司信息通信分公司 基于时空信息的网络告警定位及分析方法
CN114885235A (zh) * 2021-12-14 2022-08-09 云南电网有限责任公司玉溪供电局 一种基于站点的光传输网络拓扑的布局与展现方法
CN115720186A (zh) * 2022-10-26 2023-02-28 中盈优创资讯科技有限公司 一种基于设备拓扑和因果关系的异常根因定位方法及装置
US20230239206A1 (en) * 2022-01-24 2023-07-27 Rakuten Mobile, Inc. Topology Alarm Correlation

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114500227B (zh) * 2020-11-13 2023-11-21 中国移动通信集团安徽有限公司 一种告警分析方法、装置、设备及计算机存储介质
CN112988522A (zh) * 2021-03-08 2021-06-18 北京明略软件系统有限公司 用于告警信号关联的方法、装置及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006057588A1 (en) * 2004-11-29 2006-06-01 Telefonaktiebolaget Lm Ericsson (Publ) Service alarm correlation
CN101188523A (zh) * 2007-12-10 2008-05-28 中兴通讯股份有限公司 告警相关性规则的生成方法及生成系统
CN101316187A (zh) * 2007-06-01 2008-12-03 杭州华三通信技术有限公司 网络管理方法和网络管理系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6707795B1 (en) * 1999-04-26 2004-03-16 Nortel Networks Limited Alarm correlation method and system
CN101212367B (zh) * 2007-12-25 2010-06-30 北京亿阳信通软件研究院有限公司 一种告警信息的处理方法及装置
CN101582807B (zh) * 2009-07-02 2011-10-05 北京讯风光通信技术开发有限责任公司 一种基于北向接口实现网络管理的方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006057588A1 (en) * 2004-11-29 2006-06-01 Telefonaktiebolaget Lm Ericsson (Publ) Service alarm correlation
CN101316187A (zh) * 2007-06-01 2008-12-03 杭州华三通信技术有限公司 网络管理方法和网络管理系统
CN101188523A (zh) * 2007-12-10 2008-05-28 中兴通讯股份有限公司 告警相关性规则的生成方法及生成系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杜晓丽等: "一种基于依赖图的故障定位算法", 《计算机应用》, vol. 24, 31 December 2004 (2004-12-31), pages 67 - 69 *

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104065496A (zh) * 2013-03-18 2014-09-24 中国移动通信集团设计院有限公司 网络拓扑图的生成方法及装置
CN104065496B (zh) * 2013-03-18 2017-05-31 中国移动通信集团设计院有限公司 网络拓扑图的生成方法及装置
CN103440730B (zh) * 2013-07-22 2016-04-06 清华大学 一种基于数据提取的关联报警的识别方法
CN103440730A (zh) * 2013-07-22 2013-12-11 清华大学 一种基于数据提取的关联报警的识别方法
CN104518905A (zh) * 2013-10-08 2015-04-15 华为技术有限公司 一种故障定位方法及装置
CN106330533B (zh) * 2016-01-21 2019-12-17 华南师范大学 一种大规模网络告警实时拓扑建立方法
CN106330533A (zh) * 2016-01-21 2017-01-11 华南师范大学 一种大规模网络告警实时拓扑建立方法
CN108964960A (zh) * 2017-05-27 2018-12-07 阿里巴巴集团控股有限公司 一种告警事件的处理方法及装置
CN109951306B (zh) * 2017-12-20 2022-04-01 中国移动通信集团湖北有限公司 告警的处理方法、装置、设备及介质
CN109951306A (zh) * 2017-12-20 2019-06-28 中国移动通信集团湖北有限公司 告警的处理方法、装置、设备及介质
CN108737173A (zh) * 2018-05-17 2018-11-02 武汉微创光电股份有限公司 一种网络告警过滤方法及系统
CN108737173B (zh) * 2018-05-17 2022-02-25 武汉微创光电股份有限公司 一种网络告警过滤方法及系统
CN108829794B (zh) * 2018-06-04 2022-04-12 北京交通大学 基于区间图的告警分析方法
CN108829794A (zh) * 2018-06-04 2018-11-16 北京交通大学 基于区间图的告警分析方法
WO2020015115A1 (zh) * 2018-07-18 2020-01-23 平安科技(深圳)有限公司 故障告警方法及终端设备
CN108900353A (zh) * 2018-07-18 2018-11-27 平安科技(深圳)有限公司 故障告警方法及终端设备
CN109450677B (zh) * 2018-10-29 2021-07-13 中国联合网络通信集团有限公司 一种根源故障的定位方法和装置
CN109450677A (zh) * 2018-10-29 2019-03-08 中国联合网络通信集团有限公司 一种根源故障的定位方法和装置
CN111147300A (zh) * 2019-12-26 2020-05-12 北京神州绿盟信息安全科技股份有限公司 一种网络安全告警置信度评估方法及装置
CN111147300B (zh) * 2019-12-26 2022-04-29 绿盟科技集团股份有限公司 一种网络安全告警置信度评估方法及装置
CN111193627A (zh) * 2019-12-31 2020-05-22 中国移动通信集团江苏有限公司 信息处理方法、装置、设备及存储介质
CN111193627B (zh) * 2019-12-31 2022-08-12 中国移动通信集团江苏有限公司 信息处理方法、装置、设备及存储介质
CN112583644A (zh) * 2020-12-14 2021-03-30 华为技术有限公司 告警处理方法、装置、设备及可读存储介质
CN113844976A (zh) * 2021-09-10 2021-12-28 北京声智科技有限公司 告警数据的处理方法、装置、计算机设备和存储介质
CN114885235A (zh) * 2021-12-14 2022-08-09 云南电网有限责任公司玉溪供电局 一种基于站点的光传输网络拓扑的布局与展现方法
CN114500229A (zh) * 2021-12-30 2022-05-13 国网河北省电力有限公司信息通信分公司 基于时空信息的网络告警定位及分析方法
CN114500229B (zh) * 2021-12-30 2024-02-02 国网河北省电力有限公司信息通信分公司 基于时空信息的网络告警定位及分析方法
US20230239206A1 (en) * 2022-01-24 2023-07-27 Rakuten Mobile, Inc. Topology Alarm Correlation
CN115720186A (zh) * 2022-10-26 2023-02-28 中盈优创资讯科技有限公司 一种基于设备拓扑和因果关系的异常根因定位方法及装置

Also Published As

Publication number Publication date
WO2011157012A1 (zh) 2011-12-22

Similar Documents

Publication Publication Date Title
CN102291247A (zh) 告警关联图生成方法、装置及关联告警确定方法、装置
CN111782965B (zh) 意图推荐方法、装置、设备及存储介质
US10616248B2 (en) Space and time efficient threat detection
US10564622B1 (en) Control interface for metric definition specification for assets and asset groups driven by search-derived asset tree hierarchy
US11100113B2 (en) Object score adjustment based on analyzing machine data
US11755938B2 (en) Graphical user interface indicating anomalous events
US20160034566A1 (en) High availability scheduler for scheduling map-reduce searches
CN109086182B (zh) 数据库自动告警的方法及终端设备
US11960443B2 (en) Block data storage system in an event historian
US9842134B2 (en) Data query interface system in an event historian
CN103678494A (zh) 客户端同步服务端数据的方法及装置
CN103942639A (zh) 用于政策咨询服务系统的政策管理系统及其方法
CN106407429A (zh) 文件追踪方法、装置及系统
CN109240876A (zh) 实例监控方法、计算机可读存储介质和终端设备
CN104077293A (zh) 网页获取方法和装置
US20160308733A1 (en) Systems and Methods for Indicating Deployment of Application Features
US9658924B2 (en) Event data merge system in an event historian
CN110941757A (zh) 一种基于大数据的政策信息查询推送系统及方法
CN104462095A (zh) 一种查询语句公共部分的提取方法及装置
CN107291938B (zh) 订单查询系统及方法
CN112784025A (zh) 一种目标事件的确定方法和装置
WO2017176676A1 (en) Graph-based fusing of heterogeneous alerts
CN101605049B (zh) 网管数据统计分析指标的处理方法和装置、数据管理系统
CN108229585A (zh) 一种日志的归类方法及系统
JP5922811B1 (ja) ログ情報分類装置、ログ情報分類方法、及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111221