CN100589418C - 告警相关性规则的生成方法及生成系统 - Google Patents

告警相关性规则的生成方法及生成系统 Download PDF

Info

Publication number
CN100589418C
CN100589418C CN200710195317A CN200710195317A CN100589418C CN 100589418 C CN100589418 C CN 100589418C CN 200710195317 A CN200710195317 A CN 200710195317A CN 200710195317 A CN200710195317 A CN 200710195317A CN 100589418 C CN100589418 C CN 100589418C
Authority
CN
China
Prior art keywords
alarm
type
correlation rule
rule
incidence relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200710195317A
Other languages
English (en)
Other versions
CN101188523A (zh
Inventor
赵化冰
宋汉增
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN200710195317A priority Critical patent/CN100589418C/zh
Publication of CN101188523A publication Critical patent/CN101188523A/zh
Application granted granted Critical
Publication of CN100589418C publication Critical patent/CN100589418C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种告警相关性规则的生成方法,其包括以下步骤:步骤一,收集并保存设备所产生的告警数据;步骤二,找出所述告警数据中的所有告警类型,分析每类告警类型中的告警与其它告警类型的告警之间的关联关系;以及步骤三,根据每个所述关联关系生成相应的告警相关性规则。本发明还提供了一种告警相关性规则的生成装置。从而,可以越来越准确地反映了告警之间的关联关系并且便于对整个网络的管理和维护。

Description

告警相关性规则的生成方法及生成系统
技术领域
本发明涉及网络管理的告警管理,更具体地说,是一种通过分析网络设备产生的告警数据来生成告警相关性规则的分析处理方法和分析处理系统。
背景技术
随着通信网络技术的迅速发展,通信业务越来越丰富,从最初的电报、电话业务,发展到IP、多媒体等业务。一个通讯网络中的设备种类也越来越多,对通讯网络的管理和维护变得越来越困难。需要使用一个综合网络管理系统来对整个网络进行管理。当一个设备发生故障时,由于各个设备间的关联关系,在综合网络管理系统上会看到大量的设备上报各种不同的告警信息,如不能很快地从这些海量的告警信息中找到故障的根本原因,将会影响通讯网络的正常运行。告警相关性分析是用于对告警信息进行处理,找出根源故障的一个重要技术。
目前的相关性分析技术主要是通过预定义的业务规则对告警进行分析,分析的范围有限,只在一个或者有限的专业网中,不能对全网告警进行综合分析。
现有专利文献包括:专利号为CN02145669的中国专利申请“通信网络告警的处理方法和相关性分析管理器”和专利号为WO2006057588的欧洲专利“SERVICE ALARM CORRELATION”(服务告警相关性)。
第CN02145669号中国专利存在以下不足:一、该专利只适用于传输设备告警的处理。二、该专利方案中,相关性规则是手动生成的,存在局限性,在一个存在由众多厂商生产的数量庞大的通信设备的通信网络中,要由人工找出所有告警之间的关系,是不现实的。
第WO200605758号欧洲专利存在以下不足:一、告警之间的相关关系是由网元上报给网管的,在多厂商、多层次网元混合组网时,该方案实施存在兼容性问题。二、规则由网元内部程序硬编码实现,难以动态扩展。
发明内容
考虑到上述问题而做出本发明,为此,本发明的主要目的在于,提供一种告警相关性规则的生成方法及生成系统。
根据本发明的一个方面,提供了一种告警相关性规则的生成方法,其包括以下步骤:
步骤一,收集并保存设备所产生的告警数据;
步骤二,找出所述告警数据中的所有告警类型,分析每类告警类型中的告警与其它告警类型的告警之间的关联关系;以及
步骤三,根据每个所述关联关系生成相应的告警相关性规则。
生成方法还可以包括:根据告警相关性规则对来自设备的活动告警进行分析并定位告警根源。
在步骤二中生成告警相关性规则后,还可以包括:判断告警相关性规则是否正确,如果正确,则保存告警相关性规则。
告警类型是由设备类型和故障原因共同确定的。
当第一类型告警和第二类型告警的发生时间差和恢复时间差都小于预定时间量时,且第一类型告警的发生时间早于第二类型告警的发生时间,同时第一类型告警的恢复时间早于第二类型告警的恢复时间,则第二类型告警是第一类型告警的伴随告警。
当第二类型告警是第一类型告警的伴随告警,且伴随告警出现的概率大于预定概率值时,则第二类型告警与第一类型告警有关联关系。
告警相关性规则是第一类型告警抑制第二类型告警。
根据本发明的另一方面,提供了一种告警相关性规则的生成系统,其包括:
告警收集装置,用于收集设备所产生的告警数据;
告警数据库,用于保存告警收集装置收集的告警数据;以及
规则分析引擎,用于分析来自告警数据库的告警数据并得到告警数据之间的关联关系,以及使用关联关系生成告警相关性规则。
生成系统还可以包括:告警分析引擎,用于根据告警相关性规则对来自设备的活动告警进行分析并定位告警根源。
规则分析引擎可以包括:搜索告警类型模块,用于找出告警数据中的所有告警类型;分析关联关系模块,用于在由搜索告警模块所找出的所有告警类型中,分析每类告警类型中的告警与其它告警类型的告警之间的关联关系;以及生成规则模块,用于根据分析关联关系模块所得出的每个关联关系生成相应的告警相关性规则。
规则分析引擎中还可以包括:正确性判断模块,用于判断告警相关性规则是否正确,如果正确,则将告警相关性规则存入到用于存放告警相关性规则的规则库中。
告警类型是由设备类型和故障原因共同确定的。
通过上述技术方案,由于相关性规则来源于对告警数据的分析,准确地反映了告警之间的关联关系。随着系统运行时间的增加,告警数据库积累的数据量越来越大,分析得出的告警关联关系也会越来越准确。
此外,由于是对全网告警数据进行分析,可以得出跨专业网、跨网络层次的告警之间的关联关系,便于对整个网络的管理和维护。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1示出了根据本发明的告警相关性规则的生成方法的流程图;
图2示出了根据本发明的告警相关性规则的生成系统的框图;
图3示出了根据本发明实施例的告警规则生成和告警规则处理的系统结构图;
图4示出了根据本发明实施例的挖掘分析告警数据生成告警规则的流程图;以及
图5示出了根据本发明实施例的生成告警相关性规则的原理图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1示出了根据本发明的告警相关性规则的生成方法的流程图。
参照图1,提供了一种告警相关性规则的生成方法,其包括以下步骤:
步骤S102,收集并保存设备所产生的告警数据;
步骤S104,找出所述告警数据中的所有告警类型,分析每类告警类型中的告警与其它告警类型的告警之间的关联关系;以及
步骤S106,根据每个所述关联关系生成相应的告警相关性规则。
生成方法还可以包括:根据告警相关性规则对来自设备的活动告警进行分析并定位告警根源。
在步骤S104中生成告警相关性规则后,还可以包括:判断告警相关性规则是否正确,如果正确,则保存告警相关性规则。
告警类型是由设备类型和故障原因共同确定的。
当第一类型告警和第二类型告警的发生时间差和恢复时间差都小于预定时间量时,且第一类型告警的发生时间早于第二类型告警的发生时间,同时第一类型告警的恢复时间早于第二类型告警的恢复时间,则第二类型告警是第一类型告警的伴随告警。
当第二类型告警是第一类型告警的伴随告警,且伴随告警出现的概率大于预定概率值时,则第二类型告警与第一类型告警有关联关系。
告警相关性规则是第一类型告警抑制第二类型告警。
图2示出了根据本发明的告警相关性规则的生成系统的框图。
参照图2,提供了一种告警相关性规则的生成系统,其包括:
告警收集装置201,用于收集设备所产生的告警数据;
告警数据库202,用于保存告警收集装置201收集的告警数据;以及
规则分析引擎203,用于分析来自告警数据库202的告警数据并得到告警数据之间的关联关系,以及使用关联关系生成告警相关性规则。
生成系统还可以包括:告警分析引擎,用于根据告警相关性规则对来自设备的活动告警进行分析并定位告警根源。
规则分析引擎可以包括:搜索告警类型模块,用于找出告警数据中的所有告警类型;分析关联关系模块,用于在由搜索告警模块所找出的所有告警类型中,分析每类告警类型中的告警与其它告警类型的告警之间的关联关系;以及生成规则模块,用于根据分析关联关系模块所得出的每个关联关系生成相应的告警相关性规则。
规则分析引擎中还可以包括:正确性判断模块,用于判断告警相关性规则是否正确,如果正确,则将告警相关性规则存入到用于存放告警相关性规则的规则库中。
告警类型是由设备类型和故障原因共同确定的。
图3示出了根据本发明实施例的告警规则生成和告警规则处理的系统结构图。图3中,带箭头的细实线表示控制流,以及箭头的粗实线表示数据流。该系统包括:
网络设备:网络设备在本系统中是被管理的设备,当网络设备运行出现故障时,将产生告警,告警上报到综合网管系统中。
告警数据库:保存网络设备曾经产生的所有告警数据。
规则分析引擎:对告警数据库中的数据进行分析,以得到告警相关性规则。
规则库:用于保存分析得到的告警相关性规则。
活动告警缓存:保存网络设备产生的活动告警,活动告警即尚未被处理的告警,活动告警对应的设备故障尚未被消除。
告警分析引擎:告警分析引擎根据规则库的规则对活动告警缓存中的告警数据进行分析处理,以找出根源告警。
用户界面:呈现给用户的告警界面,该界面中只显示根源告警,以方便网络维护人员定位故障。
如图4所示,挖掘分析告警数据库,生成告警相关性规则的流程如下:
步骤1.找出告警数据中的所有告警类型,一类告警指由同一个设备的同一个故障产生的所有告警。每一个网管系统中采用的表示方法可能不同,例如可由告警码和告警产生位置来表示一类告警。
步骤2.分析一类告警和其它告警的关联关系,具体分析方法如下:
假设待分析的告警类型为告警类型A,告警数据库中有告警类型A的一个告警a,假设该告警的发生时间为Ta1,恢复时间为Ta2;同时告警数据库中有告警类型B的一个告警b,其发生时间为Tb1,恢复时间为Tb2。如果Ta1与Ta2之间的时间差、Tb1和Tb2的时间差均小于1分钟(该时间值为经验值,实现本专利时可以采用符合实际应用的任何时间值,这里采用1分钟),并且告警a的严重级别大于等于告警b的严重级别(该条件并不是必要条件,在实现本专利时可根据实际应用情况决定是否取用),则认为b是伴随a产生的告警,称b为a的伴随告警。
采用上述方法计算告警数据库中的所有告警类型A和告警类型B的告警,然后统计b是a的伴随告警的机率,如果机率大于90%(该值为经验值,实现本专利时可以采用符合实际应用的任何值,这里采用90%),则认为告警类型A和告警类型B有关联关系。如图5所示,左边的椭圆表示告警数据库中所有告警类型A的告警,右边的椭圆表示告警数据库中所有告警类型B的告警,两个椭圆的交叉部分表示B类型告警伴随A类型告警产生的部分,如果椭圆交叉部分占右边椭圆的面积大于右边椭圆总面积的90%,即B类告警伴随A类告警产生的次数除以B类告警总共产生的次数大于90%,则可认为告警类型B是伴随告警类型A产生的,告警类型B和告警类型A有关联关系。
步骤3.分析出关联关系后,生成一条相关性规则,该规则内容为告警类型A抑制告警类型B。即当系统中有告警类型A的活动告警时,告警类型B的活动告警不显示(生成规则的动作不限于告警类型B的活动告警不显示,可以是任何表示B为A伴随告警的动作)。
步骤4.由网络维护人员判断生成的相关性规则的正确性,该步骤为可选,当告警数据库中的告警数量足够多时,生成规则的可靠性较高,则该步骤可省略,直接转到步骤6。
步骤5.如果该生成的规则正确,则将该规则放入规则库中,待对活动告警进行相关性分析时使用。
步骤6.判断告警数据库中是否还有未分析的告警类型。如果还有未分析的告警类型,则继续分析下一告警类型;如果所有告警类型都分析完毕,则结束流程。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种告警相关性规则的生成方法,其特征在于,所述生成方法包括以下步骤:
步骤一,收集并保存设备所产生的告警数据;
步骤二,找出所述告警数据中的所有告警类型,分析每类告警类型中的告警与其它告警类型的告警之间的关联关系;以及
步骤三,根据每个所述关联关系生成相应的告警相关性规则。
2.根据权利要求1所述的生成方法,其特征在于,所述生成方法还包括:
根据所述告警相关性规则对来自所述设备的活动告警进行分析并定位告警根源。
3.根据权利要求1或2所述的生成方法,其特征在于,在所述步骤三中生成所述告警相关性规则后,还包括:
判断所述告警相关性规则是否正确,如果正确,则保存所述告警相关性规则。
4.根据权利要求3所述的生成方法,其特征在于,所述告警类型是由设备类型和故障原因共同确定的。
5.根据权利要求4所述的生成方法,其特征在于,当第一类型告警和第二类型告警的发生时间差和恢复时间差都小于预定时间量时,且所述第一类型告警的发生时间早于所述第二类型告警的发生时间,同时所述第一类型告警的恢复时间早于所述第二类型告警的恢复时间,则所述第二类型告警是所述第一类型告警的伴随告警;以及
当所述第二类型告警是所述第一类型告警的所述伴随告警,且所述伴随告警出现的概率大于预定概率值时,则所述第二类型告警与所述第一类型告警有所述关联关系。
6.一种告警相关性规则的生成系统,其特征在于,包括:
告警收集装置,用于收集设备所产生的告警数据;
告警数据库,用于保存所述告警收集装置收集的所述告警数据;以及
规则分析引擎,用于分析来自所述告警数据库的所述告警数据,找出所述告警数据中的所有告警类型,分析每类告警类型中的告警与其它告警类型的告警之间的关联关系,并得到所述告警数据之间的关联关系,以及使用所述关联关系生成告警相关性规则。
7.根据权利要求6所述的生成系统,其特征在于,所述生成系统还包括:
告警分析引擎,用于根据所述告警相关性规则对来自设备的活动告警进行分析并定位告警根源。
8.根据权利要求6或7所述的生成系统,其特征在于,所述规则分析引擎包括:
搜索告警类型模块,用于找出所述告警数据中的所有告警类型;
分析关联关系模块,用于在由所述搜索告警模块所找出的所述所有告警类型中,分析每类告警类型中的告警与其它告警类型的告警之间的关联关系;以及
生成规则模块,用于根据所述分析关联关系模块所得出的每个所述关联关系生成相应的告警相关性规则。
9.根据权利要求8所述的生成系统,其特征在于,所述规则分析引擎中还包括:
正确性判断模块,用于判断所述告警相关性规则是否正确,如果正确,则将所述告警相关性规则存入到用于存放所述告警相关性规则的规则库中。
10.根据权利要求9所述的生成系统,其特征在于,所述告警类型是由设备类型和故障原因共同确定的。
CN200710195317A 2007-12-10 2007-12-10 告警相关性规则的生成方法及生成系统 Active CN100589418C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200710195317A CN100589418C (zh) 2007-12-10 2007-12-10 告警相关性规则的生成方法及生成系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710195317A CN100589418C (zh) 2007-12-10 2007-12-10 告警相关性规则的生成方法及生成系统

Publications (2)

Publication Number Publication Date
CN101188523A CN101188523A (zh) 2008-05-28
CN100589418C true CN100589418C (zh) 2010-02-10

Family

ID=39480722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710195317A Active CN100589418C (zh) 2007-12-10 2007-12-10 告警相关性规则的生成方法及生成系统

Country Status (1)

Country Link
CN (1) CN100589418C (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101335643B (zh) * 2008-08-06 2010-12-08 烽火通信科技股份有限公司 用于sdh设备告警相关性分析的方法及装置
CN101938366B (zh) * 2009-06-30 2012-06-13 中兴通讯股份有限公司 一种实现关联告警的方法及装置
CN102291247A (zh) * 2010-06-18 2011-12-21 中兴通讯股份有限公司 告警关联图生成方法、装置及关联告警确定方法、装置
CN102142983A (zh) * 2010-11-24 2011-08-03 华为技术有限公司 告警相关性分析方法和装置
CN102487334B (zh) * 2010-12-06 2014-12-10 中国移动通信集团上海有限公司 关联告警信息的确定方法及装置
CN102546205B (zh) * 2010-12-20 2014-12-10 中国移动通信集团公司 一种故障关系生成及故障确定方法及装置
CN103108347B (zh) * 2011-11-11 2017-03-29 中兴通讯股份有限公司 有线网络和无线网络的关联告警方法及装置
CN102970165B (zh) * 2012-11-20 2015-07-08 北京思特奇信息技术股份有限公司 一种网络设备联合分析告警系统
CN103746831B (zh) * 2013-12-24 2017-08-18 华为技术有限公司 一种告警分析的方法、装置及系统
CN105827422B (zh) * 2015-01-06 2018-12-07 中国移动通信集团上海有限公司 一种确定网元告警关联关系的方法及装置
CN106209400B (zh) * 2015-04-30 2018-12-07 华为技术有限公司 一种定位故障的方法和设备
CN105071970B (zh) * 2015-08-27 2018-09-11 中国电信股份有限公司 故障分析方法和系统以及网管设备
CN105871581A (zh) * 2015-11-13 2016-08-17 乐视云计算有限公司 云计算中报警信息的处理方法及装置
CN107026745B (zh) * 2016-01-29 2020-07-07 华为技术有限公司 告警处理方法和告警处理设备
CN106713017B (zh) * 2016-12-08 2020-06-19 国网北京市电力公司 告警信息的处理方法及装置
CN106789347B (zh) * 2017-01-22 2019-12-13 浪潮天元通信信息系统有限公司 一种基于告警数据实现告警关联和网络故障诊断的方法
CN110955694A (zh) * 2018-09-26 2020-04-03 中国电力科学研究院有限公司 一种变电站智能告警通用规则库的描述方法及系统
CN111200509A (zh) * 2018-11-19 2020-05-26 华为技术有限公司 告警处理方法及相关装置

Also Published As

Publication number Publication date
CN101188523A (zh) 2008-05-28

Similar Documents

Publication Publication Date Title
CN100589418C (zh) 告警相关性规则的生成方法及生成系统
CN109756364B (zh) 一种基于日志分析的微服务性能优化系统和分析方法
US10664837B2 (en) Method and system for real-time, load-driven multidimensional and hierarchical classification of monitored transaction executions for visualization and analysis tasks like statistical anomaly detection
CN108959564A (zh) 数据仓库元数据管理方法、可读存储介质和计算机设备
CN101997709B (zh) 一种根告警数据分析的方法及其系统
US20150046512A1 (en) Dynamic collection analysis and reporting of telemetry data
CN103761173A (zh) 一种基于日志的计算机系统故障诊断方法及装置
CN104518905A (zh) 一种故障定位方法及装置
CN105095052B (zh) Soa环境下的故障检测方法及装置
CN105577454A (zh) 一种基于日志快速定位业务故障的方法
CN107145445A (zh) 软件自动化测试的报错日志的自动分析方法和系统
CN105159964A (zh) 一种日志监控方法及系统
JP2010501096A (ja) ラッパー生成およびテンプレート検出の協同最適化
CN107111625A (zh) 实现数据的高效分类和探索的方法和系统
CN103646104A (zh) 一种强实时故障诊断方法及系统
CN110489314A (zh) 模型异常检测方法、装置、计算机设备和存储介质
CN102541884B (zh) 数据库优化方法和装置
CN111881011A (zh) 日志管理方法、平台、服务器及存储介质
CN111259073A (zh) 基于日志、流量和业务访问的业务系统运行状态智能研判系统
CN105637488A (zh) 追踪源代码用于末端用户监控
CN105354697A (zh) 一种基于财务科目规则库的自动在线审计方法及系统
CN105808417A (zh) 自动化测试方法及代理服务器
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN102385552A (zh) 样本剖析报告的动态计算
CN102033789A (zh) 一种用于嵌入式安全关键系统的可靠性分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant