CN1863080A - 一种告警管理方法和系统 - Google Patents

一种告警管理方法和系统 Download PDF

Info

Publication number
CN1863080A
CN1863080A CN 200510109282 CN200510109282A CN1863080A CN 1863080 A CN1863080 A CN 1863080A CN 200510109282 CN200510109282 CN 200510109282 CN 200510109282 A CN200510109282 A CN 200510109282A CN 1863080 A CN1863080 A CN 1863080A
Authority
CN
China
Prior art keywords
alarm
father
child
correlation
warning information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200510109282
Other languages
English (en)
Other versions
CN100433647C (zh
Inventor
朱冬梅
邱国贤
高建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB200510109282XA priority Critical patent/CN100433647C/zh
Publication of CN1863080A publication Critical patent/CN1863080A/zh
Application granted granted Critical
Publication of CN100433647C publication Critical patent/CN100433647C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种告警管理方法及系统,本发明是在对告警之间的联系进行分析的基础上设置告警之间的父子关系,并在告警上报处理时,如果存在父告警,则不上报对应的子告警。因此,本发明的实现可以有效减少告警数量,上报父告警以保持告警功能的完整性并有利于查找故障源,从而达到了告警精简优化的效果,方便故障的诊断和维护。

Description

一种告警管理方法和系统
技术领域
本发明涉及网络管理中的数据处理,尤其涉及一种告警管理方法及系统。
背景技术
通信网络由各种网络通信设备组成,各网络通信设备间需要协同工作以实现相应的通信业务。为保证网络通信设备的正常工作,需要对其采用必要的维护手段进行维护。其中,通信设备告警便是一种重要的针对网络设备的维护手段,通常由通信设备各地区管理系统实现。
所述的通信设备告警管理系统主要由两大部分组成:
1、告警产生和上报设备:用于产生并上报网络通信设备的告警信息;比如GPRS(通用无线分组业务)服务支持节点SGSN、通用无线分组业务GPRS网关支持节点GGSN等通信网络设备均属于告警产生设备,同时每种设备都将产生的告警上报到告警管理系统。
2、告警管理系统:接受告警产生和上报设备(如各网元)上报的告警信息,并向用户提供各种告警管理操作,同时,完成向各网元下发告警管理命令的功能。
通常,告警是通过声光等方式及时直观的显示系统的运行情况,为用户设备维护、网络优化、业务分析等工作提供数据依据。告警台显示的故障告警项用于提供给设备的维护人员,以便于维护人员进行相应的维护操作,告警台是网络故障管理的核心组成部分;为保证所述故障告警项的高可用性,要求相应的数据必需注重于对客户而言的实用性。
然而,目前网络通信设备的告警系统普遍存在告警太多、频率过高、重点不突出等问题。因此,不利于用户迅速有效地定位设备故障源,并针对故障进行后续诊断、维护工作。
为此,需要对告警进行精简,以消除告警过多、重点不突出等问题。
现在已经广泛使用的消除告警过多的手段是告警屏蔽。通过配置对某类告警进行屏蔽处理,一旦系统中此类告警发生,则一概屏蔽掉,不上报告警给用户。因为告警被全部屏蔽,等价于关闭了此类告警的上报功能,虽然告警数量是减少了,却无法再反映出某类系统故障的特征,不利于用户对设备的维护。
发明内容
鉴于上述现有技术所存在的问题,本发明的目的是提供一种告警管理方法和系统,从而能够有效减少告警数量、方便查找故障源而不丧失告警功能完整性告警管理方法。
本发明的目的是通过以下技术方案实现的:
本发明提供了一种告警管理方法,包括如下步骤:
A、将网络中具有相关性的各告警分别根据告警之间的因果关系设置为父告警和对应的子告警;
B、根据所述的父告警和对应子告警的相关性,对告警信息进行处理。
所述步骤A中的父告警和对应的子告警相关性设置保存于配置的存储数据库中,并提供有对其进行更新的管理接口。
所述步骤A中的父告警与子告警之间的相关性包括父告警必然会引起对应的子告警,且所述的父告警包括组合父告警,所述组合父告警是多个同时出现的父告警组合构成;当该组合父告警出现时必然产生子告警,且当该组合中缺少任何一个或多个父告警时并不必然产生子告警。
本发明中,当确定需要上报子告警时,如果其对应的父告警已经存在,则不上报该子告警。
本发明中,当父告警恢复时,如果子告警仍然没有恢复,则上报该子告警。
本发明中,当子告警恢复时,如果父告警仍然没有恢复,则不上报子告警恢复消息。
本发明中,当父告警在子告警产生后的预定的时间内产生时,对已经上报的子告警进行相关性恢复;所述相关性恢复是指由于父告警的存在而对子告警进行屏蔽。
本发明中,当子告警进行正常恢复时如果父告警还未恢复,则把子告警的相关性恢复更新为正常恢复。
本发明还提供了一种告警管理系统,包括告警信息接收模块、告警信息处理模块和告警信息发送模块,而且,在该系统中加入相关性处理模块,根据预先设置的告警信息的相关性,对告警信息进行相应的屏蔽和上报。
所述的相关性处理模块内置于告警信息处理模块中。
由上述本发明提供的技术方案可以看出,本发明在对告警之间的联系进行分析的基础上设置告警之间的父子关系,即产生父告警时必然也产生子告警,并在告警上报处理时不上报子告警以减少告警数量,上报父告警以保持告警功能的完整性并有利于查找故障源,从而达到了告警精简优化的效果,方便故障的诊断和维护。
其中告警之间父子关系可以存储在一个数据库中,而且父告警可以是一种组合父告警,即该组合父告警是由多个告警的组合,因此,这个告警数据库就能够包含告警之间所有的父子关系即告警产生之间的所有必然因果关系。这样,通过对告警相关性的分析,对有必然因果关系的多个告警,只上报父告警,减少设备上报给用户的告警数量,帮助用户有效的定位设备故障源,迅速找到父告警,针对父告警进行后续故障诊断、故障维护工作,提高了告警实用性和设备维护效率。
另外,通过在告警上报处理过程中的相关对应配套措施,使得本发明的网络管理告警上报处理优化方法更加完善、方便实用。
附图说明
图1为本发明所述的方法的处理流程示意图;
图2为本发明所述系统的结构示意图。
具体实施方式
本发明的核心思想是在对告警之间的联系进行分析的基础上设置告警之间的父子关系,即确定各告警之间的相关性,并在告警上报处理时,根据所述的相关性进行告警上报处理,具体为:如果父告警存在时,则不上报子告警以减少上报告警数量,而仅上报父告警,以保持告警功能的完整性并有利于查找故障源,从而达到了告警精简优化的目的。
可以看出,为实现本发明的目的需要在系统中进行合理的告警之间的相关性设置。为对本发明有更好地理解,下面将首先对本发明中告警之间的相关性进行分析说明:
在通信设备中上报的告警实例并不是孤立存在的,例如,如果发生一个底层功能的故障,会导致上层的基于该功能的其他功能也无法正常工作,那么实际向用户上报的告警实例便既有底层故障告警,也有上层故障告警。可以看出,这些告警之间存在因果关系,本发明中设置:如A告警必然引起B告警,则这些告警称为相关性告警,A告警是B告警的父告警,B告警是A告警的子告警。
在实际故障定位中,只要分析父告警的原因,并排除该故障,那么所有相关的告警都会被恢复。因此,可以由告警系统分析告警实例间的相关性,利用父告警屏蔽或恢复子告警,减少系统上报给用户的告警数量,并且帮助用户有效地定位设备故障源。
所述的告警相关性是告警实例间的关系。例如子系统A上的某链路断链,会导致建立在该链路上的信道中断,那么该子系统上的断链告警a和信道中断告警b是存在相关性的;如果此时子系统B上的信道也发生了故障,上报了信道中断告警c,这个信道中断告警就和断链告警a没有相关性了。
因此,判断告警实例是否存在相关性,具体的实现方式包括:
(1)判断告警项是否存在相关性的基础:
如断链告警和信道中断告警存在逻辑上的关联,可以认为它们存在相关性的基础,对于不存在逻辑关联的告警项就不存在相关性的基础;
(2)判断告警实例的关键属性是否存在逻辑关联:
告警实例的关键属性确定了该告警实例来自于哪个故障,如果两个告警实例对应的告警项存在相关性基础,而且它们的关键属性相匹配,才可以真正判断它们之间存在相关性关系。
综合上述分析,如果事先定义存在相关性基础的告警项,并明确定义该相关性需要匹配的告警属性,就可以在告警实例上报时,根据定义的告警相关性规则判断出告警实例间的相关性关系,对子告警进行后续的屏蔽处理。
下面结合附图对本发明作进一步的详细说明。
本发明所述的方法的具体实现如图1所示,包括以下步骤:
步骤100:在数据库中配置告警之间的父子关系,即配置父告警与子告警之间的相关性。
在数据库中设置告警之间的父子关系,是建立在对告警相关性分析的基础上的,并且可以根据情况的变化变化进行更新或者重新配置。
在配置过程中对于两告警之间的相关性符合一个告警产生时必然产生另一个告警的情况,则可以将前一告警称为父告警,后一告警称为子告警。
当一个告警产生时必然会有多个告警产生,则可以建立多个父子关系;
如果多个告警同时出现时才必然产生另一个告警,则只能建立一个多对一的父子关系,此时把父告警称为组合父告警;当该组合中的一个或者多个告警没有同时出现时,并不必然出现子告警。因此,如果一个组合父告警产生时必然产生多个告警时,可以建立多个多对一的父子关系。
这样,经过步骤101的配置,告警之间的各种必然因果关系都可以分解为一对一或者是多对一的父子对应关系,并且,各对应关系都可以用数据库的形式方便地进行存储配置,及修改更新。
配置好告警之间的父子关系之后,就可以把它们应用到告警上报的优化处理中去;
步骤101:等待接收新的告警/恢复消息;
步骤102:当收到新的告警/恢复消息后,首先要进行判断收到的是新的告警还是恢复消息,如果收到的是新的告警,则执行步骤103,否则,执行步骤107:
步骤103:进一步判断是否存在未被恢复的父告警,如果存在,则执行步骤105,否则,执行步骤104;
步骤104:正常上报该告警信息,并执行步骤105;
步骤105:判断是否存在此前10秒内(或者其它可以认为父告警与子告警同时产生甚至更早产生的时间范围,且该10秒时间也可以根据实际需要进行调整,即并不固定为10秒)产生且未被恢复的子告警,如果是,则执行步骤106,否则,过程结束,并重新执行步骤101。
此处,需要说明的是:步骤103和步骤105所描述的两个判断执行的先后顺序是可以调换的,当然,其相应的处理措施也同时调换顺序。总之,如果存在未被恢复的父告警,则不上报新告警;如果不存在未被恢复的父告警,则正常上报新告警。如果存在此前10秒内未被恢复的子告警,则执行步骤106;否则,不需要特别处理;
步骤106:对该子告警进行相关性恢复,过程结束,等待重新收到新的告警/恢复消息后执行步骤101;
所述的相关性恢复是指:由于父告警的存在而对子告警进行屏蔽。
步骤107:如果步骤104中判断收到的不是新的告警,而是告警的恢复消息,则还要判断该恢复消息对应的告警是否已经上报,如果是,则执行步骤108,否则,执行步骤111;
步骤108:判断已上报的对应告警是否处于相关性恢复的状态,如果是,则表明对应告警的父告警在采用相关性恢复措施后父告警仍未恢复,需要执行步骤109,否则,执行步骤110;
步骤109:将对应故障的相关性恢复更新为正常恢复,并执行步骤111;
步骤110:正常上报恢复消息,并执行步骤111;
步骤111:判断对应告警的子告警是否未恢复,如果是,则执行步骤112,否则,过程结束,并重新执行步骤101;
此处,需要说明的是:步骤107和步骤111所述的两个判断处理过程的先后顺序也是可以调换的,当然,其相应的处理措施也同时调换顺序。
步骤112:判断对应告警的子告警仍然未恢复,则激活此子告警,重新上报此子告警。
本发明还提供了一种告警管理系统,图2所示,包括用于接收告警信息的告警信息接收模块、用于对告警信息进行处理的告警信息处理模块和用于上报告警信息的告警信息发送模块,同时,在该系统中加入相关性处理模块,具体为在所述的告警信息处理模块中增加设置相关性处理模块,用于根据预先设置的告警信息的相关性,对告警信息进行相应的屏蔽和上报,具体的屏蔽和上报处理方式前面已经描述,故此处不再详述。
综上所述,本发明通过针对各告警相关性的分析,从而有效简化了网管过程中上报的告警量,并可以保证告警功能的可靠实现,因此,本发明的实现可以提高告警实用性及设备的可维护性。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1、一种告警管理方法,其特征在于,包括如下步骤:
A、将网络中各具有相关性的告警分别根据告警间的因果关系设置为父告警和对应的子告警;
B、根据所述父告警和对应的子告警的相关性,对告警信息进行处理。
2、根据权利要求1所述的告警管理方法,其特征在于,所述步骤A中的父告警和对应的子告警相关性设置保存于配置的存储数据库中,并提供有对其进行更新的管理接口。
3、根据权利要求1所述的告警管理方法,其特征在于,所述步骤A中的父告警与子告警之间的相关性包括父告警必然会引起对应的子告警,且所述的父告警包括组合父告警,所述组合父告警是多个同时出现的父告警组合构成;当该组合父告警出现时必然产生子告警,且当该组合中缺少任何一个或多个父告警时并不必然产生子告警。
4、根据权利要求1所述的告警管理方法,其特征在于,当确定需要上报子告警时,如果其对应的父告警已经存在,则不上报该子告警。
5、根据权利要求1所述的告警管理方法,其特征在于,当父告警恢复时,如果子告警仍然没有恢复,则上报该子告警。
6、根据权利要求1所述的告警管理方法,其特征在于,当子告警恢复时,如果父告警仍然没有恢复,则不上报子告警恢复消息。
7、根据权利要求1所述的告警管理方法,其特征在于,当父告警在子告警产生后的预定的时间内产生时,对已经上报的子告警进行相关性恢复;所述相关性恢复是指由于父告警的存在而对子告警进行屏蔽。
8、根据权利要求1所述的告警管理方法,其特征在于,当子告警进行正常恢复时如果父告警还未恢复,则把子告警的相关性恢复更新为正常恢复。
9、一种告警管理系统,包括告警信息接收模块、告警信息处理模块和告警信息发送模块,其特征在于,在该系统中加入相关性处理模块,根据预先设置的告警信息的相关性,对告警信息进行相应的屏蔽和上报。
10、根据权利要求9所述的告警管理系统,其特征在于,所述的相关性处理模块内置于告警信息处理模块中。
CNB200510109282XA 2005-10-20 2005-10-20 一种告警管理方法和系统 Expired - Fee Related CN100433647C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB200510109282XA CN100433647C (zh) 2005-10-20 2005-10-20 一种告警管理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB200510109282XA CN100433647C (zh) 2005-10-20 2005-10-20 一种告警管理方法和系统

Publications (2)

Publication Number Publication Date
CN1863080A true CN1863080A (zh) 2006-11-15
CN100433647C CN100433647C (zh) 2008-11-12

Family

ID=37390413

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200510109282XA Expired - Fee Related CN100433647C (zh) 2005-10-20 2005-10-20 一种告警管理方法和系统

Country Status (1)

Country Link
CN (1) CN100433647C (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102111788A (zh) * 2009-12-29 2011-06-29 中兴通讯股份有限公司 一种告警处理方法及告警管理系统
CN102136922A (zh) * 2010-01-22 2011-07-27 华为技术有限公司 相关性分析的方法、设备及系统
CN102387035A (zh) * 2011-09-13 2012-03-21 瑞斯康达科技发展股份有限公司 一种告警处理方法和装置
CN102832998A (zh) * 2012-09-12 2012-12-19 上海斐讯数据通信技术有限公司 一种告警屏蔽配置方法
CN103209096A (zh) * 2013-04-01 2013-07-17 大唐移动通信设备有限公司 告警处理方法和设备
WO2014127621A1 (zh) * 2013-02-21 2014-08-28 中兴通讯股份有限公司 一种告警处理方法及装置、告警关联信息设置方法
WO2014169869A1 (zh) * 2013-10-31 2014-10-23 中兴通讯股份有限公司 一种告警处理的方法及告警系统
CN106730196A (zh) * 2016-12-12 2017-05-31 北京怡和嘉业医疗科技股份有限公司 一种报警方法、装置及呼吸机
WO2018119776A1 (zh) * 2016-12-28 2018-07-05 深圳中兴力维技术有限公司 告警处理方法和装置
CN110138609A (zh) * 2019-05-10 2019-08-16 江西山水光电科技股份有限公司 一种光传送网otn中的告警相关性抑制方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6707795B1 (en) * 1999-04-26 2004-03-16 Nortel Networks Limited Alarm correlation method and system
CN1278516C (zh) * 2002-05-27 2006-10-04 华为技术有限公司 网络管理系统中闪断告警的处理方法
CN100438423C (zh) * 2002-08-06 2008-11-26 华为技术有限公司 电信设备故障信息管理方法
CN100450008C (zh) * 2002-10-22 2009-01-07 华为技术有限公司 通信网络告警的处理方法和相关性分析管理器

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102111788A (zh) * 2009-12-29 2011-06-29 中兴通讯股份有限公司 一种告警处理方法及告警管理系统
CN102136922A (zh) * 2010-01-22 2011-07-27 华为技术有限公司 相关性分析的方法、设备及系统
CN102136922B (zh) * 2010-01-22 2014-04-16 华为技术有限公司 相关性分析的方法、设备及系统
CN102387035B (zh) * 2011-09-13 2014-02-05 瑞斯康达科技发展股份有限公司 一种告警处理方法和装置
CN102387035A (zh) * 2011-09-13 2012-03-21 瑞斯康达科技发展股份有限公司 一种告警处理方法和装置
CN102832998A (zh) * 2012-09-12 2012-12-19 上海斐讯数据通信技术有限公司 一种告警屏蔽配置方法
CN102832998B (zh) * 2012-09-12 2015-09-02 上海斐讯数据通信技术有限公司 一种告警屏蔽配置方法
WO2014127621A1 (zh) * 2013-02-21 2014-08-28 中兴通讯股份有限公司 一种告警处理方法及装置、告警关联信息设置方法
US9788218B2 (en) 2013-02-21 2017-10-10 Xi'an Zhongxing New Software Co., Ltd. Alarm processing method and device, alarm associated information setting method
CN103209096A (zh) * 2013-04-01 2013-07-17 大唐移动通信设备有限公司 告警处理方法和设备
WO2014169869A1 (zh) * 2013-10-31 2014-10-23 中兴通讯股份有限公司 一种告警处理的方法及告警系统
CN106730196A (zh) * 2016-12-12 2017-05-31 北京怡和嘉业医疗科技股份有限公司 一种报警方法、装置及呼吸机
CN106730196B (zh) * 2016-12-12 2019-11-15 北京怡和嘉业医疗科技股份有限公司 一种报警方法、装置及呼吸机
WO2018119776A1 (zh) * 2016-12-28 2018-07-05 深圳中兴力维技术有限公司 告警处理方法和装置
CN110138609A (zh) * 2019-05-10 2019-08-16 江西山水光电科技股份有限公司 一种光传送网otn中的告警相关性抑制方法

Also Published As

Publication number Publication date
CN100433647C (zh) 2008-11-12

Similar Documents

Publication Publication Date Title
CN1863080A (zh) 一种告警管理方法和系统
US20220187815A1 (en) Systems and methods for detecting and predicting faults in an industrial process automation system
US7259666B1 (en) Method and system for displaying status indications from communications network
US7636424B1 (en) Method and system for selectively displaying alarms in a communications network
US7301448B1 (en) Method and system for deduplicating status indications in a communications network
CN1190733C (zh) 数据管理应用程序的故障恢复方法和系统
US6792269B2 (en) System, method and apparatus for tracking deployment of cellular telephone network sites
CN101446914B (zh) 一种数据库监控方法及装置
US7526322B2 (en) Real-time analyst program for processing log files from network elements
CN108512689A (zh) 微服务业务监控方法及服务器
WO2007143943A1 (fr) Procédé, système et dispositif réseau de maintenance centralisée de dispositifs multiples
CN1412978A (zh) 用于数字数据网接入模块的管理指配控件及其控制方法
CN101079683A (zh) 数据一致性处理方法
CN101854277A (zh) 一种移动通信经营分析系统的监控方法
CN104486109A (zh) 一种故障检测、恢复方法及装置
CN1217265C (zh) 一种进程自动恢复方法
CN101388794B (zh) 一种定位网络管理系统异常事件的方法和系统
CN1503508A (zh) 网管系统的故障相关性分析及实现方法
WO2021143483A1 (zh) 系统维护方法、装置、设备和存储介质
CN1946042A (zh) 基于aop技术的大规模集群管理监控系统中的报警方法
CN100499497C (zh) 一种快速处理告警的方法和系统
CN101145944B (zh) 一种实现告警处理的方法
CN1882001A (zh) 一种通信系统中信令信息的收集系统和方法
CN104133915A (zh) 一种数据库管理员运维行为的监控方法及系统
CN1635802A (zh) 告警系统及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081112

CF01 Termination of patent right due to non-payment of annual fee