CN101076174B - 告警风暴的处理方法 - Google Patents

告警风暴的处理方法 Download PDF

Info

Publication number
CN101076174B
CN101076174B CN2007101117563A CN200710111756A CN101076174B CN 101076174 B CN101076174 B CN 101076174B CN 2007101117563 A CN2007101117563 A CN 2007101117563A CN 200710111756 A CN200710111756 A CN 200710111756A CN 101076174 B CN101076174 B CN 101076174B
Authority
CN
China
Prior art keywords
alarm
windstorm
clearing
report
described alarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007101117563A
Other languages
English (en)
Other versions
CN101076174A (zh
Inventor
詹新生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2007101117563A priority Critical patent/CN101076174B/zh
Publication of CN101076174A publication Critical patent/CN101076174A/zh
Application granted granted Critical
Publication of CN101076174B publication Critical patent/CN101076174B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

一种告警风暴处理方法,用于由基站设备对告警风暴进行处理,包括:创建告警风暴列表;基站设备在收到告警/告警恢复时,检查告警/告警恢复是否在告警风暴链表中,如果告警/告警恢复不在告警风暴链表中,则直接上报告警/告警恢复,否则,将告警/告警恢复的告警时间值和告警上次告警恢复时间值的差与门限值进行比较;以及根据比较结果,确定是否上报告警/告警恢复。从而,克服了现有技术中的发生告警风暴时前后台通讯压力增大,以及频繁进行系统应对等缺点。

Description

告警风暴的处理方法
技术领域
本发明涉及一种通讯系统设备中告警处理单元在发生告警风暴时的处理方法,更具体地,涉及一种基站设备处理告警风暴的方法。
背景技术
无线通信的基站设备的各个硬件单元都具有告警处理模块,此模块的主要功能是负责监控系统各单元模块的工作情况和状态,收集各监控单元的告警消息,同时根据告警消息进行相应的告警应对。告警处理模块对这些消息进行解析整理,发送到主控处理单板,最终向后台网管系统发送,使得后台网管能够对系统的运行情况进行监控。
基站设备告警处理模块易出现这种情况的告警系列:对于同一个告警(1)出现告警/告警恢复成对频繁上报,(2)两次告警恢复之间的时间差小于某个门限值T,我们认为此时发生了告警风暴。如附图1所示,在图1中,1,3,5,7,9表示某告警的告警上报的时间次序;2,4,6,8,10表示某告警的告警恢复上报的时间次序;T1为告警上报时间与之前告警恢复时间的差值;以及T2为告警恢复上报时间与之前告警恢复时间的差值。
针对告警风暴,目前的做法是基站设备不对告警进行过滤性处理,直接交后台网管处理。这样产生两个问题:
(1)当某些告警/告警恢复频繁产生时,会出现频繁的系统应对,造成系统资源消耗过大,影响系统效率,同时可能造成硬件损坏。例如,某个告警产生后,系统会对其他单板硬件掉电操作,当发生告警风暴,频繁产生告警则不断进行掉电操作,则可能对硬件模块造成损坏。
(2)一个网管系统管理几百个基站,当发生告警风暴告警频繁上报给后台网管系统,造成前后台通讯量过大,陡增了前后台通讯压力,影响网管系统处理效率。
因此,需要一种告警风暴的处理方法,用于克服现有技术中的发生告警风暴时前后台通讯压力增大,以及频繁进行系统应对等缺点。
发明内容
本发明的主要目的在于提供一种告警风暴的处理方法,用于克服现有技术中的发生告警风暴时前后台通讯压力增大,以及频繁进行系统应对等缺点。
为了实现上述目的,根据本发明的一个方面,提供了一种告警风暴处理方法,用于由基站设备对告警风暴进行处理,包括以下步骤:
创建告警风暴链表;
基站设备在收到告警时,检查告警是否在告警风暴链表中,如果告警不在告警风暴链表中,则直接上报告警,否则,将告警的告警时间值和告警的上次告警恢复时间值的差与门限值进行比较;以及
根据比较结果,确定是否上报告警。
告警风暴链表可以包括以下任一种或其组合:告警码、告警子码、时间、告警风暴标记、以及告警标记。
当比较结果为告警的告警时间值和告警的上次告警恢复时间值的差大于门限值时,包括以下处理:直接上报告警;以及判断之前的其它告警中是否存在告警风暴,如果存在则上报告警风暴通知。
当比较结果为告警的告警时间值和告警的上次告警恢复时间值的差不大于门限值时,包括以下处理:不上报告警,并将告警标记置为告警上报;判断之前的其它告警中是否存在告警风暴,如果存在则上报告警风暴通知;以及在预定时间后,判断是否存在告警的告警恢复上报信息,如果不存在告警恢复上报信息,则上报告警。
告警风暴处理方法,还包括以下步骤:当基站设备收到告警恢复消息时,判断告警恢复消息是否在告警风暴链表中,如果告警恢复消息不在告警风暴链表中,则在告警风暴链表中创建链表节点,否则,将告警恢复的告警恢复时间值和告警恢复的上次告警恢复时间值的差与门限值进行比较;以及根据比较结果,确定是否上报告警恢复。
创造链表节点可以包括以下步骤:记录当前告警码、当前告警子码、当前告警时间;以及将告警风暴标记置为非,将告警标记置为告警恢复,并直接上报告警恢复。
当比较结果为告警恢复的告警恢复时间值和告警恢复的上次告警恢复时间值的差大于门限值时,包括以下处理:直接上报告警恢复,并将告警标记置为告警恢复上报;以及判断之前的其它告警中是否存在告警风暴,如果存在则上报告警风暴通知,并将告警风暴标记置为非。
当比较结果为告警恢复的告警恢复时间值和告警恢复的上次告警恢复时间值的差不大于门限值时,包括以下处理:不上报告警恢复;以及将告警风暴标记置为是,将告警标记置为告警上报,并更新告警风暴链表中的告警记录时间。
告警风暴处理方法,还包括以下处理:定时扫描告警链表,并根据扫描结果确定是否上报告警风暴。
告警风暴处理方法,其中,如果扫描到的告警标记为告警上报,则上报告警;如果扫描到的告警风暴标记为是,则上报告警风暴,并将告警风暴标记置为非,将告警标记置为告警恢复上报;以及重复定时扫描的操作。
通过上述技术方案,本发明克服了现有技术中的发生告警风暴时前后台通讯压力增大,和频繁进行系统应对等缺点,并且在发生告警风暴时,基站设备可以通过可靠机制通知后台网管哪些告警发生了告警风暴。
附图说明
图1是示出了告警风暴发生的示意图;
图2是示出了根据本发明的告警风暴处理方法的流程图;
图3是示出了根据本发明的实施例的告警上报处理的流程图;
图4是示出了根据本发明的实施例的告警恢复上报处理的流程图;以及
图5是示出了根据本发明的实施例的定时扫描告警风暴链表的示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图2是示出了根据本发明的告警风暴处理方法的流程图。
参照图2,在本实施例中,提供了一种告警风暴处理方法,用于由基站设备对告警风暴进行处理,包括以下步骤:
步骤S202,创建告警风暴列表;
步骤S204,基站设备在收到告警时,检查告警是否在告警风暴链表中,如果告警不在告警风暴链表中,则直接上报告警,否则,将告警的告警时间值和告警的上次告警恢复时间值的差与门限值进行比较;以及
步骤S206,根据比较结果,确定是否上报告警。
告警风暴列表可以包括以下任一种或其组合:告警码、告警子码、时间、告警风暴标记、以及告警标记。
当比较结果为告警的告警时间值和告警的上次告警恢复时间值的差大于门限值时,包括以下处理:直接上报告警;以及判断之前的其它告警中是否存在告警风暴,如果存在则上报告警风暴通知。
当比较结果为告警的告警时间值和告警的上次告警恢复时间值的差不大于门限值时,包括以下处理:不上报告警,并将告警标记置为告警上报;判断之前的其它告警中是否存在告警风暴,如果存在则上报告警风暴通知;以及在预定时间后,判断是否存在告警的告警恢复上报信息,如果不存在告警恢复信息,则上报告警。
告警风暴处理方法,还包括以下步骤:当基站设备收到告警恢复消息时,判断告警恢复消息是否在告警风暴链表中,如果告警恢复消息不在告警风暴链表中,则在告警风暴链表中创建链表节点,否则,将告警恢复的告警恢复时间值和告警恢复的上次告警恢复时间值的差与门限值进行比较;以及根据比较结果,确定是否上报告警恢复。
创造链表节点可以包括以下步骤:记录当前告警码、当前告警子码、当前告警时间;以及将告警风暴标记置为非,将告警标记置为告警恢复,并直接上报告警恢复。
当比较结果为告警恢复的告警恢复时间值和告警恢复的上次告警恢复时间值的差大于门限值时,包括以下处理:直接上报告警恢复,并将告警标记置为告警恢复上报;以及判断之前的其它告警中是否存在告警风暴,如果存在则上报告警风暴通知,并将告警风暴标记置为非。
当比较结果为告警恢复的告警恢复时间值和告警恢复的上次告警恢复时间值的差不大于门限值时,包括以下处理:不上报告警恢复;以及将告警风暴标记置为是,将告警标记置为告警上报,并更新告警风暴链表中的告警记录时间。
告警风暴处理方法,还包括以下处理:定时扫描告警链表,并根据扫描结果确定是否上报告警风暴。
告警风暴处理方法,其中,如果扫描到的告警标记为告警上报,则上报告警;如果扫描到的告警风暴标记为是,则上报告警风暴,并将告警风暴标记置为非,将告警标记置为告警恢复上报;以及重复定时扫描的操作。
以下将参照图1、图3、和图4所示,以WCDMA的基站发生告警风暴告警处理为例对本发明进行更详细的描述,其中,取告警风暴门限值T为2秒。
图3是示出了根据本发明的实施例的告警上报处理的流程图。
如图3所示,告警上报处理主要包括以下步骤:
S302,收到告警上报消息;
S304,检查当前告警是否在告警风暴链表中,如果是第一次收到该告警上报消息,则直接进行到步骤S310,将此告警直接上报,否则进行到步骤S306;
S306,获取告警链表中当前告警的记录时间TickN-1值;
S308,判断此值与之前此告警恢复的时间值之差是否大于告警风暴门限T,即,|TickN-TickN-1|是否大于T;
S310,如果S308的判断结果为|TickN-TickN-1|大于T,此告警直接上报。同时判断之前的告警系列是否存在告警风暴,存在则上报告警风暴通知;以及
S312,如果S308的判断结果为|TickN-TickN-1|小于等于T,则告警先不上报,同时置告警标记为告警上报;若之后无告警恢复上报消息来,则时间t后此告警上报在此告警上报之前检查之前是否出现告警风暴,有告警风暴则上报告警风暴通知。
图4是示出了根据本发明的实施例的告警恢复上报处理的流程图。如图4所示,收到告警恢复上报处理包括以下步骤:
S402,收到告警恢复上报消息;
S404,检查当前告警恢复是否在告警风暴链表中,如果为第一次收到告警恢复上报消息,则检查结果为不在,进行到步骤S406,否则进行到步骤S408;
S406,创建告警风暴链表节点,记录当前告警码、告警子码、当前时间Tick1,初始化告警风暴标记为非,初始化告警标记为告警恢复,并直接上报此告警恢复;
步骤S408,取当前的告警恢复时间值TickN
步骤S410,判断此值与之前此告警恢复的时间值TickN-1之差是否小于告警风暴门限T,即,判断|TickN-TickN-1|是否大于T,如果判断结果为|TickN-TickN-1|大于T,则执行步骤S412,否则执行步骤S414;
步骤S412,此告警恢复直接上报,同时判断之前的告警系列是否存在告警风暴,存在则上报告警风暴通知,并将告警风暴标记置为非告警风暴;以及
步骤S414,如果判断结果为|TickN-TickN-1|小于等于T,则将告警风暴标志置为是告警风暴。
图5是示出了根据本发明的实施例的定时扫描告警风暴链表的示意图。如图5所示,定时扫描告警风暴链表的过程包括以下步骤:
S502,设置定时器,可以根据需要将定时器设置为不同的时长;
S504,定时器到时;
S506,扫描告警链表,若告警标记为告警上报,则上报此告警;若告警风暴标记为是,则上报告警风暴通知;
S508,重置相关标记,包括将告警风暴标记置为非,将告警标记置为告警恢复上报;以及
S510,重置定时器,重复执行步骤S504~S506。
从以上实施情况来看,本发明提出的技术方案可以保证基站的告警在发生告警风暴时能及时准确的把当前发生告警风暴的情况上报给后台网管系统。
本发明不仅适用无线通信基站系统,也适合其他通信体制的通讯网元系统。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种告警风暴处理方法,其特征在于,用于由基站设备对告警风暴进行处理,包括以下步骤:
创建告警风暴链表;
基站设备在收到告警时,检查所述告警是否在告警风暴链表中,如果所述告警不在所述告警风暴链表中,则直接上报所述告警,否则,将所述告警的告警时间值和所述告警的上次告警恢复时间值的差与门限值进行比较;以及
根据比较结果,确定是否上报所述告警。
2.根据权利要求1所述的告警风暴处理方法,其特征在于,所述告警风暴链表包括以下任一种或其组合:告警码、告警子码、时间、告警风暴标记、以及告警标记。
3.根据权利要求2所述的告警风暴处理方法,其特征在于,当比较结果为所述告警的告警时间值和所述告警的上次告警恢复时间值的差大于所述门限值时,包括以下处理:
直接上报所述告警;以及
判断之前的其它告警中是否存在所述告警风暴,如果存在则上报告警风暴通知。
4.根据权利要求2所述的告警风暴处理方法,其特征在于,当比较结果为所述告警的告警时间值和所述告警的上次告警恢复时间值的差不大于所述门限值时,包括以下处理:
不上报所述告警,并将告警标记置为告警上报;
判断之前的其它告警中是否存在所述告警风暴,如果存在则上报告警风暴通知;以及
在预定时间后,判断是否存在所述告警的告警恢复上报信息,如果不存在所述告警恢复上报信息,则上报所述告警。
5.根据权利要求3或4所述的告警风暴处理方法,其特征在于,还包括以下步骤:
当所述基站设备收到告警恢复消息时,判断所述告警恢复消息是否在所述告警风暴链表中,如果所述告警恢复消息不在所述告警风暴链表中,则在所述告警风暴链表中创建链表节点,否则,将所述告警恢复的告警恢复时间值和所述告警恢复的上次告警恢复时间值的差与所述门限值进行比较;以及根据比较结果,确定是否上报所述告警恢复。
6.根据权利要求5所述的告警风暴处理方法,其特征在于,所述创建链表节点包括以下步骤:
记录当前告警码、当前告警子码、当前告警时间;以及
将告警风暴标记置为非,将所述告警标记置为告警恢复,并直接上报所述告警恢复。
7.根据权利要求5所述的告警风暴处理方法,其特征在于,当所述比较结果为所述告警恢复的告警恢复时间值和所述告警恢复的上次告警恢复时间值的差大于所述门限值时,包括以下处理:
直接上报所述告警恢复,并将所述告警标记置为告警恢复上报;以及
判断之前的其它告警中是否存在告警风暴,如果存在则上报告警风暴通知,并将所述告警风暴标记置为非。
8.根据权利要求5所述的告警风暴处理方法,其特征在于,当所述比较结果为所述告警恢复的告警恢复时间值和所述告警恢复的上次告警恢复时间值的差不大于所述门限值时,包括以下处理:
不上报所述告警恢复;以及
将所述告警风暴标记置为是,将所述告警标记置为告警上报,并更新所述告警风暴链表中的告警时间。
9.根据权利要求6至8中任一项所述的告警风暴处理方法,其特征在于,还包括以下处理:
定时扫描所述告警风暴链表,并根据扫描结果确定是否上报所述告警风暴。
10.根据权利要求9所述的告警风暴处理方法,其特征在于,
如果扫描到的所述告警标记为告警上报,则上报所述告警;
如果扫描到的所述告警风暴标记为是,则上报所述告警风暴,并将所述告警风暴标记置为非,将所述告警标记置为告警恢复上报;以及
重复定时扫描的操作。
CN2007101117563A 2007-06-05 2007-06-05 告警风暴的处理方法 Expired - Fee Related CN101076174B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101117563A CN101076174B (zh) 2007-06-05 2007-06-05 告警风暴的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101117563A CN101076174B (zh) 2007-06-05 2007-06-05 告警风暴的处理方法

Publications (2)

Publication Number Publication Date
CN101076174A CN101076174A (zh) 2007-11-21
CN101076174B true CN101076174B (zh) 2010-09-29

Family

ID=38976949

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101117563A Expired - Fee Related CN101076174B (zh) 2007-06-05 2007-06-05 告警风暴的处理方法

Country Status (1)

Country Link
CN (1) CN101076174B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101610168B (zh) * 2008-06-19 2012-09-05 中兴通讯股份有限公司 网管系统中告警风暴的抑制方法和装置
CN101741626B (zh) * 2008-11-26 2012-04-18 华为技术有限公司 一种告警信息的处理方法和装置
CN103378981B (zh) * 2012-04-16 2017-11-03 中兴通讯股份有限公司 网管系统中振荡告警的处理方法及装置
CN103684821A (zh) * 2012-09-11 2014-03-26 中兴通讯股份有限公司 告警消息的处理方法及装置
CN103220173B (zh) * 2013-04-09 2015-10-21 北京搜狐新媒体信息技术有限公司 一种报警监控方法及监控系统
CN106483913A (zh) * 2015-08-24 2017-03-08 有车(北京)新能源汽车租赁有限公司 一种告警风暴处理方法及装置
CN108234179A (zh) * 2016-12-21 2018-06-29 大唐移动通信设备有限公司 一种告警信息上报的方法及装置
CN109669745A (zh) * 2018-11-21 2019-04-23 中国航空工业集团公司洛阳电光设备研究所 一种基于告警等级的告警信息处理方法
CN110290546B (zh) * 2019-06-21 2023-04-11 京信网络系统股份有限公司 基站重启定位方法、装置、基站设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1523802A (zh) * 2003-09-05 2004-08-25 中兴通讯股份有限公司 一种cdma系统中防止告警风暴的方法
CN1852158A (zh) * 2005-11-29 2006-10-25 华为技术有限公司 一种电信网络告警的实现方法及其系统
CN1859211A (zh) * 2006-03-08 2006-11-08 华为技术有限公司 告警报文的处理方法、装置和系统
EP1742415A1 (de) * 2005-07-05 2007-01-10 Siemens Aktiengesellschaft Automatische Korrektur von Alarmlisten in Managementsystemen

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1523802A (zh) * 2003-09-05 2004-08-25 中兴通讯股份有限公司 一种cdma系统中防止告警风暴的方法
EP1742415A1 (de) * 2005-07-05 2007-01-10 Siemens Aktiengesellschaft Automatische Korrektur von Alarmlisten in Managementsystemen
CN1852158A (zh) * 2005-11-29 2006-10-25 华为技术有限公司 一种电信网络告警的实现方法及其系统
CN1859211A (zh) * 2006-03-08 2006-11-08 华为技术有限公司 告警报文的处理方法、装置和系统

Also Published As

Publication number Publication date
CN101076174A (zh) 2007-11-21

Similar Documents

Publication Publication Date Title
CN101076174B (zh) 告警风暴的处理方法
CN103430483B (zh) 用于确定通信系统中的关联事件的技术
CN101800675B (zh) 故障监控方法、监控设备及通信系统
CN102014012B (zh) 一种告警同步的方法及装置
CN102752788A (zh) 检测失效小区的方法和设备
CN100589412C (zh) 检测单板插拔情况的系统和方法
CN105223949A (zh) 电器设备及其通讯故障诊断方法和装置
CN101257355A (zh) 一种无线传感器网络节点故障检测方法
US10862738B2 (en) System and method for alarm correlation and root cause determination
CN102196472A (zh) 网元异常告警方法、装置及系统
CN101978710A (zh) 地震和海啸蜂窝警报系统
CN105258103A (zh) 全自动锅炉智能报警提醒系统及方法
RU2010137739A (ru) Способ передачи сигнала оповещения и мобильная станция
CN101938365A (zh) 以太网中的故障处理方法和装置
CN101389112A (zh) 告警处理方法、装置和系统
CN202282059U (zh) 报警信息提示装置
CN101179813B (zh) 一种基站控制器告警测试的自动上报方法
CN106408220A (zh) 一种无人值守的产生超级告警的方法及装置
CN101364903A (zh) 一种基站告警的方法、系统及相关装置
CN205227277U (zh) 全自动锅炉智能报警提醒系统
CN101877653A (zh) 告警变化信息是否丢失的判定方法、系统及主控板
WO2014040470A1 (zh) 告警消息的处理方法及装置
CN104050764A (zh) 利用蓝牙通信实现手机之间的防盗监控报警方法及系统
CN103476052A (zh) 一种故障检测方法和设备
CN103457792A (zh) 一种故障检测方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100929

Termination date: 20160605