CN101222361B - 一种告警频率监控器及告警处理方法 - Google Patents
一种告警频率监控器及告警处理方法 Download PDFInfo
- Publication number
- CN101222361B CN101222361B CN2008100008489A CN200810000848A CN101222361B CN 101222361 B CN101222361 B CN 101222361B CN 2008100008489 A CN2008100008489 A CN 2008100008489A CN 200810000848 A CN200810000848 A CN 200810000848A CN 101222361 B CN101222361 B CN 101222361B
- Authority
- CN
- China
- Prior art keywords
- alarm
- time period
- statistical analysis
- counting
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种告警频率监控系统及方法,用于根据告警频率监控告警,首先,设定需要进行频率监控告警的范围、统计分析的时间段以及所述时间段内告警上报次数的门限值;然后,在所述统计分析的时间段内,对符合所述监控告警的范围内的告警进行告警计数;最后,当统计分析的时间段到达后,若告警计数超过所述门限值,则生成一条新的告警进行上报。本发明方法可以根据频率监控告警,提高系统的稳定性;同时,还与现有的告警处理流程相兼容。
Description
技术领域
本发明涉及告警监控技术领域,尤其涉及一种告警监控器及告警处理方法。
背景技术
告警监控是各种设备运行的有利保障,可以确保及时发现故障,通过告警系统报告给监控人员,使得监控人员可以根据各种告警及时做出正确处理。尤其在通信技术领域中,各种通信设备的告警处理功能,在网管系统中占有越来越重要的地位。完善有效的告警处理设备及方法,不仅能使维护人员快速定位设备故障所在位置,还能及时避免可能造成的严重后果。
目前,常用的告警处理方式是网管接收来自设备的告警上报信息,根据告警信息的重要性对告警进行分级,常见告警等级包括轻微告警、普通告警、重要告警和严重告警等,并将告警时间、地点、级别等告警相关信息分别记录在数据库中,网管系统及时以告警提示方式通知维护人员查看,进行相应的处理,直到上报告警恢复后该告警提示消失。
常见的告警提示方式包括:信号灯变化、语音提示、推屏、弹出对话框、根据告警级别以不同颜色显示或通过Email前转等方式。虽然有多种告警提示方式可供采用,并且也可以根据重要级别不同而采用不同告警提示方式通知维护人员查看。但是,如果有大量轻微告警上报,一般来说很难引起维护人员注意,往往使得故障得不到及时处理和修复,若轻微故障长久得不到处理的话,也会对系统的稳定性造成严重影响。
各种告警本身也会有出现频率上的差异,当有某一告警频繁出现时,表明该故障相对而言出现概率较大,说明设备对应位置稳定性差,更需优先及时处理。即使对于同一级别的告警而言,处理时也会有轻重缓急的区别,若在等同级别下,对于告警频繁的告警应当优先处理;对于不同级别的告警,若某些低级别的告警频繁出现,则也应当尽快处理,避免造成严重后果。
因而,对于设备告警监控设备而言,不但需要根据告警级别进行告警处理,还需要考虑告警出现的频繁度。
发明内容
本发明所要解决的技术问题在于,提供一种告警频率监控器及告警处理方法,实现根据告警频率对告警进行监控上报。
本发明提供一种告警频率监控器,用于根据告警频率监控告警,包括告警参数配置管理模块(101),还包括分别与所述告警参数配置管理模块(101)相连的告警选择器(102)、告警计数器(103)、门限定时检测器(104)、告警发生器(105),其中:
所述告警参数配置管理模块,用于配置监控告警的范围、统计分析的时间段、所述时间段内告警上报次数的门限值;
所述告警选择器,用于根据所述监控告警的范围判断接收的告警是否在所述范围内,如果是,则将该告警上报至所述告警计数器;
所述告警计数器,用于对所述统计分析的时间段内接收到的告警进行计数;
所述门限定时检测器,用于定时检查告警计数器中的告警计数,根据所述时间段内告警上报次数的门限值判断告警计数是否大于指定的门限值,当告警计数超过门限值时,指示所述告警发生器发出一条计数告警;
告警发生器,用于在接收到门限定时检测器指示后,产生并上报一条计数告警。
所述告警参数配置管理模块,是根据告警类型、告警发生位置、告警码、告警严重级别、或告警时间进行组合配置确定监控告警的范围。
所述告警计数器,是通过维护一条告警队列实现计数,其采用先进先出的机制,始终保持队列中的所有告警的上报时间与当前时间之差不超过预先设置的统计分析时间段的时长。
所述告警计数器,在队列首端告警的上报时间与当前时间差大于指定的统计分析时间段的时长时,去掉队列中溢出的节点,移出告警队列首端的告警。
所述参数配置管理模块,还用于配置生成计数告警的详细信息及严重级别;所述告警发生器,根据设定的生成计数告警的详细信息及严重级别生成告警、或者根据门限定时检测器检测到的信息生成新的告警。
本发明还提供一种告警频率监控方法,包括如下步骤:
首先,设定需要进行频率监控告警的范围、统计分析的时间段以及所述时间段内告警上报次数的门限值;
然后,在所述统计分析的时间段内,对符合所述监控告警的范围内的告警进行告警计数;
最后,当统计分析的时间段到达后,若告警计数超过所述门限值,则生成一条新的告警进行上报。
所述监控告警的范围,是根据告警类型、告警发生位置、告警码、告警严重级别、或告警时间进行组合配置确定。
所述在所述统计分析的时间段内进行告警计数的步骤,是通过维护一条告警队列实现计数,其采用先进先出的机制,始终保持队列中的所有告警的上报时间与当前时间之差不超过预先设置的统计分析时间段的时长。
所述告警队列是一个告警链表,当收到新的告警需要计数时,将该新的告警加入告警链表的尾端,判断首端告警的上报时间与当前时间差是否大于指定的统计分析时间段的时长,若大于,则去掉溢出的节点移出告警链表首端的告警。
所述方法进一步还配置生成计数告警的详细信息及严重级别;在检查告警计数大于所述门限值时,根据设定的生成计数告警的详细信息及严重级别生成告警、或者根据门限定时检测器检测到的信息生成新的告警。
相对于现有技术,本发明所提供的一种告警频率监控器及告警处理方法,可以根据告警频度反映出一些不容易引起维护人员足够重视的轻微故障,对这些轻微故障的上报频率进行监控,可以直接提示用户这些轻微故障的上报频率过高了,以引起维护人员的重视,使维护人员可以根据这些信息找出设备工作不稳定的瓶颈所在,从而快速定位并解决故障,提高系统的稳定性。同时,本发明并不改变现有的告警处理流程,对系统性能和其他功能不造成影响,具有很好的兼容性。
附图说明
图1是本发明实施例中告警频率监控器的结构示意图;
图2是本发明实施例中告警处理方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下结合附图对本发明作进一步地详细说明。
本发明的目的在于克服现有网管系统对告警严重性的划分不够细化的缺点,提出一种以上报频率来确定告警严重性的处理方法,通过对系统上报告警频率进行采样,能够针对上报频率较高的告警进行识别和显示。
如图1所示,本发明的告警频率监控器包括:
告警参数配置管理模块101,用于配置告警频率监控器所需的各项参数,所述参数包括:监控告警的范围、统计分析的时间段长度、告警在该时间段内上报次数的门限值、新上报告警的详细信息和严重级别。
告警选择器102,用于限定告警频率监控器所监控的告警范围,判断一条告警是否需要对其上报频率进行采样。该告警范围可通过告警参数配置管理模块101进行配置,配置条件包括:告警发生位置、告警类型等告警特征,当接收到告警时,会先使用这些配置条件进行比对,判断是否需要处理该条告警,只有满足配置条件的告警才被送入告警计数器103。
告警计数器103,用于记录并缓存指定时间段内接收到的告警的上报数量。告警计数器103通过维护一条告警队列实现计数,其采用先进先出的机制,即最先上报的告警最先出队列,始终保持队列中的所有告警的上报时间与当前时间之差不超过预先设置的统计分析时长,该时间长度可以通过参数配置管理模块101进行配置。
门限定时检测器104,用于定时检查告警计数器103中的告警计数,判断告警计数是否大于指定的门限值。如果发现告警计数超过指定的门限值,则通过告警发生器105发送一条计数告警,即上报一条新的告警。如果系统发现在前一个计时段周期内已经产生了一条计数告警,那么不再直接产生新告警,而是修改前一新告警的详细信息中有关告警发生次数的信息,使之可以体现实时的信息。如果系统已经产生了一条新的计数告警,但是却发现上一个计时段内的告警发生次数低于指定门限值,那么系统将恢复已有的新告警。所述计数门限值可以通过参数配置管理模块101进行配置。
告警发生器105,用于根据预先设定的告警级别和详细信息产生一条计数告警。其可以发生一条新的告警,也可以通过参数配置管理模块101指定该新告警的详细信息和告警级别。
如图2所示,对于图1所示的该告警频率监控器,其告警处理流程如下:
步骤201:配置参数,通过告警参数配置管理模块101对监控器进行各项参数配置。
所配置的参数包括:监控告警的范围、统计分析的时间段长度、告警在该时间段内上报次数的门限值、新上报告警的详细信息和严重级别等。
步骤202:接收并判断告警是否需要计数。
在此步骤中,接收各网元设备上报上来的告警,利用告警选择器102筛选出需要处理的告警,并将该筛选出来的告警送入告警计数器103。
步骤203:将筛选出的告警加入告警链表的尾端,即将通过告警选择器102的告警加到告警计数器103所维护的告警链表的尾端。
步骤204:判断链表是否溢出,即判断告警计数器103所维护的告警链表首端告警的上报时间与当前时间差是否大于指定的统计分析时长,如果大于则执行步骤205,否则执行步骤206;
步骤205:去掉溢出的节点,移出告警链表首端的告警,以保持链表中首端告警的上报时间与当前时间之差不超过预先设置的统计分析时长;
步骤206:计算链表中的总节点数;
步骤207:判断告警计数是否大于门限值,即利用门限定时检测器104定时检查告警计数是否大于指定门限,如果大于则执行步骤208,否则不做任何操作。
步骤208:产生一条计数告警。
本发明方法可以应用在各种网元设备的告警处理中,以Inet集中网管系统为例,本发明的频率监控的方法可做如下应用。
Inet网管系统包括故障处理子系统,其中对告警上报频率的监控是故障处理子系统的一部分,可以通过界面设置监控条件,例如,我们设置监控的告警位置为1号单板,时间段为5分钟,告警在该时间段内上报的门限值为10,指定达到该门限值上报的新告警的级别为严重。
那么,当1号单板在最近的5分钟内上报的告警条数达到10条,就会由系统自动上报一条级别为严重的告警,告警信息为1号单板在最近5分钟内已经上报了10条告警,来提示用户。
由于该方法只需要对告警上报消息进行监听,所以不会影响原告警的处理流程。
本文所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。因此,凡在本发明的精神和原则之内所作的任何修改、等同替换、改进以及更新等等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种告警频率监控器,用于根据告警频率监控告警,其特征在于,包括告警参数配置管理模块(101),还包括分别与所述告警参数配置管理模块(101)相连的告警选择器(102)、告警计数器(103)、门限定时检测器(104)、告警发生器(105),其中:
所述告警参数配置管理模块,用于配置监控告警的范围、统计分析的时间段、所述时间段内告警上报次数的门限值;
所述告警选择器,用于根据所述监控告警的范围判断接收的告警是否在所述范围内,如果是,则将该告警上报至所述告警计数器;
所述告警计数器,用于对所述统计分析的时间段内接收到的告警进行计数;
所述门限定时检测器,用于定时检查告警计数器中的告警计数,根据所述时间段内告警上报次数的门限值判断告警计数是否大于指定的门限值,当告警计数超过门限值时,指示所述告警发生器发出一条计数告警;
告警发生器,用于在接收到门限定时检测器指示后,产生并上报一条计数告警。
2.如权利要求1所述的告警频率监控器,其特征在于:
所述告警参数配置管理模块,是根据告警类型、告警发生位置、告警码、告警严重级别、或告警时间进行组合配置确定监控告警的范围。
3.如权利要求1所述的告警频率监控器,其特征在于:
所述告警计数器,是通过维护一条告警队列实现计数,其采用先进先出的机制,始终保持队列中的所有告警的上报时间与当前时间之差不超过预先设置的统计分析时间段的时长。
4.如权利要求3所述的告警频率监控器,其特征在于:
所述告警计数器,在队列首端告警的上报时间与当前时间差大于指定的统计分析时间段的时长时,去掉队列中溢出的节点,移出告警队列首端的告警。
5.如权利要求1所述的告警频率监控器,其特征在于:
所述参数配置管理模块,还用于配置生成计数告警的详细信息及严重级别;所述告警发生器,根据设定的生成计数告警的详细信息及严重级别生成告警、或者根据门限定时检测器检测到的信息生成新的告警。
6.一种告警频率监控方法,其特征在于,包括如下步骤:
首先,设定需要进行频率监控告警的范围、统计分析的时间段以及所述时间段内告警上报次数的门限值;
然后,在所述统计分析的时间段内,对符合所述监控告警的范围内的告警进行告警计数;
最后,当统计分析的时间段到达后,若告警计数超过所述门限值,则生成一条新的告警进行上报。
7.如权利要求6所述的告警频率监控方法,其特征在于,
所述监控告警的范围,是根据告警类型、告警发生位置、告警码、告警严重级别、或告警时间进行组合配置确定。
8.如权利要求6所述的告警频率监控方法,其特征在于,
所述在所述统计分析的时间段内进行告警计数的步骤,是通过维护一条告警队列实现计数,其采用先进先出的机制,始终保持队列中的所有告警的上报时间与当前时间之差不超过预先设置的统计分析时间段的时长。
9.如权利要求8所述的告警频率监控方法,其特征在于,
所述告警队列是一个告警链表,当收到新的告警需要计数时,将该新的告警加入告警链表的尾端,判断首端告警的上报时间与当前时间差是否大于指定的统计分析时间段的时长,若大于,则去掉溢出的节点,移出告警链表首端的告警。
10.如权利要求6所述的告警频率监控方法,其特征在于,
所述方法进一步还配置生成计数告警的详细信息及严重级别;在检查告警计数大于所述门限值时,根据设定的生成计数告警的详细信息及严重级别生成告警、或者根据门限定时检测器检测到的信息生成新的告警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100008489A CN101222361B (zh) | 2008-01-22 | 2008-01-22 | 一种告警频率监控器及告警处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100008489A CN101222361B (zh) | 2008-01-22 | 2008-01-22 | 一种告警频率监控器及告警处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101222361A CN101222361A (zh) | 2008-07-16 |
CN101222361B true CN101222361B (zh) | 2010-07-14 |
Family
ID=39631952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008100008489A Expired - Fee Related CN101222361B (zh) | 2008-01-22 | 2008-01-22 | 一种告警频率监控器及告警处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101222361B (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101741991A (zh) * | 2008-11-18 | 2010-06-16 | 华为技术有限公司 | 告警处理方法、装置及系统 |
CN101741626B (zh) * | 2008-11-26 | 2012-04-18 | 华为技术有限公司 | 一种告警信息的处理方法和装置 |
CN101636000A (zh) * | 2009-09-01 | 2010-01-27 | 中兴通讯股份有限公司 | 一种告警风暴的处理方法及处理装置 |
CN102201928A (zh) * | 2010-03-24 | 2011-09-28 | 中兴通讯股份有限公司 | 告警级别处理方法及告警服务器 |
CN101808023A (zh) * | 2010-05-06 | 2010-08-18 | 瑞斯康达科技发展股份有限公司 | 一种网络监测系统及网络监测方法 |
CN102340808B (zh) * | 2010-07-21 | 2015-08-26 | 中兴通讯股份有限公司 | 告警处理方法及装置 |
CN102891774A (zh) * | 2012-09-03 | 2013-01-23 | 浪潮(北京)电子信息产业有限公司 | 一种云计算系统中监控虚拟机状态并提示告警的方法 |
CN102970162B (zh) * | 2012-11-14 | 2015-04-01 | 北京奇虎科技有限公司 | 用于处理需要报警的数据的处理器和方法 |
CN104702443B (zh) * | 2012-11-14 | 2018-03-06 | 北京奇虎科技有限公司 | 用于处理需要报警的数据的处理器和方法 |
CN102999415A (zh) * | 2012-11-22 | 2013-03-27 | 江苏睿博数据技术有限公司 | 一种告警通知功能的优化方法及设备 |
CN103856339B (zh) * | 2012-12-04 | 2017-11-21 | 中国移动通信集团广西有限公司 | 一种对告警信息进行压缩的方法和设备 |
CN103490925A (zh) * | 2013-09-16 | 2014-01-01 | 国家电网公司 | 电力通信网性能状态实时评估方法与系统 |
CN104639876A (zh) * | 2013-11-06 | 2015-05-20 | 北京航天长峰科技工业集团有限公司 | 一种基于硬盘录像机的固定场所使用状态检测方法 |
CN104486790A (zh) * | 2014-12-31 | 2015-04-01 | 郭辉 | 无线通信网络故障检测方法及装置 |
CN107436833A (zh) * | 2017-08-09 | 2017-12-05 | 王瑶生 | 一种计算机故障报警系统 |
CN108572907B (zh) * | 2018-01-25 | 2022-05-06 | 北京金山云网络技术有限公司 | 一种告警方法、装置、电子设备及计算机可读存储介质 |
CN109560963A (zh) * | 2018-11-23 | 2019-04-02 | 北京车和家信息技术有限公司 | 监控报警方法、系统以及计算机可读存储介质 |
CN109639504B (zh) * | 2019-01-04 | 2023-09-12 | 平安科技(深圳)有限公司 | 一种基于云平台的告警信息处理方法和装置 |
CN110211353A (zh) * | 2019-06-12 | 2019-09-06 | 国家电网有限公司 | 监控系统告警信息抑制的一种有效方法 |
CN111124817A (zh) * | 2019-12-06 | 2020-05-08 | 江苏智臻能源科技有限公司 | 一种基于缓存机制的多类型告警判断算法 |
CN112258683B (zh) * | 2020-10-20 | 2022-07-01 | 云账户技术(天津)有限公司 | 一种业务系统的巡检方法及装置 |
CN112395156A (zh) * | 2020-11-06 | 2021-02-23 | 微民保险代理有限公司 | 故障的告警方法和装置、存储介质和电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1523802A (zh) * | 2003-09-05 | 2004-08-25 | 中兴通讯股份有限公司 | 一种cdma系统中防止告警风暴的方法 |
CN1725699A (zh) * | 2004-07-20 | 2006-01-25 | 中兴通讯股份有限公司 | 通讯网络自动巡检的方法 |
CN1761245A (zh) * | 2004-10-11 | 2006-04-19 | 华为技术有限公司 | 告警消息处理方法 |
CN101018157A (zh) * | 2007-02-14 | 2007-08-15 | 华为技术有限公司 | 一种告警处理方法及告警系统 |
CN101043270A (zh) * | 2007-04-10 | 2007-09-26 | 华为技术有限公司 | 光传输路由器和告警处理方法 |
-
2008
- 2008-01-22 CN CN2008100008489A patent/CN101222361B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1523802A (zh) * | 2003-09-05 | 2004-08-25 | 中兴通讯股份有限公司 | 一种cdma系统中防止告警风暴的方法 |
CN1725699A (zh) * | 2004-07-20 | 2006-01-25 | 中兴通讯股份有限公司 | 通讯网络自动巡检的方法 |
CN1761245A (zh) * | 2004-10-11 | 2006-04-19 | 华为技术有限公司 | 告警消息处理方法 |
CN101018157A (zh) * | 2007-02-14 | 2007-08-15 | 华为技术有限公司 | 一种告警处理方法及告警系统 |
CN101043270A (zh) * | 2007-04-10 | 2007-09-26 | 华为技术有限公司 | 光传输路由器和告警处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101222361A (zh) | 2008-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101222361B (zh) | 一种告警频率监控器及告警处理方法 | |
CN104407964B (zh) | 一种基于数据中心的集中监控系统及方法 | |
CN103544093B (zh) | 监控报警控制方法及其系统 | |
US8205116B2 (en) | Common chronics resolution management | |
CN104426697B (zh) | 网络故障管理系统 | |
CN102857365A (zh) | 网管系统中故障预防及智能修复方法和装置 | |
CN101916499A (zh) | 一种智能报警装置及智能报警方法 | |
CN100586202C (zh) | 故障定位的方法及装置 | |
CN103378981B (zh) | 网管系统中振荡告警的处理方法及装置 | |
WO2015024336A1 (zh) | 设备故障报警方法,装置与cim系统 | |
US8943102B2 (en) | Alarm management system | |
US20090259890A1 (en) | Method & apparatus for hardware fault management | |
CN102196472A (zh) | 网元异常告警方法、装置及系统 | |
CN111339466A (zh) | 接口管理方法、装置、电子设备及可读存储介质 | |
CN101247265A (zh) | 一种告警处理方法、装置和系统 | |
CN114398222A (zh) | 一种声明式可视化配置Prometheus监控告警的方法 | |
CN114172921A (zh) | 一种调度录音系统的日志审计方法及装置 | |
CN110513252B (zh) | 一种风电场scada系统数据异常告警修复系统与方法 | |
CN115951640B (zh) | 一种智能振动监控管理系统、运行方法、电子设备及介质 | |
CN103067101A (zh) | 通信终端测试监控方法和装置 | |
CN101610168A (zh) | 网管系统中告警风暴的抑制方法和装置 | |
CN115801545A (zh) | 一种混合云管的异常实时上报方法、系统、设备和介质 | |
WO2014040470A1 (zh) | 告警消息的处理方法及装置 | |
KR20000061000A (ko) | 교환망에 대한 지능형 서비스 감시 방법 | |
CN108809735B (zh) | 事件上报管理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100714 Termination date: 20180122 |