CN101267473A - 一种振荡告警的处理方法 - Google Patents

一种振荡告警的处理方法 Download PDF

Info

Publication number
CN101267473A
CN101267473A CNA2007100874284A CN200710087428A CN101267473A CN 101267473 A CN101267473 A CN 101267473A CN A2007100874284 A CNA2007100874284 A CN A2007100874284A CN 200710087428 A CN200710087428 A CN 200710087428A CN 101267473 A CN101267473 A CN 101267473A
Authority
CN
China
Prior art keywords
alarm
warning
counter value
preliminary treatment
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100874284A
Other languages
English (en)
Other versions
CN101267473B (zh
Inventor
傅华明
宋高勇
杨扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2007100874284A priority Critical patent/CN101267473B/zh
Publication of CN101267473A publication Critical patent/CN101267473A/zh
Application granted granted Critical
Publication of CN101267473B publication Critical patent/CN101267473B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种振荡告警的处理方法,该方法设置告警预处理池对接收到的告警消息进行处理:当接收到告警消息时,若告警预处理池中不存在对应的告警消息记录,则将其添加到告警预处理池中,并为其设置初始预处理计数器值;当接收到告警恢复消息时,若告警预处理池中存在对应的告警消息记录,则删除该记录;否则上报该告警恢复消息;该方法还周期性进行以下轮询操作:查询告警预处理池中的每条告警消息记录的预处理计数器值,若该值小于第一阈值,则上报对应的告警消息并删除该记录;否则将预处理计数器值减n;其中,上述第一阈值小于或等于初始预处理计数器值;n>0。该方法不影响告警源设备的正常功能,使用较小的系统资源对振荡告警进行有效处理。

Description

一种振荡告警的处理方法
技术领域
本发明涉及网络管理系统,尤其涉及电信网络管理系统。
背景技术
电信网络管理系统主要包括配置管理、故障管理、性能管理和安全管理等功能模块,故障管理模块是其中的一个重要部分。故障管理主要包括当被管理设备上报告警和告警恢复给电信网络管理系统(简称网管系统)时,网管系统将相应的告警和告警恢复信息显示在管理界面上;上报告警和告警恢复到上层网管系统;将相应的告警信息反映到告警箱上进行声光监控;对告警进行告警相关性分析等功能。
振荡告警是指告警源出现某种故障或在某种特定环境条件下不断上报告警和告警恢复消息给网管系统,并且上报告警和上报告警恢复的时间间隔很短。比如在使用温度、湿度传感器的环境动力监控系统中,当环境处于临界条件时,传感器会不断的上报某种监控对象的异常和异常恢复消息给网管系统;在使用E1的窄带业务系统中也会出现由于同轴电缆接触不良而使得监控设备不断上报E1信号瞬断告警,即网管系统会不间断地收到设备上报E1信号丢失告警和告警恢复消息。
振荡告警的周期是指上报告警和上报恢复的平均时间间隔。出现振荡告警,尤其振荡周期很短的情况下,每一级网管系统都会消耗大量的资源处理这样的告警和告警恢复消息,网管服务器用来记录告警数据的数据库表也会很快被写满从而导致不得不将其它有用的告警信息删除以存放这样的振荡告警信息;告警源设备上报这些消息,有时本地网管系统还需要向上层网管系统传递这些告警消息,都会占用大量网络资源;此外,振荡告警还增加了告警相关性分析的工作量。因此,如果系统中出现大量的振荡告警,对其进行处理将占用大量的系统资源。
为了减少振荡告警对系统资源的占用,现有的振荡告警处理方法通常是在网管系统或者告警源将告警屏蔽,也可以通过修改产生告警的上下限配置参数来使得触发振荡告警的条件不再满足。但是这两种处理方法具有一定的局限性,如果在网管系统或告警源屏蔽了告警,告警源恢复正常后如果不取消屏蔽操作将无法再监控这种类型的告警;修改产生告警的上下限配置参数会使相关告警源设备的监测精确度和灵敏度降低,也影响该设备的正常使用。
发明内容
本发明所要解决的技术问题是,克服现有技术中振荡告警处理方法的不足,提出一种不影响告警源设备的正常功能,使用较小的系统资源对振荡告警进行有效处理的方法。
为了实现上述目的,本发明提供一种振荡告警的处理方法,该方法设置告警预处理池对接收到的告警消息进行处理:
当接收到告警消息时,若告警预处理池中不存在对应的告警消息记录,则将其添加到告警预处理池中,并为其设置初始预处理计数器值;
当接收到告警恢复消息时,若告警预处理池中存在对应的告警消息记录,则删除该记录;否则上报该告警恢复消息;
该方法还周期性进行以下轮询操作:查询告警预处理池中的每条告警消息记录的预处理计数器值,若该值小于第一阈值,则上报对应的告警消息并删除该记录;否则将预处理计数器值减n;
其中,上述第一阈值小于或等于初始预处理计数器值;n>0。
此外,当接收到告警消息且告警预处理池中存在对应的告警消息记录,将该告警消息丢弃。
此外,所述轮询操作的周期大于所述轮询操作所需时间。
此外,当接收到告警恢复消息且告警预处理池中存在对应的告警消息记录时,丢弃该告警恢复消息。
此外,所述第一阈值小于所述初始预处理计数器值。
此外,为实时性要求不同的告警消息设置差值不同的所述第一阈值与所述初始预处理计数器值;其中,实时性要求高的告警消息的第一阈值与初始预处理计数器值的差值比实时性要求低的告警消息的所述差值小。
本发明通过设置告警预处理池对振荡告警消息进行高效地预处理,有效地减少了振荡告警对系统资源的占用。此外,本发明还可通过对各种预处理参数进行动态调整和配置,对不同的振荡告警消息进行不同的处理。
附图说明
图1是本发明振荡告警的处理方法的告警预处理流程的流程图;
图2是本发明振荡告警的处理方法的告警恢复预处理流程图;
图3是本发明振荡告警的处理方法的告警轮询处理流程图。
具体实施方式
为了避免频繁出现的振荡告警消息和告警恢复消息不断地上报到各级网管系统而造成的对系统资源的大量占用,本发明在现有的告警处理流程前增加了告警预处理方法,该方法使用告警预处理池对告警消息和告警恢复消息进行告警预处理。
下面将结合附图和实施例对本发明进行详细说明。
上述告警预处理池用于保存告警源设备发出的告警消息。同时,为每一条告警消息设置一个预处理计数器,用于记录告警消息的状态。此外,本发明还使用一个预处理定时器,用于周期性触发定时器事件。
本发明的振荡告警处理方法分为三个子方法:告警预处理、告警恢复预处理和告警轮询。其中,告警预处理方法在接收到告警源设备发出的告警消息时被触发;告警恢复预处理方法在接收到告警源设备发出的告警恢复消息时被触发;告警轮询方法由预处理定时器周期性触发。下面将分别对上述三个子方法进行描述。
图1是本发明振荡告警的处理方法的告警预处理流程图。如图1所示,当接收到告警源设备发出的告警消息时,进行如下处理:
A1:判断告警预处理池中是否存在该告警消息记录;如果存在,执行步骤A2;否则执行步骤A3;
A2:丢弃该告警消息,本流程结束。
通常在告警源设备已经发送了某种告警消息后,如果又产生了相同的告警不会再次发送,也就是说同样的告警消息一般不会连续发送两次。但是假设告警源设备出现异常,在没有告警恢复,不是振荡告警的情况下连续发送告警消息,进行告警预处理时发现该告警消息已在告警预处理池中有相应的记录则可直接将其丢弃。
A3:将其增加到告警预处理池中,并为其设置初始预处理计数器值。
初始预处理计数器值为大于等于1的整数。可为不同的告警消息记录设置不同的初始预处理计数器值。对于实时性要求较高的告警消息,为其设置较小的初始预处理计数器值以便及时将其上报。
当然,接收到的告警消息时也可不进行告警预处理,直接将其上报。
图2是本发明振荡告警的处理方法的告警恢复预处理流程图。如图2所示,当接收到告警源设备发出的告警恢复消息时,进行如下处理:
B1:判断告警预处理池中是否存在与该告警恢复消息对应的告警消息记录;如果存在,执行步骤B3;否则执行步骤B2;
B2:上报该告警恢复消息;本流程结束;
当告警预处理池中没有对应的告警消息记录时,一般来说是对应的告警消息已经被上报,因此该告警恢复消息也应被上报,也就是将该告警恢复消息按照现有技术的流程提交至网管系统的相应模块进行处理。
B3:将告警预处理池中的对应的告警消息记录删除,同时丢弃该告警恢复消息。
图3是本发明振荡告警的处理方法的告警轮询处理流程图。告警轮询方法由预处理定时器周期性触发,如图2所示,该方法包含如下步骤:
C1:令i=1;
C2:查询告警预处理池中的第i条告警(第i条告警消息记录)的预处理计数器值,若该值小于等于0,则执行步骤C3;否则执行步骤C4;
C3:上报该告警消息记录中保存的告警消息,并从告警预处理池中删除该记录;跳转至步骤C5;
C4:则将该条告警的预处理计数器值减1;
当然,在此情况下也可以令该预处理计数器值减一个大于1的整数值n。
C5:判断第i条告警消息记录是否为告警预处理池中的最后一条记录,如果是,本流程结束;否则执行步骤C6;
C6:令i=i+1;跳转至步骤C2。
上述预处理定时器的周期需大于进行一次轮询所需的处理时间。通常在预处理定时器被触发后,就将其暂停运行,等上述告警轮询处理结束后重新将其启动,这样可以保证预处理定时器的周期大于进行一次轮询所需的处理时间。为了提高程序的执行速度,在告警预处理池中的记录数可预测的情况下,可使用周期足够长的定时器周期性触发告警轮询处理。
通过上述步骤A3和C4可知,本发明在接收到一个新的告警消息时为其设置初始预处理计数器值,而每隔一段时间将该值减n,当预处理计数器值小于或等于0时将该记录中保存的告警消息上报,并将该记录从告警预处理池中删除;此外,在接收到与某个告警消息记录相对应的告警恢复消息时,将该告警消息从告警预处理池中删除。这样,告警源设备发出的正常告警消息经过一个很小的处理延时后即可被正常处理,而当告警源设备发生振荡告警时,它的告警消息和告警恢复消息被自动隔离直至振荡现象消失,振荡现象消失后告警消息和告警恢复消息又可被正常处理。
上述预处理参数:初始预处理计数器值和n可采用固定值或从注册表或文件中读取,此外,还可以对上述参数进行动态调整,例如,将预处理定时器的周期减小,使得振荡周期较大,对系统资源的占用较小的振荡告警消息有机会被上报处理。

Claims (6)

1. 一种振荡告警的处理方法,该方法设置告警预处理池对接收到的告警消息进行处理:
当接收到告警消息时,若告警预处理池中不存在对应的告警消息记录,则将其添加到告警预处理池中,并为其设置初始预处理计数器值;
当接收到告警恢复消息时,若告警预处理池中存在对应的告警消息记录,则删除该记录;否则上报该告警恢复消息;
该方法还周期性进行以下轮询操作:查询告警预处理池中的每条告警消息记录的预处理计数器值,若该值小于第一阈值,则上报对应的告警消息并删除该记录;否则将预处理计数器值减n;
其中,上述第一阈值小于或等于初始预处理计数器值;n>0。
2. 如权利要求1所述的振荡告警的处理方法,当接收到告警消息且告警预处理池中存在对应的告警消息记录,将该告警消息丢弃。
3. 如权利要求1所述的振荡告警的处理方法,其特征在于,所述轮询操作的周期大于所述轮询操作所需时间。
4. 如权利要求1所述的振荡告警的处理方法,其特征在于,当接收到告警恢复消息且告警预处理池中存在对应的告警消息记录时,丢弃该告警恢复消息。
5. 如权利要求1所述的振荡告警的处理方法,其特征在于,所述第一阈值小于所述初始预处理计数器值。
6. 如权利要求5所述的振荡告警的处理方法,其特征在于,为实时性要求不同的告警消息设置差值不同的所述第一阈值与所述初始预处理计数器值;其中,实时性要求高的告警消息的第一阈值与初始预处理计数器值的差值比实时性要求低的告警消息的所述差值小。
CN2007100874284A 2007-03-16 2007-03-16 一种振荡告警的处理方法 Active CN101267473B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007100874284A CN101267473B (zh) 2007-03-16 2007-03-16 一种振荡告警的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100874284A CN101267473B (zh) 2007-03-16 2007-03-16 一种振荡告警的处理方法

Publications (2)

Publication Number Publication Date
CN101267473A true CN101267473A (zh) 2008-09-17
CN101267473B CN101267473B (zh) 2010-12-08

Family

ID=39989598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100874284A Active CN101267473B (zh) 2007-03-16 2007-03-16 一种振荡告警的处理方法

Country Status (1)

Country Link
CN (1) CN101267473B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103378981A (zh) * 2012-04-16 2013-10-30 中兴通讯股份有限公司 网管系统中振荡告警的处理方法及装置
CN106817237A (zh) * 2015-12-01 2017-06-09 普天信息技术有限公司 一种重复告警抑制方法和装置
CN109445965A (zh) * 2018-11-07 2019-03-08 北京明朝万达科技股份有限公司 由Redis和MySQL实现的消息处理方法和设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1278516C (zh) * 2002-05-27 2006-10-04 华为技术有限公司 网络管理系统中闪断告警的处理方法
CN1585344A (zh) * 2004-06-12 2005-02-23 中兴通讯股份有限公司 一种振荡告警的处理方法
CN100461688C (zh) * 2004-10-11 2009-02-11 华为技术有限公司 告警消息处理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103378981A (zh) * 2012-04-16 2013-10-30 中兴通讯股份有限公司 网管系统中振荡告警的处理方法及装置
CN103378981B (zh) * 2012-04-16 2017-11-03 中兴通讯股份有限公司 网管系统中振荡告警的处理方法及装置
CN106817237A (zh) * 2015-12-01 2017-06-09 普天信息技术有限公司 一种重复告警抑制方法和装置
CN109445965A (zh) * 2018-11-07 2019-03-08 北京明朝万达科技股份有限公司 由Redis和MySQL实现的消息处理方法和设备

Also Published As

Publication number Publication date
CN101267473B (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
CN110661659B (zh) 一种告警方法、装置、系统及电子设备
US10747591B2 (en) Endpoint process state collector
CN106656537B (zh) 一种it集群系统监控方法、装置、终端及系统
CN101312405A (zh) 一种告警处理方法及网管系统
CN111339175B (zh) 数据处理方法、装置、电子设备及可读存储介质
CN102118275A (zh) 一种告警风暴的处理方法及处理装置
WO2012146026A1 (zh) 一种物联网监控方法及系统
CN111046011A (zh) 日志收集方法、系统、节点、电子设备及可读存储介质
CN110688280A (zh) 一种告警事件的管理系统、方法、设备和存储介质
CN103475696A (zh) 云计算集群服务器状态监控系统和方法
CN101267473B (zh) 一种振荡告警的处理方法
CN111010318A (zh) 发现物联网终端设备失联的方法、系统和设备影子服务器
CN112783618A (zh) 一种任务调度监控系统、计算机设备及存储介质
CN109032904A (zh) 被监控、管理服务器及数据获取、分析方法和管理系统
CN110209497A (zh) 一种主机资源动态扩缩容的方法及系统
CN106649028A (zh) 一种自动化Linux系统维护任务的方法
KR100984282B1 (ko) 메모리캐쉬를 이용한 통합보안관리시스템
CN116302862B (zh) 一种微服务架构下监控告警方法和系统
Thaler et al. Hybrid approach to hpc cluster telemetry and hardware log analytics
CN116483663A (zh) 用于平台的异常告警方法和装置
CN103268567A (zh) 面向制造行业管理系统的高效大规模事件侦测与处理方法
CN115801545A (zh) 一种混合云管的异常实时上报方法、系统、设备和介质
CN113342596A (zh) 一种设备指标的分布式监控方法、系统及装置
CN115190052A (zh) 一种长连接的管理方法、系统和控制单元
WO2014040470A1 (zh) 告警消息的处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant