CN103036723A - 一种防止告警队列溢出的处理方法和系统 - Google Patents

一种防止告警队列溢出的处理方法和系统 Download PDF

Info

Publication number
CN103036723A
CN103036723A CN2012105437881A CN201210543788A CN103036723A CN 103036723 A CN103036723 A CN 103036723A CN 2012105437881 A CN2012105437881 A CN 2012105437881A CN 201210543788 A CN201210543788 A CN 201210543788A CN 103036723 A CN103036723 A CN 103036723A
Authority
CN
China
Prior art keywords
warning information
warning
module
alarm
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105437881A
Other languages
English (en)
Other versions
CN103036723B (zh
Inventor
李能禾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201210543788.1A priority Critical patent/CN103036723B/zh
Publication of CN103036723A publication Critical patent/CN103036723A/zh
Application granted granted Critical
Publication of CN103036723B publication Critical patent/CN103036723B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种防止告警队列溢出的处理方法,设置预饱和值;该方法包括:将接收到的告警信息写入告警队列;获取告警队列中的告警信息的数量;判断告警队列中告警信息的数量是否大于预饱和值,若判断的结果为是,则停止告警信息写入告警队列,清空告警队列中的告警信息;否则,继续保持当前处理进程。本发明还同时公开了一种防止告警队列溢出的处理系统,采用本发明的防止告警队列溢出的处理方法和系统,确保告警队列中的告警信息不会溢出,降低MP的利用率,保证网络的正常运行。

Description

一种防止告警队列溢出的处理方法和系统
技术领域
本发明涉及网络维护领域,具体涉及一种防止告警队列溢出的处理方法和系统。
背景技术
运行管理维护(Operation Administration and Maintenance,OAM)是根据网络运营的需要,将网络的管理工作分为三类:运行(Operation)、管理(Administration)和维护(Maintenance)。随着网络业务的发展,对计算机网络的维护也变得至关重要。
计算机网络服务发生故障是常见的,由于受到资源的限制,存放告警队列的缓存大小是有限制的,而读取告警的频率也是固定的。但告警的上报通常具有突发性和集中性的特点,若没有及时读取告警队列中的告警信息,则源源不断的告警信息会超出告警队列的承受范围,导致告警队列中的告警信息的溢出。
另外,告警信息的产生需要在需要保护的两端设备上配置检测周期,以多协议标签交换(Multi-Protocol Label Switching,MPLS)网络为例,检测周期为发送周期的3.5倍,即如果在发送周期的3.5倍时间内未能接收到返回的检测报文,则认为链路出现了连续性丢失(Loss of Connection,LOC)故障,产生LOC故障告警。假设设备A在第一个检测周期内没有收到设备B返回的检测报文,则会产生LOC故障告警,一直到第N个检测周期接收到设备B返回的检测报文,这时会产生LOC恢复告警,如此反复,交替出现大量重复的LOC故障告警信息和LOC恢复告警信息,则产生了告警震荡,在此期间,主处理器(MasterProcessor,MP)连续处理告警队列中的告警信息,且这些告警信息中大多为重复的告警信息,使得MP的使用率居高不下,浪费了大量的MP资源,从而对设备的运行以及网络的稳定性造成很大的影响。
发明内容
有鉴于此,本发明提供一种防止告警队列溢出的处理方法和系统,确保告警队列中的告警信息不会溢出,降低MP的利用率,保证网络的正常运行。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种防止告警队列溢出的处理方法,设置预饱和值;该方法包括:
将接收到的告警信息写入告警队列;
获取所述告警队列中的告警信息的数量;
判断所述告警队列中告警信息的数量是否大于预饱和值,若判断的结果为是,则停止告警信息写入所述告警队列,清空所述告警队列中的告警信息;否则,继续保持当前处理进程。
上述方案中,当告警队列中告警信息的数量大于预饱和值时,该方法还包括:停止产生告警信息,并保存最新的告警信息。
上述方案中,该方法还包括:
当前告警队列中告警信息的数量为空值时,将所述保存的最新的告警信息写入告警队列,开始告警信息写入告警队列,并继续产生告警信息。
上述方案中,所述继续保持当前处理进程为:将接收到的告警信息写入告警队列,从所述告警队列中读取告警信息进行告警信息处理并删除读取过的告警信息,并判断所述告警队列中告警信息的数量是否大于预饱和值。
本发明还提供了一种防止告警队列溢出的处理系统,该系统包括存储模块、告警信息数量检测模块、第一监控模块、告警处理模块和检测模块;其中,
所述存储模块,用于将接收到的告警信息以告警队列形式存储;
所述告警信息数量检测模块,用于获取所述存储模块中的告警信息的数量;
所述第一监控模块,用于判断从所述告警信息数量检测模块获取的告警信息的数量是否大于预饱和值,并在判断结果为是时通知告警处理模块;
所述告警处理模块,用于第一监控模块发来当前告警信息的数量大于预饱和值的通知消息时,向检测模块发送停止告警信息写入存储模块的通知消息,并清空存储模块中的告警信息;否则,继续保持当前处理进程;
所述检测模块,用于产生告警信息并将告警信息写入存储模块;在接收到所述告警处理模块发送的停止告警信息写入存储模块的通知消息时,停止告警信息写入存储模块。
上述方案中,所述告警处理模块,还用于所述第一监控模块发来当前告警信息的数量大于预饱和值的通知消息时,向所述检测模块发送停止产生告警信息的消息;
相应的,所述检测模块,用于在接收到所述告警处理模块发送的停止产生告警信息的消息时,停止产生告警信息,并保存最新的告警信息。
上述方案中,该处理系统还包括第二监控模块,用于判断从所述告警信息数量检测模块获取的告警信息的数量是否为空值,并在判断结果为是时通知所述告警处理模块;
相应的,所述告警处理模块,还用于所述第二监控模块发来当前告警信息的数量为空值的通知消息时,向所述检测模块发送开始告警信息写入存储模块的通知消息和继续产生告警信息的消息;
相应的,所述检测模块,还用于在接收到所述告警处理模块发送的所述开始告警信息写入存储模块的通知消息时,将保存的最新的告警信息写入存储模块;在接收到所述告警处理模块发送的所述继续产生告警信息的消息时,继续产生告警信息,并将存储的最新的告警信息写入存储模块。
上述方案中,所述告警处理模块,还用于从所述存储模块中读取告警信息进行告警信息处理,并删除读取过的告警信息。
本发明提供的防止告警队列溢出的处理方法和系统,通过设置预饱和值,将告警队列中的告警信息的数量与预饱和值比较,若告警队列中告警信息的数量大于预饱和值,则停止告警信息写入告警队列,清空告警队列中的告警信息,确保告警队列中的告警信息不会溢出,降低MP的利用率,保证网络的正常运行。
附图说明
图1为本发明中防止告警队列溢出的处理方法流程示意图;
图2为本发明中防止告警队列溢出的处理系统组成结构示意图;
图3为本发明实施例提供的告警队列溢出的处理方法流程示意图。
具体实施方式
下面结合附图及具体实施例对本发明再作进一步详细的说明。
图1为本发明中防止告警队列溢出的处理方法流程示意图,如图1所示,包括以下步骤:
步骤101~步骤102:将接收到的告警信息写入告警队列;获取告警队列中的告警信息的数量;
这里,所述告警信息由检测模块在一定周期内没有收到返回的报文而产生,所述检测模块将产生的告警信息按一定的频率写入告警队列。
步骤103:判断告警队列中告警信息的数量是否大于预饱和值,若判断的结果为是,执行步骤104;否则,执行步骤105;
这里,所述预饱和值为预先设置的数值,当告警队列中的告警信息的数量为预饱和值时,可以认为当前告警队列已进入预饱和状态,若告警队列中的告警信息的数量再增加,则当前告警队列中的告警信息有溢出的危险。
步骤104:停止告警信息写入告警队列,清空告警队列中的告警信息;
这里,该方法还包括:停止产生告警信息,并保存最新的告警信息;
在当前告警队列中告警信息的数量为空值时,将保存的最新的告警信息写入告警队列,开始告警信息写入告警队列,并继续产生告警信息。
步骤105:继续保持当前处理进程;
这里,所述继续保持当前处理进程为:将接收到的告警信息写入告警队列,从所述告警队列中读取告警信息进行告警信息处理并删除读取过的告警信息,并判断所述告警队列中告警信息的数量是否大于预饱和值。
图2为本发明中防止告警队列溢出的处理系统组成结构示意图,如图2所示,处理系统包括存储模块21、告警信息数量检测模块22、第一监控模块23、告警处理模块24和检测模块25;其中,
所述存储模块21,用于将接收到的告警信息以告警队列形式存储;
所述告警信息数量检测模块22,用于获取所述存储模块21中的告警信息的数量;
所述第一监控模块23,用于判断从所述告警信息数量检测模块22获取的告警信息的数量是否大于预饱和值,并在判断结果为是时通知告警处理模块24;
所述告警处理模块24,用于第一监控模块23发来当前告警信息的数量大于预饱和值的通知消息时,向检测模块25发送停止告警信息写入存储模块21的通知消息,并清空告警队列中的告警信息;否则,继续保持当前处理进程;
所述检测模块25,用于产生告警信息并将告警信息写入存储模块21;在接收到所述告警处理模块24发送的停止告警信息写入存储模块的通知消息时,停止告警信息写入存储模块21。
进一步的,所述告警处理模块24,还用于所述第一监控模块23发来当前告警信息的数量大于预饱和值的通知消息时,向所述检测模块25发送停止产生告警信息的消息;
相应的,所述检测模块25,用于在接收到所述告警处理模块24发送的停止产生告警信息的消息时,停止产生告警信息,并保存最新的告警信息。
进一步的,该处理系统还包括第二监控模块26,用于判断从所述告警信息数量检测模块22获取的告警信息的数量是否为空值,并在判断结果为是时通知所述告警处理模块24;
相应的,所述告警处理模块24,还用于所述第二监控模块26发来当前告警信息的数量为空值的通知消息时,向所述检测模块25发送开始告警信息写入存储模块的通知消息和继续产生告警信息的消息;
相应的,所述检测模块25,还用于在接收到所述告警处理模块24发送的所述开始告警信息写入存储模块的通知消息时,将保存的最新的告警信息写入存储模块21;在接收到所述告警处理模块24发送的所述继续产生告警信息的消息时,继续产生告警信息,并将存储的最新的告警信息写入存储模块21。
进一步的,所述告警处理模块24,还用于从所述存储模块21中读取告警信息进行告警信息处理,并删除读取过的告警信息。
图3为本发明实施例提供的告警队列溢出的处理方法流程示意图,如图3所示,包括以下步骤:
步骤301~步骤302:将接收到的告警信息写入告警队列,获取告警队列中的告警信息的数量;
这里,所述告警信息由检测模块在一定周期内没有收到返回的报文而产生,所述检测模块将产生的告警信息按一定的频率写入告警队列。
步骤303:判断告警队列中告警信息的数量是否大于预饱和值,若判断的结果为是,执行步骤305;否则,执行步骤304;
这里,所述预饱和值为预先设置的数值,当告警队列中的告警信息的数量为预饱和值时,可以认为当前告警队列已进入预饱和状态,若告警队列中的告警信息的数量再增加,则当前告警队列中的告警信息有溢出的危险;其中,所述预饱和值可以取所述告警队列中能承载的最大告警信息数量的80%。
步骤304:继续保持当前处理进程;
这里,所述继续保持当前处理进程为:将接收到的告警信息写入告警队列,从告警队列中读取告警信息进行告警信息处理并删除读取过的告警信息,并且,判断告警队列中告警信息的数量是否大于预饱和值。
步骤305:停止告警信息写入告警队列,清空告警队列中的告警信息;
步骤306:通知检测模块停止产生告警信息,并保存最新的告警信息;
步骤307~步骤308:在告警队列中告警信息的数量为空值时,将保存的最新的告警信息写入告警队列,开始告警信息写入告警队列,并通知检测模块继续产生告警信息。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本发明的保护范围之内。

Claims (8)

1.一种防止告警队列溢出的处理方法,其特征在于,设置预饱和值;该方法包括:
将接收到的告警信息写入告警队列;
获取所述告警队列中的告警信息的数量;
判断所述告警队列中告警信息的数量是否大于预饱和值,若判断的结果为是,则停止告警信息写入所述告警队列,清空所述告警队列中的告警信息;否则,继续保持当前处理进程。
2.根据权利要求1所述的方法,其特征在于,当告警队列中告警信息的数量大于预饱和值时,该方法还包括:停止产生告警信息,并保存最新的告警信息。
3.根据权利要求1或2所述的方法,其特征在于,该方法还包括:
当前告警队列中告警信息的数量为空值时,将所述保存的最新的告警信息写入告警队列,开始告警信息写入告警队列,并继续产生告警信息。
4.根据权利要求1所述的方法,其特征在于,所述继续保持当前处理进程为:将接收到的告警信息写入告警队列,从所述告警队列中读取告警信息进行告警信息处理并删除读取过的告警信息,并判断所述告警队列中告警信息的数量是否大于预饱和值。
5.一种防止告警队列溢出的处理系统,其特征在于,该系统包括存储模块、告警信息数量检测模块、第一监控模块、告警处理模块和检测模块;其中,
所述存储模块,用于将接收到的告警信息以告警队列形式存储;
所述告警信息数量检测模块,用于获取所述存储模块中的告警信息的数量;
所述第一监控模块,用于判断从所述告警信息数量检测模块获取的告警信息的数量是否大于预饱和值,并在判断结果为是时通知告警处理模块;
所述告警处理模块,用于第一监控模块发来当前告警信息的数量大于预饱和值的通知消息时,向检测模块发送停止告警信息写入存储模块的通知消息,并清空存储模块中的告警信息;否则,继续保持当前处理进程;
所述检测模块,用于产生告警信息并将告警信息写入存储模块;在接收到所述告警处理模块发送的停止告警信息写入存储模块的通知消息时,停止告警信息写入存储模块。
6.根据权利要求5所述的处理系统,其特征在于,
所述告警处理模块,还用于所述第一监控模块发来当前告警信息的数量大于预饱和值的通知消息时,向所述检测模块发送停止产生告警信息的消息;
相应的,所述检测模块,用于在接收到所述告警处理模块发送的停止产生告警信息的消息时,停止产生告警信息,并保存最新的告警信息。
7.根据权利要求5所述的处理系统,其特征在于,
该处理系统还包括第二监控模块,用于判断从所述告警信息数量检测模块获取的告警信息的数量是否为空值,并在判断结果为是时通知所述告警处理模块;
相应的,所述告警处理模块,还用于所述第二监控模块发来当前告警信息的数量为空值的通知消息时,向所述检测模块发送开始告警信息写入存储模块的通知消息和继续产生告警信息的消息;
相应的,所述检测模块,还用于在接收到所述告警处理模块发送的所述开始告警信息写入存储模块的通知消息时,将保存的最新的告警信息写入存储模块;在接收到所述告警处理模块发送的所述继续产生告警信息的消息时,继续产生告警信息,并将存储的最新的告警信息写入存储模块。
8.根据权利要求5所述的处理系统,其特征在于,所述告警处理模块,还用于从所述存储模块中读取告警信息进行告警信息处理,并删除读取过的告警信息。
CN201210543788.1A 2012-12-14 2012-12-14 一种防止告警队列溢出的处理方法和系统 Expired - Fee Related CN103036723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210543788.1A CN103036723B (zh) 2012-12-14 2012-12-14 一种防止告警队列溢出的处理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210543788.1A CN103036723B (zh) 2012-12-14 2012-12-14 一种防止告警队列溢出的处理方法和系统

Publications (2)

Publication Number Publication Date
CN103036723A true CN103036723A (zh) 2013-04-10
CN103036723B CN103036723B (zh) 2016-12-07

Family

ID=48023236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210543788.1A Expired - Fee Related CN103036723B (zh) 2012-12-14 2012-12-14 一种防止告警队列溢出的处理方法和系统

Country Status (1)

Country Link
CN (1) CN103036723B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192332A (zh) * 2006-11-23 2008-06-04 中兴通讯股份有限公司 告警系统和方法
CN101765204A (zh) * 2008-12-26 2010-06-30 中兴通讯股份有限公司 告警上报方法和装置
CN102523126A (zh) * 2011-12-29 2012-06-27 深圳市同洲视讯传媒有限公司 一种告警事件发送方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192332A (zh) * 2006-11-23 2008-06-04 中兴通讯股份有限公司 告警系统和方法
CN101765204A (zh) * 2008-12-26 2010-06-30 中兴通讯股份有限公司 告警上报方法和装置
CN102523126A (zh) * 2011-12-29 2012-06-27 深圳市同洲视讯传媒有限公司 一种告警事件发送方法及装置

Also Published As

Publication number Publication date
CN103036723B (zh) 2016-12-07

Similar Documents

Publication Publication Date Title
CN105187249B (zh) 一种故障恢复方法及装置
CN103220173B (zh) 一种报警监控方法及监控系统
CN107451012B (zh) 一种数据备份方法及流计算系统
CN104753994A (zh) 基于集群服务器系统的数据同步方法及其装置
CN102741775A (zh) 用于对计算机平台的系统功率状态进行转换的方法、装置和系统
CN102045204B (zh) 一种故障处理系统及方法
CN102314392A (zh) 一种计算机监控系统及监控告警的方法
CN103200257A (zh) 一种高可用集群系统中的节点及其资源切换方法
CN109474470A (zh) 一种自监控方法和装置
CN104679623A (zh) 一种服务器硬盘的维护方法、系统及服务器监控设备
CN110661652B (zh) 一种互联网设备连接及数据转发处理方法
CN108204331B (zh) 风力发电机组的故障处理方法及装置
CN107547301A (zh) 一种主备设备倒换方法及装置
CN101854263B (zh) 网络拓扑的分析处理方法、系统和管理服务器
CN112000422B (zh) 一种防止容器编排框架中pod内存溢出的方法、装置
CN103036723A (zh) 一种防止告警队列溢出的处理方法和系统
CN110457133A (zh) 一种操作系统资源异常的处理方法及系统
CN101662382A (zh) 一种抑制网管系统中振荡告警上报的方法及系统
CN102752159A (zh) 链路连通性检测方法和设备
CN115033927A (zh) 一种检测数据完整性的方法、装置、设备及介质
CN102262579A (zh) 一种计算机监控方法及系统
CN106850283B (zh) 一种基于事件驱动的云ac告警处理系统及方法
CN102780576A (zh) 故障产生和消失的上报方法及装置
CN103117882A (zh) 接入网的告警处理方法及系统
CN101651580A (zh) 一种触发双机切换的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161207

Termination date: 20191214