CN101102217A - 电信网管系统中告警重复和闪断上报及监视的处理方法 - Google Patents

电信网管系统中告警重复和闪断上报及监视的处理方法 Download PDF

Info

Publication number
CN101102217A
CN101102217A CNA2006100902364A CN200610090236A CN101102217A CN 101102217 A CN101102217 A CN 101102217A CN A2006100902364 A CNA2006100902364 A CN A2006100902364A CN 200610090236 A CN200610090236 A CN 200610090236A CN 101102217 A CN101102217 A CN 101102217A
Authority
CN
China
Prior art keywords
alarm
time
network management
management system
judged result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006100902364A
Other languages
English (en)
Other versions
CN101102217B (zh
Inventor
邬春会
徐峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2006100902364A priority Critical patent/CN101102217B/zh
Publication of CN101102217A publication Critical patent/CN101102217A/zh
Application granted granted Critical
Publication of CN101102217B publication Critical patent/CN101102217B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种电信网管系统中告警重复和闪断上报及监视的处理方法。为解决现有技术中电信网管系统的可靠性和实时性都很差的问题而发明。本发明上报处理方法包括:(1)上报告警,系统在局部告警池中查找是否存在上报告警,存在则对该告警的重复数域加一,当告警的重复数大于告警级别值,且告警为未恢复告警,进入步骤(2);并判断该告警进入网管系统时间到当前时间的流逝时间是否大于定时器的窗口时间,如果判断为是,则进入步骤(2);(2)将该告警发送到系统告警池,并从局部告警池中删除该告警。这样,能够很好的满足电信管理网络对故障管理功能的实时、可靠的要求,并且能够减小对网管系统资源的耗费。

Description

电信网管系统中告警重复和闪断上报及监视的处理方法
技术领域
本发明涉及电信网管系统告警管理中对告警闪断和重复的处理方法。
背景技术
电信网管中故障管理是电信设备制造商和电信运营商关心的问题,故障管理必须可靠的把当前系统的运行情况实时地展示给用户,这对故障管理提出很高的要求。
目前,网管系统对设备告警的处理通常的做法是:对于上报的新告警,把告警存在告警池中,并且上报给客户端和上级网管系统;对于告警恢复,告警软件模块将对应的告警从告警池中删除,上报给客户端和上级网管系统,然后将告警写入历史告警数据库。
一般情况下,这种方式可以正常工作。但是,由于电信设备的复杂性,设备在某些时候会出现上报大量闪断告警和重复告警的情况,采用通常的处理方式,就会消耗很多网管系统资源,如cpu,内存,硬盘,网络带宽,由于资源消耗很大,甚至导致不能正常操作网管系统,网管系统的可靠性和实时性都变得很差。
发明内容
为了克服现有技术的缺陷和不足,本发明的目的在于提供一种电信网管系统中告警重复和闪断上报及监视的处理方法,能够减小对网管系统资源的耗费,降低网管系统的投资成本,满足在恶劣情况下实时可靠的显示系统当前的运行状况的需求。
为了达到上述目的,本发明一种电信网管系统中告警重复和闪断上报及监视的处理方法,包括以下步骤:
(1)电信设备向系统上报告警;
(2)系统提取该告警的告警码和告警发生的位置,并在局部告警池中查找是否存在该告警,如果判断结果为是,则进入步骤(3);如果判断结果为否,则进入步骤(6);
(3)系统依次对告警进行下述两种判断;
a、系统对该告警的重复数域加一,并判断告警的重复数是否大于告警阀值,如果判断结果为是则进入步骤(4),如果判断结果为否,则返回步骤(1);
b、判断该告警进入网管系统的时间到当前时间的流逝时间是否超过时间窗口,若判断结果为是,则进入步骤(5);若判断结果为否,则返回步骤(1);
(4)判断该告警是否为未恢复告警,如果判断结果为是,则进入步骤(5);如果判断结果为否,则返回步骤(1);
(5)系统将该告警立即发往系统告警池,并从局部告警池中删除该告警,返回步骤(1);
(6)系统将该告警立即发往系统告警池,并将该告警重复数域置为零,存储在局部告警池中,返回步骤(1);
作为本发明的进一步改进,所述的步骤(1)前还包括:
(A)用户定制告警重复和闪断的鉴别器参数。
作为本发明的进一步改进,所述的步骤(1)和步骤(2)之间还包括:
(B)系统将告警送到鉴别器,鉴别器根据用户定制的告警参数决定是否进行处理,如果满足用户定制的告警参数,则进入步骤(2),否则,直接将告警发送给系统告警池后,返回步骤(1)。
作为本发明的进一步改进,所述步骤(3)前还包括:
系统更新该告警的最后一次上报时间和进入网管系统的时间。
作为本发明的进一步改进,所述步骤(6)中系统对该告警重复数域置为零前还包括:
系统设置告警进入网管系统的时间,并将当前告警的上报时间设定为告警发生时间。
作为本发明的进一步改进,步骤(3)b具体包括以下步骤:
(11)用户定制告警重复和闪断的定时器的窗口时间;
(12)系统启动监视器的定时器,使监视器处于活动状态,定时器启动后,进入休眠状态;
(13)定时器时间到,系统判断局部告警池是否为空,如果判断结果为是,则返回步骤(12);如果判断结果为否,则进入步骤(14);
(14)系统循环从局部告警池中取出每条告警,判断告警进入网管系统时间到当前时间的流逝时间是否大于定时器的窗口时间:如果判断结果为是,则进入步骤(5);如果判断为否,则进入步骤(1)。
采用上述的方法后,在告警上报时,当处理器私有告警池不存在这条告警时,把它立即上报给客户端,保证了告警的实时上报;如果告警重复发生,达到一定的域值后,告警上报的处理流程会在告警状态是“新告警”情况下,把该告警上报系统告警池,保证客户端可以实时的得到系统正在发生重复告警/闪端的运行状态信息,而避免再次受到告警闪断的干扰;对于大量同类告警重复和闪断,通过更新告警级别域得到告警的最新状态,同时计算告警重复数,把它们压缩成一条告警。这样这条告警不仅含有当前最新的信息,也含有与这条告警相关的历史信息;提高网管系统的稳定性,由于对网络带宽,cpu等资源的耗费降低,可以保证网管系统在大量告警重复,闪断的恶劣情况下的正常运行,很好的满足了电信管理网络对故障管理功能的实时,可靠的要求。
附图说明
图1为本发明电信网管系统中告警上报的流程图;
图2为本发明电信网管系统告警监视的流程图;
图3为本发明的软件模块逻辑图。
具体实施方式
本发明主要可以解决的是告警闪断、重复情况下,减少对系统资源的占用,增加系统实时展示告警的能力。本发明使用“重复/闪断处理器”作为一个缓冲层,在其中对重复和闪断的告警进行压缩处理,这个处理器的特点是不区分告警重复和闪断,通过修改局部告警池的已经存在的告警相关域完成处理功能。如图3所示,该软件模块包括鉴别器、告警处理器、监视器和局部告警池4个组成部分,其中,局部告警池连至系统告警池,其模块还包括网元设备和EMF,本发明方法主要包括以下步骤:
预处理工作:
用户定制告警重复/闪断处理器参数,设定2个参数:
(A)鉴别器条件设定,鉴别器的作用是根据用户的条件,对满足条件的告警上报,交给“处理器”,否则,将告警插入系统告警池。鉴别器支持类SQL语句,用来描述对何种特征的告警进行处理,支持and、or等逻辑运算符,也支持空条件,表示所有的告警。
(B)监视器设定。设置一个时间窗口,在这个时间窗口内发生的告警会在告警处理器中处理。
如图1所示,告警上报处理流程包括以下步骤:
(1)开始,电信设备上报告警;
(2)告警被送到鉴别器处理;
(3)鉴别器根据用户定制的信息,判断是否满足鉴别器条件,当满足用户定制的条件时,执行(4),否则,直接将告警发送到系统告警池,转(7);
(4)进入告警处理器,首先提取这条告警的告警码和告警发生位置,查找局部告警池中是否存在该告警,如果存在这条告警,转(5);否则转(6);
(5)更新这条告警的计数器,包括更新最后一次上报时间域和这条告警进入网管系统的时间,并将这条告警的重复数域加1,更新这条告警的告警级别(即根据告警重复数可以设置不同级别),当计数小于预先设定的告警阀值100时(当然该阀值可以根据需要设定),转(7);当计数大于100时,判断该告警是否为未恢复告警,如果这条告警的当前状态是新告警,则将告警发送到系统告警池,从局部池中删除,转(7);否则转(7);
(6)将这条告警写入局部告警池之后,立即发送到系统告警池,并将这条告警的计数置为0,修改告警进入网管系统的时间,修改当前告警最后一次上报时间为告警发生时间,将这条告警存储在局部告警池中,转(7);
(7)返回(1),并处理下一条告警上报;
在上述的告警上报流程中,步骤(5)与步骤(6)之间还包括一个监视器的判断过程,判断该告警进入网管系统的时间到当前时间的流逝时间是否超过时间窗口,如果判断结果为是,则进入步骤(6),如果判断结果为否,则进入步骤(7);如图2所示,监视器处理流程具体包括以下步骤:
(11)开始,监视器启动定时器;
(12)监视器进入sleep状态,等待定时器启动;
(13)定时器时间到,监视器进入活动状态;
(14)判断局部告警池为空?如果是,则转(12);否则转(15);
(15)系统循环从局部告警池中取出每条告警,计算该告警进入网管系统时间到当前时间的流逝的时间,当该流逝时间大于窗口时间时,转(16);否则返回步骤(14);
(16)系统将该告警立即发往系统告警池,并从局部告警池中删除该告警,返回步骤(1);
本发明在告警上报时,当处理器私有告警池不存在这条告警时,把它立即上报给客户端,保证了告警的实时上报。如果告警重复发生,达到一定的域值后,告警上报的处理流程会在告警状态是“新告警”情况下,把该告警上报系统告警池,保证客户端可以实时的得到系统正在发生重复告警/闪端的运行状态信息,而避免再次受到告警闪断的干扰。由于使用类SQL语句作为鉴别器条件表达式,增强了系统的灵活性和用户友好性。即使设置鉴别器的条件为空(表示所有的告警都将进入闪断处理),系统也能正常的工作。对于大量同类告警重复和闪断,本方法不特殊区分这两种情况,而是通过更新告警级别域,得到告警的最新状态,同时计算告警重复数,把它们压缩成一条告警。这样这条告警不仅含有当前最新的信息,也含有与这条告警相关的历史信息。
在CDMA网管系统中,告警消息闪断发生时候,可以达到每秒200左右的消息量,每条消息大约1K字节。使用原来的处理方式,由于需要把恢复的告警写入历史数据库和将告警上报到上级网管,网管系统不堪重负。使用本发明,将100条这样的告警压缩成一条告警,资源占用降低了很多,提高了网管系统应对异常情况的能力,提高了告警管理系统的实时性和可靠性,本发明现应用于电信网管系统,但其原理具有普遍性,略作修改可推广到其他网管系统。

Claims (6)

1、一种电信网管系统中告警重复和闪断上报及监视的处理方法,其特征在于,包括以下步骤:
(1)电信设备向系统上报告警;
(2)系统提取该告警的告警码和告警发生的位置,并在局部告警池中查找是否存在该告警,如果判断结果为是,则进入步骤(3);如果判断结果为否,则进入步骤(6);
(3)系统依次对告警进行下述两种判断;
a、系统对该告警的重复数域加一,并判断告警的重复数是否大于告警阀值,如果判断结果为是则进入步骤(4),如果判断结果为否,则返回步骤(1);
b、判断该告警进入网管系统的时间到当前时间的流逝时间是否超过时间窗口,若判断结果为是,则进入步骤(5);若判断结果为否,则返回步骤(1);
(4)判断该告警是否为未恢复告警,如果判断结果为是,则进入步骤(5);如果判断结果为否,则返回步骤(1);
(5)系统将该告警立即发往系统告警池,并从局部告警池中删除该告警,返回步骤(1);
(6)系统将该告警立即发往系统告警池,并将该告警重复数域置为零,存储在局部告警池中,返回步骤(1)。
2、按照权利要求1所述的电信网管系统中告警闪断和重复上报及监视的处理方法,其特征在于,所述的步骤(1)前还包括:
(A)用户定制告警重复和闪断的鉴别器参数。
3、按照权利要求2所述的电信网管系统中告警闪断和重复上报的处理方法,其特征在于,所述的步骤(1)和步骤(2)之间还包括:
(B)系统将告警送到鉴别器,鉴别器根据用户定制的告警参数决定是否进行处理,如果满足用户定制的告警参数,则进入步骤(2),否则,直接将告警发送给系统告警池后,返回步骤(1)。
4、按照权利要求1所述的电信网管系统中告警闪断和重复上报及监视的处理方法,其特征在于,所述步骤(3)前还包括:
系统更新该告警的最后一次上报时间和进入网管系统的时间。
5、按照权利要求1所述的电信网管系统中告警闪断和重复上报及监视的处理方法,其特征在于,所述步骤(6)中系统对该告警重复数域置为零前还包括:
系统设置告警进入网管系统的时间,并将当前告警的上报时间设定为告警发生时间。
6、按照权利要求1所述的电信网管系统中告警闪断和重复上报及监视的处理方法,其特征在于,步骤(3)b具体包括以下步骤:
(11)用户定制告警重复和闪断的定时器的窗口时间;
(12)系统启动监视器的定时器,使监视器处于活动状态,定时器启动后,进入休眠状态;
(13)定时器时间到,系统判断局部告警池是否为空,如果判断结果为是,则返回步骤(12);如果判断结果为否,则进入步骤(14);
(14)系统循环从局部告警池中取出每条告警,判断告警进入网管系统时间到当前时间的流逝时间是否大于定时器的窗口时间:如果判断结果为是,则进入步骤(5);如果判断为否,则进入步骤(1)。
CN2006100902364A 2006-07-07 2006-07-07 电信网管系统中告警重复和闪断上报及监视的处理方法 Active CN101102217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006100902364A CN101102217B (zh) 2006-07-07 2006-07-07 电信网管系统中告警重复和闪断上报及监视的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006100902364A CN101102217B (zh) 2006-07-07 2006-07-07 电信网管系统中告警重复和闪断上报及监视的处理方法

Publications (2)

Publication Number Publication Date
CN101102217A true CN101102217A (zh) 2008-01-09
CN101102217B CN101102217B (zh) 2010-06-09

Family

ID=39036324

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100902364A Active CN101102217B (zh) 2006-07-07 2006-07-07 电信网管系统中告警重复和闪断上报及监视的处理方法

Country Status (1)

Country Link
CN (1) CN101102217B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201928A (zh) * 2010-03-24 2011-09-28 中兴通讯股份有限公司 告警级别处理方法及告警服务器
CN103190117A (zh) * 2011-02-24 2013-07-03 惠普发展公司,有限责任合伙企业 网络中的错误报告系统及方法
CN105553750A (zh) * 2016-02-29 2016-05-04 北京英诺威尔科技股份有限公司 一种可配置的告警前转处理方法
CN108427608A (zh) * 2017-02-15 2018-08-21 腾讯科技(深圳)有限公司 事件告警方法及事件告警装置
CN108737132A (zh) * 2017-04-14 2018-11-02 优酷信息技术(北京)有限公司 一种告警信息处理方法及装置
CN113220538A (zh) * 2021-06-04 2021-08-06 中富通集团股份有限公司 一种机房动力设备运行环境监控状态传输方法
CN115294736A (zh) * 2022-10-09 2022-11-04 深圳曼顿科技有限公司 报警消息控制方法、装置、终端设备以及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1278516C (zh) * 2002-05-27 2006-10-04 华为技术有限公司 网络管理系统中闪断告警的处理方法
CN100450008C (zh) * 2002-10-22 2009-01-07 华为技术有限公司 通信网络告警的处理方法和相关性分析管理器
CN1266881C (zh) * 2002-11-20 2006-07-26 华为技术有限公司 网管系统的故障相关性分析及实现方法
KR100521738B1 (ko) * 2003-03-06 2005-10-17 (주) 엘지텔레콤 지식 기반 망 관리 시스템에서 지식데이터 최적화 방법
CN1244996C (zh) * 2003-09-05 2006-03-08 中兴通讯股份有限公司 一种cdma系统中防止告警风暴的方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201928A (zh) * 2010-03-24 2011-09-28 中兴通讯股份有限公司 告警级别处理方法及告警服务器
WO2011116615A1 (zh) * 2010-03-24 2011-09-29 中兴通讯股份有限公司 告警级别处理方法及告警服务器
CN103190117A (zh) * 2011-02-24 2013-07-03 惠普发展公司,有限责任合伙企业 网络中的错误报告系统及方法
US9141462B2 (en) 2011-02-24 2015-09-22 Hewlett-Packard Development Company, L.P. System and method for error reporting in a network
CN103190117B (zh) * 2011-02-24 2016-08-31 慧与发展有限责任合伙企业 网络中的错误报告系统及方法
CN105553750A (zh) * 2016-02-29 2016-05-04 北京英诺威尔科技股份有限公司 一种可配置的告警前转处理方法
CN108427608A (zh) * 2017-02-15 2018-08-21 腾讯科技(深圳)有限公司 事件告警方法及事件告警装置
CN108427608B (zh) * 2017-02-15 2020-12-01 腾讯科技(深圳)有限公司 事件告警方法及事件告警装置
CN108737132A (zh) * 2017-04-14 2018-11-02 优酷信息技术(北京)有限公司 一种告警信息处理方法及装置
CN113220538A (zh) * 2021-06-04 2021-08-06 中富通集团股份有限公司 一种机房动力设备运行环境监控状态传输方法
CN115294736A (zh) * 2022-10-09 2022-11-04 深圳曼顿科技有限公司 报警消息控制方法、装置、终端设备以及存储介质

Also Published As

Publication number Publication date
CN101102217B (zh) 2010-06-09

Similar Documents

Publication Publication Date Title
CN101102217B (zh) 电信网管系统中告警重复和闪断上报及监视的处理方法
CN107515796B (zh) 一种设备异常监控处理方法及装置
CN110442498B (zh) 异常数据节点的定位方法、装置、存储介质及计算机设备
CN107483268A (zh) 一种告警处理方法及系统
CN102088363B (zh) 告警处理方法和系统
CN109861856B (zh) 系统故障信息的通知方法、装置、存储介质及计算机设备
CN109769226A (zh) 一种物联网卡管控方法、系统、计算机设备及存储介质
CN103123602A (zh) 基于java的异常报警监控方法及其装置
CN104967537A (zh) 一种报警信息推送方法及装置
CN105763395A (zh) 云环境下用于虚拟机和容器的监控管理方法及系统
US7293082B1 (en) Method and system for modeling behavior of elements in a telecommunications system
CN107707392A (zh) 通道修复方法及装置、终端
US9811437B1 (en) Systems and methods for monitoring and acting on logged system messages
CN111475369A (zh) 日志监控的添加方法、装置、计算机设备及存储介质
CN105933497B (zh) 一种多模式的来电拦截方法与装置
CN100581144C (zh) 邮件过滤系统和邮件过滤方法
CN112817828A (zh) 一种gtp的监控方法、装置及设备
CN103024786A (zh) 一种资源管理方法和系统
CN111949421B (zh) Sdk调用方法、装置、电子设备和计算机可读存储介质
CN107911229B (zh) 运行状态改变的提醒方法、装置、电子设备及存储介质
CN110191097A (zh) 登录页面安全性的检测方法、系统、设备及存储介质
CN111062503B (zh) 一种电网监控告警处理方法、系统、终端及存储介质
CN116483663A (zh) 用于平台的异常告警方法和装置
CN110532499A (zh) 行情数据智能推送方法及装置
CN109981338A (zh) 代码拉取的告警方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant