CN101635659A - 告警防抖方法和装置 - Google Patents

告警防抖方法和装置 Download PDF

Info

Publication number
CN101635659A
CN101635659A CN200910167580A CN200910167580A CN101635659A CN 101635659 A CN101635659 A CN 101635659A CN 200910167580 A CN200910167580 A CN 200910167580A CN 200910167580 A CN200910167580 A CN 200910167580A CN 101635659 A CN101635659 A CN 101635659A
Authority
CN
China
Prior art keywords
shake
timing
time
alarm
alarm object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910167580A
Other languages
English (en)
Other versions
CN101635659B (zh
Inventor
赵映洁
刘晨吉
李明杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2009101675802A priority Critical patent/CN101635659B/zh
Publication of CN101635659A publication Critical patent/CN101635659A/zh
Application granted granted Critical
Publication of CN101635659B publication Critical patent/CN101635659B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种告警防抖方法和装置,该方法包括:接收携带告警对象的告警信息,将告警对象的抖动次数加一,并统计在当前时刻之前的回溯时间内告警对象的抖动次数;抖动次数大于等于抖动次数门限,则开始以防抖时间为周期的第一计时;丢弃第一计时期间接收到的携带告警对象的告警信息。本发明实现了精确防抖的技术效果。

Description

告警防抖方法和装置
技术领域
本发明涉及通信领域,尤其涉及一种告警防抖方法和装置。
背景技术
现代通讯网络是庞大而复杂的系统,包含大量需要管理的对象,同时也需要应对各种由环境、人为等因素带来的干扰和故障。因此,通讯系统通常包括告警管理系统,该告警管理系统收集通讯系统中各个告警源上报的告警,并进行分析和处理,然后以某种友好的形式,通知到用户或者监控人员。
告警管理系统将每一条来自告警源的告警告知用户或监控人员。在某些特殊情形下,短时间内会有大量重复的告警信息(包括告警上报信息和告警恢复消息)上报至告警管理系统(例如:刚刚建立新的通讯网络运行尚不稳定,或者主要通讯线路发生故障,导致大量基站和小区通讯同时异常等),这种情况称为告警抖动。在发生告警抖动时,大部分的告警内容相同,只是发生时间不同,其他内容几乎重复。此时,用户或者监控人员需要不断的监控多个告警,导致增加大量的工作负担。因此需要进行告警防抖。
专利200710063940.5公开了一种在基站控制器侧的告警防抖方法。该方法利用防抖信息模块保存对待防抖告警设置的参数,利用防抖统计模块在每一个周期内统计各种告警抖动的次数,利用防抖控制模块对发生了抖动的告警进行防抖流程控制。
相关技术中的告警防抖方法,采用固定周期定时器,每隔固定时间T统计一次防抖信息。例如,设置每隔10分钟统计一次防抖信息,抖动门限为15次,即,如果在10分钟内发生了多于15次的抖动即判断应当进行防抖流程,此时,在10:10时,统计到从10:00到10:10之间发生了10次抖动,由于10小于15,所以判断不进入防抖流程并将计时器清零,在10:20时,统计从10:10到10:20之间也发生了10次抖动,由于10小于15,所以判断也不进入防抖流程;但实际情况是,在10:05到10:15分之间发生了20次抖动。因此,采用相关技术中的告警防抖方法可能导致误判。
发明内容
本发明的目的在于提供一种告警防抖方法和装置,能够解决相关技术中的告警防抖方法可能导致误判的技术问题。
根据本发明的一个方面,提供了一种告警防抖方法,包括:接收携带告警对象的告警信息,将告警对象的抖动次数加一;根据抖动次数判断是否开始以防抖时间为周期的第一计时;如果是,则开始以防抖时间为周期的第一计时,并丢弃第一计时期间接收到的携带告警对象的告警信息。
优选地,根据抖动次数判断是否开始以防抖时间为周期的第一计时具体包括:统计在当前时刻之前的回溯时间内告警对象的抖动次数;抖动次数大于等于抖动次数门限,则开始以防抖时间为周期的第一计时;如果抖动次数小于抖动次数门限,则不开始第一计时。
优选地,根据抖动次数判断是否开始以防抖时间为周期的第一计时具体包括:计算当前时刻与在当前时刻之前的第N次抖动发生的时刻之间的时间差,其中,N为抖动次数门限;时间差小于回溯时间,则开始以防抖时间为周期的第一计时;如果时间差大于等于回溯时间,则不开始第一计时。
优选地,丢弃第一计时期间接收到的携带告警对象的告警信息具体包括:接收携带告警对象的告警信息,判断是否存在告警对象的第一计时;如果存在,则丢弃告警信息,并重新开始以防抖时间为周期的第一计时。
优选地,如果不存在告警对象的第一计时,则上报告警信息,并开始以回溯时间为周期的第二计时。
优选地,第一计时或第二计时期满,第一计时或第二计时期间均未接收到携带告警对象的告警信息,则将告警对象的抖动次数清零。
根据本发明的另一个方面,还提供了一种告警防抖装置,包括:设置模块,用于设置回溯时间、抖动次数门限和防抖时间;计数器,用于在接收携带告警对象的告警信息时对告警对象的抖动次数进行计数;判断模块,用于根据抖动次数判断是否开始以防抖时间为周期的第一计时;第一计时器,用于在判断模块的判断结果为是时,开始以防抖时间为周期的第一计时;丢弃模块,用于在判断模块的判断结果为是时,丢弃第一计时期间接收到的携带告警对象的告警信息。
优选地,判断模块包括:抖动次数统计单元,用于统计在当前时刻之前的回溯时间内告警对象的抖动次数;比较单元,用于将抖动次数与抖动次数门限进行比较;判断单元,用于根据比较单元的比较结果判断是否开始以防抖时间为周期的第一计时。
优选地,判断模块包括:时间差计算单元,用于计算当前时刻与在当前时刻之前的第N次抖动发生的时刻之间的时间差,其中,N为抖动次数门限;比较单元,用于将时间差与回溯时间进行比较;判断单元,用于根据比较单元的比较结果判断是否开始以防抖时间为周期的第一计时。
优选地,丢弃模块包括:触发单元,用于在接收到携带告警对象的告警信息时触发第一计时器重新开始以防抖时间为周期的第一计时;丢弃单元,用于丢弃第一计时期间接收到的携带告警对象的告警信息。
优选地,装置还包括:上报模块,用于在判断模块的判断结果为否时,将抖动次数加一,上报告警信息,并开始以回溯时间为周期的第二计时;第二计时器,用于开始以回溯时间为周期的第二计时。
优选地,装置还包括:清零模块,用于在第一计时或第二计时期满,第一计时或第一计时期间均未接收到携带告警对象的告警信息时,清零告警对象的抖动次数。
优选地,告警防抖装置设置于基站控制器或网络管理服务器上。
借助于本发明的上述至少一个技术方案,通过在接收到告警对象的告警信息时,根据抖动次数判断是否进行计时,并在计时期间丢弃接收到的告警信息,从而避免了相关技术中采用固定周期对抖动次数进行统计可导致误判的技术问题,达到能够精确地进行防抖的技术效果。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是根据本发明第一实施例的告警防抖方法的流程图;
图2是根据本发明第一实施例的告警防抖方法的原理示意图;
图3是根据本发明第一实施例的告警防抖方法的告警防抖链表的结构示意图;
图4是根据本发明第二实施例的告警防抖装置的方框图;
图5是根据本发明第三实施例的告警防抖方法的告警对象上报告警流程图;
图6是本发明第三实施例的告警防抖方法的告警对象上报恢复流程图。
具体实施方式
功能概述
本发明的目的是为了过滤通讯系统中出现的告警抖动,减轻用户和监控人员的负担。概括的说,包括以下几个步骤:1.通过网管系统,针对不同的告警码,进行不同的防抖参数设置;2.对于设置了告警防抖参数的每一个告警对象,进行预判断;3.通过预判断,需要防抖的告警对象,开启防抖流程;预判断结束无需进入防抖流程的告警对象,走正常告警上报流程;4.开启了防抖流程的告警对象,在防抖结束后,根据告警源当前状态,决定是否上报恢复消息。
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
为了更好的对本发明进行描述,这约定一些下文常会用到的词语。在不违背本发明精神的前提下,对这些词语所指概念的描述可以有所变通。
告警对象:故障源上报的告警一般附带一些可以唯一识别本告警的关键信息(例如告警码、告警发生的位置、告警的附加信息等)。拥有不同关键信息的告警看作是不同的告警对象(例如,同样的告警码,发生位置不同,可以认为是不同的告警对象,同样告警码同样的发生位置,如果附加消息不同,也可以认为是不同的告警对象)。
抖动:告警对象发生一次告警和恢复,算作一次抖动(即,以每次恢复的时刻算作抖动发生的时刻)。
在以下的描述中,为了解释的目的,描述了多个特定的细节,以提供对本发明的透彻理解。然而,很显然,在没有这些特定细节的情况下,也可以实现本发明,此外,在不冲突的情况下,即在不背离所附权利要求阐明的精神和范围的情况下,下述实施例以及实施例中的各个细节可以进行各种组合。
第一实施例
图1是根据本发明第一实施例的告警防抖方法的流程图。如图1所示,根据本发明第一实施例的告警防抖方法包括:
步骤S102,接收携带告警对象的告警信息,将告警对象的抖动次数加一;
步骤S104,根据所述抖动次数判断是否开始以防抖时间为周期的第一计时;
步骤S106,如果是,则开始以防抖时间为周期的第一计时,并丢弃第一计时期间接收到的携带所述告警对象的告警信息。
根据本发明第一实施例的告警防抖方法通过在接收到告警对象的告警信息时,根据抖动次数判断是否进行计时,并在计时期间丢弃接收到的告警信息,从而避免了相关技术中采用固定周期对抖动次数进行统计可导致误判的技术问题,达到能够精确地进行防抖的技术效果。
除了防抖的初始设置,需要用户通过网管系统进行简单设置外,告警防抖的分析、统计、处理、上报都是自动完成的,降低了监控人员负担,节约了维护运营成本。
另外,根据本发明实施例的告警防抖方法可以有效的记录每一个告警对象的每一次抖动信息,便于用户或监控人员、测试人员了解更为细致的情况。
例如,如图2所示,假定回溯时间T=5个单位时间、防抖门限N=5次抖动、一次告警并且恢复算作一次抖动。在时间轴上,黑色块点表示告警发生、白色块点表示恢复发生,正常情况下告警源都是先发生告警,再发生恢复(如果有重复告警或者重复恢复,假设已经过滤,为方便说明,这里不说明异常情况)。将每次恢复发生时刻作为抖动发生时刻。
根据本发明第一实施例的告警防抖方法在每次抖动发生时,均根据当前已发生的抖动次数来判断是否开始第一计时。可以看出,这种每次在抖动时刻进行“回溯统计”的方法,与相关技术中固定时间间隔统计的方法相比,大大提高了防抖的精确度,因为如果只是简单的每T时间间隔统计一次,则在图2中的t2时刻时,会进行一次统计,统计结果小于N,接下来对统计次数清零,重新在下一个T时间内统计,会发现统计次数还是小于N,从而误判断为告警对象并未曾抖动过。
优选地,根据抖动次数判断是否开始以防抖时间为周期的第一计时具体包括:统计在当前时刻之前的回溯时间内告警对象的抖动次数;抖动次数大于等于抖动次数门限,则开始以防抖时间为周期的第一计时;如果抖动次数小于抖动次数门限,则不开始第一计时。
每个告警码防抖,需要设置三个参数:回溯时间T、防抖门限值N、防抖系数C。在不违背本发明精神的前提下,设置参数可根据需要,作些变通:例如可以设定为回溯时间T1、防抖门限值N、防抖时间T2-也即本发明中的T×C。
对每一个需要进行防抖的告警对象,首先进行预判断,如果预判断,发现告警对象在回溯时间T内抖动次数多于预设门限值N,则需要对该其启动防抖流程,防抖期的时长为可以为T×C,其中,C为防抖系数;防抖流程运行期间,告警对象再有告警或者恢复,都不会上报网管系统,从而达到精确防抖的技术效果。
优选地,根据抖动次数判断是否开始以防抖时间为周期的第一计时具体包括:计算当前时刻与在当前时刻之前的第N次抖动发生的时刻之间的时间差,其中,N为抖动次数门限;时间差小于回溯时间,则开始以防抖时间为周期的第一计时;如果时间差大于等于回溯时间,则不开始第一计时。
也可以通过判断过去的N次发生抖动时的首尾时间差是否大于T来确定是否进入防抖流程。
优选地,如果判断结果为否,则将抖动次数加一,并上报告警信息。
告警对象T时间内的抖动次数小于门限值N之前,告警上报网管系统,仍然走正常上报流程。
优选地,丢弃第一计时期间接收到的携带告警对象的告警信息具体包括:接收携带告警对象的告警信息,判断是否存在告警对象的第一计时;如果存在,则丢弃告警信息,并重新开始以防抖时间为周期的第一计时。
防抖期内,如果有抖动,还需对防抖时间进行适当延长(例如,将时间从新的抖动开始顺延T×C时长。直到防抖期内,该告警对象不再有抖动,则防抖流程结束。
优选地,如果不存在告警对象的第一计时,则上报告警信息,并开始以回溯时间为周期的第二计时。告警对象T时间内的抖动次数小于门限值N之前,告警上报网管系统,仍然走正常上报流程,并同时开始以回溯时间为周期的第二计时。
优选地,第一计时或第二计时期满,第一计时或第二计时期间均未接收到携带告警对象的告警信息,则将告警对象的抖动次数清零。
如果在防抖时间或回溯时间内,告警对象都没有再抖动过,因此防抖流程结束,根据先前记录的告警对象标识,将恢复上报网管系统,同时释放节点,以节约内存空间。
可选地,可以将回溯时间设置为诸如1分钟的时间,抖动次数门限设置为诸如5次的次数,防抖时间为设置诸如2分钟的时间。
告警防抖的设置需要针对不同的告警码来进行,设置好告警码之后,具有相同告警码的各个告警对象可以看作一个集合,进行管理和组织。例如,告警防抖设置结构,可以包含内容:(1)要参与防抖的告警码;(2)告警回溯时间T;(3)告警防抖门限N;(4)告警防抖时间系数C;(5)告警防抖链表。其中,告警防抖链表是对参与防抖的,拥有同样告警码的各个告警对象的组织形式,当然也可以采用别的数据结构来实现。
例如,防抖链表可以采用双向链表结构,利用动态管理的方法,动态的分配和释放告警对象的存储空间,以提高存储空间的利用率。具体可以包括:(1)链表头;(2)链表尾;(3)链表的节点。链表的节点(后文也称防抖节点)就是用来记录告警对象抖动情况的,其内容在不违背本发明原理的前提下,可以自行设定。
整个链表的结构可以如图3所示:链表是以告警码为核心,以双向链表为组织形式进行告警防抖,从头指针开始,防抖链表将不同物理位置的告警对象串联在一起,到尾指针结束。另外,同一物理位置不同附加消息的告警对象,则在双向链表的主干上,分出单向支链进行管理。防抖节点通过预判断,可以决定是否应该处于防抖流程,对应的,可以概括为两种状态:预防抖状态和颤抖状态。
对不同的告警码采用各自的“防抖链”进行维护,动态开辟空间,不会浪费内存,并且只要内存足够,可防抖数量几乎不限,可以有效应对告警抖动风暴出现的情况。
根据本发明第一实施例的告警防抖方法避免了相关技术中采用固定周期对抖动次数进行统计可导致误判的技术问题,达到能够精确地进行防抖的技术效果。
第二实施例
图4是根据本发明第二实施例的告警防抖装置的方框图。
如图4所示,根据本发明第二实施例的告警防抖装置包括:设置模块402,用于设置回溯时间、抖动次数门限和防抖时间;计数器404,用于在接收携带告警对象的告警信息时对告警对象的抖动次数进行计数;判断模块406,用于根据抖动次数判断是否开始以防抖时间为周期的第一计时;第一计时器408,用于在判断模块的判断结果为是时,开始以防抖时间为周期的第一计时;丢弃模块410,用于在判断模块的判断结果为是时,丢弃第一计时期间接收到的携带告警对象的告警信息。
根据本发明第二实施例的告警防抖装置通过在接收到告警对象的告警信息时,根据抖动次数判断是否进行计时,并在计时期间丢弃接收到的告警信息,从而避免了相关技术中采用固定周期对抖动次数进行统计可导致误判的技术问题,达到能够精确地进行防抖的技术效果。
优选地,判断模块包括:抖动次数统计单元,用于统计在当前时刻之前的回溯时间内告警对象的抖动次数;比较单元,用于将抖动次数与抖动次数门限进行比较;判断单元,用于根据比较单元的比较结果判断是否开始以防抖时间为周期的第一计时。
每个告警码防抖,需要设置三个参数:回溯时间T、防抖门限值N、防抖系数C。在不违背本发明精神的前提下,设置参数可根据需要,作些变通:例如可以设定为回溯时间T1、防抖门限值N、防抖时间T2-也即本发明中的T×C。
对每一个需要进行防抖的告警对象,首先进行预判断,如果预判断,发现告警对象在回溯时间T内抖动次数多于预设门限值N,则需要对该其启动防抖流程,防抖期的时长为可以为T×C,其中,C为防抖系数;防抖流程运行期间,告警对象再有告警或者恢复,都不会上报网管系统,从而达到精确防抖的技术效果。
优选地,判断模块包括:时间差计算单元,用于计算当前时刻与在当前时刻之前的第N次抖动发生的时刻之间的时间差,其中,N为抖动次数门限;比较单元,用于将时间差与回溯时间进行比较;判断单元,用于根据比较单元的比较结果判断是否开始以防抖时间为周期的第一计时。
也可以通过判断过去的N次发生抖动时的首尾时间差是否大于T来确定是否进入防抖流程。
优选地,丢弃模块包括:触发单元,用于在接收到携带告警对象的告警信息时触发第一计时器重新开始以防抖时间为周期的第一计时;丢弃单元,用于丢弃第一计时期间接收到的携带告警对象的告警信息。
优选地,装置还包括:上报模块,用于在判断模块的判断结果为否时,将抖动次数加一,上报告警信息,并开始以回溯时间为周期的第二计时;第二计时器,用于开始以回溯时间为周期的第二计时。告警对象T时间内的抖动次数小于门限值N之前,告警上报网管系统,仍然走正常上报流程,并同时开始以回溯时间为周期的第二计时。
优选地,装置还包括:清零模块,用于在第一计时或第二计时期满,第一计时或第一计时期间均未接收到携带告警对象的告警信息时,清零告警对象的抖动次数。
如果在防抖时间和回溯时间内,告警对象都没有再抖动过,因此防抖流程结束,根据先前记录的告警对象标识,将恢复上报网管系统,同时释放节点,以节约内存空间。
优选地,告警防抖装置设置于基站控制器或网络管理服务器上。
告警防抖可以在通讯系统的基站控制器实现,也可以在网管系统中实现,但通常在基站控制器侧实现,减轻网管系统负担的同时,基站控制器直接接收故障源上报的故障,可以更好的保证故障管理状态和真实故障源的一致。
根据本发明第二实施例的告警防抖装置避免了相关技术中采用固定周期对抖动次数进行统计可导致误判的技术问题,达到能够精确地进行防抖的技术效果。
第三实施例
下面结合图5和图6来详细说明根据本发明第三实施例的告警防抖方法。在本实施例中,定义以下几种状态:
预抖告警态——预判断阶段,告警对象的节点正处于告警状态;
预抖恢复态——预判断阶段,告警对象的节点正处于恢复状态;
预抖结束恢复态——预判断结果表明,本次恢复所代表的抖动结束后,抖动次数达到门限值,告警对象再有告警上报的话,就需要启动防抖流程了;
颤抖告警态——已经启动防抖流程的告警对象的节点正处于告警状态;
颤抖恢复态——已经启动防抖流程的告警对象的节点正处于恢复状态;
颤抖结束告警态——T×C时间内告警对象都没有再抖动,防抖流程结束,只是告警对象仍处于告警状态,所以此时节点暂不释放,记录为颤抖结束告警态。
首先,进行告警防抖的设置;可以由用户或者监控人员,通过网管系统,对需要防抖的告警码,进行参数设定;设定完毕后将参数同步到基站控制器;基站控制器根据不同情况进行处理:新加入防抖的告警码及其参数,记录下来;无需再防抖的告警码,释放其链表下所有节点,并将记录位置空闲出来;已有的需要防抖的告警码,如果仅仅是参数发生变化了,则更新参数记录,告警防抖链表的所有节点也全部释放,重新进行防抖。
其次,进行告警对象上报的告警的判断;告警对象上报的告警的判断过程如图5所示:当告警对象发生告警的时候,首先检查告警防抖设置,看看本告警对象是否需要防抖;如果不需要则,将告警上报网管系统;如果告警对象需要防抖,那么根据告警对象的位置信息进行定位,判断告警码的防抖链表里有没有该告警对象的节点;如果没有,或者有但是附加消息不同,则要新开辟一个节点;此时,将告警对象的状态设为预抖告警态并写入历史记录,同时开启预防抖定时器;如果已经有节点了,则要看状态是不是告警态(包括预抖告警态、颤抖告警态、颤抖结束告警态),如果是,则说明是重警,可直接丢弃;如果告警对象处于预抖恢复态,则将状态改为预防抖告警态并写入历史记录,同时顺延预防抖定时器,此时尚未进入颤抖状态,因此仍然正常上报后台;如果对象处于预抖结束恢复态,则表明此次告警是“第一颤”告警,将告警对象标识保存下来,供后续恢复使用,并设定颤抖定时器,对象状态改为颤抖告警态写入历史记录,此次的告警上报给后台;如果对象的告警处于颤抖恢复态,则将状态改为颤抖告警态并写入历史记录;同时顺延颤抖定时器,不再上报后台。
对告警对象上报的恢复进行判断;其过程如图6所示:告警对象发生恢复时,首先检查告警防抖设置,看看本告警对象是否需要防抖;如果不需要则上报后台;如果需要防抖,则首先根据告警位置信息定位节点在双向链表中的位置,再根据附加消息定位支链上的位置,从而找到告警对象的节点;如果没有找到对应节点,则说明这次恢复是多余的,直接丢弃即可;找到节点后,如果状态是恢复态(包括预抖恢复态、预抖结束恢复、颤抖恢复态),则说明是重复的恢复,同样丢弃掉;如果节点的状态是颤抖告警态,表明已经处于颤抖阶段,则状态修改为颤抖恢复态并写入历史记录,抖动次数加一;如果节点仍处于预抖告警态,那么首先将预抖次数加一,然后根据历史记录,判断预抖时间T内,预抖次数有没有超过网管系统配置的门限值N;若没超过门限,则状态修改为预抖恢复态并写入历史记录,如果超过了门限,就要将状态改为预抖结束恢复态并写入历史记录;此时的恢复,仍然上报给网管系统;如果对象是颤抖结束告警态,说明在T×C时间内,告警对象都没有再抖动过,因此防抖流程结束,根据先前记录的告警对象标识,将恢复上报网管系统,同时释放节点,以节约内存空间。
如果定时器超时,则按以下流程进行处理:如果某个告警对象尚处于预判断阶段,也即流程上,对应的节点处于预抖恢复态或者预抖告警态或者预抖结束恢复态,此时预防抖定时器时间到,则说明告警对象没有进一步抖动,时间T内抖动次数没有超过N,因此不启动告警防抖流程,此时,释放告警对象对应的节点;如果某个告警对象已经处于防抖阶段,也即流程上,对应的节点处于颤抖告警态或者颤抖恢复态,此时颤抖定时器时间到,说明告警对象在T×C时间内没有再次抖动,因此防抖流程需要结束;此时要判断告警对象自身是告警还是恢复状态,如果告警对象处于恢复状态,则防抖流程,要根据先前记录的告警对象标识,产生恢复上报给网管系统,同时释放节点;如果告警对象此时仍然处于告警状态,则将对应节点置为颤抖结束告警态;待下次告警对象恢复的时候,再释放节点。
本发明给出的实现实例,经试验证明,可以有效应对大量告警同时抖动的情况,同时可以很好的节约内存资源。
例如,每个节点如果允许记录40次历史状态、允许附加消息120BYTE,则每个节点占用670BYTE,假如同时有6000个告警对象在抖动,则只需要占用3.84M内存。而在实际运用中,通讯系统模块的内存一般都是G数量级的,所以应付极端的告警风暴是是足够了。另外,由于采用了动态申请和释放内存,所以,一般情况下,同时抖动着的告警如果数量正常,则占用内存不过几K,如果系统稳定运行,没有告警对象抖动,那么甚至可以不占用任何额外的内存了。
与此同时,用户和监控人员可以很好的通过接口,观察到细致的防抖轨迹,还可以根据观察的结果,方便的进行二次应用,如自制柱状图、饼状图等统计资料。
根据本发明第三实施例的告警防抖方法避免了相关技术中采用固定周期对抖动次数进行统计可导致误判的技术问题,达到能够精确地进行防抖的技术效果。
另外,由于本发明的所指的告警信息包括告警恢复信息和告警上报信息,所以在实施本发明的过程中,可以有以下四种情况:(1)接收到告警恢复信息时,将抖动次数加一,并以接收到的告警上报信息为触发信号触发或顺延以防抖时间为周期的第一计时;接收到告警上报信息时,开始或顺延以回溯时间为周期的第二计时;(2)接收到告警上报信息时,将抖动次数加一,并以接收到的告警上报信息为触发信号触发或顺延以防抖时间为周期的第一计时;并在接收到告警上报信息时,开始或顺延以回溯时间为周期的第二计时;(3)接收到告警上报信息时,将抖动次数加一,并以接收到的告警恢复信息为触发信号触发或顺延以防抖时间为周期的第一计时;并在接收到告警恢复信息时,开始或顺延以回溯时间为周期的第二计时;(4)接收到告警恢复信息时,将抖动次数加一,并以接收到的告警恢复信息为触发信号触发或顺延以防抖时间为周期的第一计时;并在接收到告警恢复信息时,开始或顺延以回溯时间为周期的第二计时。以上四种情况均包括在本发明的精神和原则之内。
总之,根据本发明实施例的告警防抖方法和装置避免了相关技术中采用固定周期对抖动次数进行统计可导致误判的技术问题,达到能够精确地进行防抖的技术效果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种告警防抖方法,其特征在于,包括:
接收携带告警对象的告警信息,将所述告警对象的抖动次数加一;
根据所述抖动次数判断是否开始以防抖时间为周期的第一计时;
如果是,则开始以防抖时间为周期的第一计时,并丢弃第一计时期间接收到的携带所述告警对象的告警信息。
2.根据权利要求1所述的方法,其特征在于,根据所述抖动次数判断是否开始以防抖时间为周期的第一计时具体包括:
统计在当前时刻之前的回溯时间内所述告警对象的抖动次数;
所述抖动次数大于等于抖动次数门限,则开始以防抖时间为周期的第一计时;
如果所述抖动次数小于抖动次数门限,则不开始所述第一计时。
3.根据权利要求1所述的方法,其特征在于,根据所述抖动次数判断是否开始以防抖时间为周期的第一计时具体包括:
计算当前时刻与在当前时刻之前的第N次抖动发生的时刻之间的时间差,其中,N为抖动次数门限;
所述时间差小于回溯时间,则开始以防抖时间为周期的第一计时;
如果所述时间差大于等于回溯时间,则不开始所述第一计时。
4.根据权利要求1所述的方法,其特征在于,丢弃第一计时期间接收到的携带所述告警对象的告警信息具体包括:
接收携带所述告警对象的告警信息,判断是否存在所述告警对象的第一计时;
如果存在,则丢弃所述告警信息,并重新开始以所述防抖时间为周期的第一计时。
5.根据权利要求4所述的方法,其特征在于,如果不存在所述告警对象的第一计时,则上报所述告警信息,并开始以所述回溯时间为周期的第二计时。
6.根据权利要求5所述的方法,其特征在于,所述第一计时或所述第二计时期满,所述第一计时或第二计时期间均未接收到携带所述告警对象的告警信息,则将所述告警对象的抖动次数清零。
7.一种告警防抖装置,其特征在于,包括:
设置模块,用于设置回溯时间、抖动次数门限和防抖时间;
计数器,用于在接收携带告警对象的告警信息时对所述告警对象的抖动次数进行计数;
判断模块,用于根据所述抖动次数判断是否开始以防抖时间为周期的第一计时;
第一计时器,用于在所述判断模块的判断结果为是时,开始以所述防抖时间为周期的第一计时;
丢弃模块,用于在所述判断模块的判断结果为是时,丢弃所述第一计时期间接收到的携带所述告警对象的告警信息。
8.根据权利要求7所述的装置,其特征在于,所述判断模块包括:
抖动次数统计单元,用于统计在当前时刻之前的回溯时间内所述告警对象的抖动次数;
比较单元,用于将所述抖动次数与抖动次数门限进行比较;
判断单元,用于根据所述比较单元的比较结果判断是否开始以防抖时间为周期的第一计时。
9.根据权利要求7所述的装置,其特征在于,所述判断模块包括:
时间差计算单元,用于计算当前时刻与在当前时刻之前的第N次抖动发生的时刻之间的时间差,其中,N为抖动次数门限;
比较单元,用于将所述时间差与所述回溯时间进行比较;
判断单元,用于根据所述比较单元的比较结果判断是否开始以防抖时间为周期的第一计时。
10.根据权利要求7所述的装置,其特征在于,所述丢弃模块包括:
触发单元,用于在接收到携带所述告警对象的告警信息时触发所述第一计时器重新开始以所述防抖时间为周期的第一计时;
丢弃单元,用于丢弃所述第一计时期间接收到的携带所述告警对象的告警信息。
11.根据权利要求7所述的装置,其特征在于,还包括:
上报模块,用于在所述判断模块的判断结果为否时,将所述抖动次数加一,上报所述告警信息,并开始以所述回溯时间为周期的第二计时;
第二计时器,用于开始以所述回溯时间为周期的第二计时。
12.根据权利要求11所述的装置,其特征在于,还包括:
清零模块,用于在所述第一计时或第二计时期满,所述第一计时或所述第一计时期间均未接收到携带所述告警对象的告警信息时,清零所述告警对象的抖动次数。
13.根据权利要求7至12任一项所述的装置,其特征在于,所述告警防抖装置设置于所述基站控制器或网络管理服务器上。
CN2009101675802A 2009-08-27 2009-08-27 告警防抖方法和装置 Active CN101635659B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101675802A CN101635659B (zh) 2009-08-27 2009-08-27 告警防抖方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101675802A CN101635659B (zh) 2009-08-27 2009-08-27 告警防抖方法和装置

Publications (2)

Publication Number Publication Date
CN101635659A true CN101635659A (zh) 2010-01-27
CN101635659B CN101635659B (zh) 2011-11-23

Family

ID=41594726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101675802A Active CN101635659B (zh) 2009-08-27 2009-08-27 告警防抖方法和装置

Country Status (1)

Country Link
CN (1) CN101635659B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101917303A (zh) * 2010-07-28 2010-12-15 中兴通讯股份有限公司 告警防抖动的处理方法及装置
CN107105448A (zh) * 2016-02-23 2017-08-29 中国移动通信集团内蒙古有限公司 一种告警信息显示方法和装置
CN111225155A (zh) * 2020-02-21 2020-06-02 Oppo广东移动通信有限公司 视频防抖方法、装置、电子设备、计算机设备和存储介质
CN113010375A (zh) * 2021-02-26 2021-06-22 腾讯科技(深圳)有限公司 设备告警方法及相关设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101917303A (zh) * 2010-07-28 2010-12-15 中兴通讯股份有限公司 告警防抖动的处理方法及装置
WO2012012986A1 (zh) * 2010-07-28 2012-02-02 中兴通讯股份有限公司 告警防抖动的处理方法及装置
CN101917303B (zh) * 2010-07-28 2014-06-11 中兴通讯股份有限公司 告警防抖动的处理方法及装置
US9007200B2 (en) 2010-07-28 2015-04-14 Zte Corporation Process method and apparatus for preventing alarm jitter
CN107105448A (zh) * 2016-02-23 2017-08-29 中国移动通信集团内蒙古有限公司 一种告警信息显示方法和装置
CN111225155A (zh) * 2020-02-21 2020-06-02 Oppo广东移动通信有限公司 视频防抖方法、装置、电子设备、计算机设备和存储介质
CN111225155B (zh) * 2020-02-21 2021-09-28 Oppo广东移动通信有限公司 视频防抖方法、装置、电子设备、计算机设备和存储介质
CN113010375A (zh) * 2021-02-26 2021-06-22 腾讯科技(深圳)有限公司 设备告警方法及相关设备
CN113010375B (zh) * 2021-02-26 2023-03-28 腾讯科技(深圳)有限公司 设备告警方法及相关设备

Also Published As

Publication number Publication date
CN101635659B (zh) 2011-11-23

Similar Documents

Publication Publication Date Title
CN101222361B (zh) 一种告警频率监控器及告警处理方法
US6124790A (en) System and method for filtering an alarm
CN105159816B (zh) 一种降低设备功耗的方法、移动终端及系统
US6658367B2 (en) System for time-bucketing of baselined data collector data
CN106961352B (zh) 监控系统及监控方法
CN108563502B (zh) 一种任务调度方法和装置
CN101635659B (zh) 告警防抖方法和装置
CN101312405B (zh) 一种告警处理方法及网管系统
CN101917303B (zh) 告警防抖动的处理方法及装置
US20040162070A1 (en) Method and apparatus for monitoring and filtering abnormal behavior of mobile stations in a wireless network
CN102523126A (zh) 一种告警事件发送方法及装置
CN103378981B (zh) 网管系统中振荡告警的处理方法及装置
CN112148504A (zh) 目标消息的处理方法及装置、存储介质及电子装置
CN101247254B (zh) 一种抑止告警风暴的方法和装置
CN110795264A (zh) 监控管理方法及系统、智能管理终端
CN110996056B (zh) 一种级联监控系统的视频存储方法及装置
US8521869B2 (en) Method and system for reporting defects within a network
KR20000002437A (ko) 통신 관리 네트웍 시스템의 성능 관리 정보 처리 방법
JP4578371B2 (ja) 監視情報取得装置
CN113489149A (zh) 基于实时状态感知的电网监控系统业务主节点选取方法
CN101854263A (zh) 网络拓扑的分析处理方法、系统和管理服务器
CN107835097B (zh) 告警信息同步方法及装置、网元
US7100095B2 (en) System and method for fault notification and correlation
CN113612647B (zh) 一种告警处理方法及装置
CN112437146B (zh) 一种设备状态同步方法、装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant