CN103401700A - 一种频次抖动告警的处理方法和设备 - Google Patents

一种频次抖动告警的处理方法和设备 Download PDF

Info

Publication number
CN103401700A
CN103401700A CN2013103034147A CN201310303414A CN103401700A CN 103401700 A CN103401700 A CN 103401700A CN 2013103034147 A CN2013103034147 A CN 2013103034147A CN 201310303414 A CN201310303414 A CN 201310303414A CN 103401700 A CN103401700 A CN 103401700A
Authority
CN
China
Prior art keywords
alarm
fault object
fault
frequency
management equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013103034147A
Other languages
English (en)
Other versions
CN103401700B (zh
Inventor
汤金辉
徐黎
张嵘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datang Mobile Communications Equipment Co Ltd
Original Assignee
Datang Mobile Communications Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datang Mobile Communications Equipment Co Ltd filed Critical Datang Mobile Communications Equipment Co Ltd
Priority to CN201310303414.7A priority Critical patent/CN103401700B/zh
Publication of CN103401700A publication Critical patent/CN103401700A/zh
Application granted granted Critical
Publication of CN103401700B publication Critical patent/CN103401700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种频次抖动告警的处理方法和设备,该方法包括:管理设备监控各故障对象的告警情况,进行频次抖动告警的检测,并在检测到有故障对象发生频次抖动告警时,管理设备确定故障对象进入不稳定状态;向故障对象发送特定故障告警,特定故障告警用于指示故障对象进入不稳定状态,且在故障对象进入不稳定状态时,故障对象不允许上报隶属于故障对象的告警以及隶属于故障对象的子故障对象的告警;管理设备在确定故障对象进入不稳定状态后,屏蔽故障对象产生的告警以及故障对象的子故障对象产生的告警。本发明实施例中,可避免告警的反复上报,减少向OMC发送的告警数量,并减轻OMC等网管设备的处理压力。

Description

一种频次抖动告警的处理方法和设备
技术领域
本发明涉及通信技术领域,尤其是一种频次抖动告警的处理方法和设备。
背景技术
由于被管理设备(如终端设备)自身的硬件不稳定,链路不稳定,外界环境(市电、散热等)等原因,会造成终端设备的反复接入,复位以及故障等情况发生,从而造成终端设备反复上报告警,并发生频次抖动告警,严重影响终端设备自身的稳定性,并对排除故障产生影响。进一步的,目前对于这种频次抖动告警,终端设备对应的管理设备(如基站设备等网元)并不对这种频次抖动告警进行处理,而是直接发送给OMC(Operation and MaintenanceCenter,操作维护中心)等网管设备,由OMC等网管设备对告警进行处理。
在实现本发明的过程中,发明人发现现有技术中至少存在以下问题:
对于频次抖动告警,向OMC发送的告警数量过多,在OMC等网管设备对这种频次抖动告警进行处理时,会给OMC等网管设备带来很大的处理压力。
发明内容
本发明实施例提供一种频次抖动告警的处理方法和设备,以减少向OMC发送的告警数量,并减轻OMC等网管设备的处理压力。
为了达到上述目的,本发明实施例提供一种频次抖动告警的处理方法,该方法包括:
管理设备监控各故障对象的告警情况,并在检测到有故障对象发生频次抖动告警时,所述管理设备确定所述故障对象进入不稳定状态;
所述管理设备向所述故障对象发送特定故障告警,所述特定故障告警用于指示所述故障对象进入不稳定状态,且在所述故障对象进入不稳定状态时,所述故障对象不允许上报隶属于所述故障对象的告警以及隶属于所述故障对象的子故障对象的告警;
所述管理设备在确定所述故障对象进入不稳定状态后,屏蔽所述故障对象产生的告警以及所述故障对象的子故障对象产生的告警。
本发明实施例提供一种频次抖动告警的处理设备,该设备包括:
确定模块,用于监控各故障对象的告警情况,并在检测到有故障对象发生频次抖动告警时,确定所述故障对象进入不稳定状态;
发送模块,用于向所述故障对象发送特定故障告警,所述特定故障告警用于指示所述故障对象进入不稳定状态,且在所述故障对象进入不稳定状态时,所述故障对象不允许上报隶属于所述故障对象的告警以及隶属于所述故障对象的子故障对象的告警;
处理模块,用于在确定所述故障对象进入不稳定状态后,屏蔽所述故障对象产生的告警以及所述故障对象的子故障对象产生的告警。
与现有技术相比,本发明实施例至少具有以下优点:本发明实施例中,通过在管理设备(如基站设备)上对故障对象(位于被管理设备)的频次抖动告警进行检测,以在检测到有故障对象发生频次抖动告警时,由管理设备向故障对象发送特定故障告警,使得故障对象不允许上报隶属于本故障对象的告警以及隶属于本故障对象的子故障对象的告警,从而可以避免被管理设备的不稳定工作。此外,管理设备在确定故障对象进入不稳定状态后,屏蔽故障对象产生的告警以及故障对象的子故障对象产生的告警,从而可以避免告警的反复上报,减少向OMC等网管设备发送的告警数量,并减轻OMC等网管设备的处理压力。进一步的,还可以避免被管理设备的不稳定状态,造成业务的反复中断,以及不稳定态设备的投入使用,造成设备毁坏等情况。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例一提供的一种频次抖动告警的处理方法流程图;
图2是本发明实施例二提供的一种频次抖动告警的处理设备结构图。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一
针对现有技术中存在的问题,本发明实施例一提供一种频次抖动告警(即反复发送告警的过程)的处理方法,该方法应用于包括管理设备(如基站设备)、网管设备(如OMC)和多个被管理设备(如终端设备)的网络中。
本发明实施例中,由管理设备监控各被管理设备的故障对象的告警情况,并在检测到有故障对象发生频次抖动告警时,由管理设备进行频次抖动告警的抑制,并提示故障对象进入不稳定状态,以减少告警数量。
本发明实施例中,管理设备需要在MIB(Management Information Base,管理系统库)中增加针对以告警编号为粒度的信息属性节点,即在MIB中配置告警信息表中。对于容易出现抖动态的告警,需要在该告警信息表中以告警编号为粒度记录这些告警的信息属性,这些信息属性包括各种故障的告警编号,以及告警对应的故障对象类型以及父故障对象类型;此外,还需要在该告警信息表中配置如下内容:频次统计周期、门限、以及达到统计门限所转换的其它告警编号等。此外,管理设备还需要建立父子对象告警关联关系模型,该父子对象告警关联关系模型基于内部定义的告警信息表,并用于预先定义各种故障的告警编号,以及该告警对应的故障对象类型和父对象类型。
本发明实施例中,管理设备需要在MIB中定义告警上报TRAP(陷阱报文)以及活跃告警记录表结构。其中,告警上报的TRAP中需要体现两个源的OID(Object identifier,对象标识),其分别为故障源的OID以及父对象的OID,且OID中需要包含MIB中定义的对象类型和索引信息。进一步的,管理设备还需要将上报的告警信息,记录到活跃告警记录表结构中,且该活跃告警记录表结构中至少包含了父对象的OID信息和子对象的OID信息。
本发明实施例中,管理设备需要新建告警频次统计表,其索引为假索引,该告警频次统计表的属性信息包括但不限于:故障源、告警编号、告警细节号(子原因号)、告警统计周期次数、告警发生次数(以告警产生次数为准,进行加1处理)、告警状态(产生和清除)、更高级别的告警是否产生的标志。
基于上述情况,如图1所示,该频次抖动告警的处理方法包括以下步骤:
步骤101,管理设备监控各故障对象的告警情况,并在检测到有故障对象发生频次抖动告警时,管理设备确定该故障对象进入不稳定状态。
步骤102,管理设备在确定故障对象进入不稳定状态后,向故障对象发送特定故障告警(更高级别的告警),该特定故障告警用于指示故障对象进入不稳定状态。在故障对象进入不稳定状态时,该故障对象不允许上报隶属于故障对象的告警以及隶属于故障对象的子故障对象的任何告警,以减少故障对象上报的告警数量。在故障对象进入不稳定状态时,该特定故障告警还用于指示该故障对象不允许提供业务承载(即不允许故障对象所在被管理设备提供后续业务承载),不允许进行业务接入(即不允许故障对象业务接入)。
本发明实施例中,该特定故障告警(即更高级别的告警)中携带的信息包括但不限于以下信息之一或者任意组合:原因告警编号,子原因号,统计周期,告警产生次数,门限信息,原因告警的附加信息。
其中,管理设备针对每种故障对象类型在MIB表中增加节点,用来指示当前故障对象的稳定状态。当故障对象进入不稳定状态后,管理设备需要指示故障对象不允许提供业务承载(即不允许故障对象所在被管理设备提供后续业务承载),不允许进行业务接入(即不允许故障对象业务接入),不允许上报隶属于故障对象的告警以及隶属于故障对象的子故障对象的任何告警。
步骤103,管理设备在确定故障对象进入不稳定状态后,屏蔽该故障对象产生的告警以及该故障对象的子故障对象产生的告警。
本发明实施例中,管理设备在确定故障对象进入不稳定状态之后,管理设备需要屏蔽和清除该故障对象以及该故障对象的子故障对象的所有活跃告警(active alarm)以及后续产生的告警。具体的,管理设备在活跃告警处理流程中增加对于该故障对象以及以该故障对象为父故障对象的所有活跃告警的上报判断,如果父故障对象已经进入不稳定状态,则管理设备对于父故障对象以及其子故障对象的所有其它的活跃告警都不进行上报。
本发明实施例中,管理设备向故障对象发送的特定故障告警定义为需要手动清除的告警;基于此,在频次告警的恢复时机,需要人为手动干预进行故障的排障和修复,即人为手动清除故障对象所在被管理设备的故障。
具体的,由OMC等管理站手动清除告警,并将命令下发到管理设备;管理设备在接收到命令后,清除告警频次统计表,清除活跃告警记录表;同时清除故障对象的不稳定状态。此后,故障对象进入稳定状态,此时,该故障对象允许提供业务承载(即允许故障对象所在被管理设备提供后续业务承载),允许进行业务接入(即允许故障对象业务接入),并允许上报隶属于故障对象的告警以及隶属于故障对象的子故障对象的任何告警。
本发明实施例中,管理设备检测到有故障对象发生频次抖动告警的过程,具体包括:在小于等于指定时间段内,管理设备检测到故障对象发生指定类型告警的次数大于等于指定次数门限时,确定该故障对象发生频次抖动告警。
例如,指定时间段为5小时,指定次数门限为10次时,管理设备在小于等于5小时的时间段内,检测到故障对象发生指定类型告警的次数达到10次时,则管理设备确定该故障对象发生频次抖动告警,并需要对该故障对象进行告警抑制处理。其中,对于该故障对象发生频次抖动告警之前的告警(产生和清除),仍然按照现有方式进行上报,仍然进行其故障处理流程。
在本发明实施例的一种优选实施方式中,管理设备检测到有故障对象发生频次抖动告警的过程,还可以进一步包括如下步骤:
步骤A、管理设备在收到故障对象的告警时,判断该告警是否为指定类型告警;如果是,则执行步骤B;如果否,则按照现有告警流程进行处理。
本发明实施例中,管理设备确定告警为指定类型告警的过程,具体包括:管理设备查询告警信息表中是否有告警对应的记录;如果是,则确定告警为指定类型告警,该告警需要进行频次统计,执行步骤B;如果否,则确定告警不是指定类型告警,该告警不需要进行频次统计,按照现有告警流程进行处理。
其中,该告警信息表中有以告警编号为粒度的信息属性,其包括各种故障的告警编号,以及告警对应的故障对象类型和父故障对象类型。
步骤B、管理设备判断该告警是否隶属于进入不稳定状态的故障对象;如果是,则管理设备屏蔽该告警;如果否,则执行步骤C。
步骤C、在告警不隶属于进入不稳定状态的故障对象时,管理设备判断告警频次统计表中是否记录有与该告警具有相同属性信息的告警;如果告警频次统计表中没有与该告警具有相同属性信息的告警,则执行步骤D;如果告警频次统计表中有与该告警具有相同属性信息的告警,则执行步骤E。
本发明实施例中,管理设备判断告警频次统计表中是否记录有与该告警具有相同属性信息的告警,具体包括但不限于如下方式:管理设备获取该告警的属性信息,该告警的属性信息至少包括故障源、告警编号和告警细节号;之后,当告警频次统计表中有该故障源、告警编号和告警细节号对应的记录时,管理设备确定告警频次统计表中有与告警具有相同属性信息的告警;当告警频次统计表中没有该故障源、告警编号和告警细节号对应的记录时,管理设备确定告警频次统计表中没有与告警具有相同属性信息的告警。
步骤D、管理设备在告警频次统计表中记录告警的属性信息,并在告警频次统计表中记录告警统计周期次数为0,记录告警发生次数为1。
本发明实施例中,在告警频次统计表中没有与该告警具有相同属性信息的告警时,如果该告警不是故障类告警,则按照现有告警流程进行处理;如果该告警是故障类告警,则管理设备需要将该告警的相关信息录入到告警频次统计表中。具体的,管理设备在告警频次统计表中记录告警统计周期次数为0,记录告警发生次数为1,并记录该告警的故障源、告警编号、告警细节号、告警状态为故障产生,创建实例信息为行有效等信息。
步骤E、管理设备将该告警对应的告警发生次数加1。
本发明实施例中,在告警频次统计表中有与该告警具有相同属性信息的告警时,如果该告警不是故障类告警,则按照现有告警流程进行处理;如果该告警是故障类告警,则管理设备需要将该告警对应的告警发生次数加1。其中,管理设备还可以判断前一时刻的告警状态,如果本次的告警状态为产生,而前一时刻的告警状态为清除,则管理设备将该告警对应的告警发生次数加1;如果本次的告警状态为清除,而前一时刻的告警状态为产生,则管理设备将该告警对应的告警发生次数加1。
步骤F、管理设备判断当前告警统计周期次数是否在统计周期门限内;如果否,则执行步骤G;如果是,则执行步骤H。
本发明实施例中,管理设备需要启动粒度定时器,该粒度定时器用于以N分钟为粒度进行周期统计;基于此,管理设备在记录告警统计周期次数为0之后,需要每次在以N分钟为粒度进行周期统计的粒度定时器超时后,将告警统计周期次数加1,即粒度定时器计时到达N分钟后,管理设备需要将告警频次统计表中所有有效的告警统计周期次数的周期加1。
本步骤中,假设粒度定时器的粒度N分钟为10分钟,故障对象在小于等于300分钟的时间段内发生指定类型告警的次数达到10次时,表示发生频次抖动告警。基于此,告警统计周期次数为30次(300/10)。管理设备在记录告警统计周期次数为0之后,在粒度定时器第一次周期到达(即10分钟)时,将记录告警统计周期次数为1,在粒度定时器第二次周期到达时,将记录告警统计周期次数为2,以此类推。进一步的,在当前告警统计周期次数小于30次时,说明当前告警统计周期次数在统计周期门限内;在当前告警统计周期次数不小于30次时,说明当前告警统计周期次数不在统计周期门限内。
步骤G、在当前告警统计周期次数达到统计周期门限时,如果当前告警发生次数小于指定次数门限,则管理设备清空告警频次统计表中对应的记录。
具体的,如果当前告警统计周期次数已经达到统计周期门限,并且该告警尚未导致更高级别的告警产生,即未产生特定故障告警,则说明相应的故障对象仍然为稳定状态,此时可以清空告警频次统计表中该告警的记录。
步骤H、在当前告警统计周期次数在统计周期门限内时,管理设备判断告警发生次数是否大于等于指定次数门限;如果是,则执行步骤I;如果否,则确定故障对象未发生频次抖动告警,并在后续过程中继续对故障类告警产生做告警发生次数累加处理,并在告警频次统计表中记录相关的告警状态。
步骤I、管理设备确定故障对象(步骤A的故障对象)发生频次抖动告警。
进一步的,管理设备在确定故障对象发生频次抖动告警之后,需要转换为特定故障告警,并记录当前更高级别的告警产生状态,以及记录故障对象接入不稳定状态的告警的附加信息:其携带原因告警编号,子原因号,统计周期,告警产生次数,门限信息,原因告警的附加信息等。
综上所述,本发明实施例中,通过在管理设备上对故障对象的频次抖动告警进行检测,以在检测到有故障对象发生频次抖动告警时,由管理设备向故障对象发送特定故障告警,使得故障对象不允许提供业务承载,不允许进行业务接入,不允许上报隶属于本故障对象的告警以及隶属于本故障对象的子故障对象的告警,从而可以避免被管理设备的不稳定工作。此外,管理设备在确定故障对象进入不稳定状态后,屏蔽故障对象产生的告警以及故障对象的子故障对象产生的告警,从而可以避免告警的反复上报,减少向OMC等网管设备发送的告警数量,并减轻OMC等网管设备的处理压力。进一步的,还可以避免被管理设备的不稳定状态,造成业务的反复中断,以及不稳定态设备的投入使用,造成设备毁坏等情况。
实施例二
基于与上述方法同样的发明构思,本发明实施例中还提供了一种频次抖动告警的处理设备,如图2所示,该设备包括:
确定模块11,用于监控各故障对象的告警情况,并在检测到有故障对象发生频次抖动告警时,确定所述故障对象进入不稳定状态;
发送模块12,用于向所述故障对象发送特定故障告警,所述特定故障告警用于指示所述故障对象进入不稳定状态,在所述故障对象进入不稳定状态时,所述故障对象不允许上报隶属于所述故障对象的告警以及隶属于所述故障对象的子故障对象的告警;
处理模块13,用于在确定所述故障对象进入不稳定状态后,屏蔽所述故障对象产生的告警以及所述故障对象的子故障对象产生的告警。
本发明实施例中,所述特定故障告警还用于指示所述故障对象不允许提供业务承载,不允许进行业务接入。
所述确定模块11,具体用于在小于等于指定时间段内,当检测到故障对象发生指定类型告警的次数大于等于指定次数门限时,确定所述故障对象发生频次抖动告警。
所述确定模块11,进一步用于在收到故障对象的告警时,如果所述告警为指定类型告警,且所述告警不隶属于进入不稳定状态的故障对象,则判断告警频次统计表中是否记录有与所述告警具有相同属性信息的告警;
如果所述告警频次统计表中没有与所述告警具有相同属性信息的告警,则在所述告警频次统计表中记录所述告警的属性信息,并记录告警统计周期次数为0,记录告警发生次数为1;
如果所述告警频次统计表中有与所述告警具有相同属性信息的告警,则将告警发生次数加1;如果当前告警统计周期次数在统计周期内,则判断告警发生次数是否大于等于指定次数门限;如果是,则确定所述故障对象发生频次抖动告警;如果否,则确定所述故障对象未发生频次抖动告警。
所述确定模块11,进一步用于查询告警信息表中是否有所述告警对应的记录;如果是,确定所述告警为指定类型告警;如果否,确定所述告警不是指定类型告警;其中,所述告警信息表中有以告警编号为粒度的信息属性,包括各种故障的告警编号,以及告警对应的故障对象类型和父故障对象类型。
所述确定模块11,进一步用于获取所述告警的属性信息,所述告警的属性信息包括故障源、告警编号和告警细节号;当所述告警频次统计表中有所述故障源、告警编号和告警细节号对应的记录时,确定所述告警频次统计表中有与所述告警具有相同属性信息的告警;当所述告警频次统计表中没有所述故障源、告警编号和告警细节号对应的记录时,确定所述告警频次统计表中没有与所述告警具有相同属性信息的告警。
所述处理模块13,还用于启动粒度定时器,所述粒度定时器用于以N分钟为粒度进行周期统计;在记录告警统计周期次数为0之后,每次在以N分钟为粒度进行周期统计的粒度定时器超时后,将告警统计周期次数加1。
所述处理模块13,还用于如果当前告警统计周期次数已经达到统计周期门限,则当告警发生次数小于指定次数门限时,清空所述告警频次统计表中对应的记录。
所述特定故障告警中携带以下信息之一或者任意组合:原因告警编号,子原因号,统计周期,告警产生次数,门限信息,原因告警的附加信息。
所述处理模块13,还用于在所述故障对象恢复后,清除所述故障对象的不稳定状态,并确定所述故障对象进入稳定状态,且在所述故障对象进入稳定状态时,所述故障对象允许提供业务承载,允许进行业务接入,允许上报隶属于所述故障对象的告警以及隶属于所述故障对象的子故障对象的告警。
其中,本发明装置的各个模块可以集成于一体,也可以分离部署。上述模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (20)

1.一种频次抖动告警的处理方法,其特征在于,该方法包括:
管理设备监控各故障对象的告警情况,并在检测到有故障对象发生频次抖动告警时,所述管理设备确定所述故障对象进入不稳定状态;
所述管理设备向所述故障对象发送特定故障告警,所述特定故障告警用于指示所述故障对象进入不稳定状态,且在所述故障对象进入不稳定状态时,所述故障对象不允许上报隶属于所述故障对象的告警以及隶属于所述故障对象的子故障对象的告警;
所述管理设备在确定所述故障对象进入不稳定状态后,屏蔽所述故障对象产生的告警以及所述故障对象的子故障对象产生的告警。
2.如权利要求1所述的方法,其特征在于,所述特定故障告警还用于指示所述故障对象不允许提供业务承载,不允许进行业务接入。
3.如权利要求1所述的方法,其特征在于,所述管理设备检测到有故障对象发生频次抖动告警的过程,具体包括:
在小于等于指定时间段内,所述管理设备检测到故障对象发生指定类型告警的次数大于等于指定次数门限时,确定所述故障对象发生频次抖动告警。
4.如权利要求1或3所述的方法,其特征在于,所述管理设备检测到有故障对象发生频次抖动告警的过程,进一步包括:
所述管理设备在收到故障对象的告警时,如果所述告警为指定类型告警,且所述告警不隶属于进入不稳定状态的故障对象,则所述管理设备判断告警频次统计表中是否记录有与所述告警具有相同属性信息的告警;
如果所述告警频次统计表中没有与所述告警具有相同属性信息的告警,则所述管理设备在所述告警频次统计表中记录所述告警的属性信息,并记录告警统计周期次数为0,记录告警发生次数为1;
如果所述告警频次统计表中有与所述告警具有相同属性信息的告警,则所述管理设备将告警发生次数加1;如果当前告警统计周期次数在统计周期内,则判断告警发生次数是否大于等于指定次数门限;如果是,则确定所述故障对象发生频次抖动告警;如果否,则确定所述故障对象未发生频次抖动告警。
5.如权利要求4所述的方法,其特征在于,所述管理设备确定所述告警为指定类型告警的过程,具体包括:
所述管理设备查询告警信息表中是否有所述告警对应的记录;如果是,确定所述告警为指定类型告警;如果否,确定所述告警不是指定类型告警;
其中,所述告警信息表中有以告警编号为粒度的信息属性,包括各种故障的告警编号,以及告警对应的故障对象类型和父故障对象类型。
6.如权利要求4所述的方法,其特征在于,所述管理设备判断告警频次统计表中是否记录有与所述告警具有相同属性信息的告警,具体包括:
所述管理设备获取所述告警的属性信息,所述告警的属性信息包括故障源、告警编号和告警细节号;当所述告警频次统计表中有所述故障源、告警编号和告警细节号对应的记录时,所述管理设备确定所述告警频次统计表中有与所述告警具有相同属性信息的告警;当所述告警频次统计表中没有所述故障源、告警编号和告警细节号对应的记录时,所述管理设备确定所述告警频次统计表中没有与所述告警具有相同属性信息的告警。
7.如权利要求4所述的方法,其特征在于,所述方法还包括:
所述管理设备启动粒度定时器,所述粒度定时器用于以N分钟为粒度进行周期统计;所述管理设备在记录告警统计周期次数为0之后,每次在以N分钟为粒度进行周期统计的粒度定时器超时后,将告警统计周期次数加1。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:
如果当前告警统计周期次数已经达到统计周期门限,则当告警发生次数小于指定次数门限时,所述管理设备清空所述告警频次统计表中对应的记录。
9.如权利要求1所述的方法,其特征在于,
所述特定故障告警中携带以下信息之一或者任意组合:原因告警编号,子原因号,统计周期,告警产生次数,门限信息,原因告警的附加信息。
10.如权利要求1所述的方法,其特征在于,所述管理设备在确定所述故障对象进入不稳定状态后,屏蔽所述故障对象产生的告警以及所述故障对象的子故障对象产生的告警之后,所述方法还包括:
所述管理设备在所述故障对象恢复后,清除所述故障对象的不稳定状态,并确定所述故障对象进入稳定状态,且在所述故障对象进入稳定状态时,所述故障对象允许提供业务承载,允许进行业务接入,允许上报隶属于所述故障对象的告警以及隶属于所述故障对象的子故障对象的告警。
11.一种频次抖动告警的处理设备,其特征在于,该设备包括:
确定模块,用于监控各故障对象的告警情况,并在检测到有故障对象发生频次抖动告警时,确定所述故障对象进入不稳定状态;
发送模块,用于向所述故障对象发送特定故障告警,所述特定故障告警用于指示所述故障对象进入不稳定状态,且在所述故障对象进入不稳定状态时,所述故障对象不允许上报隶属于所述故障对象的告警以及隶属于所述故障对象的子故障对象的告警;
处理模块,用于在确定所述故障对象进入不稳定状态后,屏蔽所述故障对象产生的告警以及所述故障对象的子故障对象产生的告警。
12.如权利要求11所述的设备,其特征在于,所述特定故障告警还用于指示所述故障对象不允许提供业务承载,不允许进行业务接入。
13.如权利要求11所述的设备,其特征在于,
所述确定模块,具体用于在小于等于指定时间段内,当检测到故障对象发生指定类型告警的次数大于等于指定次数门限时,确定所述故障对象发生频次抖动告警。
14.如权利要求11或13所述的设备,其特征在于,
所述确定模块,进一步用于在收到故障对象的告警时,如果所述告警为指定类型告警,且所述告警不隶属于进入不稳定状态的故障对象,则判断告警频次统计表中是否记录有与所述告警具有相同属性信息的告警;
如果所述告警频次统计表中没有与所述告警具有相同属性信息的告警,则在所述告警频次统计表中记录所述告警的属性信息,并记录告警统计周期次数为0,记录告警发生次数为1;
如果所述告警频次统计表中有与所述告警具有相同属性信息的告警,则将告警发生次数加1;如果当前告警统计周期次数在统计周期内,则判断告警发生次数是否大于等于指定次数门限;如果是,则确定所述故障对象发生频次抖动告警;如果否,则确定所述故障对象未发生频次抖动告警。
15.如权利要求14所述的设备,其特征在于,
所述确定模块,进一步用于查询告警信息表中是否有所述告警对应的记录;如果是,确定所述告警为指定类型告警;如果否,确定所述告警不是指定类型告警;其中,所述告警信息表中有以告警编号为粒度的信息属性,包括各种故障的告警编号,以及告警对应的故障对象类型和父故障对象类型。
16.如权利要求14所述的设备,其特征在于,
所述确定模块,进一步用于获取所述告警的属性信息,所述告警的属性信息包括故障源、告警编号和告警细节号;当所述告警频次统计表中有所述故障源、告警编号和告警细节号对应的记录时,确定所述告警频次统计表中有与所述告警具有相同属性信息的告警;当所述告警频次统计表中没有所述故障源、告警编号和告警细节号对应的记录时,确定所述告警频次统计表中没有与所述告警具有相同属性信息的告警。
17.如权利要求14所述的设备,其特征在于,
所述处理模块,还用于启动粒度定时器,所述粒度定时器用于以N分钟为粒度进行周期统计;在记录告警统计周期次数为0之后,每次在以N分钟为粒度进行周期统计的粒度定时器超时后,将告警统计周期次数加1。
18.如权利要求17所述的设备,其特征在于,
所述处理模块,还用于如果当前告警统计周期次数已经达到统计周期门限,则当告警发生次数小于指定次数门限时,清空所述告警频次统计表中对应的记录。
19.如权利要求11所述的设备,其特征在于,
所述特定故障告警中携带以下信息之一或者任意组合:原因告警编号,子原因号,统计周期,告警产生次数,门限信息,原因告警的附加信息。
20.如权利要求11所述的设备,其特征在于,
所述处理模块,还用于在所述故障对象恢复后,清除所述故障对象的不稳定状态,并确定所述故障对象进入稳定状态,且在所述故障对象进入稳定状态时,所述故障对象允许提供业务承载,允许进行业务接入,允许上报隶属于所述故障对象的告警以及隶属于所述故障对象的子故障对象的告警。
CN201310303414.7A 2013-07-18 2013-07-18 一种频次抖动告警的处理方法和设备 Active CN103401700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310303414.7A CN103401700B (zh) 2013-07-18 2013-07-18 一种频次抖动告警的处理方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310303414.7A CN103401700B (zh) 2013-07-18 2013-07-18 一种频次抖动告警的处理方法和设备

Publications (2)

Publication Number Publication Date
CN103401700A true CN103401700A (zh) 2013-11-20
CN103401700B CN103401700B (zh) 2017-08-25

Family

ID=49565231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310303414.7A Active CN103401700B (zh) 2013-07-18 2013-07-18 一种频次抖动告警的处理方法和设备

Country Status (1)

Country Link
CN (1) CN103401700B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108234179A (zh) * 2016-12-21 2018-06-29 大唐移动通信设备有限公司 一种告警信息上报的方法及装置
CN111613035A (zh) * 2020-05-21 2020-09-01 浩云科技股份有限公司 一种报警信息自动处理方法、装置及存储介质
CN112532421A (zh) * 2020-10-27 2021-03-19 南京国电南自电网自动化有限公司 一种基于fpga的通道状态在线感知和复接单元、装置及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1503508A (zh) * 2002-11-20 2004-06-09 华为技术有限公司 网管系统的故障相关性分析及实现方法
CN1873711A (zh) * 2005-05-31 2006-12-06 华为技术有限公司 一种告警信息的处理方法
CN101128001A (zh) * 2006-08-18 2008-02-20 中兴通讯股份有限公司 网元管理系统对振荡告警的处理方法
US7439854B2 (en) * 2004-09-29 2008-10-21 Tekelec Methods, systems, and computer program products for time-based inhibiting of alarms and time-based removal of inhibited alarms
CN101917303A (zh) * 2010-07-28 2010-12-15 中兴通讯股份有限公司 告警防抖动的处理方法及装置
CN102664759A (zh) * 2012-05-02 2012-09-12 大唐移动通信设备有限公司 非稳态告警消息的过滤方法和设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1503508A (zh) * 2002-11-20 2004-06-09 华为技术有限公司 网管系统的故障相关性分析及实现方法
US7439854B2 (en) * 2004-09-29 2008-10-21 Tekelec Methods, systems, and computer program products for time-based inhibiting of alarms and time-based removal of inhibited alarms
CN1873711A (zh) * 2005-05-31 2006-12-06 华为技术有限公司 一种告警信息的处理方法
CN101128001A (zh) * 2006-08-18 2008-02-20 中兴通讯股份有限公司 网元管理系统对振荡告警的处理方法
CN101917303A (zh) * 2010-07-28 2010-12-15 中兴通讯股份有限公司 告警防抖动的处理方法及装置
CN102664759A (zh) * 2012-05-02 2012-09-12 大唐移动通信设备有限公司 非稳态告警消息的过滤方法和设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108234179A (zh) * 2016-12-21 2018-06-29 大唐移动通信设备有限公司 一种告警信息上报的方法及装置
CN111613035A (zh) * 2020-05-21 2020-09-01 浩云科技股份有限公司 一种报警信息自动处理方法、装置及存储介质
CN112532421A (zh) * 2020-10-27 2021-03-19 南京国电南自电网自动化有限公司 一种基于fpga的通道状态在线感知和复接单元、装置及方法
CN112532421B (zh) * 2020-10-27 2023-12-22 南京国电南自电网自动化有限公司 一种基于fpga的通道状态在线感知和复接单元、装置及方法

Also Published As

Publication number Publication date
CN103401700B (zh) 2017-08-25

Similar Documents

Publication Publication Date Title
US10931511B2 (en) Predicting computer network equipment failure
CN103544093A (zh) 监控报警控制方法及其系统
KR20180120558A (ko) 딥러닝 기반 통신망 장비의 장애 예측 시스템 및 방법
US11050609B2 (en) Technique for reporting and processing alarm conditions occurring in a communication network
CN102014020A (zh) 一种用于对网络设备进行网络监控的设备及其方法
CN107222356A (zh) 一种云监控系统告警方法和系统
CN110650060A (zh) 流量告警的处理方法、设备及存储介质
CN101076174B (zh) 告警风暴的处理方法
CN101916499A (zh) 一种智能报警装置及智能报警方法
CN107658980A (zh) 一种用于复核电网监控告警信息的分析方法和系统
CN103401700A (zh) 一种频次抖动告警的处理方法和设备
CN107995066A (zh) 一种自动化测试网卡的方法和装置
CN102196472A (zh) 网元异常告警方法、装置及系统
CN103378981A (zh) 网管系统中振荡告警的处理方法及装置
CN101247265A (zh) 一种告警处理方法、装置和系统
CN110198224A (zh) 一种报警处理方法、装置及系统
CN108156017A (zh) 一种输变电设备状态告警管理方法
CN102136922B (zh) 相关性分析的方法、设备及系统
CN114172921A (zh) 一种调度录音系统的日志审计方法及装置
CN114070711A (zh) 告警信息的处理方法、装置、电子设备及存储介质
CN110784352B (zh) 一种基于Oracle Goldengate的数据同步监控告警方法及装置
CN101610168A (zh) 网管系统中告警风暴的抑制方法和装置
CN113015080A (zh) 伪基站识别定位方法、装置、电子设备及存储介质
CN109699041B (zh) 一种rru通道故障诊断处理方法、设备和计算机存储介质
CN108989137B (zh) 端到端通信的时延测量方法及装置、计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant