CN101247265A - 一种告警处理方法、装置和系统 - Google Patents

一种告警处理方法、装置和系统 Download PDF

Info

Publication number
CN101247265A
CN101247265A CNA2008100658082A CN200810065808A CN101247265A CN 101247265 A CN101247265 A CN 101247265A CN A2008100658082 A CNA2008100658082 A CN A2008100658082A CN 200810065808 A CN200810065808 A CN 200810065808A CN 101247265 A CN101247265 A CN 101247265A
Authority
CN
China
Prior art keywords
alarm
alarms
detected
network element
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008100658082A
Other languages
English (en)
Inventor
曹真
尹相东
郑明华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNA2008100658082A priority Critical patent/CN101247265A/zh
Publication of CN101247265A publication Critical patent/CN101247265A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明涉及通信领域,公开了一种告警处理的方法,解决了现有技术中将告警过滤从而导致的掩盖故障本质的问题。该方法在网元侧检测网元设备产生的第一告警;对至少2条检测到的第一告警进行统计分析;并在1条第二告警中携带第一告警的相关信息,上报给网管。不仅减轻了网管设备的压力,而且能够如实上报网元设备产生的告警的相关信息,使得发生故障的地方能够得到及时的检修和维护。本发明还公开了一种告警处理的装置和系统。

Description

一种告警处理方法、装置和系统
技术领域
本发明涉及通信领域,特别涉及一种告警处理方法、装置和系统。
背景技术
故障告警是通信设备在运行的过程中出现故障时产生的通知;若引起该故障告警的故障已经被修复,则生成告警级别为“Cleared”的清除告警。故障告警与清除告警统称为告警。告警机制使得网管能够准确快速的定位故障,而且在故障消除后能及时通知网管,避免了网管资源的浪费。但是,随着通信行业的发展,通信设备的结构变得越来越复杂,由于设备各种故障而产生的告警也越来越多。
对告警的检测可以在网管侧进行,也可以在网元侧进行。当检测到大量告警的突发性上报时,现有技术对这些告警的处理多采用过滤方式。
现有技术一,若在网管侧检测到大量的告警,那么对于某些告警,直接将其删除掉。例如,在检测到故障告警的很短一段时间内,又检测到了与这个故障告警相对应的清除告警,表示产生这个故障告警的故障已经恢复,那么这个故障告警以及与之相对应的清除告警都会被删除掉。这种技术能够减少保存在网管上的告警数量,避免了网管资源的浪费。
现有技术二,若在网元侧检测到大量的告警,那么对于某些告警,并不上报给网管。例如,在某个时间周期内,由于故障的产生和恢复的次数超过某个阈值,检测到了一批成对的故障告警和清除告警。那么这一批成对的故障告警和清除告警都不会上报给网管。这种技术能够在一定程度上减少告警上报的数量,避免了对网管形成冲击。
但是,在现有技术中,无论是在网管侧还是网元侧,对告警过滤式的处理都掩盖了产生告警的故障的本质,不利于对通信设备故障信息的收集,出现故障的地方也得不到及时的检修和维护。
发明内容
有鉴于此,本发明实施例提供了一种告警处理的方法、装置和系统:
一种告警处理方法,包括:
在网元侧检测网元设备产生的第一告警;
统计分析至少2条检测到的所述第一告警;
向网管上报1条第二告警;
所述第二告警携带经过统计分析的所述第一告警的相关信息。
一种告警处理的装置,所述告警处理的装置位于网元侧,包括:
告警检测模块,用于检测网元设备产生的第一告警;
告警处理模块,用于统计分析至少2条所述告警检测模块检测到的第一告警,并将所述告警检测模块检测到的至少2条所述第一告警的相关信息通过1条第二告警上报给网管设备。
一种告警处理的系统,包括告警处理装置、网管设备和至少一个网元设备;所述告警处理装置位于网元侧,包括:
告警检测模块,用于检测所述网元设备产生的第一告警;
告警处理模块,用于统计分析至少2条所述告警检测模块检测到的第一告警,并将所述告警检测模块检测到的至少2条所述第一告警的相关信息通过1条第二告警上报所述网管设备。
可见,本发明实施例提供的告警处理的方法、装置和系统,能够在减轻网管设备压力的同时,如实上报检测到的告警的相关信息,使得发生故障的地方能够得到及时的检修和维护。
附图说明
图1为本发明实施例方法流程图;
图2(a)为本发明实施例的装置结构示意图;
图2(b)为本发明实施例的又一装置结构示意图;
图3(a)为本发明实施例的系统示意图;
图3(b)为本发明实施例的又一系统示意图;
图4为本发明实施例的一个应用场景。
具体实施方式
为使本发明实施例的目的、技术方案及优点更加清楚明白,以下参照附图,对本发明实施例作进一步地详细说明。
本发明的一个实施例,如图1所示,一种告警处理的方法,包括:
S110,检测网元设备产生的第一告警。本实施例中,将网元设备产生的告警称为第一告警。
本实施例中,在网元侧检测网元设备产生的告警,所述网元设备可以是路由器、交换机等设备,此处不做限制。告警可以是由于设备发生了故障而产生的故障告警,较常见的故障有网元设备现有资源耗尽,例如地址空间耗尽;网元设备参数配置错误导致不同设备的接口之间无法正常通信等等。告警也可以是由于设备故障恢复而产生的清除告警。
由于通信设备的物理特性和逻辑特性,还有一些故障是极不稳定的,例如某些接口的UP/DOWN。这种故障的不稳定会导致出现大量的闪断告警和/或振荡告警。闪断告警是指在某个时间周期内,故障产生又立刻恢复,因此产生了一对间隔很短的故障告警和清除告警。振荡告警是指在在某个时间周期内,故障的产生和恢复的次数超过某个阈值,因此产生了一批成对的故障告警和清除告警。
S120,统计分析至少2条检测到的第一告警。
通过对检测到的第一告警进行统计分析,得到第一告警的相关信息。本实施例中,在网元侧统计分析至少2条检测到的第一告警的相关信息,可以依故障类型对检测到的第一告警进行统计分析,也可以依告警类型对检测到的第一告警进行统计分析;还可以是其他没有列举出的统计分析依据。
第一告警的相关信息包括:第一告警ID、产生第一告警的故障类型、故障定位信息,故障严酷度,故障对象状态数据等参数。以下以闪断告警和振荡告警为例进行具体的说明。
若检测到网元设备产生的第一告警为闪断告警,则第一告警的相关信息包括:故障告警ID和清除告警ID,产生该闪断告警的故障类型、故障的具体定位信息,故障的严酷度,故障对象的状态数据等参数。
若检测到网元设备产生的第一告警为振荡告警,则第一告警的相关信息包括:故障告警ID和清除告警ID,产生该振荡告警的故障类型、故障的具体定位信息,故障严酷度,故障对象状的态数据等参数。
S130,将经过统计分析的第一告警的相关信息通过1条第二告警上报给网管。本实施例中,将上报给网管的告警称为第二告警。
需要说明的是,第二告警携带的信息除了上述第一告警的相关信息,还包括:第二告警ID,第一告警产生的时间、第二告警上报的时间等参数。可以理解,第二告警中还可以携带其他参数信息,此处不再一一列举。
第二告警上报给网管设备后,通过一定的方式通知网络管理员,例如通过日志输出、电子邮件、对话框、指示灯等形式通知网络管理员。
当然,还可以设定一定的时间周期,该时间周期可配置、可更改,管理员可以根据网络的实际情况进行设定。统计分析在时间周期内检测到的所有第一告警,并将这些在时间周期内检测到的第一告警的相关信息封装到1条第二告警中,上报给网管设备。
本发明实施例提供的方法,没有直接上报检测到的告警,也没有将这些告警过滤掉,而是在网元侧将至少2条第一告警的相关信息封装到1条第二告警中,上报给网管设备。不仅减轻了网管设备的压力,而且能够如实上报网元设备产生的告警的相关信息,使得发生故障的地方能够得到及时的检修和维护。
本发明实施例还提供了一种告警处理的装置,该装置位于网元侧,如图2(a)所示,包括:
告警检测模块210,用于检测网元设备产生的第一告警;
告警处理模块220,用于统计分析至少2条告警检测模块210检测到的第一告警,并将告警检测模块210检测到的第一告警的相关信息通过1条第二告警上报给网管设备。
如图2(b)所示,所述装置还包括:
时间设置模块200,用于设定时间周期;
相应的,所述告警处理模块220包括:
第一处理子模块221,用于统计分析在时间设置模块200设定的时间周期内、告警检测模块210检测到的第一告警,并将第一告警的相关信息通过1条第二告警上报给网管设备。
本实施例提供的装置,将至少2条第一告警的相关信息封装到1条第二告警中,上报给网管设备。不仅减轻了网管设备的压力,而且能够如实上报网元设备产生的告警的相关信息,使得发生故障的地方能够得到及时的检修和维护。
基于上述方法实施例和装置实施例,本发明实施例还提供了一种告警处理的系统。如图3(a)所示,包括告警处理装置300、网管设备310和至少一个网元设备320。所述告警处理装置300位于网元侧,包括:
告警检测模块302,用于检测所述网元设备320产生的第一告警;
告警处理模块303,用于统计分析至少2条所述告警检测模块302检测到的第一告警,并将告警检测模块检测到的第一告警的相关信息通过1条第二告警上报网管设备310。
如图3(b)所述告警处理装置300还包括:
时间设置模块301,用于设定时间周期;
所述告警处理模块303还包括:
第一处理子模块3031,用于统计分析在时间设置模块301设定的时间周期内、告警检测模块302检测到的第一告警,并将第一告警的相关信息通过1条第二告警上报给网管设备。
其中,所述告警处理装置300可以集成在所述网元设备320上,也可以是一个独立的设备。
需要指出的是,为便于理解,图3中示出的所述告警处理装置300是一个独立的设备,同时图3仅示出了1个网元设备320。
本实施例提供的系统,将至少2条第一告警的相关信息封装到1条第二告警中,上报给网管设备。不仅减轻了网管设备的压力,而且能够如实上报网元设备产生的告警的相关信息,使得发生故障的地方能够得到及时的检修和维护。
以下以图4所示的应用场景为例进行介绍。如图4所示,包括网元设备400和网管设备410。本应用场景中,在网元设备400侧,检测到由于OSPF(开放式最短路径优先协议,Open Shortest PathFirst Protocol)邻居状态发生闪断而产生了1次闪断告警,即:在网元设备400侧,检测到由于OSPF邻居状态发生变化而产生了1条故障告警,随即在很短的时间内,又检测到由于OSPF邻居的状态恢复而产生了1条清除告警。所述故障告警和所述清除告警就是在实施例中提到的第一告警。
对检测到的第一告警进行统计分析,通过1条第二告警将检测到的第一告警的相关信息上报给网管设备410。所述第二告警携带的信息包括:
表1
Figure S2008100658082D00071
其中,告警参数1是所述故障告警的ID;告警参数2是所述清除告警的ID。
通过这1条第二告警,网管可以知道网元设备故障产生的时间、故障恢复的时间,以及产生这次闪断告警的故障类型、故障的位置等相关信息。
在网元设备400侧,检测到由于物理链路发生UP/DOWN状态变化产生振荡告警,即:在网元设备400侧,检测到由于物理链路在短时间内频繁的UP和DOWN,产生了一批成对的故障告警和清除告警。可以理解,所述故障告警和所述清除告警就是在实施例中提到的第一告警。
对检测到的第一告警的相关信息进行统计分析,通过1条第二告警将检测到的第一告警的相关信息上报给网管设备410。所述第二告警携带的信息包括:
表2
Figure S2008100658082D00081
通过这1条第二告警,网管可以知道振荡告警起始的时间、振荡告警持续的时间、振荡告警的频率、以及产生这次振荡告警的故障类型、故障的位置等相关信息。
通过以上的实施例的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件来实现。基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备执行本发明各个实施例或者实施例的某些部分所述的方法。
以上仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1、一种告警处理方法,其特征在于,
在网元侧检测网元设备产生的第一告警;
统计分析至少2条检测到的所述第一告警;
向网管上报1条第二告警;
所述第二告警携带经过统计分析的所述第一告警的相关信息。
2、如权利要求1所述的方法,其特征在于,所述方法还包括,设定时间周期;所述统计分析至少2条检测到的所述第一告警,具体为:
统计分析至少2条在所述时间周期内检测到的所述第一告警。
3、如权利要求1所述的方法,其特征在于,所述第二告警携带的信息还包括:所述第二告警ID,所述第二告警上报时间。
4、如权利要求1或3所述的方法,其特征在于,所述第一告警的相关信息包括:所述第一告警ID、产生所述第一告警的故障类型、故障定位信息,故障严酷度,故障对象状态数据。
5、如权利要求4所述的方法,其特征在于,所述第一告警为闪断告警,则所述第二告警携带的参数还包括:故障告警产生时间和清除告警产生时间;所述第一告警ID包括:故障告警ID和清除告警ID。
6、如权利要求4所述的方法,其特征在于,所述第一告警为振荡告警,则所述第二告警携带的信息还包括:振荡告警起始时间,振荡告警持续时间、振荡频率。
7、一种告警处理的装置,其特征在于,所述告警处理的装置位于网元侧,包括:
告警检测模块,用于检测网元设备产生的第一告警;
告警处理模块,用于统计分析至少2条所述告警检测模块检测到的第一告警,并将所述告警检测模块检测到的至少2条所述第一告警的相关信息通过1条第二告警上报给网管设备。
8、如权利要求7所述的装置,其特征在于,所述装置还包括:
时间设置模块,用于设定时间周期;
所述告警处理模块包括:
第一处理子模块,用于统计分析在所述时间设置模块设定的时间周期内、所述告警检测模块检测到的至少2条所述第一告警,并将至少2条所述第一告警的相关信息通过1条所述第二告警上报给网管设备。
9、一种告警处理的系统,其特征在于,包括告警处理装置、网管设备和至少一个网元设备;所述告警处理装置位于网元侧,包括:
告警检测模块,用于检测所述网元设备产生的第一告警;
告警处理模块,用于统计分析至少2条所述告警检测模块检测到的第一告警,并将所述告警检测模块检测到的至少2条所述第一告警的相关信息通过1条第二告警上报所述网管设备。
10、如权利要求9所述的系统,其特征在于,所述告警处理装置还包括:
时间设置模块,用于设定时间周期;
所述告警处理模块包括:
第一处理子模块,用于统计分析在所述时间设置模块设定的时间周期内、所述告警检测模块检测到的至少2条所述第一告警,并将至少2条所述第一告警的相关信息通过1条所述第二告警上报给网管设备。
11、如权利要求9或10所述的系统,其特征在于,所述告警处理装置集成在所述网元设备上,或者是一个独立的设备。
CNA2008100658082A 2008-03-06 2008-03-06 一种告警处理方法、装置和系统 Pending CN101247265A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2008100658082A CN101247265A (zh) 2008-03-06 2008-03-06 一种告警处理方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2008100658082A CN101247265A (zh) 2008-03-06 2008-03-06 一种告警处理方法、装置和系统

Publications (1)

Publication Number Publication Date
CN101247265A true CN101247265A (zh) 2008-08-20

Family

ID=39947491

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008100658082A Pending CN101247265A (zh) 2008-03-06 2008-03-06 一种告警处理方法、装置和系统

Country Status (1)

Country Link
CN (1) CN101247265A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102014020A (zh) * 2010-11-12 2011-04-13 百度在线网络技术(北京)有限公司 一种用于对网络设备进行网络监控的设备及其方法
CN102547807A (zh) * 2010-12-21 2012-07-04 中兴通讯股份有限公司 一种移动通讯设备故障的检测方法及系统
CN103246723A (zh) * 2013-05-08 2013-08-14 国家电网公司 一种监控器及方法
CN105763397A (zh) * 2016-04-19 2016-07-13 山东中创软件商用中间件股份有限公司 一种性能检测方法及装置
CN106411557A (zh) * 2015-08-03 2017-02-15 中兴通讯股份有限公司 告警的处理方法及装置
CN106992895A (zh) * 2017-05-26 2017-07-28 郑州云海信息技术有限公司 一种防震荡的告警方法、告警装置及程序产品
CN108667655A (zh) * 2018-04-23 2018-10-16 新华三技术有限公司 接口的告警方法、装置、网络管理系统和计算机可读介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102014020A (zh) * 2010-11-12 2011-04-13 百度在线网络技术(北京)有限公司 一种用于对网络设备进行网络监控的设备及其方法
CN102547807A (zh) * 2010-12-21 2012-07-04 中兴通讯股份有限公司 一种移动通讯设备故障的检测方法及系统
CN103246723A (zh) * 2013-05-08 2013-08-14 国家电网公司 一种监控器及方法
CN106411557A (zh) * 2015-08-03 2017-02-15 中兴通讯股份有限公司 告警的处理方法及装置
CN105763397A (zh) * 2016-04-19 2016-07-13 山东中创软件商用中间件股份有限公司 一种性能检测方法及装置
CN105763397B (zh) * 2016-04-19 2019-05-07 山东中创软件商用中间件股份有限公司 一种性能检测方法及装置
CN106992895A (zh) * 2017-05-26 2017-07-28 郑州云海信息技术有限公司 一种防震荡的告警方法、告警装置及程序产品
CN108667655A (zh) * 2018-04-23 2018-10-16 新华三技术有限公司 接口的告警方法、装置、网络管理系统和计算机可读介质

Similar Documents

Publication Publication Date Title
CN101247265A (zh) 一种告警处理方法、装置和系统
US10931511B2 (en) Predicting computer network equipment failure
CN101222361B (zh) 一种告警频率监控器及告警处理方法
CN104935456B (zh) 通信网络告警系统的告警消息传输和处理方法
CN103746831A (zh) 一种告警分析的方法、装置及系统
CN103166778A (zh) 一种故障自动化智能处理方法及其装置
CN102547807A (zh) 一种移动通讯设备故障的检测方法及系统
CN102404141A (zh) 一种告警抑制的方法及装置
CN111245648A (zh) 一种云手机故障告警与自动恢复的方法
CN102340808B (zh) 告警处理方法及装置
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN101916499A (zh) 一种智能报警装置及智能报警方法
CN101710863B (zh) 用于单板告警的恢复方法及系统
CN102045204A (zh) 一种故障处理系统及方法
CN101917296A (zh) 告警系统和网络管理器
CN105897491A (zh) 一种过滤无效监控报警信息的方法及其装置
CN101345656B (zh) 全局故障率测量方法
CN102820995A (zh) 告警处理方法、装置及系统
CN101132589B (zh) 一种振荡告警处理方法
CN101854263B (zh) 网络拓扑的分析处理方法、系统和管理服务器
CN110784352B (zh) 一种基于Oracle Goldengate的数据同步监控告警方法及装置
CN114070711A (zh) 告警信息的处理方法、装置、电子设备及存储介质
CN101217592B (zh) 用于告警风暴抑制的方法及系统
CN107979495A (zh) 一种网管系统中告警风暴的梯度处理方法
CN101610168A (zh) 网管系统中告警风暴的抑制方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20080820