CN101098349B - 一种网络管理系统和网元管理系统之间的告警计数过滤方法 - Google Patents
一种网络管理系统和网元管理系统之间的告警计数过滤方法 Download PDFInfo
- Publication number
- CN101098349B CN101098349B CN200610086646A CN200610086646A CN101098349B CN 101098349 B CN101098349 B CN 101098349B CN 200610086646 A CN200610086646 A CN 200610086646A CN 200610086646 A CN200610086646 A CN 200610086646A CN 101098349 B CN101098349 B CN 101098349B
- Authority
- CN
- China
- Prior art keywords
- alarm
- window
- management system
- time
- element management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种网络管理系统和网元管理系统之间的告警计数过滤方法,通过设定一个滑动时间窗,时间窗在时间轴上向后滑动,每次收到最新的重复告警进行判定时,统计在当前滑动窗口里的重复告警的总数,将其作为重复告警计数器的当前数值,重复告警计数器的数值随着滑动时间窗的不断滑动而增加或者减小,不存在被定时清零的情况,不会发生任何遗漏告警的错误情况,可以有效地进行重复告警的过滤,同时还降低了NMS和EMS之间的北向接口负荷,避免其它有用的告警信息被大量重复告警所淹没,便于操作管理人员迅速定位和排除故障。
Description
技术领域
本发明涉及移动通信领域,具体涉及网络管理系统与网元管理系统之间告警信息的计数过滤方法。
背景技术
网络管理系统(NMS,即Network Management System)与网元管理系统(EMS,即Element Management System)之间的接口称为北向接口(Itf-N,即Interface-N)。EMS主要完成ITU TMN(即International Telecommunications UnionTelecommunication Manager Network)中的网元管理层(EML,即ElementManagement Layer)功能,即完成面向设备的操作维护功能,通常不同设备供应商的EMS无法通用。NMS主要完成ITU TMN中的网络管理层(NML,即NetworkManagement Layer)功能,提供面向网络的操作管理功能,对一个被管网络(称为子网)内的所有网元设备进行管理。对于被管网络内存在多个设备供应商设备的情况,可以通过EMS管理达到管理整个子网的目的。
当移动通信设备发生故障时,将产生相应的告警信息,如果NMS设置了相关告警信息的上报,则当故障发生时,告警信息将由EMS通过北向接口上报到NMS,使得操作管理人员可以了解故障的发生并尽快进行故障定位和故障排除。
告警上报功能使用了公共管理功能中的“通知管理功能”的通知上报功能。而根据目前的处理方式,当告警产生时,通过北向接口传送的告警通知消息数量很大,对北向接口造成了很大的负担,而在这些传送的告警通知消息中,有很多是重复告警。重复告警是指这样的告警,它们由同样的设备(object instance)产生,具有相同的告警类型(Alarm Type),告警级别(Perceived Severity),告警可能原因(ProbableCause)。这些重复告警含有大量的冗余信息,不但无谓的增加了北向接口的负担,还可能把其它有用的告警信息淹没,给操作管理人员迅速定位和排除故障带来了很大困难。
为了减少接口负荷,在业界相关的北向接口标准中提出了所谓高级告警的需求,其中一个研究内容就是通过设定相应的计数过滤准则,对于在一定时间内重复告警次数小于判定阈值的重复告警进行过滤,不通过北向接口上报。然而,目前已有的一种滑动时间窗告警计数过滤的方法,由于其技术上存在一定缺陷,会导致在某些情况下,漏报本应该上报的重复告警。下面结合图1,具体说明一下这种已有方法的技术缺陷。
图1时间轴上的0,1串表示重复告警上报的情况,1表示有告警上报,0表示没有告警上报。假设图1中的告警上报的时间粒度都是单位时间粒度,即在每一个单位时间内,要么有告警上报,要么没有告警上报。即,对于图1中的0,1串,表示在10个单位时间内,总共有7个重复告警(对应于7个1)上报。假设判定阈值设定为5个,时间窗窗口长度设定为5个单位时间。
按照现有的滑动时间窗告警计数过滤方法,第一个滑动窗口100,即滑动窗口1,其开始时刻110就是首次收到告警的时刻.此后,滑动窗口1开始记时,重复告警计数器同时开始针对重复告警进行计数.随着时间的向后推移,当滑动窗口1在时间轴上向后(即沿时间轴的箭头方向,下文同此约定)增长达到规定的时间长度后,在图1中就是达到5个单位时间长度的120时刻,滑动窗口1结束,重复告警计数器也同时清零.由于在滑动窗口1的窗口长度内,重复告警计数器最大只是增加到3(对应于三个1),小于设定的阈值5,因此没有任何告警通过北向接口上报.
下一个告警的到来将触发下一个滑动时间窗150,即滑动窗口2的开始,重复告警计数器也再次重新开始针对重复告警计数。在图1中,滑动窗口2开始于时刻130,在时间轴上向后增长到规定的时间长度后,即达到5个单位时间的长度,在时刻140结束,同时重复告警计数器也再次清零。由于在滑动窗口2的窗口长度内,重复告警计数器最大只是增加到4(对应于四个1),同样小于设定的阈值5,因此也没有任何告警通过北向接口上报。
类似的,滑动窗口不断开始、在时间轴上向后增长、结束以及重复告警计数器反复清零的过程在整个时间轴上反复进行。
在这种现有技术方法下,存在多个不同的滑动窗口,它们在时间轴上没有任何重叠。第一个滑动窗口向后推移增长,期满后结束,重复告警计数器同时清零,然后第二个滑动窗口在新告警触发下开始,重复告警计数器重新开始计数。在每个滑动窗口的向后推移增长过程中,重复告警计数器都是单方向递增的,并且会随着滑动窗口的结束而定时清零。正是由于这种多个滑动窗口的分段不重叠性以及重复告警计数器定时清零的技术缺陷,就会导致在某一段时间内连续的告警被分配到多个滑动窗口的情况下,由于重复告警计数器分别清零后再次计数,就有可能造成某个滑动窗口内重复告警计数器数值小于设定阈值,导致产生遗漏告警上报的情况。例如,对于图1中的连续6个告警(6个1),大于设定的阈值5,本来应该上报该告警。但是由于被分配到了滑动窗口1和滑动窗口2,结果两个滑动窗口内的重复告警计数器取值分别为3和4,结果都没有任何告警上报,这就产生了不应该的遗漏。
发明内容
本发明解决的技术问题是提出一种网络管理系统和网元管理系统之间的告警计数过滤方法,消除告警信息的漏报并提高告警的效率。
本发明的告警计数过滤方法实现方式如下:
第一步,设置一个滑动时间窗长度,确定告警计数过滤的阈值条件;该时间窗的窗口时间长度应不小于告警计数过滤阈值对应的时间长度;
步骤二,滑动时间窗在时间轴上向后滑动,每次收到一个最新告警时,从当前收到的最新告警时刻起,在时间轴上往时间轴的反方向遍历时间窗长度个单位时间长度作为当前滑动窗口的范围,统计在当前窗口里的重复告警的总数,如果重复告警的数量大于等于告警计数过滤的阈值条件,网元管理系统就通过北向接口向网络管理系统上报该时刻收到的最新告警;否则,网元管理系统过滤该告警信息。
步骤二中计算的重复告警的总数可以存储在重复告警计数器中,计数器随着滑动时间窗的变化动态存储窗口内的重复告警总数。
告警信息包括:告警设备位置、告警类型、告警级别、告警可能原因。
当网元管理系统需要向网络管理系统发送告警清除消息时:如果该告警清除消息对应的告警消息被网元管理系统过滤掉,则该告警清除消息也被网元管理系统过滤;如果该告警清除消息对应的告警消息被网元管理系统通过北向接口上报,则该告警清除消息也被网元管理系统通过北向接口上报.
采用本发明所述方法,与现有技术相比,由于滑动时间窗在整个时间轴上向后滑动,每次收到最新的重复告警进行判定时,都从当前的时刻起,在时间轴上向前遍历时间窗长度个单位时间长度作为当前滑动窗口的范围,统计在当前滑动窗口里的重复告警的总数,将其作为重复告警计数器的当前数值,重复告警计数器的数值随着滑动时间窗的不断滑动而增加或者减小,不存在被定时清零的情况,因此不会发生任何遗漏告警的错误情况,可以有效地进行重复告警的过滤,同时还降低了NMS和EMS之间的北向接口负荷,避免其它有用的告警信息被大量重复告警所淹没,便于操作管理人员迅速定位和排除故障。
附图说明
图1是现有滑动时间窗告警计数过滤方法示例图;
图2是本发明提出的告警计数过滤方法示例图;
具体实施方式
下面通过列举一个非限制示例进行描述:
a)定义一种数据结构Filter Rule,用于表示一条告警计数过滤规则,其包含但不限于如下属性:
属性名 | 数据类型 | 说明 |
RuleID | integer | 告警计数过滤规则ID |
RuleName | string | 告警计数过滤规则名称 |
RuleDesc | string | 告警计数过滤的描述 |
SlidingWindow | integer | 滑动时间窗窗口的时间长度,单位可以是分钟等时间单位,其数值不小于判定阈值的数值。 |
Threshold | integer | 判定阈值 |
FilterAlmCounter | integer | 重复告警计数器 |
属性名 | 数据类型 | 说明 |
FilterAlmInfo | N/A | 待过滤的重复告警信息,包括但不限于:告警设备位置(object instance),告警类 |
型(Alarm Type),告警级别(Perceived Severity),告警可能原因(ProbableCause)。 |
b)EMS利用告警计数过滤规则,对相关的重复告警进行计数过滤判定处理。
下面结合附图对实施过程作进一步的详细描述,参考图2。
1)图2时间轴上的0,1串表示重复告警上报的情况,1表示有告警上报,0表示没有告警上报。假设图2中的告警上报的时间粒度都是单位时间粒度,即在每一个单位时间内,要么有告警上报,要么没有告警上报。即,对于图2中的0,1串,表示在10个单位时间内,总共有7个重复告警(7个1)上报。假设判定阈值设定为5个,滑动时间窗窗口长度设定为5个单位时间。
2)每次收到最新告警进行判定时,都从当前收到的最新告警时刻起,在时间轴上向前遍历时间窗长度个单位时间长度作为当前滑动窗口的范围,统计在当前滑动窗口里的重复告警的总数,将其作为重复告警计数器的当前数值。例如,在步骤210,由于这是收到的第一个告警,因此滑动时间窗里的数值为0,0,0,0,1,重复告警的总数即为1,因此重复告警计数器的数值就是1。在软件实现时,可以利用但不限于队列,链表,数组等方式来进行重复告警的统计。
3)用重复告警计数器的当前数值和判定阈值比较。如果重复告警计数器的当前数值大于等于设定的判别阈值,EMS就通过北向接口向NMS上报该时刻收到的最新告警;否则,EMS过滤该告警。在步骤210,重复告警计数器的数值是1,小于设定的判定阈值5,因此EMS过滤该时刻收到的最新告警不上报。
4)重复告警计数器的数值是随着滑动时间窗的不断向后滑动而进行增加或者减小的,滑动时间窗的滑动方向如图2中箭头所示,即和时间轴的箭头方向一致。
5)步骤220,表示该时刻滑动时间窗里的取值情况,计算可得重复告警计数器的数值是3,小于设定的判定阈值5,因此EMS仍然过滤该时刻收到的最新告警不上报。
6)步骤230,表示该时刻滑动时间窗里的取值情况,计算可得重复告警计数器的数值是5,等于设定的判定阈值5,因此EMS通过北向接口向NMS上报该时刻收到的最新告警。
7)步骤240,表示该时刻滑动时间窗里的取值情况,计算可得重复告警计数器的数值仍然是5,等于设定的判定阈值5,因此EMS仍然通过北向接口向NMS上报该时刻收到的最新告警。对于彼此相邻的两个时刻230和240,滑动窗口的两次取值范围存在4个单位时间长度的重叠。
c)当EMS需要向NMS发送告警清除消息时:
1)如果该告警清除消息对应的告警消息被EMS过滤掉,则该告警清除消息也被EMS过滤。
2)如果该告警清除消息对应的告警消息被EMS通过北向接口上报,则该告警清除消息也被EMS通过北向接口上报。
3)对于步骤230和240,由于这两个时刻收到的告警消息都经由北向接口上报,因此这两个告警对应的告警清除消息也通过北向接口上报。
4)对于步骤210和220,由于这两个时刻收到的告警消息都被过滤,因此这两个告警对应的告警清除消息也被过滤而不通过北向接口上报。
对于上述的示例,可以看出:在没有采用本发明方法之前,如果采用了如附图1所示的现有的告警计数过滤方法,对于图1中的连续6个告警(6个1),虽然大于设定的阈值5,本来应该上报该告警。但是由于这种方法的技术缺陷,即滑动窗口的分段不重叠性以及重复告警计数器定时清零的技术缺陷,导致没有任何告警上报,这就产生了不应该的遗漏。而采用本方法的一个具体示例之后,EMS正确的进行了告警计数过滤,通过北向接口向NMS上报了2个重复告警。通过合理的设置滑动时间窗的窗口长度和判定阈值,可以有效地减小EMS和NMS之间的北向接口的负载,也避免了其它有用告警信息被大量重复的告警信息所淹没。
上述具体实施方式以较佳实施例对本发明进行了说明,但这只是为了便于理解而举的一个形象化的实例,不应被视为是对本发明范围的限制。同样,根据本发明的技术方案及其较佳实施例的描述,可以做出各种可能的等同改变或替换,而所有这些改变或替换都应属于本发明权利要求的保护范围。
Claims (4)
1.一种网络管理系统和网元管理系统之间的告警计数过滤方法,其特征在于,包括以下处理步骤:
第一步,设置一个滑动时间窗长度,确定告警计数过滤的阈值条件;该时间窗的窗口时间长度应不小于告警计数过滤阈值对应的时间长度;
步骤二,滑动时间窗在时间轴上向后滑动,每次收到一个最新告警时,从当前收到的最新告警时刻起,在时间轴上往时间轴的反方向遍历时间窗长度个单位时间长度作为当前滑动窗口的范围,统计在当前窗口里的重复告警的总数,如果重复告警的数量大于等于告警计数过滤的阈值条件,网元管理系统就通过北向接口向网络管理系统上报该时刻收到的最新告警;否则,网元管理系统过滤该告警信息。
2.如权利要求1所述的告警计数过滤方法,其特征在于,步骤二中计算的重复告警的总数存储在重复告警计数器中,所述计数器随着滑动时间窗的变化动态存储窗口内的重复告警总数。
3.如权利要求1或2所述的告警计数过滤方法,其特征在于,所述告警信息包括:告警设备位置、告警类型、告警级别、告警可能原因。
4.如权利要求1或2所述的告警计数过滤方法,其特征在于,当网元管理系统需要向网络管理系统发送告警清除消息时:
如果该告警清除消息对应的告警消息被网元管理系统过滤掉,则该告警清除消息也被网元管理系统过滤;
如果该告警清除消息对应的告警消息被网元管理系统通过北向接口上报,则该告警清除消息也被网元管理系统通过北向接口上报。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200610086646A CN101098349B (zh) | 2006-06-27 | 2006-06-27 | 一种网络管理系统和网元管理系统之间的告警计数过滤方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200610086646A CN101098349B (zh) | 2006-06-27 | 2006-06-27 | 一种网络管理系统和网元管理系统之间的告警计数过滤方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101098349A CN101098349A (zh) | 2008-01-02 |
CN101098349B true CN101098349B (zh) | 2010-05-12 |
Family
ID=39011860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200610086646A Expired - Fee Related CN101098349B (zh) | 2006-06-27 | 2006-06-27 | 一种网络管理系统和网元管理系统之间的告警计数过滤方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101098349B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101132589B (zh) * | 2006-08-24 | 2010-12-08 | 中兴通讯股份有限公司 | 一种振荡告警处理方法 |
CN101741991A (zh) * | 2008-11-18 | 2010-06-16 | 华为技术有限公司 | 告警处理方法、装置及系统 |
CN102436720B (zh) * | 2011-09-28 | 2013-07-03 | 清华大学 | 一种基于数据过滤的重复报警处理方法 |
CN103220173B (zh) * | 2013-04-09 | 2015-10-21 | 北京搜狐新媒体信息技术有限公司 | 一种报警监控方法及监控系统 |
CN105281928A (zh) * | 2014-05-29 | 2016-01-27 | 中兴通讯股份有限公司 | 一种告警上报方法及装置 |
CN105515857B (zh) * | 2015-12-08 | 2018-09-21 | 中通服咨询设计研究院有限公司 | 一种基于rbf的城域数据网流量测算方法 |
CN106888107B (zh) * | 2016-06-08 | 2019-11-22 | 阿里巴巴集团控股有限公司 | 一种滑动窗口业务数据确定方法及装置 |
CN106656590B (zh) * | 2016-12-14 | 2019-09-27 | 北京亿阳信通科技有限公司 | 一种网络设备告警消息风暴的处理方法和装置 |
CN108573653B (zh) * | 2017-03-13 | 2022-01-04 | 腾讯科技(深圳)有限公司 | 电子地图生成方法及装置 |
CN108876391B (zh) * | 2017-05-09 | 2020-12-22 | 北京京东尚科信息技术有限公司 | 一种确定时间窗口移动时间的方法和装置 |
CN109493573B (zh) * | 2018-11-21 | 2021-04-23 | 杭州安恒信息技术股份有限公司 | 基于时间滑动窗口的用户自定义事件报警方法及系统 |
CN109709389B (zh) * | 2018-11-30 | 2021-09-28 | 珠海派诺科技股份有限公司 | 针对电力仪表分布式大容量实时数据采样告警方法和系统 |
CN112486104B (zh) * | 2019-09-12 | 2022-07-05 | 北京国双科技有限公司 | 基于实时获取传感数据进行设备异常分析的方法及装置 |
CN113890815A (zh) * | 2021-10-18 | 2022-01-04 | 中国电子科技集团公司第三十四研究所 | 网络设备端口频繁up/down监听告警方法及系统 |
CN115913886A (zh) * | 2022-11-15 | 2023-04-04 | 浪潮云信息技术股份公司 | 一种云原生环境下基于滑动窗口的告警方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1171180A (zh) * | 1994-12-23 | 1998-01-21 | 英国电讯公司 | 故障的监视 |
CN1462130A (zh) * | 2002-05-27 | 2003-12-17 | 华为技术有限公司 | 网络管理系统中闪断告警的处理方法 |
CN1633082A (zh) * | 2004-12-21 | 2005-06-29 | 中国联合通信有限公司 | 一种用于通信网络中的故障定位方法及装置 |
-
2006
- 2006-06-27 CN CN200610086646A patent/CN101098349B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1171180A (zh) * | 1994-12-23 | 1998-01-21 | 英国电讯公司 | 故障的监视 |
CN1462130A (zh) * | 2002-05-27 | 2003-12-17 | 华为技术有限公司 | 网络管理系统中闪断告警的处理方法 |
CN1633082A (zh) * | 2004-12-21 | 2005-06-29 | 中国联合通信有限公司 | 一种用于通信网络中的故障定位方法及装置 |
Non-Patent Citations (1)
Title |
---|
JP特开2004-120504A 2004.04.15 |
Also Published As
Publication number | Publication date |
---|---|
CN101098349A (zh) | 2008-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101098349B (zh) | 一种网络管理系统和网元管理系统之间的告警计数过滤方法 | |
US6239699B1 (en) | Intelligent alarm filtering in a telecommunications network | |
US7036049B2 (en) | System and method for collecting statistics for a communication network | |
US11050609B2 (en) | Technique for reporting and processing alarm conditions occurring in a communication network | |
KR20180120558A (ko) | 딥러닝 기반 통신망 장비의 장애 예측 시스템 및 방법 | |
CN103378980A (zh) | 一种层网络告警与业务相关性分析方法和装置 | |
KR20110070049A (ko) | 무선 센서 네트워크에서의 데이터 수집 장치 및 방법 | |
CN104009854A (zh) | 一种告警处理方法及装置、告警关联信息设置方法 | |
CN100539513C (zh) | 基于简单网络管理协议的故障/告警管理系统及方法 | |
EP2997756A1 (en) | Method and network device for cell anomaly detection | |
CN101076174B (zh) | 告警风暴的处理方法 | |
CN102273131A (zh) | 在大规模通信网络系统中分发故障信息的方法和系统 | |
DE69933919T2 (de) | Filterung eines sekundären Alarms | |
CN101247254B (zh) | 一种抑止告警风暴的方法和装置 | |
CN108667511A (zh) | 基于深度探测的光传输网络运行风险预警方法及系统 | |
JP2021520697A (ja) | データ伝送方法及び装置 | |
WO2017059904A1 (en) | Anomaly detection in a data packet access network | |
CN102377619A (zh) | Snmp代理通信异常自动检测及处理方法 | |
CN101360313B (zh) | 网元管理系统向网络管理系统上报告警数量信息的方法 | |
CN104796272B (zh) | 网络时钟的监测方法与装置 | |
CN115941530A (zh) | 一种二层网络环路检测的方法、装置及设备 | |
KR20200137637A (ko) | 가상 경보를 이용한 학습 데이터 생성 방법 및 이를 이용한 네트워크 장애 분석 모델 학습 방법, 이를 구현한 네트워크 시스템 | |
CN103401700A (zh) | 一种频次抖动告警的处理方法和设备 | |
ES2953736T3 (es) | Procedimiento de detección de anomalías en redes de telecomunicaciones móviles | |
CN101500345B (zh) | 一种高级告警过滤中减少告警信息丢失的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100512 |