CN102333002A - 一种告警排序方法和装置 - Google Patents

一种告警排序方法和装置 Download PDF

Info

Publication number
CN102333002A
CN102333002A CN201110346491A CN201110346491A CN102333002A CN 102333002 A CN102333002 A CN 102333002A CN 201110346491 A CN201110346491 A CN 201110346491A CN 201110346491 A CN201110346491 A CN 201110346491A CN 102333002 A CN102333002 A CN 102333002A
Authority
CN
China
Prior art keywords
alarm
level
source
alarm source
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201110346491A
Other languages
English (en)
Inventor
吴飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN201110346491A priority Critical patent/CN102333002A/zh
Publication of CN102333002A publication Critical patent/CN102333002A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种告警排序方法,预先为网络中各告警源设置告警源重要级别并保存,该方法包括:接收告警源因检测到网络故障或疑似故障而发送的告警,分析该告警并获取该告警的告警源和告警级别;根据获取的告警源查找到预先设置的对应告警源重要级别;通过查找到的告警源重要级别和获取的告警级别确定告警排序因子,并根据该告警排序因子确定该告警在未处理的告警中的排序位置。基于同样的发明构思,本发明还提出一种告警排序装置,能够提高告警处理效率,及重要业务的总体可用性水平。

Description

一种告警排序方法和装置
技术领域
本发明涉及网络管理领域,特别涉及一种告警排序方法和装置。
背景技术
在网络管理领域,故障管理是一个非常重要的部分,网络管理员的日常主要工作就是密切关注网络基础设施中出现的故障,并及时进行分析和处理。
故障管理的过程一般如下:网络设备发现自身出现故障或者疑似故障,通过网络向网络管理系统发送故障告警,网络管理系统接收和解析之后提示网络管理员告警详细信息,网络管理员查看并分析告警详细信息后,然后对故障进行分析和处理,直至故障恢复。
一般网络管理系统在接收到告警信息后,会直接呈现给网络管理员,网络管理员需要一个一个的查看并分析告警详细信息,在网络比较小,告警信息比较少的情况下,这种做法可以满足日常网络管理的需要,但是当网络规模逐渐变大,告警信息日渐增多的时候,网络管理员显然无法保证及时的处理完所有告警信息,这个时候一般的网络管理系统提供了根据网络故障优先级排序的功能,这种功能一般是根据网络设备发送的告警信息中的告警级别进行排序,这种排序方法可以让网络管理员优先分析和处理级别高的告警,从而提高告警的处理效率。
但是这种排序方式在实际应用过程中是存在问题的,如这种排序方法无法区分网络设备、网络线路对业务影响的严重程度,而网络中的设备和线路其实是存在主和备、重要和不重要的差异的,如果不加以区别,网络管理员就需要人工的去区分哪些告警是需要马上处理的,哪些是不需要的。这种不加区别的排序方式会导致网络管理员处理告警的效率降低,且影响重要业务的总体可用性水平。
发明内容
有鉴于此,本发明提供一种告警排序方法和装置,能够提高告警处理效率,及重要业务的总体可用性水平。
为解决上述技术问题,本发明的技术方案是这样实现的:
一种告警排序方法,预先为网络中各告警源设置告警源重要级别并保存,所述方法包括:
接收告警源因检测到网络故障或疑似故障而发送的告警,分析所述告警并获取所述告警的告警源和告警级别;
根据所述获取的告警源查找到预先设置的对应告警源重要级别;
通过所述查找到的告警源重要级别和所述获取的告警级别确定告警排序因子,并根据该告警排序因子确定该告警在未处理的告警中的排序位置。
一种告警排序装置,所述装置包括:配置单元、接收单元、获取单元、查找单元和确定单元;
所述配置单元,用于为网络中各告警源设置告警源重要级别并保存;
所述接收单元,用于接收告警源因检测到网络故障或疑似故障而发送的告警;
所述获取单元,用于分析所述接收单元接收的告警并获取该告警的告警源和告警级别;
所述查找单元,用于根据所述获取单元获取的告警源在所述配置单元中查找到预先设置的对应告警源重要级别;
所述确定单元,用于通过所述查找单元查找到的告警源重要级别和所述获取单元获取的告警级别确定告警排序因子,并根据该告警排序因子确定该告警在未处理的告警中的排序位置。
综上所述,本发明中网络管理系统利用预先设置的告警源重要级别结合告警级别确定告警排序因子,根据确定的告警排序因子确定该告警在未处理的告警中排序位置,能够提高告警处理效率,及重要业务的总体可用性水平。
附图说明
图1为本发明实施例中告警排序方法流程示意图;
图2为告警排序装置结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。
参见图1,图1为本发明实施例中告警排序方法流程示意图。具体步骤为:
步骤101,网络管理系统为网络中各告警源设置告警源重要级别并保存。
本步骤中,告警源表示哪个网络设备、接口发出的告警;告警源重要级别设置为一个数值,级别越高表示对业务的影响的重要程度越高。告警源级别一般设置为整数,为了达到微调的效果也可以设置为实数,如5.2等。
步骤102,网络管理系统接收告警源因检测到网络故障或疑似故障而发送的告警,分析该告警并获取该告警的告警源和告警级别。
本步骤中告警源检测到网络故障或疑似故障,如设备接口DOWN或者设备CPU利用率长时间高位运行等。告警源将这些信息放入告警中,并通过网络向网络管理系统上报,上报告警的网络协议可以为SYSLOG或者SNMP通知等标准告警,也可以为自定义的私有协议。
步骤103,网络管理系统根据获取的告警源查找到保存的对应告警源重要级别。
步骤104,网络管理系统通过查找到的告警源重要级别和获取的告警级别确定告警排序因子,并根据该告警排序因子确定该告警在未处理的告警中的排序位置。
本步骤中新收到的告警根据自身的告警排序因子,确定在未处理的告警中的排序位置,将该告警插入到排序告警中合适的位置。
步骤101中为告警源预先设置告警源重要级别的方法为:
根据对业务影响的程度,和/或网络管理员职责的不同为告警源预先设置告警源重要级别。
由于实际环境中,网络管理员分工不同,导致各自需要重点关注的告警是不一样的,针对这种情况,网络管理系统可以为每个网络管理员独立设置告警源对应的告警源重要级别,这样告警在呈现给不同的网络管理员时可以使用各自对应的告警源重要级别来计算告警排序因子,而从获得个性化的排序结果。
在具体实现中,有些标准中告警级别越小表示重要性越高。若确定告警源的告警级别越小表示重要性越高,则按预设规则将该告警级别进行转换,转换为告警级别越大表示重要性越高的相应值。
若各告警源在表示告警级别和重要性的标准不同时,在确定告警排序因子之前统一为告警级别越大重要性越高,告警级别转换的规则由网络管理系统预先设定,也可以根据实际情况进行修改。
因此为告警源预先设置告警源重要级别,还根据网络管理员职责的不同进行设置。
网络管理系统接收到告警,从告警信息中解析出告警源和告警级别,针对无法直接解析出告警源或者告警级别的告警,则通过告警中包含的某些信息进行推断并获取到所需告警源和告警级别。网络管理系统可以通过告警中包含的某些信息进行推断并获取到所需的信息。
通过查找到的告警源重要级别和获取的告警级别确定告警排序因子的方法为:
告警排序因子为告警源重要级别与告警级别的乘积;
或,告警排序因子为告警源重要级别与告警级别分别加权后求和。
其中,对告警源重要级别与告警级别加权可以根据实际应用情况确定谁起到的影响更大,则所加权值就大一些。
下面结合具体实施例,详细介绍本发明告警排序方法的实施过程。
本实施例中告警源为网络设备A在以太接口0上报告警。
网络设备A检测到其以太接口0状态变为DOWN。网络设备将这此信息加入告警M中,该告警以Syslog协议封装,并通过网络向网络管理系统上报,告警内容如下:
<59>Oct 4 10:34:15 128.255.1.1 PPP:mp/v1/Router/MP1700Interface_down:The interface‘1’:‘fastethernet0’changed status to down
网络管理系统接收到告警M,由于告警采用Syslog协议封装,因此其格式是固定。从标准的Syslog Header部分就可以解析其告警级别为3,而告警源为128.255.1.1,由于Syslog标准中定义的告警级别总共为8级,且越小表示越重要,因此需要将告警级别3进行转换,假设网络管理系统中的告警级别定义为100级,则转换结果为(8-3)×100/8=62.5。
网络管理系统根据获得的告警源128.255.1.1,查询出之前准备过程中保存的告警源重要级别,这里假设预先对告警源128.255.1.1设置的告警源重要级别为5。
网络管理系统根据告警源重要级别和告警级别信息计算该告警对应的告警排序因子,其计算结果为:告警排序因子=5×62.5=312.5。
网络管理系统根据告警排序因子将该告警插入到现有告警列表中,并呈现给网络管理员。
基于同样的发明构思,本发明还提出一种告警排序装置。参见图2,图2为告警排序装置结构示意图。该装置包括:配置单元201、接收单元202、获取单元203、查找单元204和确定单元205。
配置单元201,用于为网络中各告警源设置告警源重要级别并保存。
接收单元202,用于接收告警源因检测到网络故障或疑似故障而发送的告警。
获取单元203,用于分析接收单元202接收的告警并获取该告警的告警源和告警级别。
查找单元204,用于根据获取单元203获取的告警源在配置单元201中查找到预先设置的对应告警源重要级别。
确定单元205,用于通过查找单元204查找到的告警源重要级别和获取单元203获取的告警级别确定告警排序因子,并根据该告警排序因子确定该告警在未处理的告警中的排序位置。
较佳地,该装置进一步包括:转换单元206
配置单元设置的告警源重要级别越大表示重要性越高。
转换单元206,用于若告警源的告警级别越小表示重要性越高,则按预设规则将获取单元203获取的告警级别进行转换,转换为告警级别越大表示重要性越高的相应值,并替换获取单元203获取的告警级别。
较佳地,
配置单元201,用于根据对业务影响的程度,和/或,网络管理员职责的不同为告警源预先设置告警源重要级别。
较佳地,
获取单元203,用于从接收单元202接收的告警中解析出告警源和告警级别;
或,通过接收单元202接收的告警中包含的信息进行推断并获取告警源和告警级别。
较佳地,
确定单元205,用于确定告警排序因子为告警源重要级别与告警级别的乘积;
或,告警排序因子为告警源重要级别与告警级别分别加权后求和。
上述实施例的单元可以集成于一体,也可以分离部署;可以合并为一个单元,也可以进一步拆分成多个子单元。
综上所述,本发明具体实施例中网络管理系统利用预先设置的告警源重要级别结合告警级别确定告警排序因子,并对未处理的告警进行排序,从而将网络中影响重要业务的告警源的告警优先呈现给网络管理员,让网络管理员能够优先关注并处理这些告警,能够提高告警处理效率,及重要业务的总体可用性水平。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种告警排序方法,其特征在于,预先为网络中各告警源设置告警源重要级别并保存,所述方法包括:
接收告警源因检测到网络故障或疑似故障而发送的告警,分析所述告警并获取所述告警的告警源和告警级别;
根据所述获取的告警源查找到预先设置的对应告警源重要级别;
通过所述查找到的告警源重要级别和所述获取的告警级别确定告警排序因子,并根据该告警排序因子确定该告警在未处理的告警中的排序位置。
2.根据权利要求1所述的方法,其特征在于,
所述预设的告警源重要级别越大表示重要性越高;
所述获取告警级别之后,所述方法进一步包括:
若确定所述告警源的告警级别越小表示重要性越高,则按预设规则将该告警级别进行转换,转换为告警级别越大表示重要性越高的相应值。
3.根据权利要求1所述的方法,其特征在于,
所述为告警源预先设置告警源重要级别的方法为:
根据对业务影响的程度,和/或,网络管理员职责的不同为告警源预先设置告警源重要级别。
4.根据权利要求1所述的方法,其特征在于,所述获取所述告警的告警源和告警级别的方法为:
从所述告警中解析出告警源和告警级别;
或,通过所述告警中包含的信息进行推断并获取告警源和告警级别。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述通过所述查找到的告警源重要级别和所述获取的告警级别确定告警排序因子的方法为:
告警排序因子为告警源重要级别与告警级别的乘积;
或,告警排序因子为告警源重要级别与告警级别分别加权后求和。
6.一种告警排序装置,其特征在于,所述装置包括:配置单元、接收单元、获取单元、查找单元和确定单元;
所述配置单元,用于为网络中各告警源设置告警源重要级别并保存;
所述接收单元,用于接收告警源因检测到网络故障或疑似故障而发送的告警;
所述获取单元,用于分析所述接收单元接收的告警并获取该告警的告警源和告警级别;
所述查找单元,用于根据所述获取单元获取的告警源在所述配置单元中查找到预先设置的对应告警源重要级别;
所述确定单元,用于通过所述查找单元查找到的告警源重要级别和所述获取单元获取的告警级别确定告警排序因子,并根据该告警排序因子确定该告警在未处理的告警中的排序位置。
7.根据权利要求6所述的装置,其特征在于,所述装置进一步包括:转换单元;
所述配置单元设置的告警源重要级别越大表示重要性越高;
所述转换单元,用于若所述告警源的告警级别越小表示重要性越高,则按预设规则将该告警级别进行转换,转换为告警级别越大表示重要性越高的相应值,并替换所述获取单元获取的告警级别。
8.根据权利要求6所述的装置,其特征在于,
所述配置单元,用于根据对业务影响的程度,和/或,网络管理员职责的不同为告警源预先设置告警源重要级别。
9.根据权利要求6所述的装置,其特征在于,
所述获取单元,用于从所述接收单元接收的告警中解析出告警源和告警级别;
或,通过所述接收单元接收的告警中包含的信息进行推断并获取告警源和告警级别。
10.根据权利要求6-9任意一项所述的装置,其特征在于,
所述确定单元,用于确定告警排序因子为告警源重要级别与告警级别的乘积;
或,告警排序因子为告警源重要级别与告警级别分别加权后求和。
CN201110346491A 2011-11-04 2011-11-04 一种告警排序方法和装置 Pending CN102333002A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110346491A CN102333002A (zh) 2011-11-04 2011-11-04 一种告警排序方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110346491A CN102333002A (zh) 2011-11-04 2011-11-04 一种告警排序方法和装置

Publications (1)

Publication Number Publication Date
CN102333002A true CN102333002A (zh) 2012-01-25

Family

ID=45484612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110346491A Pending CN102333002A (zh) 2011-11-04 2011-11-04 一种告警排序方法和装置

Country Status (1)

Country Link
CN (1) CN102333002A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104468169A (zh) * 2013-09-23 2015-03-25 中兴通讯股份有限公司 基于站点状态的运维监控方法、装置、设备及系统
CN104468166A (zh) * 2013-09-18 2015-03-25 中兴通讯股份有限公司 一种告警处理优先级确定方法及系统
CN104714732A (zh) * 2013-12-17 2015-06-17 深圳市伊爱高新技术开发有限公司 一种报警显示方法
WO2015131744A1 (zh) * 2014-10-10 2015-09-11 中兴通讯股份有限公司 网络设备告警上报的方法及网络设备
WO2016086705A1 (zh) * 2014-12-02 2016-06-09 中兴通讯股份有限公司 一种实现故障定位的方法和服务器
WO2016131284A1 (zh) * 2015-07-13 2016-08-25 中兴通讯股份有限公司 一种告警管理方法及装置、通信系统
CN105991337A (zh) * 2015-03-02 2016-10-05 中国移动通信集团广东有限公司 一种告警压缩方法及告警压缩装置
CN107547262A (zh) * 2017-07-25 2018-01-05 新华三技术有限公司 告警级别的生成方法、装置和网管设备
CN107800553A (zh) * 2016-09-05 2018-03-13 中兴通讯股份有限公司 一种管理设备故障的方法和装置
CN107995149A (zh) * 2016-10-26 2018-05-04 北京国双科技有限公司 异常消息的处理方法和装置
CN110011843A (zh) * 2019-03-29 2019-07-12 网宿科技股份有限公司 告警信息处理方法、电子设备和存储介质
CN112751707A (zh) * 2020-12-29 2021-05-04 北京格林威尔科技发展有限公司 一种基于sdn、nfv技术的告警信息输出方法和装置
CN114095332A (zh) * 2021-11-11 2022-02-25 建信金融科技有限责任公司 信息处理方法、装置、设备及计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101145969A (zh) * 2007-10-25 2008-03-19 中兴通讯股份有限公司 一种减少网元上报告警数量的方法及系统
CN101340487A (zh) * 2007-07-03 2009-01-07 大唐软件技术股份有限公司 服务开通过程中的管理方法和系统
US20090193436A1 (en) * 2008-01-30 2009-07-30 Inventec Corporation Alarm display system of cluster storage system and method thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101340487A (zh) * 2007-07-03 2009-01-07 大唐软件技术股份有限公司 服务开通过程中的管理方法和系统
CN101145969A (zh) * 2007-10-25 2008-03-19 中兴通讯股份有限公司 一种减少网元上报告警数量的方法及系统
US20090193436A1 (en) * 2008-01-30 2009-07-30 Inventec Corporation Alarm display system of cluster storage system and method thereof

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104468166A (zh) * 2013-09-18 2015-03-25 中兴通讯股份有限公司 一种告警处理优先级确定方法及系统
WO2015039461A1 (zh) * 2013-09-18 2015-03-26 中兴通讯股份有限公司 告警处理优先级确定方法、系统及计算机存储介质
CN104468166B (zh) * 2013-09-18 2019-07-19 中兴通讯股份有限公司 一种告警处理优先级确定方法及系统
CN104468169A (zh) * 2013-09-23 2015-03-25 中兴通讯股份有限公司 基于站点状态的运维监控方法、装置、设备及系统
WO2015039468A1 (zh) * 2013-09-23 2015-03-26 中兴通讯股份有限公司 基于站点状态的运维监控方法、装置、设备及系统
CN104468169B (zh) * 2013-09-23 2019-01-18 中兴通讯股份有限公司 基于站点状态的运维监控方法、装置、设备及系统
CN104714732A (zh) * 2013-12-17 2015-06-17 深圳市伊爱高新技术开发有限公司 一种报警显示方法
WO2015131744A1 (zh) * 2014-10-10 2015-09-11 中兴通讯股份有限公司 网络设备告警上报的方法及网络设备
WO2016086705A1 (zh) * 2014-12-02 2016-06-09 中兴通讯股份有限公司 一种实现故障定位的方法和服务器
CN105721180A (zh) * 2014-12-02 2016-06-29 中兴通讯股份有限公司 一种实现故障定位的方法和服务器
CN105721180B (zh) * 2014-12-02 2019-06-07 中兴通讯股份有限公司 一种实现故障定位的方法和服务器
CN105991337A (zh) * 2015-03-02 2016-10-05 中国移动通信集团广东有限公司 一种告警压缩方法及告警压缩装置
WO2016131284A1 (zh) * 2015-07-13 2016-08-25 中兴通讯股份有限公司 一种告警管理方法及装置、通信系统
CN107800553A (zh) * 2016-09-05 2018-03-13 中兴通讯股份有限公司 一种管理设备故障的方法和装置
CN107995149A (zh) * 2016-10-26 2018-05-04 北京国双科技有限公司 异常消息的处理方法和装置
CN107547262A (zh) * 2017-07-25 2018-01-05 新华三技术有限公司 告警级别的生成方法、装置和网管设备
CN107547262B (zh) * 2017-07-25 2021-07-06 新华三技术有限公司 告警级别的生成方法、装置和网管设备
CN110011843A (zh) * 2019-03-29 2019-07-12 网宿科技股份有限公司 告警信息处理方法、电子设备和存储介质
CN112751707A (zh) * 2020-12-29 2021-05-04 北京格林威尔科技发展有限公司 一种基于sdn、nfv技术的告警信息输出方法和装置
CN112751707B (zh) * 2020-12-29 2023-04-18 北京格林威尔科技发展有限公司 一种基于sdn、nfv技术的告警信息输出方法和装置
CN114095332A (zh) * 2021-11-11 2022-02-25 建信金融科技有限责任公司 信息处理方法、装置、设备及计算机存储介质

Similar Documents

Publication Publication Date Title
CN102333002A (zh) 一种告警排序方法和装置
CN103544093B (zh) 监控报警控制方法及其系统
US10225165B2 (en) Apparatus and method for processing data streams in a communication network
US8144599B2 (en) Binary class based analysis and monitoring
US20150142940A1 (en) Methods, systems, and computer readable media for a network function virtualization information concentrator
US20090238088A1 (en) Network traffic analyzing device, network traffic analyzing method and network traffic analyzing system
CN114630352B (zh) 一种接入设备的故障监测方法和装置
CN105159964A (zh) 一种日志监控方法及系统
CN112491593B (zh) 网元告警处理方法和装置
CN106209405A (zh) 故障诊断方法及装置
CN103414596A (zh) 基于简单管理网络协议识别所有厂商Trap及处理的方法
CN110430159B (zh) 一种平台服务器防火墙策略开放范围过大预警方法
CN104639386B (zh) 故障定位系统和方法
CN112491579A (zh) 一种基于sdn的处理告警信息的方法及设备
CN107360035B (zh) 一种数据处理方法及系统
US8826296B2 (en) Method of supervising a plurality of units in a communications network
US9674065B2 (en) Method, apparatus and system for detecting network element load imbalance
CN108199906B (zh) 一种sdn构架中异常流量处理方法、装置和用户终端
JP6078485B2 (ja) 運用履歴分析装置及び方法及びプログラム
CN105187490B (zh) 一种物联网数据的中转处理方法
CN110661660A (zh) 告警信息根源分析方法及装置
CN106506194A (zh) 通过snmp协议自动识别不同类型或型号设备告警的方法
CN103297281A (zh) 一种电力专用业务通道运行状态监测的方法和系统
CN112291185B (zh) 一种采集网络数据的方法和装置
KR100933991B1 (ko) 네트워크 장애 관리 시스템 및 그 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120125