CN103856344B - 一种告警事件信息处理方法及装置 - Google Patents

一种告警事件信息处理方法及装置 Download PDF

Info

Publication number
CN103856344B
CN103856344B CN201210518655.9A CN201210518655A CN103856344B CN 103856344 B CN103856344 B CN 103856344B CN 201210518655 A CN201210518655 A CN 201210518655A CN 103856344 B CN103856344 B CN 103856344B
Authority
CN
China
Prior art keywords
alarm
warning value
alarm event
prediction
event information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210518655.9A
Other languages
English (en)
Other versions
CN103856344A (zh
Inventor
方梅晶
赵贺
王春艳
丁健
杨海威
姜宏岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Beijing Co Ltd
Original Assignee
China Mobile Group Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Beijing Co Ltd filed Critical China Mobile Group Beijing Co Ltd
Priority to CN201210518655.9A priority Critical patent/CN103856344B/zh
Publication of CN103856344A publication Critical patent/CN103856344A/zh
Application granted granted Critical
Publication of CN103856344B publication Critical patent/CN103856344B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种告警事件信息处理方法及装置,主要内容包括:采集告警事件信息,确定告警事件信息中的告警时间和告警值,根据确定的预测模型参数和设定的预测模型对告警事件信息中包括的告警时间和告警值进行处理,获得与网元对应的预测时长,所述预测时长是网元的告警事件类型所表示的告警事件由告警值变化为设定告警值需要的时间长度的估计值;根据告警值确定网元对应的告警级别;在告警级别达到设定级别时,输出包含预测时长的告警信息。由于本发明实施例的方案对由告警值变化为设定告警值需要的时间长度的进行了估计并在告警消息中进行输出,因此,使得告警维护人员可以准确获知网元的告警值的动态变化趋势,提高了告警信息输出的有效性。

Description

一种告警事件信息处理方法及装置
技术领域
本发明涉及网络管理技术领域,尤其涉及一种告警事件信息处理方法及装置。
背景技术
通信网络由多个通信设备构成,为了实现整个网络的正常运行,需要对各个通信设备进行网络监控。网络监控技术就是对被监控设备的软件及硬件的运行情况、任务执行情况等进行记录或远程查看,以了解其各项指标是否正常,被监控设备的某个物理设备或逻辑模块出现异常时,会发送用于传递故障信息的事件报告,这种事件报告称为告警信息。
具体实现上述功能的告警系统如图1所示,该告警系统包括:被监控网元侧的告警代理服务器(Agent)11和告警监控设备12,该系统的工作流程包括以下步骤:
第一步:被管网元侧的告警代理服务器根据告警监控设备既定的规则进行告警指标的轮询检测。
第二步:当指标的检测值超出某一个既定的阈值后,被管网元侧的告警代理服务器以事件的形式向告警监控设备上报告警事件信息,该告警事件信息包含告警网元信息、告警指标、告警值。
第三步:告警监控设备接收到告警事件信息后,确定告警级别,参照既定处理规则触发告警信息,该告警信息包括告警网元信息、告警指标、告警值和告警等级。
告警监控设备中对告警级别的定义一般分为一般告警、中等告警、严重告警和重大告警等几个级别。不同告警指标的阀值取值可以不同,比较传统的阀值定义为一般告警(告警指标全量的80%)、中等告警(告警指标全量的85%)、严重告警(告警指标全量的90%)、重大告警(告警指标全量的95%)。
第四步:根据告警等级的不同,告警系统将告警消息通过不同的通信形式通知给告警维护人员。
举例来说:对于主机的文件系统告警,告警阀值定义一般如下占用率超过85%后触发中等告警;超过90%触发严重告警;超过95%触发重大告警;当告警系统检测到文件系统超过85%(中等告警)和90%(严重告警)时,触发短信提醒;当达到95%(重大告警)时,触发值班平台进行电话告警通知。
然而,上述告警系统使用的基于事件触发的固定阈值告警模式,由于1)使用统一的固定阀值,会产生大量的垃圾告警信息(一般告警和中等告警),但如果直接过滤掉这些低级别告警,也有可能一些潜在的告警会被忽略;2)同一监控指标,其变化率具有一定的随机性和突发性。对某些异常情况,所产生一般告警、中等告警时并未引起足够的重视,而从一般/中等告警发展到严重告警的实际时长比往常正常情况要短许多,达到严重告警时再处理很可能来不及;3)告警内容往往只是某个时间点的告警值,给出的信息量不足以协助管理员进行更进一步的判断;因此存在告警信息输出的有效性不高的问题。
发明内容
本发明实施例提供了一种告警事件信息处理方法及装置,用以解决现有的技术中输出的告警信息的有效性不高的问题。
本发明实施例提供的具体技术方案如下:
一种告警事件信息处理方法,所述方法包括:
告警事件信息处理装置采集告警事件信息,确定告警事件信息中的告警时间和告警值,所述告警事件信息中包含网元标识ID、该网元ID所表示的网元的告警事件类型、告警时间和该告警事件类型所表示的告警事件的告警值;
告警事件信息处理装置根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长,所述预测时长是所述网元的告警事件类型所表示的告警事件由所述告警值变化为设定告警值需要的时间长度的估计值,所述设定的预测模型确定了告警时间和告警值之间的函数关系,所述预测模型参数是根据之前保存的告警事件信息中的告警时间和告警值确定的;
告警事件信息处理装置根据告警值确定所述网元ID所表示的网元对应的告警级别;
告警事件信息处理装置在告警级别达到设定级别时,输出告警信息,所述告警信息中包含网元ID、告警事件类型、告警时间、告警值和预测时长。
一种告警事件信息处理装置,所述装置包括:
采集模块,用于采集告警事件信息,确定告警事件信息中的告警时间和告警值,所述告警事件信息中包含网元标识ID、该网元ID所表示的网元的告警事件类型、告警时间和该告警事件类型所表示的告警事件的告警值;
预测时长确定模块,用于根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长,所述预测时长是所述网元的告警事件类型所表示的告警事件由所述告警值变化为设定告警值需要的时间长度的估计值,所述设定的预测模型确定了告警时间和告警值之间的函数关系,所述预测模型参数是根据之前保存的告警事件信息中的告警时间和告警值确定的;
告警级别确定模块,用于根据确定的所述告警值确定所述网元ID所表示的网元对应的告警级别;
告警信息输出模块,用于在告警级别达到设定级别时,输出告警信息,所述告警信息中包含网元ID、告警事件类型、告警时间、告警值和预测时长。
本发明通过根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长,并在告警达到设定级别时,输出包含用于表示告警事件由告警值变化为设定告警值需要的时间长度的估计值的预测时长,使得维护人员可以根据该预测时长来准确的确定告警事件的紧急程度,进而对该告警事件进行处理,也就是说,提高了告警信息输出的有效性。
附图说明
图1为背景技术中的告警系统结构示意图;
图2为本发明实施例一中的告警信息处理方法流程示意图;
图3为本发明实施例一中告警状态机模型示意图;
图4为本发明实施例三中的告警事件信息处理装置结构示意图。
具体实施方式
下面结合说明书附图,对本发明实施例提供的告警信息处理方法及装置的具体实施方式进行说明。
实施例一
如图2所示,为本发明实施例一的告警信息处理方法流程图,所述方法包括以下步骤:
步骤101:告警事件信息处理装置采集告警事件信息,确定告警事件信息中的告警时间和告警值。
所述告警事件信息中包含网元标识ID、该网元ID所表示的网元的告警事件类型、告警时间和该告警事件类型所表示的告警事件的告警值。
所述告警事件信息可以是从告警监控设备中采集的,告警监控设备可以对网元的状况进行监控,在大于设定的告警阈值时,输出告警事件信息。
步骤102:告警事件信息处理装置根据确定的预测模型参数和设定的预测模型对确定的所述告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长;
所述设定的预测模型确定了告警时间和告警值之间的函数关系,所述预测模型参数是根据之前保存的告警事件信息中的告警时间和告警值确定的;
所述预测时长是所述网元的告警事件类型所表示的告警事件由告警值变化为设定告警值需要的时间长度的估计值。
所述设定告警值可以根据实际需求进行设定,例如设置为被监控网元所能达到的最大告警值。
本步骤102中在需要监控的网元或网元的告警事件类型较多时,可以设置一用于定义需管理和监控的告警事件信息的历史告警事件信息的数据库,建立历史告警事件信息库,在该历史告警事件信息库中定义某次产生的告警事件信息,可以包括网元ID、告警事件类型、告警采集时间、告警值。其中,告警采集时间也即为告警时间。
以某一文件系统的告警事件信息为例,其历史告警事件信息可以如表(1)所示:
网元ID FileSystem-001
告警类型 文件系统利用率
告警采集时间 2012-5-25 11:30:02
告警值 87.3%
表(1)
具体地,所述预测时长包括第一预测时长和第二预测时长,所述第一预测时长是所述所述告警事件类型所表示的告警事件由所述告警值以正常的变化速度变化为设定告警值需要的时间长度的估计值;所述第二预测时长是所述告警事件由告警值以最快的变化速度变化为设定告警值需要的时间长度的估计值。
在以上述表(1)中的告警事件信息为例时,所述设定告警值可以设置为100%。
此外,本实施例中的预测时长还可以包括第三预测时长,所述第三预测时长是所述告警事件由告警值以最慢的变化速度变化为设定告警值需要的时间长度的估计值。
所述最慢的变化速度、正常的变化速度和最快的变化速度可以利用记录的历史告警事件信息中的告警时间和告警值来确定。
进一步地,所述设定的模型包括线性拟合预测模型和最劣情况预测模型,根据确定的线性拟合模型参数和线性拟合模型对所述告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的第一预测时长;根据确定的最劣情况预测模型参数和最劣情况预测模型对所述告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的第二预测时长。
更进一步地,所述线性拟合预测模型可以为公式(1),所述最劣情况预测模型可以为公式(2):
K=A+p×T (1)
K=B+p'×T (2)
其中:T为告警时间,K为告警值、A为线性拟合截距,B为最劣情况拟合截距,p为线性拟合增长率,可以通过公式(3)获得;p'为最劣情况增长率,可以通过公式(4)获得。
p'=max[(Kj-Ki)/(Tj-Ti)] (4)
其中,在告警时间Ti时,告警值为Ki,n为计算p所使用告警事件信息的条数,max表示取最大值。
上述公式(3)也即为对公式(1)和历史告警事件信息中的最近n次告警事件信息中包含的[Ti,Ki]数据对利用高斯最小二乘法求解获得的,n的值可以根据经验值确定。
上述公式(4)可以在本次采集告警事件信息后,可以利用本次采集的告警事件信息中的告警时间Tj和告警值Kj,也即[Tj,Kj],分别计算其与历史采集的各告警事件信息中包含的告警时间Ti和告警值Ki,也即[Ti,Ki]间的变化率(也即两点间的斜率)。
在已知上述预测模型参数和预测模型后,可以利用公式(5)获得第一预测时长,利用公式(6)获得第二预测时长。
T'=(Kf-Kn)/p (5)
T”=(Kf-Kn)/p' (6)
其中:上述Kn为告警值,Kf为设定告警值,T'为第一预测时长,T”为第二预测时长。
具体的,上述公式(5)的推导过程如下:
假设达到设定告警值Kf的时刻为Tf,那么将[Tf,Kf]带入公式(1)得到Kf=A+p×Tf;由于告警时间Tn的告警值为Kn,那么将[Tn,Kn]带入公式(1)得到Kn=A+p×Tn;则T'=Tf-Tn=(Kf-Kn)/p;
上述公式(5)还可以直接通过将告警值Kn作为线性拟合截距,构建线性拟合函数K=Kn+p×T',进而K赋值为设定告警值Kf直接推出T'=(Kf-Kn)/p;
上述公式(6)与上述公式(5)的过程类似,这里不再赘述。
进一步的,在需要监控的网元或网元的告警事件类型较多时,可以设置一用于存储告警模型参数的数据库,在该告警模型参数中记录最近一次确定的告警模型参数信息,可以包括网元ID、告警事件类型、最近告警采集时间、最近告警值、p、p'。
以某一文件系统的告警模型参数为例,其告警模型参数信息可以如表(2)所示:
告警网元ID FileSystem-001
告警事件类型 文件系统利用率
最近告警时间 2012-5-25 11:30:02
最近告警值 87.3%
线性拟合增长率 0.45
最劣情况增长率 0.8
表(2)
步骤103:告警事件信息处理装置根据确定的所述告警值确定所述网元ID所表示的网元对应的告警级别。
需要说明的是,步骤102和步骤103可以同时进行,也可以依次进行,还可以在步骤101执行完毕后,先执行步骤103,再执行步骤102,然后执行步骤104。
具体的,当监控的网元或网元的告警事件类型较多时,可以设置一用于定义需管理和监控的告警事件信息的告警事件信息配置库数据模型,建立告警事件信息配置库,在该告警事件信息配置库中定义包括网元ID、告警名称、告警事件类型、告警描述、一般告警阈值、中等告警阈值、严重告警阈值等信息。
以某一文件系统的告警事件信息为例,其告警事件信息配置信息可以如表(3)所示:
网元ID FileSystem-001
告警名称 10.4.144.4/usr
告警事件类型 文件系统利用率
告警描述 /usr的文件系统利用率告警
一般告警阀值 80%
中等告警阀值 90%
严重告警阀值 95%
表(3)
在本步骤103中,可以利用告警事件信息配置库,并根据网元ID及告警事件类型来获得告警配置等级及各等级对应的阈值,将确定的所述告警值与各阈值进行比较,即可得到所述网元ID所表示的网元对应的告警级别。
步骤104:判断所述告警级别是否达到设定级别;若是,则执行步骤105;若否,则执行步骤106。
所述设定级别可以根据实际需求确定,例如:可以设置所述设定级别为最高告警级别或严重告警级别。
步骤105:输出告警信息,所述告警信息中包含网元ID、告警事件类型、告警时间、告警值和预测时长,并执行步骤111。
本步骤105中的预测时长包括第一预测时长和第二预测时长。
步骤106:判断第二预测时长是否小于设定时长,若是跳转至步骤105,若否,则执行步骤107。
所述设定时长可以是根据经验值确定的,可以记录在表(3)中,作为告警事件信息配置信息的一部分。
步骤107:根据第二预测时长确定告警轮询的采集步长,并执行步骤108;
所述采集步长可以记录在表(2)中,作为告警模型参数信息的一部分。
具体地,可以通过但不限于公式(7)中的分段函数来确定:
其中:t1、t2、b为设定的大于0的值,且t1<t2,Δt为采集步长。
例如:所述公式(7)可以具体为下述公式(8):
上述Δt的单位是根据实际情况确定的,可以为秒、分钟等。
步骤108:告警事件信息处理装置以所述采集步长为采集时间间隔采集告警事件信息设定次数,并执行步骤109。
所述设定次数为大于等于1的正整数,可以根据b来确定,b的取值愈大,设定次数愈大,b的取值愈小,设定次数愈小,也可以根据经验值来确定。
步骤109:告警事件信息处理装置利用采集的告警事件信息对所述预测模型参数进行更新;并执行步骤110。
具体的,可以将采用部分历史告警事件信息中包含的告警时间和告警值以及在步骤108中采集的全部告警事件信息中包含的告警时间和告警值代入公式(3)、(4)、(5)和(6)对预测模型参数进行更新。
步骤110:告警事件信息处理装置将更新后的预测模型参数作为确定的预测模型参数,将最近一次采集的告警事件信息中包含的告警时间和告警值作为确定的告警时间和告警值,并跳转至步骤102;
步骤111:利用输出的告警信息对所述预测模型参数进行更新。
由于输出的告警信息中包含用来更新预测模型参数的信息:网元ID、告警事件类型、告警时间和告警值和预测时长,因此,可以利用输出的告警信息,使用步骤102中的方法对预测模型参数进行更新。
本步骤111中对预测模型参数进行更新是为了确保后续准确的确定预测时长。
在假设告警级别包括一般告警、中等告警和严重告警三个告警级别时,上述步骤101至步骤111的主要思想可以用如图3所示的告警状态机模型来表示,图3中的告警状态机包括5个状态,分别为一般告警、中等告警、严重告警、轮询监控(主要体现在步骤107-步骤110)、告警输出。由于在传统的告警状态机(图3中的虚线框部分,包括一般告警、中等告警和严重告警三个状态)上增加了轮询监控和告警输出两个状态,用于控制告警信息的输出(当处于一般告警和中等告警状态时,首先进入轮询监控状态,满足告警信息输出条件后再进行告警信息输出),一方面实现了对不满足告警信息输出条件的告警事件信息的有效过滤,另一方面有效的提升了告警的准确性和有效性。
下面通过实施例二中的数据库事务日志利用率告警这一具体例子,对本发明实施例一的方案进行更进一步的说明。
实施例二
假设所述数据库事务日志利用率的告警事件信息配置信息如表(4)所示,告警模型参数信息如表(5)所示,本次采集的告警事件信息如表(6)所示,下面对照实施例一中的步骤对本发明实施例二的具体实施过程进行分析:
告警事件信息配置信息:
网元ID TransLog-001
告警名称 10.4.144.37 VNRDB事务日志
告警事件类型 DB TransLog
告警描述 数据库事务日志利用率
一般告警阀值 50%
中等告警阀值 70%
严重告警阀值 80%
设定时长 8hours=480min
表(4)
告警模型参数信息:
表(5)
本次采集的告警事件信息:
网元ID TransLog-001
告警类型 DB TransLog
告警时间 2012-5-24 11:30:00
告警值 50.3%
表(6)
步骤101:采集到的告警事件信息为网元ID:TransLog-001、告警类型:DBTransLog(表示数据库事务日志利用率)、告警时间:2012-5-24 11:30:00、告警值:50.3%。
步骤102:根据表(5)所示的预测模型参数和设定的预测模型,按照最劣情况增长率0.0005构建最劣情况预测模型K=50.3%+0.0005×T”,由告警值50.3%劣化到设定告警值100%所用时间为:T”=(100%-50.3%)/0.0005=994分钟;按照线性拟合增长率0.00035构建线性拟合预测模型K=50.3%+0.00035×T',由告警值50.3%劣化到设定告警值100%所用时间为:T'=(100%-50.3%)/0.00035=1420分钟。
步骤103:由告警值50.3%,结合告警事件信息配置信息中的各告警级别的阈值,确定出网元ID所表示的网元对应的告警级别为一般告警。
步骤104:判断出告警级(即一般告警级别)别没有达到设定的严重告警级别,执行步骤106。
步骤106:判断第二预测时长(994分钟)大于设定时长(480分钟),执行步骤107。
步骤107:首次告警轮询的采集步长可以参照预测模型参数(表(5))中的步长,即△t=5分钟;
步骤108:5分钟后采集该告警事件参数(这里设定次数为1)采集到的告警事件信息为:网元ID:TransLog-001、告警类型:DB TransLog、告警时间:2012-5-24 11:35:00、告警值:50.53%。
步骤109:进行线性拟合模型参数和最劣情况模型参数更新。
具体为:根据两组数据(T1,K1)=(2012-5-24 11:30:00,50.3%)、(T2,K2)=(2012-5-24 11:35:00,50.53%),参照实施例一中的线性拟合预测模型得到p=0.00046,A=50.53%;
根据两组数据(T1,K1)=(2012-5-24 11:30:00,50.3%)、(T2,K2)=(2012-5-2411:35:00,50.53%),参照实施例一中的最劣情况预测模型得到p'=0.00046,A=50.53%;
步骤110:将更新后的预测模型参数作为确定的预测模型参数,将最近一次采集的告警事件信息中包含的告警时间和告警值作为确定的告警时间和告警值,执行步骤102。
步骤102:利用步骤110中确定的预测模型参数和设定的预测模型对步骤110中确定的告警时间:2012-5-24 11:35:00和告警值:50.53%进行处理,获得第一预测时长为1075分钟、第二预测时长为1075分钟,执行步骤103。
具体处理过程如下:按照最劣情况增长率0.00046构建最劣情况预测模型K=50.53%+0.00046×T”,告警值劣化到100%所用时间为:T”=(100%-50.3%)/0.00046=1075分钟;按照线性拟合增长率0.00046构建线性拟合预测模型K=50.53%+0.00046×T”,告警值劣化到100%所用时间为:T”=(100%-50.53%)/0.00046=1075分钟。
步骤103:由告警值50.53%,参照告警事件信息配置信息,确定出告警级别为一般告警级别,执行步骤104。
步骤104:判断出告警级(即一般告警级别)别没有达到设定的严重告警级别,执行步骤106。
步骤106:判断出T”=1075分钟>480分钟的设定时长,执行步骤107。
步骤107:利用实施例一中的公式(8),由第二预测时长确定告警轮询的采集步长Δt为10.75分钟。
由于T”=1075分钟,由于500min<T<1440min,所以调整动态步长为△t=T/100=10.75分钟,即下次告警轮询时间为t=2012-5-24 11:35:00+10.75=2012-5-24 11:46:10。
假设经过N次循环(假设N=10)后,告警轮询的第十次告警指标为(2012-5-24 13:16:02,60.5%),线性拟合模型参数p=0.00069,最劣情况模型参数p'=0.00094,可得由告警值劣化到100%的第一预测时长为T'=(100%-64.3%)/0.00069=517分钟,第二预测时长为T”=(100%-64.3%)/0.00094=380分钟(380分钟<480分钟门限),进行告警信息输出,输出包含第二预测时长的告警信息,并对预测模型参数进行更新。
此时,可以生成以告警通知短信“10.4.144.37VNRDB事务日志使用率为64.3%并在最近一段时间内持续增长,预估正常情况下517分钟后事务日志将达到100%,最差情况下380分钟后事务日志将达到100%,敬请关注”形式通知告警维护人员。
此次告警信息处理过程过程结束,如果告警不被及时处理,则当事务日志达到70%的中等告警情况下,可以再次触发本发明实施例的对告警事件进行处理的流程。
如果事务日志在循环过程中增长缓慢或者下降,达不到告警条件的话,则一般告警会被过滤,不通知告警人员。
本发明实施例的优点可以从如下示例中看到:
示例1:数据库事务日志使用率:数据库事务日志会由于某个任务异常,造成使用增长率较传统情况大增,并且不同的异常所导致的日志增长率也会有所不同,当事务日志的使用率达到一般告警阀值(例如50%)时,在短时间内很有可能会将事务日志占用完毕。这时候利用本发明实施例的方案就可以提前计算日志达到100%的时间,并据此动态提升告警的关注级别,通过告警提前通知(在达到固定阀值的严重级别之前就发出通知),同时将预测时长传达给维护人员。
示例2:表空间使用率:数据库管理员收到表空间使用率严重告警,但此时管理员由于若干原因无法登录系统执行操作(比如不在电脑旁等),利用本发明实施例的方案可以对表空间的增长趋势、何时达到100%进行预测,进而在预测时长较短时,维护人员可以采取相关的应急措施,以防止重大损失发生。
实施例三
基于与实施例一的同一构思,本发明实施例三提供一种告警事件信息处理装置,其结构示意图如图4所示,包括:采集模块21、预测时长确定模块22、告警级别确定模块23和告警信息输出模块24,其中:
采集模块21,用于采集告警事件信息,确定告警事件信息中的告警时间和告警值,所述告警事件信息中包含网元标识ID、该网元ID所表示的网元的告警事件类型、告警时间和该告警事件类型所表示的告警事件的告警值;
预测时长确定模块22,用于根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长,所述预测时长是所述网元的告警事件类型所表示的告警事件由所述告警值变化为设定告警值需要的时间长度的估计值,所述设定的预测模型确定了告警时间和告警值之间的函数关系,所述预测模型参数是根据之前保存的告警事件信息中的告警时间和告警值确定的;
告警级别确定模块23,用于根据确定的所述告警值确定所述网元ID所表示的网元对应的告警级别;
告警信息输出模块24,用于用于在告警级别达到设定级别时,输出告警信息,所述告警信息中包含网元ID、告警事件类型、告警时间、告警值和预测时长。
较优的,所述所述预测时长包括第一预测时长和第二预测时长,所述第一预测时长是所述告警事件由所述告警值以正常的变化速度变化为设定告警值需要的时间长度的估计值;所述第二预测时长是所述告警事件由所述告警值以最快的变化速度变化为设定告警值需要的时间长度的估计值。
较优的,所述告警信息输出模块24,还用于在告警级别未达到设定级别但第二预测时长小于设定时长时,输出告警信息。
较优的,所述告警信息输出模块24,还用于在告警级别未达到设定级别且第二预测时长不小于设定时长时,执行以下操作:根据第二预测时长确定告警轮询的采集步长,以所述采集步长为采集时间间隔采集告警事件信息设定次数,利用采集的告警事件信息对所述预测模型参数进行更新,将更新后的预测模型参数作为确定的预测模型参数,将最近一次采集的告警事件信息中包含的告警时间和告警值作为确定的告警时间和告警值,并触发预测时长确定模块。
本发明实施例三中的设定的预测模型、预测模型参数、预测模型参数的更新过程等参见本发明实施例一或实施例二中的内容,这里不再赘述。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (5)

1.一种告警事件信息处理方法,其特征在于,所述方法包括:
告警事件信息处理装置采集告警事件信息,确定告警事件信息中的告警时间和告警值,所述告警事件信息中包含网元标识ID、该网元ID所表示的网元的告警事件类型、告警时间和该告警事件类型所表示的告警事件的告警值;
告警事件信息处理装置根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长,所述预测时长是所述告警事件类型所表示的告警事件由所述告警值变化为设定告警值需要的时间长度的估计值,所述设定的预测模型确定了告警时间和告警值之间的函数关系,所述预测模型参数是根据之前保存的告警事件信息中的告警时间和告警值确定的;
告警事件信息处理装置根据确定的所述告警值确定所述网元ID所表示的网元对应的告警级别;
告警事件信息处理装置在告警级别达到设定级别时,输出告警信息,所述告警信息中包含网元ID、告警事件类型、告警时间、告警值和预测时长;
其中,所述预测时长包括第一预测时长和第二预测时长,所述第一预测时长是所述告警事件由所述告警值以正常的变化速度变化为设定告警值需要的时间长度的估计值;所述第二预测时长是所述告警事件由所述告警值以最快的变化速度变化为设定告警值需要的时间长度的估计值;
所述方法还包括:
告警事件信息处理装置在告警级别未达到设定级别但第二预测时长小于设定时长时,输出告警信息;
其中,所述设定的预测模型包括线性拟合预测模型和最劣情况预测模型;所述确定的预测模型参数包括确定的线性拟合模型参数和确定的最劣情况预测模型参数;
所述线性拟合预测模型为K=A+p×T;
所述最劣情况预测模型为K=B+p'×T;
其中:T为告警时间,K为告警值、p为线性拟合增长率,A为线性拟合截距,B为最劣情况拟合截距,p'为最劣情况增长率,在告警时间为Ti时,告警值为Ki
所述方法还包括:
告警事件信息处理装置在告警级别未达到设定级别且第二预测时长不小于设定时长时,执行以下操作:
告警事件信息处理装置根据第二预测时长确定告警轮询的采集步长;
告警事件信息处理装置以所述采集步长为采集时间间隔采集告警事件信息设定次数;
告警事件信息处理装置利用采集的告警事件信息对所述预测模型参数进行更新;
告警事件信息处理装置将更新后的预测模型参数作为确定的预测模型参数,将最近一次采集的告警事件信息中包含的告警时间和告警值作为确定的告警时间和告警值,并执行所述告警事件信息处理装置根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理的步骤。
2.如权利要求1所述的方法,其特征在于,告警事件信息处理装置根据确定的线性拟合模型参数和设定的线性拟合模型对所述告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的第一预测时长;告警事件信息处理装置根据确定的最劣情况预测模型参数和最劣情况预测模型对所述告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的第二预测时长。
3.如权利要求2所述的方法,其特征在于,
线性拟合增长率p,通过公式获得;最劣情况增长率p',通过公式p'=max[(Kj-Ki)/(Tj-Ti)]获得,n为计算p所使用告警事件信息的条数,max表示取最大值;
所述告警事件信息处理装置根据确定的线性拟合模型参数和设定的线性拟合模型对所述告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的第一预测时长具体为:
告警事件信息处理装置利用公式T'=(Kf-Kn)/p,获得第一预测时长,其中,Kn为所述告警值,Kf为设定告警值,T'为第一预测时长;
所述告警事件信息处理装置根据确定的最劣情况预测模型参数和设定的最劣情况预测模型对所述告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的第二预测时长具体为:
告警事件信息处理装置利用公式T”=(Kf-Kn)/p',获得第二预测时长,其中,T”为第二预测时长。
4.如权利要求1所述的方法,其特征在于,所述根据第二预测时长确定告警轮询的采集步长,具体为:
根据确定告警轮询的采集步长,其中,t1、t2、b为设定的大于0的值,且t1<t2,T”为第二预测时长,Δt为采集步长。
5.一种告警事件信息处理装置,其特征在于,所述装置包括:
采集模块,用于采集告警事件信息,确定告警事件信息中的告警时间和告警值,所述告警事件信息中包含网元标识ID、该网元ID所表示的网元的告警事件类型、告警时间和该告警事件类型所表示的告警事件的告警值;
预测时长确定模块,用于根据确定的预测模型参数和设定的预测模型对确定的告警时间和告警值进行处理,获得所述网元ID所表示的网元对应的预测时长,所述预测时长是所述网元的告警事件类型所表示的告警事件由所述告警值变化为设定告警值需要的时间长度的估计值,所述设定的预测模型确定了告警时间和告警值之间的函数关系,所述预测模型参数是根据之前保存的告警事件信息中的告警时间和告警值确定的;
告警级别确定模块,用于根据确定的所述告警值确定所述网元ID所表示的网元对应的告警级别;
告警信息输出模块,用于在告警级别达到设定级别时,输出告警信息,所述告警信息中包含网元ID、告警事件类型、告警时间、告警值和预测时长;
其中,所述预测时长包括第一预测时长和第二预测时长,所述第一预测时长是所述告警事件由所述告警值以正常的变化速度变化为设定告警值需要的时间长度的估计值;所述第二预测时长是所述告警事件由所述告警值以最快的变化速度变化为设定告警值需要的时间长度的估计值;
所述告警信息输出模块,还用于在告警级别未达到设定级别但第二预测时长小于设定时长时,输出告警信息;
其中,所述设定的预测模型包括线性拟合预测模型和最劣情况预测模型;所述确定的预测模型参数包括确定的线性拟合模型参数和确定的最劣情况预测模型参数;
所述线性拟合预测模型为K=A+p×T;
所述最劣情况预测模型为K=B+p'×T;
其中:T为告警时间,K为告警值、p为线性拟合增长率,A为线性拟合截距,B为最劣情况拟合截距,p'为最劣情况增长率,在告警时间为Ti时,告警值为Ki
其中,所述告警信息输出模块,还用于在告警级别未达到设定级别且第二预测时长不小于设定时长时,执行以下操作:根据第二预测时长确定告警轮询的采集步长,以所述采集步长为采集时间间隔采集告警事件信息设定次数,利用采集的告警事件信息对所述预测模型参数进行更新,将更新后的预测模型参数作为确定的预测模型参数,将最近一次采集的告警事件信息中包含的告警时间和告警值作为确定的告警时间和告警值,并触发预测时长确定模块。
CN201210518655.9A 2012-12-05 2012-12-05 一种告警事件信息处理方法及装置 Active CN103856344B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210518655.9A CN103856344B (zh) 2012-12-05 2012-12-05 一种告警事件信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210518655.9A CN103856344B (zh) 2012-12-05 2012-12-05 一种告警事件信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN103856344A CN103856344A (zh) 2014-06-11
CN103856344B true CN103856344B (zh) 2017-09-15

Family

ID=50863589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210518655.9A Active CN103856344B (zh) 2012-12-05 2012-12-05 一种告警事件信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN103856344B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190327130A1 (en) * 2017-01-03 2019-10-24 Telefonaktiebolaget Lm Ericsson (Publ) Methods, control node, network element and system for handling network events in a telecomunications network
CN108648421A (zh) * 2018-05-09 2018-10-12 北京瑞尔腾普科技有限公司 一种告警方法、装置及系统
CN109672556A (zh) * 2018-11-20 2019-04-23 珠海许继芝电网自动化有限公司 一种事件告警系统
CN109885452B (zh) * 2019-01-23 2023-04-14 平安科技(深圳)有限公司 性能监控方法、装置及终端设备
CN111124840B (zh) * 2019-12-02 2022-02-08 北京天元创新科技有限公司 业务运维中告警的预测方法、装置与电子设备
CN112702194B (zh) * 2020-12-16 2023-04-07 中国联合网络通信集团有限公司 室分小区故障定位方法、装置及电子设备
CN115102834B (zh) * 2022-04-27 2024-04-16 浙江大学 一种变更风险评估方法、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1601239A (zh) * 2004-10-22 2005-03-30 梅特勒-托利多(常州)称重设备系统有限公司 基于灰色理论的称重传感器故障预测方法
CN1617512A (zh) * 2004-11-25 2005-05-18 中国科学院计算技术研究所 一种自适应网络流量预测和异常报警方法
CN101266710A (zh) * 2007-03-14 2008-09-17 中国科学院自动化研究所 一种基于规则的全天候智能视频分析监控方法
CN102111284A (zh) * 2009-12-28 2011-06-29 北京亿阳信通软件研究院有限公司 电信业务量预测方法和装置
CN102148701A (zh) * 2011-01-14 2011-08-10 广东商学院 用于监控系统中监控指标的趋势分析方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1601239A (zh) * 2004-10-22 2005-03-30 梅特勒-托利多(常州)称重设备系统有限公司 基于灰色理论的称重传感器故障预测方法
CN1617512A (zh) * 2004-11-25 2005-05-18 中国科学院计算技术研究所 一种自适应网络流量预测和异常报警方法
CN101266710A (zh) * 2007-03-14 2008-09-17 中国科学院自动化研究所 一种基于规则的全天候智能视频分析监控方法
CN102111284A (zh) * 2009-12-28 2011-06-29 北京亿阳信通软件研究院有限公司 电信业务量预测方法和装置
CN102148701A (zh) * 2011-01-14 2011-08-10 广东商学院 用于监控系统中监控指标的趋势分析方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"移动通信告警关联规则的挖掘";黎文志;《中国优秀硕士学位论文全文数据库信息科技辑》;20060715;I136-149 *

Also Published As

Publication number Publication date
CN103856344A (zh) 2014-06-11

Similar Documents

Publication Publication Date Title
CN103856344B (zh) 一种告警事件信息处理方法及装置
CN103856339B (zh) 一种对告警信息进行压缩的方法和设备
CN102822850B (zh) 作业延迟监视方法以及作业管理装置
CN107888441B (zh) 一种网络流量基线自学习自适应方法
EP3595347B1 (en) Method and device for detecting health state of network element
CN109088775B (zh) 异常监控方法、装置以及服务器
JP2018513457A5 (zh)
CN101741991A (zh) 告警处理方法、装置及系统
WO2012068443A4 (en) Vector-based anomaly detection
CN110169016A (zh) 处理电信网络中网络事件的方法、控制节点、网络元件和系统
JP2010526352A (ja) 統計的な分析を利用した性能障害管理システム及びその方法
EP3430767B1 (en) Method and device for real-time network event processing
CN109040277A (zh) 一种服务器的远程监控方法及装置
CN107423141A (zh) 信息处理方法及装置
WO2014062557A1 (en) Method and apparatus for providing environmental management using smart alarms
CN108809720A (zh) 云数据系统中告警任务的管理方法和装置
CN106468909A (zh) 过程控制警报审核
CN108306997B (zh) 域名解析监控方法及装置
CN111157245B (zh) 一种轨道交通走行部轴承的监管方法及系统
CN113986595A (zh) 一种异常定位方法及装置
CN102820995A (zh) 告警处理方法、装置及系统
EP3187950B1 (en) A method for managing alarms in a control system
CN106294066B (zh) 报警数据处理方法及装置
CN102932170B (zh) 网元负载不均检测处理方法、装置及其系统
CN111078503B (zh) 一种异常监控方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant