CN106161058B - 一种告警分级方法及装置 - Google Patents

一种告警分级方法及装置 Download PDF

Info

Publication number
CN106161058B
CN106161058B CN201510154232.7A CN201510154232A CN106161058B CN 106161058 B CN106161058 B CN 106161058B CN 201510154232 A CN201510154232 A CN 201510154232A CN 106161058 B CN106161058 B CN 106161058B
Authority
CN
China
Prior art keywords
alarm
alarm information
information
long
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510154232.7A
Other languages
English (en)
Other versions
CN106161058A (zh
Inventor
黄兆鹏
聂鑫
梁定安
曹凤龙
霍特
杨波
陶凛然
赵子青
黄伟俊
黄浩宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201510154232.7A priority Critical patent/CN106161058B/zh
Publication of CN106161058A publication Critical patent/CN106161058A/zh
Application granted granted Critical
Publication of CN106161058B publication Critical patent/CN106161058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0609Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on severity or priority

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例公开了一种告警分级方法,及装置,其中方法的实现包括:获取告警信息,以及预置的告警分级规则;依据所述告警分级规则,确定所述告警信息是否属于长期告警或波动告警;所述长期告警为预定时间段内持续发生的告警,所述波动告警为与所述告警信息的源模块以外的其他业务模块无关的告警;若所述告警信息不属于长期告警和波动告警,则确定所述告警信息为关联告警。关联告警是较为重要的告警,是与所述告警信息的源模块以外的其他业务模块有关的告警;在确定关联告警以后,就可以从大量的告警信息中筛选出重要度较高的告警,避免重要告警遗漏以及维护不及时的问题。

Description

一种告警分级方法及装置
技术领域
本发明涉及计算机技术领域,特别涉及一种告警分级方法,及装置。
背景技术
报告是指发生紧急情况,请求加强戒备或援助。告警的目的是为了告知运维人员或者用户,需要处理。但是在很多时候,告警的数量巨大;而告警按照重要程度划分,又分多个级;有一些告警并不一定需要人为干预,因此需要尽快找到重要的告警。
例如,在多模块的应用中,存在访问链路。在本发明实施例中,模块是指一个互联网协议(IP)地址或一组IP地址的集合;访问链路是指同一模块不重复出现的一条访问关系链,如:模块A->模块B->模块C。
在以上实例中告警是指模块的某些运营指标不符合规定的标准;如,磁盘使用100%,等。
由于告警数量较多,特别是在大型系统或参与模块众多的系统中,告警数量极为庞大,面对数量庞大的告警目前难以找到重要的告警,容易出现重要告警遗漏,和维护不及时的问题。
发明内容
本发明实施例提供了一种告警分级方法,及装置,用于以从大量的告警信息中筛选出重要度较高的告警,避免重要告警遗漏以及维护不及时的问题。
一种告警分级方法,包括:
获取告警信息,以及预置的告警分级规则;
依据所述告警分级规则,确定所述告警信息是否属于长期告警或波动告警;所述长期告警为预定时间段内持续发生的告警,所述波动告警为与所述告警信息的源模块以外的其他业务模块无关的告警;
若所述告警信息不属于长期告警和波动告警,则确定所述告警信息为关联告警。
一种告警分级装置,包括:
信息获取单元,用于获取告警信息,以及预置的告警分级规则;
第一分类单元,用于依据所述告警分级规则,确定所述告警信息是否属于长期告警或波动告警;所述长期告警为预定时间段内持续发生的告警,所述波动告警为与所述告警信息的源模块以外的其他业务模块无关的告警;
第二分类单元,用于若所述告警信息不属于长期告警和波动告警,则确定所述告警信息为关联告警。
从以上技术方案可以看出,本发明实施例具有以下优点:关联告警是较为重要的告警,是与所述告警信息的源模块以外的其他业务模块有关的告警;在确定关联告警以后,就可以从大量的告警信息中筛选出重要度较高的告警,避免重要告警遗漏以及维护不及时的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例方法流程示意图;
图2为本发明实施例方法流程示意图;
图3为本发明实施例装置结构示意图;
图4为本发明实施例装置结构示意图;
图5为本发明实施例装置结构示意图;
图6为本发明实施例装置结构示意图;
图7为本发明实施例装置结构示意图;
图8为本发明实施例服务器结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施 例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供了一种告警分级方法,如图1所示,包括:
101:获取告警信息,以及预置的告警分级规则;
以上告警信息是产生的告警的具体内容,包含的参数可以依据需要有所不同,通常来说告警信息可以包含:告警的代码、告警时间、告警的源模块等。在本发明实施例中,告警分级规则,是预置的对告警信息进行分级的规则。
102:依据上述告警分级规则,确定上述告警信息是否属于长期告警或波动告警;上述长期告警为预定时间段内持续发生的告警,上述波动告警为与上述告警信息的源模块以外的其他业务模块无关的告警;
在本实施例中,告警分级规则是将告警信息中属于长期告警或波动告警区分出来的规则,该告警分级规则可以不必直接确定关联告警。由于长期告警和波动告警需要符合的技术指标已经确定,因此本领域技术人员可以依据相应的技术指标制定相应的识别算法形成告警分级规则,因此本发明实施例对告警分级规则不作唯一性限定。
本发明实施例还提供了告警分级规则的具体实现方式,用于更准确的识别出长期告警以及波动告警,具体方案如下:
上述依据上述告警分级规则,确定上述告警信息是否属于长期告警包括:计算上述告警信息在之前的第一预定时间段内的失败率的平均值以及标准差,若上述告警信息的失败率大于上述平均值与预定倍数标准差的和,则确定上述告警信息为长期告警。
以上分类方式充分利用了3sigma(三σ)原则可以准确的识别出长期告警,其中3sigma原则具体如下:
在正态分布中σ代表标准差,μ代表均值x=μ即为图像的对称轴;三σ原则即为:
数值分布在(μ—σ,μ+σ)中的概率为0.6526;
数值分布在(μ—2σ,μ+2σ)中的概率为0.9544;
数值分布在(μ—3σ,μ+3σ)中的概率为0.9974。
在本实施例中,第一预定时间段通常可以是告警信息对应时刻之前的24小时,在后续实施例中第二预定时间段通常可以这顶为告警信息对应时刻之前的48小时。将第二预定时间段设置得比第一预定时间段长会有更好的效果,通常可以设定为大于1的整数倍。上述预定倍数通常可以设定为3,依据3sigma原则,设置得更大或者更小也是可以的,通常不会设定为1因为这样会有较高的误判,另外设置得太高可能出现漏判也没有必要。
本发明实施例还提供了基于长期告警的规律/经验得出的判定的方式,也可以获得较好的准确率,其中,上述依据上述告警分级规则,确定上述告警信息是否属于长期告警包括:确定第二预定时间段内与上述告警信息相同的时刻,是否有上述告警信息,若是,则确定上述告警信息为长期告警。
本发明实施例可以应用于通用应用场景,不过应用于有访问链路的系统中会有更好的效果,具体如下:上述方法应用于具有访问链路的系统中,上述源模块和上述源模块以外的其他业务模块属于上述访问链路。
基于本发明实施例应用于具有访问链路的系统中,本发明实施例还提供了波动告警的确定方案,用于准确确定此种场景下准确确定波动告警,具体如下:上述依据上述告警分级规则,确定上述告警信息是否属于波动告警,包括:以上述源模块为根节点,根据模块访问拓扑进行预定最大深度的搜索,确定上述告警信息对应时刻是否存在非长期告警,若否,则确定为波动告警。
103:若上述告警信息不属于长期告警和波动告警,则确定上述告警信息为关联告警。
在本实施例中,关联告警是较为重要的告警,是与上述告警信息的源模块以外的其他业务模块有关的告警;在确定关联告警以后,就可以从大量的告警信息中筛选出重要度较高的告警,避免重要告警遗漏以及维护不及时的问题。
在本发明实施例中,确定告警信息的分级以后,可以采用标注的方式提示重要度较高的告警,不同分级采用不同的标注方式;由于告警信息可能是海量的,这样的标注方式对运维人员来说可能仍然较为不方便,因此本发明实施例还可以如下:上述告警信息分级完毕后,上述方法还包括:
将属于关联告警的告警信息生成告警报告,并输出上述告警报告。
通过输出关联告警的方式,可以减少运维人员从海量告警中查找关联告警的工作量,可以作为一个更优选的方式。
另外,由于波动告警有可能也需要关注,因此本发明实施例提供了两种可选的方式,方便灵活控制,具体如下:上述方法还包括:
若关联告警的数量少于预定阈值或收到输出波动告警的指示信息,则标记属于波动告警的告警信息,将上述波动告警信息添加到上述告警报告。
基于以上实施例中输出告警报告的不同,本发明实施例给出了如下两个举例,假定告警报告采用数据表的形式输出,前后两种输出结果可以分别参考表1和表2所示:
表1
告警序号 告警信息 标记
1 ... 关联
2 ... 关联
... ... ...
N ... 关联
表2
告警序号 告警信息 标记
1 ... 关联
2 ... 关联
... ... ...
N ... 关联
1 ... 波动
2 ... 波动
... ... ...
M ... 波动
在表2中,波动告警可以重新编号,也可以在关联告警之后连续编号。另,输出的告警报告可以优选采用如表2所示的,将重要告警和次重要告警分开,重要告警在前的排列方式,另外,标注方式可以是增加如表1或表2 所示的标记,也可以采用不同的背景色或者其他方式进行区别,本发明实施例不作唯一性限定。
以下实施例将以服务器一侧实现本发明实施例方案,针对访问链路中的告警信息进行分级,为例进行详细说明。
在后续实施例中,服务器接收到的告警信息类型可以有很多,例如:模调等的告警;并假设告警信息对应的告警的失败率分布为正态分布。可以采用本实施例提供的流程来对告警进行分级,按重要度从低到高依次分为:长期告警,波动告警,关联告警三级。
其中,长期告警,是指一段时间内持续发生的告警。
波动告警,属于突发的告警,但与访问链路中的其他业务模块没有关系。
关联告警,属于突发的告警,但与访问链路中的其他业务模块有关系。
具体如图2所示,包括:
201:收到告警信息,告警信息可以采用告警通知的形式;
202:获取上述告警信息过去24小时的失败率,并计算平均值以及标准值;
203:判断上述告警信息的失败率是否大于平均值+3倍标准差,如果是进入204;否则进入205;
204:确定上述告警信息为长期告警,然后可以结束流程,或进入下一个告警信息的分级;
205:确定过去48小时相同时刻是否也发生过上述告警信息对应的告警,若是进入204;否则进入206;
206:以上述告警信息的源模块为根,根据模块访问拓扑进行最大深度为K的深度搜索;在本步骤中,最大深度优选为2,模块访问拓扑是访问链路中关系链的传播方向涉及的模块;
207:确定搜索的模块是否在上述告警信息产生时刻也有非长期告警,如果否,进入208,如果是,进入209;
208:确定上述告警信息为波动告警,然后可以结束流程,或进入下一个告警信息的分级;
209:确定上述告警信息为关联告警,然后可以结束流程,或进入下一个 告警信息的分级;
对于每一个告警信息的分级都可以采用执行以上流程,因此对于海量的告警信息可以循环执行以上步骤,在对所有告警信息分级完毕后结束流程。以上流程的触发,可以是服务器接收到告警信息,也可以是人为指令触发,或者周期性触发,等。对此本发明实施例不作唯一性限定。
本发明实施例还提供了一种告警分级装置,如图3所示,包括:
信息获取单元301,用于获取告警信息,以及预置的告警分级规则;
第一分类单元302,用于依据上述告警分级规则,确定上述告警信息是否属于长期告警或波动告警;上述长期告警为预定时间段内持续发生的告警,上述波动告警为与上述告警信息的源模块以外的其他业务模块无关的告警;
第二分类单元303,用于若上述告警信息不属于长期告警和波动告警,则确定上述告警信息为关联告警。
以上告警信息是产生的告警的具体内容,包含的参数可以依据需要有所不同,通常来说告警信息可以包含:告警的代码、告警时间、告警的源模块等。在本发明实施例中,告警分级规则,是预置的对告警信息进行分级的规则。
在本实施例中,告警分级规则是将告警信息中属于长期告警或波动告警区分出来的规则,该告警分级规则可以不必直接确定关联告警。由于长期告警和波动告警需要符合的技术指标已经确定,因此本领域技术人员可以依据相应的技术指标制定相应的识别算法形成告警分级规则,因此本发明实施例对告警分级规则不作唯一性限定。
在本实施例中,关联告警是较为重要的告警,是与上述告警信息的源模块以外的其他业务模块有关的告警;在确定关联告警以后,就可以从大量的告警信息中筛选出重要度较高的告警,避免重要告警遗漏以及维护不及时的问题。
本发明实施例还提供了告警分级规则的具体实现方式,用于更准确的识别出长期告警以及波动告警,具体方案如下:
可选地,如图4所示,上述第一分类单元302包括:
计算单元401,用于计算上述告警信息在之前的第一预定时间段内的失败 率的平均值以及标准差;
确定长期单元402,用于若上述告警信息的失败率大于上述平均值与预定倍数标准差的和,则确定上述告警信息为长期告警。
以上分类方式充分利用了3sigma(三σ)原则可以准确的识别出长期告警。在本实施例中,第一预定时间段通常可以是告警信息对应时刻之前的24小时,在后续实施例中第二预定时间段通常可以这顶为告警信息对应时刻之前的48小时。将第二预定时间段设置得比第一预定时间段长会有更好的效果,通常可以设定为大于1的整数倍。上述预定倍数通常可以设定为3,依据3sigma原则,设置得更大或者更小也是可以的,通常不会设定为1因为这样会有较高的误判,另外设置得太高可能出现漏判也没有必要。
本发明实施例还提供了基于长期告警的规律/经验得出的判定的方式,也可以获得较好的准确率,可选地,如图5所示,上述第一分类单元302包括:
分类子单元501,用于确定第二预定时间段内与上述告警信息相同的时刻,是否有上述告警信息,若是,则确定上述告警信息为长期告警。
本发明实施例可以应用于通用应用场景,不过应用于有访问链路的系统中会有更好的效果,具体如下:上述装置应用于具有访问链路的系统中,上述源模块和上述源模块以外的其他业务模块属于上述访问链路。
基于本发明实施例应用于具有访问链路的系统中,本发明实施例还提供了波动告警的确定方案,用于准确确定此种场景下准确确定波动告警,具体如下:上述第一分类单元302,具体用于以上述源模块为根节点,根据模块访问拓扑进行预定最大深度的搜索,确定上述告警信息对应时刻是否存在非长期告警,若否,则确定为波动告警。
在本发明实施例中,确定告警信息的分级以后,可以采用标注的方式提示重要度较高的告警,不同分级采用不同的标注方式;由于告警信息可能是海量的,这样的标注方式对运维人员来说可能仍然较为不方便,因此本发明实施例还可以如下:如图6所示,上述装置还包括:
报告输出单元601,用于在告警信息分级完毕后,将属于关联告警的告警信息生成告警报告,并输出上述告警报告。
通过输出关联告警的方式,可以减少运维人员从海量告警中查找关联告 警的工作量,可以作为一个更优选的方式。
另外,由于波动告警有可能也需要关注,因此本发明实施例提供了两种可选的方式,方便灵活控制,具体如下:上述报告输出单元601,还用于若关联告警的数量少于预定阈值或收到输出波动告警的指示信息,则标记属于波动告警的告警信息,将上述波动告警信息添加到上述告警报告。
本发明实施例还提供了另一种告警分级装置,如图7所示,包括:接收器701、发射器702、处理器703以及存储器704;存储器704可以应用于处理器703在进行数据处理过程中所需的缓存,以及处理结果的存储。
其中,上述处理器704,用于获取告警信息,以及预置的告警分级规则;依据上述告警分级规则,确定上述告警信息是否属于长期告警或波动告警;上述长期告警为预定时间段内持续发生的告警,上述波动告警为与上述告警信息的源模块以外的其他业务模块无关的告警;若上述告警信息不属于长期告警和波动告警,则确定上述告警信息为关联告警。
以上告警信息是产生的告警的具体内容,包含的参数可以依据需要有所不同,通常来说告警信息可以包含:告警的代码、告警时间、告警的源模块等。在本发明实施例中,告警分级规则,是预置的对告警信息进行分级的规则。
在本实施例中,告警分级规则是将告警信息中属于长期告警或波动告警区分出来的规则,该告警分级规则可以不必直接确定关联告警。由于长期告警和波动告警需要符合的技术指标已经确定,因此本领域技术人员可以依据相应的技术指标制定相应的识别算法形成告警分级规则,因此本发明实施例对告警分级规则不作唯一性限定。
在本实施例中,关联告警是较为重要的告警,是与上述告警信息的源模块以外的其他业务模块有关的告警;在确定关联告警以后,就可以从大量的告警信息中筛选出重要度较高的告警,避免重要告警遗漏以及维护不及时的问题。
本发明实施例还提供了告警分级规则的具体实现方式,用于更准确的识别出长期告警以及波动告警,具体方案如下:
上述处理器704,用于依据上述告警分级规则,确定上述告警信息是否属 于长期告警包括:计算上述告警信息在之前的第一预定时间段内的失败率的平均值以及标准差,若上述告警信息的失败率大于上述平均值与预定倍数标准差的和,则确定上述告警信息为长期告警。
以上分类方式充分利用了3sigma(三σ)原则可以准确的识别出长期告警。在本实施例中,第一预定时间段通常可以是告警信息对应时刻之前的24小时,在后续实施例中第二预定时间段通常可以这顶为告警信息对应时刻之前的48小时。将第二预定时间段设置得比第一预定时间段长会有更好的效果,通常可以设定为大于1的整数倍。上述预定倍数通常可以设定为3,依据3sigma原则,设置得更大或者更小也是可以的,通常不会设定为1因为这样会有较高的误判,另外设置得太高可能出现漏判也没有必要。
本发明实施例还提供了基于长期告警的规律/经验得出的判定的方式,也可以获得较好的准确率,其中,上述处理器704,用于依据上述告警分级规则,确定上述告警信息是否属于长期告警包括:确定第二预定时间段内与上述告警信息相同的时刻,是否有上述告警信息,若是,则确定上述告警信息为长期告警。
本发明实施例可以应用于通用应用场景,不过应用于有访问链路的系统中会有更好的效果,具体如下:上述装置应用于具有访问链路的系统中,上述源模块和上述源模块以外的其他业务模块属于上述访问链路。
基于本发明实施例应用于具有访问链路的系统中,本发明实施例还提供了波动告警的确定方案,用于准确确定此种场景下准确确定波动告警,具体如下:上述处理器704,用于依据上述告警分级规则,确定上述告警信息是否属于波动告警,包括:以上述源模块为根节点,根据模块访问拓扑进行预定最大深度的搜索,确定上述告警信息对应时刻是否存在非长期告警,若否,则确定为波动告警。
在本发明实施例中,确定告警信息的分级以后,可以采用标注的方式提示重要度较高的告警,不同分级采用不同的标注方式;由于告警信息可能是海量的,这样的标注方式对运维人员来说可能仍然较为不方便,因此本发明实施例还可以如下:上述处理器704,还用于在告警信息分级完毕后,将属于关联告警的告警信息生成告警报告,并输出上述告警报告。
通过输出关联告警的方式,可以减少运维人员从海量告警中查找关联告警的工作量,可以作为一个更优选的方式。
另外,由于波动告警有可能也需要关注,因此本发明实施例提供了两种可选的方式,方便灵活控制,具体如下:上述处理器704,还用于若关联告警的数量少于预定阈值或收到输出波动告警的指示信息,则标记属于波动告警的告警信息,将上述波动告警信息添加到上述告警报告。
图8是本发明实施例提供的一种服务器结构示意图,该服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)822(例如,一个或一个以上处理器)和存储器832,一个或一个以上存储应用程序842或数据844的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器832和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器822可以设置为与存储介质830通信,在服务器800上执行存储介质830中的一系列指令操作。
服务器800还可以包括一个或一个以上电源826,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口858,和/或,一个或一个以上操作系统841,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图8所示的服务器结构。
值得注意的是,上述装置和服务器实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述各方法实施例中的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于 此,任何熟悉本技术领域的技术人员在本发明实施例揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (8)

1.一种告警分级方法,其特征在于,所述方法应用于具有访问链路的系统中,所述访问链路包括告警信息的源模块和所述源模块以外的其他业务模块,所述方法包括:
获取所述告警信息,以及预置的告警分级规则;
依据所述告警分级规则,基于所述告警信息在之前的第一预定时间段内的失败率确定所述告警信息是否属于长期告警;所述长期告警为预定时间段内持续发生的告警;
基于所述告警信息的模块访问拓扑,以所述源模块为根节点,根据模块访问拓扑进行预定最大深度的搜索,确定所述告警信息对应时刻是否存在非长期告警,若否,则确定所述告警信息为波动告警;所述波动告警为与所述告警信息的源模块以外的其他业务模块无关的告警;
若所述告警信息不属于长期告警和波动告警,则确定所述告警信息为关联告警,所述关联告警为重要告警,且与所述访问链路中的所述源模块以外的其他业务模块有关;所述长期告警和所述波动告警的重要性低于所述关联告警;
将属于所述关联告警的告警信息生成告警报告,并输出上述告警报告;
若所述关联告警的数量少于预定阈值或收到输出波动告警的指示信息,则标记属于波动告警的告警信息,将所述波动告警信息添加到所述告警报告中。
2.根据权利要求1所述方法,其特征在于,所述依据所述告警分级规则,确定所述告警信息是否属于长期告警包括:
计算所述告警信息在之前的第一预定时间段内的失败率的平均值以及标准差,若所述告警信息的失败率大于所述平均值与预定倍数标准差的和,则确定所述告警信息为长期告警。
3.根据权利要求1或2所述方法,其特征在于,所述依据所述告警分级规则,确定所述告警信息是否属于长期告警包括:
确定第二预定时间段内与所述告警信息相同的时刻,是否有所述告警信息,若是,则确定所述告警信息为长期告警。
4.一种告警分级装置,其特征在于,所述装置应用于具有访问链路的系统中,所述访问链路包括告警信息的源模块和所述源模块以外的其他业务模块,所述装置包括:
信息获取单元,用于获取所述告警信息,以及预置的告警分级规则;
第一分类单元,用于依据所述告警分级规则,基于所述告警信息在之前的第一预定时间段内的失败率确定所述告警信息是否属于长期告警;基于所述告警信息的模块访问拓扑,以所述源模块为根节点,根据模块访问拓扑进行预定最大深度的搜索,确定所述告警信息对应时刻是否存在非长期告警,若否,则确定所述告警信息为波动告警;所述长期告警为预定时间段内持续发生的告警,所述波动告警为与所述告警信息的源模块以外的其他业务模块无关的告警;
第二分类单元,用于若所述告警信息不属于长期告警和波动告警,则确定所述告警信息为关联告警,所述关联告警为重要告警,且与所述访问链路中的所述源模块以外的其他业务模块有关;所述长期告警和所述波动告警的重要性低于所述关联告警;
报告输出单元,用于在告警信息分级完毕后,将属于关联告警的告警信息生成告警报告,并输出所述告警报告;
所述报告输出单元,还用于若关联告警的数量少于预定阈值或收到输出波动告警的指示信息,则标记属于波动告警的告警信息,将所述波动告警信息添加到所述告警报告。
5.根据权利要求4所述装置,其特征在于,所述第一分类单元包括:
计算单元,用于计算所述告警信息在之前的第一预定时间段内的失败率的平均值以及标准差;
确定长期单元,用于若所述告警信息的失败率大于所述平均值与预定倍数标准差的和,则确定所述告警信息为长期告警。
6.根据权利要求4或5所述装置,其特征在于,所述第一分类单元包括:
分类子单元,用于确定第二预定时间段内与所述告警信息相同的时刻,是否有所述告警信息,若是,则确定所述告警信息为长期告警。
7.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,所述计算机程序用于执行权利要求1-3任一项所述的告警分级方法。
8.一种服务器,其特征在于,包括:存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器中存储的计算机程序;
所述计算机程序用于执行如权利要求1-3任一项所述的告警分级方法。
CN201510154232.7A 2015-04-02 2015-04-02 一种告警分级方法及装置 Active CN106161058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510154232.7A CN106161058B (zh) 2015-04-02 2015-04-02 一种告警分级方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510154232.7A CN106161058B (zh) 2015-04-02 2015-04-02 一种告警分级方法及装置

Publications (2)

Publication Number Publication Date
CN106161058A CN106161058A (zh) 2016-11-23
CN106161058B true CN106161058B (zh) 2020-07-03

Family

ID=57338252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510154232.7A Active CN106161058B (zh) 2015-04-02 2015-04-02 一种告警分级方法及装置

Country Status (1)

Country Link
CN (1) CN106161058B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778873B (zh) * 2016-12-19 2019-09-27 北京市天元网络技术股份有限公司 一种基于白名单规则的告警信息分类处置方法及装置
CN110113201B (zh) * 2019-04-30 2022-12-23 平安科技(深圳)有限公司 监控数据处理方法、装置及监控系统
CN114363148B (zh) * 2021-12-20 2023-05-26 绿盟科技集团股份有限公司 一种检测攻击告警的方法、装置、检测设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102057624A (zh) * 2008-06-10 2011-05-11 汤姆森许可贸易公司 网络监控系统中的消息过滤
CN103746831A (zh) * 2013-12-24 2014-04-23 华为技术有限公司 一种告警分析的方法、装置及系统
CN104486106A (zh) * 2014-12-04 2015-04-01 珠海金山网络游戏科技有限公司 一种分级告警服务系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100573375C (zh) * 2006-09-26 2009-12-23 深圳长城开发科技股份有限公司 静电实时监控系统及其数据采集和分析方法
CN101458513A (zh) * 2007-12-13 2009-06-17 中芯国际集成电路制造(上海)有限公司 统计过程控制方法及装置
CN102223264B (zh) * 2011-06-14 2013-10-09 深圳中兴力维技术有限公司 一种用于监控系统的告警处理方法及系统
CN104243184B (zh) * 2013-06-06 2018-01-30 中国移动通信集团河北有限公司 一种告警信息的处理方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102057624A (zh) * 2008-06-10 2011-05-11 汤姆森许可贸易公司 网络监控系统中的消息过滤
CN103746831A (zh) * 2013-12-24 2014-04-23 华为技术有限公司 一种告警分析的方法、装置及系统
CN104486106A (zh) * 2014-12-04 2015-04-01 珠海金山网络游戏科技有限公司 一种分级告警服务系统

Also Published As

Publication number Publication date
CN106161058A (zh) 2016-11-23

Similar Documents

Publication Publication Date Title
US9817893B2 (en) Tracking changes in user-generated textual content on social media computing platforms
CN110784355B (zh) 一种故障识别方法及装置
CN111049705A (zh) 一种监控分布式存储系统的方法及装置
CN110740061B (zh) 故障预警方法、装置及计算机存储介质
CN112311617A (zh) 一种配置化数据监控告警方法及系统
CN110187980B (zh) 消息队列监控方法、装置、电子设备及可读存储介质
CN109471783B (zh) 预测任务运行参数的方法和装置
CN108377201A (zh) 网络异常感知方法、装置、设备及计算机可读存储介质
CN114465870B (zh) 告警信息的处理方法及装置、存储介质和电子设备
CN111352800A (zh) 大数据集群监控方法及相关设备
CN106161058B (zh) 一种告警分级方法及装置
CN110347694B (zh) 一种基于物联网的设备监控方法、装置及系统
EP2897088A1 (en) Method and apparatus for optimum spatial clustering
CN112751726A (zh) 一种数据处理方法、装置、电子设备和存储介质
US11736363B2 (en) Techniques for analyzing a network and increasing network availability
WO2022142013A1 (zh) 基于人工智能的ab测试方法、装置、计算机设备及介质
CN112749305A (zh) 基于人工智能的监测数据管理方法、系统、设备及介质
WO2019109961A1 (zh) 故障诊断方法及装置
CN105471938B (zh) 服务器负载管理方法及装置
CN109245309B (zh) 一种电网告警信息标准化处理方法及装置
CN107493308B (zh) 一种发送消息的方法和装置及分布式设备集群系统
CN110888811B (zh) 代码覆盖率信息处理方法、装置、电子设备及介质
CN111917812B (zh) 数据的传输控制方法、装置、设备以及存储介质
CN110619737B (zh) 一种联防报警方法及装置
Barnard et al. Content-based clustering and visualization of social media text messages

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant