CN111953541A - 告警信息处理方法、装置、计算机设备及存储介质 - Google Patents

告警信息处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111953541A
CN111953541A CN202010796707.3A CN202010796707A CN111953541A CN 111953541 A CN111953541 A CN 111953541A CN 202010796707 A CN202010796707 A CN 202010796707A CN 111953541 A CN111953541 A CN 111953541A
Authority
CN
China
Prior art keywords
information
alarm
alarm information
target
classification template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010796707.3A
Other languages
English (en)
Other versions
CN111953541B (zh
Inventor
黄荣庚
李雄政
董善东
姚华宁
黄小龙
梁晓聪
张加浪
高传泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010796707.3A priority Critical patent/CN111953541B/zh
Publication of CN111953541A publication Critical patent/CN111953541A/zh
Application granted granted Critical
Publication of CN111953541B publication Critical patent/CN111953541B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Abstract

本申请提供了一种告警信息处理方法、装置、计算机设备及存储介质,属于人工智能技术领域。该方法包括:获取多个告警信息,告警信息与告警事件关联,告警事件用于指示网络服务出现异常;基于告警信息所包括的第一目标信息,将第一目标信息相同的告警信息划分为同一收敛分组,得到至少一个收敛分组;对至少一个收敛分组中的告警信息进行分类;对收敛分组中类别相同的告警信息进行合并,输出至少一个收敛分组对应的告警信息。本申请通过对告警信息进行分类和合并,使得输出的告警信息可读性较佳,从而有助于相关人员快速发现关键的告警信息,定位出现异常的根本原因,提高异常处理过程中的人机交互效率,进而提高网络服务的运维效率。

Description

告警信息处理方法、装置、计算机设备及存储介质
技术领域
本申请涉及人工智能技术领域,特别涉及一种告警信息处理方法、装置、计算机设备及存储介质。
背景技术
为保证网络服务的可靠性,可以通过运维监控系统对网络服务进行监控。当网络服务出现异常时,运维监控系统会生成相应的告警信息,发送给相关人员,以便于相关人员处理异常。
随着网络服务的复杂程度越来越高,需要部署更多的监控节点来对网络服务进行监控,生成的告警信息也越来越多。为了降低向相关人员发送告警信息的频繁程度,可以在短时间内接收到两个完全相同的告警信息时,只向相关人员发送一次该告警信息。
上述过程仅将两个完全相同的告警信息合并成一个进行发送,告警信息的处理方式单一,在大规模爆发告警信息的情况下,经过上述处理之后,运维监控系统仍然会向相关人员发送大量告警信息,告警信息的可读性较差,相关人员难以从大量告警信息中快速发现关键的告警信息,人机交互的效率较低。
发明内容
本申请实施例提供了一种告警信息处理方法、装置、计算机设备及存储介质,能够提高异常处理过程中的人机交互效率。所述技术方案如下。
一方面,提供了一种告警信息处理方法,所述方法包括:
获取多个告警信息,所述告警信息与告警事件关联,所述告警事件用于指示网络服务出现异常;
基于所述告警信息所包括的第一目标信息,将所述第一目标信息相同的告警信息划分为同一收敛分组,得到至少一个收敛分组;
对所述至少一个收敛分组中的告警信息进行分类;
对所述收敛分组中类别相同的告警信息进行合并,输出所述至少一个收敛分组对应的告警信息。
在一种可选的实现方式中,所述确定所述第二目标信息与所述分类模板信息的相似度之后,所述方法还包括:
响应于所述第二目标信息与所述分类模板信息的相似度不满足所述目标条件,将所述第二目标信息的通配字符串确定为所述收敛分组对应的另一分类模板信息。
在另一种可选的实现方式中,所述第一目标信息包括所述告警事件的事件名称、所述告警事件对应的网络服务的服务名称以及应用所述网络服务的账号信息中的至少一个。
在另一种可选的实现方式中,所述第二目标信息包括所述告警事件对应的服务器名称。
一方面,提供了一种告警信息处理方法,所述方法包括:
获取收敛分组对应的告警信息,所述收敛分组中的告警信息所包括的第一目标信息相同,所述告警信息为所述收敛分组中类别相同的告警信息合并得到的;
在告警详情界面中显示所述告警信息,所述告警信息包括第一显示信息和第二显示信息;
其中,所述第一显示信息为类别相同的告警信息所包括的第一目标信息;所述第二显示信息为类别相同的告警信息所包括的第二目标信息对应的分类模板信息。
一方面,提供了一种告警信息处理装置,所述装置包括:
第一获取模块,用于获取多个告警信息,所述告警信息与告警事件关联,所述告警事件用于指示网络服务出现异常;
划分模块,用于基于所述告警信息所包括的第一目标信息,将所述第一目标信息相同的告警信息划分为同一收敛分组,得到至少一个收敛分组;
分类模块,用于对所述至少一个收敛分组中的告警信息进行分类;
输出模块,用于对所述收敛分组中类别相同的告警信息进行合并,输出所述至少一个收敛分组对应的告警信息。
在一种可选的实现方式中,所述分类模块,包括:
第一获取单元,用于从所述告警信息中获取第二目标信息;
第二获取单元,用于获取所述收敛分组对应的分类模板信息;
相似度确定单元,用于确定所述第二目标信息与所述分类模板信息的相似度;
类别确定单元,用于响应于所述第二目标信息与所述分类模板信息的相似度满足目标条件,确定所述告警信息所属的告警类别为所述分类模板信息对应的告警类别。
在另一种可选的实现方式中,所述相似度确定单元,用于:
从所述第二目标信息中识别出符合目标特征的至少一个字符;
将所述至少一个字符转换为通配符,得到所述第二目标信息的通配字符串;
确定所述通配字符串与所述分类模板信息的相似度。
在另一种可选的实现方式中,所述类别确定单元,包括:
第一类别确定子单元,用于响应于所述第二目标信息与所述分类模板信息的第一相似度大于或等于第一阈值,确定所述告警信息所属的告警类别为所述分类模板信息对应的告警类别;
相似度确定子单元,用于响应于所述第一相似度小于所述第一阈值,确定所述第二目标信息与所述分类模板信息的第二相似度;
第二类别确定子单元,用于响应于所述第二相似度大于第二阈值,确定所述告警信息所属的告警类别为所述分类模板信息对应的告警类别。
在另一种可选的实现方式中,所述相似度确定子单元,用于:
响应于所述第一相似度小于所述第一阈值,且所述第二目标信息和所述分类模板信息包括分隔符,基于所述第二目标信息中的分隔符,将所述第二目标信息分割为多个第一字符分段,以及,基于所述分类模板信息中的分隔符,将所述分类模板信息分割为多个第二字符分段;
分别确定所述第一字符分段与所述第一字符分段对应的第二字符分段的相似度,得到所述第二目标信息对应的多个相似度;
基于所述第二目标信息对应的多个相似度,确定所述第二目标信息与所述分类模板信息的第二相似度。
在另一种可选的实现方式中,所述第二获取单元,用于:
响应于不存在所述收敛分组对应的分类模板信息,将所述第二目标信息的通配字符串确定为所述收敛分组对应的分类模板信息;
响应于存在所述收敛分组对应的分类模板信息,执行所述获取所述收敛分组对应的分类模板信息的步骤。
在另一种可选的实现方式中,所述第二获取单元,还用于:
响应于所述第二目标信息与所述分类模板信息的相似度不满足所述目标条件,将所述第二目标信息的通配字符串确定为所述收敛分组对应的另一分类模板信息。
在另一种可选的实现方式中,所述第一获取模块,包括:
接收单元,用于接收告警信息;
告警信息确定单元,用于将目标时间段内接收到的告警信息,作为所述多个告警信息。
在另一种可选的实现方式中,所述告警信息确定单元,用于将所述目标时间段内接收到的与发生频率大于频率阈值的告警事件关联的告警信息,作为所述多个告警信息。
在另一种可选的实现方式中,所述第一获取模块,用于:
接收告警信息;
获取与所述告警信息关联的告警事件对应的目标时长,所述目标时长与所述告警事件的处理紧急程度呈负相关;
以接收到所述告警信息的时间为起始时间,将在所述目标时长内接收到的与所述告警事件关联的告警信息,作为所述多个告警信息。
在另一种可选的实现方式中,所述第一目标信息包括所述告警事件的事件名称、所述告警事件对应的网络服务的服务名称以及应用所述网络服务的账号信息中的至少一个。
在另一种可选的实现方式中,所述第二目标信息包括所述告警事件对应的服务器名称。
一方面,提供了一种告警信息处理装置,所述装置包括:
第二获取模块,用于获取收敛分组对应的告警信息,所述收敛分组中的告警信息所包括的第一目标信息相同,所述告警信息为所述收敛分组中类别相同的告警信息合并得到的;
显示模块,用于在告警详情界面中显示所述告警信息,所述告警信息包括第一显示信息和第二显示信息;
其中,所述第一显示信息为类别相同的告警信息所包括的第一目标信息;所述第二显示信息为类别相同的告警信息所包括的第二目标信息对应的分类模板信息。
在一种可选的实现方式中,所述显示模块,还用于响应于类别相同的告警信息所包括的第二目标信息不同,在所述告警详情界面中,以列表的形式显示类别相同的告警信息所包括的第二目标信息。
在另一种可选的实现方式中,所述告警信息还包括除所述第一显示信息和所述第二显示信息之外的其他维度信息,所述显示模块,还用于:
响应于类别相同的告警信息所包括的其他维度信息相同,在所述告警详情界面中,显示所述其他维度信息;
响应于类别相同的告警信息所包括的其他维度信息不同,在所述告警详情界面中,以列表的形式显示类别相同的告警信息所包括的其他维度信息。
一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现上述任一可选的实现方式所述的告警信息处理方法。
一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现上述任一可选的实现方式所述的告警信息处理方法。
一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机程序代码,该计算机程序代码存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行该计算机程序代码,使得该计算机设备执行上述任一可选的实现方式所述的告警信息处理方法。
本申请实施例提供的技术方案,由于每个告警信息用于对网络服务出现的一次异常进行告警,在网络服务频繁出现异常时,会爆发多个告警信息。因此,首先以告警信息所包括的第一目标信息相同为前提条件,进行收敛分组的划分,使得每个收敛分组包括第一目标信息相同的多个告警信息,从而保证每个收敛分组中的多个告警信息属于同一个大类别,使收敛分组具有进一步分类的意义。进而对每个收敛分组中的多个告警信息进行进一步的分类,得到按照类别划分的多个告警信息,保证了待合并的多个告警信息进行合并的合理性。进而分别将类别相同的告警信息合并成一个告警信息,进行输出。减少了需要输出的告警信息的数量,不再对多个相关的告警信息进行频繁输出;并且,合并后的告警信息的结构更加清晰,信息表示更加明确,可读性较佳,从而有助于相关人员快速发现关键的告警信息,定位出现异常的根本原因,提高异常处理过程中的人机交互效率,进而提高网络服务的运维效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的示意图;
图2是本申请实施例提供的一种告警信息处理方法的流程图;
图3是本申请实施例提供的一种告警信息处理方法的流程图;
图4是本申请实施例提供的一种告警信息处理方法的流程图;
图5是本申请实施例提供的一种告警信息处理方法的示意图;
图6是本申请实施例提供的一种告警信息处理方法的示意图;
图7是本申请实施例提供的一种告警详情界面的示意图;
图8是本申请实施例提供的一种告警详情界面的示意图;
图9是本申请实施例提供的一种告警信息处理装置的框图;
图10是本申请实施例提供的一种告警信息处理装置的框图;
图11是本申请实施例提供的一种终端的框图;
图12是本申请实施例提供的一种服务器的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们的任意变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。本申请说明书和权利要求书中的“多个”是指两个或两个以上。
下面对本申请实施例涉及到的相关技术进行简单介绍。
云技术(Cloud Technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
云计算(Cloud Computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。
作为云计算的基础能力提供商,会建立云计算资源池(简称云平台,一般称为IaaS(Infrastructure as a Service,基础设施即服务)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(为虚拟化机器,包含操作系统)、存储设备、网络设备。
云服务器(Cloud Virtual Machine)是一台台从“云”里分配出来的虚拟机。“云”向外提供基础架构服务,当有用户来申请计算资源时,资源调度系统从云计算资源池中分配出用户所需的资源,虚拟化成云服务器。云服务器所具有的计算资源按需分配,且能够根据需求的变化动态调整,这是IaaS平台最基础的服务。
实例(Instance)指一个具体的云服务器。一个具体的云服务器的配置属性与一台真实的物理服务器类似,包括CPU(Central Processing Unit,中央处理器)、内存、网络和存储等。
ping(packet internet groper,因特网包探索器)是一种网络诊断工具,用于确定本地主机是否能与另一台主机成功交换(发送与接收)数据包。网络通信是双向的,数据包在相关设备之间进行双向传输。在本地主机发出的数据包能够到达目的主机且目的主机返回的数据包能够到达本地主机时,本地主机和目的主机才能正常通信。不同IP(InternetProtocol,网际互连协议)网段的主机ping测试(主机1ping主机2),若返回ping不可达的消息,则表示在正向路径(主机1到主机2)上的某一台路由器缺少到目的网络的路由。
图1是本申请实施例提供的一种实施环境的示意图。参见图1,该实施环境包括服务器101和终端102。
服务器101可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
服务器101具有告警信息处理功能。服务器101接收运维监控系统的告警信息;对接收到的告警信息进行处理;向终端102发送处理后的告警信息。其中,运维监控系统用于对网络服务进行监控,在网络服务出现异常时,触发告警事件,生成与该告警事件关联的告警信息。可选地,网络服务由物理服务器提供或者由云服务器提供,在本申请实施例中,以网络服务由云服务器提供为例进行说明。
终端102与服务器101通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。终端102可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能手表等,但并不局限于此。可选地,终端102上设有具有信息通知功能的客户端,如即时通信客户端、邮箱客户端或者浏览器客户端等。终端102通过具有信息通知功能的客户端,接收告警信息,进行告警信息的通知和显示,以便于终端102对应的用户基于告警信息,及时处理异常。其中,终端102对应的用户为关注该告警信息的工作人员,例如,终端102对应的用户为SRE(Site Reliability Engineer,网站可靠性工程师)。
终端102可以泛指多个终端中的一个,本实施例仅以终端102来举例说明。本领域技术人员可以知晓,上述终端的数量可以更多或更少。比如上述终端可以仅为一个,或者上述终端为几十个或几百个,或者更多数量,本申请实施例对终端的数量和设备类型不加以限定。
图2是本申请实施例提供的一种告警信息处理方法的流程图。在本申请实施例中,以具有告警信息处理功能的服务器为执行主体为例进行说明,参见图2,该实施例包括以下步骤。
201、服务器获取多个告警信息,告警信息与告警事件关联,告警事件用于指示网络服务出现异常。
服务器与运维监控系统关联,通过接收运维监控系统发送的告警信息,得到多个告警信息。其中,运维监控系统用于对网络服务进行监控;在网络服务出现异常时,触发告警事件,生成与该告警事件关联的告警信息;向服务器发送告警信息。例如,IaaS平台的服务提供方提供云服务器的监控服务。若监控服务监测到云服务器的带宽使用率超过带宽使用阈值,则触发带宽超限的告警事件,生成与该告警事件关联的告警信息。其中,告警信息用于提示网络服务的异常类型以及网络服务的配置信息,以使相关人员能够基于告警信息,获知异常类型以及相关的配置信息,快速定位和处理异常,提高异常处理的效率。
需要说明的一点是,可选地,服务器为运维监控系统中的一部分,服务器提供告警信息处理功能,该服务器接收运维监控系统中其他具有告警信息生成功能的服务器发送的告警信息。
202、服务器基于告警信息所包括的第一目标信息,将第一目标信息相同的告警信息划分为同一收敛分组,得到至少一个收敛分组。
第一目标信息相同是多个告警信息进一步收敛的前提条件,第一目标信息也称为告警收敛前提。服务器将第一目标信息相同的告警信息划分在同一个收敛分组,将第一目标信息不同的告警信息划分在不同的收敛分组中,保证具有不同第一目标信息的告警信息能够分别发送。例如,IaaS平台的服务提供方为多个客户提供云服务,第一目标信息包括应用云服务的客户的账号信息,从而基于第一目标信息划分收敛分组,能够保证每个客户对应的告警信息分别发送。
203、服务器对至少一个收敛分组中的告警信息进行分类。
服务器对每个收敛分组中的告警信息进行进一步的分类,确定告警信息所属的告警类别。其中,类别相同的多个告警信息允许存在差异。除第一目标信息之外,告警信息还包括其他维度信息。可选地,类别相同的多个告警信息所包括的其他维度信息相同;或者,类别相同的多个告警信息所包括的其他维度信息之间的相似度满足目标条件;或者,类别相同的多个告警信息所包括的其他维度信息的相似度不满足目标条件。
204、服务器对收敛分组中类别相同的告警信息进行合并,输出至少一个收敛分组对应的告警信息。
服务器将每个收敛分组中类别相同的多个告警信息合并为一个告警信息,得到至少一个合并后的告警信息,依次输出合并后的告警信息。
本申请实施例提供的技术方案,由于每个告警信息用于对网络服务出现的一次异常进行告警,在网络服务频繁出现异常时,会爆发多个告警信息。因此,首先以告警信息所包括的第一目标信息相同为前提条件,进行收敛分组的划分,使得每个收敛分组包括第一目标信息相同的多个告警信息,从而保证每个收敛分组中的多个告警信息属于同一个大类别,使收敛分组具有进一步分类的意义。进而对每个收敛分组中的多个告警信息进行进一步的分类,得到按照类别划分的多个告警信息,保证了待合并的多个告警信息进行合并的合理性。进而分别将类别相同的告警信息合并成一个告警信息,进行输出。减少了需要输出的告警信息的数量,不再对多个相关的告警信息进行频繁输出;并且,合并后的告警信息的结构更加清晰,信息表示更加明确,可读性较佳,从而有助于相关人员快速发现关键的告警信息,定位出现异常的根本原因,提高异常处理过程中的人机交互效率,进而提高网络服务的运维效率。
图3是本申请实施例提供的一种告警信息处理方法的流程图。在本申请实施例中,以终端为执行主体为例进行说明,参见图3,该实施例包括以下步骤。
301、终端获取收敛分组对应的告警信息,收敛分组中的告警信息所包括的第一目标信息相同,该收敛分组对应的告警信息为收敛分组中类别相同的告警信息合并得到的。
服务器向终端发送收敛分组对应的告警信息,相应的,终端接收服务器发送的告警信息。
302、终端在告警详情界面中显示该收敛分组对应的告警信息,该收敛分组对应的告警信息包括第一显示信息和第二显示信息;其中,第一显示信息为类别相同的告警信息所包括的第一目标信息;第二显示信息为类别相同的告警信息所包括的第二目标信息对应的分类模板信息。
由于类别相同的多个告警信息所包括的第一目标信息相同,告警详情界面中显示一次第一目标信息即可,第一显示信息即为显示一次的第一目标信息。
类别相同的多个告警信息所包括的第二目标信息允许存在差异,在类别相同的多个告警信息合并得到的告警信息中,以一个分类模板信息来对多个第二目标信息进行表示。其中,每个分类模板信息概括性的对同一告警类别的多个告警信息所包括的第二目标信息进行表示。
本申请实施例提供的技术方案,在告警详情界面中,对多个告警信息的合并显示,其中,相同的多个第一目标信息合并为一个进行显示,存在差异的多个第二目标信息由对应的分类模板信息来表示,从而使得所显示的告警信息的结构更加清晰,信息表示更加明确,可读性较佳,有助于相关人员快速发现关键的告警信息,定位出现异常的根本原因,提高异常处理过程中的人机交互效率,进而提高网络服务的运维效率。
图4是本申请实施例提供的一种告警信息处理方法的流程图。参见图4,该实施例包括以下步骤。
401、服务器获取多个告警信息,告警信息与告警事件关联,告警事件用于指示网络服务出现异常。
服务器能够在网络服务出现异常时,接收到告警信息。可选地,服务器接收运维监控系统发送的告警信息,得到多个告警信息。由于网络服务出现异常时,会在以时间序列表示的运行日志上有所表现,因此,通过运维监控系统对网络服务进行监控。若运维监控系统监测到多个异常点,例如,连续三分钟异常或者五分钟内有四个点异常,则生成相应的告警信息;向服务器发送告警信息,以使服务器对告警信息进行进一步的处理。
需要说明的是,告警事件为ping不可达、带宽超限、磁盘只读或者无限重启等。若云服务器与另一服务器交换数据包失败,则触发ping不可达的告警事件。若云服务器的带宽使用率大于带宽使用阈值,则触发带宽超限的告警事件。若仅能从云服务器的磁盘中读取数据,则触发磁盘只读的告警事件。若云服务器循环重启,则触发无限重启的告警事件。需要说明的是,本申请实施例仅以上述告警事件为例进行说明,在网络服务出现其他异常时,会触发其他类型的告警事件,在本申请实施例中,对告警事件的事件类型不加以限定。
需要说明的是,告警信息用于提示网络服务的异常类型以及网络服务的配置信息。其中,告警信息包括告警事件的事件名称、告警事件对应的网络服务的服务名称以及应用该网络服务的账号信息中的至少一个、告警事件对应的服务器名称。上述事件名称用于表示网络服务的异常类型,例如,事件名称为“ping不可达”。上述服务名称用于表示发生异常的网络服务所属的服务类型,例如,服务名称为“云服务器”。上述账号信息是为应用该网络服务的客户分配的账号信息,用于唯一标识该客户。上述服务器名称为发生异常的服务器的名称,若应用该网络服务的客户对应有由多个云服务器组成的服务器集群,则服务器名称为该服务器集群中出现异常的服务器的名称。
可选地,告警信息还包括告警事件的触发时间、告警事件的恢复时间、告警事件的事件状态、云服务器的实例ID(Identity Document,身份标识号)、发生异常的服务器所在的地域、云服务器的IP地址以及UUID(Universally Unique Identifier,通用唯一识别码)中的至少一个。其中,地域指服务器的物理资源所在的地理区域。可选地,告警事件的事件状态包括未恢复和已恢复。云服务器的IP地址包括内网IP和公网IP。其中,内网IP提供局域网(LAN,Local Area Network)服务,同一IaaS平台上的云服务器之间经由内部链路互相访问。公网IP是Internet(因特网)上的非保留地址,有公网IP的云服务器能够和Internet上的其他计算机互相访问。
需要说明的是,可选地,告警信息还包括其他与告警事件关联的信息,本申请实施例仅以告警信息包括上述信息为例进行说明,对告警信息所包括的信息类型不加以限定。
在一种可选的实现方式中,服务器接收运维监控系统发送的告警信息,将一定时间内接收到的多个告警信息,作为待处理的多个告警信息。相应的,上述步骤401包括:服务器接收告警信息;将目标时间段内接收到的告警信息,作为多个告警信息。
可选地,目标时间段为任一时长的时间段,例如,目标时间段为10秒、30秒或者1分钟等。若目标时间段的时长过长,则所收敛的告警信息数量较多,收敛效果较为明显,但告警信息通知到用户的延迟较大;若目标时间段的时长过短,则告警信息通知到用户的延迟较小,但所收敛的告警信息数量较少,收敛效果不明显。因此,目标时间段的时长通常设置为1分钟。若目标时间段的时长为1分钟,则服务器分别将每1分钟接收到的多个告警信息,作为待处理的多个告警信息。
可选地,服务器还支持用户配置目标时间段的时长。其中,该用户具有配置权限,例如,该用户为购买有网络服务的客户。终端登录有应用该网络服务的账号信息,用户通过该终端的配置界面,配置目标时间段的时长;终端将用户配置的目标时间段的时长发送至服务器;服务器将目标时间段的时长更改为用户配置的目标时间段的时长。
上述技术方案,由于一定时长的时间段内接收到的多个告警信息的相关程度较高,因此,以一定时长的时间段为单位,获取多个告警信息,进而对该多个告警信息进行处理,能够将多个告警信息收敛成少量告警信息,达到收敛效果,进而及时将少量告警信息通知到用户,便于用户快速发现关键的告警信息,进行异常处理,提高异常处理的效率。
在另一种可选的实现方式中,若某一类型的告警事件的发生频率较高,相应的也会产生大量关联的告警信息,服务器需要对所产生的大量告警信息进行处理,以实现告警收敛。相应的,上述步骤401包括:服务器接收告警信息;将目标时间段内接收到的与发生频率大于频率阈值的告警事件关联的告警信息,作为多个告警信息。
其中,频率阈值为预设的任一频率,例如,频率阈值为10次每秒或者50次每秒。假设频率阈值为10次每秒,若ping不可达的告警事件的发生频率为30次每秒,则将目标时间段内接收到的与ping不可达的告警事件关联的告警信息均确定为待处理的多个告警信息。
需要说明的是,若某一类型的告警事件的发生频率较低,相应的,产生的关联的告警信息的数量也较少,服务器可以不对该数量较少的告警信息进行进一步的处理。可选地,对于与发生频率小于或等于频率阈值的告警事件关联的告警信息,不通过步骤402至步骤409的处理,直接实时输出至终端。
上述技术方案,由于发生频率较高的告警事件关联产生的告警信息的数量较多,因此,将与发生频率较高的告警事件关联的告警信息确定为待处理的多个告警信息,对该多个告警信息进行处理,收敛得到少量告警信息,进而将少量告警信息通知到用户,便于用户快速发现关键的告警信息,进行异常处理,提高异常处理的效率。
在另一种可选的实现方式中,不同类型的告警事件的处理紧急程度不同,处理紧急程度越高的告警事件所能容忍的告警信息通知延迟越小,因此,服务器按照处理紧急程度,确定获取多个告警信息的时长范围。相应的,上述步骤401包括以下步骤4011和步骤4012。
步骤4011:服务器接收告警信息;获取与该告警信息关联的告警事件对应的目标时长,该目标时长与告警事件的处理紧急程度呈负相关。
可选地,处理紧急程度划分为多个级别,例如,多个级别包括最紧急、一般紧急、不紧急。处理紧急程度级别越高的告警事件对应的目标时长越短。例如,处理紧急程度为最紧急的告警事件对应的目标时长为5秒;处理紧急程度为一般紧急的告警事件对应的目标时长为1分钟;处理紧急程度为不紧急的告警事件对应的紧急程度为5分钟。
步骤4012:服务器以接收到该告警信息的时间为起始时间,将在目标时长内接收到的与该告警事件关联的告警信息,作为多个告警信息。
例如,服务器接收的告警信息为与ping不可达的告警事件关联的告警信息,ping不可达的告警事件对应的目标时长为1分钟,则服务器以接收到该告警信息的时间为起始时间,将1分钟内接收到的与ping不可达的告警事件关联的告警信息,作为多个告警信息。
上述技术方案,基于与处理紧急程度呈负相关的目标时长,获取多个告警信息,能够以较小的时间单位,获取需要紧急处理的多个告警信息,对该多个告警信息进行处理后,及时将处理后的告警信息通知到用户,减少了告警信息通知到用户所消耗的时间,提高了告警信息的通知效率,便于用户及时基于告警信息处理异常,进而提高了异常处理的效率。
为了使服务器获取多个告警信息的过程更加清晰,下面结合图5进行说明。图5是本申请实施例提供的一种告警信息处理方法的示意图,参见图5,服务器包括AMP(Automatic Monitoring Platform,自动监控平台)告警发送通道501和AI(ArtificialIntelligence,人工智能)告警收敛服务502。运维监控系统通过事件中心503将告警事件上报至AMP告警发送通道501,该告警事件关联有告警信息。AMP告警发送通道501基于接收到的告警事件,生成实时告警事件列表;从实时告警事件列表中获取告警事件,通过ES(ElasticSearch,一种高度可伸缩的全文搜索和分析引擎)存储1分钟内的告警事件,生成告警事件列表,该告警事件列表包括多个告警事件以及与每个告警事件关联的告警信息。其中,若实时告警事件列表中的告警事件的发生频率小于或等于频率阈值,则直接将与该告警事件关联的告警信息发送至终端,进行单条实时告警;若实时告警事件列表中的告警事件的发生频率大于频率阈值,则通过ES存储该告警事件,以对与该告警事件关联的告警信息进行进一步的处理。
告警通知面临的最大问题是告警信息太多,相当于狼来了的形式。相关人员在接收到大量告警信息的情况下,容易麻木,不再继续理会告警信息,导致关键的告警信息被淹没。即使相关人员对大量告警信息进行分析,也难以找到关键的告警信息,确定最根本的异常原因,进行异常处理。因此,需要对大量告警信息进行分析、合并、丢弃等处理,来减少告警信息的数量,降低告警信息的规模,实现告警收敛。以下步骤402至步骤409即为告警收敛的过程。
402、服务器基于告警信息所包括的第一目标信息,将第一目标信息相同的告警信息划分为同一收敛分组,得到至少一个收敛分组。
可选地,第一目标信息为告警信息所包括的任一维度或者任意多个维度的信息。例如,第一目标信息包括告警事件的事件名称,则服务器将同一类型的告警事件对应的告警信息划分在同一个收敛分组中。再如,第一目标信息包括告警事件对应的网络服务的服务名称,则服务器将同一网络服务下的告警信息划分在同一个收敛分组中。
在本申请实施例中,以第一目标信息包括告警事件的事件名称、告警事件对应的网络服务的服务名称以及应用网络服务的账号信息为例进行说明。例如,第一目标信息包括事件名称ping不可达事件、服务名称CVM以及账号信息12345,则第一目标信息对应的收敛分组所包括的告警信息均用于对CVM服务下12345账号对应的云服务器的ping不可达事件进行告警。
上述技术方案,服务器将同一账号信息对应的网络服务下产生的同一类型的告警事件的告警信息划分在同一个收敛分组中,进行进一步的分类,进而能够按照告警事件的类型,分别向各个客户发送某一网络服务下相关的告警信息,使得处理后的告警信息的信息结构更加清晰明确,保证了处理后的告警信息的收敛效果,有助于相关人员基于告警信息,确定异常出现的根本原因,进而进行异常处理,提高异常处理的效率。
可选地,服务器还支持用户配置第一目标信息。终端的配置界面显示有告警信息中可配置为第一目标信息的可选信息;用户通过终端的配置界面,选择需要配置为第一目标信息的可选信息;终端将用户配置的第一目标信息发送至服务器;服务器将默认的第一目标信息更改为用户配置的第一目标信息。
上述技术方案,支持用户根据应用场景对第一目标信息进行配置,能够根据用户的配置,灵活调整告警信息的处理规则,使得告警信息处理的通用化程度更高,提高告警信息处理方法的可扩展性。
为了使告警收敛的过程更加清晰,下面结合图6进行说明。图6是本申请实施例提供的一种告警信息处理方法的示意图,参见图6,服务器还包括原始告警事件输入模块504和收敛告警事件输出模块505。服务器通过原始告警事件输入模块504,读取ES存储的告警事件列表;根据告警收敛前提分组,也即通过步骤402进行收敛分组的划分。
服务器得到至少一个收敛分组,每个收敛分组包括至少一个告警信息,服务器通过以下步骤403至步骤408,分别对每个收敛分组所包括的告警信息进行进一步的分类。
403、服务器从收敛分组包括的告警信息中获取第二目标信息。
第二目标信息为收敛分组中的多个告警信息进行进一步收敛的依据,也称为告警收敛依据。也就是说,服务器以第二目标信息为依据,对收敛分组包括的多个告警信息进行进一步的分类和收敛。
可选地,第二目标信息为告警信息所包括的任一维度的信息。例如,第二目标信息为告警信息对应的服务器名称。再如,第二目标信息为告警信息对应的实例ID。在本申请实施例中,以第二目标信息为告警信息对应的服务器名称为例进行说明。
继续参见图6,服务器通过原始告警事件输入模块504提取告警收敛依据的过程与上述步骤403同理。
404、服务器生成第二目标信息的通配字符串。
同一类别的告警信息所包括的第二目标信息存在共性,通配字符串能够表示多个第二目标信息之间的共性。例如,某一服务器集群包括多个服务器,该服务器集群中的多个服务器的服务器名称通常符合一定的命名规则,由固定部分和可变部分组成,存在一定的共性。
第二目标信息由固定部分和可变部分组成,其中,固定部分构成多个第二目标信息之间的共性。可变部分包括数字编号、日期、IP地址、邮箱地址和URL(Uniform ResourceLocator,统一资源定位器)中的至少一种。例如,第二目标信息为服务器名称。服务器名称为activity-cvm-2020-02-27,其中,“2020-02-27”为该服务器的启用时间,“activity-cvm(activity-cloud virtual machine,活动-云服务器)”为同一批次的服务器的命名前缀,与该服务器属于同一批次的服务器均以“activity-cvm”加启用时间的形式命名。服务器名称为默认项目96,其中,“默认项目”表示该服务器所属的项目,“96”表示该服务器在项目中的编号,与该服务器属于同一项目的服务器均以“默认项目”加编号的形式命名。服务器名称为windows-1GB-bj-2148,其中,“windows(窗口)”表示该服务器的操作系统为windows操作系统,“1GB(GigaByte,十亿字节)”表示该服务器的内存为1GB,“bj(beijing,北京)”表示该服务器所在的地域为北京,“2148”表示该服务器的编号,与该服务器属于同一批次的服务器均以操作系统加内存加地域加编号的形式命名。
服务器将第二目标信息中的可变部分转换为通配符,得到第二目标信息的通配字符串。相应的,上述步骤404包括以下步骤4041和步骤4042。
步骤4041:服务器从第二目标信息中识别出符合目标特征的至少一个字符。
可选地,目标特征包括数字特征、日期特征、IP地址特征、邮箱地址特征和URL特征中的至少一个。服务器基于正则表达式,从第二目标信息中识别出符合目标特征的至少一个字符。
例如,第二目标信息为activity-cvm-2020-02-27,服务器从第二目标信息中识别出符合日期特征的至少一个字符为“2020-02-27”。
步骤4042:服务器将该至少一个字符转换为通配符,得到第二目标信息的通配字符串。
可选地,通配符为“*”。服务器将第二目标信息“activity-cvm-2020-02-27”中符合日期特征的至少一个字符“2020-02-27”转换为“*”,得到第二目标信息的通配字符串“activity-cvm-****-**-**”。
继续参见图6,服务器提取告警收敛依据后,对告警收敛依据进行预处理。其中,预处理的过程包括去除特殊字符和通配符处理。相应的,服务器执行将至少一个字符转换为通配符,得到第二目标信息的通配字符串的通配符处理之前,还从第二目标信息中识别出特殊字符,删除特殊字符。可选地,特殊字符为无代表意义的字符,例如,特殊字符为“~”、“#”、“$”、“%”、“^”或者“&”等。
本申请实施例提供的技术方案,将第二目标信息转换为通配字符串,得到第二目标信息的通配形式,进而将第二目标信息的通配形式相似的告警信息划分为同一告警类别,能够使多个相关的服务器产生的同一告警事件的告警信息划分为同一类,提高告警信息分类的准确性。
需要说明的一点是,在本申请实施例中,以第二目标信息为完整表示的信息,服务器将第二目标信息中的部分字符转换为通配符,得到第二目标信息的通配字符串为例进行说明。若第二目标信息是以通配形式表示的信息,则服务器直接应用第二目标信息确定相似度,不再执行生成第二目标信息的通配字符串的步骤。
405、服务器获取收敛分组对应的分类模板信息。
每个收敛分组对应有至少一个分类模板信息。每个分类模板信息用于代表一个告警类别。在一种可选的实现方式中,服务器基于从收敛分组中获取的第一个第二目标信息,确定第一个分类模板信息。相应的,上述步骤405包括:服务器响应于不存在收敛分组对应的分类模板信息,将该第二目标信息的通配字符串确定为收敛分组对应的分类模板信息。
上述技术方案,基于从收敛分组中获取的第一个第二目标信息,确定分类模板信息,进而将后续获取的第二目标信息与分类模板信息进行比较,实现告警信息的分类,以一个分类模板信息作为比较基准,相较于第二目标信息两两之间进行比较,效率更高,进而能够进一步提高告警信息的分类效率。
在另一种可选的实现方式中,若收敛分组对应有分类模板信息,则直接获取该收敛分组对应的分类模板信息。相应的,上述步骤405还包括:服务器响应于存在该收敛分组对应的分类模板信息,获取该收敛分组对应的分类模板信息。
406、服务器响应于第二目标信息的通配字符串与分类模板信息的第一相似度大于或等于第一阈值,确定告警信息所属的告警类别为分类模板信息对应的告警类别。
在一种可选的实现方式中,若第二目标信息的通配字符串与分类模板信息完全相同,则将第二目标信息所属的告警信息与分类模板信息所属的告警信息划分为同一告警类别,相应的,第一阈值为100%。可选地,服务器通过比较第二目标信息的通配字符串与分类模板信息是否完全相同,来确定第二目标信息的通配字符串与分类模板信息的第一相似度是否等于第一阈值。
上述技术方案,通过比较第二目标信息的通配字符串与分类模板信息是否相同,对告警信息进行分类,通过通配字符串的简单比较,能够快速筛选出第二目标信息相似的多个告警信息,将该多个告警信息划分为同一类别,提高了告警信息的分类效率。
在另一种可选的实现方式中,第一阈值为预设的任一数值,例如,第一阈值为0.98或者0.99等。可选地,服务器通过文本相似度算法,确定第二目标信息的通配字符串与分类模板信息的相似度。
可选地,文本相似度算法为基于关键词匹配的算法,如N-gram(N元模型,一种基于统计语言模型的算法)算法、TF-IDF(Term Frequency–Inverse Document Frequency,词频-逆文档频率)、BM25(Best Match 25,第25次迭代优化的最佳匹配算法)算法;或者,文本相似度算法为基于向量计算的算法,例如,服务器将文本映射为向量,确定向量之间的余弦相似度;或者,文本相似度算法为基于深度学习的算法,如基于用户点击数据的深度学习语义匹配模型DSSM(Deep Structured Semantic Models,深度语义匹配模型),基于卷积神经网络的文本相似度算法,以及基于Siamese LSTM(SiameseLong Short-Term Memory,孪生网络)模型的文本相似度算法;或者,文本相似度算法为基于SimHash(一种局部敏感哈希算法)的算法;或者,文本相似度算法为基于jaccard(杰卡德)相似系数的算法。
407、服务器响应于第一相似度小于第一阈值,确定第二目标信息的通配字符串与分类模板信息的第二相似度。
在一种可选的实现方式中,第二目标信息和分类模板信息均包括分隔符,服务器按照分隔符将第二目标信息和分类模板信息分割为多个字符分段;分别基于各个字符分段,确定第二相似度。相应的,上述步骤407包括以下步骤4071至步骤4072。
步骤4071:服务器响应于第一相似度小于第一阈值,且第二目标信息和分类模板信息包括分隔符,基于第二目标信息的通配字符串中的分隔符,将第二目标信息的通配字符串分割为多个第一字符分段,以及,基于分类模板信息中的分隔符,将分类模板信息分割为多个第二字符分段。
可选地,分隔符为“-”或者“_”。例如,第二目标信息的通配字符串为“txkj-yfwq-a**”,多个第一字符分段包括“txkj”“yfwq”和“a**”;分类模板信息为“txkj-yfwq-b**”,多个第二字符分段包括“txkj”“yfwq”和“b**”。
步骤4072:服务器分别确定第一字符分段与第一字符分段对应的第二字符分段的相似度,得到第二目标信息对应的多个相似度;服务器基于第二目标信息对应的多个相似度,确定第二目标信息与分类模板信息的第二相似度。
第一字符分段以及第一字符分段对应的第二字符分段位于分隔符的同一相对位置。例如,第一字符分段“txkj”在第一个分隔符之前,则该第一字符分段对应的第二字符分段为“txkj”,该第二字符分段同样位于第一个分隔符之前。
在一种可选的实现方式中,服务器确定第一字符分段与第一字符分段对应的第二字符分段是否相同。若第一字符分段与第一字符分段对应的第二字符分段相同,则相似度为1;若第一字符分段与第一字符分段对应的第二字符分段不同,则相似度为0。可选地,服务器将第二目标信息对应的多个相似度的平均值,确定为第二相似度。例如,对于“txkj-yfwq-a**”和“txkj-yfwq-b**”,存在两个字符分段相同,则第二相似度为2/3。
上述技术方案,在第二目标信息的通配字符串不完全相同时,基于分隔符对第二目标信息的通配字符串进行分割,根据分割后的多个字符分段中存在的相同字符分段的数量,确定第二目标信息的相似程度,从而基于该相似程度,快速筛选出满足条件的多个告警信息,将该多个告警信息划分为同一类别,提高了告警信息的分类效率。
在另一种可选的实现方式中,服务器基于文本相似度算法,确定第一字符分段与第二字符分段的相似度。可选地,服务器将第二目标信息对应的多个相似度的平均值,确定为第二相似度。
需要说明的一点是,若第二目标信息和分类模板信息不包括分隔符,则服务器基于文本相似度算法,确定第二目标的通配字符串与分类模板信息的第二相似度。
408、服务器响应于第二相似度大于第二阈值,确定告警信息所属的告警类别为分类模板信息对应的告警类别。
可选地,第二阈值为预设的任一数值,例如,第二阈值为0.9或者0.95等。若第二相似度大于第二阈值,则将第二目标信息所属的告警信息与分类模板信息所属的告警信息划分为同一告警类别。
继续参见图6,基于通配符处理后的告警收敛依据,对告警信息进行分层收敛。其中,收敛分层包括收敛第一层、收敛第二层和收敛第三层。收敛第一层将告警收敛依据的通配字符串相同的告警信息划分为同一告警类别;收敛第二层对包含分隔符的第二目标信息进行相似度判别,将相似度大于第二阈值的第二目标信息划分为同一告警类别;收敛第三层基于文本相似度算法,确定第二目标信息的通配字符串之间的相似度,将相似度大于第三阈值的第二目标信息划分为同一告警类别。服务器基于多个收敛分层,层层递进的对告警信息进行分类,能够降低告警信息分类的计算量,提高告警信息的分类效率。
需要说明的是,服务器支持用户配置各个收敛分层的分类策略。用户能够根据应用场景,配置相应的分类策略,进一步提高了告警信息处理的通用化程度,提升了告警信息处理方法的可扩展性。
服务器通过多个收敛分层,确定第二目标信息与分类模板信息的相似度是否满足目标条件,也即,确定是否符合分类模板。若符合分类模板,则进行合并收敛。若不符合分类模板,则自成一类。服务器重复告警信息的分类过程,直至遍历收敛分组中的所有告警信息,得到至少一个收敛告警列表。
需要说明的一点是,若收敛分组对应有多个分类模板信息,则服务器将第二目标信息依次与多个分类模板信息进行比较,直至第二目标信息与分类模板信息的相似度满足目标条件,确定第二目标信息所属的告警信息的告警类别为该分分类模板信息对应的告警类别。
若第二目标信息与收敛分组对应的分类模板信息的相似度均不满足目标条件,则将第二目标信息的通配字符串确定为收敛分组对应的另一分类模板信息。
服务器通过上述步骤403至步骤408,将第二目标信息之间的相似度满足目标条件的告警信息划分为同一告警类别。例如,第二目标信息为服务器名称。在一个示例中,分类模板信息为“activity-cvm-*-*-*”,与该分类模板信息对应的告警类别相同的告警信息所包括的第二目标信息包括“activity-cvm-2020-02-27”、“activity-cvm-2020-03-25”、“activity-cvm-2020-05-12”、“activity-cvm-2020-01-11”、“activity-cvm-2020-05-22”、“activity-cvm-2020-03-25”、“activity-cvm-2020-05-27”等。
在另一个示例中,分类模板信息为“TRANSGROUP_*”,与该分类模板信息对应的告警类别相同的告警信息所包括的第二目标信息包括“TRANSGROUP_039”、“TRANSGROUP_035”、“TRANSGROUP_029”、“TRANSGROUP_015”、“TRANSGROUP_035”、“TRANSGROUP_009”、“TRANSGROUP_022”等。
在另一个示例中,分类模板信息为“默认项目*”,与该分类模板信息对应的告警类别相同的告警信息所包括的第二目标信息包括“默认项目096”、“默认项目33”、“默认项目82”、“默认项目96”、“默认项目40”、“默认项目64”、“默认项目53”等。
在另一个示例中,分类模板信息为“windows-*GB-bj-*”,与该分类模板信息对应的告警类别相同的告警信息所包括的第二目标信息包括“windows-1GB-bj-2148”、“windows-1GB-bj-4494”、“windows-1GB-bj-2148”、“windows-2GB-bj-6483”、“windows-1GB-bj-7694”、“windows-1GB-bj-8586”、“windows-2GB--4814”等。若该示例中相似度对应的阈值设置的较小,则对于不同地域的服务器产生的告警信息也能够合并,则与该分类模板信息对应的告警类别相同的告警信息所包括的第二目标信息包括“windows-1GB-bj-2148”、“windows-1GB-sh-8813”、“windows-1GB-bj-4494”、“windows-1GB-bj-2148”、“windows-2GB-bj-6483”、“windows-2GB-gz-1380”、“windows-1GB-bj-7694”、“windows-1GB-bj-8586”、“windows-2GB--4814”、“windows-1GB-gz-8813”、“windows-1GB-cd-5807”、“windows-8GB-cd-8960”、“windows-4GB-cd-3979”等。其中,“sh”代表上海,“gz”代表广州,“cd代表成都”。
需要说明的另一点是,可选地,服务器不将第二目标信息转换为通配字符串,基于文本相似度算法,确定第二目标信息与分类模板信息的相似度;响应于相似度满足目标条件,确定告警信息所属的告警类别为分类模板信息对应的告警类别。其中,分类模板信息为从收敛分组中获取的第一个第二目标信息;或者,分类模板信息为自成一类的第二目标信息。
409、服务器对收敛分组中类别相同的告警信息进行合并,输出至少一个收敛分组对应的告警信息。
服务器将类别相同的多个告警信息合并成一个告警信息,输出合并后的一个告警信息。其中,合并后的告警信息包括第一目标信息、类别相同的多个告警信息对应的分类模板信息。
可选地,合并后的告警信息还包括多个告警信息所包括的第二目标信息。可选地,合并后的告警信息还包括除第一目标信息和第二目标信息之外的其他维度信息,如云服务器的实例ID、发生异常的服务器所在的地域、云服务器的IP地址、UUID等。继续参见图6,服务器通过收敛告警事件输出模块505对告警收敛依据进行合并,对告警收敛维度进行汇总,得到收敛后的告警信息。其中,告警收敛维度指除第一目标信息和第二目标信息之外的其他维度信息。
若多个告警信息所包括的第二目标信息相同,则合并后的告警信息中保留一个第二目标信息,可选地,不再保留对应的分类模板信息。可选地,若多个告警信息所包括的第二目标信息存在差异,则合并后的告警信息包括多个第二目标信息的列表。对于其他维度信息,若多个告警信息所包括的其他维度信息相同,则合并后的告警信息中保留一个该其他维度信息。若多个告警信息所包括的其他维度信息存在差异,可选地,合并后的告警信息包括多个其他维度信息的列表。
本申请实施例提供的技术方案,由于每个告警信息用于对网络服务出现的一次异常进行告警,在网络服务频繁出现异常时,会爆发多个告警信息。因此,首先以告警信息所包括的第一目标信息相同为前提条件,进行收敛分组的划分,使得每个收敛分组包括第一目标信息相同的多个告警信息,从而保证每个收敛分组中的多个告警信息属于同一个大类别,使收敛分组具有进一步分类的意义。进而对每个收敛分组中的多个告警信息进行进一步的分类,得到按照类别划分的多个告警信息,保证了待合并的多个告警信息进行合并的合理性。进而分别将类别相同的告警信息合并成一个告警信息,进行输出。减少了需要输出的告警信息的数量,不再对多个相关的告警信息进行频繁输出;并且,合并后的告警信息的结构更加清晰,信息表示更加明确,可读性较佳,从而有助于相关人员快速发现关键的告警信息,定位出现异常的根本原因,提高异常处理过程中的人机交互效率,进而提高网络服务的运维效率。
需要说明的一点是,在一种可选的实现方式中,服务器对类别相同的多个告警信息进行合并,输出合并后的一个告警信息。在另一种可选的实现方式中,对于类别相同的多个告警信息,服务器单独输出每个告警信息,并输出每个告警信息所属的告警类别,以使终端能够将类别相同的多个告警信息标记为同一类。服务器支持用户配置告警信息的输出形式,从而用户能够选择满足自身需求的告警信息输出方式,提高了告警信息处理方案的通用程度和可扩展性。
需要说明的另一点是,服务器支持用户配置需要显示的其他维度信息。可选地,对于用户指定显示的其他维度信息,服务器对该其他维度信息进行合并处理后输出。对于用户未指定显示的其他维度信息,服务器从告警信息中删除该其他维度信息,对除该其他维度信息之外的其他信息进行合并处理后输出。
需要说明的另一点是,可选地,服务器将类别相同的多个告警信息合并为一个告警信息之后,还对合并后的告警信息进行存储,以便于进行全局的告警分析。相较于分别存储多个告警信息,有效的降低了告警信息的存储成本。
410、终端获取收敛分组对应的告警信息,该告警信息为收敛分组中类别相同的告警信息合并得到的。
服务器向终端发送由类别相同的多个告警信息合并而成的告警信息。终端接收服务器发送的告警信息。
本申请实施例提供的技术方案,对合并后的告警信息进行传输,相较于依次传输多个告警信息,降低了信息传输成本,进而降低了告警通知成本。
411、终端在告警详情界面中显示告警信息,告警信息包括第一显示信息和第二显示信息,其中,第一显示信息为类别相同的告警信息所包括的第一目标信息;第二显示信息为类别相同的告警信息所包括的第二目标信息对应的分类模板信息。
告警详情界面为告警事件的详情展示界面,用于显示相关的告警信息。可选地,告警详情界面为终端上客户端的界面。例如,终端上运行有即时通信客户端,终端能够基于即时通信客户端的小程序服务提供告警信息通知功能,相应的,告警详情界面为告警小程序的界面。
在一种可选的实现方式中,类别相同的多个告警信息所包括的第二目标信息存在差异,则终端以一个通配字符串代表多个第二目标信息,显示在告警详情界面中。
例如,图7是本申请实施例提供的一种告警详情界面的示意图,参见图7,该告警详情界面用于对5个告警信息合并而成的告警信息进行显示。上述5个告警信息属于同一告警类别。上述5个告警信息中的服务名称、事件名称以及账号信息作为告警收敛前提701,均相同,在告警详情界面的最前端展示一次。上述5个告警信息中的服务器名称均不同,上述5个告警信息所属的告警类别对应的分类模板信息为“*-*-*-*-*”,是上述5个告警信息的服务器名称的通配形式,作为告警收敛依据702,显示在告警收敛前提701之后。
可选地,若类别相同的多个告警信息所包括的第二目标信息不同,终端还在告警详情界面中,以列表的形式显示每个告警信息所包括的第二目标信息。也即是,终端响应于类别相同的告警信息所包括的第二目标信息不同,在告警详情界面中,以列表的形式显示类别相同的告警信息所包括的第二目标信息。例如,继续参见图7,以列表形式显示的多个第二目标信息作为附加信息704显示在告警详情界面中。
需要说明的是,终端以列表的形式显示每个告警信息所包括的第二目标信息,便于相关人员查看多个告警信息的分类效果,基于当前所达到的分类效果,对第二目标信息与分类模板信息所需满足的目标条件进行调整,以达到所需的分类效果,进一步提高告警信息分类的可靠性。
例如,继续参见图7,第二目标信息为服务器名称,上述5个告警信息所包括的服务器名称均不相同,终端将每个告警信息所包括的服务器名称作为附加信息,以列表的形式显示在告警详情界面中。
可选地,除第一显示信息和第二显示信息之外,合并后的告警信息还包括其他维度信息,如云服务器的实例ID、发生异常的服务器所在的地域、云服务器的IP地址、UUID等。上述其他维度信息也称为告警收敛维度703。对于每个其他维度信息,若多个告警信息所包括的其他维度信息相同,则合并为一个进行显示;若多个告警信息所包括的其他维度信息不同,则汇总为列表的形式进行显示。相应的,终端显示其他维度信息的步骤包括:终端响应于类别相同的告警信息所包括的其他维度信息相同,在告警详情界面中,显示其他维度信息;响应于类别相同的告警信息所包括的其他维度信息不同,在告警详情界面中,以列表的形式显示类别相同的告警信息所包括的其他维度信息。
例如,继续参见图7,合并后的告警信息还包括内网IP、公网IP、UUID、实例ID以及地域。其中,多个告警信息所包括的内网IP、公网IP、UUID、实例ID均不相同,终端以列表的形式对多个告警信息所包括内网IP、公网IP、UUID、实例ID进行显示。多个告警信息所包括的地域均为上海,终端在告警详情界面中对“地域:上海”进行一次显示。
可选地,其他维度信息还包括事件量。事件量为合并后的告警信息对应的告警事件的数量,继续参见图7,事件量为5,事件量作为附加信息704显示在告警详情界面中。可选地,其他维度信息还包括告警事件的触发时间。告警详情界面以列表的形式分别显示多个告警事件的触发事件;或者,告警详情界面显示多个告警事件中最早触发的告警事件的触发时间以及最晚触发的告警事件的触发时间。
在另一种可选的实现方式中,类别相同的多个告警信息所包括的第二目标信息相同,则终端在告警详情界面中显示一个原始的第二目标信息。例如,图8是本申请实施例提供的一种告警详情界面的示意图,参见图8,该告警详情界面用于对4个告警信息合并而成的告警信息进行显示。其中,类别相同的多个告警信息所包括的第二目标信息均为“xavierpan-cvm”,服务器将“xavierpan-cvm”作为告警收敛依据802,显示在告警收敛前提801之后。
本申请实施例提供的技术方案,在告警详情界面中,对多个告警信息的合并显示,其中,相同的多个第一目标信息合并为一个进行显示,存在差异的多个第二目标信息由对应的分类模板信息来表示,从而使得所显示的告警信息的结构更加清晰,信息表示更加明确,可读性较佳,有助于相关人员快速发现关键的告警信息,定位出现异常的根本原因,提高异常处理过程中的人机交互效率,进而提高网络服务的运维效率。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
图9是本申请实施例提供的一种告警信息处理装置的框图。参见图9,该装置包括:
第一获取模块901,用于获取多个告警信息,告警信息与告警事件关联,告警事件用于指示网络服务出现异常;
划分模块902,用于基于告警信息所包括的第一目标信息,将第一目标信息相同的告警信息划分为同一收敛分组,得到至少一个收敛分组;
分类模块903,用于对至少一个收敛分组中的告警信息进行分类;
输出模块904,用于对收敛分组中类别相同的告警信息进行合并,输出至少一个收敛分组对应的告警信息。
在一种可选的实现方式中,分类模块903,包括:
第一获取单元,用于从告警信息中获取第二目标信息;
第二获取单元,用于获取收敛分组对应的分类模板信息;
相似度确定单元,用于确定第二目标信息与分类模板信息的相似度;
类别确定单元,用于响应于第二目标信息与分类模板信息的相似度满足目标条件,确定告警信息所属的告警类别为分类模板信息对应的告警类别。
在另一种可选的实现方式中,相似度确定单元,用于:
从第二目标信息中识别出符合目标特征的至少一个字符;
将至少一个字符转换为通配符,得到第二目标信息的通配字符串;
确定通配字符串与分类模板信息的相似度。
在另一种可选的实现方式中,类别确定单元,包括:
第一类别确定子单元,用于响应于第二目标信息与分类模板信息的第一相似度大于或等于第一阈值,确定告警信息所属的告警类别为分类模板信息对应的告警类别;
相似度确定子单元,用于响应于第一相似度小于第一阈值,确定第二目标信息与分类模板信息的第二相似度;
第二类别确定子单元,用于响应于第二相似度大于第二阈值,确定告警信息所属的告警类别为分类模板信息对应的告警类别。
在另一种可选的实现方式中,相似度确定子单元,用于:
响应于第一相似度小于第一阈值,且第二目标信息和分类模板信息包括分隔符,基于第二目标信息中的分隔符,将第二目标信息分割为多个第一字符分段,以及,基于分类模板信息中的分隔符,将分类模板信息分割为多个第二字符分段;
分别确定第一字符分段与第一字符分段对应的第二字符分段的相似度,得到第二目标信息对应的多个相似度;
基于第二目标信息对应的多个相似度,确定第二目标信息与分类模板信息的第二相似度。
在另一种可选的实现方式中,第二获取单元,用于:
响应于不存在收敛分组对应的分类模板信息,将第二目标信息的通配字符串确定为收敛分组对应的分类模板信息;
响应于存在收敛分组对应的分类模板信息,执行获取收敛分组对应的分类模板信息的步骤。
在另一种可选的实现方式中,第二获取单元,还用于:
响应于第二目标信息与分类模板信息的相似度不满足目标条件,将第二目标信息的通配字符串确定为收敛分组对应的另一分类模板信息。
在另一种可选的实现方式中,第一获取模块901,包括:
接收单元,用于接收告警信息;
告警信息确定单元,用于将目标时间段内接收到的告警信息,作为多个告警信息。
在另一种可选的实现方式中,告警信息确定单元,用于将目标时间段内接收到的与发生频率大于频率阈值的告警事件关联的告警信息,作为多个告警信息。
在另一种可选的实现方式中,第一获取模块901,用于:
接收告警信息;
获取与告警信息关联的告警事件对应的目标时长,目标时长与告警事件的处理紧急程度呈负相关;
以接收到告警信息的时间为起始时间,将在目标时长内接收到的与告警事件关联的告警信息,作为多个告警信息。
在另一种可选的实现方式中,第一目标信息包括告警事件的事件名称、告警事件对应的网络服务的服务名称以及应用网络服务的账号信息中的至少一个。
在另一种可选的实现方式中,第二目标信息包括告警事件对应的服务器名称。
需要说明的是:上述实施例提供的告警信息处理装置在处理告警信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的告警信息处理装置与告警信息处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请实施例提供的技术方案,由于每个告警信息用于对网络服务出现的一次异常进行告警,在网络服务频繁出现异常时,会爆发多个告警信息。因此,首先以告警信息所包括的第一目标信息相同为前提条件,进行收敛分组的划分,使得每个收敛分组包括第一目标信息相同的多个告警信息,从而保证每个收敛分组中的多个告警信息属于同一个大类别,使收敛分组具有进一步分类的意义。进而对每个收敛分组中的多个告警信息进行进一步的分类,得到按照类别划分的多个告警信息,保证了待合并的多个告警信息进行合并的合理性。进而分别将类别相同的告警信息合并成一个告警信息,进行输出。减少了需要输出的告警信息的数量,不再对多个相关的告警信息进行频繁输出;并且,合并后的告警信息的结构更加清晰,信息表示更加明确,可读性较佳,从而有助于相关人员快速发现关键的告警信息,定位出现异常的根本原因,提高异常处理过程中的人机交互效率,进而提高网络服务的运维效率。
图10是本申请实施例提供的一种告警信息处理装置的框图。参见图10,该装置包括:
第二获取模块1001,用于获取收敛分组对应的告警信息,收敛分组中的告警信息所包括的第一目标信息相同,告警信息为收敛分组中类别相同的告警信息合并得到的;
显示模块1002,用于在告警详情界面中显示告警信息,告警信息包括第一显示信息和第二显示信息;
其中,第一显示信息为类别相同的告警信息所包括的第一目标信息;第二显示信息为类别相同的告警信息所包括的第二目标信息对应的分类模板信息。
在一种可选的实现方式中,显示模块1002,还用于响应于类别相同的告警信息所包括的第二目标信息不同,在告警详情界面中,以列表的形式显示类别相同的告警信息所包括的第二目标信息。
在另一种可选的实现方式中,告警信息还包括除第一显示信息和第二显示信息之外的其他维度信息,显示模块1002,还用于:
响应于类别相同的告警信息所包括的其他维度信息相同,在告警详情界面中,显示其他维度信息;
响应于类别相同的告警信息所包括的其他维度信息不同,在告警详情界面中,以列表的形式显示类别相同的告警信息所包括的其他维度信息。
需要说明的是:上述实施例提供的告警信息处理装置在处理告警信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将终端的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的告警信息处理装置与告警信息处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请实施例提供的技术方案,在告警详情界面中,对多个告警信息的合并显示,其中,相同的多个第一目标信息合并为一个进行显示,存在差异的多个第二目标信息由对应的分类模板信息来表示,从而使得所显示的告警信息的结构更加清晰,信息表示更加明确,可读性较佳,有助于相关人员快速发现关键的告警信息,定位出现异常的根本原因,提高异常处理过程中的人机交互效率,进而提高网络服务的运维效率。
本申请实施例提供了一种计算机设备,用于执行上述各个实施例提供的告警信息处理方法,该计算机设备可以实现为终端或者服务器,下面先对终端的结构进行介绍:
图11示出了本申请一个示例性实施例提供的终端1100的结构框图。该终端1100可以是:智能手机、平板电脑、、笔记本电脑或台式电脑。终端1100还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端1100包括有:处理器1101和存储器1102。
处理器1101可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1101可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1101也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1101可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1101还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1102可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1102还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1102中的非暂态的计算机可读存储介质用于存储至少一条程序代码,该至少一条程序代码用于被处理器1101所执行以实现本申请中方法实施例提供的告警信息处理方法。
在一些实施例中,终端1100还可选包括有:外围设备接口1103和至少一个外围设备。处理器1101、存储器1102和外围设备接口1103之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1103相连。具体地,外围设备包括:射频电路1104、显示屏1105、摄像头组件1106、音频电路1107、定位组件1108和电源1109中的至少一种。
外围设备接口1103可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1101和存储器1102。在一些实施例中,处理器1101、存储器1102和外围设备接口1103被集成在同一芯片或电路板上;在一些其他实施例中,处理器1101、存储器1102和外围设备接口1103中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1104用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1104通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1104将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1104包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1104可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1104还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1105用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1105是触摸显示屏时,显示屏1105还具有采集在显示屏1105的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1101进行处理。此时,显示屏1105还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1105可以为一个,设置在终端1100的前面板;在另一些实施例中,显示屏1105可以为至少两个,分别设置在终端1100的不同表面或呈折叠设计;在另一些实施例中,显示屏1105可以是柔性显示屏,设置在终端1100的弯曲表面上或折叠面上。甚至,显示屏1105还可以设置成非矩形的不规则图形,也即异形屏。显示屏1105可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-EmittingDiode,有机发光二极管)等材质制备。
摄像头组件1106用于采集图像或视频。可选地,摄像头组件1106包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1106还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1107可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1101进行处理,或者输入至射频电路1104以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1100的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1101或射频电路1104的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1107还可以包括耳机插孔。
定位组件1108用于定位终端1100的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件1108可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源1109用于为终端1100中的各个组件进行供电。电源1109可以是交流电、直流电、一次性电池或可充电电池。当电源1109包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1100还包括有一个或多个传感器1110。该一个或多个传感器1110包括但不限于:加速度传感器1111、陀螺仪传感器1112、压力传感器1113、指纹传感器1114、光学传感器1115以及接近传感器1116。
本领域技术人员可以理解,图11中示出的结构并不构成对终端1100的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
上述计算机设备还可以实现为服务器,下面对服务器的结构进行介绍:
图12是本申请实施例提供的一种服务器的框图,该服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)1201和一个或一个以上的存储器1202,其中,存储器1202中存储有至少一条程序代码,至少一条程序代码由处理器1201加载并执行以实现上述各个方法实施例提供的告警信息处理方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条程序代码,上述至少一条程序代码可由计算机设备中的处理器执行以完成上述实施例中的告警信息处理方法。例如,计算机可读存储介质可以是ROM(Read-OnlyMemory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、CD-ROM(CompactDisc Read-Only Memory,只读光盘)、磁带、软盘和光数据存储设备等。
本申请还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机程序代码,该计算机程序代码存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行该计算机程序代码,使得该计算机设备执行上述各个方法实施例中的告警信息处理方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,上述程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种告警信息处理方法,其特征在于,所述方法包括:
获取多个告警信息,所述告警信息与告警事件关联,所述告警事件用于指示网络服务出现异常;
基于所述告警信息所包括的第一目标信息,将所述第一目标信息相同的告警信息划分为同一收敛分组,得到至少一个收敛分组;
对所述至少一个收敛分组中的告警信息进行分类;
对所述收敛分组中类别相同的告警信息进行合并,输出所述至少一个收敛分组对应的告警信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述至少一个收敛分组中的告警信息进行分类,包括:
从所述告警信息中获取第二目标信息;
获取所述收敛分组对应的分类模板信息;
确定所述第二目标信息与所述分类模板信息的相似度;
响应于所述第二目标信息与所述分类模板信息的相似度满足目标条件,确定所述告警信息所属的告警类别为所述分类模板信息对应的告警类别。
3.根据权利要求2所述的方法,其特征在于,所述确定所述第二目标信息与所述分类模板信息的相似度,包括:
从所述第二目标信息中识别出符合目标特征的至少一个字符;
将所述至少一个字符转换为通配符,得到所述第二目标信息的通配字符串;
确定所述通配字符串与所述分类模板信息的相似度。
4.根据权利要求2所述的方法,其特征在于,所述响应于所述第二目标信息与所述分类模板信息的相似度满足目标条件,确定所述告警信息所属的告警类别为所述分类模板信息对应的告警类别,包括:
响应于所述第二目标信息与所述分类模板信息的第一相似度大于或等于第一阈值,确定所述告警信息所属的告警类别为所述分类模板信息对应的告警类别;
响应于所述第一相似度小于所述第一阈值,确定所述第二目标信息与所述分类模板信息的第二相似度;
响应于所述第二相似度大于第二阈值,确定所述告警信息所属的告警类别为所述分类模板信息对应的告警类别。
5.根据权利要求4所述的方法,其特征在于,所述响应于所述第一相似度小于所述第一阈值,确定所述第二目标信息与所述分类模板信息的第二相似度,包括:
响应于所述第一相似度小于所述第一阈值,且所述第二目标信息和所述分类模板信息包括分隔符,基于所述第二目标信息中的分隔符,将所述第二目标信息分割为多个第一字符分段,以及,基于所述分类模板信息中的分隔符,将所述分类模板信息分割为多个第二字符分段;
分别确定所述第一字符分段与所述第一字符分段对应的第二字符分段的相似度,得到所述第二目标信息对应的多个相似度;
基于所述第二目标信息对应的多个相似度,确定所述第二目标信息与所述分类模板信息的第二相似度。
6.根据权利要求2所述的方法,其特征在于,所述获取所述收敛分组对应的分类模板信息,包括:
响应于不存在所述收敛分组对应的分类模板信息,将所述第二目标信息的通配字符串确定为所述收敛分组对应的分类模板信息;
响应于存在所述收敛分组对应的分类模板信息,执行所述获取所述收敛分组对应的分类模板信息的步骤。
7.根据权利要求1所述的方法,其特征在于,所述获取多个告警信息,包括:
接收告警信息;
将目标时间段内接收到的告警信息,作为所述多个告警信息。
8.根据权利要求7所述的方法,其特征在于,所述将目标时间段内接收到的告警信息,作为所述多个告警信息,包括:
将所述目标时间段内接收到的与发生频率大于频率阈值的告警事件关联的告警信息,作为所述多个告警信息。
9.根据权利要求1所述的方法,其特征在于,所述获取多个告警信息,包括:
接收告警信息;
获取与所述告警信息关联的告警事件对应的目标时长,所述目标时长与所述告警事件的处理紧急程度呈负相关;
以接收到所述告警信息的时间为起始时间,将在所述目标时长内接收到的与所述告警事件关联的告警信息,作为所述多个告警信息。
10.一种告警信息处理方法,其特征在于,所述方法包括:
获取收敛分组对应的告警信息,所述收敛分组中的告警信息所包括的第一目标信息相同,所述告警信息为所述收敛分组中类别相同的告警信息合并得到的;
在告警详情界面中显示所述告警信息,所述告警信息包括第一显示信息和第二显示信息;
其中,所述第一显示信息为类别相同的告警信息所包括的第一目标信息;所述第二显示信息为类别相同的告警信息所包括的第二目标信息对应的分类模板信息。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
响应于类别相同的告警信息所包括的第二目标信息不同,在所述告警详情界面中,以列表的形式显示类别相同的告警信息所包括的第二目标信息。
12.根据权利要求10所述的方法,其特征在于,所述告警信息还包括除所述第一显示信息和所述第二显示信息之外的其他维度信息,所述方法还包括:
响应于类别相同的告警信息所包括的其他维度信息相同,在所述告警详情界面中,显示所述其他维度信息;
响应于类别相同的告警信息所包括的其他维度信息不同,在所述告警详情界面中,以列表的形式显示类别相同的告警信息所包括的其他维度信息。
13.一种告警信息处理装置,其特征在于,所述装置包括多个功能模块,用于实现如权利要求1-12任一项所述的告警信息处理方法。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如权利要求1-12任一项所述的告警信息处理方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如权利要求1-12任一项所述的告警信息处理方法。
CN202010796707.3A 2020-08-10 2020-08-10 告警信息处理方法、装置、计算机设备及存储介质 Active CN111953541B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010796707.3A CN111953541B (zh) 2020-08-10 2020-08-10 告警信息处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010796707.3A CN111953541B (zh) 2020-08-10 2020-08-10 告警信息处理方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN111953541A true CN111953541A (zh) 2020-11-17
CN111953541B CN111953541B (zh) 2023-12-05

Family

ID=73332011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010796707.3A Active CN111953541B (zh) 2020-08-10 2020-08-10 告警信息处理方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111953541B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651656A (zh) * 2020-12-31 2021-04-13 四川弘和通讯有限公司 一种基于时间线方式检测火情动态趋势方法及系统
CN112988509A (zh) * 2021-03-09 2021-06-18 京东数字科技控股股份有限公司 一种告警消息过滤方法、装置、电子设备及存储介质
CN113645073A (zh) * 2021-08-11 2021-11-12 未鲲(上海)科技服务有限公司 告警邮件处理方法、装置、电子设备及存储介质
CN113844976A (zh) * 2021-09-10 2021-12-28 北京声智科技有限公司 告警数据的处理方法、装置、计算机设备和存储介质
WO2022156293A1 (zh) * 2021-01-22 2022-07-28 华为技术有限公司 处理告警日志的方法、装置及存储介质
CN115019242A (zh) * 2022-08-05 2022-09-06 中电科新型智慧城市研究院有限公司 一种交通场景的异常事件检测方法、装置和处理设备
CN116991684A (zh) * 2023-08-03 2023-11-03 北京优特捷信息技术有限公司 一种告警信息处理方法、装置、设备及介质

Citations (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0808744D0 (en) * 2007-05-16 2008-06-18 Gen Electric System and method of discovering, detecting and classifying alarm patterns for electrophysiological monitoring systems
CN102717815A (zh) * 2012-05-15 2012-10-10 江苏物泰信息科技有限公司 一种特种车智能告警方法及其告警系统
CN103545922A (zh) * 2013-09-24 2014-01-29 许继集团有限公司 基于多场景分析的智能告警推理方法
CN105389652A (zh) * 2015-10-29 2016-03-09 国电南瑞科技股份有限公司 一种面向变电站设备集中监控的告警信号动态分类方法
CN105450436A (zh) * 2014-09-12 2016-03-30 中兴通讯股份有限公司 网管告警显示方法和装置
US20160098402A1 (en) * 2014-10-02 2016-04-07 Splunk Inc. Custom Communication Alerts
CN105634822A (zh) * 2016-01-15 2016-06-01 武汉烽火网络有限责任公司 基于告警分组实现快速查询告警信息的方法及装置
CN106502683A (zh) * 2016-10-31 2017-03-15 广东电网有限责任公司电力调度控制中心 一种实时告警的动态定制分类展示方法及装置
CN107105448A (zh) * 2016-02-23 2017-08-29 中国移动通信集团内蒙古有限公司 一种告警信息显示方法和装置
CN107124298A (zh) * 2017-03-31 2017-09-01 北京奇艺世纪科技有限公司 告警聚合方法及系统
WO2017181805A1 (zh) * 2016-04-20 2017-10-26 中兴通讯股份有限公司 告警信息的显示方法及装置、计算机存储介质
CN107562556A (zh) * 2017-08-14 2018-01-09 腾讯科技(深圳)有限公司 故障的恢复方法、恢复装置及存储介质
CN107968483A (zh) * 2017-12-06 2018-04-27 贵州电网有限责任公司 一种调度自动化主站系统可视化智能监视方法
CN108563652A (zh) * 2017-12-20 2018-09-21 海南电网有限责任公司 基于蛮力搜索算法的基准信息分类方法
CN108712294A (zh) * 2018-06-05 2018-10-26 陈艳 一种基于Syslog知识库实现网络设备监控告警的方法
US20180322508A1 (en) * 2017-05-05 2018-11-08 Servicenow, Inc. Identifying clusters for service management operations
CN108897664A (zh) * 2018-06-28 2018-11-27 北京九章云极科技有限公司 一种信息展示方法及系统
CN109660388A (zh) * 2018-12-03 2019-04-19 郑州云海信息技术有限公司 一种基于云平台的告警管理方法及装置
CN109787809A (zh) * 2018-12-07 2019-05-21 北京盛世全景科技股份有限公司 一种全景易视智能运维系统
WO2019109351A1 (zh) * 2017-12-08 2019-06-13 深圳迈瑞生物医疗电子股份有限公司 监护设备中生理参数的统计显示方法及监护设备
CN110138583A (zh) * 2019-03-03 2019-08-16 北京立思辰安科技术有限公司 一种报警智能分析的展示方法
CN110224858A (zh) * 2019-05-16 2019-09-10 平安科技(深圳)有限公司 基于日志的告警方法及相关装置
CN110598645A (zh) * 2019-09-17 2019-12-20 北京西骏数据科技股份有限公司 一种快速修复信息系统的故障和风险的方法
CN110597719A (zh) * 2019-09-05 2019-12-20 腾讯科技(深圳)有限公司 一种用于适配测试的图像聚类方法、装置及介质
KR20190143229A (ko) * 2018-06-20 2019-12-30 주식회사 케이티 네트워크 장애경보 관리장치 및 방법
CN111092748A (zh) * 2019-11-14 2020-05-01 远景智能国际私人投资有限公司 物联网设备的告警规则设置方法、装置、设备及存储介质
CN111385148A (zh) * 2020-03-06 2020-07-07 深圳鼎盛电脑科技有限公司 业务告警方法、装置、计算机设备及存储介质

Patent Citations (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0808744D0 (en) * 2007-05-16 2008-06-18 Gen Electric System and method of discovering, detecting and classifying alarm patterns for electrophysiological monitoring systems
CN102717815A (zh) * 2012-05-15 2012-10-10 江苏物泰信息科技有限公司 一种特种车智能告警方法及其告警系统
CN103545922A (zh) * 2013-09-24 2014-01-29 许继集团有限公司 基于多场景分析的智能告警推理方法
CN105450436A (zh) * 2014-09-12 2016-03-30 中兴通讯股份有限公司 网管告警显示方法和装置
US20160098402A1 (en) * 2014-10-02 2016-04-07 Splunk Inc. Custom Communication Alerts
CN105389652A (zh) * 2015-10-29 2016-03-09 国电南瑞科技股份有限公司 一种面向变电站设备集中监控的告警信号动态分类方法
CN105634822A (zh) * 2016-01-15 2016-06-01 武汉烽火网络有限责任公司 基于告警分组实现快速查询告警信息的方法及装置
CN107105448A (zh) * 2016-02-23 2017-08-29 中国移动通信集团内蒙古有限公司 一种告警信息显示方法和装置
WO2017181805A1 (zh) * 2016-04-20 2017-10-26 中兴通讯股份有限公司 告警信息的显示方法及装置、计算机存储介质
CN106502683A (zh) * 2016-10-31 2017-03-15 广东电网有限责任公司电力调度控制中心 一种实时告警的动态定制分类展示方法及装置
CN107124298A (zh) * 2017-03-31 2017-09-01 北京奇艺世纪科技有限公司 告警聚合方法及系统
US20180322508A1 (en) * 2017-05-05 2018-11-08 Servicenow, Inc. Identifying clusters for service management operations
CN107562556A (zh) * 2017-08-14 2018-01-09 腾讯科技(深圳)有限公司 故障的恢复方法、恢复装置及存储介质
CN107968483A (zh) * 2017-12-06 2018-04-27 贵州电网有限责任公司 一种调度自动化主站系统可视化智能监视方法
WO2019109351A1 (zh) * 2017-12-08 2019-06-13 深圳迈瑞生物医疗电子股份有限公司 监护设备中生理参数的统计显示方法及监护设备
CN108563652A (zh) * 2017-12-20 2018-09-21 海南电网有限责任公司 基于蛮力搜索算法的基准信息分类方法
CN108712294A (zh) * 2018-06-05 2018-10-26 陈艳 一种基于Syslog知识库实现网络设备监控告警的方法
KR20190143229A (ko) * 2018-06-20 2019-12-30 주식회사 케이티 네트워크 장애경보 관리장치 및 방법
CN108897664A (zh) * 2018-06-28 2018-11-27 北京九章云极科技有限公司 一种信息展示方法及系统
CN109660388A (zh) * 2018-12-03 2019-04-19 郑州云海信息技术有限公司 一种基于云平台的告警管理方法及装置
CN109787809A (zh) * 2018-12-07 2019-05-21 北京盛世全景科技股份有限公司 一种全景易视智能运维系统
CN110138583A (zh) * 2019-03-03 2019-08-16 北京立思辰安科技术有限公司 一种报警智能分析的展示方法
CN110224858A (zh) * 2019-05-16 2019-09-10 平安科技(深圳)有限公司 基于日志的告警方法及相关装置
CN110597719A (zh) * 2019-09-05 2019-12-20 腾讯科技(深圳)有限公司 一种用于适配测试的图像聚类方法、装置及介质
CN110598645A (zh) * 2019-09-17 2019-12-20 北京西骏数据科技股份有限公司 一种快速修复信息系统的故障和风险的方法
CN111092748A (zh) * 2019-11-14 2020-05-01 远景智能国际私人投资有限公司 物联网设备的告警规则设置方法、装置、设备及存储介质
CN111385148A (zh) * 2020-03-06 2020-07-07 深圳鼎盛电脑科技有限公司 业务告警方法、装置、计算机设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王祥浩;赵仰东;吴琳;赵家庆;宋英华;: "基于时态产生式规则的配电网告警综合推理方法的研究", 供用电, no. 10 *
石艳荣;贺永强;: "一种基于关联的IDS告警分析模型", 微电子学与计算机, no. 12 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651656A (zh) * 2020-12-31 2021-04-13 四川弘和通讯有限公司 一种基于时间线方式检测火情动态趋势方法及系统
CN112651656B (zh) * 2020-12-31 2023-11-07 四川弘和通讯有限公司 一种基于时间线方式检测火情动态趋势方法及系统
WO2022156293A1 (zh) * 2021-01-22 2022-07-28 华为技术有限公司 处理告警日志的方法、装置及存储介质
CN112988509A (zh) * 2021-03-09 2021-06-18 京东数字科技控股股份有限公司 一种告警消息过滤方法、装置、电子设备及存储介质
CN113645073A (zh) * 2021-08-11 2021-11-12 未鲲(上海)科技服务有限公司 告警邮件处理方法、装置、电子设备及存储介质
CN113844976A (zh) * 2021-09-10 2021-12-28 北京声智科技有限公司 告警数据的处理方法、装置、计算机设备和存储介质
CN115019242A (zh) * 2022-08-05 2022-09-06 中电科新型智慧城市研究院有限公司 一种交通场景的异常事件检测方法、装置和处理设备
CN115019242B (zh) * 2022-08-05 2022-11-04 中电科新型智慧城市研究院有限公司 一种交通场景的异常事件检测方法、装置和处理设备
CN116991684A (zh) * 2023-08-03 2023-11-03 北京优特捷信息技术有限公司 一种告警信息处理方法、装置、设备及介质
CN116991684B (zh) * 2023-08-03 2024-01-30 北京优特捷信息技术有限公司 一种告警信息处理方法、装置、设备及介质

Also Published As

Publication number Publication date
CN111953541B (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
CN111953541B (zh) 告警信息处理方法、装置、计算机设备及存储介质
CN110209952B (zh) 信息推荐方法、装置、设备及存储介质
US10127453B2 (en) Automatically detecting an event and determining whether the event is a particular type of event
US10142213B1 (en) Techniques for providing event driven notifications
US8913730B2 (en) Communication system with message prioritization mechanism and method of operation thereof
JP2017215995A (ja) メッセージ・アクティビティおよび通知値に基づく視覚通知パラメータの調整
US9652196B2 (en) Smart audio routing management
WO2021233262A1 (zh) 通信控制
CN111090687B (zh) 数据处理方法及装置、系统、计算机可读存储介质
CN111953811A (zh) 站点访问方法、站点注册方法、装置、设备及存储介质
CN111800443A (zh) 数据处理系统和方法、装置以及电子设备
CN113507461B (zh) 基于大数据的网络监控系统及网络监控方法
CN114244595A (zh) 权限信息的获取方法、装置、计算机设备及存储介质
CN113377626A (zh) 基于服务树的可视化统一报警方法、装置、设备和介质
CN117221324B (zh) 云服务器的创建任务分发方法、装置、电子设备及介质
US11005797B2 (en) Method, system and server for removing alerts
US11010810B1 (en) Computerized system and method for automatically establishing a network connection for a real-time video conference between users
CN113472580A (zh) 基于动态加载机制的告警系统及告警方法
US11277300B2 (en) Method and apparatus for outputting information
CN114756301A (zh) 日志处理方法、装置和系统
US9426173B2 (en) System and method for elimination of spam in a data stream according to information density
US10410497B1 (en) Anonymous notification and intervention of users requiring assistance
US10693984B2 (en) Automated mobile device notification routing
CN114338903B (zh) 消息发送方法、装置及可读程序介质
CN114785722B (zh) 监控数据处理方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant