CN114172785B - 告警信息处理方法、装置、设备和存储介质 - Google Patents

告警信息处理方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN114172785B
CN114172785B CN202111227009.2A CN202111227009A CN114172785B CN 114172785 B CN114172785 B CN 114172785B CN 202111227009 A CN202111227009 A CN 202111227009A CN 114172785 B CN114172785 B CN 114172785B
Authority
CN
China
Prior art keywords
alarm
information
alarm information
alert
rule data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111227009.2A
Other languages
English (en)
Other versions
CN114172785A (zh
Inventor
庞飞川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Baiguoyuan Information Technology Co Ltd
Original Assignee
Guangzhou Baiguoyuan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Baiguoyuan Information Technology Co Ltd filed Critical Guangzhou Baiguoyuan Information Technology Co Ltd
Priority to CN202111227009.2A priority Critical patent/CN114172785B/zh
Publication of CN114172785A publication Critical patent/CN114172785A/zh
Application granted granted Critical
Publication of CN114172785B publication Critical patent/CN114172785B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0609Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on severity or priority
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0618Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on the physical or logical position
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Alarm Systems (AREA)

Abstract

本发明实施例公开了一种告警信息处理方法、装置、设备和存储介质,该方法包括:获取待处理的告警信息,加载预先设置的告警规则数据,所述告警规则数据包括告警输入信息项和告警过滤信息项;根据所述告警输入信息项对所述告警信息进行筛选得到多个第一告警信息;根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息。本方案可以最大化程度的减少无用告警信息的发出,告警信息收敛情况良好。

Description

告警信息处理方法、装置、设备和存储介质
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种告警信息处理方法、装置、设备和存储介质。
背景技术
随着网络技术的发展,网络连接的稳定性以及网络设备运行的可靠性是需要重点解决关注的问题。通过对网络以及网络设备的运行情况进行监控,在其出现问题时给出相应的告警信息,能够帮助相关人员及时发现问题来源。在实际应用过程中,由于网络结构本身的复杂性(如包括公网网络、专线网络和内网网络等不同类型的通信网络),以及服务器、交换机等网络设备部署架构的复杂性(如设备数量、设备型号、设备部署区域众多等),因而会导致告警信息数量的激增,进而导致相关维护人员需要处理的工作量显著增加,也会导致关键性的告警信息不易第一时间发现。
现有技术中,通常会采用时间窗口算法对一定时间窗口内产生的所有告警信息进行收敛处理,再将处理后的告警信息发送至相关维护人员,以避免大量告警信息的直接发送。具体的收敛处理方式包括:将告警信息按照风险严重性和时间紧迫性进行分组,得到告警信息的优先级,根据优先级的高低选择需要发送的告警信息;或者,将告警信息基于不同的主机设备进行合并,合并后进行发送;或者,人为进行告警场景的设定,将同一告警场景下的告警信息进行合并后发送。上述告警信息的处理方式,灵活性差、信息冗余度高,需要改进。
发明内容
本发明实施例提供了一种告警信息处理方法、装置、设备和存储介质,解决了现有技术中告警信息处理灵活性差,得到的最终告警信息冗余度高的问题,最大化程度的减少了无用告警信息的发出,告警信息收敛情况良好。
第一方面,本发明实施例提供了一种告警信息处理方法,该方法包括:
获取待处理的告警信息,加载预先设置的告警规则数据,所述告警规则数据包括告警输入信息项和告警过滤信息项;
根据所述告警输入信息项对所述告警信息进行筛选得到多个第一告警信息;
根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息。
第二方面,本发明实施例还提供了一种告警信息处理装置,包括:
数据获取模块,用于获取待处理的告警信息,加载预先设置的告警规则数据,所述告警规则数据包括告警输入信息项和告警过滤信息项;
告警信息筛选模块,用于根据所述告警输入信息项对所述告警信息进行筛选得到多个第一告警信息;
告警信息收敛模块,用于根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息。
第三方面,本发明实施例还提供了一种告警信息处理设备,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所述的告警信息处理方法。
第四方面,本发明实施例还提供了一种存储计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本发明实施例所述的告警信息处理方法。
本发明实施例中,通过获取待处理的告警信息,加载预先设置的告警规则数据,其中,告警规则数据包括告警输入信息项和告警过滤信息项,根据告警输入信息项对告警信息进行筛选得到多个第一告警信息后,再根据告警过滤信息项对多个第一告警信息进行收敛处理得到第二告警信息,该种告警信息的处理方法,灵活性更强,可以最大化程度的减少了无用告警信息的发出,告警信息收敛情况良好。
附图说明
图1为本发明实施例提供的一种告警信息处理方法的流程图;
图2为本发明实施例提供的一种根据告警输入信息项对告警信息进行筛选的方法的流程图;
图3为本发明实施例提供的一种根据在第三告警信息确定第一告警信息的方法的流程图;
图4为本发明实施例提供的一种进行告警信息发送的方法的流程图;
图5为本发明实施例提供的一种对告警信息进行处理时递归收敛处理的方法的流程图;
图6为本发明实施例提供的一种告警信息处理装置的结构框图;
图7为本发明实施例提供的一种告警信息处理设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明实施例,而非对本发明实施例的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明实施例相关的部分而非全部结构。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明实施例提供的一种告警信息处理方法的流程图,可用于对网络或网络设备等生成的告警信息进行收敛处理,该方法可以由计算设备如台式机、笔记本、后台服务器、平板电脑和智能手机等设备来执行,具体包括如下步骤:
步骤S101、获取待处理的告警信息,加载预先设置的告警规则数据,所述告警规则数据包括告警输入信息项和告警过滤信息项。
其中,该告警信息可以是对网络或网络设备进行监控告警得到的信息。可选的,可以是在设定的时间窗口内获取到的多条告警信息。在一个实施例中,该告警信息包括场景类型、主机信息、告警级别、告警维度、监控项信息和具体的告警内容等。运维工作人员可根据该告警信息进行相应的介入处理以保障网络和设备的整体的安全、稳定的运行。
其中,告警规则数据为预先编写设置的特殊格式的文件数据,如JSON格式配置的文件数据,基于该告警规则数据可实现对告警信息的处理。可选的,在需要对告警信息进行处理时,对该告警规则数据进行加载,在告警规则数据设置过程中,可根据不同告警场景和收敛处理规则设置多个不同的告警规则数据,相应的,基于需要执行的收敛处理的顺序对每个告警规则数据依次进行编号并存储在告警规则数据中。
在一个实施例中,该告警规则数据包括告警输入信息项和告警过滤信息项。其中,该告警输入信息项用于指定当前收敛处理的规则所针对的告警场景,哪个告警场景导致了其他几种告警场景的告警信息的产生,以及每一个告警场景本身是否定义了告警收敛规则,是否需要预先进行该单一告警场景的告警信息的预先收敛。在该告警输入信息项中可指定当前告警规则数据的收敛处理执行过程所针对的告警信息的具体场景。如通过设置的“alarm_scene”字段来指定将哪一个告警场景的告警信息作为收敛处理的输入项。其中,告警场景指根据不同告警信息的类型等进行划分设置的场景,如设备板卡重启场景、设备接口Down场景、设备BGP连接Down场景、电源风扇等通用硬件类故障场景。具体的,针对不同的告警场景可以设置不同的字段值进行区分,如设备接口Down场景对应字段值为1,设备BGP连接Down场景对应字段值为2,设备板卡重启场景对应字段值为3等。
在一个实施例中,该待处理的告警信息为经过告警合并和告警屏蔽后的告警信息,再通过本方案的对告警信息的处理方式,将两条或多条存在关联关系的告警信息最终生成一条告警进行发送。其中,告警合并在指一个时间窗口内,同场景下同主机且相同接口标识的告警合并成一条的过程,如在一个2分钟的滑动时间窗口内,设备接口Down场景中192.168.100.101的交换机设备的100GE0/1/32这个接口产生了10次告警,则可以合并成一条发出。其中,告警屏蔽指将告警按照紧急、高、中、低等进行等级划分,然后将中、低两个等级的告警进行屏蔽;或者,通过设置告警的屏蔽条件,当某条告警满足该屏蔽条件时对其进行屏蔽。
针对收敛处理过程,示例性的,如两台交换机设备建立了BGP连接,当BGP连接断开后,两台交换机设备针对该异常情况都会发出告警,因此需要收敛成一条发出来,与此同时也还要告知被收敛的对端交换机设备是哪台;又如,一台交换机设备的板卡发生故障进行了自动重启,此时将会产生设备BGP连接Down、设备板卡重启以及设备接口Down等多个场景的多条告警信息,此时需要发送的即经过收敛处理后得到的仅为该交换机设备板卡重启对应的告警信息。
在一个实施例中,对告警信息进行处理时,可以是针对单一场景进行的告警信息的处理也可以是针对多个场景的告警信息的联合处理。在告警输入信息项还包括“primary”字段,用于标记当前的告警场景在告警收敛处理的规则中是否是导致其它几个告警场景下产生告警信息的主要原因。
其中,告警过滤信息项中定义有相应的告警信息的收敛规则,如针对两条告警信息而言,通过该收敛规则确定需要保留的告警信息。示例性的,其包括“preferred_val”字段和“preferred”字段。其中,“preferred_val”字段表示多告警场景的告警收敛规则执行时产生的默认条件,具体表征:如果次要告警场景需要预先递归收敛,则包含了当前主告警场景中指定的字段的告警信息拥有更高的保留权,由此使得跟主告警场景有密切关系的告警信息理优先被保留下来,而不在进行预先告警收敛过程中被其他告警收敛规则进行收敛。针对“preferred”字段而言,如果preferred_val字段值为空,则检查当前字段定义的优先条件,满足其优先条件的告警信息被保留,举例而言,规则可以是设备主机IP小的告警信息优先保留。
步骤S102、根据所述告警输入信息项对所述告警信息进行筛选得到多个第一告警信息。
在一个实施例中,告警信息包括告警场景数据,即待处理的告警信息在生成时标记有对应的告警场景,如前所述,告警场景指根据不同告警信息的类型等进行划分设置的场景,如设备板卡重启场景、设备接口Down场景、设备BGP连接Down场景、电源风扇等通用硬件类故障场景。相应的,告警信息生成时相应的记录有该告警信息对应的告警场景。如在一个2分钟的时间窗口中分别生成了5个场景下的100条待处理的告警信息。
其中,告警输入信息项包括场景指定标识以及收敛条件,该场景指定标识用于指定当前告警规则数据所处理的告警信息的告警场景,收敛条件用于筛选可以进行合并的告警信息。具体的,如图2所示,图2为本发明实施例提供的一种根据告警输入信息项对告警信息进行筛选的方法的流程图,其包括:
步骤S1021、根据所述告警输入信息项中的场景指定标识以及每个告警信息中的告警场景数据对所述告警信息进行筛选得到多个第三告警信息。
在一个实施例中,不同的告警规则数据对应有相应的可处理的告警场景,针对该告警场景进行相同告警信息的筛选,其中,待处理的告警信息以预先根据告警场景和设备标识进行分组。以单一场景的收敛处理为例,告警规则数据对应处理的告警场景为设备板卡重启场景,则此时在待处理的告警信息中筛选设备板卡重启场景下的告警信息;以多场景的收敛处理为例,告警规则数据对应处理的告警场景可以是设备板卡重启场景以及设备BGP连接Down场景,则相应的,在待处理的告警信息中筛选设备板卡重启场景以及设备BGP连接Down场景下的告警信息。其中,针对多场景的收敛处理中,在多个指定的告警场景中设置有主告警场景和次要告警场景,如设备板卡重启场景为主告警场景,设备BGP连接Down场景为次要告警场景。
示例性的,待处理的告警信息假定为5个告警场景(如分别记为告警场景1、告警场景2、告警场景3、告警场景4和告警场景5)下的100条告警信息,如当前的告警规则数据处理的告警场景为告警场景1,则此时在待处理的告警信息中筛选出告警场景1下的告警信息,此处记为第三告警信息。
步骤S1022、在所述多个第三告警信息中确定出满足所述收敛条件的多个第一个告警信息。
其中,在得到第三告警信息后,根据告警输入信息项中的收敛条件确定可合并的第三告警信息。如图3所示,图3为本发明实施例提供的一种根据在第三告警信息确定第一告警信息的方法的流程图,具体包括:
步骤S1023、根据所述告警输入信息项中指定的字段名称分别获取第三告警信息中对应字段名称的字段值,基于预设算法对所述字段值进行计算。
步骤S1024、将计算结果一致的多个第三告警信息确定为多个第一告警信息。
在一个实施例中,告警输入信息项包含有“aggr_fields”字段,该字段记录有指定的字段名称。示例性的,告警输入信息项中“aggr_fields”字段指定的字段为["host","remote_ip"],则相应的分别取出"host"字段值以及"remote_ip"字段值。其中,该预设算法可以是:在取出指定的字段值后,如"host"字段值为a,"remote_ip"字段值为b,计算该取出的字段值的排列组合,如包括排列组合ab和ba,根据MD5算法计算每种排列组合数据对应的摘要值。将摘要值一致的第三告警信息确定为第一告警信息,即认为摘要值一致的第三告警信息其在业务上为同一个故障源在多个设备上产生的有关联关系的告警信息,可以对其进行收敛处理。
步骤S103、根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息。
在一个实施例中,告警过滤信息项的预设字段如“preferred”字段记录有优先级判断信息,可基于此对多个第一告警信息进行收敛处理得到第二告警信息。具体的,包括:获取告警过滤信息项中的优先级判断信息,根据优先级判断信息对多个第一告警信息进行收敛处理得到第二告警信息。在一个实施例中,该优先级判断信息包括“filed”字段和“logic”字段。其中,“filed”字段标识需要比对处理的参数的名称,如host、interface等;“logic”字段表示具体的逻辑运算关系,用以确定告警信息优先级的高低。示例性的,针对“filed”字段为host时,“logic”字段值为“less”,则表征host更小的告警信息的优先级更高。优先级高的告警信息将会保留,而优先级低的告警信息则被收敛。
由上述方案可知,通过加载预先设置的告警规则数据对获取的待告警信息进行处理,处理过程中根据告警输入信息项对告警信息进行场景维度上的筛选,并确定得到多个可合并第一告警信息后,基于告警过滤信息项对多个第一告警信息进行收敛处理得到第二告警信息,利用该种特殊结构定义的告警规则数据实现了灵活的可配置的对告警信息进行收敛处理,并非简单的告警信息合并和屏蔽,而是根据设置的收敛处理规则对告警信息进行收敛得到收敛结果,可以最大化程度的减少了无用告警信息的发出,告警信息收敛情况良好。
在上述技术方案的基础上,在根据优先级判断信息对多个第一告警信息进行收敛处理得到第二告警信息之后,还包括:确定被收敛的第一告警信息与第二告警信息的关联关系,根据关联关系生成树形结构化数据进行保存。
可选的,针对得到的第二告警信息,首先判断其为在多个第一告警信息中保留的一条告警信息还是新建生成的告警信息。针对保留的告警信息而言,需要将被收敛的告警信息关联到被保留下来的告警信息的子节点中,具体的,如果被保留下来的告警信息没有子节点,则直接将被收敛的告警信息设置为它的子节点,如果被保留下来的告警信息存在子节点,则将被收敛的告警信息挂载到其子节点的最后一个兄弟节点上;针对新建生成的告警信息而言,则基于新建生成的告警信息克隆生成一条一致的告警信息,将被收敛的告警信息和该条克隆得到的告警信息进行关联生成树形结构化数据进行保存。通过对收敛处理后的告警信息以树形结构化形式进行保存实现了对告警信息收敛处理结果的记录,并入库存储作为留档,便于相关人员查询和追溯。
在上述技术方案的基础上,得到第二告警信息后进一步包括对其进行输出的过程。图4为本发明实施例提供的一种进行告警信息发送的方法的流程图,其中,告警规则数据包括告警输出信息项,如图4所示,具体包括:
步骤S201、根据所述第二告警信息的生成类型以及在所述告警输出信息项中定义的标签处理规则生成待发送告警信息。
其中,第二告警信息的生成类型包括信息保留类型、信息合并类型以及信息创建类型,相应的,标签处理规则包括信息保留类型的标签处理规则、信息合并类型的标签处理规则以及信息创建类型的标签处理规则。示例性的,在告警输出信息项中分别进行标签处理规则的定义,如设置三个不同的字段分别为“base_fields”字段、“merge_fields”字段以及“extra_fields”字段,分别对应处理信息保留类型、信息合并类型以及信息创建类型的第二告警信息。针对“base_fields”字段而言,进行基础标签的提取,可选的该基础标签可在告警输入信息项中以“item_name”字段的形式定义;针对“merge_fields”字段而言,其将两条第一告警信息中的指定标签进行合并,可以中文顿号的形式隔开,如::10GE1/0/47、Eth-Trunk2;针对“extra_fields”字段而言,指需要新增的其他额外标签字段,如bgp_down_desc字段。
步骤S202、根据所述告警输出信息项中配置的信息发送参数对所述待发送告警信息进行发送。
在一个实施例中,该告警输出信息项还记录有信息发送参数,如记录为“monitor_item_name:”字段。其可以记录需要输出的目标信息,如设置指定输出至开发人员自主开发的监控平台中的某个监控项,或者配置为通过指定app软件的接口进行发送。
由上述可知,在得到第二告警信息后,根据不同的生成规则进行第二告警信息的标签信息处理,并基于信息发送参数进行处理后的告警信息的发送,实现了对多个不同告警信息的收敛处理,降低了发送的告警信息的冗余度,显著降低了告警信息的发送数量,其发送内容更加精准。
在一个实施例中,告警规则数据包括多个,其中每个告警规则数据还包括基础属性信息,图5为本发明实施例提供的一种对告警信息进行处理时递归收敛处理的方法的流程图,如图5所示,具体包括:
步骤S301、根据基础属性信息中记录的序号值选择第一告警规则数据。
在一个实施例中,该基础属性信息记录有当前告警规则数据的序号值,当然其还可以记录有收敛规则名称、收敛规则类型、收敛规则描述和指定场景等字段信息。其中,该序号值作为告警信息处理时选取告警规则数据顺序的依据,如由小到大或由大到小依次获取告警规则数据进行告警信息的处理,直至告警规则数据遍历完毕且进行相应的告警信息处理后,判定告警信息处理结束输出收敛结果,当然如果在告警信息处理结束后,还存在未处理的告警信息则可一并输出。
步骤S302、根据第一告警规则数据中告警输入信息项记录的递归收敛标识确定是否为递归收敛,如果是,则执行步骤S303,否则执行步骤S304。
在一个实施例中,在对告警信息进行收敛处理时,包括递归收敛处理。可选的,通过在告警输入信息项中以递归收敛标识的方式记录其是否需要进行递归处理,如字段“pre_aggr”的值为true则表示进行收敛递归处理,值为false则表示不进行收敛递归处理。
步骤S303、获取相同场景指定标识的第二告警规则数据,根据所述第二告警规则数据的告警输入信息项对所述告警信息进行筛选得到多个第一告警信息。
当然,需要说明的时,本方案以两层递归为例进行说明,在获取到第二告警规则数据后,依然进行是否收敛递归处理的判定,如果是,则继续根据序号值进行第三告警规则数据的选择直到最后一层。
在基于第二告警规则数据筛选得到多个第一告警信息后,进一步的通过第二告警规则数据中的告警过滤信息项对第一告警信息进行收敛处理得到第二告警信息。
步骤S304、根据所述第一告警规则数据的告警输入信息项对所述告警信息进行筛选得到多个第一告警信息。
在一个实施例中,如果当前的告警规则数据不为收敛递归处理,则根据当前的告警输入信息项筛选得到多个第一告警信息后,利用告警过滤信息项对多个第一告警信息进行收敛处理得到第二告警信息。
由上述可知,通过对告警信息进行递归收敛处理以最终形成树形结构的收敛结果,保证了收敛效率和收敛准确度,同时可对收敛过程进行准确的记录。
在一个实施例中,告警规则数据包括主告警规则数据和次要告警规则数据,其中,根据告警输入信息项对告警信息进行筛选得到多个第一告警信息,根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息,包括:分别根据所述主告警规则数据以及所述次要告警规则数据中的告警输入信息项对所述告警信息进行筛选得到第一告警信息,根据告警规则优先级条件以及所述主要告警规则数据和所述次要告警规则数据中的告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息。具体的,对于多告警场景(包含主告警场景和次要告警场景)的告警信息处理,分别设置有主告警规则数据和次要告警规则数据,该主告警场景下对应至少一条告警信息,次要告警场景下对应至少一条告警信息。在进行告警信息的收敛处理时,将主告警规则数据中定义的优先级条件联合次要告警数据规则对次要告警场景下的告警信息进行收敛处理。
示例性的场景可以是,某个时刻10.234.16.12这台交换机的100GE1/0/1和Trunk32这两个接口发生了故障,连接了10.234.196.2这台交换机的Trunk4和100GE2/0/32这两个接口,因此这时这两台交换机会分别发出两条设备接口Down场景的告警信息。此外,10.234.16.12和10.234.196.2这两台交换机还建立了BGP连接,因此这时这两台交换机还会分别发出一条设备BGP连接Down场景的告警信息。在这个故障场景中,本质上只是10.234.16.12和10.234.196.2这两台交换机上建立连接的那两个物理接口中的其中一个发生了故障,结果却产生了6条告警信息出来,而这6条告警信息是告警合并、告警屏蔽逻辑所无法处理的,只能通过本方案中的收敛处理逻辑来进行收敛,最终需要的效果是只发出一条设备接口Down场景的告警,指出哪台交换机的哪个接口发生了故障,与它建立连接的对端的交换机是哪台,同时还要加上一个标签信息标明这两台交换机之间建立的BGP连接同时也出现了故障。
具体的,收敛处理规则的定义可以是:针对设备接口Down场景的告警,设置两条单告警场景的收敛规则,分别是:设备接口Down且对端接口也发生了Down和多个接口都发生了Down。显然,前者的优先级更高,将该告警规则数据的序号至设置为1,后者设置为2。针对设备BGP连接Down场景的告警,也设置两条告警收敛规则,它们分别是:peer对应的host也发生了Down和多个peer都发生了Down。通过上述定义的4条单告警场景的收敛规则的处理,假想的故障场景产生的6条告警信息在经过收敛规则的收敛后最终还剩下2条告警信息(同一台设备产生的一条设备接口Down场景的告警信息,以及另一条设备BGP连接Down场景的告警信息),此时需要再定义一条这两个告警场景的复合收敛规则,以最终保留一条告警信息了。具体保留筛选的方式可以通过定义的告警规则优先级条件确定,如本例子中将设备接口Down场景设置为主告警场景,设备BGP连接Down场景为次要场景,其中主告警场景的优先级高于次要告警场景的优先级,即最终收敛处理得到一条告警信息。具体的,在设备BGP连接Down场景进行单告警场景的对端收敛时,互相处于对端设备的两条告警信息如果无优先级的引入是等效的,但是显然触发了设备接口Down场景这个主告警场景的那台设备上的设备BGP连接Down场景的告警信息能够保留下来,以使得最终得到的收敛效果最好(总共产生了6条告警信息,但是最终只发送1条告警信息出去)。可选的,基于此设计需求的逻辑,在主告规则数据中指定相关的标签信息进行组装后,作为其他次要告警场景进行收敛处理的优先条件以最终生成符合需求的主告警场景的告警信息。
图6为本发明实施例提供的一种告警信息处理装置的结构框图,该装置用于执行上述实施例提供的告警信息处理方法,具备执行方法相应的功能模块和有益效果。如图6所示,该系统具体包括:数据获取模块101、告警信息筛选模块102和告警信息收敛模块103,其中,
数据获取模块101,用于获取待处理的告警信息,加载预先设置的告警规则数据,所述告警规则数据包括告警输入信息项和告警过滤信息项;
告警信息筛选模块102,用于根据所述告警输入信息项对所述告警信息进行筛选得到多个第一告警信息;
告警信息收敛模块103,用于根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息。
由上述方案可知,通过获取待处理的告警信息,加载预先设置的告警规则数据,其中,告警规则数据包括告警输入信息项和告警过滤信息项,根据告警输入信息项对告警信息进行筛选得到多个第一告警信息后,再根据告警过滤信息项对多个第一告警信息进行收敛处理得到第二告警信息,该种告警信息的处理方法,灵活性更强,可以最大化程度的减少了无用告警信息的发出,告警信息收敛情况良好。
在一个可能的实施例中,所述告警信息包括告警场景数据,所述告警输入信息项包括场景指定标识以及收敛条件,所述告警信息筛选模块102具体用于:
根据所述告警输入信息项中的场景指定标识以及每个告警信息中的告警场景数据对所述告警信息进行筛选得到多个第三告警信息;
在所述多个第三告警信息中确定出满足所述收敛条件的多个第一个告警信息。
在一个可能的实施例中,所述告警信息筛选模块102具体用于:根据所述告警输入信息项中指定的字段名称分别获取第三告警信息中对应字段名称的字段值,基于预设算法对所述字段值进行计算;
将计算结果一致的多个第三告警信息确定为多个第一告警信息。
在一个可能的实施例中,所述告警规则数据包括至少两个,所述告警规则数据还包括基础属性信息,所述数据获取模块101还用于:
在根据所述告警输入信息项对所述告警信息进行筛选得到多个第一告警信息之前,根据所述基础属性信息中记录的序号值选择第一告警规则数据;
根据所述第一告警规则数据中告警输入信息项记录的递归收敛标识确定是否为递归收敛,如果是,则获取相同场景指定标识的第二告警规则数据,其中,所述第二告警规则数据和所述第一告警规则的序号值满足预设排序条件;
所述告警信息筛选模块102具体用于:
根据所述第二告警规则数据的告警输入信息项对所述告警信息进行筛选得到多个第一告警信息。
在一个可能的实施例中,所述告警信息收敛模块103具体用于:
获取所述告警过滤信息项中的优先级判断信息;
根据所述优先级判断信息对所述多个第一告警信息进行收敛处理得到第二告警信息。
在一个可能的实施例中,该装置还包括告警信息输出模块104,用于:
在根据所述优先级判断信息对所述多个第一告警信息进行收敛处理得到第二告警信息之后,确定被收敛的第一告警信息与所述第二告警信息的关联关系,根据所述关联关系生成树形结构化数据进行保存。
在一个可能的实施例中,告警规则数据还包括告警输出信息项,所述告警信息输出模块104还用于:
在根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息之后,根据所述第二告警信息的生成类型以及在所述告警输出信息项中定义的标签处理规则生成待发送告警信息,所述生成类型包括信息保留类型、信息合并类型以及信息创建类型,对应的标签处理规则包括信息保留类型的标签处理规则、信息合并类型的标签处理规则以及信息创建类型的标签处理规则;根据所述告警输出信息项中配置的信息发送参数对所述待发送告警信息进行发送。
在一个可能的实施例中,所述告警规则数据包括主告警规则数据和次要告警规则数据,所述告警信息筛选模块102具体用于:
分别根据所述主告警规则数据以及所述次要告警规则数据中的告警输入信息项对所述告警信息进行筛选得到第一告警信息;
所述告警信息收敛模块103具体用于:
根据告警规则优先级条件以及所述主要告警规则数据和所述次要告警规则数据中的告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息。
图7为本发明实施例提供的一种告警信息处理设备的结构示意图,如图7所示,该设备包括处理器201、存储器202、输入装置203和输出装置204;设备中处理器201的数量可以是一个或多个,图7中以一个处理器201为例;设备中的处理器201、存储器202、输入装置203和输出装置204可以通过总线或其他方式连接,图7中以通过总线连接为例。存储器202作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的告警信息处理方法对应的程序指令/模块。处理器201通过运行存储在存储器202中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的告警信息处理方法。输入装置203可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置204可包括显示屏等显示设备。
本发明实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种上述实施例描述的告警信息处理方法,具体包括:
获取待处理的告警信息,加载预先设置的告警规则数据,所述告警规则数据包括告警输入信息项和告警过滤信息项;
根据所述告警输入信息项对所述告警信息进行筛选得到多个第一告警信息;
根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息。
值得注意的是,上述告警信息处理装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
注意,上述仅为本发明实施例的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明实施例不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明实施例的保护范围。因此,虽然通过以上实施例对本发明实施例进行了较为详细的说明,但是本发明实施例不仅仅限于以上实施例,在不脱离本发明实施例构思的情况下,还可以包括更多其他等效实施例,而本发明实施例的范围由所附的权利要求范围决定。

Claims (10)

1.告警信息处理方法,其特征在于,包括:
获取待处理的告警信息,加载预先设置的告警规则数据,所述告警规则数据包括告警输入信息项和告警过滤信息项,以及基础属性信息;
根据所述基础属性信息中记录的序号值选择第一告警规则数据;
根据所述第一告警规则数据中告警输入信息项记录的递归收敛标识确定是否为递归收敛,如果是,则获取相同场景指定标识的第二告警规则数据,其中,所述第二告警规则数据和所述第一告警规则数据的序号值满足预设排序条件;
根据所述告警输入信息项对所述告警信息进行筛选得到多个第一告警信息,其中,包括根据所述第二告警规则数据的告警输入信息项对所述告警信息进行筛选得到多个第一告警信息;
根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息。
2.根据权利要求1所述的告警信息处理方法,其特征在于,所述告警信息包括告警场景数据,所述告警输入信息项包括场景指定标识以及收敛条件,所述根据所述告警输入信息项对所述告警信息进行筛选得到多个第一告警信息,包括:
根据所述告警输入信息项中的场景指定标识以及每个告警信息中的告警场景数据对所述告警信息进行筛选得到多个第三告警信息;
在所述多个第三告警信息中确定出满足所述收敛条件的多个第一告警信息。
3.根据权利要求2所述的告警信息处理方法,其特征在于,所述在所述多个第三告警信息中确定出满足所述收敛条件的多个第一告警信息,包括:
根据所述告警输入信息项中指定的字段名称分别获取第三告警信息中对应字段名称的字段值,基于预设算法对所述字段值进行计算;
将计算结果一致的多个第三告警信息确定为多个第一告警信息。
4.根据权利要求1所述的告警信息处理方法,其特征在于,所述根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息,包括:
获取所述告警过滤信息项中的优先级判断信息;
根据所述优先级判断信息对所述多个第一告警信息进行收敛处理得到第二告警信息。
5.根据权利要求4所述的告警信息处理方法,其特征在于,在根据所述优先级判断信息对所述多个第一告警信息进行收敛处理得到第二告警信息之后,还包括:
确定被收敛的第一告警信息与所述第二告警信息的关联关系,根据所述关联关系生成树形结构化数据进行保存。
6.根据权利要求1所述的告警信息处理方法,其特征在于,所述告警规则数据还包括告警输出信息项,在根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息之后,还包括:
根据所述第二告警信息的生成类型以及在所述告警输出信息项中定义的标签处理规则生成待发送告警信息,所述生成类型包括信息保留类型、信息合并类型以及信息创建类型,对应的标签处理规则包括信息保留类型的标签处理规则、信息合并类型的标签处理规则以及信息创建类型的标签处理规则;
根据所述告警输出信息项中配置的信息发送参数对所述待发送告警信息进行发送。
7.根据权利要求1所述的告警信息处理方法,其特征在于,所述告警规则数据包括主告警规则数据和次要告警规则数据,所述根据所述告警输入信息项对所述告警信息进行筛选得到多个第一告警信息,包括:
分别根据所述主告警规则数据以及所述次要告警规则数据中的告警输入信息项对所述告警信息进行筛选得到第一告警信息;
所述根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息,包括:
根据告警规则优先级条件以及所述主告警规则数据和所述次要告警规则数据中的告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息。
8.告警信息处理装置,其特征在于,包括:
数据获取模块,用于获取待处理的告警信息,加载预先设置的告警规则数据,所述告警规则数据包括告警输入信息项和告警过滤信息项,以及基础属性信息,所述数据获取模块,还用于根据所述基础属性信息中记录的序号值选择第一告警规则数据;根据所述第一告警规则数据中告警输入信息项记录的递归收敛标识确定是否为递归收敛,如果是,则获取相同场景指定标识的第二告警规则数据,其中,所述第二告警规则数据和所述第一告警规则数据的序号值满足预设排序条件;
告警信息筛选模块,用于根据所述告警输入信息项对所述告警信息进行筛选得到多个第一告警信息,其中,具体用于根据所述第二告警规则数据的告警输入信息项对所述告警信息进行筛选得到多个第一告警信息;
告警信息收敛模块,用于根据所述告警过滤信息项对所述多个第一告警信息进行收敛处理得到第二告警信息。
9.一种告警信息处理设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的告警信息处理方法。
10.一种存储计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一项所述的告警信息处理方法。
CN202111227009.2A 2021-10-21 2021-10-21 告警信息处理方法、装置、设备和存储介质 Active CN114172785B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111227009.2A CN114172785B (zh) 2021-10-21 2021-10-21 告警信息处理方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111227009.2A CN114172785B (zh) 2021-10-21 2021-10-21 告警信息处理方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN114172785A CN114172785A (zh) 2022-03-11
CN114172785B true CN114172785B (zh) 2023-10-03

Family

ID=80477082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111227009.2A Active CN114172785B (zh) 2021-10-21 2021-10-21 告警信息处理方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN114172785B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116599820B (zh) * 2023-05-26 2024-03-19 北京天融信网络安全技术有限公司 一种告警过滤处理方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017016084A1 (zh) * 2015-07-30 2017-02-02 中兴通讯股份有限公司 告警信息通知方法、装置及告警信息过滤设备
CN106713017A (zh) * 2016-12-08 2017-05-24 国网北京市电力公司 告警信息的处理方法及装置
CN107832200A (zh) * 2017-10-24 2018-03-23 平安科技(深圳)有限公司 告警处理方法、装置、计算机设备及存储介质
CN112596990A (zh) * 2020-12-24 2021-04-02 科华恒盛股份有限公司 告警风暴的处理方法、装置及终端设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017016084A1 (zh) * 2015-07-30 2017-02-02 中兴通讯股份有限公司 告警信息通知方法、装置及告警信息过滤设备
CN106713017A (zh) * 2016-12-08 2017-05-24 国网北京市电力公司 告警信息的处理方法及装置
CN107832200A (zh) * 2017-10-24 2018-03-23 平安科技(深圳)有限公司 告警处理方法、装置、计算机设备及存储介质
CN112596990A (zh) * 2020-12-24 2021-04-02 科华恒盛股份有限公司 告警风暴的处理方法、装置及终端设备

Also Published As

Publication number Publication date
CN114172785A (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
US10616044B1 (en) Event based service discovery and root cause analysis
US20130297603A1 (en) Monitoring methods and systems for data centers
CN112422484B (zh) 确定用于处理安全事件的剧本的方法、装置及存储介质
CN113259168B (zh) 一种故障根因分析方法及装置
US20130212257A1 (en) Computer program and monitoring apparatus
CN103490941A (zh) 一种云计算环境中实时监控在线配置方法
CN111459770A (zh) 服务器运行状态的告警方法、装置、服务器及存储介质
CN110166562B (zh) 数据同步的方法、装置、存储介质和电子设备
CN111767173A (zh) 网络设备数据处理方法、装置、计算机设备和存储介质
US20220207383A1 (en) Fault propagation condition extraction method and apparatus and storage medium
US20220222266A1 (en) Monitoring and alerting platform for extract, transform, and load jobs
CN114172785B (zh) 告警信息处理方法、装置、设备和存储介质
CN115037597A (zh) 一种故障检测方法及设备
CN113886198A (zh) 一种告警方法、系统、设备以及介质
CN109558300B (zh) 一种整机柜告警处理方法、装置、终端及存储介质
CN111162938A (zh) 数据处理系统及方法
CN112099879B (zh) 配置信息管理方法、装置、计算机设备及存储介质
CN115102862A (zh) 一种用于sdn设备的自动同步方法及装置
CN114756301A (zh) 日志处理方法、装置和系统
CN114564286A (zh) 一种规则引擎告警方法及规则引擎告警系统
CN113918204A (zh) 一种元数据脚本管理方法、装置、电子设备和存储介质
CN112667512A (zh) 数据驱动测试方法、装置、设备和计算机可读存储介质
CN115544202A (zh) 告警处理方法、装置及存储介质
CN113297149A (zh) 数据处理请求的监测方法及装置
WO2018173698A1 (ja) 監視システム、コンピュータ可読記憶媒体および監視方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant