CN111030857A - 网络告警方法、装置、系统与计算机可读存储介质 - Google Patents

网络告警方法、装置、系统与计算机可读存储介质 Download PDF

Info

Publication number
CN111030857A
CN111030857A CN201911242825.3A CN201911242825A CN111030857A CN 111030857 A CN111030857 A CN 111030857A CN 201911242825 A CN201911242825 A CN 201911242825A CN 111030857 A CN111030857 A CN 111030857A
Authority
CN
China
Prior art keywords
alarm
information
network
log
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911242825.3A
Other languages
English (en)
Inventor
汪小苗
杨俊杰
卢道和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201911242825.3A priority Critical patent/CN111030857A/zh
Publication of CN111030857A publication Critical patent/CN111030857A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0686Additional information in the notification, e.g. enhancement of specific meta-data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Abstract

本发明公开了一种网络告警方法,包括:采集网络设备产生的日志,并基于预设规则提取所述日志中的告警日志;确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息;将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端。本发明还公开了一种网络告警装置、设备和计算机可读存储介质。本发明通过采集网络设备的日志,并从中提取故障日志,再查找故障日志的辅助信息,以生成内容较传统故障日志丰富的告警信息,最后将告警信息发送至运维终端,使得运维终端的运维人员能获取较为全面的故障信息,提高告警的智能性,实现快速排障。

Description

网络告警方法、装置、系统与计算机可读存储介质
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及网络告警方法、装置、系统与计算机可读存储介质。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,网络运维技术也不例外,但由于金融行业的安全性、实时性要求,也对网络运维技术提出了更高的要求。
网络告警是网络运维中重要的一个方面,与网络日志分析不同,它非常看中实时性,如果每一次处理查询的时间耗时过长会引起实时性不足带来的危机,实时性除了体现在“告出来”的时候,还体现在“告出来”之后信息如何有效传递。传递的网络告警信息是否清晰完整,对故障的处理有着非常重要的作用,尤其是金融行业,要求故障能够快速恢复。
在现有技术中,一般是在网络设备故障时,按照syslog协议收集网络设备的日志,然后告警处理引擎将日志以http形式发给一个专门的告警平台,告警平台提示相关的运维人员进行排障,也即,目前对网络设备的运维,普遍是依靠现场运维人员处理或者传递告警信息,需要7×24小时看着告警平台来确认告警,并且告警时还需要在各个系统之间不停查询所需要的信息,处理时效较慢,这是由于银行等金融机构出于安全考虑,通常会采购不同厂商型号的设备,不同设备告警时,处理手段差异较大,所以即使是基础架构出现问题,对于专业的运维人员来说也经常要查阅相关文档才可以排查故障处理。
在此种情形下,若出现批量告警,很可能响应不及时,从而错失了一些重要的告警信息。因此,如何提高告警智能性,以便相关人员能快速排障是亟待解决的问题。
发明内容
本发明的主要目的在于提出一种网络告警方法、装置、系统与计算机可读存储介质,旨在提高告警智能性,实现快速排障。
为实现上述目的,本发明提供一种网络告警方法,所述网络告警方法包括如下步骤:
采集网络设备产生的日志,并基于预设规则提取所述日志中的告警日志;
确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息;
将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端。
优选地,所述告警内容包括告警字段,所述确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息的步骤包括:
获取所述网络设备的告警字段,所述告警字段用于表征所述网络设备的设备属性;
基于所述告警字段,确定所述告警日志的业务线程,并获取所述业务线程对应的辅助信息。
优选地,所述基于所述告警字段,确定所述告警日志的业务线程,并获取所述业务线程对应的辅助信息的步骤包括:
基于所述告警字段,确定所述告警日志的业务线程,并确定所述告警日志是否与所述业务线程对应的缓存日志一致;
若否,则获取所述业务线程对应的辅助信息。
优选地,所述告警内容包括告警主题,所述确定所述告警日志是否与所述业务线程对应的缓存日志一致的步骤包括:
确定所述告警日志对应的目标规则,并基于所述目标规则,确定所述告警日志的告警主题;
确定所述业务线程对应的缓存日志的缓存主题,并将所述告警主题与所述缓存主题进行匹配;
若匹配成功,则确定所述告警日志与所述业务线程对应的缓存日志一致。
优选地,所述将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端的步骤之后,所述网络告警方法还包括:
确定所述告警信息的检查指令,并基于所述检查指令,检测所述告警信息对应的故障是否已解决;
若解决,则标记所述告警信息为已解决。
优选地,所述确定所述告警信息的检查指令,并基于所述检查指令,检测所述告警信息对应的故障是否已解决的步骤包括:
确定所述告警信息的检查指令,并将所述检查指令发送至所述网络设备;
接收所述网络设备基于所述检查指令返回的回显指令,并基于所述回显指令确定所述故障是否已解决;
其中,若所述回显指令的状态为指定状态,则确定所述故障已解决。
优选地,所述将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端的步骤包括:
将所述告警内容和所述辅助信息封装成告警信息,并确定所述告警信息对应的处理策略;
将所述告警信息和所述处理策略发送至运维终端。
此外,为实现上述目的,本发明还提供一种网络告警装置,所述网络告警装置包括:
采集模块,用于采集网络设备产生的日志,并基于预设规则提取所述日志中的告警日志;
获取模块,用于确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息;
发送模块,用于将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端。
优选地,所述告警内容包括告警字段,所述获取模块还用于:
获取所述网络设备的告警字段,所述告警字段用于表征所述网络设备的设备属性;
基于所述告警字段,确定所述告警日志的业务线程,并获取所述业务线程对应的辅助信息。
优选地,所述获取模块还用于:
基于所述告警字段,确定所述告警日志的业务线程,并确定所述告警日志是否与所述业务线程对应的缓存日志一致;
若否,则获取所述业务线程对应的辅助信息。
优选地,所述告警内容包括告警主题,所述获取模块还用于:
确定所述告警日志对应的目标规则,并基于所述目标规则,确定所述告警日志的告警主题;
确定所述业务线程对应的缓存日志的缓存主题,并将所述告警主题与所述缓存主题进行匹配;
若匹配成功,则确定所述告警日志与所述业务线程对应的缓存日志一致。
优选地,所述网络告警装置还包括检测模块,所述检测模块用于:
确定所述告警信息的检查指令,并基于所述检查指令,检测所述告警信息对应的故障是否已解决;
若解决,则标记所述告警信息为已解决。
优选地,所述检测模块还用于:
确定所述告警信息的检查指令,并将所述检查指令发送至所述网络设备;
接收所述网络设备基于所述检查指令返回的回显指令,并基于所述回显指令确定所述故障是否已解决;
其中,若所述回显指令的状态为指定状态,则确定所述故障已解决。
优选地,所述发送模块还用于:
将所述告警内容和所述辅助信息封装成告警信息,并确定所述告警信息对应的处理策略;
将所述告警信息和所述处理策略发送至运维终端。
此外,为实现上述目的,本发明还提供一种网络告警系统,所述网络告警系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的网络告警程序,所述网络告警程序被所述处理器执行时实现如上所述的网络告警方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有网络告警程序,所述网络告警程序被处理器执行时实现如上所述的网络告警方法的步骤。
本发明提出的网络告警方法,采集网络设备产生的日志,并提取所述日志中的告警日志;确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息;将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端。本发明通过采集网络设备的日志,并通过预设规则,从中提取故障日志,再查找故障日志的辅助信息,最后将通过预设规则提取到的故障日志和辅助信息封装成告警信息,使得生成的告警信息较传统故障日志有更为丰富的内容,最后将告警信息发送至运维终端,使得运维终端的运维人员能获取较为全面的故障信息,提高告警的智能性,帮助运维人员快速排障。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的系统结构示意图;
图2为本发明网络告警方法第一实施例的流程示意图;
图3为本发明网络告警方法第一实施例中步骤S20的细化流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的系统结构示意图。
本发明实施例系统可以是PC机或服务器设备。
如图1所示,该系统可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的系统结构并不构成对网络告警系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及网络告警程序。
其中,操作系统是管理和控制网络告警系统与软件资源的程序,支持网络通信模块、用户接口模块、网络告警程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1002;用户接口模块用于管理和控制用户接口1003。
在图1所示的网络告警系统中,所述网络告警系统通过处理器1001调用存储器1005中存储的网络告警程序,并执行下述网络告警方法各个实施例中的操作。
基于上述硬件结构,提出本发明网络告警方法实施例。
参照图2,图2为本发明网络告警方法第一实施例的流程示意图,所述方法包括:
步骤S10,采集网络设备产生的日志,并基于预设规则提取所述日志中的告警日志;
步骤S20,确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息;
步骤S30,将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端。
本实施例网络告警方法运用于理财机构或者银行等金融机构的网络告警系统中,为描述方便,网络告警系统以告警系统进行描述。告警系统包括日志收集器,告警处理引擎和网管系统,其中,日志收集器实时监测网络设备,收集并转发网络设备产生的日志给告警处理引擎,在具体实施时,日志收集器可以是分布式的架构,这是由于银行等金融机构都有数个IDC(Internet Data Center,数据中心),因此,每个IDC分配一个日志收集器,日志收集器会把收集到的日志用http方式发送给告警处理引擎;而告警处理引擎可以过滤掉一些无用的日志减轻网管系统的压力,具体可利用告警关键字或者正则表达式,对日志收集器发送过来的日志进行针对性提取,具体过滤方式在下述实施例中进行详细描述;经过过滤后,得到告警日志,该告警日志会流经网管系统,网管系统通过确定告警日志的告警内容,获取对应的辅助信息,并将告警内容和辅助信息封装成告警信息,以丰富告警日志,最后将告警信息发送至运维终端,使得运维终端得到的告警信息较为详细,可帮助运维人员快速排障。
以下将对各个步骤进行详细说明:
步骤S10,采集网络设备产生的日志,并基于预设规则提取所述日志中的告警日志。
在本实施例中,告警系统通过日志收集器采集网络设备产生的日志,并将日志通过日志收集器发送至告警处理引擎,由告警处理引擎基于预设规则提取日志中的告警日志,可以理解的,网络设备产生的日志并不都是告警日志,因此,需要从众多日志中,提取告警日志,其中,预设规则可以是预设的告警关键字,具体的:将一条条日志与预设告警关键字进行比较,也即,事先定义告警关键字,然后将一条条日志与告警关键字进行比较,若是命中,则确定当前与预设告警关键字命中的日志为告警日志,从而从众多日志中提取到告警日志;此外,在另一实施例中,预设规则还可以是预设的正则表达式,具体的:将一条条日志与正则表达式进行匹配,也即,事先写好若干正则表达式,然后,将一条条日志与正则表达式进行匹配,若当前正则表达式返回了正确的结果,则确定匹配当前正则表达式的日志为告警日志,从而从众多日志中提取到告警关键字。
步骤S20,确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息。
在本实施例中,在告警系统通过告警处理引擎得到告警日志后,再通过网管系统确定告警日志的告警内容,其中,告警内容包括告警主题和告警字段。
具体的,参照图3,步骤S20包括:
步骤S21,获取所述网络设备的告警字段,所述告警字段用于表征所述网络设备的设备属性;
在该步骤中,告警系统通过网管系统获取网络设备的告警字段,其中,告警字段用于表征网络设备的设备属性,具体的,告警字段包括设备管理IP、端口、协议等。
进一步地,在另一实施例中,步骤S21包括:
确定所述告警日志对应的第一告警模板,基于所述第一告警模板,获取所述网络设备的告警字段。
在该步骤中,告警系统可根据告警日志的告警主题确定对应的第一告警模板,再根据第一告警模板获取对应的告警字段,其中,告警主题的确定在下述实施例中进行详细描述,第一告警模板包括告警参数,也即,每一种告警主题都有对应的第一告警模板,可以理解的,运维人员在面对不同告警主题的告警日志,对当前告警日志进行分析时,所依赖的告警参数是不同的,如当前告警日志对应的第一告警模板包括A告警参数,则告警字段需包含有A;若当前告警日志对应的第一告警模板包括B告警参数,则告警字段需包含有B等,因此,告警系统需要针对不同的第一告警模板,获取相应的告警字段,以便运维人员能了解到较为全面的告警信息。
步骤S22,基于所述告警字段,确定所述告警日志的业务线程,并获取所述业务线程对应的辅助信息。
在该步骤中,告警系统的网管系统根据告警字段,确定告警日志的业务线程,具体的,基于告警字段,去通过网管系统与告警系统连接的业务系统中,查找对应的业务线程,在具体实施时,可根据告警字段中的端口,确定该端口关联的业务线程,从而获取该业务线程对应的辅助信息,其中,辅助信息包括业务信息,用于表征出现故障的具体是哪一个业务。
步骤S30,将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端。
在本实施例中,告警系统的网管系统将告警内容和辅助信息封装成告警信息,具体封装成json格式,如上所示例子封装成告警信息为:
{
title:”端口抖动”,
manage_ip:“2.2.2.2”,
port:”xxx”
status:”down”,
business:”xxx业务”,
reason:“Parent interface is down”
}
最后,将告警信息发送至运维终端,供运维终端的运维人员查看。
进一步地,在另一实施例中,步骤S30包括:
将所述告警内容和所述辅助信息封装成告警信息,并确定所述告警信息对应的处理策略;
在该步骤中,告警系统的网管系统将告警内容和辅助信息封装成告警信息后,通过预先设定的处理策略,确定告警信息对应的处理策略,在具体实施时,根据告警主题和业务信息,确定对应的处理策略,该处理策略可为事先定义处理该故障日志的标准流程文档。
将所述告警信息和所述处理策略发送至运维终端。
最后,将封装好的告警信息和处理策略发送至运维终端,可以理解的,此时的告警信息并单单只有日志信息,还包含了业务信息等辅助信息,以及对应的处理策略,运维人员可从告警信息中判断出告警日志的重要性以及告警设备、端口等信息,可以帮助运维人员快速进行排障。
进一步地,在另一实施例中,步骤S30包括:
将所述告警内容和所述辅助信息封装成告警信息,并确定所述告警信息对应的第二告警模板;
基于所述第二告警模板,将所述告警信息发送至运维终端。
也即,告警系统的网管系统中事先设置有不同告警信息对应的第二告警模板,具体可根据告警信息所属的业务线程来确定对应的第二告警模板,其中,第二告警模板用于表征告警信息中参数的重要性排序。可以理解的,告警信息中的参数有重要性区别,有些对运维人员来说是重要的,有些是不那么重要的,如网络设备的管理IP,运维人员在解决故障时,管理IP并不那么重要,所以应当将管理IP等非重要参数放置在告警信息的底部,或者不显示,避免告警信息太多,导致运维人员需要花费较多的时间去确定重点。
因此,将告警内容和辅助信息封装成告警信息后,告警系统的网管系统基于告警信息对应的业务线程,确定告警信息对应的第二告警模板,并将告警信息以第二告警模板的格式进行排列显示,并发送至运维终端,以便运维人员快速读取故障详情,实现快速排障。
进一步地,在另一实施例中,步骤S30包括:
将所述告警内容和所述辅助信息封装成待处理告警信息,并确定所述待处理告警信息对应的运维人员信息;
基于所述运维人员信息,确定所述待处理告警信息中的重要参数,并将所述重要参数封装成告警信息,将所述告警信息发送至所述运维人员信息对应的运维终端。
也即,在另一实施例中,由于每个运维人员需要维护或者处理的重点信息不同,为满足各个运维人员的准确需求,以便运维人员能快速获取到自己想要的告警参数,告警系统在将告警内容和辅助信息封装成待处理告警信息后,确定待处理告警信息对应的运维人员信息,具体可通过待处理告警信息所属的业务线程确定;或者,根据待处理告警信息所属的网络设备确定,也即,在具体实施时,不同的业务线程或者不同的网络设备由不同的运维人员进行维护,因此,可根据待处理告警信息所属的业务线程,或者网络设备确定对应的运维人员信息。
然后,根据事先设置好的不同运维人员的个性化要求,从待处理告警信息中确定对应的重要参数,如运维人员甲的个性化要求是告警信息要有协议,不要管理IP,那么确定当前待处理告警信息的重要参数为协议,则只需将协议封装成告警信息即可,管理IP可直接舍去,最后,将告警信息发送至运维人员信息对应的运维终端,提高了告警信息输出的准确性。
本实施例采集网络设备产生的日志,并提取所述日志中的告警日志;确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息;将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端。本发明通过采集网络设备的日志,并通过预设规则,从中提取故障日志,再查找故障日志的辅助信息,最后将通过预设规则提取到的故障日志和辅助信息封装成告警信息,使得生成的告警信息较传统故障日志有更为丰富的内容,最后将告警信息发送至运维终端,使得运维终端的运维人员能获取较为全面的故障信息,提高告警的智能性,帮助运维人员快速排障。
进一步地,基于本发明网络告警方法第一实施例,提出本发明网络告警方法第二实施例。
网络告警方法的第二实施例与网络告警方法的第一实施例的区别在于,步骤S23包括:
步骤a,基于所述告警字段,确定所述告警日志的业务线程,并确定所述告警日志是否与所述业务线程对应的缓存日志一致;
步骤b,若否,则获取所述业务线程对应的辅助信息。
本实施例网络中的链路会经过多个节点,这使得相同链路的节点之间彼此互相影响,如一个地方出现抖动,可能会引起其他相关的多处地方也出现抖动,影响运维人员视觉体验,也即,同一业务线程的不同节点的故障都会告警,然而其本质上是相同的告警问题,为避免同一业务线程的不同节点的相同故障重复告警,本实施例将采集的告警信息存在缓存里,具体可以采用redis(一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API),当有其他告警日志与当前缓存的告警信息匹配时,不再重复告警,也即做到告警的收敛。
以下将对各个步骤进行详细说明:
步骤a,基于所述告警字段,确定所述告警日志的业务线程,并确定所述告警日志是否与所述业务线程对应的缓存日志一致。
在本实施例中,告警系统的网管系统根据告警字段确定当前告警日志对应的业务线程,然后,确定当前告警日志是否与当前业务线程对应的缓存日志一致,也即确定当前告警日志是否是当前业务线程的重复告警,在具体实施时,通过告警字段中的端口确定对应的业务线程。
具体的,步骤a包括:
确定所述告警日志对应的目标规则,并基于所述目标规则,确定所述告警日志的告警主题;
在该步骤中,由于网络设备的网络告警有数十种类型,为区分出不同告警主题的告警日志,告警系统通过网管系统确定当前告警日志对应的目标规则,其中,目标规则可为正则表达式,也即,在具体实施时,事先写好各个告警主题的正则表达式,每个正则表达式单独为一个线程,采用多线程解析的方式,也即,并发套用正则表达式的方式,确定当前告警日志对应的目标规则,也即目标正则表达式,最后,基于目标规则,确定网络设备的告警主题。
如下例子:管理IP为2.2.2.2的网络设备每天都产生很多日志,以如下两条告警日志为例:
第一条:sub Module 1current-status is MOD_STATUS_ONLINE/OK;
第二条:Interface Ethernet1/6 is down(Parent interface is down)。
这两条告警日志属于不同的告警主题,通过事先写好正则表达式:
板卡状态相关的正则表达式:
(.*)current-status is MOD_STATUS_ONLINE/(.*?);
端口抖动相关的正则表达式:
Interface(.*?)is down\((.*?)\)。
并发套用这些正则表达式,也即,让每个线程去跟告警日志匹配,例子中第一条告警日志最终只有试图匹配与板卡状态相关的正则表达式的线程返回了正确的结果,因此可确定第一条告警日志的告警主题为卡板状态,第二条告警日志最终只有试图匹配与端口抖动相关的正则表达式的线程返回了正确的结果,因此,可确定第二条告警日志的告警主题为端口抖动等。
确定所述业务线程对应的缓存日志的缓存主题,并将所述告警主题与所述缓存主题进行匹配;
在该步骤中,告警系统的网管系统确定当前业务线程对应的缓存日志的缓存主题,并将该告警主题与当前告警日志的告警主题进行匹配,具体匹配规则可以正则表达式确定,具体匹配过程与上述类似,在此不再赘述。在具体实施时,告警系统的网管系统缓存有预设时间的缓存日志,预设时间为经验值,一般为一分钟,也即,告警系统的网管系统缓存的缓存日志只存在一分钟,在一分钟后即不再保存,相当于预设时间内告警的告警日志,若是告警主题相同,则归为一次告警,避免重复告警,在预设时间后复发的告警日志则为一次有效告警。
如当前业务线程的一个节点出现抖动,在预设时间内,在当前业务线程的另一节点也出现抖动,则针对当前业务线程的故障只告警一次,若是在预设时间后,检测到另一节点也出现抖动,此时则发出告警。
若匹配成功,则确定所述告警日志与所述业务线程对应的缓存日志一致。
在该步骤中,若确定匹配成功,则确定当前告警日志与当前业务线程对应的缓存日志一致,也即为重复告警,在此之前,已有相同业务线程的告警主题告过警,不需要再重复告警。
步骤b,若否,则获取所述业务线程对应的辅助信息。
在本实施例中,若确定当前告警日志不是重复告警,则需要对外发起告警,因此,此时需要获取业务线程对应的辅助信息,以便丰富告警信息,使得后续接收到告警信息的运维人员能全面了解故障详情,从而实现快速排障。
本实施例为避免重复告警,将同一业务线程的相同告警主题的告警归为一次告警,减少重复告警信息,避免运维人员做重复工作,实现快速排障。
进一步地,基于本发明网络告警方法第一、第二实施例,提出本发明网络告警方法第三实施例。
网络告警方法的第三实施例与网络告警方法的第一、第二实施例的区别在于,步骤S30之后,网络告警方法还包括:
步骤c,确定所述告警信息的检查指令,并基于所述检查指令,检测所述告警信息对应的故障是否已解决;
步骤d,若已解决,则标记所述告警信息为已解决。
本实施例在将告警信息发送至运维终端后,需要对其进行跟踪,监测当前的故障是否已被解决,若是已解决,则标记为解决,若是未解决,则发送催促信息至运维终端进行催促。
以下将对各个步骤进行详细说明:
步骤c,确定所述告警信息的检查指令,并基于所述检查指令,检测所述告警信息对应的故障是否已解决;
在本实施例中,告警系统确定当前告警信息的检查指令,也即每一条告警信息都对应有不同的检查指令,在具体实施时,以告警信息的告警主题确定对应的检查指令,其中,检查指令为人为编辑的检查程序。
在确定当前告警信息对应的检查指令后,告警系统将该检查指令发送给网络设备,以检测当前告警信息对应的故障是否已被解决。
具体的,步骤c包括:
确定所述告警信息的检查指令,并将所述检查指令发送至所述网络设备;
在该步骤中,告警系统会将告警信息储存在数据库中,并定时自动化检查告警是否解决,具体的,告警系统记录每种告警主题的检查指令,以及指令回显的正则匹配,因此,可根据当前告警信息的告警主题确定对应的检查指令,并将检查指令发送至网络设备,以供网络设备运行该检查指令对应的程序进行自检,并返回对应的回显指令,其中,回显指令即指令回显。
接收所述网络设备基于所述检查指令返回的回显指令,并基于所述回显指令确定所述故障是否已解决;其中,若所述回显指令的状态为指定状态,则确定所述故障已解决。
在该步骤中,告警系统接收网络设备基于检查指令返回的回显指令,然后告警系统根据回显指令匹配预设的正则表达式,从而确定当前告警信息对应的故障是否已解决,其中,若回显指令的状态为指定状态,则确定故障已解决,若回显指令的状态为非指定状态,则确定故障未解决。
如端口抖动对应的指令是:show int[port],告警系统根据当前告警信息的告警主题,确定对应的检查指令:show int xxx,并将检查指令发送至网络设备,以供网络设备运行检查指令对应的程序,然后接收网络设备基于检查指令返回的回显指令,匹配预设的正则表达式判断端口状态,如果是up就是恢复。下一次定时检查将不用再检查这条告警信息。
步骤d,若已解决,则标记所述告警信息为已解决。
在本实施例中,若确定故障已解决,则将当前告警信息标记为已解决;若确定故障未解决,则发送对应的催促信息至运维终端以进行催促。
本实施例对告警信息进行跟踪,确定告警信息是否已被解决,若是被解决,则标记为已解决,若是未解决,则发送对应的催促信息催促运维人员,提高告警的智能性,便于运维人员实现快速排障。
本发明还提供一种网络告警装置。本发明网络告警装置包括:
采集模块,用于采集网络设备产生的日志,并基于预设规则提取所述日志中的告警日志;
获取模块,用于确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息;
发送模块,用于将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端。
进一步地,所述告警内容包括告警字段,所述获取模块还用于:
获取所述网络设备的告警字段,所述告警字段用于表征所述网络设备的设备属性;
基于所述告警字段,确定所述告警日志的业务线程,并获取所述业务线程对应的辅助信息。
进一步地,所述获取模块还用于:
基于所述告警字段,确定所述告警日志的业务线程,并确定所述告警日志是否与所述业务线程对应的缓存日志一致;
若否,则获取所述业务线程对应的辅助信息。
进一步地,所述告警内容包括告警主题,所述获取模块还用于:
确定所述告警日志对应的目标规则,并基于所述目标规则,确定所述告警日志的告警主题;
确定所述业务线程对应的缓存日志的缓存主题,并将所述告警主题与所述缓存主题进行匹配;
若匹配成功,则确定所述告警日志与所述业务线程对应的缓存日志一致。
进一步地,所述网络告警装置还包括检测模块,所述检测模块用于:
确定所述告警信息的检查指令,并基于所述检查指令,检测所述告警信息对应的故障是否已解决;
若解决,则标记所述告警信息为已解决。
进一步地,所述检测模块还用于:
确定所述告警信息的检查指令,并将所述检查指令发送至所述网络设备;
接收所述网络设备基于所述检查指令返回的回显指令,并基于所述回显指令确定所述故障是否已解决;
其中,若所述回显指令的状态为指定状态,则确定所述故障已解决。
进一步地,所述发送模块还用于:
将所述告警内容和所述辅助信息封装成告警信息,并确定所述告警信息对应的处理策略;
将所述告警信息和所述处理策略发送至运维终端。
本发明还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有网络告警程序,所述网络告警程序被处理器执行时实现如上所述的网络告警方法的步骤。
其中,在所述处理器上运行的网络告警程序被执行时所实现的方法可参照本发明网络告警方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书与附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种网络告警方法,其特征在于,所述网络告警方法包括如下步骤:
采集网络设备产生的日志,并基于预设规则提取所述日志中的告警日志;
确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息;
将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端。
2.如权利要求1所述的网络告警方法,其特征在于,所述告警内容包括告警字段,所述确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息的步骤包括:
获取所述网络设备的告警字段,所述告警字段用于表征所述网络设备的设备属性;
基于所述告警字段,确定所述告警日志的业务线程,并获取所述业务线程对应的辅助信息。
3.如权利要求2所述的网络告警方法,其特征在于,所述基于所述告警字段,确定所述告警日志的业务线程,并获取所述业务线程对应的辅助信息的步骤包括:
基于所述告警字段,确定所述告警日志的业务线程,并确定所述告警日志是否与所述业务线程对应的缓存日志一致;
若否,则获取所述业务线程对应的辅助信息。
4.如权利要求3所述的网络告警方法,其特征在于,所述告警内容包括告警主题,所述确定所述告警日志是否与所述业务线程对应的缓存日志一致的步骤包括:
确定所述告警日志对应的目标规则,并基于所述目标规则,确定所述告警日志的告警主题;
确定所述业务线程对应的缓存日志的缓存主题,并将所述告警主题与所述缓存主题进行匹配;
若匹配成功,则确定所述告警日志与所述业务线程对应的缓存日志一致。
5.如权利要求1所述的网络告警方法,其特征在于,所述将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端的步骤之后,所述网络告警方法还包括:
确定所述告警信息的检查指令,并基于所述检查指令,检测所述告警信息对应的故障是否已解决;
若解决,则标记所述告警信息为已解决。
6.如权利要求5所述的网络告警方法,其特征在于,所述确定所述告警信息的检查指令,并基于所述检查指令,检测所述告警信息对应的故障是否已解决的步骤包括:
确定所述告警信息的检查指令,并将所述检查指令发送至所述网络设备;
接收所述网络设备基于所述检查指令返回的回显指令,并基于所述回显指令确定所述故障是否已解决;
其中,若所述回显指令的状态为指定状态,则确定所述故障已解决。
7.如权利要求1-6任一项所述的网络告警方法,其特征在于,所述将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端的步骤包括:
将所述告警内容和所述辅助信息封装成告警信息,并确定所述告警信息对应的处理策略;
将所述告警信息和所述处理策略发送至运维终端。
8.一种网络告警装置,其特征在于,所述网络告警装置包括:
采集模块,用于采集网络设备产生的日志,并基于预设规则提取所述日志中的告警日志;
获取模块,用于确定所述告警日志的告警内容,并获取所述告警内容对应的辅助信息;
发送模块,用于将所述告警内容和所述辅助信息封装成告警信息,并将所述告警信息发送至运维终端。
9.一种网络告警系统,其特征在于,所述网络告警系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的网络告警程序,所述网络告警程序被所述处理器执行时实现如权利要求1至7中任一项所述的网络告警方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有网络告警程序,所述网络告警程序被处理器执行时实现如权利要求1至7中任一项所述的网络告警方法的步骤。
CN201911242825.3A 2019-12-06 2019-12-06 网络告警方法、装置、系统与计算机可读存储介质 Pending CN111030857A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911242825.3A CN111030857A (zh) 2019-12-06 2019-12-06 网络告警方法、装置、系统与计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911242825.3A CN111030857A (zh) 2019-12-06 2019-12-06 网络告警方法、装置、系统与计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111030857A true CN111030857A (zh) 2020-04-17

Family

ID=70207465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911242825.3A Pending CN111030857A (zh) 2019-12-06 2019-12-06 网络告警方法、装置、系统与计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111030857A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112448849A (zh) * 2020-11-13 2021-03-05 中盈优创资讯科技有限公司 一种智能收集设备故障的方法及装置
CN112650611A (zh) * 2020-12-11 2021-04-13 苏州浪潮智能科技有限公司 一种批量诊断服务器故障的方法及系统
CN112667461A (zh) * 2020-12-15 2021-04-16 中国建设银行股份有限公司 告警处理方法、系统、计算机设备和存储介质
CN113067729A (zh) * 2021-03-18 2021-07-02 浪潮思科网络科技有限公司 一种网络设备监控方法、设备及介质
CN113065139A (zh) * 2021-05-06 2021-07-02 携程旅游网络技术(上海)有限公司 告警接入方法及系统、电子设备及介质
CN113395179A (zh) * 2021-06-11 2021-09-14 中国科学技术大学 提高ip网络中bgp对等体抖动告警信息可读性的方法
CN113595794A (zh) * 2021-07-30 2021-11-02 中国工商银行股份有限公司 网络设备告警信息优化方法、装置、设备及存储介质
CN114374597A (zh) * 2021-12-27 2022-04-19 浪潮通信信息系统有限公司 一种网络事件的故障处理方法、装置、设备及产品
CN114944980A (zh) * 2022-07-26 2022-08-26 上海有孚智数云创数字科技有限公司 用于监控告警的系统方法、设备、介质及程序产品
CN115150261A (zh) * 2022-06-29 2022-10-04 北京天融信网络安全技术有限公司 告警分析的方法、装置、电子设备及存储介质
CN115150252A (zh) * 2022-06-20 2022-10-04 浪潮思科网络科技有限公司 一种网络故障检测方法、系统及设备
CN116015873A (zh) * 2022-12-27 2023-04-25 北京天融信网络安全技术有限公司 网络安全告警处理方法、装置、设备及存储介质
CN115150261B (zh) * 2022-06-29 2024-04-19 北京天融信网络安全技术有限公司 告警分析的方法、装置、电子设备及存储介质

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112448849A (zh) * 2020-11-13 2021-03-05 中盈优创资讯科技有限公司 一种智能收集设备故障的方法及装置
CN112448849B (zh) * 2020-11-13 2023-08-01 中盈优创资讯科技有限公司 一种智能收集设备故障的方法及装置
CN112650611A (zh) * 2020-12-11 2021-04-13 苏州浪潮智能科技有限公司 一种批量诊断服务器故障的方法及系统
CN112667461A (zh) * 2020-12-15 2021-04-16 中国建设银行股份有限公司 告警处理方法、系统、计算机设备和存储介质
CN113067729A (zh) * 2021-03-18 2021-07-02 浪潮思科网络科技有限公司 一种网络设备监控方法、设备及介质
CN113067729B (zh) * 2021-03-18 2022-07-12 浪潮思科网络科技有限公司 一种网络设备监控方法、设备及介质
CN113065139A (zh) * 2021-05-06 2021-07-02 携程旅游网络技术(上海)有限公司 告警接入方法及系统、电子设备及介质
CN113395179B (zh) * 2021-06-11 2022-04-19 中国科学技术大学 提高ip网络中bgp对等体抖动告警信息可读性的方法
CN113395179A (zh) * 2021-06-11 2021-09-14 中国科学技术大学 提高ip网络中bgp对等体抖动告警信息可读性的方法
CN113595794A (zh) * 2021-07-30 2021-11-02 中国工商银行股份有限公司 网络设备告警信息优化方法、装置、设备及存储介质
CN113595794B (zh) * 2021-07-30 2023-08-04 中国工商银行股份有限公司 网络设备告警信息优化方法、装置、设备及存储介质
CN114374597A (zh) * 2021-12-27 2022-04-19 浪潮通信信息系统有限公司 一种网络事件的故障处理方法、装置、设备及产品
CN115150252A (zh) * 2022-06-20 2022-10-04 浪潮思科网络科技有限公司 一种网络故障检测方法、系统及设备
CN115150261A (zh) * 2022-06-29 2022-10-04 北京天融信网络安全技术有限公司 告警分析的方法、装置、电子设备及存储介质
CN115150261B (zh) * 2022-06-29 2024-04-19 北京天融信网络安全技术有限公司 告警分析的方法、装置、电子设备及存储介质
CN114944980A (zh) * 2022-07-26 2022-08-26 上海有孚智数云创数字科技有限公司 用于监控告警的系统方法、设备、介质及程序产品
CN114944980B (zh) * 2022-07-26 2022-10-21 上海有孚智数云创数字科技有限公司 用于监控告警的系统方法、设备和介质
CN116015873A (zh) * 2022-12-27 2023-04-25 北京天融信网络安全技术有限公司 网络安全告警处理方法、装置、设备及存储介质
CN116015873B (zh) * 2022-12-27 2023-08-29 北京天融信网络安全技术有限公司 网络安全告警处理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111030857A (zh) 网络告警方法、装置、系统与计算机可读存储介质
US10678669B2 (en) Field content based pattern generation for heterogeneous logs
CN107317724B (zh) 基于云计算技术的数据采集系统及方法
US20180129579A1 (en) Systems and Methods with a Realtime Log Analysis Framework
CN105243159B (zh) 一种基于可视化脚本编辑器的分布式网络爬虫系统
CN112631913B (zh) 应用程序的运行故障监控方法、装置、设备和存储介质
US20220239674A1 (en) Security appliance to monitor networked computing environment
CN112905261B (zh) 一种应用程序接口api管控方法、装置及电子设备
US8682935B2 (en) System and method for application navigation
CN103077107B (zh) 一种数据维护方法及系统
JP2003141075A (ja) ログ情報管理装置及びログ情報管理プログラム
CN107085549B (zh) 故障信息生成的方法和装置
CN110035087B (zh) 一种从流量还原账号信息的方法、装置、设备及存储介质
CN109815382A (zh) 大规模网络数据的感知与获取方法和系统
CN107168844B (zh) 一种性能监控的方法及装置
CN114528457A (zh) Web指纹检测方法及相关设备
CN113472787A (zh) 一种告警信息处理方法、装置、设备及存储介质
US10915510B2 (en) Method and apparatus of collecting and reporting database application incompatibilities
US20050120330A1 (en) System and method for creating and using self describing events in automation
CN107704369A (zh) 一种操作日志的记录方法、电子设备、存储介质、系统
WO2015187001A2 (en) System and method for managing resources failure using fast cause and effect analysis in a cloud computing system
CN114465741B (zh) 一种异常检测方法、装置、计算机设备及存储介质
CN115941224A (zh) 一种网络访问信息管理方法、装置和计算机可读存储介质
CN112270490A (zh) 一种基于物联网知识图谱的园区智能设施管理系统
CN103902725A (zh) 搜索引擎优化信息的获取方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination