CN108712294A - 一种基于Syslog知识库实现网络设备监控告警的方法 - Google Patents

一种基于Syslog知识库实现网络设备监控告警的方法 Download PDF

Info

Publication number
CN108712294A
CN108712294A CN201810569077.9A CN201810569077A CN108712294A CN 108712294 A CN108712294 A CN 108712294A CN 201810569077 A CN201810569077 A CN 201810569077A CN 108712294 A CN108712294 A CN 108712294A
Authority
CN
China
Prior art keywords
alarm
event
syslog
keyword
knowledge bases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810569077.9A
Other languages
English (en)
Inventor
陈艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pan Ye
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810569077.9A priority Critical patent/CN108712294A/zh
Publication of CN108712294A publication Critical patent/CN108712294A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于Syslog知识库实现网络设备监控告警的方法,包括如下步骤:S1)通过Syslog知识库收录各厂商的告警关键字;S2)对每个关键字进行级别分类以及事件分类;S3)日志服务器在接收到日志后,先对日志进行告警知识库的关键字匹配,然后根据匹配结果再进行告警转发。本发明通过Syslog知识库收录各厂商的告警关键字,并对每个关键字进行级别分类以及事件分类,在日志接收时对关键字进行匹配,实现精确的日志事件告警;通过知识库对海量日志告警进行告警压缩,即同一种类型的告警只累计次数,不触发新的告警,从而满足海量日志下网络设备高效便捷的监控需求。

Description

一种基于Syslog知识库实现网络设备监控告警的方法
技术领域
本发明涉及一种网络设备监控告警方法,尤其涉及一种基于Syslog知识库实现网络设备监控告警的方法。
背景技术
系统日志(Syslog)协议是在一个IP网络中转发系统日志信息的标准,日志服务器通过接收Syslog消息,对其内容进行判断,实现事件告警。
Syslog消息格式:系统消息由一个百分号开始,其结构如下所示。
%FACILITY-SUBFACILITY-SEVERITY-MNEMONIC:Message-text
Facility(特性):由2个或2个以上大写字母组成的代码,用来表示硬件设备、协议或系统软件的型号。
Severity(严重性):范围为0~7的数字编码,表示了事件的严重程度。
Mnemonic(助记码):唯一标识出错误消息的代码。
Message-text(消息文本):用于描述事件的文本串。消息中的这一部分有时会包含事件的细节信息,其中包括目的端口号、网络地址或系统内存地址空间中所对应的的地址。
Syslog日志消息体并无严格的格式控制,发送端和接收端无需互相协调,即可实现日志收发,协议的基本原则是简单。因此不同厂商的标准都不一样,对日志内容的定义也不一样。
告警级别是指产生告警的日志事件其本身实际的需重视程度,之所以使用“实际的”来描述,主要是因为Syslog消息格式中的Severity部分内容,并不一定能满足具体业务环境需要,这可能是厂商对Syslog的实现定义背景与用户的业务环境不一致。
由上可见,目前的技术方案存在如下问题:
1、由于厂商对日志的定义无统一规范,导致告警级别分类和事件分类无法有效实现。特别地,对于告警恢复的实现问题。
2、日志事件是以时间为序的列表,日志内容本身并没有上下文相关性,因此处理海量日志事件时,产生的告警数量将也是十分庞大的。
发明内容
本发明所要解决的技术问题是提供一种基于Syslog知识库实现网络设备监控告警的方法,能够实现精确的日志事件告警,满足海量日志下网络设备高效便捷的监控需求。
本发明为解决上述技术问题而采用的技术方案是提供一种基于Syslog知识库实现网络设备监控告警的方法,包括如下步骤:S1)通过Syslog知识库收录各厂商的告警关键字;S2)对每个关键字进行级别分类以及事件分类;S3)日志服务器在接收到日志后,先对日志进行告警知识库的关键字匹配,然后根据匹配结果再进行告警转发。
上述的基于Syslog知识库实现网络设备监控告警的方法,其中,所述步骤S1中的Syslog知识库包括如下字段:关键字表主键ID、关键字标题、事件ID、告警级别、设备类型、关键字信息、关键字转义后的正则表达式公式、被恢复规则id、规则类型、告警级别以及合并告警的关键字。
上述的基于Syslog知识库实现网络设备监控告警的方法,其中,所述步骤S2中的事件分类步骤如下:按事件源、事件影响目标和事件状态转换要素进行分类,所述事件源为设备功能模块,包括CPU,电源和风扇灯;所述事件影响目标是指对设备的具体承载业务的影响程度,包括业务网络中断、冗余失效或链路拥塞;所述事件状态转换用于描述事件的产生周期,包括事件从故障异常变为恢复。
上述的基于Syslog知识库实现网络设备监控告警的方法,其中,所述步骤S3中日志服务器通过监听一个网络端口集中收集日志,并进行统一分析存储,实现事件告警及事件回溯。
上述的基于Syslog知识库实现网络设备监控告警的方法,其中,所述步骤S2包括通过知识库对海量日志告警进行告警压缩,对同一个事件源的事件通过提取日志内容进行判断,并归集合并到较早前的告警中;所述步骤S3对同一种类型的告警只累计次数,不触发新的告警。
上述的基于Syslog知识库实现网络设备监控告警的方法,其中,所述步骤S2为每个事件创建一个事件组,所述事件组包含相互对立的告警类型事件和恢复类型事件,所述步骤S2每接收到一个事件,先根据事件组ID检索之前的事件,对海量日志进行匹配关联。
本发明对比现有技术有如下的有益效果:本发明提供的基于Syslog知识库实现网络设备监控告警的方法,通过Syslog知识库收录各厂商的告警关键字,并对每个关键字进行级别分类以及事件分类,在日志接收时对关键字进行匹配,实现精确的日志事件告警;通过知识库对海量日志告警进行告警压缩,即同一种类型的告警只累计次数,不触发新的告警,从而满足海量日志下网络设备高效便捷的监控需求。
附图说明
图1为本发明基于Syslog知识库实现网络设备监控告警处理流程示意图;
图2为本发明相互对立的告警类型事件和恢复类型事件匹配组合示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
图1为本发明基于Syslog知识库实现网络设备监控告警处理流程示意图。
请参见图1,本发明提供的基于Syslog知识库实现网络设备监控告警的方法,包括如下步骤:
S1)通过Syslog知识库收录各厂商的告警关键字;
S2)对每个关键字进行级别分类以及事件分类;
S3)日志服务器在接收到日志后,先对日志进行告警知识库的关键字匹配,然后根据匹配结果再进行告警转发。
本发明通过在设备上配置Syslog日志服务器并发送日志,日志服务器通过监听一个网络端口(通常是UDP-514)集中收集日志,并进行统一分析存储,实现事件告警及事件回溯,所述步骤S1中的Syslog知识库包括如下字段:
本发明提供的基于Syslog知识库实现网络设备监控告警的方法,事件分类是指对事件源、事件影响目标、事件状态转换等要素进行分类。事件源通常是设备的一个功能模块,如CPU,电源,风扇灯;事件影响目标是对设备的具体承载业务的影响,如业务网络中断、冗余失效、链路拥塞等;事件状态转换是对事件的产生周期的描述,如事件从故障异常变为恢复。
本发明通过制定统一的告警知识库,用以适应各种厂商的不同标准,实现高可用、个性化的日志事件告警。用户可用根据业务需求自定义告警条件,告警条件实现高可配置性。所述步骤S2包括通过知识库对海量日志告警进行告警压缩,对同一个事件源的事件通过提取日志内容进行判断,并归集合并到较早前的告警中;所述步骤S3对同一种类型的告警只累计次数,不触发新的告警。具体实现过程如下:
1)告警级别分类:通过匹配到的关键字的告警级别字段进行判断,实现分类;
2)事件合并:系统对同一个事件源的事件进行归集,是通过提取日志内容进行判断的。比如日志出现了slot 0is down,系统会提取slot 0,在以后再次受到与slot 0相关的日志时,会归类到较早前的告警中。
3)告警恢复/故障事件分类:系统对每个事件创建一个事件组,事件组包含类型为告警的事件和恢复的事件,称其为对立事件。每接收到一个事件,系统会根据事件组ID检索之前的事件,对海量日志进行匹配关联,如图2所示。
告警对立事件定义如下:
综上所述,本发明使用知识库实现日志事件告警的事件级别、类型分类,并使用知识库实现日志事件告警的合并。具体优点如下:
1)基于知识库实现的日志分析引擎,能兼容所有设备厂商的日志规范,支持告警恢复事件的闭合,支持告警压缩;
2)基于知识库实现的的告警关键字、告警级别、告警描述等参数管理,高效便捷;
3)知识库作为监控告警实现的一个组件,其自身具备极高的可复用性,同时更利于告警经验的积累。
虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,当可作些许的修改和完善,因此本发明的保护范围当以权利要求书所界定的为准。

Claims (6)

1.一种基于Syslog知识库实现网络设备监控告警的方法,其特征在于,包括如下步骤:
S1)通过Syslog知识库收录各厂商的告警关键字;
S2)对每个关键字进行级别分类以及事件分类;
S3)日志服务器在接收到日志后,先对日志进行告警知识库的关键字匹配,然后根据匹配结果再进行告警转发。
2.如权利要求1所述的基于Syslog知识库实现网络设备监控告警的方法,其特征在于,所述步骤S1中的Syslog知识库包括如下字段:关键字表主键ID、关键字标题、事件ID、告警级别、设备类型、关键字信息、关键字转义后的正则表达式公式、被恢复规则id、规则类型、告警级别以及合并告警的关键字。
3.如权利要求1所述的基于Syslog知识库实现网络设备监控告警的方法,其特征在于,所述步骤S2中的事件分类步骤如下:按事件源、事件影响目标和事件状态转换要素进行分类,所述事件源为设备功能模块,包括CPU,电源和风扇灯;所述事件影响目标是指对设备的具体承载业务的影响程度,包括业务网络中断、冗余失效或链路拥塞;所述事件状态转换用于描述事件的产生周期,包括事件从故障异常变为恢复。
4.如权利要求1所述的基于Syslog知识库实现网络设备监控告警的方法,其特征在于,所述步骤S3中日志服务器通过监听一个网络端口集中收集日志,并进行统一分析存储,实现事件告警及事件回溯。
5.如权利要求1所述的基于Syslog知识库实现网络设备监控告警的方法,其特征在于,所述步骤S2包括通过知识库对海量日志告警进行告警压缩,对同一个事件源的事件通过提取日志内容进行判断,并归集合并到较早前的告警中;所述步骤S3对同一种类型的告警只累计次数,不触发新的告警。
6.如权利要求1所述的基于Syslog知识库实现网络设备监控告警的方法,其特征在于,所述步骤S2为每个事件创建一个事件组,所述事件组包含相互对立的告警类型事件和恢复类型事件,所述步骤S2每接收到一个事件,先根据事件组ID检索之前的事件,对海量日志进行匹配关联。
CN201810569077.9A 2018-06-05 2018-06-05 一种基于Syslog知识库实现网络设备监控告警的方法 Pending CN108712294A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810569077.9A CN108712294A (zh) 2018-06-05 2018-06-05 一种基于Syslog知识库实现网络设备监控告警的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810569077.9A CN108712294A (zh) 2018-06-05 2018-06-05 一种基于Syslog知识库实现网络设备监控告警的方法

Publications (1)

Publication Number Publication Date
CN108712294A true CN108712294A (zh) 2018-10-26

Family

ID=63870473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810569077.9A Pending CN108712294A (zh) 2018-06-05 2018-06-05 一种基于Syslog知识库实现网络设备监控告警的方法

Country Status (1)

Country Link
CN (1) CN108712294A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109245309A (zh) * 2018-11-07 2019-01-18 广东电网有限责任公司 一种电网告警信息标准化处理方法及装置
CN109412870A (zh) * 2018-12-10 2019-03-01 网宿科技股份有限公司 告警监控方法及平台、服务器、存储介质
CN110086666A (zh) * 2019-04-25 2019-08-02 深圳前海微众银行股份有限公司 一种告警方法、装置及系统
CN110166290A (zh) * 2019-05-16 2019-08-23 平安科技(深圳)有限公司 基于日志文件的告警方法及装置
CN110245045A (zh) * 2019-05-23 2019-09-17 平安科技(深圳)有限公司 一种基于日志的关键字告警方法及装置
CN110245055A (zh) * 2019-05-23 2019-09-17 平安科技(深圳)有限公司 一种基于日志的关键字告警方法及装置
CN110322153A (zh) * 2019-07-09 2019-10-11 中国工商银行股份有限公司 监控事件处理方法及系统
CN110362545A (zh) * 2019-05-27 2019-10-22 平安科技(深圳)有限公司 日志监控方法、装置、终端与计算机可读存储介质
CN110659187A (zh) * 2019-09-04 2020-01-07 深圳供电局有限公司 一种日志告警监控方法及其系统、计算机可读存储介质
CN111162950A (zh) * 2019-12-31 2020-05-15 中国建设银行股份有限公司 故障事件处理方法、装置及系统
CN111221702A (zh) * 2019-11-18 2020-06-02 上海维谛信息科技有限公司 基于日志分析的异常处理方法、系统、终端及介质
CN111953541A (zh) * 2020-08-10 2020-11-17 腾讯科技(深圳)有限公司 告警信息处理方法、装置、计算机设备及存储介质
CN112448849A (zh) * 2020-11-13 2021-03-05 中盈优创资讯科技有限公司 一种智能收集设备故障的方法及装置
CN112636962A (zh) * 2020-12-15 2021-04-09 广东华兴银行股份有限公司 一种提高网络监控效率的方法、设备及介质
CN114124664A (zh) * 2021-11-23 2022-03-01 上海新炬网络技术有限公司 一种基于日志与设备邻居关系判断网络设备重启的方法
CN115150252A (zh) * 2022-06-20 2022-10-04 浪潮思科网络科技有限公司 一种网络故障检测方法、系统及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104144071A (zh) * 2013-05-10 2014-11-12 北京新媒传信科技有限公司 系统日志的处理方法和系统日志的处理平台
CN104717085A (zh) * 2013-12-16 2015-06-17 中国移动通信集团湖南有限公司 一种日志解析方法及装置
CN105991337A (zh) * 2015-03-02 2016-10-05 中国移动通信集团广东有限公司 一种告警压缩方法及告警压缩装置
CN106528619A (zh) * 2016-09-30 2017-03-22 国家电网公司 一种基于关键字段的交换机日志快速聚合方法
CN107861856A (zh) * 2017-11-08 2018-03-30 郑州云海信息技术有限公司 云数据系统中告警信息的处理方法和计算机存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104144071A (zh) * 2013-05-10 2014-11-12 北京新媒传信科技有限公司 系统日志的处理方法和系统日志的处理平台
CN104717085A (zh) * 2013-12-16 2015-06-17 中国移动通信集团湖南有限公司 一种日志解析方法及装置
CN105991337A (zh) * 2015-03-02 2016-10-05 中国移动通信集团广东有限公司 一种告警压缩方法及告警压缩装置
CN106528619A (zh) * 2016-09-30 2017-03-22 国家电网公司 一种基于关键字段的交换机日志快速聚合方法
CN107861856A (zh) * 2017-11-08 2018-03-30 郑州云海信息技术有限公司 云数据系统中告警信息的处理方法和计算机存储介质

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109245309A (zh) * 2018-11-07 2019-01-18 广东电网有限责任公司 一种电网告警信息标准化处理方法及装置
CN109245309B (zh) * 2018-11-07 2020-08-14 广东电网有限责任公司 一种电网告警信息标准化处理方法及装置
CN109412870A (zh) * 2018-12-10 2019-03-01 网宿科技股份有限公司 告警监控方法及平台、服务器、存储介质
CN109412870B (zh) * 2018-12-10 2022-07-01 网宿科技股份有限公司 告警监控方法及平台、服务器、存储介质
CN110086666A (zh) * 2019-04-25 2019-08-02 深圳前海微众银行股份有限公司 一种告警方法、装置及系统
CN110166290A (zh) * 2019-05-16 2019-08-23 平安科技(深圳)有限公司 基于日志文件的告警方法及装置
CN110245045A (zh) * 2019-05-23 2019-09-17 平安科技(深圳)有限公司 一种基于日志的关键字告警方法及装置
CN110245055A (zh) * 2019-05-23 2019-09-17 平安科技(深圳)有限公司 一种基于日志的关键字告警方法及装置
CN110245045B (zh) * 2019-05-23 2022-06-07 平安科技(深圳)有限公司 一种基于日志的关键字告警方法及装置
CN110362545A (zh) * 2019-05-27 2019-10-22 平安科技(深圳)有限公司 日志监控方法、装置、终端与计算机可读存储介质
CN110322153A (zh) * 2019-07-09 2019-10-11 中国工商银行股份有限公司 监控事件处理方法及系统
CN110659187B (zh) * 2019-09-04 2023-07-07 深圳供电局有限公司 一种日志告警监控方法及其系统、计算机可读存储介质
CN110659187A (zh) * 2019-09-04 2020-01-07 深圳供电局有限公司 一种日志告警监控方法及其系统、计算机可读存储介质
CN111221702A (zh) * 2019-11-18 2020-06-02 上海维谛信息科技有限公司 基于日志分析的异常处理方法、系统、终端及介质
CN111221702B (zh) * 2019-11-18 2024-02-27 上海维谛信息科技有限公司 基于日志分析的异常处理方法、系统、终端及介质
CN111162950A (zh) * 2019-12-31 2020-05-15 中国建设银行股份有限公司 故障事件处理方法、装置及系统
CN111953541A (zh) * 2020-08-10 2020-11-17 腾讯科技(深圳)有限公司 告警信息处理方法、装置、计算机设备及存储介质
CN111953541B (zh) * 2020-08-10 2023-12-05 腾讯科技(深圳)有限公司 告警信息处理方法、装置、计算机设备及存储介质
CN112448849A (zh) * 2020-11-13 2021-03-05 中盈优创资讯科技有限公司 一种智能收集设备故障的方法及装置
CN112636962A (zh) * 2020-12-15 2021-04-09 广东华兴银行股份有限公司 一种提高网络监控效率的方法、设备及介质
CN114124664A (zh) * 2021-11-23 2022-03-01 上海新炬网络技术有限公司 一种基于日志与设备邻居关系判断网络设备重启的方法
CN115150252A (zh) * 2022-06-20 2022-10-04 浪潮思科网络科技有限公司 一种网络故障检测方法、系统及设备

Similar Documents

Publication Publication Date Title
CN108712294A (zh) 一种基于Syslog知识库实现网络设备监控告警的方法
US7779026B2 (en) Method and apparatus for collecting and displaying network device information
CN1992636B (zh) 一种处理告警信息的系统及方法
US11348023B2 (en) Identifying locations and causes of network faults
CN105049223B (zh) 一种电力通信网缺陷故障处理决策辅助分析方法
CN105159964A (zh) 一种日志监控方法及系统
CN112055062B (zh) 数据通信方法、装置、设备及可读存储介质
US10289522B2 (en) Autonomous information technology diagnostic checks
CN102546274A (zh) 一种通信业务中的告警监控方法及设备
CN112000502B (zh) 海量错误日志的处理方法、装置、电子装置及存储介质
CN110929896A (zh) 一种系统设备的安全分析方法及装置
CN110677304A (zh) 一种分布式问题追踪系统及设备
CN108241744A (zh) 一种日志读取方法和装置
CN113672456A (zh) 应用平台的模块化自监听方法、系统、终端及存储介质
CN111258798A (zh) 监控数据的故障定位方法、装置、计算机设备及存储介质
CN110798348A (zh) 配电通信网故障告警方法、服务器及系统
CN114328107A (zh) 光磁融合存储服务器集群的监控方法、系统及电子设备
CN108039971A (zh) 一种告警方法及装置
CN106646105A (zh) 一种主站与行波测距装置之间的数据传输方法
JP6078485B2 (ja) 運用履歴分析装置及び方法及びプログラム
CN113037549A (zh) 一种运维环境告警方法
CN111143318B (zh) 一种信息处理方法、装置、电子设备及存储介质
CN115080669B (zh) 全防误信息点表生成方法、装置、设备及存储介质
CN115599657B (zh) 软件设施异常判断方法
CN116821798B (zh) 一种故障预警的服务器、方法及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190129

Address after: Room 404, 33 Dongqing Street, Haizhu District, Guangzhou City, Guangdong 510000

Applicant after: Pan Ye

Applicant after: Chen Yan

Address before: 510000 Meidong Road, Yuexiu District, Guangzhou City, Guangdong Province, 80

Applicant before: Chen Yan

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20181026

RJ01 Rejection of invention patent application after publication