CN114708717A - 一种系统监控的关联告警方法及装置 - Google Patents

一种系统监控的关联告警方法及装置 Download PDF

Info

Publication number
CN114708717A
CN114708717A CN202210402531.8A CN202210402531A CN114708717A CN 114708717 A CN114708717 A CN 114708717A CN 202210402531 A CN202210402531 A CN 202210402531A CN 114708717 A CN114708717 A CN 114708717A
Authority
CN
China
Prior art keywords
alarm
time
data
index data
configuration interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210402531.8A
Other languages
English (en)
Other versions
CN114708717B (zh
Inventor
李苏雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202210402531.8A priority Critical patent/CN114708717B/zh
Publication of CN114708717A publication Critical patent/CN114708717A/zh
Application granted granted Critical
Publication of CN114708717B publication Critical patent/CN114708717B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/18Status alarms
    • G08B21/182Level alarms, e.g. alarms responsive to variables exceeding a threshold
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/18Status alarms
    • G08B21/24Reminder alarms, e.g. anti-loss alarms

Landscapes

  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Alarm Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本文提供了一种系统监控的关联告警方法及装置,方法包括:接收用户配置的多个原子规则及告警策略,原子规则包括指标标识、告警类型及阈值条件,各原子规则中的告警类型为静态阈值、动态阈值及关键字之一,告警策略包括告警时间信息及原子规则满足的告警条件;根据告警时间信息,确定每次数据池中指标数据的时间信息;根据每次时间信息及指标标识,读取系统的指标数据,将读取的指标数据存储于数据池;利用原子规则执行告警步骤以识别数据池中的相关指标数据;判断原子规则的识别结果是否满足告警条件,若满足,生成并发出告警信息。本文将不同告警类型原子规则进行组合,适用各种应用场景,能够提高告警准确度。

Description

一种系统监控的关联告警方法及装置
技术领域
本文涉及数据监控领域,尤其涉及一种系统监控的关联告警方法及装置。
背景技术
现有技术中运维监控领域的告警模式通常是为系统的某个指标设定一告警阈值,当指标达到告警阈值时,则触发告警。然而该种告警方式并不适用于所有场景,在某些场景中,系统的一指标异常并不能说明系统异常,例如系统中的每秒交易量指标低于设定阈值时,并不能说明系统异常,此时,需要交易耗时也超出阈值,才能说明程序发生事故,因此,现有技术中通过单个指标与告警阈值比较的告警方式存在适用场景有限且告警精度低的问题。
发明内容
本文用于解决现有技术中单个指标与告警阈值比较的告警方式存在适用场景有限且告警精度低的问题。
为了解决上述技术问题,本文的一方面提供一种系统监控的关联告警方法,包括:
接收用户配置的多个原子规则及告警策略,所述原子规则包括指标标识、告警类型及阈值条件,各原子规则中的告警类型为静态阈值告警、动态阈值告警及关键字告警其中之一,所述告警策略包括告警时间信息及原子规则满足的告警条件;
根据所述告警时间信息,确定每次数据池中指标数据的时间信息;
根据每次数据池中指标数据的时间信息及所述指标标识,读取系统的指标数据,将读取的指标数据存储于数据池;
利用所述原子规则执行告警步骤,以识别所述数据池中的相关指标数据;
判断所述原子规则的识别结果是否满足告警条件,若满足,则生成并发出告警信息。
作为本文进一步实施例中,所述告警时间信息包括告警时间范围及告警时间间隔;所述数据池中指标数据的时间信息包括起始时刻及结束时刻,起始时刻与结束时刻之差为告警时间间隔;
所述告警步骤的运行时刻为数据池中指标数据的结束时刻与延迟时间长度之和。
作为本文进一步实施例中,根据所述告警时间信息,确定每次数据池中指标数据的时间信息,包括:
根据所述告警时间信息,设置首次数据池中指标数据的时间信息;设置第n次数据池中指标数据的时间信息为首次数据池中指标数据的时间信息加上n个告警时间间隔,其中,n为大于1的正整数;或
根据所述告警时间信息,确定每次告警步骤的运行时刻,每次告警步骤的运行时刻间的差值为告警时间间隔;将每次告警步骤的运行时刻减去告警时间间隔及延迟时间长度得到每次数据池中指标数据的开始时刻;将每次告警步骤的运行时刻减去延迟时间长度作为每次数据池中指标数据的结束时刻。
作为本文进一步实施例中,所述告警策略还包括:报警通知渠道信息、维护人员、告警级别信息;
生成告警信息的过程包括:获取告警级别信息及告警类型对应的告警模板;根据获取的告警模板生成告警信息;根据所述报警通知渠道信息发出所述告警信息至所述维护人员。
作为本文进一步实施例中,用户通过配置界面配置多个原子规则及告警策略,所述配置界面包括原子规则配置接口及告警策略配置接口;
所述原子规则配置接口包括:指标数据配置接口、静态阈值配置接口、动态阈值配置接口、关键字配置接口;
所述指标数据配置接口用于供用户配置指标数据名称;
所述静态阈值配置接口用于供用户配置静态阈值;
所述动态阈值配置接口用于供用户配置动态阈值;
所述关键字配置接口用于供用户配置关键字;
所述告警策略配置接口包括:告警时间配置接口及告警条件配置接口;
所述告警时间配置接口用于供用户配置告警时间信息;
所述告警条件配置接口用于供用户配置原子规则触发次数及原子规则间的组合逻辑。
作为本文进一步实施例中,所述静态阈值配置接口中设置有静态阈值选项列表,所述静态阈值选项列表中的阈值根据业务需求确定;
所述动态阈值配置接口中设置有动态阈值选项列表,所述动态阈值选项列表中的阈值根据历史指标数据变动规律确定;
所述关键字配置接口中设置有关键字选项列表,所述关键字选项列表中的关键字根据异常日志中异常字段确定。
本文另一方面提供一种系统监控的关联告警装置,包括:
配置单元,用于接收用户配置的多个原子规则及告警策略,所述原子规则包括指标标识、告警类型及阈值条件,各原子规则中的告警类型为静态阈值告警、动态阈值告警及关键字告警其中之一,所述告警策略包括告警时间信息及原子规则满足的告警条件;
初始化单元,用于根据所述告警时间信息,确定每次数据池中指标数据的时间信息;
读取单元,用于根据每一时间信息及所述指标标识,读取系统的指标数据,将读取的指标数据存储于数据池;
告警识别单元,用于利用所述原子规则执行告警步骤,以识别所述数据池中的相关指标数据;
告警策略匹配单元,用于判断所述原子规则的识别结果是否满足告警条件,若满足,则生成并发出告警信息。
本文另一方面提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述任一实施例所述方法。
本文另一方面提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被计算机设备的处理器运行时,执行根据前述任一实施例所述方法的指令。
本文另一方面提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现前述任一实施例所述的方法。
本文提供的系统监控的关联告警方法及装置通过供用户配置多个原子规则及告警策略,所述原子规则包括指标标识、告警类型及阈值条件,各原子规则中的告警类型为静态阈值告警、动态阈值告警及关键字告警其中之一,告警策略包括告警时间信息及原子规则满足的告警条件;根据告警时间信息,确定每次数据池中指标数据的时间信息;根据每次数据池中指标数据的时间信息,执行如下告警处理:根据该时间信息及所述指标标识,读取系统的指标数据,将读取的指标数据存储于数据池;利用原子规则执行告警步骤,以识别数据池中的相关指标数据;判断原子规则的识别结果是否满足告警条件,若满足,则生成并发出告警信息,能够将不同告警类型的原子规则进行组合,适用各种应用场景,提高告警准确度。
为让本文的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本文实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本文的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本文实施例系统监控的关联告警系统示意图;
图2示出了本文实施例系统监控的关联告警方法的流程图;
图3A示出了本文实施例配置界面的第一示意图;
图3B示出了本文实施例配置界面的第二示意图;
图3C示出了本文实施例配置界面的第三示意图;
图3D示出了本文实施例配置界面的第四示意图;
图3E示出了本文实施例配置界面的第五示意图;
图4示出了本文实施例告警策略示意图;
图5示出了本文实施例系统监控的关联告警装置的结构图;
图6示出了本文实施例计算机设备结构图。
附图符号说明:
110、客户端;
120、服务器;
311、指标数据配置接口;
312、静态阈值配置接口;
313、动态阈值配置接口;
314、关键字配置接口
501、配置单元;
502、初始化单元;
503、读取单元;
504、告警识别单元;
505、告警策略匹配单元;
602、计算机设备;
604、处理器;
606、存储器;
608、驱动机构;
610、输入/输出模块;
612、输入设备;
614、输出设备;
616、呈现设备;
618、图形用户接口;
620、网络接口;
622、通信链路;
624、通信总线。
具体实施方式
下面将结合本文实施例中的附图,对本文实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本文一部分实施例,而不是全部的实施例。基于本文中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文保护的范围。
需要说明的是,本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或装置产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。
需要说明的是,本文的系统监控的关联告警方法及装置可用于金融领域,也可用于除金融领域之外的任意领域,本文的系统监控的关联告警方法及装置的应用领域不做限定。
需要说明的是,本申请所涉及的信息和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本文根据实际场景中单指标阈值告警方式存在告警误判率高不适用于更多场景的基础上,提出了一种系统监控的关联告警系统,如图1所示,包括:客户端110及服务器120。
客户端110用于供用户配置多个原子规则及告警策略,所述原子规则包括指标标识、告警类型及阈值条件,每一原子规则中的告警类型为静态阈值告警、动态阈值告警及关键字告警之一,所述告警策略包括告警时间信息及原子规则满足的告警条件。
服务器120接收客户端110发送的多个原子规则及告警策略,根据告警时间信息,确定每次数据池中指标数据的时间信息;对于每次数据池中指标数据的时间信息,执行如下告警处理:根据该时间信息及指标标识,读取系统的指标数据,将读取的指标数据存储于数据池;利用原子规则执行告警步骤,以识别数据池中的相关指标数据;判断原子规则的识别结果是否满足告警条件,若满足,则生成并发出告警信息。
详细的说,本实施例所述的客户端110可以为台式电脑、平板电脑、笔记本电脑、智能手机、数字助理、智能可穿戴设备等。其中,智能可穿戴设备可以包括智能手环、智能手表、智能眼镜、智能头盔等,客户端中安装有供用户配置信息的应用程序。当然,客户端110并不限于上述具有一定实体的电子设备,其还可以为运行于上述电子设备中的软件。服务器120与系统连接,可直接从系统获取指标数据。本文所述的系统指的是根据业务信息计算指标数据的系统。
本文所述的指标用于反映业务是否在规定时间内正常处理,以交易系统为例,指标例如为交易每秒的平均耗时,每秒的交易量。本文所述的指标标识为指标编号,可用数字、字符等标识,例如001表示交易每秒的平均耗时,本文对指标标识不做限定。
同一用户配置的原子规则中的告警类型可以相同,也可以不同,可供用户选择的告警类型为静态阈值告警、动态阈值告警及关键字告警。
其中,静态阈值告警中的静态阈值根据业务需求确定,具体的,可通过专家经验得出。
动态阈值告警中的动态阈值根据历史指标数据变动规律确定,具体的,根据历史指标数据规律预测得到基线,根据基线自动计算阈值的上下限。
关键字告警中的关键字由日志中的异常字段确定,例如为ERROR,Exception等。具体实施时,关键字告警中的关键字可由开发人员配置。
告警时间信息包括告警时间范围及告警时间间隔,告警时间范围用于指定有效指标数据的时间范围,例如为08:00至20:00,22:00-23:59,00:00-06:00,每一原子规则中可设置多个告警时间范围,本文对告警时间范围具体值不作限定,可根据指标的实际情况进行设定。告警时间间隔例如为5分钟,同样可由用户根据需求进行设定,本文对此不作限定。
对于动态阈值告警而言,阈值条件包括阈值关系(大于、小于或等于)及阈值计算所需历史指标数据及预测算法,历史指标数据例如为过去四周的指标数据,预算算法例如为方差法,具体的,阈值具体值计算过程包括:计算历史指标数据的均值和方差,根据计算得到的均值和方差确定指标数据的波动范围,通过该波动范围为确定阈值具体值。对于静态阈值告警而言,阈值条件包括阈值关系及阈值。对于关键字告警而言,阈值条件包括阈值,即关键字。
原子规则识别结果包括是否满足阈值及满足阈值的次数。
原子规则满足的告警条件包括原子规则触发次数(即在数据池中数据内,也即告警时间间隔内满足阈值的次数)及原子规则间的组合逻辑,触发次数根据业务需求设定,组合逻辑包括与、或、非。例如用户设置了两个原子规则,原子规则1——每秒的交易量指标大于1000,原子规则2——每秒的平均耗时指标大于5秒,告警策略为原子规则1且原子规则2在告警时间间隔内同时超出阈值5次。
本文所述数据池中指标数据的时间信息包括起始时刻及结束时刻,起始时刻与结束时刻之差为告警时间间隔。考虑到指标数据进入数据池中存在数据延迟,告警步骤的运行时刻为数据池中指标数据的结束时刻与延迟时间长度之和,延迟时间可根据数据传输延迟特性确定,本文对其具体取值不做限定。
一些实施方式中,根据告警时间信息,确定每次数据池中指标数据的时间信息,包括:
(1)根据告警时间信息,设置首次数据池中指标数据的时间信息。具体实施时,可设置首次数据池中指标数据的起始时刻为告警时间信息中告警时间范围的起始时刻,首次数据池中指标数据的结束时刻为告警时间范围的起始时刻加上告警时间间隔的时刻。
(2)设置第n次数据池中指标数据的时间信息为首次数据池中指标数据的时间信息加上n个告警时间间隔,其中,n为大于等于2的正整数。
其它实施方式中,根据告警时间信息,确定每次数据池中指标数据的时间信息,包括:
(1)根据告警时间信息,确定每次告警步骤的运行时刻,每次告警步骤的运行时刻间的差值为告警时间间隔。具体实施时,设置首次告警步骤的运行时刻为告警时间信息中告警时间范围的起始时刻加上告警时间间隔及延迟时间。第i次告警步骤的运行时刻为首次告警步骤的运行时刻加上i倍的告警时间间隔,i为大于等于2的正整数。
(2)将每次告警步骤的运行时刻减去告警时间间隔及延迟时间长度得到每次数据池中指标数据的开始时刻。
(3)将每次告警步骤的运行时刻减去延迟时间长度作为每次数据池中指标数据的结束时刻。
本文所述数据池中仅存储待告警判断的指标数据,具体实施时,数据池中可划分为多个子区域,每一子区域存储一种类型的指标数据。
本文一实施例中,还提供一种系统监控的关联告警方法,如图2所示,系统监控的关联告警方法包括:
步骤201,接收用户配置的多个原子规则及告警策略。
其中,原子规则包括指标标识及告警类型,各原子规则中的告警类型为静态阈值告警、动态阈值告警及关键字告警其中之一。告警策略包括告警时间信息及原子规则满足的告警条件。
本步骤实施时,可从数据库中加载用户配置的多个原子规则及告警策略。用户通过配置界面配置多个原子规则及告警策略,配置界面包括原子规则配置接口及告警策略配置接口。如图3A所示,原子规则配置接口包括:指标数据配置接口311、静态阈值配置接口312、动态阈值配置接口313、关键字配置接口314。指标数据配置接口311用于供用户配置指标数据名称,静态阈值配置接口312用于供用户配置静态阈值,动态阈值配置接口313用于供用户配置动态阈值,关键字配置接口314用于供用户配置关键字。
一具体实施方式中,指标数据配置接口311供用户配置告警指标、部署地及可用区等信息。
静态阈值配置接口312如图3B所示,可供用户配置阈值条件,包括阈值关系(大于、小于或等于)、阈值上限、阈值下限等。动态阈值配置接口313如图3C所示,可供用户配置阈值条件,包括阈值关系、阈值计算所需历史指标数据及预测算法。关键字配置接口314如图3D所示,可供用户配置关键字。图3A至图3D仅为示例性说明,具体实施时,可根据用户需求设计配置界面。
告警策略配置接口如图3E所示,用于供用户配置告警时间范围、告警时间间隔、原子规则触发次数及原子规则之间的组合逻辑。配置好的告警策略如图4所示,具体实施时,用户配置过的原子规则存储于原子规则池中,用户还可根据原子规则池中已有原子规则直接配置告警策略。
步骤202,根据告警时间信息,确定每次数据池中指标数据的时间信息。
本步骤能够保证数据池中仅保留当前待分析的指标数据,具体实施时,可一次确定出数据池中指标数据的时间序列,序列中元素为一次数据池中指标数据的时间信息,还可一次仅确定出一次数据池中指标数据的时间信息,待数据池中数据分析完后,再确定下一次数据池中指标数据的时间信息。
步骤203,根据第i次数据池中指标数据的时间信息及指标标识,读取系统的指标数据,将读取的指标数据存储于数据池,初始状态下i=1,i的最大取值为m,m为告警时间范围内取指标数据的次数。
步骤204,利用原子规则执行告警步骤,以识别数据池中的相关指标数据是否满足原子规则中的阈值及满足阈值的次数。
实施时,可在数据池中仅保留满足阈值的指标数据,删除不满足阈值的指标数据,同时记录满足阈值的次数。指标数据的识别结果包括:满足阈值的指标数据及满足次数。
步骤205,判断原子规则的识别结果是否满足告警条件,若满足,则生成并发出告警信息,若不满足,则执行步骤206。
步骤206,计算i=i+1,返回步骤203继续执行。
本步骤实施时,先分析各原子规则的识别结果是否满足告警条件中设定的原子规则触发次数,若满足,则确定原子规则的触发次数间的逻辑关系是否满足告警条件中的组合逻辑,若满足,则满足告警条件,生成并发送告警信息,反之,继续根据下次数据池中指标数据的时间信息读取指标数据、执行告警步骤。
本实施例将不同告警类型的原子规则进行组合,只有满足所有组合条件时,才会发生报警,本实施例使得告警结果更加精确,能够提高告警信息质量,压缩告警信息的数量,进而更容易分析问题,定位故障原因。
为了便于用户快速获取异常指标数据,可将数据池中剩余的异常指标数据添加至告警信息中一并发送给相关运维人员。
本文进一步实施例中,为了提高告警信息的可读性,便于运维人员解读告警信息,告警策略还包括:报警通知渠道信息、维护人员、告警级别信息。其中,通知渠道信息包括邮件、短信等数据发送手段。告警级别信息指对告警等级进行分级,如特别严重、严重、一般等,通过告警级别信息可提示运维人员异常紧急程度。原子规则中还可供用户配置是否按照预定维度进行告警,预定维度例如数据来源设备等。
生成告警信息的过程包括:获取告警级别信息及告警类型对应的告警模板;根据获取的告警模板生成告警信息;根据报警通知渠道信息发出所述告警信息至所述维护人员。
一具体实施例中,静态阈值告警模板例如为:当前时间[{xxx}],告警级别:[{xxx}级],指标[{xxx}]在部署地[{xxx}]可用区[{xxx}]在[{xxx}-{xxx}]内,告警策略:[{xxx}],维度:[{xxx}],[{xxx}]在[{xxx}{xxx}]内超出阈值[{xxx}]{xxx}次,其中告警峰值{xxx}{xxx}。
动态阈值告警模板与静态阈值告警模板类似。
关键字告警模板例如为:当前时间[{xxx}],告警级别:[{xxx}级],产品[{xxx}]在部署地[{xxx}]可用区[{xxx}]日志类型[{xxx}]在[{xxx}-{xxx}]内,告警策略:[{xxx}],过滤条件:[{xxx}],关键字[{xxx}]在[{xxx}{xxx}]内出现{xxx}次。
基于同一发明构思,本文还提供一种系统监控的关联告警装置,如下面的实施例所述。由于系统监控的关联告警装置解决问题的原理与系统监控的关联告警方法相似,因此系统监控的关联告警装置的实施可以参见系统监控的关联告警方法,重复之处不再赘述。
具体的。如图5所示,系统监控的关联告警装置包括:
配置单元501,用于接收用户配置的多个原子规则及告警策略,所述原子规则包括指标标识、告警类型及阈值条件,各原子规则中的告警类型为静态阈值告警、动态阈值告警及关键字告警其中之一,所述告警策略包括告警时间信息及原子规则满足的告警条件;
初始化单元502,用于根据所述告警时间信息,确定每次数据池中指标数据的时间信息;
读取单元503,用于根据每一时间信息及所述指标标识,读取系统的指标数据,将读取的指标数据存储于数据池;
告警识别单元504,用于利用所述原子规则执行告警步骤,以识别所述数据池中的相关指标数据;
告警策略匹配单元505,用于判断所述原子规则的识别结果是否满足告警条件,若满足,则生成并发出告警信息。
本实施例能够将不同告警类型的原子规则进行组合,适用各种应用场景,提高告警准确度。
本文一实施例中,如图6所示,还提供一种计算机设备602,计算机设备602可以包括一个或多个处理器604,诸如一个或多个中央处理单元(CPU),每个处理单元可以实现一个或多个硬件线程。计算机设备602还可以包括任何存储器606,其用于存储诸如代码、设置、数据等之类的任何种类的信息。非限制性的,比如,存储器606可以包括以下任一项或多种组合:任何类型的RAM,任何类型的ROM,闪存设备,硬盘,光盘等。更一般地,任何存储器都可以使用任何技术来存储信息。进一步地,任何存储器可以提供信息的易失性或非易失性保留。进一步地,任何存储器可以表示计算机设备602的固定或可移除部件。在一种情况下,当处理器604执行被存储在任何存储器或存储器的组合中的相关联的指令时,计算机设备602可以执行相关联指令的任一操作。计算机设备602还包括用于与任何存储器交互的一个或多个驱动机构608,诸如硬盘驱动机构、光盘驱动机构等。
计算机设备602还可以包括输入/输出模块610(I/O),其用于接收各种输入(经由输入设备612)和用于提供各种输出(经由输出设备614))。一个具体输出机构可以包括呈现设备616和相关联的图形用户接口618(GUI)。在其他实施例中,还可以不包括输入/输出模块610(I/O)、输入设备612以及输出设备614,仅作为网络中的一台计算机设备。计算机设备602还可以包括一个或多个网络接口620,其用于经由一个或多个通信链路622与其他设备交换数据。一个或多个通信总线624将上文所描述的部件耦合在一起。
通信链路622可以以任何方式实现,例如,通过局域网、广域网(例如,因特网)、点对点连接等、或其任何组合。通信链路622可以包括由任何协议或协议组合支配的硬连线链路、无线链路、路由器、网关功能、名称服务器等的任何组合。
对应于图2中的方法,本文实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法的步骤。
本文实施例还提供一种计算机可读指令,其中当处理器执行所述指令时,其中的程序使得处理器执行如图2所示的方法。
应理解,在本文的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本文实施例的实施过程构成任何限定。
还应理解,在本文实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本文的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本文所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本文实施例方案的目的。
另外,在本文各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本文的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本文各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本文中应用了具体实施例对本文的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本文的方法及其核心思想;同时,对于本领域的一般技术人员,依据本文的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本文的限制。

Claims (10)

1.一种系统监控的关联告警方法,其特征在于,包括:
接收用户配置的多个原子规则及告警策略,所述原子规则包括指标标识、告警类型及阈值条件,各原子规则中的告警类型为静态阈值告警、动态阈值告警及关键字告警其中之一,所述告警策略包括告警时间信息及原子规则满足的告警条件;
根据所述告警时间信息,确定每次数据池中指标数据的时间信息;
根据每次数据池中指标数据的时间信息及所述指标标识,读取系统的指标数据,将读取的指标数据存储于数据池;
利用所述原子规则执行告警步骤,以识别所述数据池中的相关指标数据;
判断所述原子规则的识别结果是否满足告警条件,若满足,则生成并发出告警信息。
2.如权利要求1所述的方法,其特征在于,所述告警时间信息包括告警时间范围及告警时间间隔;所述数据池中指标数据的时间信息包括起始时刻及结束时刻,起始时刻与结束时刻之差为告警时间间隔;
所述告警步骤的运行时刻为数据池中指标数据的结束时刻与延迟时间长度之和。
3.如权利要求2所述的方法,其特征在于,根据所述告警时间信息,确定每次数据池中指标数据的时间信息,包括:
根据所述告警时间信息,设置首次数据池中指标数据的时间信息;设置第n次数据池中指标数据的时间信息为首次数据池中指标数据的时间信息加上n个告警时间间隔;或
根据所述告警时间信息,确定每次告警步骤的运行时刻,每次告警步骤的运行时刻间的差值为告警时间间隔;将每次告警步骤的运行时刻减去告警时间间隔及延迟时间长度得到每次数据池中指标数据的开始时刻;将每次告警步骤的运行时刻减去延迟时间长度作为每次数据池中指标数据的结束时刻。
4.如权利要求1所述的方法,其特征在于,所述告警策略还包括:报警通知渠道信息、维护人员、告警级别信息;
生成告警信息的过程包括:获取告警级别信息及告警类型对应的告警模板;根据获取的告警模板生成告警信息;根据所述报警通知渠道信息发出所述告警信息至所述维护人员。
5.如权利要求1所述的方法,其特征在于,用户通过配置界面配置多个原子规则及告警策略,所述配置界面包括原子规则配置接口及告警策略配置接口;
所述原子规则配置接口包括:指标数据配置接口、静态阈值配置接口、动态阈值配置接口、关键字配置接口;
所述指标数据配置接口用于供用户配置指标数据名称;
所述静态阈值配置接口用于供用户配置静态阈值;
所述动态阈值配置接口用于供用户配置动态阈值;
所述关键字配置接口用于供用户配置关键字;
所述告警策略配置接口包括:告警时间配置接口及告警条件配置接口;
所述告警时间配置接口用于供用户配置告警时间信息;
所述告警条件配置接口用于供用户配置原子规则触发次数及原子规则间的组合逻辑。
6.如权利要求5所述的方法,其特征在于,所述静态阈值配置接口中设置有静态阈值选项列表,所述静态阈值选项列表中的阈值根据业务需求确定;
所述动态阈值配置接口中设置有动态阈值选项列表,所述动态阈值选项列表中的阈值根据历史指标数据变动规律确定;
所述关键字配置接口中设置有关键字选项列表,所述关键字选项列表中的关键字根据异常日志中异常字段确定。
7.一种系统监控的关联告警装置,其特征在于,包括:
配置单元,用于接收用户配置的多个原子规则及告警策略,所述原子规则包括指标标识、告警类型及阈值条件,各原子规则中的告警类型为静态阈值告警、动态阈值告警及关键字告警其中之一,所述告警策略包括告警时间信息及原子规则满足的告警条件;
初始化单元,用于根据所述告警时间信息,确定每次数据池中指标数据的时间信息;
读取单元,用于根据每一时间信息及所述指标标识,读取系统的指标数据,将读取的指标数据存储于数据池;
告警识别单元,用于利用所述原子规则执行告警步骤,以识别所述数据池中的相关指标数据;
告警策略匹配单元,用于判断所述原子规则的识别结果是否满足告警条件,若满足,则生成并发出告警信息。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一所述方法。
9.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被计算机设备的处理器运行时,执行根据权利要求1-6任意一项所述方法的指令。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至6任意一项所述的方法。
CN202210402531.8A 2022-04-18 2022-04-18 一种系统监控的关联告警方法及装置 Active CN114708717B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210402531.8A CN114708717B (zh) 2022-04-18 2022-04-18 一种系统监控的关联告警方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210402531.8A CN114708717B (zh) 2022-04-18 2022-04-18 一种系统监控的关联告警方法及装置

Publications (2)

Publication Number Publication Date
CN114708717A true CN114708717A (zh) 2022-07-05
CN114708717B CN114708717B (zh) 2024-07-19

Family

ID=82174804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210402531.8A Active CN114708717B (zh) 2022-04-18 2022-04-18 一种系统监控的关联告警方法及装置

Country Status (1)

Country Link
CN (1) CN114708717B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115514613A (zh) * 2022-11-15 2022-12-23 阿里云计算有限公司 告警策略获得方法、装置
CN115756782A (zh) * 2022-11-15 2023-03-07 支付宝(杭州)信息技术有限公司 一种大规模告警布防方法、装置以及设备
CN116206427A (zh) * 2023-05-06 2023-06-02 安徽智寰科技有限公司 一种基于通用指标自适应阈值的分级报警方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102098175A (zh) * 2011-01-26 2011-06-15 浪潮通信信息系统有限公司 一种移动互联网告警关联规则获取方法
CN104125087A (zh) * 2013-04-28 2014-10-29 中国移动通信集团设计院有限公司 一种告警信息处理方法及装置
CN106844165A (zh) * 2016-12-16 2017-06-13 华为技术有限公司 告警方法及装置
CN112565009A (zh) * 2020-11-27 2021-03-26 中盈优创资讯科技有限公司 一种基于自定义性能阈值告警规则的处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102098175A (zh) * 2011-01-26 2011-06-15 浪潮通信信息系统有限公司 一种移动互联网告警关联规则获取方法
CN104125087A (zh) * 2013-04-28 2014-10-29 中国移动通信集团设计院有限公司 一种告警信息处理方法及装置
CN106844165A (zh) * 2016-12-16 2017-06-13 华为技术有限公司 告警方法及装置
CN112565009A (zh) * 2020-11-27 2021-03-26 中盈优创资讯科技有限公司 一种基于自定义性能阈值告警规则的处理方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115514613A (zh) * 2022-11-15 2022-12-23 阿里云计算有限公司 告警策略获得方法、装置
CN115756782A (zh) * 2022-11-15 2023-03-07 支付宝(杭州)信息技术有限公司 一种大规模告警布防方法、装置以及设备
CN115514613B (zh) * 2022-11-15 2023-04-11 阿里云计算有限公司 告警策略获得方法、装置
CN116206427A (zh) * 2023-05-06 2023-06-02 安徽智寰科技有限公司 一种基于通用指标自适应阈值的分级报警方法
CN116206427B (zh) * 2023-05-06 2023-06-30 安徽智寰科技有限公司 一种基于通用指标自适应阈值的分级报警方法

Also Published As

Publication number Publication date
CN114708717B (zh) 2024-07-19

Similar Documents

Publication Publication Date Title
CN114708717B (zh) 一种系统监控的关联告警方法及装置
CN110661659B (zh) 一种告警方法、装置、系统及电子设备
CN109918279B (zh) 电子装置、基于日志数据识别用户异常操作的方法及存储介质
CN110096410A (zh) 告警信息处理方法、系统、计算机装置及可读存储介质
US11816586B2 (en) Event identification through machine learning
CN110471821B (zh) 异常变更检测方法、服务器及计算机可读存储介质
CN109992473B (zh) 应用系统的监控方法、装置、设备及存储介质
US20180191552A1 (en) Network monitor and method for event based prediction of radio network outages and their root cause
US9373078B1 (en) Methods and systems for predictive alerting
CN112116273B (zh) 一种员工查询行为风险监测方法、装置、设备及存储介质
CN114416490A (zh) 基于区块链的监控报警方法、装置、电子设备及存储介质
CN112532435A (zh) 一种运维方法、运维管理平台、设备及介质
CN114202238A (zh) 供电设备健康度评估方法、运维方法、装置及服务器
CN110677271B (zh) 基于elk的大数据告警方法、装置、设备及存储介质
CN111078503A (zh) 一种异常监控方法及系统
CN108595685B (zh) 一种数据处理方法及装置
CN109783310A (zh) It设备的多维动态安全监控方法及其监控装置
CN113159463A (zh) 业务量监控方法和装置
CN109218062B (zh) 基于置信区间的互联网业务报警方法和装置
KR102464688B1 (ko) 모니터링 결과의 이벤트 등급 결정 방법 및 장치
CN114140241A (zh) 一种交易监控指标的异常识别方法及装置
CN110347552B (zh) 一种支持可配置的决策引擎实时监控的方法、装置和电子设备
CN109508356B (zh) 数据异常预警方法、装置、计算机设备及存储介质
CN113627940A (zh) 一种交易量异常的告警方法及装置
CN112926877A (zh) 批处理业务的健康情况判断方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant