CN117749602A - 一种精准告警方法、装置、设备及存储介质 - Google Patents

一种精准告警方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117749602A
CN117749602A CN202311787114.0A CN202311787114A CN117749602A CN 117749602 A CN117749602 A CN 117749602A CN 202311787114 A CN202311787114 A CN 202311787114A CN 117749602 A CN117749602 A CN 117749602A
Authority
CN
China
Prior art keywords
alarm
record
monitoring system
service monitoring
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311787114.0A
Other languages
English (en)
Inventor
罗国雄
李浩贤
詹先
司徒达擎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Eshore Technology Co Ltd
Original Assignee
Guangdong Eshore Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Eshore Technology Co Ltd filed Critical Guangdong Eshore Technology Co Ltd
Priority to CN202311787114.0A priority Critical patent/CN117749602A/zh
Publication of CN117749602A publication Critical patent/CN117749602A/zh
Pending legal-status Critical Current

Links

Abstract

本申请提出一种精准告警方法、装置、设备及存储介质,精准告警方法通过采集指标数据,将告警策略转换为服务监控系统的告警规则,用户可以根据实际需求设定个性化的告警策略,自动将告警策略转换为服务监控系统的告警规则应用于告警中,有利于扩展告警功能;将告警规则同步至服务监控系统的配置文件中,通过服务监控系统以及配置文件中的告警规则,生成指标数据对应的告警记录,根据告警记录以及告警规则,确定告警记录的至少一个告警等级,以最高的告警等级标记告警记录,并根据标记后的告警记录发送通知,能够准确、有效地定位至重要问题,强化告警功能。

Description

一种精准告警方法、装置、设备及存储介质
技术领域
本申请涉及运维领域,尤其涉及一种精准告警方法、装置、设备及存储介质。
背景技术
随着电子技术及网络技术的不断发展,互联网的发展日新月异,推动了软件技术的快速发展。一些系统开始从单一向分布式、服务化的方向发展,系统接入的服务器越来越多,服务器的应用组件关系越来越复杂,互联网应用的运维成本越来越高,小则几十、上百台服务器的集群,大则几千、几万台服务器的云平台,需要一个有效的方法去准确定位系统的重要问题并通知。
发明内容
本申请实施例提供一种精准告警方法、装置、设备及存储介质,以解决相关技术存在的至少一个问题,技术方案如下:
第一方面,本申请实施例提供了一种精准告警的方法,包括:
采集指标数据;
将告警策略转换为服务监控系统的告警规则,将所述告警规则同步至所述服务监控系统的配置文件中;
通过所述服务监控系统以及所述配置文件中的所述告警规则,生成所述指标数据对应的告警记录;
根据所述告警记录以及所述告警规则,确定所述告警记录的至少一个告警等级,以最高的告警等级标记所述告警记录,并根据标记后的告警记录发送通知。
在一种实施方式中,所述将告警策略转换为服务监控系统的告警规则,将所述告警规则同步至所述服务监控系统的配置文件中包括:
将告警策略转换为服务监控系统的告警表达式;
将所述告警表达式作为所述告警规则,同步至所述服务监控系统的实例的配置文件中。
在一种实施方式中,所述根据所述告警记录以及所述告警规则,确定所述告警记录的至少一个告警等级,以最高的告警等级标记所述告警记录包括:
对所述告警记录进行识别,确定告警状态;
当所述告警状态为新告警时,根据所述告警记录以及告警规则计算确定所述告警记录的至少一个告警等级;
当所述告警记录满足多个所述告警等级,以最高的告警等级标记所述告警记录,或者,当所述告警记录满足一个所述告警等级,以该告警等级作为最高的告警等级标记所述告警记录。
在一种实施方式中,所述对所述告警记录进行识别,确定告警状态包括:
在缓存或者数据库中查询,是否存在与所述告警记录的告警对象相同的历史记录;
当存在相同的历史记录时,判断所述历史记录的结束时间是否早于当前时间,当所述结束时间早于所述记录时间,确定所述告警状态为恢复,否则,更新所述结束时间为所述告警记录的新结束时间;
当不存在相同的历史记录时,确定所述告警状态为新告警。
在一种实施方式中,所述根据标记后的告警记录发送通知包括:
将标记后的告警记录进行目标格式转换,得到目标告警记录;
确定所述目标告警记录的自定义插件配置情况,根据所述自定义插件配置情况,基于预设通知对象配置,调用发送接口将所述目标告警记录发送至通知对象。
在一种实施方式中,所述根据所述自定义插件配置情况,基于预设通知对象配置,调用发送接口将所述目标告警记录发送至通知对象包括:
当所述自定义插件配置情况表征目标告警记录具有自定义插件时,调用所述自定义插件对所述目标告警记录进行处理,得到新的目标告警记录,基于预设通知对象配置,调用发送接口将新的目标告警记录发送至通知对象;
当所述自定义插件配置情况表征目标告警记录不具有自定义插件时,基于预设通知对象配置,调用发送接口将所述目标告警记录发送至通知对象。
在一种实施方式中,所述采集指标数据包括:
通过告警对象将所述指标数据发送至服务监控系统的网关,以使所述服务监控系统采集指标数据;
或者,
通过告警对象提供符合的服务监控系统接口规范的接口,通过所述接口由所述服务监控系统采集指标数据。
第二方面,本申请实施例提供了一种精准告警装置,包括:
采集模块,用于采集指标数据;
同步模块,用于将告警策略转换为服务监控系统的告警规则,将所述告警规则同步至所述服务监控系统的配置文件中;
生成模块,用于通过所述服务监控系统以及所述配置文件中的所述告警规则,生成所述指标数据对应的告警记录;
发送模块,用于根据所述告警记录以及告警规则,确定所述告警记录的至少一个告警等级,以最高的告警等级标记所述告警记录,并根据标记后的告警记录发送通知。
第三方面,本申请实施例提供了一种电子设备,包括:处理器和存储器,该存储器中存储指令,该指令由该处理器加载并执行,以实现上述各方面任一种实施方式中的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被执行时实现上述各方面任一种实施方式中的方法。
上述技术方案中的有益效果至少包括:
通过采集指标数据,将告警策略转换为服务监控系统的告警规则,用户可以根据实际需求设定个性化的告警策略,自动将告警策略转换为服务监控系统的告警规则应用于告警中,有利于扩展告警功能;将告警规则同步至服务监控系统的配置文件中,通过服务监控系统以及配置文件中的告警规则,生成指标数据对应的告警记录,根据告警记录以及告警规则,确定告警记录的至少一个告警等级,以最高的告警等级标记告警记录,并根据标记后的告警记录发送通知,能够准确、有效地定位至重要问题,强化告警功能。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本申请进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请公开的一些实施方式,而不应将其视为是对本申请范围的限制。
图1为本申请一实施例精准告警方法的步骤流程示意图;
图2为本申请一实施例的系统架构示意图;
图3为本申请一实施例的精准告警装置的结构框图;
图4为本申请一实施例的电子设备的结构框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
参照图1,示出本申请一实施例的精准告警方法的流程图,该精准告警方法至少可以包括步骤S100-S400:
S100、采集指标数据。
S200、将告警策略转换为服务监控系统的告警规则,将告警规则同步至服务监控系统的配置文件中。
S300、通过服务监控系统以及配置文件中的告警规则,生成指标数据对应的告警记录。
S400、根据告警记录以及告警规则,确定告警记录的至少一个告警等级,以最高的告警等级标记告警记录,并根据标记后的告警记录发送通知。
本申请实施例的精准告警方法可以通过计算机、手机、平板、车载终端等终端的电子控制单元、控制器、处理器等执行,也可以通过云服务器执行。例如,通过云服务器的系统执行。
本申请实施例的技术方案,通过采集指标数据,将告警策略转换为服务监控系统的告警规则,用户可以根据实际需求设定个性化的告警策略,自动将告警策略转换为服务监控系统的告警规则应用于告警中,有利于扩展告警功能;将告警规则同步至服务监控系统的配置文件中,通过服务监控系统以及配置文件中的告警规则,生成指标数据对应的告警记录,根据告警记录以及告警规则,确定告警记录的至少一个告警等级,以最高的告警等级标记告警记录,并根据标记后的告警记录发送通知,能够准确、有效地定位至重要问题,强化告警功能。
示例性地,本申请实施例中以服务监控系统为Prometheus为例进行说明,不构成具体限定。
在一种实施方式中,步骤S100包括步骤S110或者S120:
S110、通过告警对象将指标数据发送至服务监控系统的网关,以使服务监控系统采集指标数据。
可选地,通过告警对象如需要告警的组件或服务,将其指标数据发送至服务监控系统Prometheus的push_gateway网关,以使服务监控系统采集指标数据。
S120、通过告警对象提供符合的服务监控系统接口规范的接口,通过接口由服务监控系统采集指标数据。
可选地,通过告警对象如需要告警的组件或服务提供符合的服务监控系统Prometheus的exporter接口规范的接口,通过该接口由服务监控系统Prometheus采集指标数据。
在一种实施方式中,步骤S200包括步骤S210-S220:
S210、将告警策略转换为服务监控系统的告警表达式。
可选地,用户可以根据自身需要便捷、扩展告警策略,并录入系统中,系统提供告警服务以及告警策略解析器,定时将未被同步的告警策略的相关配置送入告警策略解析器,告警策略解析器将告警策略配置转换为服务监控系统Prometheus的查询表达式,作为告警表达式。
S220、将告警表达式作为告警规则,同步至服务监控系统的实例的配置文件中。
可选地,确定告警表达式后将告警表达式作为告警规则,告警服务将告警规则同步到服务监控系统Prometheus的实例的配置文件中,用于后续生成告警记录。
在一种实施方式中,步骤S300中,当服务监控系统Prometheus采集到指标数据后,利用配置文件中的告警规则对指标数据进行处理,从而生成指标数据对应的告警记录。需要说明的是,在确定告警记录后,可以早服务监控系统Prometheus事先配置的配置信息中确定发送地址,将告警记录通过发送地址发送至接收告警记录的服务接口,服务接口接收到告警记录后可以进行预处理,例如过滤无效、去重、屏蔽过滤、告警标签信息处理等等,此时剩下的告警记录为有效的待处理的告警记录,将该告警记录录入更新到缓存中并入库。
在一种实施方式中,步骤S400中根据告警记录以及告警规则,确定告警记录的至少一个告警等级,以最高的告警等级标记告警记录,包括步骤S410-S430:
S410、对告警记录进行识别,确定告警状态。
可选地,步骤S410包括步骤S4101-S4103:
S4101、在缓存或者数据库中查询,是否存在与告警记录的告警对象相同的历史记录。
可选地,由于有效的告警相关记录都会录入缓存或者数据库,因此可以在缓存或者数据库中查询,当缓存中的告警一直没更新是否存在与当前的告警记录对应的告警对象相同的历史记录。
其中,本申请实施例中创建线程池,使用多线程读取缓存中的告警,提升处理效率,具体地启用多线程准备处理缓存中的告警记录,线程需要遍历缓存中的告警记录。
S4102、当存在相同的历史记录时,判断历史记录的结束时间是否早于当前时间,当结束时间早于记录时间,确定告警状态为恢复,否则,更新结束时间为告警记录的新结束时间。
可选地,当存在相同的历史记录时,则判断历史记录的结束时间是否早于当前时间,如果结束时间早于记录时间,确定告警状态为恢复(即告警解除),在缓存或者数据库中更新告警记录的状态,否则,在缓存或者数据库中更新结束时间为告警记录的新结束时间。
S4103、当不存在相同的历史记录时,确定告警状态为新告警。
可选地,当缓存或者数据库中不存在相同的历史记录时,确定告警状态为新告警。其中,新的告警记录新增到缓存和数据库中。
本申请实施例中,历史记录发送后可对后续的重复告警进行屏蔽配置,在配置的屏蔽时间范围内不再发送告警记录;如果是重复的告警记录,根据告警记录是否配置屏蔽时间范围,如果配置了屏蔽时间范围,并且告警记录在这个范围内,告警记录丢弃发送,否则即为新的告警。
S420、当告警状态为新告警时,根据告警记录以及告警规则计算确定告警记录的至少一个告警等级。
可选地,用户可以在告警策略中配置不同告警对应的等级,因此基于告警规则可以计算确定告警记录的告警等级,一个告警可以满足一个或者多个告警等级。本申请实施例中,当告警状态为新告警时,根据告警记录以及告警规则计算确定当前的告警记录的至少一个告警等级。
本申请实施例中,等待接收Prometheus发送的告警记录,并对告警记录进行状态和有效性判断,符合要求的告警记录更新到缓存和写进数据库等待下个环节处理。
S430、当告警记录满足多个告警等级,以最高的告警等级标记告警记录,或者,当告警记录满足一个告警等级,以该告警等级作为最高的告警等级标记告警记录。
可选地,进行等级压制合并判断,相同告警对象的告警,高等级压制低等级,当告警记录满足多个告警等级,以最高的告警等级标记告警记录,而当告警记录满足一个告警等级,以该告警等级作为最高的告警等级标记告警记录。需要说明的是,将标记后的告警记录作为待处理发送记录送入发送队列,其他低等级告警记录则被丢弃。
需要说明的是,当存在相同的历史记录时,并且历史记录的告警级别高于当前的告警记录,并且历史记录的告警还在重复告警的有效期内,则将当前的告警记录丢弃,告警等级压制规则:严重>警告>普通。
在一种实施方式中,步骤S400中根据标记后的告警记录发送通知,包括步骤S440-S450:
S440、将标记后的告警记录进行目标格式转换,得到目标告警记录。
可选地,系统的发送处理服务从发送队列获取标记后的告警记录进行目标格式转换生成完整的告警记录,得到目标告警记录。具体地,根据目标告警记录的内容中定义的变量名通过解析器解析具体的变量值,生成完整的告警记录,将解析后的完整的告警记录的内容更新到告警记录。
S450、确定目标告警记录的自定义插件配置情况,根据自定义插件配置情况,基于预设通知对象配置,调用发送接口将目标告警记录发送至通知对象。
可选地,包括步骤S4501-S4502:
S4501、当自定义插件配置情况表征目标告警记录具有自定义插件时,调用自定义插件对目标告警记录进行处理,得到新的目标告警记录,基于预设通知对象配置,调用发送接口将新的目标告警记录发送至通知对象。
需要说明的是,如果自定义插件配置情况表征目标告警记录具有自定义插件时,例如shell脚本或者rest服务,将目标告警记录作为参数调用自定义插件,对目标告警记录进行二次的处理,得到新的目标告警记录,新的目标告警记录存储至缓存中或者入库。例如,Shell脚本将目标告警记录写入临时生成的文件夹给脚本获取并处理,处理结果写入约定的文件,插件执行服务获取处理结果,即新的目标告警记录。或者,rest服务将目标告警记录写入rest请求的body中,处理结束后rest服务将结果返回结构体的body中,得到新的目标告警记录,插件执行调用rest服务获取处理结果。
本申请实施例中,可以事先进行预设通知对象配置,确定发送方式以及通知对象,发送服务基于预设通知对象配置调用发送接口将新的目标告警记录发送至通知对象中。因此,本申请实施例中用户可以根据在实际需要自定义插件功能,当目标告警记录具有自定义插件时,可以在确定目标告警记录后进行二次处理,提高兼容性以及功能性。
S4502、当自定义插件配置情况表征目标告警记录不具有自定义插件时,基于预设通知对象配置,调用发送接口将目标告警记录发送至通知对象。
类似地,事先进行预设通知对象配置,确定发送方式以及通知对象,当自定义插件配置情况表征目标告警记录不具有自定义插件时,基于预设通知对象配置,调用发送接口将目标告警记录发送至通知对象中,例如可以为发送至通知对象的钉钉中,目标告警记录可以在web门户进行列表化展示。
本申请实施例中,在目标告警记录发送成功或者失败后,生成成功或者失败标志并记录,同时记录发送接口返回的日志信息,如果发送失败,再尝试发送,最多尝试2次发送后,不成功,告警记录标志发送失败,否则发送成功。
需要说明的是,整个过程中,用户自定义插件的执行日志、执行前后的告警记录都保存入库,用于审计查询。
如图2所示,为本申请实施例的系统架构图,包括交互视图、运营能力以及客户端,交互视图包括Grafana页面、监控视图、告警配置、告警列表,用户可以在Grafana页面进行告警策略配置,并且告警记录等内容可以在页面显示,例如告警时间、等级、内容、类型、指标等等;运营能力包括grafana服务、Pushgateway、prometheus server、告警服务、告警服务发送、告警配置服务等,用户可以自定义告警记录对应的处理插件、运营能力用于在对采集的指标数据进行处理;客户端包括、指标采集服务、exporter、组件等,用于进行指标数据采集并传输至运营能力的层中,另外系统还可以包括本发明实施例的软件以及客户开发软件、开源组件等。
通过本申请实施例的方法,在扩展传统告警生成方法的基础上,本发明提供第三方接口,支持shell脚本和REST接口协议,让用户可根据实际需要按本发明的告警插件规范编写告警功能扩展自定义功能插件以及告警策略,扩展告警功能,极大的扩展的告警的适用范围,达到更精准的生成告警信息,过滤无效告警信息。并且,告警策略配置丰富,支持多指标联合告警,支持调用通过符合本发明规范开发的第三方告警处理的自定义插件,扩展告警信息的处理能力。
参照图3,示出了本申请一实施例的精准告警装置的结构框图,该装置可以包括:
采集模块,用于采集指标数据;
同步模块,用于将告警策略转换为服务监控系统的告警规则,将告警规则同步至服务监控系统的配置文件中;
生成模块,用于通过服务监控系统以及配置文件中的告警规则,生成指标数据对应的告警记录;
发送模块,用于根据告警记录以及告警规则,确定告警记录的至少一个告警等级,以最高的告警等级标记告警记录,并根据标记后的告警记录发送通知。
本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
参照图4,示出了本申请一实施例电子设备的结构框图,该电子设备包括:存储器310和处理器320,存储器310内存储有可在处理器320上运行的指令,处理器320加载并执行该指令实现上述实施例中的精准告警方法。其中,存储器310和处理器320的数量可以为一个或多个。
在一种实施方式中,电子设备还包括通信接口330,用于与外界设备进行通信,进行数据交互传输。如果存储器310、处理器320和通信接口330独立实现,则存储器310、处理器320和通信接口330可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(PeripheralComponentInterconnect,PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器310、处理器320及通信接口330集成在一块芯片上,则存储器310、处理器320及通信接口330可以通过内部接口完成相互间的通信。
本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中提供的精准告警方法。
本申请实施例还提供了一种芯片,该芯片包括,包括处理器,用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的通信设备执行本申请实施例提供的方法。
本申请实施例还提供了一种芯片,包括:输入接口、输出接口、处理器和存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行申请实施例提供的方法。
应理解的是,上述处理器可以是中央处理器(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(digital signal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(fieldprogrammablegate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(advanced RISC machines,ARM)架构的处理器。
进一步地,可选的,上述存储器可以包括只读存储器和随机存取存储器,还可以包括非易失性随机存取存储器。该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以包括只读存储器(read-onlymemory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以包括随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用。例如,静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic random access memory,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(doubledata date SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络,或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。
在本说明书的描述中,参考术语“一个实施例”“一些实施例”“示例”“具体示例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
应理解的是,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种精准告警方法,其特征在于,包括:
采集指标数据;
将告警策略转换为服务监控系统的告警规则,将所述告警规则同步至所述服务监控系统的配置文件中;
通过所述服务监控系统以及所述配置文件中的所述告警规则,生成所述指标数据对应的告警记录;
根据所述告警记录以及所述告警规则,确定所述告警记录的至少一个告警等级,以最高的告警等级标记所述告警记录,并根据标记后的告警记录发送通知。
2.根据权利要求1所述精准告警方法,其特征在于:所述将告警策略转换为服务监控系统的告警规则,将所述告警规则同步至所述服务监控系统的配置文件中包括:
将告警策略转换为服务监控系统的告警表达式;
将所述告警表达式作为所述告警规则,同步至所述服务监控系统的实例的配置文件中。
3.根据权利要求1或2所述精准告警方法,其特征在于:所述根据所述告警记录以及所述告警规则,确定所述告警记录的至少一个告警等级,以最高的告警等级标记所述告警记录包括:
对所述告警记录进行识别,确定告警状态;
当所述告警状态为新告警时,根据所述告警记录以及告警规则计算确定所述告警记录的至少一个告警等级;
当所述告警记录满足多个所述告警等级,以最高的告警等级标记所述告警记录,或者,当所述告警记录满足一个所述告警等级,以该告警等级作为最高的告警等级标记所述告警记录。
4.根据权利要求3所述精准告警方法,其特征在于:所述对所述告警记录进行识别,确定告警状态包括:
在缓存或者数据库中查询,是否存在与所述告警记录的告警对象相同的历史记录;
当存在相同的历史记录时,判断所述历史记录的结束时间是否早于当前时间,当所述结束时间早于所述记录时间,确定所述告警状态为恢复,否则,更新所述结束时间为所述告警记录的新结束时间;
当不存在相同的历史记录时,确定所述告警状态为新告警。
5.根据权利要求1所述精准告警方法,其特征在于:所述根据标记后的告警记录发送通知包括:
将标记后的告警记录进行目标格式转换,得到目标告警记录;
确定所述目标告警记录的自定义插件配置情况,根据所述自定义插件配置情况,基于预设通知对象配置,调用发送接口将所述目标告警记录发送至通知对象。
6.根据权利要求5所述精准告警方法,其特征在于:所述根据所述自定义插件配置情况,基于预设通知对象配置,调用发送接口将所述目标告警记录发送至通知对象包括:
当所述自定义插件配置情况表征目标告警记录具有自定义插件时,调用所述自定义插件对所述目标告警记录进行处理,得到新的目标告警记录,基于预设通知对象配置,调用发送接口将新的目标告警记录发送至通知对象;
当所述自定义插件配置情况表征目标告警记录不具有自定义插件时,基于预设通知对象配置,调用发送接口将所述目标告警记录发送至通知对象。
7.根据权利要求1所述精准告警方法,其特征在于:所述采集指标数据包括:
通过告警对象将所述指标数据发送至服务监控系统的网关,以使所述服务监控系统采集指标数据;
或者,
通过告警对象提供符合的服务监控系统接口规范的接口,通过所述接口由所述服务监控系统采集指标数据。
8.一种精准告警装置,其特征在于,包括:
采集模块,用于采集指标数据;
同步模块,用于将告警策略转换为服务监控系统的告警规则,将所述告警规则同步至所述服务监控系统的配置文件中;
生成模块,用于通过所述服务监控系统以及所述配置文件中的所述告警规则,生成所述指标数据对应的告警记录;
发送模块,用于根据所述告警记录以及告警规则,确定所述告警记录的至少一个告警等级,以最高的告警等级标记所述告警记录,并根据标记后的告警记录发送通知。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器中存储指令,所述指令由所述处理器加载并执行,以实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被执行时实现如权利要求1-7中任一项所述的方法。
CN202311787114.0A 2023-12-22 2023-12-22 一种精准告警方法、装置、设备及存储介质 Pending CN117749602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311787114.0A CN117749602A (zh) 2023-12-22 2023-12-22 一种精准告警方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311787114.0A CN117749602A (zh) 2023-12-22 2023-12-22 一种精准告警方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117749602A true CN117749602A (zh) 2024-03-22

Family

ID=90281139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311787114.0A Pending CN117749602A (zh) 2023-12-22 2023-12-22 一种精准告警方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117749602A (zh)

Similar Documents

Publication Publication Date Title
CN111897625B (zh) 一种基于Kubernetes集群的资源事件回溯方法、系统及电子设备
CN110134738B (zh) 分布式存储系统资源预估方法、装置
CN110968478B (zh) 日志采集方法、服务器及计算机存储介质
CN111177165A (zh) 数据一致性检测的方法、装置及设备
CN112613993A (zh) 交易数据处理方法、装置、计算机设备和存储介质
CN113360519A (zh) 数据处理方法、装置、设备和存储介质
CN110457279B (zh) 数据离线扫描方法、装置、服务器及可读存储介质
CN117749602A (zh) 一种精准告警方法、装置、设备及存储介质
CN104111862A (zh) 云计算平台中获取虚拟机ip地址方法与系统
CN110955460A (zh) 一种服务进程启动方法、装置、电子设备和存储介质
CN108121514B (zh) 元信息更新方法、装置、计算设备及计算机存储介质
CN111367921A (zh) 数据对象的刷新方法及装置
CN112765188B (zh) 配置信息处理方法、配置管理系统、电子设备及存储介质
CN114844771A (zh) 微服务系统的监测方法、装置、存储介质、程序产品
CN113535470A (zh) 组态备份方法、装置、电子设备和存储介质
CN110597828A (zh) 一种数据库变更方法、装置、设备及存储介质
JP2020038409A (ja) 車載装置、データ収集システム、データ収集方法およびデータ収集装置
CN115514806B (zh) 一种离散服务集群的感知发现方法及系统
CN115495769B (zh) 一种数据脱敏方法、系统、可读存储介质及设备
CN110166421B (zh) 基于日志监控的入侵控制方法、装置及终端设备
CN112114900A (zh) 一种格式化方法及相关设备
CN115499509A (zh) 一种网关链路性能和可用性提升方法
CN114218049A (zh) 监控数据处理方法及装置、存储介质及电子设备
CN115114115A (zh) 一种数据采集方法、装置及计算机可读存储介质
CN116627484A (zh) 一种数据管理方法、装置、电子设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination