CN115701890A - 调整告警规则的方法及相关设备 - Google Patents

调整告警规则的方法及相关设备 Download PDF

Info

Publication number
CN115701890A
CN115701890A CN202211601991.XA CN202211601991A CN115701890A CN 115701890 A CN115701890 A CN 115701890A CN 202211601991 A CN202211601991 A CN 202211601991A CN 115701890 A CN115701890 A CN 115701890A
Authority
CN
China
Prior art keywords
maintenance
information
data
fault
operation data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211601991.XA
Other languages
English (en)
Other versions
CN115701890B (zh
Inventor
张良
毛艳清
胡爱纯
段小勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Fulian Hangzhou Data Technology Co ltd
Shenzhen Fulian Fugui Precision Industry Co Ltd
Original Assignee
Industrial Fulian Hangzhou Data Technology Co ltd
Shenzhen Fulian Fugui Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial Fulian Hangzhou Data Technology Co ltd, Shenzhen Fulian Fugui Precision Industry Co Ltd filed Critical Industrial Fulian Hangzhou Data Technology Co ltd
Priority to CN202211601991.XA priority Critical patent/CN115701890B/zh
Publication of CN115701890A publication Critical patent/CN115701890A/zh
Application granted granted Critical
Publication of CN115701890B publication Critical patent/CN115701890B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Alarm Systems (AREA)

Abstract

本申请提供一种调整告警规则的方法及相关设备,所述方法包括:响应目标设备的更新请求,获目标设备的运行数据;基于运行数据得到的第一维护信息,确定目标设备的故障等级;根据目标设备的第二维护信息,确定目标设备的故障维护优先级;根据第一维护信息、故障等级以及故障维护优先级中的至少一种,调整目标设备的告警规则。所述方法提高了系统告警的准确度以及应急故障处理的效率。

Description

调整告警规则的方法及相关设备
技术领域
本申请涉及系统维护技术领域,尤其涉及一种调整告警规则的方法及相关设备。
背景技术
监控是各类电子设备运营与维护的重要环节,可以通过监控系统获取各类电子设备的运行数据。针对运行数据的指标超出默认指标的情况,可以触发预警信息,以使运维人员及时采取相应的急救措施。然而,在动态变化的业务应用中,不同的业务应用配置不同的指标,直接采用默认指标进行检测并不能反映电子设备的实际情况,导致错报或漏报告警信息,增加人工检查成本。
发明内容
本申请实施例公开了一种调整告警规则的方法及相关设备,能够解决利用过于单一的指标去检测不同的设备中实时动态变化的各类不同参数,而导致的错误预警或遗漏预警的技术问题。
本申请提供一种调整告警规则的方法,所述方法包括:
响应目标设备的更新请求,获取所述目标设备的运行数据;
基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级;
根据所述目标设备的第二维护信息,确定所述目标设备的故障维护优先级;
根据所述第一维护信息、所述故障等级以及所述故障维护优先级中的至少一种,调整所述目标设备的告警规则。
在一些可选的实施方式中,所述第一维护信息包括如下一种或多种信息:维护指标阈值信息、维护统计周期信息以及历史告警信息。
在一些可选的实施方式中,所述基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级,包括:
若所述第一维护信息包括所述维护指标阈值信息,利用所述维护指标阈值信息,确定所述目标设备的故障等级,其中,所述维护指标阈值信息根据对所述运行数据进行同比分析确定。
在一些可选的实施方式中,所述运行数据包括本期运行数据和所述本期运行数据对应的历史同期运行数据,所述维护指标阈值信息根据对所述运行数据进行同比分析确定,包括:
对所述本期运行数据进行加权;
对所述历史同期运行数据进行加权;
对加权后的所述本期运行数据和所述历史同期运行数据进行比对分析,获取第一告警率;
基于所述第一告警率确定所述维护指标阈值信息。
在一些可选的实施方式中,所述基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级,包括:
若所述第一维护信息包括所述维护统计周期信息,利用所述维护统计周期信息,确定所述目标设备的故障等级,其中,所述维护统计周期信息根据对所述运行数据进行环比分析确定。
在一些可选的实施方式中,所述运行数据包括本期运行数据和所述本期运行数据相邻的前一周期运行数据,所述维护统计周期信息根据对所述运行数据进行环比分析确定,包括:
计算所述本期运行数据和所述前一周期运行数据的加权平均值;
获取与所述本期运行数据和所述前一周期运行数据对应的历史运行数据,并对所述历史运行数据计算历史加权平均值;
对所述加权平均值与所述历史加权平均值进行比对分析,获取第二告警率;
根据所述第二告警率确定所述维护统计周期信息。
在一些可选的实施方式中,所述第二维护信息包括如下信息的一种或多种:所述目标设备的故障等级、所述目标设备的业务数据量以及所述目标设备的服务等级协议。
在一些可选的实施方式中,所述方法还包括:
设置所述告警规则的访问权限,并确定所述访问权限对应的访问密匙;
响应于所述目标设备的更新请求,发送所述告警规则的访问密匙至所述目标设备;
基于所述访问密匙,控制所述目标设备对所述告警规则的访问。
本申请还提供一种调整告警规则的装置,所述装置包括响应模块、第一确定模块、第二确定模块以及调整模块:
所述响应模块,用于响应目标设备的更新请求,获取所述目标设备的运行数据;
所述第一确定模块,用于基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级;
所述第二确定模块,用于根据所述目标设备的第二维护信息,确定所述目标设备的故障维护优先级;
所述调整模块,用于根据所述第一维护信息、所述故障等级以及所述故障维护优先级中的至少一种,调整所述目标设备的告警规则。
本申请还提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的调整告警规则的方法。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的调整告警规则的方法。
本申请提供的调整告警规则的方法及相关设备,能够根据目标设备的实际负载情况进行动态调整告警规则,提高告警的准确度,避免告警误报。并且,根据故障等级、目标设备对应的业务数据量以及目标设备的服务等级协议确定故障维护优先级,根据该故障优先级可以提升应急故障处理的效率。
附图说明
图1是本申请实施例提供的电子设备的结构示意图。
图2是本申请实施例提供的调整告警规则的方法的流程图。
图3是本申请又一实施例提供的调整告警规则的方法的流程图。
图4是本申请实施例提供的调整告警规则的方法访问告警规则的流程图。
图5是本申请实施例提供的调整告警规则的装置的功能模块图。
图6是本申请又一实施例提供的调整告警规则的装置访问告警规则的功能模块图。
具体实施方式
为了便于理解,示例性的给出了部分与本申请实施例相关概念的说明以供参考。
需要说明的是,本申请中“至少一个”是指一个或者多个,“多个”是指两个或多于两个。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不是用于描述特定的顺序或先后次序。
为了更好地理解本申请实施例提供的调整告警规则的方法及相关设备,下面首先对本申请调整告警规则的方法的应用场景进行描述。
图1为本申请实施例提供的电子设备的结构示意图。参阅图1所示,所述电子设备1包括,但不限于,存储器11和至少一个处理器12。存储器11和处理器12之间可以通过通讯总线13连接,也可以直接连接。
所述电子设备1可以是计算机、手机、平板电脑、个人数字助理(Personal DigitalAssistant,PDA)等安装有应用程序的设备。本领域技术人员可以理解,所述示意图1仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备等。
所述电子设备1可以与多个其他电子设备通信连接,将多个其他电子设备作为目标设备2,在本实施例中,所述电子设备1可对目标设备2的运行数据进行监控,并及时获取更新相应的指标,以便及时对目标设备2进行维护。
图2是本申请实施例提供的调整告警规则的方法的流程图。所述调整告警规则的方法应用在电子设备(例如图1中的电子设备1)中。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。在本实施方式中,所述调整告警规则的方法包括以下步骤:
21,响应目标设备的更新请求,获取所述目标设备的运行数据。
示例性的,电子设备可以通过预先安装的监控系统(Supervision Control andData Acquisition System)监控多个目标设备。其中,目标设备包括但不限于虚拟机、容器以及中间件等。电子设备通过监控系统采集多个目标设备的监控指标,所述监控指标包括但不限于目标设备CPU使用率(为便于描述,下文称为“主机CPU使用率”)、MySQL的请求数、MongoDB(MongoDB是一个基于分布式文件存储的数据库)写入请求数以及主机网络流量值。电子设备根据该监控指标判断目标设备的运行状态,确定是否需要发出告警信息以便运维人员进行维修。
响应更新请求,电子设备获取目标设备的运行数据。可以选取在目标设备发出更新请求的第一周期(例如,将2022年3月作为第一周期)内目标设备的运行数据作为运行数据。电子设备可以实时获取目标设备的运行数据,运行数据包括但不限于主机CPU使用数据、MySQL的请求数据、MongoDB写入请求数据以及主机网络流量数据。电子设备可以采用时序数据库按时间顺序对运行数据进行存储。
监控到的目标设备的运行数据中是否存在触发告警的数据,当电子设备监控到目标设备的运行数据中含有不符合当前告警规则的数据时,则发出更新请求。其中,目标设备的告警规则的更新依赖但不限于维护指标阈值信息、维护统计周期信息、故障等级以及故障优先级。
在本申请提供的实施例中,在监控系统中新增目标设备时,可以采用默认的监控指标生成该新增目标设备的告警规则。监控指标中至少可以包括设备类型与告警规则的对应关系,如此,对于新增目标设备,能够根据新增目标设备的类型匹配对应的告警规则,作为新增目标设备的初始告警规则,并利用所述方法的后续流程,对初始告警规则进行更新与调整。
22,基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级。
在一实施例中,对于待维护的目标设备,获取所述目标设备的第一维护信息,所述第一维护信息包括维护指标阈值信息、维护统计周期信息以及历史告警信息中的至少一种。若所述第一维护信息包括多种信息时,根据所述维护指标阈值信息、维护统计周期信息及/或历史告警信息对于目标设备的重要性,设置相应的权重,根据权重的大小确定利用第一维护信息中的至少一种信息进行维护的优先级,所述优先级可以是历史告警信息优先于所述维护指标阈值信息,所述维护指标阈值信息优先于所述维护统计周期信息。
在一实施例中,所述基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级,包括:
若所述第一维护信息包括所述维护指标阈值信息,利用所述维护指标阈值信息,确定所述目标设备的故障等级,其中,所述维护指标阈值信息根据对所述运行数据进行同比分析确定。
在一实施例中,所述运行数据包括本期运行数据和所述本期运行数据对应的历史同期运行数据,所述维护指标阈值信息根据对所述运行数据进行同比分析确定,包括:
对所述本期运行数据进行加权;
对所述历史同期运行数据进行加权;
对加权后的所述本期运行数据和所述历史同期运行数据进行比对分析,获取第一告警率;
基于所述第一告警率确定所述维护指标阈值信息。
所述电子设备基于所述运行数据,确定所述目标设备的维护指标阈值信息,对所述运行数据进行同比分析。
同比分析指的是将本期运行数据与历史同期运行数据进行对比分析,例如:将2022年3月的数据与2021年3月的数据进行同比分析,其中,2022年3月的数据就是同比分析中的本期运行数据,而2021年3月的数据就是同比分析中的历史同期运行数据。在本实施例中,针对同比分析,采用时间序列预测法中的加权移动平均法,对区间移动数据进行加权计算,以分析监测指标的变化趋势。
同比分析包括但不限于采用时间序列预测法(Time Series PredictionMethod),根据时间序列预测法中的加权移动平均法,对时间区间内的移动数据进行加权计算,做同比统计分析,将同比分析结果作为第一告警率进而确定目标设备的维护指标阈值信息。
或者,采用聚类的算法,在本期数据中随机选取k个元素,将这k个元素作为k个簇的簇中心,基于加权的余弦相似度,将本期数据中的数据集合聚类为k个簇,采用聚类算法,更新k个簇的簇中心,根据更新以后的簇中心,采用加权的余弦相似度重新聚类,获取聚类结果。根据聚类结果,计算目标设备的维护指标阈值信息。
通过同比分析的计算方式确定维护指标阈值信息,进一步根据维护指标值信息确定目标设备的故障等级,可以分析监测指标的变化趋势,当监测指标的变化趋势大于预设阈值时,计算所述维护指标值信息作为第一维护信息,根据第一维护信息更新目前目标设备的故障等级,有效的获取目标设备的故障情况。
在一实施例中,所述基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级,包括:
若所述第一维护信息包括所述维护统计周期信息,利用所述维护统计周期信息,确定所述目标设备的故障等级,其中,所述维护统计周期信息根据对所述运行数据进行环比分析确定。
在一实施例中,所述运行数据包括本期运行数据和所述本期运行数据相邻的前一周期运行数据,所述维护统计周期信息根据对所述运行数据进行环比分析确定,包括:
计算所述本期运行数据和所述前一周期运行数据的加权平均值;
获取与所述本期运行数据和所述前一周期运行数据对应的历史运行数据,并对所述历史运行数据计算历史加权平均值;
对所述加权平均值与所述历史加权平均值进行比对分析,获取第二告警率;
根据所述第二告警率确定所述维护统计周期信息。
所述电子设备基于所述运行数据后确定所述目标设备的维护统计周期信息,对所述运行数据进行环比分析。
环比分析指的是将本期运行数据与前一周期运行数据进行对比分析,例如:将2022年3月的数据与2022年2月的数据进行环比分析,其中,2022年3月的数据就是环比分析中的本期运行数据。2022年2月的数据就是环比分析中的前一周期运行数据。
针对环比分析,采用加权序时平均数法分别计算本期运行数据和前一周期运行数据的加权平均值,再将加权平均值与历史加权平均值进行对比,根据数值或百分比差异情况判断新进数据是否异常。
环比分析包括但不限于采用加权序时平均法,加权序时平均法是将各个时期的历史运行数据按本期和历史同期影响程度进行加权,求出本期的平均值与历史同期的平均值,并进行分析作为下期预测值。在本实施例中,获取对应于相邻两周期的历史运行数据。对本期运行数据和历史运行数据分别计算加权平均值,做环比统计分析。其中,不同时期的影响程度指的是目标设备在运行的过程中,异常数据对目标设备的影响程度,影响程度包括较高影响、一般影响以及较低影响。
通过环比分析的计算方式确定维护统计周期信息,进一步根据维护统计周期信息确定目标设备的故障等级,统计不同时期目标设备的运行数据,可以得到异常数据对目标设备的影响程度,进一步利用异常数据对目标设备的影响程度得到当前目标设备的故障等级,以便及时更新目标设备的状态,提高对目标设备的维护效率。
当第一维护信息包括历史告警信息时,可以从历史告警信息得到目标设备历史的维护数据,可以从历史的维护数据得到目标设备的故障等级。
本实施例针对故障等级的确定不限于第一维护信息中的单一条件,第一维护信息包括了维护指标阈值信息、维护统计周期信息以及历史告警信息,将维护指标阈值信息、维护统计周期信息以及历史告警信息作为确定故障等级的条件,本实施例不仅针对单一条件能确定故障等级,还针对两种或三种条件确定故障等级,使得确定目标设备的故障等级的准确性更高。
当第一维护信息包括维护指标阈值信息以及维护统计周期信息时,可以通过比对不同时期的运行数据,得到目标设备的变化趋势,将所述维护指标阈值信息和所述维护统计周期信息与对应的历史数据匹配,若不匹配,根据所述维护指标阈值信息和所述维护统计周期信息,调整所述目标设备的故障等级,避免利用单一时期的运行数据造成对目标设备故障状态评估不准确。
当第一维护信息包括维护指标阈值信息以及历史告警信息时,通过统计不同时期的运行数据并结合历史告警的数据,避免利用单一时期的运行数据造成对目标设备故障状态评估不准确,提高了判断目标设备的故障等级的准确性。
当第一维护信息包括维护统计周期信息以及历史告警信息时,将各个时期的历史运行数据按本期和历史同期影响程度进行加权并结合历史告警的数据,避免利用单一的运行数据造成对目标设备故障状态评估不准确,提高了判断目标设备的故障等级的准确性。
当第一维护信息包括维护指标阈值信息、维护统计周期信息以及历史告警信息时,一方面计算不同时期的运行数据,更加全面的获取了目标设备的变化趋势,另一方面通过历史告警信息获取目标设备历史异常情况,将基于运行数据得到的目标设备的变化趋势以及历史记录的目标设备历史的告警等级,有效的判定了当前目标设备的故障等级,有效的避免了目标设备的故障漏报以及误报的情况。
示例性的,目标设备的故障等级分为一般等级和警告等级。可以参考历史告警信息计算目标设备在第一时间周期内的第三告警率,根据第三告警率、维护指标阈值信息以及维护统计周期信息确定目标设备的故障等级,其中,历史告警信息包含了目标设备历史的告警等级。
23,根据所述目标设备的第二维护信息,确定所述目标设备的故障维护优先级。
在一实施方式中,所述第二维护信息包括如下信息的种或多种:所述目标设备的故障等级、所述目标设备的业务数据量以及所述目标设备的服务等级协议(Service LevelAgreement,SLA)。
若所述第二维护信息包括目标设备的故障等级,根据上述的方式针对故障等级的确定来进一步得到故障维护优先级,可以设定故障等级越高,故障维护优先级越高。
若所述第二维护信息包括所述目标设备的业务数据量,若所述目标设备的业务数据量与对应的历史数据不匹配,根据当前的目标设备的业务数据量来更新目标设备当前的故障维护优先级。
若所述第二维护信息包括所述目标设备的服务等级协议,所述目标设备的服务等级协议可以是预先设置的设备维护等级,则若所述目标设备的服务等级协议与对应的历史数据不匹配,根据所述目标设备的服务等级协议,调整所述目标设备的故障维护优先级。
若所述第二维护信息包括所述目标设备的业务数据量和所述目标设备的服务等级协议,则若所述目标设备的业务数据量和所述目标设备的服务等级协议与对应的历史数据不匹配,根据所述目标设备的业务数据量和所述目标设备的服务等级协议,确定所述目标设备的故障维护优先级。
若所述第二维护信息包括目标设备的故障等级以及所述目标设备的业务数据量,判断所述目标设备的业务数据量与对应的历史数据的匹配情况,若不匹配,则结合故障等级以及当前目标设备的业务数据量来确定目标设备的故障维护优先级,有效的获取故障维护优先级,以便根据所述故障维护优先级对目标设备进行维护,提高工作效率。
若所述第二维护信息包括目标设备的故障等级以及所述目标设备的服务等级协议,所述目标设备的服务等级协议可以是预先设置的设备维护等级,结合根据运行数据获取的目标设备的故障等级和预先设置的设备维护等级,更新当前目标设备的故障维护优先级,以便及时获取需要优先维护的目标设备,提供工作效率。
若所述第二维护信息包括所述目标设备的故障等级、所述目标设备的业务数据量以及所述目标设备的服务等级协议,可以根据计算得到的故障等级、预先设置的故障等级以及当前目标设备的业务数据量来进一步确定优先维护的目标设备,全面的获取目标设备的相关数据,提高了确定故障维护优先级的准确性,进一步提高了维护目标设备的工作效率。
示例性的,监控系统与目标设备之间产生联动,获取目标设备的实时业务数据量以及目标设备的服务等级协议,根据故障等级、目标设备对应的业务数据量以及服务等级协议,采用优先级排序模型进行训练,针对实时获取的运行数据进行告警优先级排序,以排序结果作为优先级的故障等级定级结果,方便维护人员依优先级处理故障,提高应用的维护质量,如,故障等级高、业务量大、SLA高的故障优先级也相对为高。
例如,将故障维护优先级从高优先级到低优先级分为P1、P2、P3以及P4,假设监控系统获取的监控指标分别为主机CPU使用率、MySQL的请求数、MongoDB写入请求数以及主机网络流量。根据上述步骤的计算方式,计算主机CPU使用率的维护指标阈值信息为0.85,维护统计周期信息为3分钟维护统计一次,并且持续统计三个不同时期的数据,根据告警率确定故障等级为一般等级,根据上述计算结果中的至少一种,确定该目标设备的故障维护优先级为P2。
24,根据所述第一维护信息、所述故障等级以及所述故障维护优先级中的至少一种,调整所述目标设备的告警规则。
具体地,基于上述的计算,将获取到的所述第一维护信息、故障等级以及故障维护优先级中的一种或多种信息,动态调整告警规则,通过分别判断所述第一维护信息、故障等级以及故障维护优先级与对应的历史数据不匹配,来动态调整告警规则,若在所述第一维护信息、故障等级以及故障维护优先级中存在至少一种与对应的历史数据不匹配,利用所述至少一种与历史数据不匹配,来调整告警规则。
在本实施例中,所述第一维护信息可以是维护指标阈值信息和/或维护统计周期信息。
针对利用所述维护指标阈值信息调整告警规则,利用运行数据做同比分析,采用时间序列预测法对数据进行加权计算,获取维护指标阈值信息与历史数据进行匹配。若维护指标阈值信息与历史数据不匹配,更新故障等级,否则,若维护指标阈值信息与历史数据匹配,不更新/部分更新告警规则。
本实施例通过采用同比分析,提高了目标设备的维护指标阈值信息的准确度,进而根据维护指标阈值信息,并结合历史告警数据确定故障等级,避免了单一的故障等级带来的弊端,进一步确定故障维护优先级,让维修人员及时的进行检修,提高效率。
针对利用所述维护统计周期信息调整告警规则,利用运行数据做环比分析,采用加权序时平均数法分别计算本期运行数据和前一周期运行数据的加权平均值,再将加权平均值与历史加权平均值进行对比,获取维护统计周期信息与历史数据进行匹配。若维护统计周期信息与历史数据不匹配,更新故障等级,否则,若维护统计周期信息与历史数据匹配,不更新/部分更新告警规则。
本实施例通过采用环比分析,提高了目标设备的维护统计周期信息的准确度,进而根据维护统计周期信息,并结合历史告警数据确定故障等级,避免了单一的故障等级带来的弊端,进一步确定故障维护优先级,让维修人员及时的进行检修,提高效率。
在一实施方式中,对于不同时刻的数据,采用聚类的算法,在运行数据中随机选取k个元素,将这k个元素作为k个簇的簇中心,基于加权的余弦相似度,将运行数据中的数据集合聚类为k个簇,采用聚类算法,更新k个簇的簇中心,根据更新以后的簇中心,采用加权的余弦相似度重新聚类,获取第一聚类结果,根据第一聚类结果生成告警率。同样的,针对目标设备的历史数据,采用聚类的算法,获取历史数据的第二聚类结果,根据第二聚类结果生成历史告警率,将该告警率与历史告警率匹配。若该告警率与历史告警率不匹配,更新故障等级;否则,若该告警率与历史告警率匹配,不更新/部分更新告警规则。
利用包含维护指标阈值信息以及维护统计周期信息的第一维护信息,调整目标设备的告警规则,具体的,通过判断所述维护指标阈值信息以及维护统计周期信息与对应的历史信息是否匹配,若不匹配,利用当前的第一维护信息来调整目标设备的告警规则。
利用故障等级对目标设备的告警规则进行调整,全面的利用运行数据以及历史告警信息,提高了对告警规则设定的全面性,进一步保障了对目标设备维护的效率。
利用故障维护优先级对目标设备的告警规则进行调整,在得到故障等级的基础上,进一步得到目标设备的故障维护优先级,根据所述故障维护优先级来调整所述告警规则,进一步提高了对于优先级高的目标设备的维护效率。
利用第一维护信息以及故障等级来对告警规则进行调整,通过判断所述第一维护信息与历史数据不匹配,以及计算得到的故障等级,来更新目标设备的告警规则,提高了对于故障等级较高的目标设备的维护效率。
利用第一维护信息以及故障维护优先级来对告警规则进行调整,通过判断所述第一维护信息与历史数据不匹配,以及计算得到的目标设备的故障维护优先级,来更新目标设备的告警规则,以便工作人员能优先处理目标设备的故障问题,提高了维护的工作效率。
利用故障等级以及故障维护优先级来对告警规则进行调整,集合故障等级以及故障维护优先级,有效的处理优先维护的目标设备以及有效的获取所述目标设备目前的等级情况,提高了维护人员的维护效率。
利用第一维护信息、故障等级以及故障维护优先级对告警规则进行调整,更加全面的获取目标设备的情况,对目标设备当前的维护以及后续的维护工作提供了有效的依据。
图3是本申请又一实施例提供的调整告警规则的方法的流程图。通过采用同比分析和环比分析进行确定维护指标阈值信息和维护统计周期信息,采用维护指标阈值信息和/或维护统计周期信息与对应的历史运行数据是否匹配,来判断是否需要更新故障等级,在确定更新故障等级以后,基于监控系统与目标设备的联动,获取目标设备的业务数据量以及SLA,将目标设备的业务数据量与历史的业务数据量进行匹配,若目标设备的业务数据量与历史的业务数据量匹配不成功,则更新目标设备的故障维护优先级,若目标设备的业务数据量与历史的业务数据量匹配成功,不更新/部分更新告警规则,其中,不更新告警规则为:保持当前的告警规则作为目标设备的告警规则,部分更新告警规则为:例如,若维护指标阈值信息和/或维护统计周期信息与对应的历史数据不匹配,更新故障等级,若目标设备的业务数据量和/或目标设备的服务等级协议与对应的历史数据匹配,不更新故障优先级。
图4是本申请实施例提供的调整告警规则的方法访问告警规则的流程图,在本实施方式中,所述调整告警规则的方法还包括以下步骤:
41,设置告警规则的访问权限,并确定访问权限对应的访问密匙。
在本实施例中,针对每个待监测目标设备的告警规则设置访问权限,防止被恶意修改,并对访问权限设置相应的访问密匙。
42,响应于目标设备的更新请求,发送告警规则的访问密匙至目标设备。
在本实施例中,响应目标设备的更新请求,根据该更新请求判断所述目标设备是否有访问权限,若所述目标设备具有访问权限,通过预先设置唯一的访问密匙,能够仅限于专门负责的工作人员访问。
43,基于访问密匙,控制目标设备对告警规则的访问。
在本实施例中,在获取到访问密匙之后,所述目标设备的用户可根据该访问密匙,对告警规则中的运行数据进行访问,依次访问维护指标阈值信息、维护周期维护统计周期信息、故障等级以及故障维护优先级,以便进行更新。
本申请提出了一种调整告警规则的方法,分别对告警规则中的维护指标阈值信息、维护统计周期信息、故障等级以及故障维护优先级进行计算,并分别与历史数据进行比对,根据第一维护信息、故障等级以及故障维护优先级中的至少一种确定是否需要更新告警规则。该方法结合同比分析和环比分析进行计算,提高了数据分析的准确度。本申请根据系统实际负载情况进行动态调整告警规则,避免误报和漏报的问题,通过与历史告警记录对比做动态故障等级更新,依据故障等级、业务量和SLA对故障优先级动态排序,提升了应急处理的效率,减轻了工作人员的运维压力,降低了人工检查成本。
图5为本申请实施例提供一种调整告警规则的装置5的功能模块图。所述调整告警规则的装置包括响应模块510、第一确定模块520、第二确定模块530以及调整模块540。本申请所称的模块是指一种能够被处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在计算机设备的存储器中。可以是手机、平板电脑等电子设备。在本实施例中,关于各模块的功能将在后续的实施例中详述。
响应模块510,用于响应目标设备的更新请求,获取所述目标设备的运行数据。
示例性的,电子设备可以通过预先安装的监控系统(Supervision Control andData Acquisition System)监控多个目标设备。其中,目标设备包括但不限于虚拟机、容器以及中间件等。电子设备通过监控系统采集多个目标设备的监控指标,所述监控指标包括但不限于目标设备CPU使用率(为便于描述,下文称为“主机CPU使用率”)、MySQL的请求数、MongoDB(MongoDB是一个基于分布式文件存储的数据库)写入请求数以及主机网络流量值。电子设备根据该监控指标判断目标设备的运行状态,确定是否需要发出告警信息以便运维人员进行维修。
响应更新请求,电子设备获取目标设备的运行数据。可以选取在目标设备发出更新请求的第一周期(例如,将2022年3月作为第一周期)内目标设备的运行数据作为运行数据。电子设备可以实时获取目标设备的运行数据,运行数据包括但不限于主机CPU使用数据、MySQL的请求数据、MongoDB写入请求数据以及主机网络流量数据。电子设备可以采用时序数据库按时间顺序对运行数据进行存储。
监控到的目标设备的运行数据中是否存在触发告警的数据,当电子设备监控到目标设备的运行数据中含有不符合当前告警规则的数据时,则发出更新请求。其中,目标设备的告警规则的更新依赖但不限于维护指标阈值信息、维护统计周期信息、故障等级以及故障优先级。
在本申请提供的实施例中,在监控系统中新增目标设备时,可以采用默认的监控指标生成该新增目标设备的告警规则。监控指标中至少可以包括设备类型与告警规则的对应关系,如此,对于新增目标设备,能够根据新增目标设备的类型匹配对应的告警规则,作为新增目标设备的初始告警规则,并利用所述方法的后续流程,对初始告警规则进行更新与调整。
第一确定模块520,用于基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级。
在一实施例中,对于待维护的目标设备,获取所述目标设备的第一维护信息,所述第一维护信息包括维护指标阈值信息、维护统计周期信息以及历史告警信息中的至少一种。若所述第一维护信息包括多种信息时,根据所述维护指标阈值信息、维护统计周期信息及/或历史告警信息对于目标设备的重要性,设置相应的权重,根据权重的大小确定利用第一维护信息中的至少一种信息进行维护的优先级,所述优先级可以是历史告警信息优先于所述维护指标阈值信息,所述维护指标阈值信息优先于所述维护统计周期信息。
在一实施例中,所述基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级,包括:
若所述第一维护信息包括所述维护指标阈值信息,利用所述维护指标阈值信息,确定所述目标设备的故障等级,其中,所述维护指标阈值信息根据对所述运行数据进行同比分析确定。
在一实施例中,所述运行数据包括本期运行数据和所述本期运行数据对应的历史同期运行数据,所述维护指标阈值信息根据对所述运行数据进行同比分析确定,包括:
对所述本期运行数据进行加权;
对所述历史同期运行数据进行加权;
对加权后的所述本期运行数据和所述历史同期运行数据进行比对分析,获取第一告警率;
基于所述第一告警率确定所述维护指标阈值信息。
所述电子设备基于所述运行数据,确定所述目标设备的维护指标阈值信息,对所述运行数据进行同比分析。
同比分析指的是将本期运行数据与历史同期运行数据进行对比分析,例如:将2022年3月的数据与2021年3月的数据进行同比分析,其中,2022年3月的数据就是同比分析中的本期运行数据,而2021年3月的数据就是同比分析中的历史同期运行数据。在本实施例中,针对同比分析,采用时间序列预测法中的加权移动平均法,对区间移动数据进行加权计算,以分析监测指标的变化趋势。
同比分析包括但不限于采用时间序列预测法(Time Series PredictionMethod),根据时间序列预测法中的加权移动平均法,对时间区间内的移动数据进行加权计算,做同比统计分析,将同比分析结果作为第一告警率进而确定目标设备的维护指标阈值信息。
或者,采用聚类的算法,在本期数据中随机选取k个元素,将这k个元素作为k个簇的簇中心,基于加权的余弦相似度,将本期数据中的数据集合聚类为k个簇,采用聚类算法,更新k个簇的簇中心,根据更新以后的簇中心,采用加权的余弦相似度重新聚类,获取聚类结果。根据聚类结果,计算目标设备的维护指标阈值信息。
通过同比分析的计算方式确定维护指标阈值信息,进一步根据维护指标值信息确定目标设备的故障等级,可以分析监测指标的变化趋势,当监测指标的变化趋势大于预设阈值时,计算所述维护指标值信息作为第一维护信息,根据第一维护信息更新目前目标设备的故障等级,有效的获取目标设备的故障情况。
在一实施例中,所述基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级,包括:
若所述第一维护信息包括所述维护统计周期信息,利用所述维护统计周期信息,确定所述目标设备的故障等级,其中,所述维护统计周期信息根据对所述运行数据进行环比分析确定。
在一实施例中,所述运行数据包括本期运行数据和所述本期运行数据相邻的前一周期运行数据,所述维护统计周期信息根据对所述运行数据进行环比分析确定,包括:
计算所述本期运行数据和所述前一周期运行数据的加权平均值;
获取与所述本期运行数据和所述前一周期运行数据对应的历史运行数据,并对所述历史运行数据计算历史加权平均值;
对所述加权平均值与所述历史加权平均值进行比对分析,获取第二告警率;
根据所述第二告警率确定所述维护统计周期信息。
所述电子设备基于所述运行数据后确定所述目标设备的维护统计周期信息,对所述运行数据进行环比分析。
环比分析指的是将本期运行数据与前一周期运行数据进行对比分析,例如:将2022年3月的数据与2022年2月的数据进行环比分析,其中,2022年3月的数据就是环比分析中的本期运行数据。2022年2月的数据就是环比分析中的前一周期运行数据。
针对环比分析,采用加权序时平均数法分别计算本期运行数据和前一周期运行数据的加权平均值,再将加权平均值与历史加权平均值进行对比,根据数值或百分比差异情况判断新进数据是否异常。
环比分析包括但不限于采用加权序时平均法,加权序时平均法是将各个时期的历史运行数据按本期和历史同期影响程度进行加权,求出本期的平均值与历史同期的平均值,并进行分析作为下期预测值。在本实施例中,获取对应于相邻两周期的历史运行数据。对本期运行数据和历史运行数据分别计算加权平均值,做环比统计分析。其中,不同时期的影响程度指的是目标设备在运行的过程中,异常数据对目标设备的影响程度,影响程度包括较高影响、一般影响以及较低影响。
通过环比分析的计算方式确定维护统计周期信息,进一步根据维护统计周期信息确定目标设备的故障等级,统计不同时期目标设备的运行数据,可以得到异常数据对目标设备的影响程度,进一步利用异常数据对目标设备的影响程度得到当前目标设备的故障等级,以便及时更新目标设备的状态,提高对目标设备的维护效率。
当第一维护信息包括历史告警信息时,可以从历史告警信息得到目标设备历史的维护数据,可以从历史的维护数据得到目标设备的故障等级。
本实施例针对故障等级的确定不限于第一维护信息中的单一条件,第一维护信息包括了维护指标阈值信息、维护统计周期信息以及历史告警信息,将维护指标阈值信息、维护统计周期信息以及历史告警信息作为确定故障等级的条件,本实施例不仅针对单一条件能确定故障等级,还针对两种或三种条件确定故障等级,使得确定目标设备的故障等级的准确性更高。
当第一维护信息包括维护指标阈值信息以及维护统计周期信息时,可以通过比对不同时期的运行数据,得到目标设备的变化趋势,将所述维护指标阈值信息和所述维护统计周期信息与对应的历史数据匹配,若不匹配,根据所述维护指标阈值信息和所述维护统计周期信息,调整所述目标设备的故障等级,避免利用单一时期的运行数据造成对目标设备故障状态评估不准确。
当第一维护信息包括维护指标阈值信息以及历史告警信息时,通过统计不同时期的运行数据并结合历史告警的数据,避免利用单一时期的运行数据造成对目标设备故障状态评估不准确,提高了判断目标设备的故障等级的准确性。
当第一维护信息包括维护统计周期信息以及历史告警信息时,将各个时期的历史运行数据按本期和历史同期影响程度进行加权并结合历史告警的数据,避免利用单一的运行数据造成对目标设备故障状态评估不准确,提高了判断目标设备的故障等级的准确性。
当第一维护信息包括维护指标阈值信息、维护统计周期信息以及历史告警信息时,一方面计算不同时期的运行数据,更加全面的获取了目标设备的变化趋势,另一方面通过历史告警信息获取目标设备历史异常情况,将基于运行数据得到的目标设备的变化趋势以及历史记录的目标设备历史的告警等级,有效的判定了当前目标设备的故障等级,有效的避免了目标设备的故障漏报以及误报的情况。
示例性的,目标设备的故障等级分为一般等级和警告等级。可以参考历史告警信息计算目标设备在第一时间周期内的第三告警率,根据第三告警率、维护指标阈值信息以及维护统计周期信息确定目标设备的故障等级,其中,历史告警信息包含了目标设备历史的告警等级。
第二确定模块530,用于根据所述目标设备的第二维护信息,确定所述目标设备的故障维护优先级。
在一实施方式中,所述第二维护信息包括如下信息的种或多种:所述目标设备的故障等级、所述目标设备的业务数据量以及所述目标设备的服务等级协议(Service LevelAgreement,SLA)。
若所述第二维护信息包括目标设备的故障等级,根据上述的方式针对故障等级的确定来进一步得到故障维护优先级,可以设定故障等级越高,故障维护优先级越高。
若所述第二维护信息包括所述目标设备的业务数据量,若所述目标设备的业务数据量与对应的历史数据不匹配,根据当前的目标设备的业务数据量来更新目标设备当前的故障维护优先级。
若所述第二维护信息包括所述目标设备的服务等级协议,所述目标设备的服务等级协议可以是预先设置的设备维护等级,则若所述目标设备的服务等级协议与对应的历史数据不匹配,根据所述目标设备的服务等级协议,调整所述目标设备的故障维护优先级。
若所述第二维护信息包括所述目标设备的业务数据量和所述目标设备的服务等级协议,则若所述目标设备的业务数据量和所述目标设备的服务等级协议与对应的历史数据不匹配,根据所述目标设备的业务数据量和所述目标设备的服务等级协议,确定所述目标设备的故障维护优先级。
若所述第二维护信息包括目标设备的故障等级以及所述目标设备的业务数据量,判断所述目标设备的业务数据量与对应的历史数据的匹配情况,若不匹配,则结合故障等级以及当前目标设备的业务数据量来确定目标设备的故障维护优先级,有效的获取故障维护优先级,以便根据所述故障维护优先级对目标设备进行维护,提高工作效率。
若所述第二维护信息包括目标设备的故障等级以及所述目标设备的服务等级协议,所述目标设备的服务等级协议可以是预先设置的设备维护等级,结合根据运行数据获取的目标设备的故障等级和预先设置的设备维护等级,更新当前目标设备的故障维护优先级,以便及时获取需要优先维护的目标设备,提供工作效率。
若所述第二维护信息包括所述目标设备的故障等级、所述目标设备的业务数据量以及所述目标设备的服务等级协议,可以根据计算得到的故障等级、预先设置的故障等级以及当前目标设备的业务数据量来进一步确定优先维护的目标设备,全面的获取目标设备的相关数据,提高了确定故障维护优先级的准确性,进一步提高了维护目标设备的工作效率。
示例性的,监控系统与目标设备之间产生联动,获取目标设备的实时业务数据量以及目标设备的服务等级协议,根据故障等级、目标设备对应的业务数据量以及服务等级协议,采用优先级排序模型进行训练,针对实时获取的运行数据进行告警优先级排序,以排序结果作为优先级的故障等级定级结果,方便维护人员依优先级处理故障,提高应用的维护质量,如,故障等级高、业务量大、SLA高的故障优先级也相对为高。
例如,将故障维护优先级从高优先级到低优先级分为P1、P2、P3以及P4,假设监控系统获取的监控指标分别为主机CPU使用率、MySQL的请求数、MongoDB写入请求数以及主机网络流量。根据上述步骤的计算方式,计算主机CPU使用率的维护指标阈值信息为0.85,维护统计周期信息为3分钟维护统计一次,并且持续统计三个不同时期的数据,根据告警率确定故障等级为一般等级,根据上述计算结果中的至少一种,确定该目标设备的故障维护优先级为P2。
调整模块540,用于根据所述第一维护信息、所述故障等级以及所述故障维护优先级中的至少一种,调整所述目标设备的告警规则。
具体地,基于上述的计算,将获取到的所述第一维护信息、故障等级以及故障维护优先级中的一种或多种信息,动态调整告警规则,通过分别判断所述第一维护信息、故障等级以及故障维护优先级与对应的历史数据不匹配,来动态调整告警规则,若在所述第一维护信息、故障等级以及故障维护优先级中存在至少一种与对应的历史数据不匹配,利用所述至少一种与历史数据不匹配,来调整告警规则。
在本实施例中,所述第一维护信息可以是维护指标阈值信息和/或维护统计周期信息。
针对利用所述维护指标阈值信息调整告警规则,利用运行数据做同比分析,采用时间序列预测法对数据进行加权计算,获取维护指标阈值信息与历史数据进行匹配。若维护指标阈值信息与历史数据不匹配,更新故障等级,否则,若维护指标阈值信息与历史数据匹配,不更新/部分更新告警规则。
本实施例通过采用同比分析,提高了目标设备的维护指标阈值信息的准确度,进而根据维护指标阈值信息,并结合历史告警数据确定故障等级,避免了单一的故障等级带来的弊端,进一步确定故障维护优先级,让维修人员及时的进行检修,提高效率。
针对利用所述维护统计周期信息调整告警规则,利用运行数据做环比分析,采用加权序时平均数法分别计算本期运行数据和前一周期运行数据的加权平均值,再将加权平均值与历史加权平均值进行对比,获取维护统计周期信息与历史数据进行匹配。若维护统计周期信息与历史数据不匹配,更新故障等级,否则,若维护统计周期信息与历史数据匹配,不更新/部分更新告警规则。
本实施例通过采用环比分析,提高了目标设备的维护统计周期信息的准确度,进而根据维护统计周期信息,并结合历史告警数据确定故障等级,避免了单一的故障等级带来的弊端,进一步确定故障维护优先级,让维修人员及时的进行检修,提高效率。
在一实施方式中,对于不同时刻的数据,采用聚类的算法,在运行数据中随机选取k个元素,将这k个元素作为k个簇的簇中心,基于加权的余弦相似度,将运行数据中的数据集合聚类为k个簇,采用聚类算法,更新k个簇的簇中心,根据更新以后的簇中心,采用加权的余弦相似度重新聚类,获取第一聚类结果,根据第一聚类结果生成告警率。同样的,针对目标设备的历史数据,采用聚类的算法,获取历史数据的第二聚类结果,根据第二聚类结果生成历史告警率,将该告警率与历史告警率匹配。若该告警率与历史告警率不匹配,更新故障等级;否则,若该告警率与历史告警率匹配,不更新/部分更新告警规则。
利用包含维护指标阈值信息以及维护统计周期信息的第一维护信息,调整目标设备的告警规则,具体的,通过判断所述维护指标阈值信息以及维护统计周期信息与对应的历史信息是否匹配,若不匹配,利用当前的第一维护信息来调整目标设备的告警规则。
利用故障等级对目标设备的告警规则进行调整,全面的利用运行数据以及历史告警信息,提高了对告警规则设定的全面性,进一步保障了对目标设备维护的效率。
利用故障维护优先级对目标设备的告警规则进行调整,在得到故障等级的基础上,进一步得到目标设备的故障维护优先级,根据所述故障维护优先级来调整所述告警规则,进一步提高了对于优先级高的目标设备的维护效率。
利用第一维护信息以及故障等级来对告警规则进行调整,通过判断所述第一维护信息与历史数据不匹配,以及计算得到的故障等级,来更新目标设备的告警规则,提高了对于故障等级较高的目标设备的维护效率。
利用第一维护信息以及故障维护优先级来对告警规则进行调整,通过判断所述第一维护信息与历史数据不匹配,以及计算得到的目标设备的故障维护优先级,来更新目标设备的告警规则,以便工作人员能优先处理目标设备的故障问题,提高了维护的工作效率。
利用故障等级以及故障维护优先级来对告警规则进行调整,集合故障等级以及故障维护优先级,有效的处理优先维护的目标设备以及有效的获取所述目标设备目前的等级情况,提高了维护人员的维护效率。
利用第一维护信息、故障等级以及故障维护优先级对告警规则进行调整,更加全面的获取目标设备的情况,对目标设备当前的维护以及后续的维护工作提供了有效的依据。
图3是本申请又一实施例提供的调整告警规则的方法的流程图。通过采用同比分析和环比分析进行确定维护指标阈值信息和维护统计周期信息,采用维护指标阈值信息和/或维护统计周期信息与对应的历史运行数据是否匹配,来判断是否需要更新故障等级,在确定更新故障等级以后,基于监控系统与目标设备的联动,获取目标设备的业务数据量以及SLA,将目标设备的业务数据量与历史的业务数据量进行匹配,若目标设备的业务数据量与历史的业务数据量匹配不成功,则更新目标设备的故障维护优先级,若目标设备的业务数据量与历史的业务数据量匹配成功,不更新/部分更新告警规则,其中,不更新告警规则为:保持当前的告警规则作为目标设备的告警规则,部分更新告警规则为:例如,若维护指标阈值信息和/或维护统计周期信息与对应的历史数据不匹配,更新故障等级,若目标设备的业务数据量和/或目标设备的服务等级协议与对应的历史数据匹配,不更新故障优先级。
图6是本申请又一实施例提供的调整告警规则的装置访问告警规则的功能模块图。调整告警规则的装置5还包括设置模块610、获取模块620以及访问模块630。
设置模块610,用于设置告警规则的访问权限,并确定访问权限对应的访问密匙。
在本实施例中,针对每个待监测目标设备的告警规则设置访问权限,防止被恶意修改,并对访问权限设置相应的访问密匙。
获取模块620,用于响应于目标设备的更新请求,发送告警规则的访问密匙至目标设备。
在本实施例中,响应目标设备的更新请求,根据该更新请求判断所述目标设备是否有访问权限,若所述目标设备具有访问权限,通过预先设置唯一的访问密匙,能够仅限于专门负责的工作人员访问。
访问模块630,用于基于访问密匙,控制目标设备对告警规则的访问。
在本实施例中,在获取到访问密匙之后,所述目标设备的用户可根据该访问密匙,对告警规则中的运行数据进行访问,依次访问维护指标阈值信息、维护周期维护统计周期信息、故障等级以及故障维护优先级,以便进行更新。
本实施例分别对告警规则中的维护指标阈值信息、维护统计周期信息、故障等级以及故障维护优先级进行计算,并分别与历史数据进行比对,根据第一维护信息、故障等级以及故障维护优先级中的至少一种确定是否需要更新告警规则。该方法结合同比分析和环比分析进行计算,提高了数据分析的准确度。本申请根据系统实际负载情况进行动态调整告警规则,避免误报和漏报的问题,通过与历史告警记录对比做动态故障等级更新,依据故障等级、业务量和SLA对故障优先级动态排序,提升了应急处理的效率,减轻了工作人员的运维压力,降低了人工检查成本。
请继续参阅图1,本实施例中,所述存储器11可以是电子设备1的内部存储器,即内置于所述电子设备1的存储器。在其他实施例中,所述存储器11也可以是电子设备1的外部存储器,即外接于所述电子设备1的存储器。
在一些实施例中,所述存储器11用于存储程序代码和各种数据,并在电子设备1的运行过程中实现高速、自动地完成程序或数据的存取。
所述存储器11可以包括随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在一实施例中,所述处理器12可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器也可以是其它任何常规的处理器等。
所述存储器11中的程序代码和各种数据如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,例如调整告警规则的方法,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,所述计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)等。
可以理解的是,以上所描述的模块划分,为一种逻辑功能划分,实际实现时可以有另外的划分方式。另外,在本申请各个实施例中的各功能模块可以集成在相同处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在相同单元中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。

Claims (11)

1.一种调整告警规则的方法,其特征在于,所述方法包括:
响应目标设备的更新请求,获取所述目标设备的运行数据;
基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级;
根据所述目标设备的第二维护信息,确定所述目标设备的故障维护优先级;
根据所述第一维护信息、所述故障等级以及所述故障维护优先级中的至少一种,调整所述目标设备的告警规则。
2.根据权利要求1所述的调整告警规则的方法,其特征在于,所述第一维护信息包括如下一种或多种信息:维护指标阈值信息、维护统计周期信息以及历史告警信息。
3.根据权利要求2所述的调整告警规则的方法,其特征在于,所述基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级,包括:
若所述第一维护信息包括所述维护指标阈值信息,利用所述维护指标阈值信息,确定所述目标设备的故障等级,其中,所述维护指标阈值信息根据对所述运行数据进行同比分析确定。
4.根据权利要求3所述的调整告警规则的方法,其特征在于,所述运行数据包括本期运行数据和所述本期运行数据对应的历史同期运行数据,所述维护指标阈值信息根据对所述运行数据进行同比分析确定,包括:
对所述本期运行数据进行加权;
对所述历史同期运行数据进行加权;
对加权后的所述本期运行数据和所述历史同期运行数据进行比对分析,获取第一告警率;
基于所述第一告警率确定所述维护指标阈值信息。
5.根据权利要求2所述的调整告警规则的方法,其特征在于,所述基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级,包括:
若所述第一维护信息包括所述维护统计周期信息,利用所述维护统计周期信息,确定所述目标设备的故障等级,其中,所述维护统计周期信息根据对所述运行数据进行环比分析确定。
6.根据权利要求5所述的调整告警规则的方法,其特征在于,所述运行数据包括本期运行数据和所述本期运行数据相邻的前一周期运行数据,所述维护统计周期信息根据对所述运行数据进行环比分析确定,包括:
计算所述本期运行数据和所述前一周期运行数据的加权平均值;
获取与所述本期运行数据和所述前一周期运行数据对应的历史运行数据,并对所述历史运行数据计算历史加权平均值;
对所述加权平均值与所述历史加权平均值进行比对分析,获取第二告警率;
根据所述第二告警率确定所述维护统计周期信息。
7.根据权利要求1所述的调整告警规则的方法,其特征在于,所述第二维护信息包括如下信息的一种或多种:所述目标设备的故障等级、所述目标设备的业务数据量以及所述目标设备的服务等级协议。
8.根据权利要求1所述的调整告警规则的方法,其特征在于,所述方法还包括:
设置所述告警规则的访问权限,并确定所述访问权限对应的访问密匙;
响应于所述目标设备的更新请求,发送所述告警规则的访问密匙至所述目标设备;
基于所述访问密匙,控制所述目标设备对所述告警规则的访问。
9.一种调整告警规则的装置,其特征在于,所述装置包括响应模块、第一确定模块、第二确定模块以及调整模块:
所述响应模块,用于响应目标设备的更新请求,获取所述目标设备的运行数据;
所述第一确定模块,用于基于所述运行数据得到的第一维护信息,确定所述目标设备的故障等级;
所述第二确定模块,用于根据所述目标设备的第二维护信息,确定所述目标设备的故障维护优先级;
所述调整模块,用于根据所述第一维护信息、所述故障等级以及所述故障维护优先级中的至少一种,调整所述目标设备的告警规则。
10.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1至8中任意一项所述的调整告警规则的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1至8中任意一项所述的调整告警规则的方法。
CN202211601991.XA 2022-12-14 2022-12-14 调整告警规则的方法及相关设备 Active CN115701890B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211601991.XA CN115701890B (zh) 2022-12-14 2022-12-14 调整告警规则的方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211601991.XA CN115701890B (zh) 2022-12-14 2022-12-14 调整告警规则的方法及相关设备

Publications (2)

Publication Number Publication Date
CN115701890A true CN115701890A (zh) 2023-02-14
CN115701890B CN115701890B (zh) 2023-06-02

Family

ID=85162772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211601991.XA Active CN115701890B (zh) 2022-12-14 2022-12-14 调整告警规则的方法及相关设备

Country Status (1)

Country Link
CN (1) CN115701890B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116228496A (zh) * 2023-03-28 2023-06-06 深圳富联富桂精密工业有限公司 应急预案的生成方法及相关设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120259962A1 (en) * 2011-04-08 2012-10-11 International Business Machines Corporation Reduction of alerts in information technology systems
CN106502871A (zh) * 2016-09-28 2017-03-15 广州汇通国信信息科技有限公司 监管系统的告警阈值动态配置系统及方法
CN111832827A (zh) * 2020-07-16 2020-10-27 国网北京市电力公司 一种配网故障预警方法、装置、可读介质及电子设备
CN112612671A (zh) * 2020-12-16 2021-04-06 深圳前海微众银行股份有限公司 系统监控方法、装置、设备及存储介质
CN113448763A (zh) * 2021-07-16 2021-09-28 广东电网有限责任公司 全生命周期管理的可动态扩展分组告警服务方法
CN113986693A (zh) * 2021-11-15 2022-01-28 中国银行股份有限公司 告警响应级别确定方法、装置、电子设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120259962A1 (en) * 2011-04-08 2012-10-11 International Business Machines Corporation Reduction of alerts in information technology systems
CN106502871A (zh) * 2016-09-28 2017-03-15 广州汇通国信信息科技有限公司 监管系统的告警阈值动态配置系统及方法
CN111832827A (zh) * 2020-07-16 2020-10-27 国网北京市电力公司 一种配网故障预警方法、装置、可读介质及电子设备
CN112612671A (zh) * 2020-12-16 2021-04-06 深圳前海微众银行股份有限公司 系统监控方法、装置、设备及存储介质
CN113448763A (zh) * 2021-07-16 2021-09-28 广东电网有限责任公司 全生命周期管理的可动态扩展分组告警服务方法
CN113986693A (zh) * 2021-11-15 2022-01-28 中国银行股份有限公司 告警响应级别确定方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116228496A (zh) * 2023-03-28 2023-06-06 深圳富联富桂精密工业有限公司 应急预案的生成方法及相关设备
CN116228496B (zh) * 2023-03-28 2023-08-04 深圳富联富桂精密工业有限公司 应急预案的生成方法及相关设备

Also Published As

Publication number Publication date
CN115701890B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
CN108491305B (zh) 一种服务器故障的检测方法及系统
US7444263B2 (en) Performance metric collection and automated analysis
CN111427753A (zh) 基于arima模型的容量预测装置及其控制方法
CN110740061B (zh) 故障预警方法、装置及计算机存储介质
CN111865407B (zh) 光通道性能劣化智能预警方法、装置、设备及存储介质
US9858106B2 (en) Virtual machine capacity planning
CN108599977B (zh) 基于统计方法监控系统可用性的系统及方法
CN111355610A (zh) 一种基于边缘网络的异常处理方法及装置
CN114267178B (zh) 一种车站的智能运营维护方法及装置
CN110245053A (zh) 故障预测诊断方法及系统
US20190158363A1 (en) Parameter setting method, data analysis device, data analysis system and program
CN115701890B (zh) 调整告警规则的方法及相关设备
CN111984442A (zh) 计算机集群系统的异常检测方法及装置、存储介质
KR20170084445A (ko) 시계열 데이터를 이용한 이상 감지 방법 및 그 장치
CN110795324B (zh) 一种数据处理方法及装置
CN113590429A (zh) 一种服务器故障诊断方法、装置及电子设备
CN114995348A (zh) 一种变频传动全寿命周期管理方法
CN113949652B (zh) 基于人工智能的用户异常行为检测方法、装置及相关设备
CN115441456A (zh) 一种电网调度支持系统故障诊断方法及装置
KR101960755B1 (ko) 미취득 전력 데이터 생성 방법 및 장치
CN113992602A (zh) 一种电缆监测数据上传方法、装置、设备以及存储介质
CN113032239A (zh) 风险提示方法、装置、电子设备及存储介质
CN116714469A (zh) 充电桩健康监测方法、装置、终端及存储介质
WO2020044898A1 (ja) 機器状態監視装置及びプログラム
CN108289035B (zh) 一种直观的网络及业务系统运行状态展现方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant