CN116302859A - 应用平台告警方法及装置 - Google Patents
应用平台告警方法及装置 Download PDFInfo
- Publication number
- CN116302859A CN116302859A CN202310204166.4A CN202310204166A CN116302859A CN 116302859 A CN116302859 A CN 116302859A CN 202310204166 A CN202310204166 A CN 202310204166A CN 116302859 A CN116302859 A CN 116302859A
- Authority
- CN
- China
- Prior art keywords
- data
- detected
- target
- index type
- application platform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000001514 detection method Methods 0.000 claims abstract description 64
- 230000002159 abnormal effect Effects 0.000 claims abstract description 32
- 238000012549 training Methods 0.000 claims description 82
- 238000003860 storage Methods 0.000 claims description 30
- 230000008569 process Effects 0.000 description 13
- 238000004590 computer program Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/327—Alarm or error message display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Alarm Systems (AREA)
Abstract
本申请公开一种应用平台告警方法及装置,涉及互联网技术领域。本申请的方法包括:接收目标应用平台发送的多个待检测数据;根据每个待检测数据对应的指标类型确定每个待检测数据对应的告警模型;分别将每个待检测数据输入至每个待检测数据对应的告警模型中,以获得每个待检测数据对应的检测结果;当一个或多个待检测数据对应的检测结果为异常数据时,生成每个检测结果为异常数据的待检测数据对应的告警信息;将一个或多个告警信息发送至目标终端设备,其中,目标终端设备为目标应用平台侧的工作人员使用的终端设备。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种应用平台告警方法及装置。
背景技术
随着互联网的不断发展,应用平台的使用越来越广泛,应用平台可为各行各业提供相应的服务。在提供服务的同时,部署在云端服务器中的应用平台也会发生故障,为了保证应用平台可以正常运行,工作人员需要对应用平台进行监控,以确定应用平台是否发生故障,并在确定应用平台发生故障时,确定故障原因,以及根据故障原因对应用平台进行故障修复。
目前,工作人员通常是通过人工监控的方式确定应用平台是否发生故障。因此,工作人员是否能够准确确定应用平台是否发生故障,取决于工作人员的工作经验,当工作人员的工作经验不足时,工作人员无法准确确定应用平台是否发生故障。
发明内容
本申请实施例提供一种应用平台告警方法及装置,主要目的在于准确确定应用平台是否发生故障。
为解决上述技术问题,本申请实施例提供如下技术方案:
第一方面,本申请提供了一种应用平台告警方法,所述方法包括:
接收目标应用平台发送的多个待检测数据;
根据每个所述待检测数据对应的指标类型确定每个所述待检测数据对应的告警模型;
分别将每个所述待检测数据输入至每个所述待检测数据对应的告警模型中,以获得每个所述待检测数据对应的检测结果;
当一个或多个所述待检测数据对应的检测结果为异常数据时,生成每个检测结果为异常数据的所述待检测数据对应的告警信息;
将一个或多个所述告警信息发送至目标终端设备,其中,所述目标终端设备为所述目标应用平台侧的工作人员使用的终端设备。
可选的,在所述接收目标应用平台发送的多个待检测数据之前,所述方法还包括:
获取每个目标指标类型对应的训练样本集;
根据每个所述目标指标类型对应的训练样本集对每个所述目标指标类型对应的预置模型进行训练,以获得每个所述目标指标类型对应的告警模型。
可选的,所述根据每个所述目标指标类型对应的训练样本集对每个所述目标指标类型对应的预置模型进行训练,以获得每个所述目标指标类型对应的告警模型,包括:
对于任意一个目标指标类型而言:
基于所述目标指标类型对应的训练样本集对所述目标指标类型对应的预置模型进行迭代训练;其中,
在每轮训练后,判断是否达到预设训练终止条件;
若达到,则将本轮训练后得到的所述预置模型确定为所述目标指标类型对应的告警模型;
若未达到,则根据所述预置模型对应的损失函数对所述预置模型的模型参数进行优化调整,以及基于优化调整后的所述预置模型进行下一轮训练。
可选的,在所述将一个或多个所述告警信息发送至目标终端设备之后,所述方法还包括:
根据根因推荐信息集合、每个所述待检测数据对应的检测结果和指标类型,确定多个所述待检测数据对应的根因推荐信息;
将多个所述待检测数据对应的根因推荐信息发送至所述目标终端设备。
可选的,所述方法还包括:
对于任意一个待检测数据而言:
根据所述待检测数据和所述待检测数据对应的检测结果,对所述待检测数据对应的告警模型进行重训练。
第二方面,本申请还提供一种应用平台告警装置,所述装置包括:
接收单元,用于接收目标应用平台发送的多个待检测数据;
第一确定单元,用于根据每个所述待检测数据对应的指标类型确定每个所述待检测数据对应的告警模型;
输入单元,用于分别将每个所述待检测数据输入至每个所述待检测数据对应的告警模型中,以获得每个所述待检测数据对应的检测结果;
生成单元,用于当一个或多个所述待检测数据对应的检测结果为异常数据时,生成每个检测结果为异常数据的所述待检测数据对应的告警信息;
第一发送单元,用于将一个或多个所述告警信息发送至目标终端设备,其中,所述目标终端设备为所述目标应用平台侧的工作人员使用的终端设备。
可选的,所述装置还包括:
获取单元,用于在所述接收单元接收目标应用平台发送的多个待检测数据之前,获取每个目标指标类型对应的训练样本集;
训练单元,用于根据每个所述目标指标类型对应的训练样本集对每个所述目标指标类型对应的预置模型进行训练,以获得每个所述目标指标类型对应的告警模型。
可选的,所述训练单元,具体用于:对于任意一个目标指标类型而言:
基于所述目标指标类型对应的训练样本集对所述目标指标类型对应的预置模型进行迭代训练;其中,
在每轮训练后,判断是否达到预设训练终止条件;
若达到,则将本轮训练后得到的所述预置模型确定为所述目标指标类型对应的告警模型;
若未达到,则根据所述预置模型对应的损失函数对所述预置模型的模型参数进行优化调整,以及基于优化调整后的所述预置模型进行下一轮训练。
可选的,所述装置还包括:
第二确定单元,用于在所述第一发送单元将一个或多个所述告警信息发送至目标终端设备之后,根据根因推荐信息集合、每个所述待检测数据对应的检测结果和指标类型,确定多个所述待检测数据对应的根因推荐信息;
第二发送单元,用于将多个所述待检测数据对应的根因推荐信息发送至所述目标终端设备。
可选的,所述装置还包括:
重训练单元,用于对于任意一个待检测数据而言:
根据所述待检测数据和所述待检测数据对应的检测结果,对所述待检测数据对应的告警模型进行重训练。
第三方面,本申请的实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行第一方面所述的应用平台告警方法。
第四方面,本申请的实施例提供了一种应用平台告警装置,所述装置包括存储介质;及一个或者多个处理器,所述存储介质与所述处理器耦合,所述处理器被配置为执行所述存储介质中存储的程序指令;所述程序指令运行时执行第一方面所述的应用平台告警方法。
借由上述技术方案,本申请提供的技术方案至少具有下列优点:
本申请提供一种应用平台告警方法及装置,本申请能够在应用平台告警应用程序接收到目标应用平台发送的多个待检测数据后,由应用平台告警应用程序先根据每个待检测数据对应的指标类型确定每个待检测数据对应的告警模型,再分别将每个待检测数据输入至每个待检测数据对应的告警模型中,以获得每个待检测数据对应的检测结果;当一个或多个待检测数据对应的检测结果为异常数据时,应用平台告警应用程序便可生成每个检测结果为异常数据的待检测数据对应的告警信息,并将一个或多个告警信息发送至目标终端设备;在目标终端设备接收到一个或多个告警信息后,目标应用平台侧的工作人员便可获知目标应用平台出现故障,并且,根据一个或多个告警信息能够获知目标应用平台运行过程中哪个指标类型的数据出现异常,从而导致目标应用平台出现故障,进而无需工作人员通过人工监控的方式确定目标应用平台是否发生故障,能够有效提高确定目标应用平台是否发生故障的准确性。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,相同或对应的标号表示相同或对应的部分,其中:
图1示出了本申请实施例提供的一种应用平台告警方法流程图;
图2示出了本申请实施例提供的一种应用平台告警装置的组成框图;
图3示出了本申请实施例提供的另一种应用平台告警装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施方式。虽然附图中显示了本申请的示例性实施方式,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本申请所属领域技术人员所理解的通常意义。
本申请实施例提供一种应用平台告警方法,具体如图1所示,该方法包括:
101、接收目标应用平台发送的多个待检测数据。
其中,云端服务器集群中包含目标云端服务器和多个其他云端服务器,在本申请实施例中,各个步骤中的执行主体为部署在目标云端服务器中的应用平台告警应用程序,每个其他云端服务器中部署有应用平台;其中,目标应用平台可以为任意一个其他云端服务器中部署的应用平台,目标应用平台可以但不限为:智能驾驶应用平台、自动泊车应用平台等中的任意一个;其中,多个待检测数据可以为部署目标应用平台的其他云端服务器对应的基础架构类指标数据(即其他云端服务器运行过程中产生的基础架构类指标数据,如服务器CPU使用率数据、服务器内存使用率数据、服务器磁盘使用率数据等等),也可以为目标应用平台对应的应用类指标数据(即目标应用平台运行过程中产生的应用类指标数据,如应用平台CPU使用率数据、应用平台内存使用率数据、应用平台磁盘使用率数据等等)。
在本申请实施例中,由于,根据部署目标应用平台的其他云端服务器对应的基础架构类指标数据和目标应用平台对应的应用类指标数据能够确定目标应用平台是否出现故障,即当检测出其他云端服务器对应的基础架构类指标数据和/或目标应用平台对应的应用类指标数据为异常数据时,便可确定目标应用平台出现故障,因此,在目标应用平台运行过程中,目标应用平台需要将其他云端服务器对应的基础架构类指标数据和/或目标应用平台对应的应用类指标数据(即多个待检测数据)发送给应用平台告警应用程序,此时,应用平台告警应用程序便可接收得到目标应用平台发送的多个待检测数据,后续根据多个待检测数据便可确定目标应用平台是否出现故障。
具体的,在本步骤中,应用平台告警应用程序可以通过消息中间件接收目标应用平台发送的多个待检测数据,但不限于此。
具体的,在本步骤中,应用平台告警应用程序在接收到目标应用平台发送的多个待检测数据后,可以根据目标应用平台对应的应用平台名称、部署目标应用平台的其他云端服务器对应的主机名称等等,分别为每个待检测数据添加唯一标识,但不限于此。
具体的,在本步骤中,应用平台告警应用程序在接收到目标应用平台发送的多个待检测数据后,还可以根据预设要求对多个待检测数据进行数据清洗处理,本申请实施例对预设要求包含的内容不进行具体限定。
具体的,在本步骤中,应用平台告警应用程序在接收到目标应用平台发送的多个待检测数据后,可以将多个待检测数据存储至消费中间件中,当需要对多个待检测数据进行检测处理时,便可在消费中间件中获取多个待检测数据。
102、根据每个待检测数据对应的指标类型确定每个待检测数据对应的告警模型。
其中,不同的待检测数据对应于不同的指标类型,例如,服务器CPU使用率数据对应的指标类型为服务器CPU使用率指标、服务器内存使用率数据对应的指标类型为服务器内存使用率指标…应用平台CPU使用率数据对应的指标类型为应用平台CPU使用率指标等等;其中,不同的指标类型对应于不同的告警模型,例如,服务器CPU使用率指标对应的告警模型为告警模型A、服务器内存使用率指标对应的告警模型为告警模型B…应用平台CPU使用率指标对应的告警模型为告警模型F等等;其中,目标云端服务器的本地存储空间中存储有不同指标类型对应的告警模型。
在本申请实施例中,应用平台告警应用程序在接收到目标应用平台发送的多个待检测数据后,便可根据每个待检测数据对应的指标类型确定每个待检测数据对应的告警模型,例如,若待检测数据a具体为服务器CPU使用率数据,则待检测数据a对应的告警模型为告警模型A。
103、分别将每个待检测数据输入至每个待检测数据对应的告警模型中,以获得每个待检测数据对应的检测结果。
在本申请实施例中,应用平台告警应用程序在确定每个待检测数据对应的告警模型后,便可分别将每个待检测数据输入至每个待检测数据对应的告警模型中,以获得每个待检测数据对应的检测结果;其中,对于任意一个待检测数据而言,其对应的检测结果可以为:正常数据,也可以为:异常数据。
104、当一个或多个待检测数据对应的检测结果为异常数据时,生成每个检测结果为异常数据的待检测数据对应的告警信息。
在本申请实施例中,应用平台告警应用程序在获得每个待检测数据对应的检测结果后,便可根据每个待检测数据对应的检测结果确定是否需要生成告警信息,即当某个待检测数据对应的检测结果具体为:正常数据时,无需生成该待检测数据对应的告警信息,当某个待检测数据对应检测结果具体为:异常数据时,需要生成该待检测数据对应的告警信息;因此,当一个或多个待检测数据对应的检测结果为异常数据时,应用平台告警应用程序需要生成每个检测结果为异常数据的待检测数据对应的告警信息。
具体的,在本步骤中,当某个待检测数据对应检测结果具体为:异常数据时,应用平台告警应用程序可以根据该待检测数据对应的检测结果、指标类型和唯一标识,生成该待检测数据对应的告警信息。
105、将一个或多个告警信息发送至目标终端设备。
其中,目标终端设备为目标应用平台侧的工作人员使用的终端设备。
在本申请实施例中,应用平台告警应用程序在生成一个或多个告警信息后,便可将一个或多个告警信息发送至目标终端设备,在目标终端设备接收到一个或多个告警信息后,目标应用平台侧的工作人员便可获知目标应用平台出现故障,并且,根据一个或多个告警信息能够获知目标应用平台运行过程中哪个指标类型的数据出现异常,从而导致目标应用平台出现故障。
具体的,在本申请实施例中,应用平台告警应用程序可以以短信形式将一个或多个告警信息发送至目标终端设备,也可以以邮件形式将一个或多个告警信息发送至目标终端设备,本申请实施例对此不进行具体限定。
本申请实施例提供一种应用平台告警方法,本申请实施例能够在应用平台告警应用程序接收到目标应用平台发送的多个待检测数据后,由应用平台告警应用程序先根据每个待检测数据对应的指标类型确定每个待检测数据对应的告警模型,再分别将每个待检测数据输入至每个待检测数据对应的告警模型中,以获得每个待检测数据对应的检测结果;当一个或多个待检测数据对应的检测结果为异常数据时,应用平台告警应用程序便可生成每个检测结果为异常数据的待检测数据对应的告警信息,并将一个或多个告警信息发送至目标终端设备;在目标终端设备接收到一个或多个告警信息后,目标应用平台侧的工作人员便可获知目标应用平台出现故障,并且,根据一个或多个告警信息能够获知目标应用平台运行过程中哪个指标类型的数据出现异常,从而导致目标应用平台出现故障,进而无需工作人员通过人工监控的方式确定目标应用平台是否发生故障,能够有效提高确定目标应用平台是否发生故障的准确性。
进一步的,在本申请实施例中,为了能够准确获得每个待检测数据对应的检测结果,应用平台告警应用程序需要预先训练每个目标指标类型对应的告警模型,其中,多个目标指标类型可以但不限于包括:服务器CPU使用率指标、服务器内存使用率指标、服务器磁盘使用率指标…应用平台CPU使用率指标、应用平台内存使用率指标、应用平台磁盘使用率指标等等。
具体的,在本步骤中,应用平台告警应用程序训练每个目标指标类型对应的告警模型的具体过程为:
(1)获取每个目标指标类型对应的训练样本集。
其中,对于任意一个目标指标类型而言,其对应的训练样本集中包含多个样本数据和每个样本数据对应的标注结果(或部分样本数据对应的标注结果),其中,该目标指标类型对应的样本数据为属于该目标指标类型的正常样本数据,或为属于该目标指标类型的异常样本数据。
(2)根据每个目标指标类型对应的训练样本集对每个目标指标类型对应的预置模型进行训练,以获得每个目标指标类型对应的告警模型。
其中,不同目标指标类型对应的预置模型可以相同,也可以不同,对于任意一个目标指标类型而言,其对应的预置模型可以但不限于为:任意一种自监督学习模型或任意一种半监督学习模型,本申请实施例对此不进行具体限定。
在本申请实施例中,应用平台告警应用程序在获取得到每个目标指标类型对应的训练样本集后,便可根据每个目标指标类型对应的训练样本集对每个目标指标类型对应的预置模型进行训练,以获得每个目标指标类型对应的告警模型;在训练获得每个目标指标类型对应的告警模型后,便可将多个告警模型存储至目标云端服务器的本地存储空间中。
其中,对于任意一个目标指标类型而言,应用平台告警应用程序根据该目标指标类型对应的训练样本集对该目标指标类型对应的预置模型进行训练的具体过程为:基于该目标指标类型对应的训练样本集对该目标指标类型对应的预置模型进行迭代训练;其中,在每轮训练后,判断是否达到预设训练终止条件;若达到,则将本轮训练后得到的预置模型确定为目标指标类型对应的告警模型;若未达到,则根据预置模型对应的损失函数对预置模型的模型参数进行优化调整,以及基于优化调整后的预置模型进行下一轮训练;其中,预设训练终止条件可以但不限于为:(1)当前累计迭代训练次数达到预设次数阈值(2)当前累计迭代训练时长达到预设时长阈值(3)预置模型的准确率大于预设准确率阈值等等中的任意一个。
进一步的,在本申请实施例中,应用平台告警应用程序在将一个或多个告警信息发送至目标终端设备后,还可以根据根因推荐信息集合、每个待检测数据对应的检测结果和指标类型,确定多个待检测数据对应的根因推荐信息,并将生成的根因推荐信息发送至目标终端设备,其中,根因推荐信息集合中包含多个预置根因推荐信息和每个预置根因推荐信息对应的多个指标类型,例如,预置根因推荐信息A对应于指标类型a、指标类型b和指标类型c,预置根因推荐信息B对应于指标类型a、指标类型d、指标类型e和指标类型f,预置根因推荐信息C对应于指标类型c、指标类型f和指标类型g…当根据每个待检测数据对应的检测结果和指标类型确定指标类型c的待检测数据、指标类型f的待检测数据和指标类型g的待检测数据为异常数据时,应用平台告警应用程序便可确定多个待检测数据对应的根因推荐信息为预置根因推荐信息C;其中,根因推荐信息中包含导致目标应用平台出现故障可能性最大的原因,在目标终端设备接收到根因推荐信息后,目标应用平台侧的工作人员根据根因推荐信息便可快速确定导致目标应用平台出现故障的根本原因。
进一步的,在本申请实施例中,应用平台告警应用程序在将一个或多个告警信息发送至目标终端设备后,还可以根据多个待检测数据和每个待检测数据对应的检测结果对多个告警模型进行重训练处理,从而进一步提高告警模型输出检测结果的准确性,其中,对于任意一个待检测数据而言:应用平台告警应用程序可以根据该待检测数据和该待检测数据对应的检测结果,对该待检测数据对应的告警模型进行重训练处理。
进一步的,作为对上述图1所示方法的实现,本申请另一实施例还提供了一种应用平台告警装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。该装置应用于准确确定应用平台是否发生故障,具体如图2所示,该装置包括:
接收单元201,用于接收目标应用平台发送的多个待检测数据;
第一确定单元202,用于根据每个所述待检测数据对应的指标类型确定每个所述待检测数据对应的告警模型;
输入单元203,用于分别将每个所述待检测数据输入至每个所述待检测数据对应的告警模型中,以获得每个所述待检测数据对应的检测结果;
生成单元204,用于当一个或多个所述待检测数据对应的检测结果为异常数据时,生成每个检测结果为异常数据的所述待检测数据对应的告警信息;
第一发送单元205,用于将一个或多个所述告警信息发送至目标终端设备,其中,所述目标终端设备为所述目标应用平台侧的工作人员使用的终端设备。
进一步的,如图3所示,该装置还包括:
获取单元206,用于在接收单元201接收目标应用平台发送的多个待检测数据之前,获取每个目标指标类型对应的训练样本集;
训练单元207,用于根据每个所述目标指标类型对应的训练样本集对每个所述目标指标类型对应的预置模型进行训练,以获得每个所述目标指标类型对应的告警模型。
进一步的,如图3所示,训练单元207,具体用于:对于任意一个目标指标类型而言:
基于所述目标指标类型对应的训练样本集对所述目标指标类型对应的预置模型进行迭代训练;其中,
在每轮训练后,判断是否达到预设训练终止条件;
若达到,则将本轮训练后得到的所述预置模型确定为所述目标指标类型对应的告警模型;
若未达到,则根据所述预置模型对应的损失函数对所述预置模型的模型参数进行优化调整,以及基于优化调整后的所述预置模型进行下一轮训练。
进一步的,如图3所示,该装置还包括:
第二确定单元208,用于在第一发送单元205将一个或多个所述告警信息发送至目标终端设备之后,根据根因推荐信息集合、每个所述待检测数据对应的检测结果和指标类型,确定多个所述待检测数据对应的根因推荐信息;
第二发送单元209,用于将多个所述待检测数据对应的根因推荐信息发送至所述目标终端设备。
进一步的,如图3所示,该装置还包括:
重训练单元210,用于对于任意一个待检测数据而言:
根据所述待检测数据和所述待检测数据对应的检测结果,对所述待检测数据对应的告警模型进行重训练。
本申请实施例提供一种应用平台告警方法及装置,本申请实施例能够在应用平台告警应用程序接收到目标应用平台发送的多个待检测数据后,由应用平台告警应用程序先根据每个待检测数据对应的指标类型确定每个待检测数据对应的告警模型,再分别将每个待检测数据输入至每个待检测数据对应的告警模型中,以获得每个待检测数据对应的检测结果;当一个或多个待检测数据对应的检测结果为异常数据时,应用平台告警应用程序便可生成每个检测结果为异常数据的待检测数据对应的告警信息,并将一个或多个告警信息发送至目标终端设备;在目标终端设备接收到一个或多个告警信息后,目标应用平台侧的工作人员便可获知目标应用平台出现故障,并且,根据一个或多个告警信息能够获知目标应用平台运行过程中哪个指标类型的数据出现异常,从而导致目标应用平台出现故障,进而无需工作人员通过人工监控的方式确定目标应用平台是否发生故障,能够有效提高确定目标应用平台是否发生故障的准确性。
本申请实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的应用平台告警方法。
存储介质可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请实施例还提供了一种应用平台告警装置,所述装置包括存储介质;及一个或者多个处理器,所述存储介质与所述处理器耦合,所述处理器被配置为执行所述存储介质中存储的程序指令;所述程序指令运行时执行上述所述的应用平台告警方法。
本申请实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
接收目标应用平台发送的多个待检测数据;
根据每个所述待检测数据对应的指标类型确定每个所述待检测数据对应的告警模型;
分别将每个所述待检测数据输入至每个所述待检测数据对应的告警模型中,以获得每个所述待检测数据对应的检测结果;
当一个或多个所述待检测数据对应的检测结果为异常数据时,生成每个检测结果为异常数据的所述待检测数据对应的告警信息;
将一个或多个所述告警信息发送至目标终端设备,其中,所述目标终端设备为所述目标应用平台侧的工作人员使用的终端设备。
进一步的,在所述接收目标应用平台发送的多个待检测数据之前,所述方法还包括:
获取每个目标指标类型对应的训练样本集;
根据每个所述目标指标类型对应的训练样本集对每个所述目标指标类型对应的预置模型进行训练,以获得每个所述目标指标类型对应的告警模型。
进一步的,所述根据每个所述目标指标类型对应的训练样本集对每个所述目标指标类型对应的预置模型进行训练,以获得每个所述目标指标类型对应的告警模型,包括:
对于任意一个目标指标类型而言:
基于所述目标指标类型对应的训练样本集对所述目标指标类型对应的预置模型进行迭代训练;其中,
在每轮训练后,判断是否达到预设训练终止条件;
若达到,则将本轮训练后得到的所述预置模型确定为所述目标指标类型对应的告警模型;
若未达到,则根据所述预置模型对应的损失函数对所述预置模型的模型参数进行优化调整,以及基于优化调整后的所述预置模型进行下一轮训练。
进一步的,在所述将一个或多个所述告警信息发送至目标终端设备之后,所述方法还包括:
根据根因推荐信息集合、每个所述待检测数据对应的检测结果和指标类型,确定多个所述待检测数据对应的根因推荐信息;
将多个所述待检测数据对应的根因推荐信息发送至所述目标终端设备。
进一步的,所述方法还包括:
对于任意一个待检测数据而言:
根据所述待检测数据和所述待检测数据对应的检测结果,对所述待检测数据对应的告警模型进行重训练。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:接收目标应用平台发送的多个待检测数据;根据每个所述待检测数据对应的指标类型确定每个所述待检测数据对应的告警模型;分别将每个所述待检测数据输入至每个所述待检测数据对应的告警模型中,以获得每个所述待检测数据对应的检测结果;当一个或多个所述待检测数据对应的检测结果为异常数据时,生成每个检测结果为异常数据的所述待检测数据对应的告警信息;将一个或多个所述告警信息发送至目标终端设备,其中,所述目标终端设备为所述目标应用平台侧的工作人员使用的终端设备。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (12)
1.一种应用平台告警方法,其特征在于,所述方法包括:
接收目标应用平台发送的多个待检测数据;
根据每个所述待检测数据对应的指标类型确定每个所述待检测数据对应的告警模型;
分别将每个所述待检测数据输入至每个所述待检测数据对应的告警模型中,以获得每个所述待检测数据对应的检测结果;
当一个或多个所述待检测数据对应的检测结果为异常数据时,生成每个检测结果为异常数据的所述待检测数据对应的告警信息;
将一个或多个所述告警信息发送至目标终端设备,其中,所述目标终端设备为所述目标应用平台侧的工作人员使用的终端设备。
2.根据权利要求1所述的方法,其特征在于,在所述接收目标应用平台发送的多个待检测数据之前,所述方法还包括:
获取每个目标指标类型对应的训练样本集;
根据每个所述目标指标类型对应的训练样本集对每个所述目标指标类型对应的预置模型进行训练,以获得每个所述目标指标类型对应的告警模型。
3.根据权利要求2所述的方法,其特征在于,所述根据每个所述目标指标类型对应的训练样本集对每个所述目标指标类型对应的预置模型进行训练,以获得每个所述目标指标类型对应的告警模型,包括:
对于任意一个目标指标类型而言:
基于所述目标指标类型对应的训练样本集对所述目标指标类型对应的预置模型进行迭代训练;其中,
在每轮训练后,判断是否达到预设训练终止条件;
若达到,则将本轮训练后得到的所述预置模型确定为所述目标指标类型对应的告警模型;
若未达到,则根据所述预置模型对应的损失函数对所述预置模型的模型参数进行优化调整,以及基于优化调整后的所述预置模型进行下一轮训练。
4.根据权利要求1所述的方法,其特征在于,在所述将一个或多个所述告警信息发送至目标终端设备之后,所述方法还包括:
根据根因推荐信息集合、每个所述待检测数据对应的检测结果和指标类型,确定多个所述待检测数据对应的根因推荐信息;
将多个所述待检测数据对应的根因推荐信息发送至所述目标终端设备。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:
对于任意一个待检测数据而言:
根据所述待检测数据和所述待检测数据对应的检测结果,对所述待检测数据对应的告警模型进行重训练。
6.一种应用平台告警装置,其特征在于,所述装置包括:
接收单元,用于接收目标应用平台发送的多个待检测数据;
第一确定单元,用于根据每个所述待检测数据对应的指标类型确定每个所述待检测数据对应的告警模型;
输入单元,用于分别将每个所述待检测数据输入至每个所述待检测数据对应的告警模型中,以获得每个所述待检测数据对应的检测结果;
生成单元,用于当一个或多个所述待检测数据对应的检测结果为异常数据时,生成每个检测结果为异常数据的所述待检测数据对应的告警信息;
第一发送单元,用于将一个或多个所述告警信息发送至目标终端设备,其中,所述目标终端设备为所述目标应用平台侧的工作人员使用的终端设备。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
获取单元,用于在所述接收单元接收目标应用平台发送的多个待检测数据之前,获取每个目标指标类型对应的训练样本集;
训练单元,用于根据每个所述目标指标类型对应的训练样本集对每个所述目标指标类型对应的预置模型进行训练,以获得每个所述目标指标类型对应的告警模型。
8.根据权利要求7所述的装置,其特征在于,
所述训练单元,具体用于:对于任意一个目标指标类型而言:
基于所述目标指标类型对应的训练样本集对所述目标指标类型对应的预置模型进行迭代训练;其中,
在每轮训练后,判断是否达到预设训练终止条件;
若达到,则将本轮训练后得到的所述预置模型确定为所述目标指标类型对应的告警模型;
若未达到,则根据所述预置模型对应的损失函数对所述预置模型的模型参数进行优化调整,以及基于优化调整后的所述预置模型进行下一轮训练。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二确定单元,用于在所述第一发送单元将一个或多个所述告警信息发送至目标终端设备之后,根据根因推荐信息集合、每个所述待检测数据对应的检测结果和指标类型,确定多个所述待检测数据对应的根因推荐信息;
第二发送单元,用于将多个所述待检测数据对应的根因推荐信息发送至所述目标终端设备。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述装置还包括:
重训练单元,用于对于任意一个待检测数据而言:
根据所述待检测数据和所述待检测数据对应的检测结果,对所述待检测数据对应的告警模型进行重训练。
11.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1-5中任一项所述的应用平台告警方法。
12.一种应用平台告警装置,其特征在于,所述装置包括存储介质;及一个或者多个处理器,所述存储介质与所述处理器耦合,所述处理器被配置为执行所述存储介质中存储的程序指令;所述程序指令运行时执行权利要求1-5中任一项所述的应用平台告警方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310204166.4A CN116302859A (zh) | 2023-02-27 | 2023-02-27 | 应用平台告警方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310204166.4A CN116302859A (zh) | 2023-02-27 | 2023-02-27 | 应用平台告警方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116302859A true CN116302859A (zh) | 2023-06-23 |
Family
ID=86816232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310204166.4A Pending CN116302859A (zh) | 2023-02-27 | 2023-02-27 | 应用平台告警方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116302859A (zh) |
-
2023
- 2023-02-27 CN CN202310204166.4A patent/CN116302859A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111897705B (zh) | 服务状态处理、模型训练方法、装置、设备和存储介质 | |
CN112393931B (zh) | 检测方法、装置、电子设备和计算机可读介质 | |
CN109887125B (zh) | 故障检测方法及装置 | |
CN110275992B (zh) | 应急处理方法、装置、服务器及计算机可读存储介质 | |
CN111767957B (zh) | 一种日志异常的检测方法、装置、存储介质及电子设备 | |
CN113641526A (zh) | 告警根因定位方法、装置、电子设备及计算机存储介质 | |
CN111898059A (zh) | 网站页面质量评估和监控方法及其系统 | |
WO2018202440A1 (en) | Data transmission method and apparatus | |
CN113123955B (zh) | 柱塞泵异常检测方法、装置、存储介质及电子设备 | |
CN116302859A (zh) | 应用平台告警方法及装置 | |
CN115442209B (zh) | 一种故障检测方法、装置、电子设备及存储介质 | |
CN112668727A (zh) | 检测设备故障的方法和装置 | |
CN110780198A (zh) | 一种伺服焊接系统运动的波形识别方法及设备 | |
CN115658441A (zh) | 一种基于日志的家政业务系统异常监控方法、设备及介质 | |
CN114330569A (zh) | 一种检测风机组部件故障的方法、设备及存储介质 | |
CN111935279B (zh) | 基于区块链和大数据的物联网络维护方法及计算节点 | |
WO2022015313A1 (en) | Generation of alerts of correlated time-series behavior of environments | |
JP2018005393A (ja) | 故障予兆判定方法、故障予兆判定装置および故障予兆判定プログラム | |
CN111880959A (zh) | 一种异常检测方法、装置及电子设备 | |
CN113071541B (zh) | 轨旁配置文件的生成方法及装置 | |
CN113285817B (zh) | 报警方法、系统、设备及存储介质 | |
CN113992530B (zh) | 波特率识别方法、装置、电子设备和存储介质 | |
CN116881036A (zh) | 服务器异常运行数据确定方法、装置和非易失性存储介质 | |
CN117875157A (zh) | 一种基于数据中台的换流变压器的健康评估方法及系统 | |
CN116069542A (zh) | 云平台集群健康状态检测方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |