CN118013409A - 一种终端设备的故障预测方法、装置、设备及存储介质 - Google Patents

一种终端设备的故障预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN118013409A
CN118013409A CN202410137445.8A CN202410137445A CN118013409A CN 118013409 A CN118013409 A CN 118013409A CN 202410137445 A CN202410137445 A CN 202410137445A CN 118013409 A CN118013409 A CN 118013409A
Authority
CN
China
Prior art keywords
data
fault
target
attribute
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410137445.8A
Other languages
English (en)
Inventor
陈鹏远
秦琨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202410137445.8A priority Critical patent/CN118013409A/zh
Publication of CN118013409A publication Critical patent/CN118013409A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种终端设备的故障预测方法、装置、设备及存储介质,该方法包括:获取待预测设备的采集目标数据,然后将采集目标数据输入到训练好的GBDT模型中,获取待预测终端设备的故障预测信息。其中,目标GBDT模型是基于训练数据训练生成的,该训练数据中包括故障数据,训练数据是基于终端设备的历史目标数据划分得到的。该终端设备可以包括待预测设备的故障数据,也可以包括其他终端设备的故障数据。通过上述方法,可以利用终端设备的历史故障数据,训练GBDT模型,使其具有故障预测的能力,从而可以利用GBDT模型预测终端设备发生故障的信息。以便后续管理人员可以得到故障预测信息后及时进行处理,减少故障的发生。

Description

一种终端设备的故障预测方法、装置、设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种终端设备的故障预测方法、装置、设备及存储介质。
背景技术
随着银行数字化转型与智慧银行的发展,智能终端设备被广泛应用于各银行网点,智能终端设备可以理解为个人业务集中作业系统网点端的业务受理设备,通过硬件设备的集成和软件系统的整合,智能终端设备可以处理绝大部分个人客户的非现金业务的自主办理。
现在银行对于智能终端设备的可靠性能要求越来越高,但是目前设备的故障检测通常在故障发生后,也就是,只有设备出现问题后,才可以检测设备产生的故障类型、故障原因等,无法预测故障发生,从而无法及时采取修复措施,导致故障发生产生较大的损失。
发明内容
有鉴于此,本申请提供了一种终端设备的故障预测方法、装置、设备及存储介质,从而可以实现对终端设备的故障预测,以便提前采取措施减少故障的发生。
第一方面,本申请提供了一种终端设备的故障预测方法,所述方法包括:
获取待预测设备的采集目标数据;
将所述采集目标数据输入到训练好的目标梯度提升决策树GBDT模型,获取所述待预测设备的故障预测信息;
其中,所述目标GBDT模型是基于训练数据训练生成的,所述训练数据包括故障数据,所述训练数据是基于终端设备的历史目标数据划分得到的。
在一种可能的实现方式中,所述目标GBDT模型的训练过程包括:
将所述训练数据输入到初始决策树,获取预测结果;
确定所述预测结果与所述训练数据中样本真值的残差;
拟合所述残差确定新的决策树,重复执行上述过程,直至残差小于预设值。
在一种可能的实现方式中,所述历史目标数据包括k个互斥子集,其中,(k-1)个子集作为训练数据,另一个子集作为测试数据,所述目标GBDT模型是基于k折交叉验证算法训练得到的。
在一种可能的实现方式中,所述历史目标数据的获取过程包括:
获取所述终端设备的第一属性数据、第一动态数据以及第一故障数据;
对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取所述历史目标数据。
在一种可能的实现方式中,所述对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取所述历史目标数据,包括:
对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取第二属性数据、第二动态数据以及第二故障数据;
对所述第二属性数据进行聚类处理,获取分类后的第三属性数据;
基于所述第三属性数据、所述第二动态数据以及所述第二故障数据,确定所述历史目标数据。
在一种可能的实现方式中,所述基于所述第三属性数据、所述第二动态数据以及所述第二故障数据,确定所述历史目标数据,包括:
将所述第三属性数据、所述第二动态数据以及所述第二故障数据按照预设时间段进行划分,确定所述历史目标数据。
在一种可能的实现方式中,所述对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取第二属性数据、第二动态数据以及第二故障数据,包括以下中的一种或多种:
获取所述第一属性数据、所述第一动态数据以及所述第一故障数据中的空值和/或异常值;删除所述空值和/或异常值,获取所述第二属性数据、所述第二动态数据以及所述第二故障数据;或者,
获取所述第一属性数据、所述第一动态数据以及所述第一故障数据中的空值和/或异常值;删除所述空值和/或异常值,获取第三属性数据、第三动态数据以及第三故障数据;对所述第三属性数据、所述第三动态数据以及所述第三故障数据进行特征编码,获取所述第二属性数据、所述第二动态数据以及所述第二故障数据。
在一种可能的实现方式中,所述方法还包括:
基于所述故障预测信息生成告警信息;
基于所述告警信息进行告警。
第二方面,本申请提供了一种终端设备的故障预测装置,所述装置包括:
获取单元,用于获取待预测设备的采集目标数据;
故障预测单元,用于将所述采集目标数据输入到训练好的目标梯度提升决策树GBDT模型,获取所述待预测设备的故障预测信息;
其中,所述目标GBDT模型是基于所述历史目标数据划分得到的训练数据训练生成的,所述训练数据包括故障数据,所述训练数据是基于终端设备的历史目标数据划分得到的。
在一种可能的实现方式中,所述目标GBDT模型的训练过程包括:将所述训练数据输入到初始决策树,获取预测结果;确定所述预测结果与所述训练数据中样本真值的残差;拟合所述残差确定新的决策树,重复执行上述过程,直至残差小于预设值。
在一种可能的实现方式中,所述历史目标数据包括k个互斥子集,其中,(k-1)个子集作为训练数据,另一个子集作为测试数据,所述目标GBDT模型是基于k折交叉验证算法训练得到的。
在一种可能的实现方式中,所述获取单元,还用于获取所述终端设备的第一属性数据、第一动态数据以及第一故障数据;对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取所述历史目标数据。
在一种可能的实现方式中,所述获取单元,具体用于对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取第二属性数据、第二动态数据以及第二故障数据;对所述第二属性数据进行聚类处理,获取分类后的第三属性数据;基于所述第三属性数据、所述第二动态数据以及所述第二故障数据,确定所述历史目标数据。
在一种可能的实现方式中,所述获取单元,具体用于将所述第三属性数据、所述第二动态数据以及所述第二故障数据按照预设时间段进行划分,确定所述历史目标数据。
在一种可能的实现方式中,所述获取单元,具体用于获取所述第一属性数据、所述第一动态数据以及所述第一故障数据中的空值和/或异常值;删除所述空值和/或异常值,获取所述第二属性数据、所述第二动态数据以及所述第二故障数据;或者,获取所述第一属性数据、所述第一动态数据以及所述第一故障数据中的空值和/或异常值;删除所述空值和/或异常值,获取第三属性数据、第三动态数据以及第三故障数据;对所述第三属性数据、所述第三动态数据以及所述第三故障数据进行特征编码,获取所述第二属性数据、所述第二动态数据以及所述第二故障数据。
在一种可能的实现方式中,所述装置还包括:告警单元,用于基于所述故障预测信息生成告警信息;基于所述告警信息进行告警。
第三方面,本申请提供了一种终端设备的故障预测设备,所述设备包括:存储器以及处理器;
所述存储器用于存储相关的程序代码;
所述处理器用于调用所述程序代码,执行上述第一方面任意一种实现方式所述的终端设备的故障预测方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述第一方面任意一种实现方式所述的终端设备的故障预测方法。
由此可见,本申请具有如下有益效果:
在本申请的上述实现方式中,为了可以预测终端设备发生故障的信息,可以利用终端设备的历史发生故障的相关数据,训练梯度提升决策树(Gradient BoostingDecision Tree,GBDT)模型,使得GBDT模型具有预测故障的能力。具体实现时,可以获取待预测设备的采集目标数据,然后将采集目标数据输入到训练好的GBDT模型中,获取待预测终端设备的故障预测信息。其中,目标GBDT模型是基于训练数据训练生成的,该训练数据中包括故障数据,训练数据是基于终端设备的历史目标数据划分得到的。其中,历史目标数据包括历史发生的故障数据。该终端设备可以包括待预测设备的故障数据,也可以包括其他终端设备的故障数据。通过本申请所提供的终端设备的故障预测方法,可以利用终端设备的历史故障数据,训练GBDT模型,使其具有故障预测的能力,从而可以利用GBDT模型预测终端设备发生故障的信息。以便后续管理人员可以得到故障预测信息后及时进行处理,减少故障的发生。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见,下面描述中的附图仅仅是本申请中提供的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种终端设备的故障预测方法的流程图;
图2为本申请实施例提供的一种终端设备的故障预测装置的示意图;
图3为本申请实施例提供的一种终端设备的故障预测设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,所描述的实施例仅为本申请示例性的实施方式,并非全部实现方式。本领域技术人员可以结合本申请的实施例,在不进行创造性劳动的情况下,获得其他的实施例,而这些实施例也在本申请的保护范围之内。
随着银行数字化转型与智慧银行的发展,智能终端设备被广泛应用于各银行网点,智能终端设备可以理解为个人业务集中作业系统网点端的业务受理设备,通过硬件设备的集成和软件系统的整合,智能终端设备可以处理绝大部分个人客户的非现金业务的自主办理。例如,可以办理个人开卡、电子银行签约、账户挂失、密码重置、理财签约购买等业务,能有效解决银行人工柜台服务填单多、流程繁琐等问题,提高用户办理业务的效率。
现在银行对于智能终端设备的可靠性能要求越来越高,但是目前设备的故障检测通常在故障发生后,也就是,只有设备出现问题后,才可以检测设备产生的故障类型、故障原因等,无法预测故障发生,从而无法及时采取修复措施,导致故障发生产生较大的损失。
基于此,本申请实施例提供了一种终端设备的故障预测方法,从而可以实现对终端设备的故障预测,以便提前采取措施减少故障的发生。具体实现时,可以获取待预测设备的采集目标数据,然后将采集目标数据输入到训练好的GBDT模型中,获取待预测终端设备的故障预测信息。其中,目标GBDT模型是基于训练数据训练生成的,该训练数据中包括故障数据,训练数据是基于终端设备的历史目标数据划分得到的。其中,历史目标数据包括历史发生的故障数据。该终端设备可以包括待预测设备的故障数据,也可以包括其他终端设备的故障数据。通过本申请所提供的终端设备的故障预测方法,可以利用终端设备的历史故障数据,训练GBDT模型,使其具有故障预测的能力,从而可以利用GBDT模型预测终端设备发生故障的信息。以便后续管理人员可以得到故障预测信息后及时进行处理,减少故障的发生。
为了便于理解本申请实施例所提供的方法,下面将结合说明书中的附图进行具体介绍。
参见图1,图1为本申请实施例提供的一种终端设备的故障预测方法的流程图。
该方法可以由数据处理设备执行。其中,该数据处理设备可以为电子设备,也可以为其他设备。
该方法可以包括以下步骤:
S101:获取待预测设备的采集目标数据;
该采集目标数据中可以包括采集待预测设备的属性数据和动态数据。其中,属性数据可以表示用于区分不同设备的属性的数据。例如,可以为设备型号、归属厂商、设备服务版本号、设备硬件模块服务版本号等。动态数据可以表示待预测设备运行中所采集的数据。例如,可以为设备中各个硬件模块的温度、响应耗时等。
S102:将采集目标数据输入到训练好的目标GBDT模型,获取待预测终端设备的故障预测信息。
其中,目标GBDT模型是基于训练数据训练生成的,该训练数据中包括故障数据,所以可以通过包括故障数据的训练数据训练GBDT模型,使其具有故障预测的能力。训练数据是基于终端设备的历史目标数据划分得到的,也就是,历史目标数据中也包括故障数据。例如,该历史故障数据可以包括发生故障的模块、故障类型、故障次数等等。并且,该终端设备可以包括待预测设备的历史故障数据,也可以包括其他终端设备的历史故障数据。
可选地,该历史目标数据可以为针对终端设备中硬件模块的数据,也就是,可以采集终端设备各个硬件模块的历史数据,该历史数据包括故障数据等,从而后续可以预测待预测设备中可能发生故障的硬件模块的故障信息。
需要说明的是,训练GBDT模型的设备与数据处理设备可以为同一个设备,也可以为不同的设备。当训练GBDT模型的设备与数据处理设备为相同的设备时,数据处理设备可以预先根据训练数据训练GBDT模型,然后存储训练好的目标GBDT模型,以便后续在进行故障预测时,可以调用目标GBDT模型进行数据处理。当训练GBDT模型的设备与数据处理设备为不同的设备时,训练GBDT模型的设备可以利用训练数据训练GBDT模型,得到训练好的目标GBDT模型。数据处理设备可以获取训练设备训练得到的目标GBDT模型,以便对待预测设备进行故障预测。
在一种可能的实现方式中,当基于目标GBDT模型生成待预测设备的故障预测信息后,还可以基于故障预测信息生成告警信息,并基于告警信息进行告警。其中,该故障预测信息(告警信息)中可以包括故障模块、故障类型等。可以将告警信息通过短信或者邮件的发送给管理人员,以便管理人员根据告警信息对待预测设备进行及时处理,预防故障的发生。
为了便于更清楚地理解本申请实施例的技术方案,下面对目标GBDT模型的训练过程进行介绍。
为了训练目标GBDT模型,首先需要获取训练数据,训练数据是基于终端设备的历史目标数据划分得到的,在一种可能的实现方式中,历史目标数据可以通过以下方式确定,获取终端设备的第一属性数据、第一动态数据以及第一故障数据。其中,第一属性数据可以表示用于区分不同设备的属性的数据,例如,可以为设备型号、归属厂商、设备服务版本号、设备硬件模块服务版本号等。第一动态数据可以表示设备运行中所采集的数据,例如,可以为设备中各个硬件模块的温度、响应耗时。第一故障数据可以为设备中硬件模块发生故障时相关的数据,例如,可以表示为故障率。对第一属性数据、第一动态数据以及第一故障数据进行预处理,获取历史目标数据。
可选地,为了便于数据的处理,可以将采集的第一属性数据、第一动态数据以及第一故障数据按照采集的时间进行排序,组成序列的形式。例如,历史目标数据可以表示为以下形式:
其中,采集终端设备的数据的时间可以表示为t0,t1...tn,SOwt0表示在t0时间采集的终端设备的第w个属性数据,即第一属性数据包括w个数据,则在时间点t0采集到的终端设备的第一属性数据可以表示为SO1t0,SO2t0,SO3t0...SOwt0。DOvt0表示在t0时间采集的终端设备的第v个动态数据,即第一动态数据包括v个数据,则在时间点t0采集到的终端设备的第一动态数据可以表示为DO1t0,DO2t0,DO3t0...DOvt0,时间点t0时终端设备对应的故障率为Rt0。则历史目标数据可以表示为OT的矩阵形式。
由于采集设备的原始数据时,可能存在一些空值或者异常值,所以可以对采集的第一属性数据、第一动态数据以及第一故障数据进行数据清洗,即预处理操作。在一种可能的实现方式中,可以获取第一属性数据、第一动态数据以及第一故障数据中的空值和/或异常值,通过删除空值和/或异常值实现预处理,从而获取经过预处理的第二属性数据、第二动态数据以及第二故障数据。
可选地,删除空值和/或异常值后,历史目标数据可以表示为以下形式:
也就是,在时间点t k+1采集的第一属性数据、第一动态数据或者第一故障数据中存在空值或者异常值时,可以将该时间点采集的所有数据进行删除处理。
在一种可能的实现方式中,由于第一属性数据或者第一动态数据中有些数据不是数值类型,为了数据的统一处理,可以对删除空值和/或异常值后的采集数据进行特征编码。具体地,获取第一属性数据、第一动态数据以及第一故障数据中的空值和/或异常值,并删除空值和/或异常值,获取第三属性数据、第三动态数据以及第三故障数据。对第三属性数据、第三动态数据以及第三故障数据进行特征编码,获取第二属性数据、第二动态数据以及第二故障数据。
可选地,可以利用独热编码对数据进行特征编码。其中,独热编码即One-Hot编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。通过特征编码后得到了数值型数据,进一步地,还可以采用归一化方法对进行特征编码的数据进行处理,使得特征编码后的数据均处于[0,1]区间,便于对模型的训练,提高数据的处理速度。
根据上述实施例可知,所采集的终端设备的数据可以包括多个终端设备,在一种可能的实现方式中,还可以对多个终端设备进行聚类处理,以便可以根据终端设备的类型进行更准确地故障预测。具体实现时,当对第一属性数据、第一动态数据以及第一故障数据进行预处理后,获取第二属性数据、第二动态数据以及第二故障数据。对第二属性数据进行聚类处理,获取分类后的第三属性数据,从而基于第三属性数据、第二动态数据以及第二故障数据,确定历史目标数据。
由于第二属性数据可以用于区分不同终端设备的属性,所以可以基于第二属性数据进行聚类处理,获取分类后的第三属性数据。其中,可以利用K均值聚类算法对第二属性数据进行聚类处理,得到分为多个类别的第三属性数据。然后针对每个类别所包括的属性数据以及该属性数据所对应的动态数据和故障数据,组成该类别所包括的数据。
k均值聚类算法是一种迭代求解的聚类算法,可以随机选取K个样本作为初始的聚类中心。在本实施例中,可以随机选取k个设备对应的属性数据作为样本。然后计算每个样本与各个种子聚类中心之间的距离,把每个样本分配给距离它最近的聚类中心。聚类中心以及分配给它们的样本则代表一个聚类。当全部样本均被分配后,每个聚类的聚类中心会根据聚类中现有的样本重新计算。这个过程将不断重复,直到满足某个终止条件。例如,终止条件可以是没有样本被重新分配给不同的聚类,或者聚类中心不再发生变化等。
在一种可能的实现方式中,当采集数据的时间点较多时,虽然可以采集比较丰富的样本数据,但是由于对数据时间特征划分的粒度较小,可能丢失数据的某些特征信息,并且在模型训练时容易产生过拟合的问题。因此,可以在获取聚类后的第三属性数据后,可以对第三属性数据、第二动态数据以及第二故障数据按照预设时间段进行划分,确定历史目标数据。其中,该预设时间段可以包括多个采集数据的时间点。也就是,将在预设时间段的多个时间点对应的数据进行汇总处理。
例如,可以选取预设时间段step,即间隔step内的采集时间点划分为同一时间段,则可以将不同的采集时间点{t0,t1,t2...tn}划分为多个采集时间段,即{0,step,2step,3step...24-step,24},则历史目标数据可以表示为多个采集时间段所对应的数据。
可选地,由于聚类处理是基于终端设备的第二属性数据处理的,因此在得到聚类后的第三属性数据后,为了减少数据的处理量,可以删除第三属性数据中保持不变的属性数据。例如,可以删除终端设备的型号、归属厂商等数据。
当得到历史目标数据后,可以对历史目标数据进行划分,得到训练GBDT模型的训练数据。在一种可能的实现方式中,可以将历史目标数据随机划分为预设个数的互斥子集,然后选取其中多个互斥子集作为训练数据。
其中,GBDT模型是一种迭代的决策树算法,基本原理是通过构建一系列的弱学习器,即决策树,并对它们的预测结果进行累加,从而获得最终的预测输出。在训练过程中,每次增加的决策树均以上一课决策树的预测结果与样本真实值的残差作为拟合目标,逐步减小之前决策树预测的残差,直至新的决策树预测的残差小于预设值或者为0,从而停止迭代过程,将各个决策树进行累加即得到训练好的目标GBDT模型。
具体实现时,将训练数据输入到初始决策树,获取初始决策树的预测结果。确定该预测结果与训练数据中样本真值的残差。可选地,训练数据中可以包括多个样本,样本可以表示为每个聚类所对应的历史目标数据。样本中可以包括输入数据,即属性数据和动态数据,也包括样本真值,即故障率。也就是,将输入数据输入到决策树中,获取预测结果。基于预测结果和样本真值的残差作为拟合目标,学习新的决策树。
可选地,该残差可以基于预测结果与样本真值的损失函数所确定。例如,可以计算预测结果与样本真值的均方误差作为损失函数,然后计算该均方误差的负梯度作为残差。
每次迭代时,通过拟合上一课决策树的残差构建新的决策树,重复执行上述过程,直至残差小于预设值。其中,该预设值的大小可以结合实际需求场景进行设置,本申请实施例对此不做限定。
在一种可能的实现方式中,在对历史目标数据进行划分得到训练数据时,可以将历史目标数据划分为训练数据和测试数据,且训练数据和测试数据为互斥的集合。当利用训练数据训练得到目标GBDT模型后,还可以利用测试数据对目标GBDT模型进行验证。例如,将测试数据输入到目标GBDT模型后,获取测试数据的预测结果。当该预测结果与测试数据中的样本真值的误差小于阈值时,表明训练得到的目标GBDT模型的准确性满足要求。否则,继续对目标GBDT模型进行训练,以及利用测试数据进行验证,直至训练得到的GBDT模型满足要求。
在一种可能的实现方式中,可以利用k折交叉验证算法对GBDT模型进行训练。其中,GBDT模型可以包括多组可调节的参数,通过针对不同组可调节的参数进行训练,得到准确性最高的目标GBDT模型。
具体实现时,可以将历史目标数据随机划分为k组数据,其中,针对每次训练过程,选择其中一组作为测试数据,其余(k-1)组作为训练数据,根据训练数据训练GBDT模型,得到候选GBDT模型。然后利用测试数据测试候选GBDT模型的预测结果与样本真值之间的误差。下一次训练过程,选择不同的一组作为测试数据,剩余(k-1)组作为训练数据,直至执行完k次训练过程,可以得到k个候选GBDT模型以及k个误差,可以计算k个误差的平均值,作为GBDT模型在当前可调节参数下对应的模型评价指标。针对每组可调节参数下的GBDT模型均执行上述过程,可以将模型评价指标的最小值(即误差最小值)所对应的可调节参数作为目标参数。然后可以将目标参数作为GBDT模型的参数,利用k组数据作为训练数据,重新训练GBDT模型,以得到目标GBDT模型。
通过本申请实施例所提供的终端设备的故障预测方法,可以利用终端设备的历史故障数据,训练GBDT模型,使其具有故障预测的能力,从而可以利用GBDT模型预测终端设备的故障信息。以便后续管理人员可以得到故障预测信息后及时进行处理,减少故障的发生。
基于上述方法实施例,本申请实施例还提供一种终端设备的故障预测装置。
参见图2所示,为本申请实施例提供的一种终端设备的故障预测装置的示意图。
该装置200可以包括:
获取单元201,用于获取待预测设备的采集目标数据;
故障预测单元202,用于将所述采集目标数据输入到训练好的目标梯度提升决策树GBDT模型,获取所述待预测设备的故障预测信息;
其中,所述目标GBDT模型是基于所述历史目标数据划分得到的训练数据训练生成的,所述训练数据包括故障数据,所述训练数据是基于终端设备的历史目标数据划分得到的。
在一种可能的实现方式中,所述目标GBDT模型的训练过程包括:将所述训练数据输入到初始决策树,获取预测结果;确定所述预测结果与所述训练数据中样本真值的残差;拟合所述残差确定新的决策树,重复执行上述过程,直至残差小于预设值。
在一种可能的实现方式中,所述历史目标数据包括k个互斥子集,其中,(k-1)个子集作为训练数据,另一个子集作为测试数据,所述目标GBDT模型是基于k折交叉验证算法训练得到的。
在一种可能的实现方式中,所述获取单元201,还用于获取所述终端设备的第一属性数据、第一动态数据以及第一故障数据;对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取所述历史目标数据。
在一种可能的实现方式中,所述获取单元201,具体用于对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取第二属性数据、第二动态数据以及第二故障数据;对所述第二属性数据进行聚类处理,获取分类后的第三属性数据;基于所述第三属性数据、所述第二动态数据以及所述第二故障数据,确定所述历史目标数据。
在一种可能的实现方式中,所述获取单元201,具体用于将所述第三属性数据、所述第二动态数据以及所述第二故障数据按照预设时间段进行划分,确定所述历史目标数据。
在一种可能的实现方式中,所述获取单元201,具体用于获取所述第一属性数据、所述第一动态数据以及所述第一故障数据中的空值和/或异常值;删除所述空值和/或异常值,获取所述第二属性数据、所述第二动态数据以及所述第二故障数据;或者,获取所述第一属性数据、所述第一动态数据以及所述第一故障数据中的空值和/或异常值;删除所述空值和/或异常值,获取第三属性数据、第三动态数据以及第三故障数据;对所述第三属性数据、所述第三动态数据以及所述第三故障数据进行特征编码,获取所述第二属性数据、所述第二动态数据以及所述第二故障数据。
在一种可能的实现方式中,所述装置还包括:告警单元,用于基于所述故障预测信息生成告警信息;基于所述告警信息进行告警。
基于上述方法实施例和装置实施例,本申请实施例还提供一种终端设备的故障预测设备。下面将结合附图进行介绍。
参见图3,图3为本申请实施例提供的一种终端设备的故障预测设备的示意图。
该设备300包括:存储器301以及处理器302;
所述存储器301用于存储相关的程序代码;
所述处理器302用于调用所述程序代码,执行上述方法实施例所述的—方法。
此外,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方法实施例所述的终端设备的故障预测方法。
需要说明的是,本申请实施例中所提供的上位手段中的技术特征对于本领域技术人员来说是清楚的,上位手段要解决的问题也是清楚的,如何获得相应特征的手段,可以由本领域技术人员根据具体实现需求进行选择,本申请提供的手段不应视为对方案的限制或者是作为唯一实现手段。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。尤其,对于系统或装置实施例而言,由于其基本类似于方法实施例,所以描述得比较简单,相关部分参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元或模块可以是或者也可以不是物理上分开的,作为单元或模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上,可以根据实际需要选择其中的部分或者全部单元或模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
附图中的流程图和框图,图示了按照本申请各种实施例的方法、装置和设备等可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本申请中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本申请中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本申请中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本申请所示的这些实施例,而是要符合与本申请所公开的原理和新颖特点相一致的最宽的范围。

Claims (11)

1.一种终端设备的故障预测方法,其特征在于,所述方法包括:
获取待预测设备的采集目标数据;
将所述采集目标数据输入到训练好的目标梯度提升决策树GBDT模型,获取所述待预测设备的故障预测信息;
其中,所述目标GBDT模型是基于训练数据训练生成的,所述训练数据包括故障数据,所述训练数据是基于终端设备的历史目标数据划分得到的。
2.根据权利要求1所述的方法,其特征在于,所述目标GBDT模型的训练过程包括:
将所述训练数据输入到初始决策树,获取预测结果;
确定所述预测结果与所述训练数据中样本真值的残差;
拟合所述残差确定新的决策树,重复执行上述过程,直至残差小于预设值。
3.根据权利要求1所述的方法,其特征在于,所述历史目标数据包括k个互斥子集,其中,(k-1)个子集作为训练数据,另一个子集作为测试数据,所述目标GBDT模型是基于k折交叉验证算法训练得到的。
4.根据权利要求1所述的方法,其特征在于,所述历史目标数据的获取过程包括:
获取所述终端设备的第一属性数据、第一动态数据以及第一故障数据;
对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取所述历史目标数据。
5.根据权利要求4所述的方法,其特征在于,所述对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取所述历史目标数据,包括:
对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取第二属性数据、第二动态数据以及第二故障数据;
对所述第二属性数据进行聚类处理,获取分类后的第三属性数据;
基于所述第三属性数据、所述第二动态数据以及所述第二故障数据,确定所述历史目标数据。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第三属性数据、所述第二动态数据以及所述第二故障数据,确定所述历史目标数据,包括:
将所述第三属性数据、所述第二动态数据以及所述第二故障数据按照预设时间段进行划分,确定所述历史目标数据。
7.根据权利要求5所述的方法,其特征在于,所述对所述第一属性数据、所述第一动态数据以及所述第一故障数据进行预处理,获取第二属性数据、第二动态数据以及第二故障数据,包括以下中的一种或多种:
获取所述第一属性数据、所述第一动态数据以及所述第一故障数据中的空值和/或异常值;删除所述空值和/或异常值,获取所述第二属性数据、所述第二动态数据以及所述第二故障数据;或者,
获取所述第一属性数据、所述第一动态数据以及所述第一故障数据中的空值和/或异常值;删除所述空值和/或异常值,获取第三属性数据、第三动态数据以及第三故障数据;对所述第三属性数据、所述第三动态数据以及所述第三故障数据进行特征编码,获取所述第二属性数据、所述第二动态数据以及所述第二故障数据。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述故障预测信息生成告警信息;
基于所述告警信息进行告警。
9.一种终端设备的故障预测装置,其特征在于,所述装置包括:
获取单元,用于获取待预测设备的采集目标数据;
故障预测单元,用于将所述采集目标数据输入到训练好的目标梯度提升决策树GBDT模型,获取所述待预测设备的故障预测信息;
其中,所述目标GBDT模型是基于所述历史目标数据划分得到的训练数据训练生成的,所述训练数据包括故障数据,所述训练数据是基于终端设备的历史目标数据划分得到的。
10.一种终端设备的故障预测设备,其特征在于,所述设备包括:存储器以及处理器;
所述存储器用于存储相关的程序代码;
所述处理器用于调用所述程序代码,执行权利要求1至8任一项所述的设备的故障预测方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求1至8任一项所述的设备的故障预测方法。
CN202410137445.8A 2024-01-31 2024-01-31 一种终端设备的故障预测方法、装置、设备及存储介质 Pending CN118013409A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410137445.8A CN118013409A (zh) 2024-01-31 2024-01-31 一种终端设备的故障预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410137445.8A CN118013409A (zh) 2024-01-31 2024-01-31 一种终端设备的故障预测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN118013409A true CN118013409A (zh) 2024-05-10

Family

ID=90955554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410137445.8A Pending CN118013409A (zh) 2024-01-31 2024-01-31 一种终端设备的故障预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN118013409A (zh)

Similar Documents

Publication Publication Date Title
CN111176953B (zh) 一种异常检测及其模型训练方法、计算机设备和存储介质
CN111783875A (zh) 基于聚类分析的异常用户检测方法、装置、设备及介质
CN110471821B (zh) 异常变更检测方法、服务器及计算机可读存储介质
CN114297036A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN111652280A (zh) 基于行为的目标物数据分析方法、装置及存储介质
CN111160329A (zh) 一种根因分析的方法及装置
CN114266289A (zh) 一种复杂装备健康状态评估方法
CN115687038B (zh) 一种基于大数据的硬盘故障预测系统及方法
CN113986595A (zh) 一种异常定位方法及装置
CN118069380B (zh) 一种算力资源处理方法
CN112905125A (zh) 一种基于计算机高精度计算的数据存储及读取方法
CN112836750A (zh) 一种系统资源分配方法、装置及设备
CN109801073B (zh) 风险用户识别方法、装置、计算机设备及存储介质
CN117371861B (zh) 基于数字化的家政服务质量智能分析方法及系统
CN113672871A (zh) 一种高比例缺失数据填补方法及相关装置
CN115858606A (zh) 时序数据的异常检测方法、装置、设备及存储介质
CN112949697A (zh) 一种管道异常的确认方法、装置及计算机可读存储介质
CN110874601B (zh) 识别设备运行状态的方法、状态识别模型训练方法及装置
CN116539994A (zh) 基于多源时间序列数据的变电站主设备运行状态检测方法
CN111325255A (zh) 特定人群圈定方法、装置、电子设备及存储介质
CN118013409A (zh) 一种终端设备的故障预测方法、装置、设备及存储介质
CN116149895A (zh) 大数据集群性能预测方法、装置和计算机设备
CN110389875A (zh) 用于监控计算机系统运行状态的方法、装置和存储介质
CN111654853B (zh) 一种基于用户信息的数据分析方法
CN114862618A (zh) 基于人工智能的城市用水量预测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination