CN107450524A - 预测工业设备故障的方法、装置及计算机可读存储介质 - Google Patents
预测工业设备故障的方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN107450524A CN107450524A CN201710764313.8A CN201710764313A CN107450524A CN 107450524 A CN107450524 A CN 107450524A CN 201710764313 A CN201710764313 A CN 201710764313A CN 107450524 A CN107450524 A CN 107450524A
- Authority
- CN
- China
- Prior art keywords
- feature
- sample
- industrial equipment
- training set
- decision tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0208—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the configuration of the monitoring system
- G05B23/0213—Modular or universal configuration of the monitoring system, e.g. monitoring system having modules that may be combined to build monitoring program; monitoring system that can be applied to legacy systems; adaptable monitoring system; using different communication protocols
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/20—Pc systems
- G05B2219/24—Pc safety
- G05B2219/24065—Real time diagnostics
Abstract
本发明涉及物联网领域,提供一种预测工业设备故障的方法、装置、计算机可读存储介质和终端设备,以较为准确地预测工业设备故障,从而高效、低成本地处理这些故障。所述方法包括:基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征;根据N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树;根据H个决策树,对工业设备进行故障预测。根据这些N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树以及据此对工业设备进行故障预测时,不仅对工业设备的故障预测准确,而且能够显著提高排除故障的效率。
Description
技术领域
本发明属于物联网领域,尤其涉及一种预测工业设备故障的方法、装置及计算机可读存储介质。
背景技术
随着工业互联网的普及,工业设备尤其是现代工业设备,譬如锅炉、压缩机、发电机组、热泵、变频器、充电桩、水处理设备、充电桩、新能源汽车等以及其外接和各种各样的装置、传感器或者零部件,越来越多的设备运行数据和设备参数会实时上报至云服务器,因而可以对数量庞大的工业设备进行实时、在线地监控,并且在发生异常或者危险时及时告警,后台也可以针对大量的历史数据进行统计和分析。然而,如何才能根据这些庞大的数据量,对每个工业设备的下一步运行状态、下一步需要给它发送什么样的执行指令或者未来可能会发生的故障进行预测,这是业界普遍关注的问题。
目前,工业设备发生故障时的常见处理方法是实地调试设备,这种方法需要停机甚至检修,损失较大,当然,有些厂家还会根据设备运行数据对设备进行排查,如此,不仅耗费人力,效率也不高。
上述常见的处理方法存在的问题亟待解决。
发明内容
本发明提供一种预测工业设备故障的方法、装置、计算机可读存储介质和终端设备,以较为准确地预测工业设备故障,从而高效、低成本地处理这些故障。
本发明第一方面提供了一种预测工业设备故障的方法,所述方法包括:
基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,所述N为大于或等于1的整数;
根据所述N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树,所述H为大于或等于1的整数;
根据所述H个决策树,对工业设备进行故障预测。
本发明第二方面提供了一种预测工业设备故障的装置,所述装置包括:
获取模块,用于基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,所述N为大于或等于1的整数;
决策树构建模块,用于根据所述N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树,所述H为大于或等于1的整数;
预测模块,用于根据所述H个决策树,对工业设备进行故障预测。
本发明第三方面提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,所述N为大于或等于1的整数;
根据所述N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树,所述H为大于或等于1的整数;
根据所述H个决策树,对工业设备进行故障预测。
结合本发明的第三方面,在所述第三方面的第一种实施方式中,所述基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,包括:
从给定的样本中随机选择N个样本构成训练集;
计算所述训练集对应的特征集中具有最大增益的n个特征作为所述N个样本构成的训练集的特征,所述n为大于或等于1的整数。
结合本发明的第三方面的第一种实施方式,在所述第三方面的第二种实施方式中,所述计算所述训练集对应的特征集中具有最大增益的n个特征作为所述N个样本构成的训练集的特征,包括:
从包含m个特征的所述特征集中随机选择n个特征作为一组,得到n’组且每组包含n个特征的随选特征集;
计算所述每一组随选特征集中各个特征之间的交叉熵;
比较所述交叉熵,将交叉熵最小所对应的一组随选特征集作为所述N个样本构成的训练集的特征。
结合本发明的第三方面的第一种实施方式,在所述第三方面的第三种实施方式中,所述从给定的样本中随机选择N个样本构成训练集,包括:
从给定的M个样本中随机取N个样本进行训练,所述M为大于或等于N的整数;
训练完毕后,将所述随机所取的N个样本重新放回给定的M—N个样本中以恢复成M个样本;
重复上述过程直至训练的结果达到预期。
结合本发明的第三方面、第三方面的第一种实施方式、第三方面的第二种实施方式或第三方面的第三种实施方式,在所述第三方面的第四种实施方式中,所述根据所述H个决策树,对工业设备进行故障预测,包括:
将工业设备的运行状态参数输入所述H个决策树进行决策,分别得到H个决策结果;
对所述H个决策结果进行投票,得到工业设备的故障预测结果。
本发明实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,所述N为大于或等于1的整数;
根据所述N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树,所述H为大于或等于1的整数;
根据所述H个决策树,对工业设备进行故障预测。
结合本发明的第四方面,在所述第四方面的第一种实施方式中,所述基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,包括:
从给定的样本中随机选择N个样本构成训练集;
计算所述训练集对应的特征集中具有最大增益的n个特征作为所述N个样本构成的训练集的特征,所述n为大于或等于1的整数。
结合本发明的第四方面的第一种实施方式,在所述第四方面的第二种实施方式中,所述计算所述训练集对应的特征集中具有最大增益的n个特征作为所述N个样本构成的训练集的特征,包括:
从包含m个特征的所述特征集中随机选择n个特征作为一组,得到n’组且每组包含n个特征的随选特征集;
计算所述每一组随选特征集中各个特征之间的交叉熵;
比较所述交叉熵,将交叉熵最小所对应的一组随选特征集作为所述N个样本构成的训练集的特征。
结合本发明的第四方面的第一种实施方式,在所述第四方面的第三种实施方式中,所述从给定的样本中随机选择N个样本构成训练集,包括:
从给定的M个样本中随机取N个样本进行训练,所述M为大于或等于N的整数;
训练完毕后,将所述随机所取的N个样本重新放回给定的M—N个样本中以恢复成M个样本;
重复上述过程直至训练的结果达到预期。
结合本发明的第四方面、第四方面的第一种实施方式、第四方面的第二种实施方式或第四方面的第三种实施方式,在所述第四方面的第四种实施方式中,所述根据所述H个决策树,对工业设备进行故障预测,包括:
将工业设备的运行状态参数输入所述H个决策树进行决策,分别得到H个决策结果;
对所述H个决策结果进行投票,得到工业设备的故障预测结果。
从上述本发明提供的技术方案可知,由于可以通过基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,使得通过机器学习训练得到的模型能够达到足够的准确率,因此,根据这些N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树以及据此对工业设备进行故障预测时,不仅对工业设备的故障预测准确,而且能够显著提高排除故障的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的预测工业设备故障的方法的实现流程示意图;
图2是本发明实施例提供的预测工业设备故障的装置的结构示意图;
图3是本发明另一实施例提供的预测工业设备故障的装置的结构示意图;
图4是本发明另一实施例提供的预测工业设备故障的装置的结构示意图;
图5是本发明实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
附图1是本发明实施例提供的预测工业设备故障的方法的实现流程示意图,主要包括以下步骤S101至S103,详细说明如下:
S101,基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,其中,N为大于或等于1的整数。
在本发明实施例中,之所以选择随机森林模型,是考虑到这一模型执行简单,不容易过度拟合(overfitting),预测准确率较高,并且能够给出较为重要的特征。当将测试数据集输入到这个模型后,可以得到一个待确定的模型和测试的准确率。若准确率与预期相符,则可以利用这个模型来进行预测,反之,若准确率与预期不符,则可重新选择模型。
作为本发明一个实施例,基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征可通过如下步骤S1011和S1012实现:
S1011,从给定的样本中随机选择N个样本构成训练集。
所谓样本,是用于训练的数据,具体地,在本发明实施例中,可以是工业设备周期性采集其运行状态数据上传到云服务器保存后,从云服务器获取的这些运行状态的历史数据。需要说明的是,样本的数量不宜过少,也不宜过多,可以根据需要选择适量的数据作为样本。
此外,考虑到后续的决策树可能发生过拟合(overfitting),即训练误差(training error)较小和/或泛化误差(generalization error)较大,在本发明实施例中,从给定的样本中随机选择N个样本构成训练集具体可以是:1)从给定的M个样本中随机取N个样本进行训练;2)训练完毕后,将所述随机所取的N个样本重新放回给定的M—N个样本中以恢复成M个样本,重复上述1)和2)的过程,直至训练的结果达到预期,此处,M为大于或等于N的整数,如此,可以有效地去除后续决策树的过拟合。
S1012,计算训练集对应的特征集中具有最大增益的n个特征作为所述N个样本构成的训练集的特征,此处,n为大于或等于1的整数。
作为本发明一个实施例,计算训练集对应的特征集中具有最大增益的n个特征作为N个样本构成的训练集的特征可通过如下步骤S1至S3来实现:
S1,从包含m个特征的特征集中随机选择n个特征作为一组,得到n’组且每组包含n个特征的随选特征集。
在本发明实施例中,n可以是m的平方根的整数部分或者其他大于或等于1的整数。根据组合原理,n’不大于从m中选取n个可构成的组合数,即n’≤Cm n。
S2,计算每一组随选特征集中各个特征之间的交叉熵。
S3,比较每一组随选特征集中各个特征之间的交叉熵,将交叉熵最小所对应的一组随选特征集作为N个样本构成的训练集的特征。
根据交叉熵与增益的关系,各个特征之间的交叉熵越小,其增益越大。在本发明实施例中,选择增益最大即选择每一组随选特征集中各个特征之间的交叉熵中最小交叉熵所对应的一组随选特征集作为N个样本构成的训练集的特征。
S102,根据N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树,其中,H为大于或等于1的整数。
S103,根据经步骤S102构建的H个决策树,对工业设备进行故障预测。
作为本发明一个实施例,根据N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树可通过如下步骤S1031和S1032实现:
S1031,将工业设备的运行状态参数输入H个决策树进行决策,分别得到H个决策结果。
在本发明实施例中,经步骤S102构建的H个决策树之间是相互独立的,将工业设备的运行状态参数输入H个决策树进行决策,可以分别得到H个决策结果,即一个决策树得到一个决策结果。
S1032,对经步骤S1031得到的H个决策结果进行投票,得到工业设备的故障预测结果。
对经步骤S1031得到的H个决策结果进行投票,通常投票机制包括有一票否决制、加权多数和少数服从多数等。作为本发明一个实施例,在对经步骤S1031得到的H个决策结果进行投票时,可选择加权多数的投票机制来进行H个决策结果的投票,从而得到工业设备的故障预测结果。
从上述附图1示例的预测工业设备故障的方法可知,由于可以通过基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,使得通过机器学习训练得到的模型能够达到足够的准确率,因此,根据这些N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树以及据此对工业设备进行故障预测时,不仅对工业设备的故障预测准确,而且能够显著提高排除故障的效率。
附图2是本发明实施例提供的预测工业设备故障的装置的示意图,主要包括获取模块201、决策树构建模块202和预测模块203,详细说明如下:
获取模块201,用于基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,其中,N为大于或等于1的整数;
决策树构建模块202,用于根据N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树,其中,H为大于或等于1的整数;
预测模块203,用于根据决策树构建模块202所构建的H个决策树,对工业设备进行故障预测。
需要说明的是,本发明实施例提供的装置,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
附图2示例的获取模块201可以包括训练集生成单元301和计算单元302,如附图3示例的预测工业设备故障的装置,其中:
训练集生成单元301,用于从给定的样本中随机选择N个样本构成训练集;
计算单元302,用于计算训练集对应的特征集中具有最大增益的n个特征作为所述N个样本构成的训练集的特征,所述n为大于或等于1的整数。
附图3示例的计算单元302可以包括随选特征集选择单元401、交叉熵计算单元402和特征获取单元403,如附图4示例的预测工业设备故障的装置,其中:
随选特征集选择单元401,用于从包含m个特征的所述特征集中随机选择n个特征作为一组,得到n’组且每组包含n个特征的随选特征集;
交叉熵计算单元402,用于计算所述每一组随选特征集中各个特征之间的交叉熵;
特征获取单元403,用于比较所述交叉熵,将交叉熵最小所对应的一组随选特征集作为所述N个样本构成的训练集的特征。
附图3示例的训练集生成单元301可以包括训练单元和重放回单元,其中:
训练单元,用于从给定的M个样本中随机取N个样本进行训练,所述M为大于或等于N的整数;
重放回单元,用于所述训练单元从给定的M个样本中随机取N个样本进行训练完毕后,将所述随机所取的N个样本重新放回给定的M—N个样本中以恢复成M个样本;
上述训练单元和重放回单元重复执行其功能,直至训练的结果达到预期。
上述任一装置的实施例中,预测模块203包括决策单元和投票单元,其中:
决策单元,用于将工业设备的运行状态参数输入H个决策树进行决策,分别得到H个决策结果;
投票单元,用于对决策单元得到的H个决策结果进行投票,得到工业设备的故障预测结果。
图5是本发明一实施例提供的终端设备的结构示意图。如图5所示,该实施例的终端设备5包括:处理器50、存储器51以及存储在存储器51中并可在处理器50上运行的计算机程序52,例如预测工业设备故障的方法的程序。处理器50执行计算机程序52时实现上述预测工业设备故障的方法实施例中的步骤,例如图1所示的步骤S101至S103。或者,处理器50执行计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图2所示获取模块201、决策树构建模块202和预测模块203的功能。
示例性的,预测工业设备故障的方法的计算机程序52主要包括:基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,所述N为大于或等于1的整数;根据所述N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树,所述H为大于或等于1的整数;根据所述H个决策树,对工业设备进行故障预测。计算机程序52可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器51中,并由处理器50执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序52在计算设备5中的执行过程。例如,计算机程序52可以被分割成获取模块201、决策树构建模块202和预测模块203的功能,各模块具体功能如下:获取模块201,用于基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,其中,N为大于或等于1的整数;决策树构建模块202,用于根据N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树,其中,H为大于或等于1的整数;预测模块203,用于根据决策树构建模块202所构建的H个决策树,对工业设备进行故障预测。
终端设备5可包括但不仅限于处理器50、存储器51。本领域技术人员可以理解,图5仅仅是终端设备5的示例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器51可以是终端设备5的内部存储单元,例如终端设备5的硬盘或内存。存储器51也可以是终端设备5的外部存储设备,例如终端设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器51还可以既包括终端设备5的内部存储单元也包括外部存储设备。存储器51用于存储计算机程序以及终端设备所需的其他程序和数据。存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,预测工业设备故障的方法的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤,即,基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,所述N为大于或等于1的整数;根据所述N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树,所述H为大于或等于1的整数;根据所述H个决策树,对工业设备进行故障预测。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种预测工业设备故障的方法,其特征在于,所述方法包括:
基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,所述N为大于或等于1的整数;
根据所述N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树,所述H为大于或等于1的整数;
根据所述H个决策树,对工业设备进行故障预测。
2.如权利要求1所述预测工业设备故障的方法,其特征在于,所述基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,包括:
从给定的样本中随机选择N个样本构成训练集;
计算所述训练集对应的特征集中具有最大增益的n个特征作为所述N个样本构成的训练集的特征,所述n为大于或等于1的整数。
3.如权利要求2所述预测工业设备故障的方法,其特征在于,所述计算所述训练集对应的特征集中具有最大增益的n个特征作为所述N个样本构成的训练集的特征,包括:
从包含m个特征的所述特征集中随机选择n个特征作为一组,得到n’组且每组包含n个特征的随选特征集;
计算所述每一组随选特征集中各个特征之间的交叉熵;
比较所述交叉熵,将交叉熵最小所对应的一组随选特征集作为所述N个样本构成的训练集的特征。
4.如权利要求2所述预测工业设备故障的方法,其特征在于,所述从给定的样本中随机选择N个样本构成训练集,包括:
从给定的M个样本中随机取N个样本进行训练,所述M为大于或等于N的整数;
训练完毕后,将所述随机所取的N个样本重新放回给定的M—N个样本中以恢复成M个样本;
重复上述过程直至训练的结果达到预期。
5.如权利要求1至4任意一项所述预测工业设备故障的方法,其特征在于,所述根据所述H个决策树,对工业设备进行故障预测,包括:
将工业设备的运行状态参数输入所述H个决策树进行决策,分别得到H个决策结果;
对所述H个决策结果进行投票,得到工业设备的故障预测结果。
6.一种预测工业设备故障的装置,其特征在于,所述装置包括:
获取模块,用于基于随机森林模型对给定的样本进行训练,获取N个样本构成的训练集及其特征,所述N为大于或等于1的整数;
决策树构建模块,用于根据所述N个样本构成的训练集及其特征,选择C4.5算法构建H个决策树,所述H为大于或等于1的整数;
预测模块,用于根据所述H个决策树,对工业设备进行故障预测。
7.如权利要求6所述预测工业设备故障的装置,其特征在于,所述获取模块包括:
训练集生成单元,用于从给定的样本中随机选择N个样本构成训练集;
计算单元,用于计算所述训练集对应的特征集中具有最大增益的n个特征作为所述N个样本构成的训练集的特征,所述n为大于或等于1的整数。
8.如权利要求7所述预测工业设备故障的装置,其特征在于,所述计算单元包括:
随选特征集选择单元,用于从包含m个特征的所述特征集中随机选择n个特征作为一组,得到n’组且每组包含n个特征的随选特征集;
交叉熵计算单元,用于计算所述每一组随选特征集中各个特征之间的交叉熵;
特征获取单元,用于比较所述交叉熵,将交叉熵最小所对应的一组随选特征集作为所述N个样本构成的训练集的特征。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710764313.8A CN107450524A (zh) | 2017-08-30 | 2017-08-30 | 预测工业设备故障的方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710764313.8A CN107450524A (zh) | 2017-08-30 | 2017-08-30 | 预测工业设备故障的方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107450524A true CN107450524A (zh) | 2017-12-08 |
Family
ID=60494561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710764313.8A Pending CN107450524A (zh) | 2017-08-30 | 2017-08-30 | 预测工业设备故障的方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107450524A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108305095A (zh) * | 2017-12-22 | 2018-07-20 | 杭州先临三维云打印技术有限公司 | 三维模型打印成本估算方法及装置 |
CN108427854A (zh) * | 2018-03-29 | 2018-08-21 | 深圳市智物联网络有限公司 | 一种数据分析方法及其相关设备 |
CN108446202A (zh) * | 2018-03-07 | 2018-08-24 | 武汉物联远科技有限公司 | 一种机房设备的安全状况的判断方法 |
CN108509727A (zh) * | 2018-03-30 | 2018-09-07 | 深圳市智物联网络有限公司 | 数据建模中的模型选择处理方法及装置 |
CN108693868A (zh) * | 2018-05-25 | 2018-10-23 | 深圳市轱辘车联数据技术有限公司 | 故障预测模型训练的方法、车辆故障预测的方法及装置 |
CN109886328A (zh) * | 2019-02-14 | 2019-06-14 | 国网浙江省电力有限公司电力科学研究院 | 一种电动汽车充电设施故障预测方法与系统 |
CN110196792A (zh) * | 2018-08-07 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 故障预测方法、装置、计算设备及存储介质 |
CN110474786A (zh) * | 2018-05-10 | 2019-11-19 | 上海大唐移动通信设备有限公司 | 基于随机森林分析VoLTE网络故障原因的方法及装置 |
CN110868732A (zh) * | 2018-08-27 | 2020-03-06 | 中国移动通信集团广东有限公司 | VoLTE接通无线失败的问题定位方法、系统和设备 |
CN110912775A (zh) * | 2019-11-26 | 2020-03-24 | 中盈优创资讯科技有限公司 | 物联网企业网络故障的监控方法及装置 |
CN111105063A (zh) * | 2018-10-26 | 2020-05-05 | 北京国双科技有限公司 | 故障预测、模型构建方法、装置、处理器及可读存储介质 |
CN111445034A (zh) * | 2018-12-29 | 2020-07-24 | 深圳市赛特尔信息技术有限公司 | 一种工业设备故障预测的系统及方法 |
CN111624906A (zh) * | 2020-05-11 | 2020-09-04 | 新智数字科技有限公司 | 设备运行状态确定方法、装置、可读介质及电子设备 |
CN112578794A (zh) * | 2020-12-12 | 2021-03-30 | 云南昆船智能装备有限公司 | 基于机器学习的agv故障检测方法、存储介质及系统 |
CN112594107A (zh) * | 2019-09-17 | 2021-04-02 | 通用汽车环球科技运作有限责任公司 | 诊断方法和系统 |
CN112771504A (zh) * | 2018-06-29 | 2021-05-07 | 微软技术许可有限责任公司 | 多因素云服务存储设备错误预测 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103257921A (zh) * | 2013-04-16 | 2013-08-21 | 西安电子科技大学 | 一种基于改进随机森林算法的软件故障预测系统及其方法 |
US20160096272A1 (en) * | 2014-10-02 | 2016-04-07 | Brain Corporation | Apparatus and methods for training of robots |
CN105844300A (zh) * | 2016-03-24 | 2016-08-10 | 河南师范大学 | 一种基于随机森林算法的优化分类方法及装置 |
CN106934368A (zh) * | 2017-03-13 | 2017-07-07 | 长安大学 | 一种基于眼动指标数据的驾驶疲劳检测系统及识别方法 |
-
2017
- 2017-08-30 CN CN201710764313.8A patent/CN107450524A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103257921A (zh) * | 2013-04-16 | 2013-08-21 | 西安电子科技大学 | 一种基于改进随机森林算法的软件故障预测系统及其方法 |
US20160096272A1 (en) * | 2014-10-02 | 2016-04-07 | Brain Corporation | Apparatus and methods for training of robots |
CN105844300A (zh) * | 2016-03-24 | 2016-08-10 | 河南师范大学 | 一种基于随机森林算法的优化分类方法及装置 |
CN106934368A (zh) * | 2017-03-13 | 2017-07-07 | 长安大学 | 一种基于眼动指标数据的驾驶疲劳检测系统及识别方法 |
Non-Patent Citations (2)
Title |
---|
丁文彬: "基于决策树分类的网络异常流检测与过滤", 《全国优秀硕士学位论文全文数据库 信息科技辑》 * |
卢育梓: "基于数据挖掘技术的配电网故障预测研究", 《全国优秀硕士学位论文全文数据库 工程科技II辑》 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108305095A (zh) * | 2017-12-22 | 2018-07-20 | 杭州先临三维云打印技术有限公司 | 三维模型打印成本估算方法及装置 |
CN108446202A (zh) * | 2018-03-07 | 2018-08-24 | 武汉物联远科技有限公司 | 一种机房设备的安全状况的判断方法 |
CN108446202B (zh) * | 2018-03-07 | 2021-03-26 | 武汉物联远科技有限公司 | 一种机房设备的安全状况的判断方法 |
CN108427854B (zh) * | 2018-03-29 | 2022-06-07 | 深圳市智物联网络有限公司 | 一种数据分析方法及其相关设备 |
CN108427854A (zh) * | 2018-03-29 | 2018-08-21 | 深圳市智物联网络有限公司 | 一种数据分析方法及其相关设备 |
CN108509727A (zh) * | 2018-03-30 | 2018-09-07 | 深圳市智物联网络有限公司 | 数据建模中的模型选择处理方法及装置 |
CN108509727B (zh) * | 2018-03-30 | 2022-04-08 | 深圳市智物联网络有限公司 | 数据建模中的模型选择处理方法及装置 |
CN110474786A (zh) * | 2018-05-10 | 2019-11-19 | 上海大唐移动通信设备有限公司 | 基于随机森林分析VoLTE网络故障原因的方法及装置 |
CN110474786B (zh) * | 2018-05-10 | 2022-05-24 | 上海大唐移动通信设备有限公司 | 基于随机森林分析VoLTE网络故障原因的方法及装置 |
CN108693868A (zh) * | 2018-05-25 | 2018-10-23 | 深圳市轱辘车联数据技术有限公司 | 故障预测模型训练的方法、车辆故障预测的方法及装置 |
CN108693868B (zh) * | 2018-05-25 | 2021-06-11 | 深圳市轱辘车联数据技术有限公司 | 故障预测模型训练的方法、车辆故障预测的方法及装置 |
CN112771504A (zh) * | 2018-06-29 | 2021-05-07 | 微软技术许可有限责任公司 | 多因素云服务存储设备错误预测 |
CN110196792A (zh) * | 2018-08-07 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 故障预测方法、装置、计算设备及存储介质 |
CN110196792B (zh) * | 2018-08-07 | 2022-06-14 | 腾讯科技(深圳)有限公司 | 故障预测方法、装置、计算设备及存储介质 |
CN110868732A (zh) * | 2018-08-27 | 2020-03-06 | 中国移动通信集团广东有限公司 | VoLTE接通无线失败的问题定位方法、系统和设备 |
CN111105063A (zh) * | 2018-10-26 | 2020-05-05 | 北京国双科技有限公司 | 故障预测、模型构建方法、装置、处理器及可读存储介质 |
CN111445034A (zh) * | 2018-12-29 | 2020-07-24 | 深圳市赛特尔信息技术有限公司 | 一种工业设备故障预测的系统及方法 |
CN109886328B (zh) * | 2019-02-14 | 2021-07-23 | 国网浙江省电力有限公司电力科学研究院 | 一种电动汽车充电设施故障预测方法与系统 |
CN109886328A (zh) * | 2019-02-14 | 2019-06-14 | 国网浙江省电力有限公司电力科学研究院 | 一种电动汽车充电设施故障预测方法与系统 |
CN112594107A (zh) * | 2019-09-17 | 2021-04-02 | 通用汽车环球科技运作有限责任公司 | 诊断方法和系统 |
CN110912775A (zh) * | 2019-11-26 | 2020-03-24 | 中盈优创资讯科技有限公司 | 物联网企业网络故障的监控方法及装置 |
CN111624906A (zh) * | 2020-05-11 | 2020-09-04 | 新智数字科技有限公司 | 设备运行状态确定方法、装置、可读介质及电子设备 |
CN112578794A (zh) * | 2020-12-12 | 2021-03-30 | 云南昆船智能装备有限公司 | 基于机器学习的agv故障检测方法、存储介质及系统 |
CN112578794B (zh) * | 2020-12-12 | 2023-09-01 | 云南昆船智能装备有限公司 | 基于机器学习的agv故障检测方法、存储介质及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107450524A (zh) | 预测工业设备故障的方法、装置及计算机可读存储介质 | |
Wang et al. | A new chaotic time series hybrid prediction method of wind power based on EEMD-SE and full-parameters continued fraction | |
WO2020077672A1 (zh) | 一种服务质量评估模型的训练方法及装置 | |
CN106649840A (zh) | 一种适用于电力数据质量评估与规则校验的方法 | |
US20140207415A1 (en) | Performance evaluation system and method therefor | |
CN106598791A (zh) | 一种基于机器学习的工业设备故障预防性识别方法 | |
CN109501834A (zh) | 一种道岔转辙机故障预测方法及装置 | |
CN114118156B (zh) | 设备故障诊断方法、装置、电子设备及存储介质 | |
CN107679089A (zh) | 一种用于电力传感数据的清洗方法、装置和系统 | |
CN108090606A (zh) | 设备故障发现方法及系统 | |
CN107526007A (zh) | 故障类型的识别方法及装置 | |
CN113486585A (zh) | 设备剩余使用寿命预测方法、装置、电子设备及存储介质 | |
CN110532314A (zh) | 高压电器质量检测的方法及终端设备 | |
CN113313280A (zh) | 云平台的巡检方法、电子设备及非易失性存储介质 | |
CN115221982A (zh) | 牵引供电运维方法、装置、终端及存储介质 | |
CN115576293A (zh) | 基于数据监控的压敏胶在线生产分析方法及系统 | |
Berghout et al. | EL-NAHL: Exploring labels autoencoding in augmented hidden layers of feedforward neural networks for cybersecurity in smart grids | |
Keshavarz et al. | Efficient upper and lower bounding methods for flowshop sequence-dependent group scheduling problems | |
CN109359034A (zh) | 一种业务系统测试方法、计算机可读存储介质及终端设备 | |
CN116435995A (zh) | 时间序列的处理方法、计算机可读存储介质和电子设备 | |
CN113540526B (zh) | 一种基于历史数据分析的燃料电池故障诊断方法及系统 | |
Grebenyuk et al. | Technological infrastructure management models and methods based on digital twins | |
CN115860278A (zh) | 一种基于数据分析的电机组装生产管理方法及系统 | |
CN113486586B (zh) | 设备健康状态评估方法、装置、计算机设备及存储介质 | |
Tong et al. | A prediction model for complex equipment remaining useful life using gated recurrent unit complex networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |