CN111008732B

CN111008732B - 一种基于堆栈模型的故障预测方法及系统

Info

Publication number: CN111008732B
Application number: CN201911147200.9A
Authority: CN
Inventors: 彭涛; 彭霞; 叶城磊; 陶宏伟; 阳春华; 杨超; 陈志文
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2019-11-21
Filing date: 2019-11-21
Publication date: 2023-06-20
Anticipated expiration: 2039-11-21
Also published as: CN111008732A

Abstract

本发明涉及故障预测及健康管理领域，公开了一种基于堆栈模型的故障预测方法及系统，以融合不同预测方法，在处理不同特点的数据时充分发挥各自优点，提高系统预测精度。该方法包括确定堆栈模型的层数，选择每层堆栈模型所用的预测方法；将得到的原始数据集划分为第一层训练数据集和第一层测试数据集；采用K折交叉验证方法将第一层训练数据集分为训练集和验证集并对训练集进行训练以得到第一层堆栈模型；分别用训练学习好的第一层堆栈模型，测试对应验证集及测试集，将得到验证集及测试集的预测值，分别作为下一层的训练数据集和测试数据集；重复上述步骤计算所有层堆栈模型，根据最后一层堆栈模型对测试数据集的预测结果得到最终的预测结果。

Description

一种基于堆栈模型的故障预测方法及系统

技术领域

本发明涉及故障预测及健康管理领域，尤其涉及一种基于堆栈模型的故障预测方法及系统。

背景技术

随着现代科技工业技术尤其是信息技术的迅速发展，在轨道交通、船舶、工业应用等各个领域的工程系统日趋复杂，系统的复杂性、综合化、智能化程度不断提高。伴随着复杂系统的发展其研制、生产尤其是维护和保障的成本越来越高。同时，由于组成环节和影响因素的增加，发生故障和功能失效的几率逐渐加大，因此，系统故障诊断和维护逐渐成为研究者关注的焦点。在实际情况中，存在一类具有退化过程的故障，即，某性能随时间变化而逐渐退化变差，但仍能工作。如何对该类故障进行预测成为一个需要解决的问题。因此，以预测技术为核心的故障预测和健康管理(Prognostics and Health Management,PHM)策略获得越来越多的重视和应用,如何提高预测的效率和精度，降低维修费用，是故障预测和健康管理的要求和目标。

基于数据驱动的故障预测方法通过传感器所获取的历史运行数据，采用数学模型认识或学习被测对象部件/系统的健康/非健康行为，并对未来被测对象部件/系统行为进行预测，它无需建立部件/系统的复杂数学或物理模型而获得广泛的关注和应用。历史运行数据各有特点，如高维、不平衡、非线性、异构等，而不同预测方法对不同特点数据的表达能力存在差异，单一的预测方法难以适应复杂系统复杂数据特点，从而影响故障预测的精度。

因此，现需提供一种能有效融合各种不同预测方法，使其在处理不同特点的数据时充分发挥各自优点，提高预测精度的故障预测方法及系统。

发明内容

本发明针对上述问题提供了一种基于堆栈模型的故障预测方法及系统，以能有效融合不同预测方法，在处理不同特点的数据时充分发挥各自优点，提高系统预测精度。

为实现上述目的，本发明提供了一种基于堆栈模型的故障预测方法，包括以下步骤：

S1:确定堆栈模型的层数，为堆栈模型的每一层设定所用的预测方法；根据待预测对象的历史退化数据集得到原始数据集，将所述原始数据集输入至所述堆栈模型的第一层；

S2:在所述堆栈模型的第一层中，将所述原始数据集划分为第一层训练数据集和第一层测试数据集；采用K折交叉验证方法将第一层训练数据集分为K组不同的训练集和验证集；采用第一层所用的预测方法对K组不同的训练集进行训练，得到第一层堆栈模型；

S3:采用所述第一层堆栈模型测试第一层的验证集，得到验证集预测值；用所述第一层堆栈模型对所述测试数据集进行预测，得到测试数据集预测值；将第一层作为当前层；

S4:根据所述验证集预测值构建当前层的验证集预测值矩阵，将所述验证集预测值矩阵作为当前层的下一层的训练数据集以采用对应层的预测方法训练得到下一层的堆栈模型；并根据所述测试数据集预测值构建当前层的测试数据集预测值矩阵，将所述测试数据集预测值矩阵作为当前层的下一层的测试数据集以对对应层的堆栈模型进行预测；

S5:将所述当前层的下一层作为新的当前层，重复上述S4；直至训练完最后一层的堆栈模型；

S6：采用最后一层的堆栈模型预测的测试数据集作为最终的预测结果。

优选地，所述预测方法包括贝叶斯回归预测方法、随机梯度下降预测方法、核岭回归预测方法、K-近邻预测方法、和高斯过程回归预测方法中的任意一种。

优选地，所述S1具体包括以下步骤：

S11：确定堆栈模型的层数m，为堆栈模型的每一层设定所用的预测方法，第i层堆栈模型选取N_i种预测方法，其中，i＝1,2,…,m；

S12：根据待预测对象的历史退化数据集得到原始数据集D，其维度为L×F，L表示退化数据的组数，F表示待预测对象退化过程中传感器的个数，该L组退化数据的真实退化量为B；

S13：将所述原始数据集D随机划分为第一层训练数据集

和第一层测试数据集

第一层训练数据集/>

的维度和对应退化量标签分别为LA×F和/>

其中LA表示训练数据集/>

的数据组数；第一层测试数据集/>

的维度和对应退化量标签分别为LE×F和/>

其中LE表示测试数据集/>

的数据组数。

优选地，所述S2具体包括以下步骤：

S21：将第一层训练数据集

随机分成K个子集/>

把第一个子集/>

作为第一层训练数据集中第一折的验证集/>

其余K-1个子集作为第一折的训练集/>

用于训练学习第一折预测模型；依次构建所有第k折的验证集/>

和训练集

用于训练学习所有K折预测模型，k＝1，2，...K；

其中，构建的第k折训练集和验证集，用公式表示为：

S22：采用第一种预测方法对第一层、第一折的训练集

进行训练学习，得到预测模型/>

采用第一种预测方法依次对第一层所有第k折的训练集/>

进行训练学习，得到第一层、所有第k折的预测模型/>

采用第n₁种预测方法，依次对第一层所有第k折的训练集

进行训练学习，得到第一层、所有第k折的预测模型/>

采用N₁种预测方法，得到的第一层、K折的预测模型，用矩阵表示为：

式中模型为对K组不同的训练集进行训练学习得到的第一层堆栈模型，式中，维度为N₁×K。

优选地，所述S3具体包括以下步骤：

S31：采用训练好的预测模型

测试对应验证集/>

得到采用第一种预测方法对第一层的第一折验证集的预测值/>

S32：依次采用训练学习好的第一层堆栈模型

测试对应验证集/>

得到采用N₁种预测方法对第一层、所有K折验证集的预测值

S33：将第一层作为当前层i；

优选地，所述S4具体包括以下步骤

S41：采用设定的预测方法将第i层的所有折的预测值

拼接成验证集预测值序列/>

其序列长度为LA，将第i层堆栈模型中所有第n_i种预测方法、所有第k折的预测值/>

拼接成验证集预测值序列

用验证集预测值序列/>

构建第i层验证集预测值矩阵/>

矩阵维度为LA×N₁；

S42：将第i层验证集预测值矩阵作为i+1层训练数据集

S43：用训练学习好的预测模型

对第i层测试数据集/>

进行预测，得到采用第一种预测方法的第i层所有K折预测模型对第i层测试数据集的预测值序列/>

维度为LE×1；将每一折预测模型下测试集的预测值取平均得到采用第一种预测方法对第i层测试数据集的预测值序列/>

维度为LE×1，公式为：

S44：采用训练学习好的预测模型

对第i层测试数据集/>

进行预测，得到采用所有第n_i种预测方法、第i层、所有K折预测模型对第i层测试数据集的预测值序列

维度为LE×1；将每一种预测方法下的测试集的预测值取平均，公式为：

得到采用N_i种预测方法对第i层测试数据集的预测值序列

S45：用所得的第i层测试数据集的预测值序列

构建第i层测试数据集预测值矩阵/>

其维度为LE×N₁；将所得的第i层测试数据集预测值矩阵作为第i+1测试数据集/>

S46：训练学习得到第i+1层的堆栈模型

用矩阵表示为：

式中模型为第i+1层堆栈模型，维度为N_i+1×K，i＝1,2,…,m；n_i＝1,2,…,N_i；k＝1,2,…,K

S47：构建第i+1层的训练数据集

S48：利用堆栈模型(5)构建第i+1层的测试数据集

优选地，所述S5具体包括以下步骤：

S51:将所述当前层的下一层作为新的当前层，重复上述S4，逐次训练各层堆栈模型，构建各层训练数据集和测试数据集；

S52:直至训练完最后一层的堆栈模型

构建最后一层的训练数据集/>

以及测试数据集/>

优选地，所述S6具体包括以下步骤：

S61:用第m层训练数据集所有第n_m种预测方法、所有第k折所构建的第m层堆栈模型

对第m层测试数据集/>

进行预测，得到N_m×K组预测结果/>

S62:对所得的N_m×K组预测结果求平均，公式为：

式中，n_m＝1,2,…,N_m,k＝1,2,…,K，得到最终的预测结果

其维度为LE×1。

作为一个总地发明构思，本发明还提供一种基于堆栈模型的故障预测系统，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

本发明具有以下有益效果：

本发明提供一种基于堆栈模型的故障预测方法及系统，包括：确定堆栈模型的层数，选择每层堆栈模型所用的预测方法；将得到的原始数据集划分为第一层训练数据集和第一层测试数据集；采用K折交叉验证方法将第一层训练数据集分为训练集和验证集并对训练集进行训练以得到第一层堆栈模型；分别用训练学习好的第一层堆栈模型，测试对应验证集及测试集，将得到验证集及测试集的预测值，分别作为下一层的训练数据集和测试数据集；重复上述步骤计算所有层堆栈模型，根据最后一层堆栈模型对测试数据集的预测结果取平均得到最终的预测结果。它通过各层堆栈模型，有效地将不同故障预测方法深度融合，融合不同预测方法后的模型能充分发挥各自方法的优势，适应具有不同特点的数据，提高系统故障预测精度。有效的故障预测可在系统尚未造成重大危害时及时预警，降低维护成本，同时提高系统的稳定性和安全性。

下面将参照附图，对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明的健康、健康退化、故障状态示意图；

图2是本发明优选实施例的基于堆栈模型的故障预测方法流程图；

图3是本发明优选实施例的基于K折交叉验证的训练集和验证集选取方法图；

图4是本发明优选实施例的堆栈模型构建示意图；

图5是本发明优选实施例的基于堆栈模型的功率器件故障预测结果图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明，但是本发明可以由权利要求限定和覆盖的多种不同方式实施。

需要说明的是，本发明方法可以针对一类具有退化过程的故障(某性能随时间变化而逐渐退化变差，但仍能工作)进行预测，如永磁同步电机定子绕组匝间短路故障、永磁体失磁故障；异步电机转子断条故障(未断)、气隙偏心故障；传感器偏差故障、漂移故障等，且不仅限于所列类型故障，但不包括突变故障。

例如，可以将构成电机的整体状态描述为“健康”、“健康退化”和“故障”三种状态。“健康”状态是指电机持续应对所处服役工况，并完成规定任务的能力程度。“健康退化”状态是指电机运行状态呈现出健康状态但其某些性能参数已有故障先兆的状态，或者偏离“健康”状态，造成系统性能下降，但还未到达“故障”的状态。“故障”状态是指电机不能执行规定功能的状态，即达服役寿命期限的和已丧失服役能力的状态，其功能失效可能导致整个系统功能恶化。“故障”可能由“健康退化”(具有时间累积效应)和“健康”突变(由应力、工况等外部因素导致)两种机理原因造成。健康、健康退化、故障状态示意图如图1所示。

实施例1

参见图2，本实施例提供一种基于堆栈模型的功率器件故障预测方法，包括以下步骤：

S1:确定堆栈模型的层数，为堆栈模型的每一层设定所用的预测方法；根据待预测对象的历史退化数据集得到原始数据集，将原始数据集输入至堆栈模型的第一层；

S2:在堆栈模型的第一层中，将原始数据集划分为第一层训练数据集和第一层测试数据集；采用K折交叉验证方法将第一层训练数据集分为K组不同的训练集和验证集，如图3所示；采用第一层所用的预测方法对K组不同的训练集进行训练，得到第一层堆栈模型；

S3:采用第一层堆栈模型测试第一层的验证集，得到验证集预测值；用第一层堆栈模型对测试数据集进行预测，得到测试数据集预测值；将第一层作为当前层；

S4:根据验证集预测值构建当前层的验证集预测值矩阵，将验证集预测值矩阵作为当前层的下一层的训练数据集以采用对应层的预测方法训练得到下一层的堆栈模型；并根据测试数据集预测值构建当前层的测试数据集预测值矩阵，将测试数据集预测值矩阵作为当前层的下一层的测试数据集以对对应层的堆栈模型进行预测；

S5:将当前层的下一层作为新的当前层，重复上述S4；直至训练完最后一层的堆栈模型；

上述的基于堆栈模型的故障预测方法针对单一预测方法对不同特点的数据的可描述能存在差异，融合多种预测方法，使其在处理不同特点的数据时充分发挥各自优点，提高故障预测的精度。

作为本实施例优选的实施方式，为堆栈模型的每一层设定所用的预测方法可以为用于回归的方法，如Lasso、Elastic-Net、贝叶斯回归(Bayesian Regression)、随机梯度下降(Stochastic Gradient Descent Regression)、核岭回归(Kernel ridge regression)、K-近邻(KNN)、LightGBM、高斯过程回归(Gaussian Process Regression)、支持向量回归(SVR)、XGBoost等，但本发明并不仅限于所列预测方法，此处，仅作举例示意。在本发明中，堆栈模型的各层地预测方法可以相同也可以不同，具体设定情况根据待测对象随机选定。

实际应用中，在上述步骤中，本发明的基于堆栈模型的功率器件故障预测方法还可以进行优化，优化后的实施例如下：

本实施例中确定堆栈模型的层数为m层，选择m层堆栈模型所用的预测方法。根据功率器件的历史退化数据集得到原始数据集。作为可变换的实施方式，还可以根据功率器件的历史退化数据集所计算的特征得到原始数据集将所述原始数据集划分为第一层训练数据集和第一层测试数据集。

具体地，包括：

S12：根据待预测对象的历史退化数据集得到原始数据集D，其维度为L×F，L表示退化数据的组数，F表示待预测对象退化过程中传感器的个数，该L组退化数据的真实退化量为B。需要说明的是，在另一个可选的实施例中，当根据功率器件的历史退化数据集所计算的特征作为原始数据集时，F表示所提取的待预测对象退化过程中的特征个数。

S13：将所述原始数据集D随机划分为第一层训练数据集

和第一层测试数据集

第一层训练数据集/>

的维度和对应退化量标签分别为LA×F和/>

其中LA表示训练数据集/>

的数据组数；第一层测试数据集/>

的维度和对应退化量标签分别为LE×F和/>

其中LE表示测试数据集/>

的数据组数。

作为可变换地实施方式，可以改变上述堆栈层数，也可以改变每层使用的预测方法个数和所选择的方法，且尽量选用多种能在不同特点的数据上优劣互补的预测方法。充分发挥各自优点，提高故障预测的精度。

S2:在所述堆栈模型的第一层中，将所述原始数据集划分为第一层训练数据集和第一层测试数据集；采用K折交叉验证方法将第一层训练数据集分为K组不同的训练集和验证集；采用第一层所用的预测方法对K组不同的训练集进行训练，得到第一层堆栈模型；具体如下：

S21：将第一层训练数据集

随机分成K个子集/>

把第一个子集/>

作为第一层训练数据集中第一折的验证集/>

其余K-1个子集作为第一折的训练集/>

和训练集

用于训练学习所有K折预测模型，k＝1，2，…K；

其中，构建的第k折训练集和验证集，用公式表示为：

S22：采用第一种预测方法对第一层、第一折的训练集

进行训练学习，得到预测模型/>

采用第一种预测方法依次对第一层所有第k折的训练集/>

进行训练学习，得到第一层、所有第k折的预测模型/>

采用第n₁种预测方法，依次对第一层所有第k折的训练集

进行训练学习，得到第一层、所有第k折的预测模型/>

S3:采用所述第一层堆栈模型测试第一层的验证集，得到验证集预测值；用所述第一层堆栈模型对所述测试数据集进行预测，得到测试数据集预测值；具体如下：

S31：采用训练好的预测模型

测试对应验证集/>

S32：依次采用训练学习好的第一层堆栈模型

测试对应验证集/>

得到采用N₁种预测方法对第一层、所有K折验证集的预测值

S33：将第一层作为当前层i。

S4:将第一层作为当前层，根据所述验证集预测值构建当前层的验证集预测值矩阵，将所述验证集预测值矩阵作为当前层的下一层的训练数据集以采用对应层的预测方法训练得到下一层的堆栈模型；并根据所述测试数据集预测值构建当前层的测试数据集预测值矩阵，将所述测试数据集预测值矩阵作为当前层的下一层的测试数据集以对对应层的堆栈模型进行预测；具体如下：

S41：采用设定的预测方法将第i层的所有折的预测值

拼接成验证集预测值序列/>

拼接成验证集预测值序列

用验证集预测值序列/>

构建第i层验证集预测值矩阵/>

矩阵维度为LA×N₁；

S42：将第i层验证集预测值矩阵作为i+1层训练数据集

S43：用训练学习好的预测模型

对第i层测试数据集/>

维度为LE×1，公式为：

S44：采用训练学习好的预测模型

对第i层测试数据集/>

得到采用N_i种预测方法对第i层测试数据集的预测值序列

S45：用所得的第i层测试数据集的预测值序列

构建第i层测试数据集预测值矩阵/>

S46：训练学习得到第i+1层的堆栈模型

用矩阵表示为：

S47：构建第i+1层的训练数据集

S48：利用堆栈模型(5)构建第i+1层的测试数据集

作为可变换地实施方式，在构建下一层的训练数据集

和测试数据集/>

时，可以加入上一层训练数据集/>

和测试数据集/>

使得

加强上一层数据集对最终预测结果的决定作用。

S5:将所述当前层的下一层作为新的当前层，重复上述S4，如图4所示，直至训练完最后一层的堆栈模型。具体包括：

S52:直至训练完最后一层的堆栈模型

构建最后一层的训练数据集

以及测试数据集/>

S6:采用最后一层的堆栈模型预测的测试数据集作为最终的预测结果；具体如下：

对第m层测试数据集/>

进行预测，得到N_m×K组预测结果/>

S62:对所得的N_m×K组预测结果求平均，公式为：

式中，n_m＝1,2,…,N_m,k＝1,2,…,K，得到最终的预测结果

其维度为LE×1。

式中，n_m＝1,2,…,N_m,k＝1,2,…,K，得到最终的预测结果

其维度为LE×1。

进一步的，本实施例以某型功率器件IGBT为例，对本发明的方法进行进一步说明与验证。由于随着IGBT不断老化，集电极、发射极间关断瞬时的尖峰电压，因此将关断瞬时的尖峰电压作为IGBT故障参数。

本实施例确定堆栈模型的层数m＝3，选择第一层堆栈模型所用的预测方法为K-近邻(KNN)、LightGBM、高斯过程回归(Gaussian Process Regression)，第二层堆栈模型所用的预测方法为：支持向量回归(SVR)、XGBoost；第三层堆栈模型所用的预测方法为：ElasticNet。逐渐下降采集IGBT老化过程的集电极、发射极间关断电压(原始数据集)，连续取其中900个尖峰值构成时序[V₁,V₂,…,V₉₀₀],选取前20个连续时序所采集的数据为一组退化数据的输入，下一个时序数据为这组退化数据的标签，如[V₁,V₂,…,V₂₀]退化数据的标签为V₂₁，900组尖峰电压时序共构成880组原始数据集。将这880组原始数据集前500组作为第一层训练数据集，其维度为500×20，后380组作为第一层测试数据集，其维度为380×20；然后在本实施例中K＝10，通过K折交叉验证方法将第一层训练数据集分为10组不同的训练集和验证集，采用第一层所选预测方法3种预测方法对10组不同的训练集进行训练学习，得到第一层堆栈模型，其维度为10×3；接着，分别用训练学习好的第一层堆栈模型，测试对应验证集及测试集，将得到验证集及测试集的预测值，分别作为第二层的训练数据集和测试数据集，其维度分别为500×3、380×3；然后，依次构建第二层，第三层训练数据集和测试数据集并训练学习第二层，第三层堆栈模型；最后用训练学习好的第3层堆栈模型，预测第3层测试数据集并得到最终的预测结果，其预测结果维度为380×1，对应第一层测试数据集中的380组退化数据。

图5为采用堆栈模型预测结果，经过380组测试，预测的退化量与实际退化量之间基本趋于一致，预测精度较高。本方法能有效的融合不同预测方法，使其在处理不同特点的数据时充分发挥各自优点，实现系统高精度故障预测。

实施例2

与上述方法实施例相对应地，本实施例提供一种基于堆栈模型的故障预测系统，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。