CN111008732B - 一种基于堆栈模型的故障预测方法及系统 - Google Patents

一种基于堆栈模型的故障预测方法及系统 Download PDF

Info

Publication number
CN111008732B
CN111008732B CN201911147200.9A CN201911147200A CN111008732B CN 111008732 B CN111008732 B CN 111008732B CN 201911147200 A CN201911147200 A CN 201911147200A CN 111008732 B CN111008732 B CN 111008732B
Authority
CN
China
Prior art keywords
layer
data set
training
stack model
prediction method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911147200.9A
Other languages
English (en)
Other versions
CN111008732A (zh
Inventor
彭涛
彭霞
叶城磊
陶宏伟
阳春华
杨超
陈志文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201911147200.9A priority Critical patent/CN111008732B/zh
Publication of CN111008732A publication Critical patent/CN111008732A/zh
Application granted granted Critical
Publication of CN111008732B publication Critical patent/CN111008732B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及故障预测及健康管理领域,公开了一种基于堆栈模型的故障预测方法及系统,以融合不同预测方法,在处理不同特点的数据时充分发挥各自优点,提高系统预测精度。该方法包括确定堆栈模型的层数,选择每层堆栈模型所用的预测方法;将得到的原始数据集划分为第一层训练数据集和第一层测试数据集;采用K折交叉验证方法将第一层训练数据集分为训练集和验证集并对训练集进行训练以得到第一层堆栈模型;分别用训练学习好的第一层堆栈模型,测试对应验证集及测试集,将得到验证集及测试集的预测值,分别作为下一层的训练数据集和测试数据集;重复上述步骤计算所有层堆栈模型,根据最后一层堆栈模型对测试数据集的预测结果得到最终的预测结果。

Description

一种基于堆栈模型的故障预测方法及系统
技术领域
本发明涉及故障预测及健康管理领域,尤其涉及一种基于堆栈模型的故障预测方法及系统。
背景技术
随着现代科技工业技术尤其是信息技术的迅速发展,在轨道交通、船舶、工业应用等各个领域的工程系统日趋复杂,系统的复杂性、综合化、智能化程度不断提高。伴随着复杂系统的发展其研制、生产尤其是维护和保障的成本越来越高。同时,由于组成环节和影响因素的增加,发生故障和功能失效的几率逐渐加大,因此,系统故障诊断和维护逐渐成为研究者关注的焦点。在实际情况中,存在一类具有退化过程的故障,即,某性能随时间变化而逐渐退化变差,但仍能工作。如何对该类故障进行预测成为一个需要解决的问题。因此,以预测技术为核心的故障预测和健康管理(Prognostics and Health Management,PHM)策略获得越来越多的重视和应用,如何提高预测的效率和精度,降低维修费用,是故障预测和健康管理的要求和目标。
基于数据驱动的故障预测方法通过传感器所获取的历史运行数据,采用数学模型认识或学习被测对象部件/系统的健康/非健康行为,并对未来被测对象部件/系统行为进行预测,它无需建立部件/系统的复杂数学或物理模型而获得广泛的关注和应用。历史运行数据各有特点,如高维、不平衡、非线性、异构等,而不同预测方法对不同特点数据的表达能力存在差异,单一的预测方法难以适应复杂系统复杂数据特点,从而影响故障预测的精度。
因此,现需提供一种能有效融合各种不同预测方法,使其在处理不同特点的数据时充分发挥各自优点,提高预测精度的故障预测方法及系统。
发明内容
本发明针对上述问题提供了一种基于堆栈模型的故障预测方法及系统,以能有效融合不同预测方法,在处理不同特点的数据时充分发挥各自优点,提高系统预测精度。
为实现上述目的,本发明提供了一种基于堆栈模型的故障预测方法,包括以下步骤:
S1:确定堆栈模型的层数,为堆栈模型的每一层设定所用的预测方法;根据待预测对象的历史退化数据集得到原始数据集,将所述原始数据集输入至所述堆栈模型的第一层;
S2:在所述堆栈模型的第一层中,将所述原始数据集划分为第一层训练数据集和第一层测试数据集;采用K折交叉验证方法将第一层训练数据集分为K组不同的训练集和验证集;采用第一层所用的预测方法对K组不同的训练集进行训练,得到第一层堆栈模型;
S3:采用所述第一层堆栈模型测试第一层的验证集,得到验证集预测值;用所述第一层堆栈模型对所述测试数据集进行预测,得到测试数据集预测值;将第一层作为当前层;
S4:根据所述验证集预测值构建当前层的验证集预测值矩阵,将所述验证集预测值矩阵作为当前层的下一层的训练数据集以采用对应层的预测方法训练得到下一层的堆栈模型;并根据所述测试数据集预测值构建当前层的测试数据集预测值矩阵,将所述测试数据集预测值矩阵作为当前层的下一层的测试数据集以对对应层的堆栈模型进行预测;
S5:将所述当前层的下一层作为新的当前层,重复上述S4;直至训练完最后一层的堆栈模型;
S6:采用最后一层的堆栈模型预测的测试数据集作为最终的预测结果。
优选地,所述预测方法包括贝叶斯回归预测方法、随机梯度下降预测方法、核岭回归预测方法、K-近邻预测方法、和高斯过程回归预测方法中的任意一种。
优选地,所述S1具体包括以下步骤:
S11:确定堆栈模型的层数m,为堆栈模型的每一层设定所用的预测方法,第i层堆栈模型选取Ni种预测方法,其中,i=1,2,…,m;
S12:根据待预测对象的历史退化数据集得到原始数据集D,其维度为L×F,L表示退化数据的组数,F表示待预测对象退化过程中传感器的个数,该L组退化数据的真实退化量为B;
S13:将所述原始数据集D随机划分为第一层训练数据集
Figure BDA0002282535750000021
和第一层测试数据集
Figure BDA0002282535750000022
第一层训练数据集/>
Figure BDA0002282535750000023
的维度和对应退化量标签分别为LA×F和/>
Figure BDA0002282535750000024
其中LA表示训练数据集/>
Figure BDA0002282535750000025
的数据组数;第一层测试数据集/>
Figure BDA0002282535750000026
的维度和对应退化量标签分别为LE×F和/>
Figure BDA0002282535750000027
其中LE表示测试数据集/>
Figure BDA0002282535750000028
的数据组数。
优选地,所述S2具体包括以下步骤:
S21:将第一层训练数据集
Figure BDA0002282535750000029
随机分成K个子集/>
Figure BDA00022825357500000216
把第一个子集/>
Figure BDA00022825357500000211
作为第一层训练数据集中第一折的验证集/>
Figure BDA00022825357500000212
其余K-1个子集作为第一折的训练集/>
Figure BDA00022825357500000213
用于训练学习第一折预测模型;依次构建所有第k折的验证集/>
Figure BDA00022825357500000214
和训练集
Figure BDA00022825357500000215
用于训练学习所有K折预测模型,k=1,2,...K;
其中,构建的第k折训练集和验证集,用公式表示为:
Figure BDA0002282535750000031
S22:采用第一种预测方法对第一层、第一折的训练集
Figure BDA0002282535750000032
进行训练学习,得到预测模型/>
Figure BDA0002282535750000033
采用第一种预测方法依次对第一层所有第k折的训练集/>
Figure BDA0002282535750000034
进行训练学习,得到第一层、所有第k折的预测模型/>
Figure BDA0002282535750000035
采用第n1种预测方法,依次对第一层所有第k折的训练集
Figure BDA0002282535750000036
进行训练学习,得到第一层、所有第k折的预测模型/>
Figure BDA0002282535750000037
采用N1种预测方法,得到的第一层、K折的预测模型,用矩阵表示为:
Figure BDA0002282535750000038
式中模型为对K组不同的训练集进行训练学习得到的第一层堆栈模型,式中,维度为N1×K。
优选地,所述S3具体包括以下步骤:
S31:采用训练好的预测模型
Figure BDA0002282535750000039
测试对应验证集/>
Figure BDA00022825357500000310
得到采用第一种预测方法对第一层的第一折验证集的预测值/>
Figure BDA00022825357500000311
S32:依次采用训练学习好的第一层堆栈模型
Figure BDA00022825357500000312
测试对应验证集/>
Figure BDA00022825357500000313
得到采用N1种预测方法对第一层、所有K折验证集的预测值
Figure BDA00022825357500000314
S33:将第一层作为当前层i;
优选地,所述S4具体包括以下步骤
S41:采用设定的预测方法将第i层的所有折的预测值
Figure BDA00022825357500000315
拼接成验证集预测值序列/>
Figure BDA00022825357500000316
其序列长度为LA,将第i层堆栈模型中所有第ni种预测方法、所有第k折的预测值/>
Figure BDA00022825357500000317
拼接成验证集预测值序列
Figure BDA00022825357500000318
Figure BDA00022825357500000319
用验证集预测值序列/>
Figure BDA00022825357500000320
构建第i层验证集预测值矩阵/>
Figure BDA00022825357500000321
矩阵维度为LA×N1
S42:将第i层验证集预测值矩阵作为i+1层训练数据集
Figure BDA0002282535750000041
S43:用训练学习好的预测模型
Figure BDA0002282535750000042
对第i层测试数据集/>
Figure BDA0002282535750000043
进行预测,得到采用第一种预测方法的第i层所有K折预测模型对第i层测试数据集的预测值序列/>
Figure BDA0002282535750000044
维度为LE×1;将每一折预测模型下测试集的预测值取平均得到采用第一种预测方法对第i层测试数据集的预测值序列/>
Figure BDA0002282535750000045
维度为LE×1,公式为:
Figure BDA0002282535750000046
S44:采用训练学习好的预测模型
Figure BDA0002282535750000047
对第i层测试数据集/>
Figure BDA0002282535750000048
进行预测,得到采用所有第ni种预测方法、第i层、所有K折预测模型对第i层测试数据集的预测值序列
Figure BDA0002282535750000049
Figure BDA00022825357500000410
维度为LE×1;将每一种预测方法下的测试集的预测值取平均,公式为:
Figure BDA00022825357500000411
得到采用Ni种预测方法对第i层测试数据集的预测值序列
Figure BDA00022825357500000412
S45:用所得的第i层测试数据集的预测值序列
Figure BDA00022825357500000413
构建第i层测试数据集预测值矩阵/>
Figure BDA00022825357500000414
其维度为LE×N1;将所得的第i层测试数据集预测值矩阵作为第i+1测试数据集/>
Figure BDA00022825357500000415
S46:训练学习得到第i+1层的堆栈模型
Figure BDA00022825357500000416
用矩阵表示为:
Figure BDA00022825357500000417
式中模型为第i+1层堆栈模型,维度为Ni+1×K,i=1,2,…,m;ni=1,2,…,Ni;k=1,2,…,K
S47:构建第i+1层的训练数据集
Figure BDA00022825357500000418
S48:利用堆栈模型(5)构建第i+1层的测试数据集
Figure BDA00022825357500000419
优选地,所述S5具体包括以下步骤:
S51:将所述当前层的下一层作为新的当前层,重复上述S4,逐次训练各层堆栈模型,构建各层训练数据集和测试数据集;
S52:直至训练完最后一层的堆栈模型
Figure BDA0002282535750000051
构建最后一层的训练数据集/>
Figure BDA0002282535750000052
以及测试数据集/>
Figure BDA0002282535750000053
优选地,所述S6具体包括以下步骤:
S61:用第m层训练数据集所有第nm种预测方法、所有第k折所构建的第m层堆栈模型
Figure BDA0002282535750000054
对第m层测试数据集/>
Figure BDA0002282535750000055
进行预测,得到Nm×K组预测结果/>
Figure BDA0002282535750000056
S62:对所得的Nm×K组预测结果求平均,公式为:
Figure BDA0002282535750000057
式中,nm=1,2,…,Nm,k=1,2,…,K,得到最终的预测结果
Figure BDA0002282535750000058
其维度为LE×1。
作为一个总地发明构思,本发明还提供一种基于堆栈模型的故障预测系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本发明具有以下有益效果:
本发明提供一种基于堆栈模型的故障预测方法及系统,包括:确定堆栈模型的层数,选择每层堆栈模型所用的预测方法;将得到的原始数据集划分为第一层训练数据集和第一层测试数据集;采用K折交叉验证方法将第一层训练数据集分为训练集和验证集并对训练集进行训练以得到第一层堆栈模型;分别用训练学习好的第一层堆栈模型,测试对应验证集及测试集,将得到验证集及测试集的预测值,分别作为下一层的训练数据集和测试数据集;重复上述步骤计算所有层堆栈模型,根据最后一层堆栈模型对测试数据集的预测结果取平均得到最终的预测结果。它通过各层堆栈模型,有效地将不同故障预测方法深度融合,融合不同预测方法后的模型能充分发挥各自方法的优势,适应具有不同特点的数据,提高系统故障预测精度。有效的故障预测可在系统尚未造成重大危害时及时预警,降低维护成本,同时提高系统的稳定性和安全性。
下面将参照附图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明的健康、健康退化、故障状态示意图;
图2是本发明优选实施例的基于堆栈模型的故障预测方法流程图;
图3是本发明优选实施例的基于K折交叉验证的训练集和验证集选取方法图;
图4是本发明优选实施例的堆栈模型构建示意图;
图5是本发明优选实施例的基于堆栈模型的功率器件故障预测结果图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
需要说明的是,本发明方法可以针对一类具有退化过程的故障(某性能随时间变化而逐渐退化变差,但仍能工作)进行预测,如永磁同步电机定子绕组匝间短路故障、永磁体失磁故障;异步电机转子断条故障(未断)、气隙偏心故障;传感器偏差故障、漂移故障等,且不仅限于所列类型故障,但不包括突变故障。
例如,可以将构成电机的整体状态描述为“健康”、“健康退化”和“故障”三种状态。“健康”状态是指电机持续应对所处服役工况,并完成规定任务的能力程度。“健康退化”状态是指电机运行状态呈现出健康状态但其某些性能参数已有故障先兆的状态,或者偏离“健康”状态,造成系统性能下降,但还未到达“故障”的状态。“故障”状态是指电机不能执行规定功能的状态,即达服役寿命期限的和已丧失服役能力的状态,其功能失效可能导致整个系统功能恶化。“故障”可能由“健康退化”(具有时间累积效应)和“健康”突变(由应力、工况等外部因素导致)两种机理原因造成。健康、健康退化、故障状态示意图如图1所示。
实施例1
参见图2,本实施例提供一种基于堆栈模型的功率器件故障预测方法,包括以下步骤:
S1:确定堆栈模型的层数,为堆栈模型的每一层设定所用的预测方法;根据待预测对象的历史退化数据集得到原始数据集,将原始数据集输入至堆栈模型的第一层;
S2:在堆栈模型的第一层中,将原始数据集划分为第一层训练数据集和第一层测试数据集;采用K折交叉验证方法将第一层训练数据集分为K组不同的训练集和验证集,如图3所示;采用第一层所用的预测方法对K组不同的训练集进行训练,得到第一层堆栈模型;
S3:采用第一层堆栈模型测试第一层的验证集,得到验证集预测值;用第一层堆栈模型对测试数据集进行预测,得到测试数据集预测值;将第一层作为当前层;
S4:根据验证集预测值构建当前层的验证集预测值矩阵,将验证集预测值矩阵作为当前层的下一层的训练数据集以采用对应层的预测方法训练得到下一层的堆栈模型;并根据测试数据集预测值构建当前层的测试数据集预测值矩阵,将测试数据集预测值矩阵作为当前层的下一层的测试数据集以对对应层的堆栈模型进行预测;
S5:将当前层的下一层作为新的当前层,重复上述S4;直至训练完最后一层的堆栈模型;
S6:采用最后一层的堆栈模型预测的测试数据集作为最终的预测结果。
上述的基于堆栈模型的故障预测方法针对单一预测方法对不同特点的数据的可描述能存在差异,融合多种预测方法,使其在处理不同特点的数据时充分发挥各自优点,提高故障预测的精度。
作为本实施例优选的实施方式,为堆栈模型的每一层设定所用的预测方法可以为用于回归的方法,如Lasso、Elastic-Net、贝叶斯回归(Bayesian Regression)、随机梯度下降(Stochastic Gradient Descent Regression)、核岭回归(Kernel ridge regression)、K-近邻(KNN)、LightGBM、高斯过程回归(Gaussian Process Regression)、支持向量回归(SVR)、XGBoost等,但本发明并不仅限于所列预测方法,此处,仅作举例示意。在本发明中,堆栈模型的各层地预测方法可以相同也可以不同,具体设定情况根据待测对象随机选定。
实际应用中,在上述步骤中,本发明的基于堆栈模型的功率器件故障预测方法还可以进行优化,优化后的实施例如下:
本实施例中确定堆栈模型的层数为m层,选择m层堆栈模型所用的预测方法。根据功率器件的历史退化数据集得到原始数据集。作为可变换的实施方式,还可以根据功率器件的历史退化数据集所计算的特征得到原始数据集将所述原始数据集划分为第一层训练数据集和第一层测试数据集。
具体地,包括:
S11:确定堆栈模型的层数m,为堆栈模型的每一层设定所用的预测方法,第i层堆栈模型选取Ni种预测方法,其中,i=1,2,…,m;
S12:根据待预测对象的历史退化数据集得到原始数据集D,其维度为L×F,L表示退化数据的组数,F表示待预测对象退化过程中传感器的个数,该L组退化数据的真实退化量为B。需要说明的是,在另一个可选的实施例中,当根据功率器件的历史退化数据集所计算的特征作为原始数据集时,F表示所提取的待预测对象退化过程中的特征个数。
S13:将所述原始数据集D随机划分为第一层训练数据集
Figure BDA0002282535750000071
和第一层测试数据集
Figure BDA0002282535750000072
第一层训练数据集/>
Figure BDA0002282535750000073
的维度和对应退化量标签分别为LA×F和/>
Figure BDA0002282535750000074
其中LA表示训练数据集/>
Figure BDA0002282535750000075
的数据组数;第一层测试数据集/>
Figure BDA0002282535750000076
的维度和对应退化量标签分别为LE×F和/>
Figure BDA0002282535750000077
其中LE表示测试数据集/>
Figure BDA0002282535750000078
的数据组数。
作为可变换地实施方式,可以改变上述堆栈层数,也可以改变每层使用的预测方法个数和所选择的方法,且尽量选用多种能在不同特点的数据上优劣互补的预测方法。充分发挥各自优点,提高故障预测的精度。
S2:在所述堆栈模型的第一层中,将所述原始数据集划分为第一层训练数据集和第一层测试数据集;采用K折交叉验证方法将第一层训练数据集分为K组不同的训练集和验证集;采用第一层所用的预测方法对K组不同的训练集进行训练,得到第一层堆栈模型;具体如下:
S21:将第一层训练数据集
Figure BDA0002282535750000081
随机分成K个子集/>
Figure BDA0002282535750000082
把第一个子集/>
Figure BDA0002282535750000083
作为第一层训练数据集中第一折的验证集/>
Figure BDA0002282535750000084
其余K-1个子集作为第一折的训练集/>
Figure BDA0002282535750000085
用于训练学习第一折预测模型;依次构建所有第k折的验证集/>
Figure BDA0002282535750000086
和训练集
Figure BDA0002282535750000087
用于训练学习所有K折预测模型,k=1,2,…K;
其中,构建的第k折训练集和验证集,用公式表示为:
Figure BDA0002282535750000088
S22:采用第一种预测方法对第一层、第一折的训练集
Figure BDA0002282535750000089
进行训练学习,得到预测模型/>
Figure BDA00022825357500000810
采用第一种预测方法依次对第一层所有第k折的训练集/>
Figure BDA00022825357500000811
进行训练学习,得到第一层、所有第k折的预测模型/>
Figure BDA00022825357500000812
采用第n1种预测方法,依次对第一层所有第k折的训练集
Figure BDA00022825357500000813
进行训练学习,得到第一层、所有第k折的预测模型/>
Figure BDA00022825357500000814
采用N1种预测方法,得到的第一层、K折的预测模型,用矩阵表示为:
Figure BDA00022825357500000815
式中模型为对K组不同的训练集进行训练学习得到的第一层堆栈模型,式中,维度为N1×K。
S3:采用所述第一层堆栈模型测试第一层的验证集,得到验证集预测值;用所述第一层堆栈模型对所述测试数据集进行预测,得到测试数据集预测值;具体如下:
S31:采用训练好的预测模型
Figure BDA00022825357500000816
测试对应验证集/>
Figure BDA00022825357500000817
得到采用第一种预测方法对第一层的第一折验证集的预测值/>
Figure BDA0002282535750000091
S32:依次采用训练学习好的第一层堆栈模型
Figure BDA0002282535750000092
测试对应验证集/>
Figure BDA0002282535750000093
得到采用N1种预测方法对第一层、所有K折验证集的预测值
Figure BDA0002282535750000094
S33:将第一层作为当前层i。
S4:将第一层作为当前层,根据所述验证集预测值构建当前层的验证集预测值矩阵,将所述验证集预测值矩阵作为当前层的下一层的训练数据集以采用对应层的预测方法训练得到下一层的堆栈模型;并根据所述测试数据集预测值构建当前层的测试数据集预测值矩阵,将所述测试数据集预测值矩阵作为当前层的下一层的测试数据集以对对应层的堆栈模型进行预测;具体如下:
S41:采用设定的预测方法将第i层的所有折的预测值
Figure BDA0002282535750000095
拼接成验证集预测值序列/>
Figure BDA0002282535750000096
其序列长度为LA,将第i层堆栈模型中所有第ni种预测方法、所有第k折的预测值/>
Figure BDA0002282535750000097
拼接成验证集预测值序列
Figure BDA0002282535750000098
Figure BDA0002282535750000099
用验证集预测值序列/>
Figure BDA00022825357500000910
构建第i层验证集预测值矩阵/>
Figure BDA00022825357500000911
矩阵维度为LA×N1
S42:将第i层验证集预测值矩阵作为i+1层训练数据集
Figure BDA00022825357500000912
S43:用训练学习好的预测模型
Figure BDA00022825357500000913
对第i层测试数据集/>
Figure BDA00022825357500000914
进行预测,得到采用第一种预测方法的第i层所有K折预测模型对第i层测试数据集的预测值序列/>
Figure BDA00022825357500000915
维度为LE×1;将每一折预测模型下测试集的预测值取平均得到采用第一种预测方法对第i层测试数据集的预测值序列/>
Figure BDA00022825357500000916
维度为LE×1,公式为:
Figure BDA00022825357500000917
S44:采用训练学习好的预测模型
Figure BDA00022825357500000918
对第i层测试数据集/>
Figure BDA00022825357500000919
进行预测,得到采用所有第ni种预测方法、第i层、所有K折预测模型对第i层测试数据集的预测值序列
Figure BDA00022825357500000920
Figure BDA00022825357500000921
维度为LE×1;将每一种预测方法下的测试集的预测值取平均,公式为:
Figure BDA0002282535750000101
得到采用Ni种预测方法对第i层测试数据集的预测值序列
Figure BDA0002282535750000102
S45:用所得的第i层测试数据集的预测值序列
Figure BDA0002282535750000103
构建第i层测试数据集预测值矩阵/>
Figure BDA0002282535750000104
其维度为LE×N1;将所得的第i层测试数据集预测值矩阵作为第i+1测试数据集/>
Figure BDA0002282535750000105
S46:训练学习得到第i+1层的堆栈模型
Figure BDA0002282535750000106
用矩阵表示为:
Figure BDA0002282535750000107
式中模型为第i+1层堆栈模型,维度为Ni+1×K,i=1,2,…,m;ni=1,2,…,Ni;k=1,2,…,K
S47:构建第i+1层的训练数据集
Figure BDA0002282535750000108
S48:利用堆栈模型(5)构建第i+1层的测试数据集
Figure BDA0002282535750000109
作为可变换地实施方式,在构建下一层的训练数据集
Figure BDA00022825357500001010
和测试数据集/>
Figure BDA00022825357500001011
时,可以加入上一层训练数据集/>
Figure BDA00022825357500001012
和测试数据集/>
Figure BDA00022825357500001013
使得
Figure BDA00022825357500001014
加强上一层数据集对最终预测结果的决定作用。
S5:将所述当前层的下一层作为新的当前层,重复上述S4,如图4所示,直至训练完最后一层的堆栈模型。具体包括:
S51:将所述当前层的下一层作为新的当前层,重复上述S4,逐次训练各层堆栈模型,构建各层训练数据集和测试数据集;
S52:直至训练完最后一层的堆栈模型
Figure BDA00022825357500001015
构建最后一层的训练数据集
Figure BDA00022825357500001016
以及测试数据集/>
Figure BDA00022825357500001017
S6:采用最后一层的堆栈模型预测的测试数据集作为最终的预测结果;具体如下:
S61:用第m层训练数据集所有第nm种预测方法、所有第k折所构建的第m层堆栈模型
Figure BDA00022825357500001018
对第m层测试数据集/>
Figure BDA00022825357500001019
进行预测,得到Nm×K组预测结果/>
Figure BDA00022825357500001020
S62:对所得的Nm×K组预测结果求平均,公式为:
Figure BDA0002282535750000111
式中,nm=1,2,…,Nm,k=1,2,…,K,得到最终的预测结果
Figure BDA0002282535750000112
其维度为LE×1。
式中,nm=1,2,…,Nm,k=1,2,…,K,得到最终的预测结果
Figure BDA0002282535750000113
其维度为LE×1。
进一步的,本实施例以某型功率器件IGBT为例,对本发明的方法进行进一步说明与验证。由于随着IGBT不断老化,集电极、发射极间关断瞬时的尖峰电压,因此将关断瞬时的尖峰电压作为IGBT故障参数。
本实施例确定堆栈模型的层数m=3,选择第一层堆栈模型所用的预测方法为K-近邻(KNN)、LightGBM、高斯过程回归(Gaussian Process Regression),第二层堆栈模型所用的预测方法为:支持向量回归(SVR)、XGBoost;第三层堆栈模型所用的预测方法为:ElasticNet。逐渐下降采集IGBT老化过程的集电极、发射极间关断电压(原始数据集),连续取其中900个尖峰值构成时序[V1,V2,…,V900],选取前20个连续时序所采集的数据为一组退化数据的输入,下一个时序数据为这组退化数据的标签,如[V1,V2,…,V20]退化数据的标签为V21,900组尖峰电压时序共构成880组原始数据集。将这880组原始数据集前500组作为第一层训练数据集,其维度为500×20,后380组作为第一层测试数据集,其维度为380×20;然后在本实施例中K=10,通过K折交叉验证方法将第一层训练数据集分为10组不同的训练集和验证集,采用第一层所选预测方法3种预测方法对10组不同的训练集进行训练学习,得到第一层堆栈模型,其维度为10×3;接着,分别用训练学习好的第一层堆栈模型,测试对应验证集及测试集,将得到验证集及测试集的预测值,分别作为第二层的训练数据集和测试数据集,其维度分别为500×3、380×3;然后,依次构建第二层,第三层训练数据集和测试数据集并训练学习第二层,第三层堆栈模型;最后用训练学习好的第3层堆栈模型,预测第3层测试数据集并得到最终的预测结果,其预测结果维度为380×1,对应第一层测试数据集中的380组退化数据。
图5为采用堆栈模型预测结果,经过380组测试,预测的退化量与实际退化量之间基本趋于一致,预测精度较高。本方法能有效的融合不同预测方法,使其在处理不同特点的数据时充分发挥各自优点,实现系统高精度故障预测。
实施例2
与上述方法实施例相对应地,本实施例提供一种基于堆栈模型的故障预测系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于堆栈模型的故障预测方法,其特征在于,包括以下步骤:
S1:确定堆栈模型的层数,为堆栈模型的每一层设定所用的预测方法;根据待预测对象的历史退化数据集得到原始数据集,将所述原始数据集输入至所述堆栈模型的第一层;
S2:在所述堆栈模型的第一层中,将所述原始数据集划分为第一层训练数据集和第一层测试数据集;采用K折交叉验证方法将第一层训练数据集分为K组不同的训练集和验证集;采用第一层所用的预测方法对K组不同的训练集进行训练,得到第一层堆栈模型;
S3:采用所述第一层堆栈模型测试第一层的验证集,得到验证集预测值;用所述第一层堆栈模型对所述测试数据集进行预测,得到测试数据集预测值;将第一层作为当前层;
S4:根据所述验证集预测值构建当前层的验证集预测值矩阵,将所述验证集预测值矩阵作为当前层的下一层的训练数据集以采用对应层的预测方法训练得到下一层的堆栈模型;并根据所述测试数据集预测值构建当前层的测试数据集预测值矩阵,将所述测试数据集预测值矩阵作为当前层的下一层的测试数据集以对对应层的堆栈模型进行预测;
S5:将所述当前层的下一层作为新的当前层,重复上述S4;直至训练完最后一层的堆栈模型;
S6:采用最后一层的堆栈模型预测的测试数据集作为最终的预测结果;
所述S2具体包括以下步骤:
S21:将第一层训练数据集
Figure FDA0004112651200000011
随机分成K个子集/>
Figure FDA0004112651200000012
k=1,2,…,K;把第一个子集
Figure FDA0004112651200000013
作为第一层训练数据集中第一折的验证集/>
Figure FDA0004112651200000014
其余K-1个子集作为第一折的训练集
Figure FDA0004112651200000015
用于训练学习第一折预测模型;依次构建所有第k折的验证集/>
Figure FDA0004112651200000016
和训练集/>
Figure FDA0004112651200000017
用于训练学习所有K折预测模型,k=1,2,…K;
其中,构建的第k折训练集和验证集,用公式表示为:
Figure FDA0004112651200000018
S22:采用第一种预测方法对第一层、第一折的训练集
Figure FDA0004112651200000019
进行训练学习,得到预测模型/>
Figure FDA00041126512000000110
采用第一种预测方法依次对第一层所有第k折的训练集/>
Figure FDA00041126512000000111
进行训练学习,得到第一层、所有第k折的预测模型/>
Figure FDA00041126512000000112
k=1,2,…,K;
采用第n1种预测方法,依次对第一层所有第k折的训练集
Figure FDA00041126512000000113
进行训练学习,得到第一层、所有第k折的预测模型/>
Figure FDA00041126512000000114
n1=1,2,…,N1,k=1,2,…,K;
采用N1种预测方法,得到的第一层、K折的预测模型,用矩阵表示为:
Figure FDA0004112651200000021
式中模型为对K组不同的训练集进行训练学习得到的第一层堆栈模型,式中,维度为N1×K;
所述S3具体包括以下步骤:
S31:采用训练好的预测模型
Figure FDA0004112651200000022
测试对应验证集/>
Figure FDA0004112651200000023
得到采用第一种预测方法对第一层的第一折验证集的预测值/>
Figure FDA0004112651200000024
S32:依次采用训练学习好的第一层堆栈模型
Figure FDA0004112651200000025
测试对应验证集/>
Figure FDA0004112651200000026
得到采用N1种预测方法对第一层、所有K折验证集的预测值/>
Figure FDA0004112651200000027
n1=1,2,…,N1,k=1,2,…,K;
S33:将第一层作为当前层i;
所述S4具体包括以下步骤
S41:采用设定的预测方法将第i层的所有折的预测值
Figure FDA0004112651200000028
k=1,2,…,K拼接成验证集预测值序列/>
Figure FDA0004112651200000029
其序列长度为LA,将第i层堆栈模型中所有第ni种预测方法、所有第k折的预测值/>
Figure FDA00041126512000000210
拼接成验证集预测值序列
Figure FDA00041126512000000211
用验证集预测值序列/>
Figure FDA00041126512000000212
构建第i层验证集预测值矩阵/>
Figure FDA00041126512000000213
矩阵维度为LA×N1
S42:将第i层验证集预测值矩阵作为i+1层训练数据集
Figure FDA00041126512000000214
S43:用训练学习好的预测模型
Figure FDA00041126512000000215
对第i层测试数据集/>
Figure FDA00041126512000000216
进行预测,得到采用第一种预测方法的第i层所有K折预测模型对第i层测试数据集的预测值序列/>
Figure FDA00041126512000000217
维度为LE×1;将每一折预测模型下测试集的预测值取平均得到采用第一种预测方法对第i层测试数据集的预测值序列/>
Figure FDA00041126512000000218
维度为LE×1,公式为:
Figure FDA00041126512000000219
S44:采用训练学习好的预测模型
Figure FDA00041126512000000220
对第i层测试数据集/>
Figure FDA00041126512000000221
进行预测,得到采用所有第ni种预测方法、第i层、所有K折预测模型对第i层测试数据集的预测值序列/>
Figure FDA0004112651200000031
i=1,2,…,m;ni=1,2,…,Ni;k=1,2,…,K,维度为LE×1;将每一种预测方法下的测试集的预测值取平均,公式为:
Figure FDA0004112651200000032
得到采用Ni种预测方法对第i层测试数据集的预测值序列
Figure FDA0004112651200000033
S45:用所得的第i层测试数据集的预测值序列
Figure FDA0004112651200000034
构建第i层测试数据集预测值矩阵/>
Figure FDA0004112651200000035
其维度为LE×N1;将所得的第i层测试数据集预测值矩阵作为第i+1测试数据集/>
Figure FDA0004112651200000036
S46:训练学习得到第i+1层的堆栈模型
Figure FDA0004112651200000037
用矩阵表示为:
Figure FDA0004112651200000038
式中模型为第i+1层堆栈模型,维度为Ni+1×K,i=1,2,…,m;ni=1,2,…,Ni;k=1,2,…,K
S47:构建第i+1层的训练数据集
Figure FDA0004112651200000039
S48:利用堆栈模型(5)构建第i+1层的测试数据集
Figure FDA00041126512000000310
2.根据权利要求1所述的基于堆栈模型的故障预测方法,其特征在于,所述预测方法包括贝叶斯回归预测方法、随机梯度下降预测方法、核岭回归预测方法、K-近邻预测方法、和高斯过程回归预测方法中的任意一种。
3.根据权利要求1所述的基于堆栈模型的故障预测方法,其特征在于,所述S1具体包括以下步骤:
S11:确定堆栈模型的层数m,为堆栈模型的每一层设定所用的预测方法,第i层堆栈模型选取Ni种预测方法,其中,i=1,2,…,m;
S12:根据待预测对象的历史退化数据集得到原始数据集D,其维度为L×F,L表示退化数据的组数,F表示待预测对象退化过程中传感器的个数,该L组退化数据的真实退化量为B;
S13:将所述原始数据集D随机划分为第一层训练数据集
Figure FDA00041126512000000311
和第一层测试数据集/>
Figure FDA00041126512000000312
第一层训练数据集/>
Figure FDA0004112651200000041
的维度和对应退化量标签分别为LA×F和/>
Figure FDA0004112651200000042
其中LA表示训练数据集/>
Figure FDA0004112651200000043
的数据组数;第一层测试数据集/>
Figure FDA0004112651200000044
的维度和对应退化量标签分别为LE×F和
Figure FDA0004112651200000045
其中LE表示测试数据集/>
Figure FDA0004112651200000046
的数据组数。
4.根据权利要求1所述的基于堆栈模型的故障预测方法,其特征在于,所述S5具体包括以下步骤:
S51:将所述当前层的下一层作为新的当前层,重复上述S4,逐次训练各层堆栈模型,构建各层训练数据集和测试数据集;
S52:直至训练完最后一层的堆栈模型
Figure FDA0004112651200000047
构建最后一层的训练数据集/>
Figure FDA0004112651200000048
以及测试数据集/>
Figure FDA0004112651200000049
5.根据权利要求1所述的基于堆栈模型的故障预测方法,其特征在于,所述S6具体包括以下步骤:
S61:用第m层训练数据集所有第nm种预测方法、所有第k折所构建的第m层堆栈模型
Figure FDA00041126512000000410
对第m层测试数据集/>
Figure FDA00041126512000000411
进行预测,得到Nm×K组预测结果/>
Figure FDA00041126512000000412
S62:对所得的Nm×K组预测结果求平均,公式为:
Figure FDA00041126512000000413
式中,nm=1,2,…,Nm,k=1,2,…,K,得到最终的预测结果
Figure FDA00041126512000000414
其维度为LE×1。
6.一种基于堆栈模型的故障预测系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至5任一所述方法的步骤。
CN201911147200.9A 2019-11-21 2019-11-21 一种基于堆栈模型的故障预测方法及系统 Active CN111008732B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911147200.9A CN111008732B (zh) 2019-11-21 2019-11-21 一种基于堆栈模型的故障预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911147200.9A CN111008732B (zh) 2019-11-21 2019-11-21 一种基于堆栈模型的故障预测方法及系统

Publications (2)

Publication Number Publication Date
CN111008732A CN111008732A (zh) 2020-04-14
CN111008732B true CN111008732B (zh) 2023-06-20

Family

ID=70113070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911147200.9A Active CN111008732B (zh) 2019-11-21 2019-11-21 一种基于堆栈模型的故障预测方法及系统

Country Status (1)

Country Link
CN (1) CN111008732B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113759225B (zh) * 2020-06-01 2022-07-19 上海交通大学 Igbt剩余寿命预测和状态评估实现方法
CN112380041B (zh) * 2020-11-13 2023-11-14 重庆金美通信有限责任公司 一种基于xgboost的指控通信装备故障预测方法
CN112598166A (zh) * 2020-12-16 2021-04-02 哈尔滨锅炉厂有限责任公司 一种基于回归算法学习机及专家经验的电站锅炉再热器左右两侧温度偏差的预测方法
CN115049024B (zh) * 2022-08-15 2022-11-01 国能日新科技股份有限公司 风速预测模型的训练方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014117245A1 (en) * 2013-01-31 2014-08-07 Spielo International Canada Ulc Faults and performance issue prediction
WO2018026995A1 (en) * 2016-08-03 2018-02-08 Schlumberger Technology Corporation Multi-scale deep network for fault detection
CN109472462A (zh) * 2018-10-18 2019-03-15 中山大学 一种基于多模型堆栈融合的项目风险评级方法及装置
CN110110848A (zh) * 2019-05-05 2019-08-09 武汉烽火众智数字技术有限责任公司 一种组合预测模型构建方法及装置
CN110334764A (zh) * 2019-07-04 2019-10-15 西安电子科技大学 基于集成深度自编码器的旋转机械智能故障诊断方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133436A (zh) * 2016-02-26 2017-09-05 阿里巴巴集团控股有限公司 一种多重抽样模型训练方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014117245A1 (en) * 2013-01-31 2014-08-07 Spielo International Canada Ulc Faults and performance issue prediction
WO2018026995A1 (en) * 2016-08-03 2018-02-08 Schlumberger Technology Corporation Multi-scale deep network for fault detection
CN109472462A (zh) * 2018-10-18 2019-03-15 中山大学 一种基于多模型堆栈融合的项目风险评级方法及装置
CN110110848A (zh) * 2019-05-05 2019-08-09 武汉烽火众智数字技术有限责任公司 一种组合预测模型构建方法及装置
CN110334764A (zh) * 2019-07-04 2019-10-15 西安电子科技大学 基于集成深度自编码器的旋转机械智能故障诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
任俊 ; 胡晓峰 ; 李宁 ; .基于SDA与SVR混合模型的迁移学习预测算法.计算机科学.2018,(第01期),全文. *
刘正平 ; 胡俊 ; 张龙 ; .基于堆栈降噪自编码的轴承故障诊断方法.机床与液压.2018,(第15期),全文. *
王惠中 ; 乔林翰 ; 贺珂珂 ; 段洁 ; .基于Cross-Validation的电机故障诊断振动数据处理方法.自动化仪表.2018,(第04期),全文. *

Also Published As

Publication number Publication date
CN111008732A (zh) 2020-04-14

Similar Documents

Publication Publication Date Title
CN111008732B (zh) 一种基于堆栈模型的故障预测方法及系统
CN106409120B (zh) 机械学习方法及机械学习装置、以及故障预知装置及系统
CN110942101B (zh) 基于深度生成式对抗网络的滚动轴承剩余寿命预测方法
Zhang et al. Few-shot bearing fault diagnosis based on model-agnostic meta-learning
Alexandridis Evolving RBF neural networks for adaptive soft-sensor design
CN111914873A (zh) 一种两阶段云服务器无监督异常预测方法
CN114357594B (zh) 一种基于sca-gru的桥梁异常监测方法、系统、设备及存储介质
US9934470B2 (en) Production equipment including machine learning system and assembly and test unit
Simões et al. Evolutionary algorithms for dynamic environments: prediction using linear regression and markov chains
CN112611584B (zh) 风力发电机组的疲劳失效检测方法、装置、设备及介质
Le et al. Multi-branch Hidden semi-Markov modeling for RUL prognosis
Le et al. Hidden Markov Models for diagnostics and prognostics of systems under multiple deterioration modes
Larocque-Villiers et al. Automating predictive maintenance using state-based transfer learning and ensemble methods
Lutska et al. Forecasting the efficiency of the control system of the technological object on the basis of neural networks
Smarsly et al. Structural health monitoring based on artificial intelligence techniques
Zhang et al. Condition assessment of stay cables through enhanced time series classification using a deep learning approach
Ozdagli et al. Model-based damage detection through physics guided learning
CN111079348B (zh) 一种缓变信号检测方法和装置
He et al. NARNET-based prognostics modeling for deteriorating systems under dynamic operating conditions
Mondal et al. Sequential Modeling and Knowledge Source Integration for Identifying the Structure of a Bayesian Network for Multistage Process Monitoring and Diagnosis
Smarsly et al. Artificial intelligence in structural health monitoring
EP3968231A1 (en) Active learning agent for learning at least one strategy
Soualhi et al. Fault prognosis based on Hidden Markov models
CN115329906B (zh) 一种基于图正则化网络的故障诊断方法及装置
US20230196088A1 (en) Fan behavior anomaly detection using neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant