CN112231980A - 一种发动机寿命预测方法、存储介质及计算设备 - Google Patents

一种发动机寿命预测方法、存储介质及计算设备 Download PDF

Info

Publication number
CN112231980A
CN112231980A CN202011119733.9A CN202011119733A CN112231980A CN 112231980 A CN112231980 A CN 112231980A CN 202011119733 A CN202011119733 A CN 202011119733A CN 112231980 A CN112231980 A CN 112231980A
Authority
CN
China
Prior art keywords
subspace
feature
mlp
prediction
engine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011119733.9A
Other languages
English (en)
Other versions
CN112231980B (zh
Inventor
陈俊英
徐琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Architecture and Technology
Original Assignee
Xian University of Architecture and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Architecture and Technology filed Critical Xian University of Architecture and Technology
Priority to CN202011119733.9A priority Critical patent/CN112231980B/zh
Publication of CN112231980A publication Critical patent/CN112231980A/zh
Application granted granted Critical
Publication of CN112231980B publication Critical patent/CN112231980B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/04Ageing analysis or optimisation against ageing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Computational Mathematics (AREA)
  • Operations Research (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Optimization (AREA)
  • Economics (AREA)
  • Mathematical Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Hardware Design (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Geometry (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种发动机寿命预测方法、存储介质及计算设备,依据特征之间的相关程度去除发动机状态数据中信息冗余的特征,同时根据特征与预测目标之间的相关性去除与预测目标相关程度小的特征;随机选取抽样样本集,在随机抽样样本集上随机选取特征子空间,在得到的随机抽样子空间上建立决策回归树,不同随机抽样子空间上的决策树得到对应特征组合下的寿命预测结果;构建MLP模型结构和损失函数,通过Adam算法学习得到MLP模型参数;基于训练好的MLP模型集成多棵决策树的预测结果,得到发动机的剩余使用寿命。本发明通过学习的方法集成不同随机抽样子空间上决策树的预测值,提高预测准确率和可靠性,为航空发动机的保养和故障预测提供依据。

Description

一种发动机寿命预测方法、存储介质及计算设备
技术领域
本发明属于航空涡扇发动机剩余寿命预测技术领域,具体涉及一种基于MLP集成随机抽样子空间决策树的发动机寿命预测方法、存储介质及计算设备。
背景技术
正确预测航空发动机剩余寿命是合理维护发动机和保证飞行器安全的重要手段。航空发动机相关的众多参数能体现发动机的工作状态和剩余寿命。目前随着智能化仪表和计算机存储技术的广泛应用,大量的参数数据可以得到有效地监测、收集和存储。基于收集的数据进行挖掘成为发动机剩余寿命预测的有效方式和手段之一。这种基于数据驱动的方法不需要分析故障状态和各参数之间的工作机理,也不依赖于专家的知识与经验,但需要充分挖掘数据隐藏的信息才能更好地预测发动机的剩余寿命。
目前,在发动机数据挖掘方法上主要有基于统计的方法、基于机器学习的方法或结合统计方法和机器学习的组合预测方法等。统计学方法主要侧重于分析属性之间的关系,基于此建立退化模型或从相似性角度出发计算发动机的剩余使用寿命。近年来随着机器学习方法在工业场景中的广泛应用,其也被越来越多地用来自动挖掘隐藏在发动机相关监测数据中的信息。
以往的研究工作应用一定的方法和技术手段实现对航空发动机剩余使用寿命的预测,促进了这一领域的研究进展,但用于数据分析和挖掘的属性的选取无特定的规律。有的方法采用与发动机相关的14个检测参数,还有的方法采用7个或8个参数。为了避免特征选择不恰当给预测带来的损失问题,有必要研究不同属性特征组合下的预测性能。随机子空间有利于探测不同特征组合,决策树方便在子空间上建立预测模型。为避免单一决策树可能带来的不够可靠和稳健的问题,同时为了考虑不同子空间上的预测结果,以多层感知器(Multi-Layer Perceptron,MLP)自学习集成子空间决策树的方式给出预测结果。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于MLP集成随机抽样子空间决策树的发动机寿命预测方法、存储介质及计算设备,以探讨多种特征组合下的发动机剩余寿命,以MLP自学习的方式集成多种特征组合下基于决策树的预测结果。
本发明采用以下技术方案:
一种发动机寿命预测方法,包括以下步骤:
S1、依据特征之间的相关程度去除发动机状态数据中信息冗余的特征,同时根据特征与预测目标之间的相关性去除与预测目标相关系数绝对值小于0.15的特征;
S2、随机选取抽样特征子空间,以特征子空间中的特征属性为节点,以最小化均方误差为依据选择最优分裂节点,通过迭代分裂节点构建决策回归树,得到不同抽样子空间上对应的决策树,不同抽样子空间上的决策树得到对应特征组合下的寿命预测结果;
S3、构建MLP模型结构和损失函数,通过Adam算法学习得到MLP模型参数;
S4、基于训练好的MLP模型集成多棵决策树的预测结果,得到发动机的剩余使用寿命。
具体的,步骤S1具体为:
S101、设有m个样本,每个样本有N维特征,第i个特征表示为Fi,第k个样本表示为xk=[xk1,xk2,...,xkN]T,计算每两个特征之间以及每个特征和预测目标之间的Pearson相关系数;
S102、通过Pearson相关系数判断特征之间以及特征和预测目标之间的相关程度,根据相关系数进行特征选择。
进一步的,步骤S102具体为:
S1021、任意两个特征之间的Pearson相关系数大于0.95的情况,去掉其中一个特征;
S1022、任意一个特征和剩余寿命目标间相关系数的绝对值小于0.15的情况,去掉对应特征;
S1023、经过步骤S1021和S1022处理后剩余的特征即为特征选择结果。
具体的,步骤S2具体为:
S201、使用Bootstrap随机抽样的方法重复n次得到n个抽样样本集;在每个抽样样本集上随机选择特征得到随机抽样子空间;
S202、在每个随机抽样子空间样本集sub_new_train_data[i]上构建一颗决策树,n个随机抽样子空间样本集共构建n棵决策树;
S203、决策树相关参数寻优。
进一步的,步骤S202具体为:
S2021、对每个随机抽样子空间样本集sub_new_train_data[i],选择一个最优特征值进行节点分裂,以均方误差MSE衡量分裂点的优劣,均方误差MSE是真实值与预测值的差值的平方然后求和平均,计算如下:
Figure BDA0002731586480000041
其中,l为随机抽样子空间样本数,yi为第i个样本对应的真实输出,
Figure BDA0002731586480000042
为第i个样本对应的决策树的输出估计值;
S2022、在步骤S2021节点分裂的基础上得到的子节点上分别再选最优特征值进行下次分裂,最优分裂点的选取都以最小化均方误差MSE为准则,重复分裂过程直到树的最大深度数max_depth达到给定的阈值。
进一步的,步骤S203具体为:
S2031、设定子空间最大特征数目可搜索范围为1到最大特征数目,随机抽样子空间的个数可搜索范围为50~200,决策树的最大深度数可搜索范围为1~10;
S2032、在每个可搜索特征数目上、每个可搜索随机抽样子空间的个数上和每个可搜索最大深度数上,采用网格搜索法搜索每一组参数下,对应的决策树在训练集上的均方误差MSE;
S2033、选择最小的均方误差MSE对应的特征数目为随机子空间的最大特征数、对应的子空间个数为随机抽样子空间的数目n、对应的深度数作为决策树的最大深度数max_depth。
具体的,步骤S3具体为:
S301、构建包含输入层、两个隐含层和输出层的MLP神经网络,MLP神经网络的输入是各个随机抽样子空间上决策树的输出结果,隐含层每一个神经元对输入进行非线性运算,第一个隐含层第j个神经元的输出为:
Figure BDA0002731586480000043
第二个隐含层第k个神经元的输出为:
Figure BDA0002731586480000051
神经网络最终输出为:
Figure BDA0002731586480000052
采用ReLU激活函数如下:
f(x)=max(0,x)
S302、构建MLP损失函数,然后基于Adam算法训练MLP,MLP损失函数如下:
Figure BDA0002731586480000053
其中,第一项为模型预测值与真实值之间的误差平方和,y(i)为第i个样本对应的真实剩余寿命,m为参与训练的样本数,
Figure BDA0002731586480000054
为第i个样本对应的预测值;第二项为MLP模型中权值向量各个元素的平方和;a为平衡模型精度与复杂度的参数;n为MLP模型的输入变量个数,n1为第一个隐含层中神经元个数,
Figure BDA0002731586480000055
为输入层第i个输入到第一个隐含层第j个神经元的连接权值,n2为第二个隐含层中神经元个数,
Figure BDA0002731586480000056
为第一个隐含层第j个神经元到第二个隐含层第k个神经元的连接权值,j∈{1,2,...,n1},k∈{1,2,...,n2};
Figure BDA0002731586480000057
为第二个隐含层第k个神经元到输出的连接权值,b1、b2、b3为偏置分量。
具体的,步骤S4中,训练好MLP模型后,航空发动机的剩余使用寿命RUL计算如下:
RUL=MLP(trees_predict(test))
其中,test为需要预测RUL的航空发动机的各子空间特征向量组成的集合,trees_predict()表示在各随机子空间上建立的决策树集合,MLP()表示MLP模型对应的函数计算。
本发明的另一个技术方案是,一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行所述的方法中的任一方法。
本发明的另一个技术方案是,一种计算设备,包括:
一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行所述的方法中的任一方法的指令。
与现有技术相比,本发明至少具有以下有益效果:
本发明一种基于MLP集成随机抽样子空间决策树的发动机寿命预测方法,依据特征之间的相关程度去除信息冗余的特征,同时根据特征与预测目标之间的相关性去除与预测目标相关程度小的特征,基于随机抽样子空间和决策树探测不同特征组合下的预测结果,基于MLP自学习集成不同子空间对应的预测结果,以避免选取某一特定特征空间的困难和风险问题,又通过运用集成预测方法避免单一预测方法不够可靠和稳健的问题。
进一步的,通过去除原始特征空间中信息冗余的特征和与预测目标相关程度小的特征,有利于步骤S2更有效地随机选取特征子空间。
进一步的,根据Pearson相关系数大小进行特征选择,有利于去除冗余特征和与预测目标相关程度小的特征。
进一步的,在特征选择后得到的特征空间上进行随机抽样子空间的选取,有益于得到不同的特征组合,在随机抽样子空间上建立决策树有益于得到对应特征组合下的发动机剩余寿命预测结果。
进一步的,建立各随机抽样子空间上的决策树,有益于探测不同特征组合上的预测性能,得到不同特征组合空间上的发动机剩余寿命预测结果。
进一步的,通过网格搜索法寻找使得预测性能评价指标值MSE最佳的决策树参数,旨在得到各随机抽样子空间上的最佳预测性能。
进一步的,通过设计合理的网络结构、损失函数和训练算法学习得到MLP模型,基于建立的MLP模型可集成各随机抽样子空间上决策树的预测结果,给出更为准确和可靠的剩余寿命预测结果。
进一步的,得到用本发明方法计算的发动机剩余寿命预测结果,为航空发动机的保养和故障预测提供依据。
综上所述,本发明结合了特征选择、随机抽样子空间、决策树和MLP集成预测等各个模块的优势,有效挖掘已有数据中隐藏的信息,可用于航空发动机的剩余寿命预测。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为MLP集成随机抽样子空间决策树的航空发动机寿命预测方案示意图;
图2为相关分析热度图;
图3为MLP模型结构图;
图4为测试集上预测值与真实值对比图;
图5为各个剩余寿命区间上的平均绝对误差图;
图6为各个剩余寿命区间上的均方根误差图;
图7为各个剩余寿命区间上的预测准确率图。
具体实施方式
本发明提供了一种基于MLP集成随机抽样子空间决策树的发动机寿命预测方法、存储介质及计算设备,解决发动机状态关联参数多但不知何种特征组合对寿命预测更为有效的问题;该方法包括以下步骤:首先依据特征之间的相关程度去除信息冗余的特征,同时根据特征与预测目标之间的相关性去除与预测目标相关系数绝对值小于0.15的特征;然后随机选取抽样样本的特征子空间,以特征子空间中的特征属性为节点,以最小化均方误差为依据选择最优分裂节点,通过迭代分裂节点构建决策回归树,不同子空间上的决策树得到对应特征组合下的寿命预测结果;接着构建MLP模型结构和损失函数,通过Adam算法学习得到MLP模型参数;最后基于训练好的MLP模型集成多棵决策树的预测结果,得到发动机的剩余使用寿命。同现有方法相比,该方法探讨了不同特征组合空间上的发动机寿命预测结果,通过学习的方法集成不同子空间上的预测值,提高预测准确度和可靠性,为航空发动机的保养和故障预测提供依据。
请参阅图1,本发明一种基于MLP集成随机抽样子空间决策树的发动机寿命预测方法,对于监测到的发动机状态数据,先依据特征之间的相关程度去除信息冗余的特征,同时根据特征与预测目标之间的相关性去除与预测目标相关程度小的特征;然后随机选取抽样样本集,在随机抽样样本集上随机选取特征子空间,在得到的随机抽样子空间上建立决策回归树,得到不同子空间上对应的决策树;接着构建MLP模型结构和损失函数,通过Adam算法学习得到MLP模型参数;最后基于训练好的MLP模型集成多棵决策树的预测结果,得到发动机的剩余使用寿命。具体步骤如下:
S1、依据特征之间的相关程度去除发动机状态数据中信息冗余的特征,同时根据特征与预测目标之间的相关性去除与预测目标相关系数绝对值小于0.15的特征;
S101、相关性计算;
为了考查特征之间的相关程度,用Pearson相关系数表征两个特征之间的相关性。设有m个样本,每个样本有N维特征,第i个特征表示为Fi,第k个样本表示为xk=[xk1,xk2,...,xkN]T,Pearson相关系数定义如下:
Figure BDA0002731586480000091
其中,
Figure BDA0002731586480000092
Figure BDA0002731586480000093
Figure BDA0002731586480000094
分别表示样本在第i个特征和第j个特征上的取值均值;cov(Fi,Fj)表示两个特征Fi和Fj的协方差,是对两个随机变量联合分布线性相关程度的一种度量。为了剔除两个变量量纲影响,通过将协方差除以特征Fi和Fj的标准差,得到标准化后的特殊协方差,即Pearson相关系数。
Pearson相关系数的取值范围是[-1,1],Pearson相关系数大于0表示特征Fi和Fj正相关;Pearson相关系数小于0表示特征Fi和Fj负相关;Pearson相关系数等于0表示特征Fi和Fj不相关。
S102、特征选择;
通过计算出的Pearson相关系数来判断特征之间的相关程度,并根据相关系数大小进行特征选择,具体步骤如下:
S1021、任意两个特征之间的Pearson相关系数大于0.95的情况,去掉其中一个特征;
S1022、任意一个特征和剩余寿命这一目标之间的相关系数的绝对值小于0.15的情况,去掉该特征;
S1023、经过第一步和第二步处理后剩余的特征即为特征选择结果。
S2、随机选取抽样特征子空间,以特征子空间中的特征属性为节点,以最小化均方误差为依据选择最优分裂节点,通过迭代分裂节点构建决策回归树,得到不同抽样子空间上对应的决策树,不同抽样子空间上的决策树得到对应特征组合下的寿命预测结果;
S201、样本抽样和随机选择特征;
为了得到n个随机抽样子空间,使用Bootstrap随机抽样的方法重复n次得到n个抽样样本集。在每个抽样样本集上随机选择特征得到随机抽样子空间,该算法描述如下:
算法:基于Bootstrap随机抽样和随机选择特征子空间算法
输入:训练样本train_data
输出:n个抽样子空间样本集sub_new_train_data
算法描述:
1.给定抽样样本数l、子空间最大特征数目max_features
2.for i=1 to n
3.new_train_data[i]赋值为空
4.for j=1 to l
5.从train_data中随机抽取一个样本,放入new_train_data[i]集合中
6.end for
7.从new_train_data[i]中随机抽取max_features维特征构成子空间训练数据集sub_new_train_data[i]
8.end for
9.返回sub_new_train_data
S202、构建决策回归树
在每个随机抽样子空间样本集sub_new_train_data[i]上构建一颗决策树,n个随机抽样子空间样本集共构建n棵决策树。每棵树的构建步骤如下:
S2021、选择一个最优特征值进行节点分裂。穷举子空间上每个特征的每个取值找最好的分裂点,以均方误差(MSE,Mean Square Error)衡量分裂点的优劣。MSE是真实值与预测值的差值的平方然后求和平均,其计算公式如式(2)所示:
Figure BDA0002731586480000111
其中,l为随机抽样子空间样本数,yi为第i个样本对应的真实输出,
Figure BDA0002731586480000112
为第i个样本对应的决策树的输出估计值;
S2022、在前一步节点分裂的基础上得到的子节点上分别再选最优特征值进行下次分裂,最优分裂点的选取都以最小化MSE为准则,重复这样的分裂过程直到树的最大深度数max_depth达到给定的阈值。
S203、决策树相关参数寻优
构建决策树涉及的重要参数有:随机抽样子空间的个数、子空间最大特征数目、决策树的深度;用网格交叉验证方法解决模型的调参问题,先将训练集均分成3个不相交的子集,对每一组决策树参数先用两个子集建立决策树,然后用剩下的一个子集验证该决策树的性能,经过3次循环验证,平均MSE作为该参数下决策树的性能评价依据。
决策树相关参数寻优,具体步骤如下:
S2031、设定子空间最大特征数目可搜索范围为1到最大特征数目,随机抽样子空间的个数可搜索范围为50到200,决策树的最大深度数可搜索范围为1到10;
S2032、在每个可搜索特征数目上、每个可搜索随机抽样子空间的个数上和每个可搜索最大深度数上,采用网格搜索法搜索每一组参数下,对应的决策树在训练集上的预测性能评价值MSE;
S2033、选择最小的MSE对应的特征数目为随机抽样子空间的最大特征数、对应的随机抽样子空间的个数为寻优后随机抽样子空间的个数n、对应的深度数作为决策树的最大深度数。
S3、构建MLP模型结构和损失函数,通过Adam算法学习得到MLP模型参数;
S301、构建MLP模型结构;
请参阅图3,MLP是由多个神经元组成的一种网络模型,在每一个神经元上进行非线性运算,MLP神经网络的输入是各个子空间上决策树的输出结果,第一个隐含层第j个神经元的输出
Figure BDA0002731586480000121
为:
Figure BDA0002731586480000122
其中,n为MLP模型的输入变量个数,j∈{1,2,...,n1},n1为第一个隐含层中神经元个数,
Figure BDA0002731586480000123
为输入层第i个输入到第一个隐含层第j个神经元的连接权值,b1为偏置分量;
第二个隐含层第k个神经元的输出
Figure BDA0002731586480000124
为:
Figure BDA0002731586480000131
其中,k∈{1,2,...,n2},n2为第二个隐含层中神经元个数,
Figure BDA0002731586480000132
为第一个隐含层第j个神经元到第二个隐含层第k个神经元的连接权值,b2为偏置分量;
神经网络最终输出yo为:
Figure BDA0002731586480000133
其中,
Figure BDA0002731586480000134
为第二个隐含层第k个神经元到输出的连接权值,b3为偏置分量;
为了有选择地对决策树的输出进行组合预测,采用ReLU激活函数,形式如下式(7)所示:
f(x)=max(0,x) (7)
S302、构建MLP损失函数,基于Adam算法训练MLP;
为了减小MLP模型对训练数据的过度拟合,在设计训练损失函数时不仅考虑了误差平方和,还添加了正则项来约束模型的权重,从而降低模型的复杂度,损失函数定义如下式(8)所示:
Figure BDA0002731586480000135
其中,第一项为模型预测值与真实值之间的误差平方和,y(i)为第i个样本对应的真实剩余寿命,m为参与训练的样本数,
Figure BDA0002731586480000136
为第i个样本对应的预测值;第二项为MLP模型中权值向量各个元素的平方和;a为平衡模型精度与复杂度的参数。训练MLP模型时采用实际应用中收敛速度较快、学习效果较有效的Adam方法;
S4、基于MLP集成决策树的预测结果。
训练好MLP模型之后,对需要预测剩余使用寿命的航空发动机使用下式(9)计算:
RUL=MLP(trees_predict(test)) (9)
其中,test为需要预测RUL的航空发动机的各子空间特征向量组成的集合,trees_predict()表示在各随机子空间上建立的决策树集合,MLP()表示MLP模型对应的函数计算。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面通过NASA的C-MAPSS航空发动机数据集来验证本发明方法。数据集是NASA进行资产退化建模的非常著名的公共数据集,也是研究航空发动机寿命预测最常用的数据集之一。
数据集可进一步分为训练集和测试集;训练集包括100组发动机从正常状态到故障状态的变化数据,共有20631行,26列有效数据,测试集也包括100台发动机数据,用于验证算法性能。数据集第一列为发动机编码,第二列为使用周期数,第3、4、5列分别对应于发动机的三种操作模式,剩余的21列为传感器对应的测量值,表1给出了该数据集中21个属性的描述。在这26列数据中,第三种操作模式、设定风扇转速、设定核心机换算转速、风扇入口压力、风扇入口总温、燃烧室燃气比和发动机压比的数据值一直未发生改变,说明发动机使用寿命和这些数据无关。经过删除7个常数值的列,数据集中还有19个属性。另外,考虑发动机初期性能相对平稳,退化趋势不明显,即先经历性能正常阶段,运行一段时间后发生退化。据此,根据剩余寿命的分段模型,该模型将设备的剩余寿命划分成常数阶段和线性递减阶段,本发明根据分段模型的转折点,直接用使用周期数大于75的样本学习发动机的性能退化过程。
表1传感器数据集描述
Figure BDA0002731586480000151
Figure BDA0002731586480000161
步骤S1中,基于式(1)计算19个特征之间的Pearson相关系数以及预测目标RUL和各特征之间的相关系数,结果采用如图2所示的“热度图”表示。经过相关分析进行特征选择,最终选取的14个特征是T24、T30、T50、P30、Nf、Nc、Ps30、Phi、NRf、BPR、htBleed、W31、W32。
在步骤S203决策树相关参数寻优过程中,经过网格交叉验证得到决策树的最优参数为:n为70,最大子空间特征数为7,树的最大深度为5。
在步骤S3中,学习到的MLP参数为表2所示:
表2 MLP模型参数调优结果
Figure BDA0002731586480000162
Figure BDA0002731586480000171
请参阅图4,在步骤S4基于MLP集成决策树的预测结果中,给出了100个测试发动机样本上的预测值和真实值。
发动机剩余寿命预测的评价指标包括平均绝对误差(MAE)、均方根误差(RMSE)、惩罚得分、拟合优度(R2)以及准确率等多个指标值。
将发动机剩余寿命预测误差定义为LE=LP-LT,其中,LT表示发动机真实寿命,LP表示预测的剩余寿命。根据预测误差LE的大小,将预测结果分为提前预测、滞后预测和准确预测3种,当LE<-13时对应于提前预测,当LE>10时对应于滞后预测,当-13≤LE≤10时对应于准确预测。所以对应的预测准确率Accuracy定义为:
Figure BDA0002731586480000172
其中:
Figure BDA0002731586480000173
考虑到滞后预测比提前预测带来的后果可能更为严重,惩罚得分Score这一指标考虑了对滞后预测进行一个惩罚,其计算方法为:
Figure BDA0002731586480000174
MAE表示预测值与真实值之间绝对误差的平均值,其值越小说明预测值与真实值之间的偏差越小;计算公式如式(12)所示:
Figure BDA0002731586480000181
其中,y(i)为第i个样本对应的真实值,
Figure BDA0002731586480000182
为第i个样本对应的预测值。
RMSE表示预测值与真实值之间残差的样本标准差,这一指标可衡量预测结果的离散程度。其值越大说明离散程度越高。其计算公式如式(13)所示:
Figure BDA0002731586480000183
拟合优度R2的计算公式如式(14)所示:
Figure BDA0002731586480000184
其中,
Figure BDA0002731586480000185
为y(i),i=1,2,···,m的平均值。
100台测试发动机剩余寿命的相关指标值如表3所示。
表3 MLP集成随机抽样子空间决策树的发动机寿命预测性能指标结果
性能指标 MLP集成预测
Score 660.55
MAE 14.25
RMSE 19.04
R<sup>2</sup> 0.79
Accuracy 0.57
在发动机使用过程中,实际剩余寿命会随着维修保养等操作发生变化,使得越接近最终寿命时的预测越有意义。所以有必要分析当剩余寿命位于不同区间时,预测指标值的变化趋势。为了保证测试样本在每个区间都有一定的数目分布,本实施例中选取[0,30)、[30,60)、[60,90)、[90,120)、[120,150)共5个区间分析了平均绝对误差、均方根误差和预测准确率的变化情况,结果分别见图5、图6和图7所示。
请参阅图5,当真实剩余寿命处于[30,60)这一区间时,MAE值最小,为7.45,而当真实剩余寿命处于[0,30)时,MAE值相对于[60,90)、[90,120)、[120,150)区间的MAE值要小得多,此时MAE值为8.6。
请参阅图6,RMSE在各个区间的取值大小规律和MAE的相同,在[0,30)区间内RMSE取值为12.29,[30,60)区间内对应的取值为9.64。
从图7预测准确率随剩余寿命区间分布来看,当剩余寿命在最短的区间[0,30)时,准确率最高,其值为0.72。这符合当发动机使用周期越接近于其真实寿命时,希望其预测越准确的应用需求。
综上所述,本发明一种发动机寿命预测方法、存储介质及计算设备,随机选取抽样特征子空间探测了不同特征组合,借助于决策树得到了不同子空间上发动机的剩余寿命,应用MLP集成了不同子空间上决策树的预测结果,得到了航空发动机剩余使用寿命。实验结果验证了本方法的实用性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

Claims (10)

1.一种发动机寿命预测方法,其特征在于,包括以下步骤:
S1、依据特征之间的相关程度去除发动机状态数据中信息冗余的特征,同时根据特征与预测目标之间的相关性去除与预测目标相关系数绝对值小于0.15的特征;
S2、随机选取抽样特征子空间,以抽样特征子空间中的特征属性为节点,以最小化均方误差为依据选择最优分裂节点,通过迭代分裂节点构建决策回归树,得到不同抽样特征子空间上对应的决策树,不同抽样特征子空间上的决策树得到对应特征组合下的寿命预测结果;
S3、构建MLP模型结构和损失函数,通过Adam算法学习得到MLP模型参数;
S4、基于训练好的MLP模型集成多棵决策树的预测结果,得到发动机的剩余使用寿命。
2.根据权利要求1所述的方法,其特征在于,步骤S1具体为:
S101、设有m个样本,每个样本有N维特征,第i个特征表示为Fi,第k个样本表示为xk=[xk1,xk2,...,xkN]T,计算每两个特征之间以及每个特征和预测目标之间的Pearson相关系数;
S102、通过Pearson相关系数判断特征之间以及特征和预测目标之间的相关程度,根据相关系数进行特征选择。
3.根据权利要求2所述的方法,其特征在于,步骤S102具体为:
S1021、任意两个特征之间的Pearson相关系数大于0.95时,去掉其中一个特征;
S1022、任意一个特征和剩余寿命目标间相关系数的绝对值小于0.15时,去掉对应特征;
S1023、经过步骤S1021和S1022处理后剩余的特征作为特征选择结果。
4.根据权利要求1所述的方法,其特征在于,步骤S2具体为:
S201、使用Bootstrap随机抽样的方法重复n次得到n个抽样样本集;在每个抽样样本集上随机选择特征得到随机抽样子空间;
S202、在每个随机抽样子空间样本集sub_new_train_data[i]上构建一颗决策树,n个随机抽样子空间样本集共构建n棵决策树;
S203、决策树相关参数寻优。
5.根据权利要求4所述的方法,其特征在于,步骤S202具体为:
S2021、对每个随机抽样子空间样本集sub_new_train_data[i],选择一个最优特征值进行节点分裂;最优分裂点的选取以最小化均方误差MSE为准则,均方误差MSE是真实值与预测值的差值的平方然后求和平均,计算如下:
Figure FDA0002731586470000021
其中,l为随机抽样子空间样本数,yi为第i个样本对应的真实输出,
Figure FDA0002731586470000022
为第i个样本对应的决策树的输出估计值;
S2022、在步骤S2021节点分裂的基础上得到的子节点上分别再选最优特征值进行下次分裂,重复分裂过程直到树的最大深度数max_depth达到给定的阈值。
6.根据权利要求4所述的方法,其特征在于,步骤S203具体为:
S2031、设定子空间最大特征数目可搜索范围为1到最大特征数目,随机抽样子空间的个数可搜索范围为50~200,决策树的最大深度数可搜索范围为1~10;
S2032、在每个可搜索特征数目上、每个可搜索随机抽样子空间的个数上和每个可搜索最大深度数上,采用网格搜索法搜索每一组参数下,对应的决策树在训练集上的均方误差MSE;
S2033、选择最小的均方误差MSE对应的特征数目为随机子空间的最大特征数、对应的子空间个数为随机抽样子空间的数目n、对应的深度数作为决策树的最大深度数max_depth。
7.根据权利要求1所述的方法,其特征在于,步骤S3具体为:
S301、构建包含输入层、两个隐含层和输出层的MLP神经网络,MLP神经网络的输入是各个随机抽样子空间上决策树的输出结果,隐含层每一个神经元对输入进行非线性运算,第一个隐含层第j个神经元的输出为:
Figure FDA0002731586470000031
第二个隐含层第k个神经元的输出为:
Figure FDA0002731586470000032
神经网络最终输出为:
Figure FDA0002731586470000033
采用ReLU激活函数如下:
f(x)=max(0,x)
S302、构建MLP损失函数,然后基于Adam算法训练MLP,MLP损失函数如下:
Figure FDA0002731586470000034
其中,第一项为模型预测值与真实值之间的误差平方和,y(i)为第i个样本对应的真实剩余寿命,m为参与训练的样本数,
Figure FDA0002731586470000035
为第i个样本对应的预测值;第二项为MLP模型中权值向量各个元素的平方和;a为平衡模型精度与复杂度的参数;n为MLP模型的输入变量个数,n1为第一个隐含层中神经元个数,
Figure FDA0002731586470000041
为输入层第i个输入到第一个隐含层第j个神经元的连接权值,n2为第二个隐含层中神经元个数,
Figure FDA0002731586470000042
为第一个隐含层第j个神经元到第二个隐含层第k个神经元的连接权值,j∈{1,2,...,n1},k∈{1,2,...,n2};
Figure FDA0002731586470000043
为第二个隐含层第k个神经元到输出的连接权值,b1、b2、b3为偏置分量。
8.根据权利要求1所述的方法,其特征在于,步骤S4中,训练好MLP模型后,航空发动机的剩余使用寿命RUL计算如下:
RUL=MLP(trees_predict(test))
其中,test为需要预测RUL的航空发动机的各子空间特征向量组成的集合,trees_predict()表示在各随机子空间上建立的决策树集合,MLP()表示MLP模型对应的函数计算。
9.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至8所述的方法中的任一方法。
10.一种计算设备,其特征在于,包括:
一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1至8所述的方法中的任一方法的指令。
CN202011119733.9A 2020-10-19 2020-10-19 一种发动机寿命预测方法、存储介质及计算设备 Active CN112231980B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011119733.9A CN112231980B (zh) 2020-10-19 2020-10-19 一种发动机寿命预测方法、存储介质及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011119733.9A CN112231980B (zh) 2020-10-19 2020-10-19 一种发动机寿命预测方法、存储介质及计算设备

Publications (2)

Publication Number Publication Date
CN112231980A true CN112231980A (zh) 2021-01-15
CN112231980B CN112231980B (zh) 2024-06-07

Family

ID=74118430

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011119733.9A Active CN112231980B (zh) 2020-10-19 2020-10-19 一种发动机寿命预测方法、存储介质及计算设备

Country Status (1)

Country Link
CN (1) CN112231980B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239963A (zh) * 2021-04-13 2021-08-10 联合汽车电子有限公司 车辆数据的处理方法、装置、设备、车辆和存储介质
CN113505532A (zh) * 2021-07-06 2021-10-15 新智数字科技有限公司 设备剩余寿命预测方法、装置、计算机设备及介质
CN113722989A (zh) * 2021-08-23 2021-11-30 南京航空航天大学 一种基于cps-dp模型的航空发动机寿命预测方法
CN114549939A (zh) * 2022-04-26 2022-05-27 汉谷云智(武汉)科技有限公司 一种基于图像特征提取的树木病虫害图片分类方法
CN117054104A (zh) * 2023-08-15 2023-11-14 广州天马集团天马摩托车有限公司 一种摩托车发动机性能测试平台及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8781982B1 (en) * 2011-09-23 2014-07-15 Lockheed Martin Corporation System and method for estimating remaining useful life
CN109472110A (zh) * 2018-11-29 2019-03-15 南京航空航天大学 一种基于lstm网络和arima模型的航空发动机剩余使用寿命预测方法
CN109766583A (zh) * 2018-12-14 2019-05-17 南京航空航天大学 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法
CN110222371A (zh) * 2019-05-05 2019-09-10 北京大学 基于贝叶斯和神经网络的发动机剩余寿命在线预测方法
CN110245745A (zh) * 2019-05-30 2019-09-17 华中科技大学 基于集成双向循环神经网络的设备剩余使用寿命预测方法
CN110555230A (zh) * 2019-07-12 2019-12-10 北京交通大学 基于集成gmdh框架的旋转机械剩余寿命预测方法
CN110807257A (zh) * 2019-11-04 2020-02-18 中国人民解放军国防科技大学 航空发动机剩余寿命预测方法
US20200184131A1 (en) * 2018-06-27 2020-06-11 Dalian University Of Technology A method for prediction of key performance parameter of an aero-engine transition state acceleration process based on space reconstruction
CN111274737A (zh) * 2020-02-25 2020-06-12 山东大学 一种机械设备剩余使用寿命预测方法及系统
CN111639467A (zh) * 2020-06-08 2020-09-08 长安大学 一种基于长短期记忆网络的航空发动机寿命预测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8781982B1 (en) * 2011-09-23 2014-07-15 Lockheed Martin Corporation System and method for estimating remaining useful life
US20200184131A1 (en) * 2018-06-27 2020-06-11 Dalian University Of Technology A method for prediction of key performance parameter of an aero-engine transition state acceleration process based on space reconstruction
CN109472110A (zh) * 2018-11-29 2019-03-15 南京航空航天大学 一种基于lstm网络和arima模型的航空发动机剩余使用寿命预测方法
CN109766583A (zh) * 2018-12-14 2019-05-17 南京航空航天大学 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法
CN110222371A (zh) * 2019-05-05 2019-09-10 北京大学 基于贝叶斯和神经网络的发动机剩余寿命在线预测方法
CN110245745A (zh) * 2019-05-30 2019-09-17 华中科技大学 基于集成双向循环神经网络的设备剩余使用寿命预测方法
CN110555230A (zh) * 2019-07-12 2019-12-10 北京交通大学 基于集成gmdh框架的旋转机械剩余寿命预测方法
CN110807257A (zh) * 2019-11-04 2020-02-18 中国人民解放军国防科技大学 航空发动机剩余寿命预测方法
CN111274737A (zh) * 2020-02-25 2020-06-12 山东大学 一种机械设备剩余使用寿命预测方法及系统
CN111639467A (zh) * 2020-06-08 2020-09-08 长安大学 一种基于长短期记忆网络的航空发动机寿命预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
彭鸿博;蒋雄伟;: "基于相关向量机的发动机剩余寿命预测", 科学技术与工程, no. 18, 30 June 2020 (2020-06-30) *
高峰;曲建岭;袁涛;高峰娟;: "基于改进差分时域特征和深度学习优化的航空发动机剩余寿命预测算法", 电子测量与仪器学报, no. 03, 31 March 2019 (2019-03-31) *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239963A (zh) * 2021-04-13 2021-08-10 联合汽车电子有限公司 车辆数据的处理方法、装置、设备、车辆和存储介质
CN113239963B (zh) * 2021-04-13 2024-03-01 联合汽车电子有限公司 车辆数据的处理方法、装置、设备、车辆和存储介质
CN113505532A (zh) * 2021-07-06 2021-10-15 新智数字科技有限公司 设备剩余寿命预测方法、装置、计算机设备及介质
CN113505532B (zh) * 2021-07-06 2023-12-29 新奥新智科技有限公司 设备剩余寿命预测方法、装置、计算机设备及介质
CN113722989A (zh) * 2021-08-23 2021-11-30 南京航空航天大学 一种基于cps-dp模型的航空发动机寿命预测方法
CN113722989B (zh) * 2021-08-23 2023-04-28 南京航空航天大学 一种基于cps-dp模型的航空发动机寿命预测方法
CN114549939A (zh) * 2022-04-26 2022-05-27 汉谷云智(武汉)科技有限公司 一种基于图像特征提取的树木病虫害图片分类方法
CN117054104A (zh) * 2023-08-15 2023-11-14 广州天马集团天马摩托车有限公司 一种摩托车发动机性能测试平台及系统
CN117054104B (zh) * 2023-08-15 2024-02-06 广州天马集团天马摩托车有限公司 一种摩托车发动机性能测试平台及系统

Also Published As

Publication number Publication date
CN112231980B (zh) 2024-06-07

Similar Documents

Publication Publication Date Title
CN112231980B (zh) 一种发动机寿命预测方法、存储介质及计算设备
Yuan et al. Hierarchical quality-relevant feature representation for soft sensor modeling: A novel deep learning strategy
CN111222549B (zh) 一种基于深度神经网络的无人机故障预测方法
CN110827921B (zh) 一种单细胞聚类方法、装置、电子设备及存储介质
Jiang et al. Deep discriminative representation learning for nonlinear process fault detection
CN114399032B (zh) 一种电能表计量误差预测方法及系统
Chen et al. Aero-engine remaining useful life prediction method with self-adaptive multimodal data fusion and cluster-ensemble transfer regression
CN114139589A (zh) 故障诊断方法、装置、设备与计算机可读存储介质
You et al. A variable relevant multi-local PCA modeling scheme to monitor a nonlinear chemical process
Chen et al. Convolution-graph attention network with sensor embeddings for remaining useful life prediction of turbofan engines
Li et al. A light attention-mixed-base deep learning architecture toward process multivariable modeling and knowledge discovery
CN113837266A (zh) 一种基于特征提取和Stacking集成学习的软件缺陷预测方法
Wang et al. Soft sensor modeling method by maximizing output-related variable characteristics based on a stacked autoencoder and maximal information coefficients
Jiang et al. Multi-objective optimal placement of sensors based on quantitative evaluation of fault diagnosability
CN114970353A (zh) 基于缺失数据填充的mswi过程二噁英排放软测量方法
CN115174263B (zh) 攻击路径动态决策方法与装置
CN113642029B (zh) 一种度量数据样本与模型决策边界相关性的方法及系统
CN116186507A (zh) 一种特征子集的选取方法、装置及存储介质
CN115169521A (zh) 一种保持预测顺序和结构依赖关系的图神经网络解释方法
Qi et al. Adaptive time window convolutional neural networks concerning multiple operation modes with applications in energy efficiency predictions
Tchendjou et al. Evaluation of machine learning algorithms for image quality assessment
KR20110056046A (ko) 타이어의 성능 평가 방법
Antonelli et al. Feature selection based on fuzzy mutual information
Ren et al. A network structure for industrial process fault diagnosis based on hyper feature extraction and stacked LSTM
Zhou et al. Mining dependencies considering time lag in spatio-temporal traffic data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant