CN112329337A - 基于深度强化学习的航空发动机剩余使用寿命估计方法 - Google Patents
基于深度强化学习的航空发动机剩余使用寿命估计方法 Download PDFInfo
- Publication number
- CN112329337A CN112329337A CN202011144498.0A CN202011144498A CN112329337A CN 112329337 A CN112329337 A CN 112329337A CN 202011144498 A CN202011144498 A CN 202011144498A CN 112329337 A CN112329337 A CN 112329337A
- Authority
- CN
- China
- Prior art keywords
- service life
- engine
- life estimation
- value
- aircraft engine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000002787 reinforcement Effects 0.000 title claims abstract description 29
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 43
- 238000013136 deep learning model Methods 0.000 claims abstract description 22
- 230000008569 process Effects 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims abstract description 15
- 230000003993 interaction Effects 0.000 claims abstract description 11
- 230000009471 action Effects 0.000 claims abstract description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 15
- 238000012544 monitoring process Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 7
- 238000011217 control strategy Methods 0.000 claims description 6
- 238000001816 cooling Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 6
- 230000002452 interceptive effect Effects 0.000 claims description 6
- 230000003068 static effect Effects 0.000 claims description 6
- 230000008901 benefit Effects 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 claims description 4
- 230000007704 transition Effects 0.000 claims description 4
- 238000002485 combustion reaction Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000012546 transfer Methods 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims 2
- 238000012423 maintenance Methods 0.000 abstract description 9
- 230000009286 beneficial effect Effects 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/04—Ageing analysis or optimisation against ageing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明提供一种基于深度强化学习的航空发动机剩余使用寿命估计方法,根据航空发动机寿命估计的需求和特点,将其视为一种序列性的决策问题,因此建立对应的马尔可夫决策过程模型。针对此马尔可夫模型,制定了状态动作奖赏等交互规则,同时设计了寿命估计奖励函数,并且根据航空发动机寿命估计数据的特点,提出了寿命估计策略的深度学习模型。最后,利用深度强化学习算法,在此马尔可夫模型中学得最优的航空发动机寿命估计估计策略。本发明克服了传统的监督学习方法所带来的过拟合风险,有利于求得更优的航空发动机寿命估计策略,可以提高航空发动机寿命估计的准确度,改善视情维修的及时性,增强飞机飞行的安全性,节省不必要的维护费用。
Description
技术领域
本发明针对航空发动机剩余使用寿命估计领域,首先将航空发动机剩余使用寿命估计问题建模为马尔可夫序列决策过程模型,然后利用深度强化学习(DeepReinforcement Learning)算法求得最优的剩余使用寿命估计策略,从而提高航空发动机剩余使用寿命估计的准确度。
背景技术
由于老化或其他突发状况,当代的工业系统有时会发生严重的故障。因此机器的维护管理在现代工业活动中起着关键的作用。视情维修(Condition-based Maintenance,CBM)作为一种高效的维护策略,已经被广泛应于现代的工业系统中。预断学(Prognostics)作为CBM实施的关键推动力,在CBM中起着重要的作用。预断技术通常备被用来分析所收集到的机器状况监控数据(Condition Monitoring,CM)。通过对CM数据的分析,机器的潜在故障信息可以被提前诊断出,因此可以安排适当及时的维修。CBM可以用来避免发生灾难性的错误,并且减少不必要的维修损失。在预断学中,一个关键性的技术即是对机器的剩余使用寿命进行估计(remaining useful life,RUL)。RUL表示机器距离发生故障或失效所剩余的使用时间。只要准备的预估出RUL的数值,则机器的故障时间可以提前准确的预知,相应的维修计划也可以及时得到安排。因此一个准确的剩余使用寿命估计模型可以提高系统的可靠性,改善机器维护的高效性,并且节省不必要的经济损失。由于其种种优点以及重要性,剩余使用寿命估计已经吸引了许多研究兴趣。
通常,目前存在的剩余使用寿命估计的方法可以分为三类:1)基于模型的方法。2)句驱动的方法。3)混合方法。若给出准确地物理系统退化过程模型,基于模型的方法可以准确的预估出剩余使用寿命值。然而,这种建模需要大量的对物理系统的先验知识,然而这些先验知识在实际过程中通常难以获得。另一方面,数据驱动的方法可以直接学习到机器的状态监控数据与剩余使用寿命之间的映射关系。在数据驱动方法中,无需关于机械系统的先验知识。并且随着传感器技术的发展,可以收集越来越多的机器监控数据。因此,基于数据驱动的方法目前在剩余使用寿命领域越来越受欢迎。
机器学习算法具有较强的泛化能力。近些年来,在数据驱动方法领域,越来越多的机器学习法被用来学习剩余使用寿命与机器监控数据之间的映射关系。例如,在2016年,支持向量回归(Support Vector Regression,SVR)算法被用来进行剩余使用寿命估计。在2016年,卷积神经网络(Convolutional Neural Networks,CNN)被用来进行剩余使用寿命估计方法的研究。同样在2016年,随机森林(Random Forest(RF)),梯度提升(GradientBoosting,GB),极限学习机(Extreme Learning Machine,ELM)算法,多层感知机(Multi-layer Perceptron,MLP),深度置信神经网络(Deep Belief Network,DBN)算法,被应用于剩余使用寿命估计。在2016年,多目标进化算法集成的深度置信神经网络被提出,用于剩余使用寿命估计。在2017年,长短时记忆神经网络(Long Short-Term Memory networks,LSTM)被应用于剩余使用寿命估计。在2018年,双向的LSTM神经网络被应用于使用寿命估计。在2019年,CNN混合LSTM被提出应用于剩余使用寿命估计。在2020年,双向门循环单元和CNN的混合算法被提出,并成功应用于航空发动机寿命估计领域,取得了优异的效果。
虽然许多机器学习的算法被应用于剩余使用寿命估计领域,但他们都属于监督学习算法的范畴,遵循相同的学习模式。在这种训练模式下,通过拟合训练集数据,来学习到一个剩余使用寿命估计模型,从而用于生产环境中的剩余使用寿命估计问题。但监督学习普遍存在过拟合的风险,因此为了避免过拟合,只能早停或其他的防治过拟合的策略,然而,这种处理方式会阻止对更优的剩余使用寿命估计策略的探索与发现。因此目前的机器学习算法,在航空发动机寿命估计领域存在一定的性能缺陷。作为机器学习算法的另一个分支,强化学习在未知环境探索中有着强大的能力。不同于监督学习算法,基于标签化的训练集学得一个剩余使用寿命估计模型,深度强化学习从未知环境中通过试错,逐步学得一个具有较强泛化性的策略。近些年来强化学习已经应用于许多交叉领域。
深度强化学习(Deep Reinforcement Learning,DRL)算法由Google DeepMind团队提出,是强化学习和和深度学习的一种结合。自提出以来,深度强化学习被广泛应用游戏、机器人控制以及金融等领域。深度强化学习通过与环境模型的交互,逐渐学得最优的控制策略。近年来深度强化学习已经成功解决了许多之前挑战性的序列性决策问题。例如,Mnih等提出了基于卷积神经网络的深度强化学习,并直接从游戏画面的高维输入中成功学习了控制策略。目前关于将深度强化学习应用于航空发动机剩余使用寿命估计领域的方法研究尚属空白。大部分的数据驱动方面的研究还是局限于监督学习算法领域。因此目前的方法存在一定的过拟合风险,会引起一定的性能缺陷。
发明内容
发明目的:
为了突破当前剩余使用寿命估计领域的基于数据驱动算法中,仅采用监督学习方法存在的局限,本发明将深度强化学习引入到航空发动机剩余使用寿命估计领域。针对航空发动机剩余使用寿命估计任务,首先将该估计问题建模为马尔可夫序列决策过程模型,然后利用深度强化学习算法求得最优的剩余使用寿命估计策略,从而提高航空发动机剩余使用寿命估计的准确度。
技术方案:
一种基于深度强化学习的航空发动机剩余使用寿命估计方法,包括以下步骤:
步骤1:收集航空发动机状态监控传感器数据以及对应的剩余使用寿命值,并对原始数据进行归一化。每个数据样本为一个数据对,其中包括传感器参数数据以及对应的航空发动机剩余使用寿命值。对收集到的航空发动机剩余使用寿命数据随机编号,组成带编号的航空发动机剩余使用寿命历史数据库。传感器监控数据主要包括21种数据,分别为:风扇进口总温、低压压气机出口总温、高压压气机出口总温、低压涡轮出口总温、风扇进口压力、外涵道总压、高压压气机出口总压、风扇物理转速、核心机物理转速、发动机压比、高压压气机出口静压、耗油率与高压压气机出口静压之比、修正风扇转速、修正核心机转速、外涵比、燃烧室油气比、抽气焓、额定风扇转速、额定修正风扇转速、高压涡轮冷却气抽气量、低压涡轮冷却气抽气量。航空发动机剩余使用寿命值为大于0的整数,表示发动机剩余使用周期。
步骤2:基于步骤1所建立的航空发动机剩余使用寿命历史数据库,对传统的航空发动机剩余使用寿命估计过程,建立其对应的马尔可夫决策过程模型,该马尔可夫模型主要包括以下内容:
1)状态:发动机寿命估计模型的状态量st即为发动机传感器数据样本,包括上述的21种航空发动机可测参数。
2)初始状态:初始状态即为航空发动机剩余使用寿命数据库中,第一个样本的传感器数据值。
3)动作:动作值at即为对发动机传感器故障数据所作的剩余使用寿命估计值,为大于0的实数。
4)奖励函数:奖励值rt表征当前的航空发动机寿命估计策略,对当前样本所作剩余使用寿命估计的准确度,定义如下:
5)状态转移概率:在航空发动机剩余使用寿命估计马尔可夫决策过程模型中,状态转移概率P(st+1|st,at)为确定值,即马尔可夫环境按照航空发动机剩余使用寿命数据库中的样本顺序,由当前样本st转移到下一样本st+1。
6)剩余使用寿命估计策略πθ:策略πθ实现对当前航空发动机传感器数据样本剩余使用寿命的估计。本发明使用深度学习模型来构建剩余使用寿命估计策略,输出值即为当前样本的剩余使用寿命值。
7)终止:当马尔可夫模型转移到航空发动机剩余使用寿命数据库中的终止状态是,当前估计交互任务终止,返回终止信号Terminal。
步骤3:初始化航空发动机寿命估计策略深度学习模型,本发明使用的深度学习模型为卷积神经网络与全连接神经网络模型(Fully Connected Networks,FCN)的组合模型。如图1所示,当前的发动机状态监控数据(st)输入航空发动机寿命估计深度学习模型,依次经过CNN、FCN层处理,最后输出控制策略数据,或者值函数。
本发明所提供的航空发动机寿命估计深度学习模型中,共有两个CNN层,每层包括一个卷积层和一个池化层。因此CNN模型由两层卷积(Convolution)层、两层最大池化层(Max-pooling)组成。CNN中的卷积层运算定义为:
zi=tanh(I*fi+bi) (7)
其中I为输入矩阵,*表示卷积操作,fi表示第i个卷积层,bi表示卷积层中的误差项。在本发明使用的CNN层中,采用了tanh激活函数。假设卷积层由F个过滤器组成,则输出即为Z=[z1,z2,…,zF]。最大池化层的运算操作定义为:
gi=MaxPooling(Pi) (8)
意味着在矩阵中取最大值。Pi是卷积层输出的矩阵。CNN层的输出,输出到FCN层中,经过全连接运算,即可得到相应的输出。最后初始化迭代次数i=0,最大迭代次数N,航空发动机寿命估计数据总数n。
步骤4:初始化交互步数t=0。
步骤5:根据当前的航空发动机寿命估计策略深度学习模型,对当前接收到的航空发动机传感器特征数据进行一次剩余使用寿命估计,根据剩余使用寿命估计值以及实际剩余使用寿命值,马尔可夫模型给出相应的奖励值。并将当前估计交互数据存储,估计交互数据包括:当前的状态、执行剩余使用寿命估计值、奖励值。并判断是都已经到达终止状态:t≥n?,若满足条件,则进行下一步,否则继续与航空发动机寿命估计马尔可夫模型进行估计交互。
步骤6:基于最新的n步剩余使用寿命估计交互数据,使用深度强化学习算法,对当前的剩余使用寿命估计策略深度学习模型进行更新,并增加迭代次数:i=i+1。判断i≥N?,若满足条件则终止训练,否则返回步骤4继续训练。本发明所采用的深度强化学习算法为Proximal Policy Optimization(PPO)算法。将由深度学习模型表示发动机控制策略记为πθ,其中θ表示该神经网络的所有权重系数。则使用PPO算法,θ更新公式如下:
其中LCLIP是PPO算法中的替代性目标函数,定义如下:
其中表示在状态s采取动作a的优势值。∈是一个超参数,表示策略更新的上限。clip函数将策略更新限制在1-∈和1+∈之间。在PPO算法中,基于值函数Vμ(st)计算而得。Vμ(st)同样是由深度学习模型所表示。Vμ(st)表示是马尔可夫模型中的期望返回奖励值,μ表示深度学习模型的所有超参数。值函数的更新通过梯度下降算法,最小化以下均方根误差:
有益效果:
通过将传统的航空发动机剩余使用寿命估计问题,建立对应的马尔可夫决策过程模型,可以使用深度强化学习来学习得最优的航空发动机剩余使用寿命估计策略。本发明所提供的方法避免了传统基于监督学习算法的航空发动机寿命估计算法中所存在的过拟合以及性能缺陷问题。同时本发明所提供的方法具有较强的泛化性,在实际使用过程中,可以提供更准确的剩余使用寿命估计精度。
附图说明
图1为航空发动机剩余使用寿命估计深度学习模型;
图2为航空发动机剩余使用寿命估计马尔可夫决策过程图;
图3为训练发动机传感器数据分布图;
图4为原始数据归一化效果图;
图5为测试发动机剩余使用寿命估计效果曲线。
具体实施例
本实施例采用航空发动机传感器状态监控数据,该数据由21个传感器收集而得,主要包括:风扇进口总温、低压压气机出口总温、高压压气机出口总温、低压涡轮出口总温、风扇进口压力、外涵道总压、高压压气机出口总压、风扇物理转速、核心机物理转速、发动机压比、高压压气机出口静压、耗油率与高压压气机出口静压之比、修正风扇转速、修正核心机转速、外涵比、燃烧室油气比、抽气焓、额定风扇转速、额定修正风扇转速、高压涡轮冷却气抽气量、低压涡轮冷却气抽气量。
发动机的原始传感器数据集分布如图3所示。在使用本发明所提供的基于深度强化学习的航空发动机剩余使用寿命估计方法之前,首先对原始传感器数据进行归一化处理。归一化处理公式定义如下:
其中x(m,f)为原始数据,为归一化后的数据,m表示M个可能的发动机失效退化故障原因,f表示第f个传感器数据。μ(m,f)和σ(m,f)分别表示原始数据分布的均值和方差。归一化数据和未归一化数据的对比如图4所示,可以看出,经过归一化后的数据显示出明显的蜕化趋势。
将归一化处理后的数据随机编号,组成带编号的航空发动机剩余使用寿命历史数据库。基于该数据库,对传统的航空发动机剩余使用寿命估计过程,建立其对应的马尔可夫决策过程模型,该马尔可夫决策过程的交互如图2所示。初始化航空发动机寿命估计策略深度学习模型。每交互n步则使用PPO算法对当前的航空发动机寿命估计策略深度学习模型进行更新,记该策略模型为πθ,其中θ表示该神经网络的所有权重系数。则使用PPO算法,θ更新公式如下:
其中LCLIP是PPO算法中的替代性目标函数,定义如下:
经过更新N步后,即可学习到最优的航空发动机寿命估计策略。为了评估所学的策略的剩余使用寿命表现效果,采用均方误差判据(Root mean squared error,RMSE),其定义如下:
其中T表示测试集的样本数,di=RULi-RULi表示剩余使用寿命的估计值与实际值之间的误差。将本发明所提高方法取得的效果与传统的监督学习方法作对比,对比结果如表1所示,其中DRLRULe即为本发明所提供的方法。表中斜体粗体下划线表示的分数代表第一名。斜体粗体表示的分数代表第二名。由结果对比可以看出,相比于其他传统的监督学习算法,本发明所提供的方法取得了优异的剩余使用寿命估计效果。
为了直观显示学得的剩余使用寿命估计策略的表现,本次实验挑选了四台测试发动机的传感器数据值,使用学得的剩余使用寿命估计策略对其进行估计。如图5所示,估计而得的剩余使用寿命与实际值非常吻合,而且精度较高。因此本发明所提供的方法可以提高剩余使用寿命估计的精度。
表1剩余使用寿命估计效果对比
Claims (6)
1.一种基于深度强化学习的航空发动机剩余使用寿命估计方法,其特征在于,包括如下步骤:
步骤1:收集航空发动机状态监控传感器数据以及对应的剩余使用寿命值,组成航空发动机剩余使用寿命历史数据库;
步骤2:基于步骤1中的航空发动机剩余使用寿命历史数据库,对传统的航空发动机剩余使用寿命估计过程,建立其对应的马尔可夫决策过程模型;
步骤3:初始化航空发动机寿命估计策略深度学习模型,迭代次数i=0,最大迭代次数N,航空发动机寿命估计数据总数n;
步骤4:初始化交互步数t=0;
步骤5:根据当前的航空发动机寿命估计策略深度学习模型,对当前接收到的航空发动机传感器特征数据进行一次剩余使用寿命估计,根据剩余使用寿命估计值以及实际剩余使用寿命值,马尔可夫模型给出相应的奖励值;并将当前估计交互数据存储,并判断是都已经到达终止状态:t≥n?,若满足条件,则进行下一步,否则继续与航空发动机寿命估计马尔可夫模型进行估计交互;
步骤6:基于最新的n步剩余使用寿命估计交互数据,使用深度强化学习算法,对当前的剩余使用寿命估计策略深度学习模型进行更新,并增加迭代次数:i=i+1,判断i≥N?,若满足条件则终止训练,否则返回步骤4继续训练。
2.根据权利要求1所述的一种基于深度强化学习的航空发动机剩余使用寿命估计算法,其特征在于,步骤1中的航空发动机状态监控传感器数据包括21种航空发动机可测参数,分别为:风扇进口总温、低压压气机出口总温、高压压气机出口总温、低压涡轮出口总温、风扇进口压力、外涵道总压、高压压气机出口总压、风扇物理转速、核心机物理转速、发动机压比、高压压气机出口静压、耗油率与高压压气机出口静压之比、修正风扇转速、修正核心机转速、外涵比、燃烧室油气比、抽气焓、额定风扇转速、额定修正风扇转速、高压涡轮冷却气抽气量、低压涡轮冷却气抽气量。
3.根据权利要求2所述的一种基于深度强化学习的航空发动机剩余使用寿命估计算法,其特征在于,步骤2中,针对航空发动机剩余使用寿命估计过程,建立其对应的马尔可夫决策过程模型,包括以下内容:
1)状态:发动机寿命估计模型的状态量st即为发动机传感器数据样本,包括所述的21种航空发动机可测参数;
2)初始状态:初始状态即为航空发动机剩余使用寿命数据库中,第一个样本的传感器数据值;
3)动作:动作值at即为对发动机传感器故障数据所作的剩余使用寿命估计值,为大于0的实数;
4)奖励函数:奖励值rt表征当前的航空发动机寿命估计策略,对当前样本所作剩余使用寿命估计的准确度,定义如下:
5)状态转移概率:在航空发动机剩余使用寿命估计马尔可夫决策过程模型中,状态转移概率P(st+1|st,at)为确定值,即马尔可夫环境按照航空发动机剩余使用寿命数据库中的样本顺序,由当前样本st转移到下一样本st+1;
6)剩余使用寿命估计策略πθ:策略πθ实现对当前航空发动机传感器数据样本剩余使用寿命的估计;
7)终止:当马尔可夫模型转移到航空发动机剩余使用寿命数据库中的终止状态是,当前估计交互任务终止,返回终止信号Terminal。
4.根据权利要求1所述的一种基于深度强化学习的航空发动机剩余使用寿命估计算法,其特征在于,步骤3中的深度学习模型为卷积神经网络及全连接神经网络的组合模型,当前的发动机状态监控数据st输入航空发动机寿命估计深度学习模型,依次经过卷积神经网络、全连接神经网络处理,最后输出控制策略数据或者值函数。
5.根据权利要求1所述的一种基于深度强化学习的航空发动机剩余使用寿命估计算法,其特征在于,步骤6中采用的深度强化学习算法为PPO算法,具体步骤包括:将由深度学习模型表示发动机控制策略记为πθ,其中θ表示该神经网络的所有权重系数,则使用PPO算法,θ更新公式如下:
在PPO算法中,基于值函数Vμ(st)计算而得,Vμ(st)同样是由深度学习模型所表示,Vμ(st)表示是马尔可夫模型中的期望返回奖励值,μ表示深度学习模型的所有超参数,值函数的更新通过梯度下降算法,最小化以下均方根误差:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011144498.0A CN112329337A (zh) | 2020-10-23 | 2020-10-23 | 基于深度强化学习的航空发动机剩余使用寿命估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011144498.0A CN112329337A (zh) | 2020-10-23 | 2020-10-23 | 基于深度强化学习的航空发动机剩余使用寿命估计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112329337A true CN112329337A (zh) | 2021-02-05 |
Family
ID=74311540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011144498.0A Pending CN112329337A (zh) | 2020-10-23 | 2020-10-23 | 基于深度强化学习的航空发动机剩余使用寿命估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112329337A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114013685A (zh) * | 2021-11-15 | 2022-02-08 | 中国航发沈阳发动机研究所 | 一种航空发动机核心机试验加温加压程序设计方法 |
CN117588394A (zh) * | 2024-01-18 | 2024-02-23 | 华土木(厦门)科技有限公司 | 基于AIoT的真空泵智能联动控制方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107545112A (zh) * | 2017-09-07 | 2018-01-05 | 西安交通大学 | 多源无标签数据机器学习的复杂装备性能评估与预测方法 |
CN109272114A (zh) * | 2018-08-08 | 2019-01-25 | 西安交通大学 | 机械装备剩余使用寿命快速有效预测的深度学习方法 |
CN110348002A (zh) * | 2018-04-05 | 2019-10-18 | 通用汽车环球科技运作有限责任公司 | 实现语音请求的系统和方法 |
CN111177974A (zh) * | 2019-12-24 | 2020-05-19 | 北京航空航天大学 | 基于双层嵌套寻优和子集模拟的结构小失效概率计算方法 |
-
2020
- 2020-10-23 CN CN202011144498.0A patent/CN112329337A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107545112A (zh) * | 2017-09-07 | 2018-01-05 | 西安交通大学 | 多源无标签数据机器学习的复杂装备性能评估与预测方法 |
CN110348002A (zh) * | 2018-04-05 | 2019-10-18 | 通用汽车环球科技运作有限责任公司 | 实现语音请求的系统和方法 |
CN109272114A (zh) * | 2018-08-08 | 2019-01-25 | 西安交通大学 | 机械装备剩余使用寿命快速有效预测的深度学习方法 |
CN111177974A (zh) * | 2019-12-24 | 2020-05-19 | 北京航空航天大学 | 基于双层嵌套寻优和子集模拟的结构小失效概率计算方法 |
Non-Patent Citations (2)
Title |
---|
吴献彪等: "考虑脆弱性的航空发动机剩余寿命预测", 南京航空航天大学学报, vol. 52, no. 4, pages 580 - 587 * |
黄志平等: "基于数据驱动的铣削刀具寿命预测研究", 制造技术与机床, pages 153 - 161 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114013685A (zh) * | 2021-11-15 | 2022-02-08 | 中国航发沈阳发动机研究所 | 一种航空发动机核心机试验加温加压程序设计方法 |
CN114013685B (zh) * | 2021-11-15 | 2023-09-08 | 中国航发沈阳发动机研究所 | 一种航空发动机核心机试验加温加压程序设计方法 |
CN117588394A (zh) * | 2024-01-18 | 2024-02-23 | 华土木(厦门)科技有限公司 | 基于AIoT的真空泵智能联动控制方法及系统 |
CN117588394B (zh) * | 2024-01-18 | 2024-04-05 | 华土木(厦门)科技有限公司 | 基于AIoT的真空泵智能联动控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114997051B (zh) | 一种基于迁移学习的航空发动机寿命预测与健康评估方法 | |
CN112580263B (zh) | 基于时空特征融合的涡扇发动机剩余使用寿命预测方法 | |
CN111274737A (zh) | 一种机械设备剩余使用寿命预测方法及系统 | |
CN109141847B (zh) | 一种基于mscnn深度学习的飞机系统故障诊断方法 | |
CN110288046B (zh) | 一种基于小波神经网络与隐马尔科夫模型的故障预测方法 | |
CN114048600A (zh) | 一种数字孪生驱动的多模型融合工业系统异常检测方法 | |
CN112329337A (zh) | 基于深度强化学习的航空发动机剩余使用寿命估计方法 | |
CN114297918A (zh) | 基于全注意力深度网络和动态集成学习的航空发动机剩余寿命预测方法 | |
CN113869563A (zh) | 一种基于故障特征迁移的航空涡扇发动机剩余寿命预测方法 | |
CN114282443B (zh) | 基于mlp-lstm有监督联合模型的剩余使用寿命预测方法 | |
CN114266278B (zh) | 一种基于双重注意力网络的设备剩余使用寿命预测方法 | |
CN111610466A (zh) | 一种变压器状态预测方法、装置和存储介质 | |
Nasser et al. | A hybrid of convolutional neural network and long short-term memory network approach to predictive maintenance | |
Chen et al. | Real-time bearing remaining useful life estimation based on the frozen convolutional and activated memory neural network | |
Zhong et al. | Aero-engine exhaust gas temperature prognostic model based on gated recurrent unit network | |
Kumar | Remaining useful life prediction of aircraft engines using hybrid model based on artificial intelligence techniques | |
CN110516391A (zh) | 一种基于神经网络的航空发动机动态模型建模方法 | |
Sayah et al. | Towards distribution clustering-based deep LSTM models for RUL prediction | |
Wu et al. | Ensemble recurrent neural network-based residual useful life prognostics of aircraft engines | |
CN111598161A (zh) | 一种基于cnn迁移学习的发动机气路状态诊断系统 | |
CN113283516A (zh) | 一种基于强化学习和d-s证据理论的多传感器数据融合方法 | |
Zhao et al. | Remaining life prediction of turbofan engine based on multi-path feature fusion | |
Zhuang et al. | Remaining useful life estimation under variable failure behaviors via transferable metric learning | |
CN116517921B (zh) | 航空液压油车状态在线检测方法及系统 | |
CN117421665A (zh) | 一种考虑运行工况的两阶段航空发动机气路故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |