CN116911191A - 一种基于改进PSO优化BiLSTM的航空发动机气路系统建模方法 - Google Patents
一种基于改进PSO优化BiLSTM的航空发动机气路系统建模方法 Download PDFInfo
- Publication number
- CN116911191A CN116911191A CN202310881772.XA CN202310881772A CN116911191A CN 116911191 A CN116911191 A CN 116911191A CN 202310881772 A CN202310881772 A CN 202310881772A CN 116911191 A CN116911191 A CN 116911191A
- Authority
- CN
- China
- Prior art keywords
- gas circuit
- bilstm
- circuit system
- optimal
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000005457 optimization Methods 0.000 title claims abstract description 33
- 238000005094 computer simulation Methods 0.000 title claims abstract description 9
- 230000006870 function Effects 0.000 claims abstract description 39
- 238000004364 calculation method Methods 0.000 claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 29
- 230000013016 learning Effects 0.000 claims abstract description 19
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 230000000694 effects Effects 0.000 claims abstract description 15
- 230000009467 reduction Effects 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 6
- 239000002245 particle Substances 0.000 claims description 53
- 230000002441 reversible effect Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 210000004027 cell Anatomy 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 210000002569 neuron Anatomy 0.000 claims description 6
- 230000001133 acceleration Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000009326 social learning Effects 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000004880 explosion Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000012352 Spearman correlation analysis Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000010220 Pearson correlation analysis Methods 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Geometry (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种基于改进PSO优化BiLSTM的航空发动机气路系统建模方法,包括:获取发动机气路数据,将发动机气路数据的输入和输出进行降维处理,并划分为训练数据集和测试数据集;创建PSO优化算法的对象函数,所述对象函数的待优化对象为BiLSTM网络的最佳隐藏层节点数、最佳初始学习率、最佳L2正则化系数,设定BiLSTM网络的相关参数及设置误差计算函数以作为之后PSO优化效果好坏的评判标准,获得BiLSTM网络的最优参数;以PSO输出的最优参数构建基于BiLSTM网络的发动机气路系统模型并采用训练数据集开始训练;将发动机气路系统模型在测试数据集与训练数据集下进行仿真得到的预测数据进行误差计算,得到发动机气路系统模型的预测误差,判断航空发动机气路系统模型的准确性。
Description
技术领域
本申请属于航空发动机技术领域,特别涉及一种基于改进PSO优化BiLSTM的航空发动机气路系统建模方法。
背景技术
航空发动机气路故障是典型的发动机故障类别之一,由于航空发动机气路工作环境复杂,内部相应气路参数同时受到工作循环数、内部压气机或涡轮磨损、腐蚀和侵蚀以及外来物等因素的影响,经常会导致发动机偏离正常工作状态从而引起气路故障,进而导致发动机性能退化甚至发生重大事故,因此及时对气路故障进行故障排查并且预测是十分重要的。而故障阈值设定通常是故障排查中最关键的一环,目前的故障阈值设定方法有固定阈值与自适应阈值等,这两者方法都需要一个高精度的健康数值预测模型作为准确计算残差的基础。
现有航空发动机气路数据回归预测多使用BP神经网络或LSTM神经网络进行预测。
BP神经网络对于航空发动机的时序飞行数据的处理和分析效果欠佳,且BP神经网络具有极易陷入局部最优,对初始网络权重过于灵敏,容易过拟合等缺点,导致预测数据效果欠佳且不稳定。此外,由于BP神经网络具有严重的样本依赖性,需要使用典型样本实例组成的训练集进行训练,但典型样本在工程实践中难以获取。同时,由于BP神经网络算法本质上为梯度下降法,复杂的目标函数导致算法低效,而且由于不能使用传统的一维搜索法求每次迭代的步长,而必须把步长的更新规则预先赋予网络,这导致了BP算法具有收敛速度较慢的缺点。
在时序数据回归预测的问题上,LSTM神经网络很好地解决了BP神经网络对时序数据处理效果差的问题,其内部的门结构使其可以实现对前后时序数据趋势和相关性的有效挖掘,但LSTM神经网络也存在一些问题,就是其无法对双向时序数据——即过去和未来的数据同时进行准确的处理,而且LSTM网络还存在着一定的梯度爆炸或者梯度弥散的问题。
另外,上述两个神经网络对回归预测还存在一个共性问题,即这些神经网络的初始超参数众多而且很难找到一个使预测效果最好的准确值,超参数的设定一般通过操作者的经验设定范围值并通过不停的修改数值并测试以找到使预测效果最好的值,这往往会消耗掉大量的时间并找到局部最优解。因此需要一种自适应调整网络超参数的方法以提高神经网络的准确率并缩短整个训练进程的时间。
发明内容
本申请的目的是提供了一种基于改进PSO优化BiLSTM的航空发动机气路系统建模方法,以解决或减轻背景技术中的至少一个问题。
本申请的技术方案是:一种基于改进PSO优化BiLSTM的航空发动机气路系统建模方法,包括:
获取发动机气路数据,将发动机气路数据的输入和输出进行降维处理,降维处理后按照预定比例划分为训练数据集和测试数据集,对训练数据集和测试数据集进行归一化和格式转换处理,获得用于训练网络操作的输入输出数据;
创建PSO优化算法的对象函数,所述对象函数的待优化对象为BiLSTM网络的最佳隐藏层节点数、最佳初始学习率、最佳L2正则化系数,设定BiLSTM网络的相关参数及设置误差计算函数以作为之后PSO优化效果好坏的评判标准,获得BiLSTM网络的最优参数;
以PSO输出的最优参数构建基于BiLSTM网络的发动机气路系统模型并采用训练数据集开始训练;
将发动机气路系统模型在测试数据集与训练数据集下进行仿真得到的预测数据进行误差计算,得到发动机气路系统模型的预测误差,判断航空发动机气路系统模型的准确性。
在本申请优选实施方式中,将发动机气路数据的输入和输出进行降维处理过程中,当发动机气路数据的输入和/或输出参数不满足正态分布时,采用斯皮尔曼相关性检验来检测发动机气路数据的输入输出参数之间的相关性,斯皮尔曼等级相关系数满足:
式中,Ri、Si为X元素、Y元素第i位的值;为X元素、Y元素的平均值;N为观察次数;/>为每个观察值两元素X、Y的排名对应相减得到的差值的平方。
在本申请优选实施方式中,所述BiLSTM网络的相关参数包括:
优化算法选用Adam;
学习率调整因子为0.2;
梯度阈值为1。
在本申请优选实施方式中,通过PSO获得BiLSTM网络的最优参数的过程包括:
1)初始化
首先,设置最大迭代次数、目标函数的自变量个数、粒子的最大速度、位置信息为整个搜索空间,在速度区间和搜索空间上随机初始化速度和位置,设置粒子群规模为M,每个粒子随机初始化一个飞翔速度;
2)个体极值与全局最优解
之后定义适应度函数,个体极值为每个粒子找到的最优解,从最优解中找到一个全局值,叫做本次全局最优解,与历史全局最优比较,进行更新;
3)更新速度和位置
更新速度和位置的数学表示方法如下式所示:
Vid=ωVid+c1random(0,1)(Pid-Xid)+c2random(0,1)(Pgd-Xid)
Xid=Xid+Vid
其中,ω称为惯性因子,其值为非负,较大时,全局寻优能力强,局部寻优能力若,较小时,全局寻优能力弱,局部寻优能力强,通过调整ω的大小,能够对全局寻优性能和局部寻优性能进行调整,c1和c2称为加速常数,前者为每个粒子的个体学习因子,后者为每个粒子的社会学习因子;random(0,1)表示区间[0,1]上的随机数,Pid表示第i个变量的个体极值的第d维,Pgd表示全局最优解的第d维;
4)终止条件
改进惯性权重分配,公式如下:
式中,Wmax为最大惯性权重,Wmin为最小惯性权重,i为当前迭代次数,nmax为最大迭代次数;
引入正弦函数改进学习因子的计算方式,使c1和c2随着迭代次数的增加同时变化,改进的学习因子c1和c2计算公式如下所示:
使用时,首先确定粒子群优化PSO的初始参数,以改进性权重分配和改进的学习因子计算方法设定c1、c2和惯性权重的值,同时设定初始化种群规模和最大迭代次数;之后随机生成粒子并初始化粒子的位置与速度,并设置粒子的适应度函数,即均方根误差计算函数,如下式所示:
式中,N为迭代次数;xi为粒子在第i次迭代所处位置;为粒子在第i次迭代时之前位置的平均值;
之后计算每个粒子的适应度值,通过全局搜索与局部搜索相结合的方式,更新调整每个粒子的搜索方向,同时每次迭代将每个粒子的当前最佳位置用作历史最佳位置,更新粒子的速度和位置;每次迭代都计算一次相应的粒子适应度值,并比较全局最优解和局部最优解的大小,以最大程度提高预测精度;
最后,判断此次迭代结束后是否满足结束条件,结束条件为达到最高迭代次数或预测均方根误差低于设定值,若满足结束条件则输出最优参数,若不满足结束条件则继续进行迭代。
在本申请优选实施方式中,基于BiLSTM网络的发动机气路系统模型的过程包括:
BiLSTM网络则由前向LSTM与反向LSTM组合而成,xn表示第n次的输入量,on表示第n次的输出量,Wf表示正向LSTM神经元,Wb表示反向LSTM神经元,Cbn表示反向LSTM第n次的细胞状态,abn表示反向LSTM第n次的隐层状态,Cfn表示正向LSTM第n次的细胞状态,afn表示正向LSTM第n次的隐层状态;
LSTM单元结构可用下式表示:
it=σ(Wi·[ht-1,xt]+bi)
ft=σ(Wf·[ht-1,xt]+bf)
ot=σ(Wo[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中,xt为当前时刻当前LSTM层的输入值,ht为当前时刻当前LSTM层的输出值,Wf、Wi、WC、Wo分别为LSTM当前数据状态参数和输出门的权重矩阵,bf、bt、bc、bo分别为当前数据动态参数和输出门的偏差,ft、it、Ct、ot分别为采集门、输入门、当前数据状态和输出门,σ为sigmoid函数,*代表Hadamard积。
在本申请优选实施方式中,在发动机气路系统模型预测数据误差计算中,采用评价指标来评价发动机气路系统模型的预测结果,所述评价指标包括平均绝对误差(MAE)、均方误差(MSE)、预测均方根误差(RMSEP)、决定系数(R2)、相对分析误差(RPD)、平均绝对百分比误差(MAPE)中的至少一个。
本申请可有效解决BP神经网络易过拟合和易陷入局部最优的问题,预测结果远好于传统BP神经网络同时也优于现阶段较先进的LSTM网络。
附图说明
为了更清楚地说明本申请提供的技术方案,下面将对附图作简单地介绍。显而易见地,下面描述的附图仅仅是本申请的一些实施例。
图1为本申请的基于PSO-BiLSTM的航空发动机气路系统建模方法流程图。
图2为本申请中的BiLSTM网络结构示意图。
图3为本申请一实施例中的风扇分布直方图。
图4为本申请一实施例中的LPC失速裕度分布直方图。
图5为本申请一实施例中的飞行高度分布直方图。
图6为本申请一实施例中的油门杆解算角度分布直方图。
图7为本申请一实施例中的高压涡轮机出口静压分布直方图。
图8为本申请一实施例中的斯皮尔曼相关性分析结果
图9为本申请一实施例中的各网络预测结果示意图。
图10为本申请一实施例中的各网络预测误差示意图。
具体实施方式
为使本申请实施的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行更加详细的描述。
如图1所示,本申请提供的基于PSO-BiLSTM的航空发动机气路系统建模方法包括如下步骤:
一、数据预处理
获取发动机气路数据,将发动机气路数据的输入和输出进行降维处理,降维处理后将其以合适比例划分为训练数据集和测试数据集,对训练数据集和测试数据集进行归一化和格式转换处理,获得用于训练网络操作的输入输出数据。
在自然科学领域中,皮尔逊相关性系数、斯皮尔曼相关性系数、肯德尔相关性系数都被广泛用于度量变量之间两两的相关性,被称为统计学三大相关性分析系数,然而三种相关性分析的应用环境有所差异,皮尔逊相关性分析需要两个变量的总体是正态分布或接近正态的单峰分布,并且要求服从一个联合的双变量正态分布,而且样本中的极端值对皮尔逊相关性系数影响较大,可能会因为一两个数值而导致出现错误,这在抽取的工程数据上是难以实现的。此外,皮尔逊相关系数是在原始数据的方差和协方差基础上计算得到,所以对离群值比较敏感,它度量的是线性相关。因此,即使皮尔逊相关系数为0,也只能说明变量之间不存在线性相关,但仍有可能存在曲线相关;而肯德尔相关性系数与斯皮尔曼相关性系数对数据条件的要求相同,斯皮尔曼相关系数和肯德尔相关系数都是建立在秩和观测值的相对大小的基础上得到,是一种更为一般性的非参数方法,对离群值的敏感度较低,因而也更具有耐受性,度量的主要是变量之间的联系。因此,本申请中使用斯皮尔曼相关性检验来检测发动机气路数据的输入输出参数之间的相关性。
斯皮尔曼等级相关系数(Spearman’s Rank Correlation Coefficient),通常也叫斯皮尔曼秩相关系数,被定义成等级变量之间的皮尔逊相关系数。对于样本容量为n的样本,n个原始数据被转换成等级数据(做排序),然后再根据公式进行计算。而“秩”可以理解成就是一种顺序或者排序,那么根据原始数据的排序位置进行求解,这种表征形式就没有了求皮尔森相关性系数时那些限制。
斯皮尔曼等级相关系数的计算公式如公式1所示:
式中,Ri、Si为X元素、Y元素第i位的值;为X元素、Y元素的平均值;N为观察次数;/>为每个观察值两元素X、Y的排名对应相减得到的差值的平方。。
斯皮尔曼相关系数表明独立变量X和依赖变量Y的相关方向。如果当X增加时,Y趋向于增加,斯皮尔曼相关系数则为正;如果当X增加时,Y趋向于减少,斯皮尔曼相关系数则为负。斯皮尔曼相关系数为零表明当X增加时Y没有任何趋向性。当X和Y越来越接近完全的单调相关时,斯皮尔曼相关系数会在绝对值上增加。当X和Y完全单调相关时,斯皮尔曼相关系数的绝对值为1。完全的单调递增关系意味着任意两对数据(Xi,Yi)和(Xj,Yj),有Xi-Xj和Yi-Yj总是同号。完全的单调递减关系意味着任意两对数据(Xi,Yi)和(Xj,Yj),有Xi-Xj和Yi-Yj总是异号。
本申请中归一化处理采用Min-Max标准化方法,如公式2所示:
式中,Z'为第i次标准化处理后的结果值;Z为第i次标准化处理的目标值;Zmax为数据集中的最大值;Zmin为数据集中的最小值。
通过格式转换将训练数据集的输入/输出和测试数据集的输/输出分别转换为一维的元胞数组形式,以适应之后的神经网络操作的输入输出数据格式。
二、创建待优化函数
创建粒子群优化(Particle Swarm Optimization,PSO)的对象函数,该对象函数的待优化对象为双向长短期记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)的最佳隐藏层节点数、最佳初始学习率、最佳L2正则化系数三个参数;之后设定BiLSTM网络组成部分相关参数,将其中的待优化参数设为未知量,之后设置训练网络参数。在本申请中,训练BiLSTM网络参数选用Adam优化算法,设定学习率调整因子为0.2,并设定梯度阈值为1以防止梯度爆炸。最后设置误差计算函数以作为之后PSO优化效果好坏的评判标准。
PSO优化算法是一种进化计算技术,基本思想是通过群体中个体之间的协作和信息共享来寻找最优解,PSO优化算法的流程如下:
1)初始化
首先,设置最大迭代次数、目标函数的自变量个数、粒子的最大速度、位置信息为整个搜索空间,在速度区间和搜索空间上随机初始化速度和位置,设置粒子群规模为M,每个粒子随机初始化一个飞翔速度。
2)个体极值与全局最优解
之后定义适应度函数,个体极值为每个粒子找到的最优解,从这些最优解找到一个全局值,叫做本次全局最优解。与历史全局最优比较,进行更新。
3)更新速度和位置
更新速度和位置的数学表示方法如下式所示:
Vid=ωVid+c1random(0,1)(Pid-Xid)+c2random(0,1)(Pgd-Xid) (3)
Xid=Xid+Vid (4)
其中,ω称为惯性因子,其值为非负,较大时,全局寻优能力强,局部寻优能力若,较小时,全局寻优能力弱,局部寻优能力强,通过调整ω的大小,可以对全局寻优性能和局部寻优性能进行调整,c1和c2称为加速常数,前者为每个粒子的个体学习因子,后者为每个粒子的社会学习因子。c1和c2为常数时可以得到较好的解,通常设置c1=c2=2,但不一定必须等于2,一般取c1=c2∈[0,4]。random(0,1)表示区间[0,1]上的随机数,Pid表示第i个变量的个体极值的第d维,Pgd表示全局最优解的第d维。
4)终止条件
一般设定为达到设定的迭代次数终止或者代数之间差值满足最小界限终止。
但是,传统的PSO优化算法虽然具有不错的优化效果,但是由于其在优化过程中的超参数是固定或者线性变化的,导致其在应对实际问题时缺乏有效的参数控制,本申请在传统粒子群优化的基础上改进了其惯性权重和学习因子的计算方法。
首先,传统的惯性权重设定方法常用固定值设定或者线性递减设定,惯性权重随迭代次数保持不变或是线性下降,这种方法不能完全适应复杂的非线性情况,并且PSO的局部搜索能力会随着惯性权重的线性减小而降低,使用非线性递减分配方法则可改善这一情况,改进的惯性权重分配公式如下式所示:
式中,Wmax为最大惯性权重,Wmin为最小惯性权重,i为当前迭代次数,nmax为最大迭代次数。
其次,传统的学习因子设定方法多为设定c1和c2为0.5到2之间的某一个固定值,而在实际应用中,随着迭代步骤的增加,通常需要c1的值从大到小变化以在早期的步骤中提高全局搜索能力,加快搜索速度,同时c2的值从小到大变化以提高后期局部搜索能力,提高搜索精度。本申请引入正弦函数改进学习因子计算方式,使c1和c2随着迭代次数的增加同时变化。改进的加速常数c1和c2计算公式如下所示:
使用时,首先确定粒子群优化PSO的初始参数,以公式5-7的计算方法设定c1、c2和惯性权重的值,同时设定初始化种群规模为50个,最大迭代次数为50次。之后随机生成粒子并初始化粒子的位置与速度,并设置粒子的适应度函数,即均方根误差计算函数,如下式所示:
式中,N为迭代次数;xi为粒子在第i次迭代所处位置;为粒子在第i次迭代时之前位置的平均值。
之后计算每个粒子的适应度值,通过全局搜索与局部搜索相结合的方式,更新调整每个粒子的搜索方向,同时每次迭代将每个粒子的当前最佳位置用作历史最佳位置,使用公式3、4更新粒子的速度和位置。每次迭代都计算一次相应的粒子适应度值,并比较全局最优解和局部最优解的大小,以最大程度提高预测精度。
最后,判断此次迭代结束后是否满足结束条件,结束条件为达到最高迭代次数或预测均方根误差低于设定值,若满足结束条件则输出最优参数,若不满足结束条件则继续进行迭代。
三、发动机气路系统建模
以PSO输出的最优参数构建基于BiLSTM网络的发动机气路系统模型并采用训练数据集开始训练,BiLSTM网络由输入层、BiLSTM层、ReLu激活层、全连接层和回归层组成,其他网络参数与步骤2中的待优化函数对应参数保持一致。
BiLSTM神经网络是一种结合了BRNN和LSTM神经网络两者优点而形成的新模型,LSTM算法在RNN上进行改进,增加了门机制和记忆单元,有效防止了梯度爆炸和梯度消失;BRNN则允许输出单元同时依赖于过去和未来的输入输出值,BiLSTM则克服LSTM算法无法处理后文信息的问题,同时解决了BRNN的长期依赖和梯度消失问题,能够有效提升发动机故障气路部件建模的性能。
LSTM单元结构可用下式表示:
it=σ(Wi·[ht-1,xt]+bi) (9)
ft=σ(Wf·[ht-1,xt]+bf) (10)
ot=σ(Wo[ht-1,xt]+bo) (12)
ht=ot*tanh(Ct) (14)
其中,xt为当前时刻当前LSTM层的输入值,ht为当前时刻当前LSTM层的输出值,Wf、Wi、WC、Wo分别为LSTM当前数据状态参数和输出门的权重矩阵,bf、bt、bc、bo分别为当前数据动态参数和输出门的偏差,ft、it、Ct、ot分别为采集门、输入门、当前数据状态和输出门,σ为sigmoid函数,*代表Hadamard积。
BiLSTM网络则由前向LSTM与反向LSTM组合而成,其网络结构图如图2所示,图中xn表示第n次的输入量,on表示第n次的输出量,Wf表示正向LSTM神经元,Wb表示反向LSTM神经元,Cbn表示反向LSTM第n次的细胞状态,abn表示反向LSTM第n次的隐层状态,Cfn表示正向LSTM第n次的细胞状态,afn表示正向LSTM第n次的隐层状态。
四、发动机气路系统模型评价
使用发动机在相同工作环境的真实试验数据与发动机气路系统模型仿真得到的预测数据进行误差计算,从而得到发动机气路系统模型的预测误差。
本申请中使用了多个指标评价发动机气路系统模型性能,评价指标包括平均绝对误差(MAE)、均方误差(MSE)、预测均方根误差(RMSEP)、决定系数(R2)、相对分析误差(RPD)、平均绝对百分比误差(MAPE),以实现全方位综合比较本申请的发动机气路系统模型相较于之前的回归预测神经网络的性能优越性。
4.1)平均绝对误差(MAE)
平均绝对误差(Mean Absolute Error,MAE)是对表达相同现象的成对观察之间的误差的度量。MAE与均方根误差(RMSE)不同,MAE在概念上比RMSE更简单,也更容易解释,每个误差对MAE的贡献与误差的绝对值成正比,平均绝对误差值越小,说明模型预测性能越好,平均绝对误差计算公式如下式所示:
式中,fpi表示第i次的预测值,yai表示第i次的真实值。
4.2)均方误差(MSE)与预测均方根误差(RMSEP)
预测均方根误差也叫均方根误差(RMSE),是均方误差的开方,MSE和RMSEP的值越小,说明模型预测性能越好,MSE具有更强的宏观误差表现能力而RMSEP在微观上受到异常值的影响相较于MSE更小。
均方误差与预测均方根误差的计算公式如下式所示:
4.3)决定系数(R2)
R2是用来度量拟合优度的一个统计量,R2的值越接近1表示模型拟合效果越好,越接近0表示模型拟合效果越差,计算公式如下式所示:
4.4)相对分析误差(RPD)
相对分析误差是一种基于决定系数的误差表示形式,RPD<1.4认为模型不可靠,1.4<RPD<2.0认为模型较可靠,RPD>2.0认为模型很可靠,能用做模型分析,RPD的计算公式如下式所示:
式中,R2表示决定系数,SD表示样本标准偏差,SEC表示样本均方根误差。
4.5)平均绝对百分比误差(MAPE)
MAPE相较于MAE多了分母,因为是基于百分比的误差,所以不依赖于量纲,MAPE的值越小,说明模型预测性能越好,MAPE的计算公式如下式所示:
本申请可有效解决BP神经网络易过拟合和易陷入局部最优的问题,预测结果远好于传统BP神经网络同时也优于现阶段较先进的LSTM网络。
为了使本申请更加清晰明了,本申请提供了一个使用NASA公开的N-CMAPSS数据集的实施例,该NCMAPSS数据集的DS01类别第4轮次中5000组数据作为训练集,使用第7轮次中50组数据作为测试集,首先绘制训练集与数据集中的输入和输出参数的分布直方图,用以直观的判断待输入数据是否服从正态分布,如图3至图7所示,从图中可以判断出输入输出数据均不服从正态分布,因此选择斯皮尔曼相关性分析判断数据之间相关性,以确保使用的输入数据两两相关性小于0.9,将相关性大于0.9的参数只保留一个,剔除其他,用以减小模型误差,避免增加运算量和陷入过拟合,如图8所示为本申请该实施例中的斯皮尔曼相关性分析结果。
在保证选取数据组两两之间相关性小于0.9、大于-0.9的基础上,选取风扇(SmFan)、LPC的失速裕度(SmLPC)、飞行高度(alt)、油门杆解算角度(TRA)作为输入,高压涡轮机出口静压(Ps30)作为输出进行回归预测。
预测结果评估选取平均绝对误差(MAE)、均方误差(MSE)、预测均方根误差(RMSEP)、决定系数(R2)、相对分析误差(RPD)、平均绝对百分比误差(MAPE)作为评价指标,并选取常用的BP神经网络、无优化LSTM网络、PSO优化的LSTM网络与本申请的PSO优化BiLSTM网络使用相同数据集作为预测指标对比对象,预测结果如表1所示,预测结果如图9所示,预测误差如图10所示。
表1.各网络预测指标结果对比
由预测结果图可以看出,LSTM、PSO-LSTM、PSO-BiLSTM对于N-CMAPSS数据集的拟合预测效果都很好,而BP神经网络具有比较明显的预测误差。同时,由预测误差结果可以看出,BP、LSTM网络的预测误差都比较大,而PSO优化后误差具有明显的下降,体现了PSO优化的有效性,而PSO-BiLSTM相较于PSO-LSTM网络预测误差又有所改善,表明双向长短期记忆网络(BiLSTM)在时序序列数据预测上较长短期记忆网络(LSTM)的优越性。
由此可见,本申请提供的PSO优化的BiLSTM网络在时序相关的航空发动机气路相关数据的预测上效果很好,相较于当前较为主流的RNN网络具有更好的拟合效果和更低的预测误差,符合工程实践要求。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (6)
1.一种基于改进PSO优化BiLSTM的航空发动机气路系统建模方法,其特征在于,所述方法包括:
获取发动机气路数据,将发动机气路数据的输入和输出进行降维处理,降维处理后按照预定比例划分为训练数据集和测试数据集,对训练数据集和测试数据集进行归一化和格式转换处理,获得用于训练网络操作的输入输出数据;
创建PSO优化算法的对象函数,所述对象函数的待优化对象为BiLSTM网络的最佳隐藏层节点数、最佳初始学习率、最佳L2正则化系数,设定BiLSTM网络的相关参数及设置误差计算函数以作为之后PSO优化效果好坏的评判标准,获得BiLSTM网络的最优参数;
以PSO输出的最优参数构建基于BiLSTM网络的发动机气路系统模型并采用训练数据集开始训练;
将发动机气路系统模型在测试数据集与训练数据集下进行仿真得到的预测数据进行误差计算,得到发动机气路系统模型的预测误差,判断航空发动机气路系统模型的准确性。
2.如权利要求1所述的基于改进PSO优化BiLSTM的航空发动机气路系统建模方法,其特征在于,将发动机气路数据的输入和输出进行降维处理过程中,当发动机气路数据的输入和/或输出参数不满足正态分布时,采用斯皮尔曼相关性检验来检测发动机气路数据的输入输出参数之间的相关性,斯皮尔曼等级相关系数满足:
式中,Ri、Si为X元素、Y元素第i位的值;为X元素、Y元素的平均值;N为观察次数;为每个观察值两元素X、Y的排名对应相减得到的差值的平方。
3.如权利要求1所述的基于改进PSO优化BiLSTM的航空发动机气路系统建模方法,其特征在于,所述BiLSTM网络的相关参数包括:
优化算法选用Adam;
学习率调整因子为0.2;
梯度阈值为1。
4.如权利要求1所述的基于改进PSO优化BiLSTM的航空发动机气路系统建模方法,其特征在于,通过PSO获得BiLSTM网络的最优参数的过程包括:
1)初始化
首先,设置最大迭代次数、目标函数的自变量个数、粒子的最大速度、位置信息为整个搜索空间,在速度区间和搜索空间上随机初始化速度和位置,设置粒子群规模为M,每个粒子随机初始化一个飞翔速度;
2)个体极值与全局最优解
之后定义适应度函数,个体极值为每个粒子找到的最优解,从最优解中找到一个全局值,叫做本次全局最优解,与历史全局最优比较,进行更新;
3)更新速度和位置
更新速度和位置的数学表示方法如下式所示:
Vid=ωVid+c1random(0,1)(Pid-Xid)+c2random(0,1)(Pgd-Xid)
Xid=Xid+Vid
其中,ω称为惯性因子,其值为非负,较大时,全局寻优能力强,局部寻优能力若,较小时,全局寻优能力弱,局部寻优能力强,通过调整ω的大小,能够对全局寻优性能和局部寻优性能进行调整,c1和c2称为加速常数,前者为每个粒子的个体学习因子,后者为每个粒子的社会学习因子;random(0,1)表示区间[0,1]上的随机数,Pid表示第i个变量的个体极值的第d维,Pgd表示全局最优解的第d维;
4)终止条件
改进惯性权重分配,公式如下:
式中,Wmax为最大惯性权重,Wmin为最小惯性权重,i为当前迭代次数,nmax为最大迭代次数;
引入正弦函数改进学习因子的计算方式,使c1和c2随着迭代次数的增加同时变化,改进的学习因子c1和c2计算公式如下所示:
使用时,首先确定粒子群优化PSO的初始参数,以改进性权重分配和改进的学习因子计算方法设定c1、c2和惯性权重的值,同时设定初始化种群规模和最大迭代次数;之后随机生成粒子并初始化粒子的位置与速度,并设置粒子的适应度函数,即均方根误差计算函数,如下式所示:
式中,N为迭代次数;xi为粒子在第i次迭代所处位置;为粒子在第i次迭代时之前位置的平均值;
之后计算每个粒子的适应度值,通过全局搜索与局部搜索相结合的方式,更新调整每个粒子的搜索方向,同时每次迭代将每个粒子的当前最佳位置用作历史最佳位置,更新粒子的速度和位置;每次迭代都计算一次相应的粒子适应度值,并比较全局最优解和局部最优解的大小,以最大程度提高预测精度;
最后,判断此次迭代结束后是否满足结束条件,结束条件为达到最高迭代次数或预测均方根误差低于设定值,若满足结束条件则输出最优参数,若不满足结束条件则继续进行迭代。
5.如权利要求4所述的基于改进PSO优化BiLSTM的航空发动机气路系统建模方法,其特征在于,基于BiLSTM网络的发动机气路系统模型的过程包括:
BiLSTM网络则由前向LSTM与反向LSTM组合而成,xn表示第n次的输入量,on表示第n次的输出量,Wf表示正向LSTM神经元,Wb表示反向LSTM神经元,Cbn表示反向LSTM第n次的细胞状态,abn表示反向LSTM第n次的隐层状态,Cfn表示正向LSTM第n次的细胞状态,afn表示正向LSTM第n次的隐层状态;
LSTM单元结构可用下式表示:
it=σ(Wi·[ht-1,xt]+bi)
ft=σ(Wf·[ht-1,xt]+bf)
ot=σ(Wo[ht-1,xt]+bo)
ht=ot*tanh(Ct)
其中,xt为当前时刻当前LSTM层的输入值,ht为当前时刻当前LSTM层的输出值,Wf、Wi、WC、Wo分别为LSTM当前数据状态参数和输出门的权重矩阵,bf、bt、bc、bo分别为当前数据动态参数和输出门的偏差,ft、it、Ct、ot分别为采集门、输入门、当前数据状态和输出门,σ为sigmoid函数,*代表Hadamard积。
6.如权利要求1所述的基于改进PSO优化BiLSTM的航空发动机气路系统建模方法,其特征在于,在发动机气路系统模型预测数据误差计算中,采用评价指标来评价发动机气路系统模型的预测结果,所述评价指标包括平均绝对误差、均方误差、预测均方根误差、决定系数、相对分析误差、平均绝对百分比误差中的至少一个。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310881772.XA CN116911191A (zh) | 2023-07-18 | 2023-07-18 | 一种基于改进PSO优化BiLSTM的航空发动机气路系统建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310881772.XA CN116911191A (zh) | 2023-07-18 | 2023-07-18 | 一种基于改进PSO优化BiLSTM的航空发动机气路系统建模方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116911191A true CN116911191A (zh) | 2023-10-20 |
Family
ID=88366355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310881772.XA Pending CN116911191A (zh) | 2023-07-18 | 2023-07-18 | 一种基于改进PSO优化BiLSTM的航空发动机气路系统建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116911191A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117725685A (zh) * | 2024-02-05 | 2024-03-19 | 中汽研汽车检验中心(天津)有限公司 | 一种车辆操控性多目标优化方法和设备 |
CN117725685B (zh) * | 2024-02-05 | 2024-05-31 | 中汽研汽车检验中心(天津)有限公司 | 一种车辆操控性多目标优化方法和设备 |
-
2023
- 2023-07-18 CN CN202310881772.XA patent/CN116911191A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117725685A (zh) * | 2024-02-05 | 2024-03-19 | 中汽研汽车检验中心(天津)有限公司 | 一种车辆操控性多目标优化方法和设备 |
CN117725685B (zh) * | 2024-02-05 | 2024-05-31 | 中汽研汽车检验中心(天津)有限公司 | 一种车辆操控性多目标优化方法和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109766583B (zh) | 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法 | |
CN110442936B (zh) | 基于数字孪生模型的设备故障诊断方法、装置及系统 | |
CN109766930B (zh) | 一种基于dcnn模型的矿井机械设备的剩余寿命预测方法 | |
CN110807257A (zh) | 航空发动机剩余寿命预测方法 | |
CN111258297B (zh) | 基于数据融合网络的设备健康指标构建及寿命预测方法 | |
CN108241901B (zh) | 一种基于预测数据的变压器预警评估方法及装置 | |
CN111814956B (zh) | 一种基于多维度二次特征提取的多任务学习的空气质量预测方法 | |
CN108960421B (zh) | 改进基于bp神经网络的水面无人艇航速在线预报方法 | |
CN113297787B (zh) | 一种基于迁移学习的航空发动机剩余寿命预测方法 | |
CN111310965A (zh) | 一种基于lstm网络的飞行器航迹预测方法 | |
Ayodeji et al. | Causal augmented ConvNet: A temporal memory dilated convolution model for long-sequence time series prediction | |
Souza et al. | Variable and delay selection using neural networks and mutual information for data-driven soft sensors | |
CN116448419A (zh) | 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法 | |
CN106971077B (zh) | 一种基于时间片段参数辨识的动态仿真模型验证方法 | |
CN113657814B (zh) | 一种航空网络风险预测方法及风险等级评估方法 | |
Ghorbani et al. | Estimating remaining useful life of turbofan engine using data-level fusion and feature-level fusion | |
Wang et al. | Three‐stage feature selection approach for deep learning‐based RUL prediction methods | |
Ruan et al. | Remaining useful life prediction for aero-engine based on lstm and cnn | |
Viale et al. | Least squares smoothed k-nearest neighbors online prediction of the remaining useful life of a NASA turbofan | |
CN116911191A (zh) | 一种基于改进PSO优化BiLSTM的航空发动机气路系统建模方法 | |
CN112560252B (zh) | 一种航空发动机剩余寿命预测方法 | |
CN114971032A (zh) | 一种基于os-elm的电子鼻在线气体浓度预测方法 | |
Yu et al. | Design for an SPRT control scheme based on linguistic data | |
CN113705932B (zh) | 一种短期负荷预测方法及装置 | |
Hamonangan et al. | A review of soft sensor methods for mach number measurement at LAPAN supersonic wind tunnel |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |