CN111160457B - 基于软一类极限学习机的涡轴发动机故障检测方法 - Google Patents

基于软一类极限学习机的涡轴发动机故障检测方法 Download PDF

Info

Publication number
CN111160457B
CN111160457B CN201911386199.5A CN201911386199A CN111160457B CN 111160457 B CN111160457 B CN 111160457B CN 201911386199 A CN201911386199 A CN 201911386199A CN 111160457 B CN111160457 B CN 111160457B
Authority
CN
China
Prior art keywords
sample
training
samples
beta
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911386199.5A
Other languages
English (en)
Other versions
CN111160457A (zh
Inventor
赵永平
黄功
胡乾坤
李兵
谢云龙
潘颖庭
宋房全
吴奂
何家俊
陈耀斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201911386199.5A priority Critical patent/CN111160457B/zh
Publication of CN111160457A publication Critical patent/CN111160457A/zh
Application granted granted Critical
Publication of CN111160457B publication Critical patent/CN111160457B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明提供一种基于软一类极限学习机的涡轴发动机故障检测方法,本发明针对发动机故障数据很难获取或者是获取代价极高时的情况,通过对正常数据进行分析处理,建立一个分类效果良好的分类器,消除了经典OC‑ELM优化目标的约束条件和决策函数的判决条件不一致的这一缺陷。对每个训练样本的标签分配一个合适的软间隔,从而构建了效果更好的故障检测分类器。

Description

基于软一类极限学习机的涡轴发动机故障检测方法
技术领域
本发明针对涡轴发动机气路部件故障,利用一类极限学习机(One Class ExtremeLearning Machine)改进算法来解决在故障数据很难获取或者获取代价极高的情况下,对发动机进行故障检测等领域内存在的技术难题。
背景技术
航空发动机故障诊断系统作为发动机健康管理系统的有效组成部分之一,一直都是工业界和学术界的关注热点,而发动机气路部件故障发生概率可以占到发动机总体故障的90%以上,因此建立对气路部件故障诊断的有效方法就显得尤为重要。目前,对发动机故障诊断的可行方法主要集中在基于模型的方法和数据驱动的方法。基于模型的方法主要根据真实发动机运行状况而建立起发动机数学模型来对发动机健康状况做出判断,这种方法需要研究人员对发动机工作原理十分熟悉,但是随着发动机自身的不断创新与改进,建立精准模型的难度也在不断提升,模型中存在的不确定性以及系统非线性复杂度越来越高,都会影响这种方法的判断准确度,另外需要指出的就是这种方法对于不同型号发动机需要建立不同的数学模型。数据驱动的方法可以根据发动机传感器的实时数据以及历史收集数据来对目标进行故障检测与隔离,这种方法可以克服之前所述方法存在的困难,只要选择有效的机器学习算法并加以改进就可以完成对不同型号发动机故障诊断任务,本发明采用数据驱动的办法来解决发动机气路故障诊断中存在的问题。
传统的数据驱动航空发动机气路部件故障诊断机器学习算法为有监督型的学习算法,常见方法主要有神经网络、极限学习机和支持向量机等。神经网络算法可以避免发动机建模过程中复杂度与非线性过高所带来的问题,但是这种方法需要大量数据来训练隐含层与输出层节点权重参数,运用梯度下降的方法求解模型使得训练时间过长,并且最终结果容易陷入局部最优。支持向量机(Support Vector Machine,简称SVM)作为经典的二分类算法,在处理中小样本分类问题时有较好的结果。极限学习机(Extreme LearningMachine,简称ELM)是一种简单的单隐藏层前馈神经网络,这种模型训练简单,并且当隐含层节点大于一定数目时,模型输出可以以零误差逼近训练样本,但是这种方法往往存在过拟合的风险。由于生产技术及科学水平的提高,发动机出现故障的情况也越来越少见,故障数据的获取也越来越昂贵,故类别不平衡问题在航空发动机的故障检测中越来越突出。标准ELM在解决类别不平衡问题时,会存在一定的问题:测试结果会倾向于样本量大的那一类样本。而一类极限学习机(One-Class Extreme Learning Machine,简称OC-ELM)能很好的解决这一潜在的问题。其基本原理为:将全体训练样本中模型输出值和样本标签值之间差值大于阈值θ的那一小部分样本剔除掉,使用剩余的样本来训练分类器,针对测试样本,如果其模型输出值和样本标签值之间的差值小于阈值θ,则认为该测试样本为正常样本,否则为故障样本。由原理可知OC-ELM在构建分类器时,只需正常数据即可。然而,传统的OC-ELM存在一些不足,如:优化目标的约束条件和决策函数的判决条件不一致。基于此,本发明提出一种软一类极限学习机(Soft One-Class Extreme Learning Machine,简称SOC-ELM)学习算法。该算法通过对每一个训练样本分配一个合适的间隔,将离散的目标值转变为连续的目标值来提高算法的分类性能。
本发明采用一种改进的OC-ELM来构建分类器,能很好的处理在故障数据量少的情况下,对涡轴发动机进行高效的故障检测这一技术难题。
发明内容
发明目的:为克服ELM,OC-ELM在解决类别不平衡情况下的故障检测准确率低的问题,本发明对每个训练样本分配一个合适的间隔,消除了经典OC-ELM对每个训练样本都分配同一个间隔的缺陷,从而提高故障检测的准确率。
技术方案:
一种软一类极限学习机算法,通过对每个训练样本分配一个合适的间隔,包括如下的步骤:
步骤1:建立软一类极限学习机的数学模型:
SOC-ELM是一种特殊的单隐含层前馈神经网络,其网络结构由输入层、隐含层和输出层等三层神经网络组成。给定训练样本集{(xi,t)|xi∈Rd,t∈R,i=1,2,...,N},xi=[xi1,xi2,...,xid]T表示第i个训练样本,t是训练样本的标签,一般情况下t=1,N表示训练样本的个数,R表示实数集合。可知输入层节点数为d,输出层节点数为1,设隐含层节点数为#HN,则SOC-ELM的优化目标可写为
Figure BDA0002342095290000031
其中算子⊙为Hadamard积,||·||2为2范数,β=[β1,β2,...,β#HN]T为输出向量,βi为第i个隐含层节点与输出层节点的连接权重,e=[e1,e2,...,eN]T为误差向量,ei表示第i个训练样本的预测值与真实值之间的误差,t=[1,1,...,1]T,τ=[τ1,τ2,...,τN]T为目标边界向量,需要经过优化才能确定具体数值,C为平衡参数,H为隐含层节点输出矩阵,其定义式为
Figure BDA0002342095290000032
其中,aj=[aj1,aj2,...,ajd]T为第j个隐含层节点与输入层神经元的连接权重,bj为第j个隐含层节点的偏置量,h(·)为隐含层激活函数。根据KKT条件,SOC-ELM的优化目标可以转化为如下拉格朗日函数:
Figure BDA0002342095290000033
其中,α=[α1,α2,...,αN]T为拉格朗日乘子,上标T表示转置,将拉格朗日函数分别对β、e和α求偏导,并且令求导结果为0,即
Figure BDA0002342095290000034
化简上式,可得输出向量的计算公式为:
Figure BDA0002342095290000035
其中,I为单位矩阵。为了提高算法的鲁棒性,将训练样本中网络预测值和实际标签值之间误差较大的那一小部分样本剔除,剔除样本量与总训练样本量的比值μ一般取为0.05或者0.1。对于样本xi,网络预测值和实际标签值之间误差的定义为:
Figure BDA0002342095290000041
其中,βj由输出向量的计算公式(5)求得。由公式(6)可以看出,距离ε(xi)越小,说明xi为正常样本的可能性越大。定义一个阈值参数θ,当ε(xi)≤θ时,可以认为样本xi为正常样本,否则认为xi为故障样本。参数θ的计算方式为:首先依据误差的定义式(6),计算全体训练样本的误差,然后将求得的误差按照从大到小的顺序排列,即ε(1)≥…≥ε(N),令
Figure BDA0002342095290000042
其中,
Figure BDA0002342095290000043
为向下取整符号。其数学意义为:将误差介于ε(1)和θ之间的训练样本剔除掉,只使用误差小于θ的样本来训练分类器,这样可以避免过拟合,从而达到提高算法泛化性能的目的。对于测试样本xt,其决策函数为
Figure BDA0002342095290000044
当隐含层节点数#HN或者隐含层激活函数无法确定时,可以采用核技巧的形式来处理:
Ω=HHT:Ωi,j=h(xi)·h(xj)=K(xi,xj) (9)
此时,误差的计算公式(6)变为:
Figure BDA0002342095290000045
其中,下标RN表示在使用公式(10)计算误差时,实际使用到的训练样本的个数,具体来说:在确定参数θ时,需要计算全体训练样本的误差,此时RN的值为训练样本总个数N。在训练分类器时,使用到的训练样本是剔除了一小部分误差较大的训练样本之后剩余的样本,此时RN的值为实际训练样本个数
Figure BDA0002342095290000051
同理,Ωtrain为实际训练样本经过公式(9)计算得到的。相应地,使用核技巧时,决策函数(8)转变为
Figure BDA0002342095290000052
其中,RN的取值和Ωtrain的定义与公式(10)中相同。
本发明中使用高斯核函数K(xi,xj)=exp(-||xi-xj||2/(2σ2))作为非线性映射函数,σ为核函数的参数。
步骤2:解算软一类极限学习机的数学模型
根据公式(11)可以知道,在判断样本xt为正常样本还是故障样本时,需要先计算出向量β和τ的具体数值。本发明中,使用一种两步法来求解β和τ。具体求解过程如下:
第一步:固定τn,优化βn+1。在这里,τn为第n次迭代时的τ向量,βn+1为第n+1次迭代时的β向量。此时βn+1的计算公式为
Figure BDA0002342095290000053
第二步:已知βn+1,优化τn+1。在得到了βn+1的数值之后,样本xj在第n+1次迭代时的间隔为
Figure BDA0002342095290000061
接下来依据以下的规则来更新样本xj的目标间隔
Figure BDA0002342095290000062
(1)如果
Figure BDA0002342095290000063
由公式(13)可知,tj和/>
Figure BDA0002342095290000064
符号必然相同,说明样本xj被正确分类,且正确分类的间隔至少为1,这种结果令人满意。因此,xj在第n+1次迭代时的目标间隔设置为
Figure BDA0002342095290000065
(2)如果
Figure BDA0002342095290000066
说明样本xj被正确分类,但是正确分类间隔比较小,此时将/>
Figure BDA0002342095290000067
设置为
Figure BDA0002342095290000068
这样设置是为了鼓励增加它的间隔。
(3)如果
Figure BDA0002342095290000069
则说明样本xj被错误分类,为了能够在下一次迭代时以最大的程度来惩罚该误分类样本,将/>
Figure BDA00023420952900000610
设置为
Figure BDA00023420952900000611
将公式(14)、(15)和(16)综合起来,可以得到
Figure BDA00023420952900000612
的计算公式为
Figure BDA00023420952900000613
得到τn+1的值之后,就可以继续下一次迭代,直至满足迭代停止条件。在第一次迭代即n=0时,设置τ0=[1,1,...,1]T
步骤3:由步骤2中的方法,可以计算得到β和τ的数值,此时可以使用决策函数(11)来判断样本xt为正常样本还是故障样本。核函数参数σ和平衡参数C是通过5折交叉验证法选取的,备选集分别为:{2-5,2-4,...,210}和{2-5,2-4,...,210}。
上述算法在涡轴发动机故障检测中的应用,包括如下步骤:
步骤1:采集全飞行包线内的发动机数据,若航空发动机子部件正常,则记相应的标签为+1,反之则为-1。
步骤2:将样本数据预处理、归一化后,划分训练集和测试集。用训练集来训练软一类极限学习机;
步骤3:用训练好的软一类极限学习机分类器对新的涡轴发动机各部件进行故障检测。
有益效果:类不平衡学习中,通过对每个训练样本分配一个合适的间隔来使得OC-ELM算法的故障检测性能得到进一步的提高。
附图说明
图1为SOC-ELM的算法流程图;
图2为某型涡轴发动机的截面示意图;
图3.1-3.10为不同故障模式下三个算法的性能比较图,其中图3.1为故障样本占整个训练集1%时,CED故障模式下的ROC曲线图;图3.2为故障样本占整个训练集5%时,CED故障模式下的ROC曲线图;图3.3为故障样本占整个训练集1%时,CFD故障模式下的ROC曲线图;图3.4为故障样本占整个训练集5%时,CFD故障模式下的ROC曲线图;图3.5为故障样本占整个训练集1%时,GTED故障模式下的ROC曲线图;图3.6为故障样本占整个训练集5%时,GTED故障模式下的ROC曲线图;图3.7为故障样本占整个训练集1%时,GTFD故障模式下的ROC曲线图;图3.8为故障样本占整个训练集5%时,GTFD故障模式下的ROC曲线图;图3.9为故障样本占整个训练集1%时,PTED故障模式下的ROC曲线图;图3.10为故障样本占整个训练集5%时,PTED故障模式下的ROC曲线图。
具体实施例
在涡轴发动机故障检测中,将正常样本的标签设置为1,由于软一类极限学习机在训练分类器时,只需要正常样本,所以训练样本的间隔全为+1,是离散的。为了使优化目标的约束条件和决策函数的判决条件尽可能保持一致,对每个训练样本分配一个合适的目标间隔,目标间隔的具体数值依据真实的发动机数据计算而得到。给定训练样本集{(xi,t)|xi∈Rd,t∈R,i=1,2,...,N},xi=[xi1,xi2,...,xid]T表示第i个训练样本,t是训练样本的标签,一般情况下t=1,N表示训练样本的个数,R表示实数集合。可知输入层节点数为d,输出层节点数为1,设隐含层节点数为#HN,则SOC-ELM的优化目标可写为
Figure BDA0002342095290000081
其中算子⊙为Hadamard积,||·||2为2范数,β=[β1,β2,...,β#HN]T为输出向量,βi为第i个隐含层节点与输出层节点的连接权重,e=[e1,e2,...,eN]T为误差向量,ei表示第i个训练样本的预测值与真实值之间的误差,t=[1,1,...,1]T,τ=[τ1,τ2,...,τN]T为目标边界向量,需要经过优化才能确定具体数值,C为平衡参数,H为隐含层节点输出矩阵,其定义式为
Figure BDA0002342095290000082
其中,aj=[aj1,aj2,...,ajd]T为第j个隐含层节点与输入层神经元的连接权重,bj为第j个隐含层节点的偏置量,h(·)为隐含层激活函数。根据KKT条件,SOC-ELM的优化目标可以转化为如下拉格朗日函数:
Figure BDA0002342095290000083
其中,α=[α1,α2,...,αN]T为拉格朗日乘子,上标T表示转置,将拉格朗日函数分别对β、e和α求偏导,并且令求导结果为0,即
Figure BDA0002342095290000084
化简上式,可得输出向量的计算公式为:
Figure BDA0002342095290000091
其中,I为单位矩阵。为了提高算法的鲁棒性,将训练样本中网络预测值和实际标签值之间误差较大的那一小部分样本剔除,剔除样本量与总训练样本量的比值μ一般取为0.05或者0.1。对于样本xi,网络预测值和实际标签值之间误差的定义为:
Figure BDA0002342095290000092
其中,βj由输出向量的计算公式(5)求得。由公式(6)可以看出,距离ε(xi)越小,说明xi为正常样本的可能性越大。定义一个阈值参数θ,当ε(xi)≤θ时,可以认为样本xi为正常样本,否则认为xi为故障样本。参数θ的计算方式为:首先依据误差的定义式(6),计算全体训练样本的误差,然后将求得的误差按照从大到小的顺序排列,即ε(1)≥…≥ε(N),令
Figure BDA0002342095290000093
其中,
Figure BDA0002342095290000094
为向下取整符号。其数学意义为:将误差介于ε(1)和θ之间的训练样本剔除掉,只使用误差小于θ的样本来训练分类器,这样可以避免过拟合,从而达到提高算法泛化性能的目的。对于测试样本xt,其决策函数为
Figure BDA0002342095290000095
当隐含层节点数#HN或者隐含层激活函数无法确定时,可以采用核技巧的形式来处理:
Ω=HHT:Ωi,j=h(xi)·h(xj)=K(xi,xj) (9)
此时,误差的计算公式(6)变为:
Figure BDA0002342095290000101
其中,下标RN表示在使用公式(10)计算误差时,实际使用到的训练样本的个数,具体来说:在确定参数θ时,需要计算全体训练样本的误差,此时RN的值为训练样本总个数N。在训练分类器时,使用到的训练样本是剔除了一小部分误差较大的训练样本之后剩余的样本,此时RN的值为实际训练样本个数
Figure BDA0002342095290000102
同理,Ωtrain为实际训练样本经过公式(9)计算得到的。相应地,使用核技巧时,决策函数(8)转变为
Figure BDA0002342095290000103
其中,RN的取值和Ωtrain的定义与公式(10)中相同。
本发明中使用高斯核函数K(xi,xj)=exp(-||xi-xj||2/(2σ2))作为非线性映射函数,σ为核函数的参数。
根据公式(11)可以知道,在判断样本xt为正常样本还是故障样本时,需要先计算出向量β和τ的具体数值。本发明中,使用一种两步法来求解β和τ。具体求解过程如下:
第一步:固定τn,优化βn+1。在这里,τn为第n次迭代时的τ向量,βn+1为第n+1次迭代时的β向量。此时βn+1的计算公式为
Figure BDA0002342095290000111
第二步:已知βn+1,优化τn+1。在得到了βn+1的数值之后,样本xj在第n+1次迭代时的间隔为
Figure BDA0002342095290000112
接下来依据以下的规则来更新样本xj的目标间隔
Figure BDA0002342095290000113
(1)如果
Figure BDA0002342095290000114
由公式(13)可知,tj和/>
Figure BDA0002342095290000115
符号必然相同,说明样本xj被正确分类,且正确分类的间隔至少为1,这种结果令人满意。因此,xj在第n+1次迭代时的目标间隔设置为
Figure BDA0002342095290000116
(2)如果
Figure BDA0002342095290000117
说明样本xj被正确分类,但是正确分类间隔比较小,此时将/>
Figure BDA0002342095290000118
设置为
Figure BDA0002342095290000119
这样设置是为了鼓励增加它的间隔。
(3)如果
Figure BDA00023420952900001110
则说明样本xj被错误分类,为了能够在下一次迭代时以最大的程度来惩罚该误分类样本,将/>
Figure BDA00023420952900001111
设置为
Figure BDA00023420952900001112
将公式(14)、(15)和(16)综合起来,可以得到
Figure BDA00023420952900001113
的计算公式为
Figure BDA0002342095290000121
得到τn+1的值之后,就可以继续下一次迭代,直至满足迭代停止条件。在第一次迭代即n=0时,设置τ0=[1,1,...,1]T
根据上面叙述的方法,可以计算得到β和τ的数值,此时可以使用决策函数(11)来判断样本xt为正常样本还是故障样本。
下面是本发明提出的算法SOC-ELM的实现过程:
Figure BDA0002342095290000122
ROC(Receiver Operation Characteristic,简称ROC)曲线的评价方法经常在类不平衡问题中被使用,ROC曲线下方围成的面积被称为AUC(Area Under Curve,简称AUC)值,AUC作为数值可以直观的评价分类器的好坏,值越大则分类性能越好。对于航空发动机实例,把故障判为正常的代价是非常巨大的,这是在航空发动机故障检测中不希望看到的结果。综合考虑正常和故障的查准率或查全率是合理的,那么用G-mean作为评价指标就能同时关注到预测为正常和故障的情况,并能评价分类器的性能。其中
Figure BDA0002342095290000131
(TP代表预测为正且标签为正的样本数,TN代表预测为负且标签为负的样本数,FP代表预测为正但标签为负的样本数,FN代表预测为负但标签为正的样本数)。所有实验均选用AUC值和G-mean值作为评价指标,这两个指标均为越大越好,数值1为其可以取到的最佳值。参数优化过程中,使用5折交叉验证。具体做法为:将数据集等分成五份,轮流将其中的4份作为训练集,1份作为测试集进行试验。每次试验都会得出相应的AUC(或G-mean)。5次结果的AUC(或G-mean)平均值作为对算法性能的估计,对每一组σ和C都有一个估计的AUC(或G-mean)值,最大的AUC(或G-mean)值对应的那一组参数即为实验选取到的最优参数。所有实验均是在Intel(R)Core(TM)i5-7400 CPU@3.00GHz的Windows 10上进行的,采用MATLAB R2017a编程。
本发明用T700型涡轴发动机做实验,如图2所示。该发动机主要部件包括进气道(Inlet),变速器(Transmission),压气机(Compressor),燃烧室(Combustor),燃气涡轮(Gas Turbine,简称GT),动力涡轮(Power Turbine,简称PT)和尾喷管(Nozzle)。压气机出口截面、燃气涡轮出口截面、功率涡轮出口截面以及尾喷管出口截面分别用代号3、42、5和9表示。气流经进气道流入压气机,通过压气机后气体为高压气。在燃烧室内,燃油喷入并和高压气体混合燃烧形成混合气,混合气流经燃气涡轮和动力涡轮时,通过高压轴和低压轴分别相连的压气机和减速器被驱动。混合气大部分能量都被转化为机械能,通过减速器传给了主旋翼。最终混合气以低速排入大气中。
与涡轴发动机转子相连的压气机,GT和PT在高转速下易发生故障。因此仅考虑这三个部件的故障。实验前收集全飞行包线内的仿真数据。本发明选5个性能参数,分别有压气机效率ηC、压气机流量WC、燃气涡轮效率ηTG、燃气涡轮流量WTG、动力涡轮效率ηTP,性能参数蜕化量以及相应的样本数量如表1所示。根据已装配发动机的传感器类型以及各参数的测量难易程度,经分析选取以下11个传感器测量参数:飞行高度H、前飞速度vx、燃油流量Wf、压气机出口总温T3、压气机出口总压P3、功率涡轮输出转速PNP、燃气涡轮输出转速PNC、燃气涡轮出口总温T42、燃气涡轮出口总压P42、动力涡轮出口总温T5、动力涡轮出口总压P5。为了进一步说明本文提出的SOC-ELM算法的有效性,本文将该算法与标准OC-ELM和标准一类支持向量机OCSVM进行比较。将采集得到的正常状态的数据标签置为+1,作为目标样本集;将5种故障数据的标签均置为-1,作为异常样本集。本文根据设置的5种故障形式,分别设计5组实验,即以目标数据集作为正常数据,分别以5种故障数据作为异常样本进行实验仿真。在每组仿真实验开始之前,使用Min-Max Scaling方式对数据进行归一化。对每组仿真实验,随机挑选正常样本中的40%样本作为训练集的一部分,随机挑选占比整个训练集1%的故障数据作为训练集的另一部分,并将该故障数据的标签人为的改为+1,即,训练集中正常样本个数为1320个,故障样本个数为13个。测试集的样本构成则为剩余的正常样本以及剩余的故障样本。参数优化结束后,在整个训练集中随机挑选70%的样本用于训练分类器,使用测试集来测试训练好的分类器的性能。需要注意的是,发动机的真实数据是使用传感器测量得到的,传感器测量的数据难免会混入噪声,在训练数据中加入占比1%的故障数据并将其标签改为+1的目的就是为了模拟正常数据中混入噪声的情况。为了能进一步考查正常样本中混入了更多噪声的情况,本次实验还设置了故障样本占训练集5%的实验,此时训练集中正常样本的个数为1320个,故障样本的个数为69个,测试集的样本构成则为剩余的正常样本以及剩余的故障样本。为了减少训练数据的随机选取对分类结果的影响,使算法独立运行50次并取其平均值和方差作为最终的评估值。故障样本占整个训练集1%和5%时的实验结果以及对应的ROC曲线图分别如表2、表3和图3.1-3.10所示。
表1性能参数的主要信息
Figure BDA0002342095290000141
Figure BDA0002342095290000151
从表2可以看出,当故障样本占整个训练集1%时,在CED、GTED和GTFD三个数据集上,无论是用AUC还是用G-mean作为衡量指标,SOC-ELM的性能都是最优的,尤其是在用G-mean衡量时,与OC-ELM相比,SOC-ELM的值分别提高了4.82%,2.52%和3.08%。在CFD和PTED数据集上,使用AUC值衡量时,与OC-ELM相比,虽然SOC-ELM的值分别降低了0.25%和0.56%,但在使用G-mean衡量时,SOC-ELM的值分别提高了6.29%和0.13%。这说明在对涡轴发动机进行故障检测实验时,与OC-ELM和OC-SVM相比,SOC-ELM具有更强的检测性能。继续分析表2可以发现,在CFD、GTED、GTFD和PTED四个数据集中,SOC-ELM的训练时间比OC-ELM的要长,这是因为SOC-ELM的目标边界向量τ和输出权重向量β均需要优化,这使得其解算过程更复杂,从而花费了较多的训练时间。在CED数据集中,SOC-ELM的训练时间比OC-ELM的要短,一个可能的原因是OC-ELM在求解阈值参数θ时耗费的时间比SOC-ELM在求解θ、τ和β时耗费的时间都要多,这种现象是一个特例,与具体的数据有关系,在此不详细研究其形成机理。虽然SOC-ELM的训练时间要更长,但是这些算法都是采用离线训练、在线测试的方式进行故障检测的,所以训练时间稍长并不会影响到实际的检测过程。由表2还可以看出,虽然在GTFD数据集中,SOC-ELM的测试时间比OC-ELM的时间要稍长,但是在另外的CED、CFD、GTED和PTED四个数据集中,SOC-ELM的测试时间都更短。这说明当故障样本占整个训练集1%时,与OC-ELM相比,SOC-ELM更稀疏。在五个数据集中,与SOC-ELM和OC-ELM相比,虽然OC-SVM的测试时间要更短,但是其故障检测性能却是最差的。这进一步说明了在进行涡轴发动机的故障检测时,SOC-ELM具有很强的优势。
表2故障样本占整个训练集1%时的涡轴发动机实验结果
Figure BDA0002342095290000152
/>
Figure BDA0002342095290000161
表3故障样本占整个训练集5%时的涡轴发动机实验结果
Figure BDA0002342095290000162
由表3可以看出,当故障样本占整个训练集5%时,在五个数据集中,无论是用AUC还是G-mean作为评价指标,SOC-ELM的性能都是最优的,而且其数值均在95%以上。从数值角度分析,在CED、CFD、GTED、GTFD和PTED五个数据集中,与OC-ELM相比,在使用AUC作为评价指标时,SOC-ELM的值分别提高了6.53%、8.03%、0.73%、4.99%和6.16%,在使用G-mean作为评价指标时,SOC-ELM的值分别提高了15.2%、14.08%、0.92%、13.21%和16.7%。与SOC-ELM和OC-ELM相比,OC-SVM的故障检测性能依然是最差的。关于训练时间和测试时间的分析,与故障样本占整个训练集1%时的情形类似,在此不再重复叙述。
图3.1-3.10所示的ROC曲线图与表2和表3的AUC值相对应。由图3.1-3.10可以直观的看出,SOC-ELM算法相对于另三种对比算法是具有优越性的。
由以上分析可知,在选择的5种故障模式里,本发明提出的SOC-ELM算法的故障检测性能是最好的,在AUC值和G-mean值两个指标的评价下均是如此。航空发动机故障检测算法优劣排序为SOC-ELM>OC-ELM>OC-SVM。
注:表中CED、CFD、GTED、GTFD和PTED分别对应压气机效率ηC故障、压气机流量WC故障、燃气涡轮效率ηTG故障、燃气涡轮流量WTG故障、动力涡轮效率ηTP故障这五种情况。

Claims (2)

1.基于软一类极限学习机的涡轴发动机故障检测方法,其特征在于,包括如下步骤:
步骤1:采集全飞行包线内,涡轴发动机各部件正常状态下的数据和故障状态下的数据,构建样本集;
步骤2:用样本集训练软一类极限学习机分类器;
步骤3:用训练好的软一类极限学习机分类器对新采集的涡轴发动机的数据进行分类;
步骤2包括:
步骤2.1:建立软一类极限学习机的数学模型;
给定训练样本集{(xi,t)|xi∈Rd,t∈R,i=1,2,...,N},xi=[xi1,xi2,...,xid]T表示第i个训练样本,t是训练样本的标签,N表示训练样本的个数,R表示实数集合;可知输入层节点数为d,输出层节点数为1,设隐含层节点数为#HN,则SOC-ELM的优化目标可写为
Figure FDA0004216545750000011
其中算子⊙为Hadamard积,||·||2为2范数,β=[β12,...,β#HN]T为输出向量,βi为第i个隐含层节点与输出层节点的连接权重,e=[e1,e2,...,eN]T为误差向量,ei表示第i个训练样本的预测值与真实值之间的误差,t=[1,1,...,1]T,τ=[τ12,...,τN]T为目标边界向量,C为平衡参数,H为隐含层节点输出矩阵,其定义式为
Figure FDA0004216545750000012
其中,aj=[aj1,aj2,...,ajd]T为第j个隐含层节点与输入层神经元的连接权重,bj为第j个隐含层节点的偏置量,h(·)为隐含层激活函数;
根据KKT条件,SOC-ELM的优化目标可转化为如下拉格朗日函数:
Figure FDA0004216545750000013
其中,α=[α12,...,αN]T为拉格朗日乘子,上标T表示转置;
将拉格朗日函数分别对β、e和α求偏导,并且令求导结果为0,即
Figure FDA0004216545750000021
化简上式,可得输出向量的计算公式为:
Figure FDA0004216545750000022
其中,I为单位矩阵;
对于样本xi,网络预测值和实际标签值之间误差的定义为:
Figure FDA0004216545750000023
其中,βj由输出向量的计算公式(5)求得;定义一个阈值参数θ,当ε(xi)≤θ时,可认为样本xi为正常样本,否则认为xi为故障样本;参数θ的计算方式为:首先依据误差的定义式(6),计算全体训练样本的误差,然后将求得的误差按照从大到小的顺序排列,即ε(1)≥…≥ε(N),令
Figure FDA0004216545750000024
其中,
Figure FDA0004216545750000025
为向下取整符号;其数学意义为:将误差介于ε(1)和θ之间的训练样本剔除掉,只使用误差小于θ的样本来训练分类器,以避免过拟合,从而达到提高算法泛化性能的目的;对于测试样本xt,其决策函数为
Figure FDA0004216545750000026
当隐含层节点数#HN或者隐含层激活函数无法确定时,可采用核技巧的形式来处理:
Ω=HHTi,j=h(xi)·h(xj)=K(xi,xj)(9)此时,误差的计算公式(6)变为:
Figure FDA0004216545750000031
其中,下标RN表示在使用公式(10)计算误差时,实际使用到的训练样本的个数,具体来说:在确定参数θ时,需要计算全体训练样本的误差,此时RN的值为训练样本总个数N;在训练分类器时,使用到的训练样本是剔除了一小部分误差较大的训练样本之后剩余的样本,此时RN的值为实际训练样本个数
Figure FDA0004216545750000032
同理,Ωtrain为实际训练样本经过公式(9)计算得到的;相应地,使用核技巧时,决策函数(8)转变为
Figure FDA0004216545750000033
其中,RN的取值和Ωtrain的定义与公式(10)中相同;
使用高斯核函数K(xi,xj)=exp(-||xi-xj||2/(2σ2))作为非线性映射函数,σ为核函数的参数;
步骤2.2:解算软一类极限学习机的数学模型;
使用两步法来求解β和τ,具体求解过程如下:
第一步:固定τn,优化βn+1;τn为第n次迭代时的τ向量,βn+1为第n+1次迭代时的β向量;此时βn+1的计算公式为
Figure FDA0004216545750000041
第二步:已知βn+1,优化τn+1;在得到了βn+1的数值之后,样本xj在第n+1次迭代时的间隔为
Figure FDA0004216545750000042
接下来依据以下的规则来更新样本xj的目标间隔
Figure FDA0004216545750000043
(1)如果
Figure FDA0004216545750000044
由公式(13)可知,tj和/>
Figure FDA0004216545750000045
符号必然相同,说明样本xj被正确分类,且正确分类的间隔至少为1,xj在第n+1次迭代时的目标间隔设置为
Figure FDA0004216545750000046
(2)如果
Figure FDA0004216545750000047
说明样本xj被正确分类,但是正确分类间隔比较小,此时将/>
Figure FDA0004216545750000048
设置为
Figure FDA0004216545750000049
(3)如果
Figure FDA00042165457500000410
则说明样本xj被错误分类,为了能够在下一次迭代时以最大的程度来惩罚该被错误分类的样本,将/>
Figure FDA00042165457500000411
设置为
Figure FDA00042165457500000412
将公式(14)、(15)和(16)综合起来,可得到
Figure FDA00042165457500000413
的计算公式为
Figure FDA0004216545750000051
得到τn+1的值之后,就可继续下一次迭代,直至满足迭代停止条件,在第一次迭代即n=0时,设置τ0=[1,1,...,1]T
2.根据权利要求1所述的基于软一类极限学习机的涡轴发动机故障检测方法,其特征在于,核函数参数σ和平衡参数C是通过5折交叉验证法选取,备选集分别为:{2-5,2-4,…,210}和{2-5,2-4,…,210}。
CN201911386199.5A 2019-12-27 2019-12-27 基于软一类极限学习机的涡轴发动机故障检测方法 Active CN111160457B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911386199.5A CN111160457B (zh) 2019-12-27 2019-12-27 基于软一类极限学习机的涡轴发动机故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911386199.5A CN111160457B (zh) 2019-12-27 2019-12-27 基于软一类极限学习机的涡轴发动机故障检测方法

Publications (2)

Publication Number Publication Date
CN111160457A CN111160457A (zh) 2020-05-15
CN111160457B true CN111160457B (zh) 2023-07-11

Family

ID=70558876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911386199.5A Active CN111160457B (zh) 2019-12-27 2019-12-27 基于软一类极限学习机的涡轴发动机故障检测方法

Country Status (1)

Country Link
CN (1) CN111160457B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183590A (zh) * 2020-09-14 2021-01-05 浙江大学 一种基于OneclassSVM算法的变压器故障诊断方法
CN112116101A (zh) * 2020-09-17 2020-12-22 南京航空航天大学 一种基于群体约减核极限学习机的航空发动机故障诊断方法
CN112682269A (zh) * 2020-12-21 2021-04-20 浙江工业大学 一种基于oc-rkelm的风电机组状态监测方法
CN113449779B (zh) * 2021-06-11 2024-04-16 南京航空航天大学 基于样本分布密度改进kkt条件的svm增量学习方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6519575B1 (en) * 2000-04-24 2003-02-11 General Electric Company System and method for classifying unknown data patterns in multi-variate feature space
CN107688825B (zh) * 2017-08-03 2020-02-18 华南理工大学 一种改进型的集成加权极限学习机污水处理故障诊断方法

Also Published As

Publication number Publication date
CN111160457A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
CN111160457B (zh) 基于软一类极限学习机的涡轴发动机故障检测方法
Zhou et al. Fault diagnosis of gas turbine based on partly interpretable convolutional neural networks
US7251582B2 (en) Fault diagnosis
US5105372A (en) Data processing system using a kalman filter
CN109033930B (zh) 基于故障机理和统计模型在线学习的设备故障诊断方法
CN109766583A (zh) 基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法
CN110500217B (zh) 基于可测数据特征的柴油机共轨系统油泵故障检测方法
CN108334059A (zh) 基于粒子群算法优化bp神经网络模型故障诊断方法
CN106093612A (zh) 一种电力变压器故障诊断方法
CN109781411A (zh) 一种结合改进稀疏滤波器与kelm的轴承故障诊断方法
CN109359668B (zh) 一种航空发动机多故障并发诊断方法
CN112257530A (zh) 基于盲信号分离和支持向量机的滚动轴承故障诊断方法
Chen et al. Aero-engine remaining useful life prediction method with self-adaptive multimodal data fusion and cluster-ensemble transfer regression
Montazeri-Gh et al. Gas path component fault diagnosis of an industrial gas turbine under different load condition using online sequential extreme learning machine
CN110046409A (zh) 一种基于ResNet的汽轮机部件健康状态评估方法
Salilew et al. Investigation of fault detection and isolation accuracy of different Machine learning techniques with different data processing methods for gas turbine
CN114297918A (zh) 基于全注意力深度网络和动态集成学习的航空发动机剩余寿命预测方法
CN110986407A (zh) 一种离心式冷水机组故障诊断方法
CN115375026A (zh) 一种多故障模式下的航空发动机寿命预测方法
CN110826587B (zh) 基于改进的加权一类支持向量机的涡轴发动机故障检测方法
CN111695288A (zh) 一种基于Apriori-BP算法的变压器故障诊断方法
CN111368370A (zh) 基于类特定重定向极限学习机学习算法的航空发动机故障诊断方法
Kumar Remaining useful life prediction of aircraft engines using hybrid model based on artificial intelligence techniques
Vladov et al. Neural network method for helicopters turboshaft engines working process parameters identification at flight modes
CN110826600B (zh) 基于自适应共振网络在线增量学习的发动机喘振预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant