CN111160457B

CN111160457B - 基于软一类极限学习机的涡轴发动机故障检测方法

Info

Publication number: CN111160457B
Application number: CN201911386199.5A
Authority: CN
Inventors: 赵永平; 黄功; 胡乾坤; 李兵; 谢云龙; 潘颖庭; 宋房全; 吴奂; 何家俊; 陈耀斌
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2019-12-27
Filing date: 2019-12-27
Publication date: 2023-07-11
Anticipated expiration: 2039-12-27
Also published as: CN111160457A

Abstract

本发明提供一种基于软一类极限学习机的涡轴发动机故障检测方法，本发明针对发动机故障数据很难获取或者是获取代价极高时的情况，通过对正常数据进行分析处理，建立一个分类效果良好的分类器，消除了经典OC‑ELM优化目标的约束条件和决策函数的判决条件不一致的这一缺陷。对每个训练样本的标签分配一个合适的软间隔，从而构建了效果更好的故障检测分类器。

Description

基于软一类极限学习机的涡轴发动机故障检测方法

技术领域

本发明针对涡轴发动机气路部件故障，利用一类极限学习机(One Class ExtremeLearning Machine)改进算法来解决在故障数据很难获取或者获取代价极高的情况下，对发动机进行故障检测等领域内存在的技术难题。

背景技术

航空发动机故障诊断系统作为发动机健康管理系统的有效组成部分之一，一直都是工业界和学术界的关注热点，而发动机气路部件故障发生概率可以占到发动机总体故障的90％以上，因此建立对气路部件故障诊断的有效方法就显得尤为重要。目前，对发动机故障诊断的可行方法主要集中在基于模型的方法和数据驱动的方法。基于模型的方法主要根据真实发动机运行状况而建立起发动机数学模型来对发动机健康状况做出判断，这种方法需要研究人员对发动机工作原理十分熟悉，但是随着发动机自身的不断创新与改进，建立精准模型的难度也在不断提升，模型中存在的不确定性以及系统非线性复杂度越来越高，都会影响这种方法的判断准确度，另外需要指出的就是这种方法对于不同型号发动机需要建立不同的数学模型。数据驱动的方法可以根据发动机传感器的实时数据以及历史收集数据来对目标进行故障检测与隔离，这种方法可以克服之前所述方法存在的困难，只要选择有效的机器学习算法并加以改进就可以完成对不同型号发动机故障诊断任务，本发明采用数据驱动的办法来解决发动机气路故障诊断中存在的问题。

传统的数据驱动航空发动机气路部件故障诊断机器学习算法为有监督型的学习算法，常见方法主要有神经网络、极限学习机和支持向量机等。神经网络算法可以避免发动机建模过程中复杂度与非线性过高所带来的问题，但是这种方法需要大量数据来训练隐含层与输出层节点权重参数，运用梯度下降的方法求解模型使得训练时间过长，并且最终结果容易陷入局部最优。支持向量机(Support Vector Machine，简称SVM)作为经典的二分类算法，在处理中小样本分类问题时有较好的结果。极限学习机(Extreme LearningMachine，简称ELM)是一种简单的单隐藏层前馈神经网络，这种模型训练简单，并且当隐含层节点大于一定数目时，模型输出可以以零误差逼近训练样本，但是这种方法往往存在过拟合的风险。由于生产技术及科学水平的提高，发动机出现故障的情况也越来越少见，故障数据的获取也越来越昂贵，故类别不平衡问题在航空发动机的故障检测中越来越突出。标准ELM在解决类别不平衡问题时，会存在一定的问题：测试结果会倾向于样本量大的那一类样本。而一类极限学习机(One-Class Extreme Learning Machine，简称OC-ELM)能很好的解决这一潜在的问题。其基本原理为：将全体训练样本中模型输出值和样本标签值之间差值大于阈值θ的那一小部分样本剔除掉，使用剩余的样本来训练分类器，针对测试样本，如果其模型输出值和样本标签值之间的差值小于阈值θ，则认为该测试样本为正常样本，否则为故障样本。由原理可知OC-ELM在构建分类器时，只需正常数据即可。然而，传统的OC-ELM存在一些不足，如：优化目标的约束条件和决策函数的判决条件不一致。基于此，本发明提出一种软一类极限学习机(Soft One-Class Extreme Learning Machine，简称SOC-ELM)学习算法。该算法通过对每一个训练样本分配一个合适的间隔，将离散的目标值转变为连续的目标值来提高算法的分类性能。

本发明采用一种改进的OC-ELM来构建分类器，能很好的处理在故障数据量少的情况下，对涡轴发动机进行高效的故障检测这一技术难题。

发明内容

发明目的：为克服ELM，OC-ELM在解决类别不平衡情况下的故障检测准确率低的问题，本发明对每个训练样本分配一个合适的间隔，消除了经典OC-ELM对每个训练样本都分配同一个间隔的缺陷，从而提高故障检测的准确率。

技术方案：

一种软一类极限学习机算法，通过对每个训练样本分配一个合适的间隔，包括如下的步骤：

步骤1：建立软一类极限学习机的数学模型：

SOC-ELM是一种特殊的单隐含层前馈神经网络，其网络结构由输入层、隐含层和输出层等三层神经网络组成。给定训练样本集{(x_i，t)|x_i∈R^d，t∈R，i＝1，2，...，N}，x_i＝[x_i1，x_i2，...，x_id]^T表示第i个训练样本，t是训练样本的标签，一般情况下t＝1，N表示训练样本的个数，R表示实数集合。可知输入层节点数为d，输出层节点数为1，设隐含层节点数为#HN，则SOC-ELM的优化目标可写为

其中算子⊙为Hadamard积，||·||₂为2范数，β＝[β₁，β₂，...，β_#HN]^T为输出向量，β_i为第i个隐含层节点与输出层节点的连接权重，e＝[e₁，e₂，...，e_N]^T为误差向量，e_i表示第i个训练样本的预测值与真实值之间的误差，t＝[1，1，...，1]^T，τ＝[τ₁，τ₂，...，τ_N]^T为目标边界向量，需要经过优化才能确定具体数值，C为平衡参数，H为隐含层节点输出矩阵，其定义式为

其中，a_j＝[a_j1，a_j2，...，a_jd]^T为第j个隐含层节点与输入层神经元的连接权重，b_j为第j个隐含层节点的偏置量，h(·)为隐含层激活函数。根据KKT条件，SOC-ELM的优化目标可以转化为如下拉格朗日函数：

其中，α＝[α₁，α₂，...，α_N]^T为拉格朗日乘子，上标T表示转置，将拉格朗日函数分别对β、e和α求偏导，并且令求导结果为0，即

化简上式，可得输出向量的计算公式为：

其中，I为单位矩阵。为了提高算法的鲁棒性，将训练样本中网络预测值和实际标签值之间误差较大的那一小部分样本剔除，剔除样本量与总训练样本量的比值μ一般取为0.05或者0.1。对于样本x_i，网络预测值和实际标签值之间误差的定义为：

其中，β_j由输出向量的计算公式(5)求得。由公式(6)可以看出，距离ε(x_i)越小，说明x_i为正常样本的可能性越大。定义一个阈值参数θ，当ε(x_i)≤θ时，可以认为样本x_i为正常样本，否则认为x_i为故障样本。参数θ的计算方式为：首先依据误差的定义式(6)，计算全体训练样本的误差，然后将求得的误差按照从大到小的顺序排列，即ε₍₁₎≥…≥ε_(N)，令

其中，

为向下取整符号。其数学意义为：将误差介于ε₍₁₎和θ之间的训练样本剔除掉，只使用误差小于θ的样本来训练分类器，这样可以避免过拟合，从而达到提高算法泛化性能的目的。对于测试样本x_t，其决策函数为

当隐含层节点数#HN或者隐含层激活函数无法确定时，可以采用核技巧的形式来处理：

Ω＝HH^T：Ω_i，j＝h(x_i)·h(x_j)＝K(x_i，x_j) (9)

此时，误差的计算公式(6)变为：

其中，下标RN表示在使用公式(10)计算误差时，实际使用到的训练样本的个数，具体来说：在确定参数θ时，需要计算全体训练样本的误差，此时RN的值为训练样本总个数N。在训练分类器时，使用到的训练样本是剔除了一小部分误差较大的训练样本之后剩余的样本，此时RN的值为实际训练样本个数

同理，Ω_train为实际训练样本经过公式(9)计算得到的。相应地，使用核技巧时，决策函数(8)转变为

其中，RN的取值和Ω_train的定义与公式(10)中相同。

本发明中使用高斯核函数K(x_i，x_j)＝exp(-||x_i-x_j||²/(2σ²))作为非线性映射函数，σ为核函数的参数。

步骤2：解算软一类极限学习机的数学模型

根据公式(11)可以知道，在判断样本x_t为正常样本还是故障样本时，需要先计算出向量β和τ的具体数值。本发明中，使用一种两步法来求解β和τ。具体求解过程如下：

第一步：固定τⁿ，优化βⁿ⁺¹。在这里，τⁿ为第n次迭代时的τ向量，βⁿ⁺¹为第n+1次迭代时的β向量。此时βⁿ⁺¹的计算公式为

第二步：已知βⁿ⁺¹，优化τⁿ⁺¹。在得到了βⁿ⁺¹的数值之后，样本x_j在第n+1次迭代时的间隔为

接下来依据以下的规则来更新样本x_j的目标间隔

(1)如果

由公式(13)可知，t_j和/>

符号必然相同，说明样本x_j被正确分类，且正确分类的间隔至少为1，这种结果令人满意。因此，x_j在第n+1次迭代时的目标间隔设置为

(2)如果

说明样本x_j被正确分类，但是正确分类间隔比较小，此时将/>

设置为

这样设置是为了鼓励增加它的间隔。

(3)如果

则说明样本x_j被错误分类，为了能够在下一次迭代时以最大的程度来惩罚该误分类样本，将/>

设置为

将公式(14)、(15)和(16)综合起来，可以得到

的计算公式为

得到τⁿ⁺¹的值之后，就可以继续下一次迭代，直至满足迭代停止条件。在第一次迭代即n＝0时，设置τ⁰＝[1，1，...，1]^T。

步骤3：由步骤2中的方法，可以计算得到β和τ的数值，此时可以使用决策函数(11)来判断样本x_t为正常样本还是故障样本。核函数参数σ和平衡参数C是通过5折交叉验证法选取的，备选集分别为：{2^-5，2^-4，...，2¹⁰}和{2^-5，2^-4，...，2¹⁰}。

上述算法在涡轴发动机故障检测中的应用，包括如下步骤：

步骤1：采集全飞行包线内的发动机数据，若航空发动机子部件正常，则记相应的标签为+1，反之则为-1。

步骤2：将样本数据预处理、归一化后，划分训练集和测试集。用训练集来训练软一类极限学习机；

步骤3：用训练好的软一类极限学习机分类器对新的涡轴发动机各部件进行故障检测。

有益效果：类不平衡学习中，通过对每个训练样本分配一个合适的间隔来使得OC-ELM算法的故障检测性能得到进一步的提高。

附图说明

图1为SOC-ELM的算法流程图；

图2为某型涡轴发动机的截面示意图；

图3.1-3.10为不同故障模式下三个算法的性能比较图，其中图3.1为故障样本占整个训练集1％时，CED故障模式下的ROC曲线图；图3.2为故障样本占整个训练集5％时，CED故障模式下的ROC曲线图；图3.3为故障样本占整个训练集1％时，CFD故障模式下的ROC曲线图；图3.4为故障样本占整个训练集5％时，CFD故障模式下的ROC曲线图；图3.5为故障样本占整个训练集1％时，GTED故障模式下的ROC曲线图；图3.6为故障样本占整个训练集5％时，GTED故障模式下的ROC曲线图；图3.7为故障样本占整个训练集1％时，GTFD故障模式下的ROC曲线图；图3.8为故障样本占整个训练集5％时，GTFD故障模式下的ROC曲线图；图3.9为故障样本占整个训练集1％时，PTED故障模式下的ROC曲线图；图3.10为故障样本占整个训练集5％时，PTED故障模式下的ROC曲线图。

具体实施例

在涡轴发动机故障检测中，将正常样本的标签设置为1，由于软一类极限学习机在训练分类器时，只需要正常样本，所以训练样本的间隔全为+1，是离散的。为了使优化目标的约束条件和决策函数的判决条件尽可能保持一致，对每个训练样本分配一个合适的目标间隔，目标间隔的具体数值依据真实的发动机数据计算而得到。给定训练样本集{(x_i，t)|x_i∈R^d，t∈R，i＝1，2，...，N}，x_i＝[x_i1，x_i2，...，x_id]^T表示第i个训练样本，t是训练样本的标签，一般情况下t＝1，N表示训练样本的个数，R表示实数集合。可知输入层节点数为d，输出层节点数为1，设隐含层节点数为#HN，则SOC-ELM的优化目标可写为

化简上式，可得输出向量的计算公式为：

其中，

Ω＝HH^T：Ω_i，j＝h(x_i)·h(x_j)＝K(x_i，x_j) (9)

此时，误差的计算公式(6)变为：

其中，RN的取值和Ω_train的定义与公式(10)中相同。

接下来依据以下的规则来更新样本x_j的目标间隔

(1)如果

由公式(13)可知，t_j和/>

(2)如果

设置为

这样设置是为了鼓励增加它的间隔。

(3)如果

设置为

将公式(14)、(15)和(16)综合起来，可以得到

的计算公式为

根据上面叙述的方法，可以计算得到β和τ的数值，此时可以使用决策函数(11)来判断样本x_t为正常样本还是故障样本。

下面是本发明提出的算法SOC-ELM的实现过程：

ROC(Receiver Operation Characteristic，简称ROC)曲线的评价方法经常在类不平衡问题中被使用，ROC曲线下方围成的面积被称为AUC(Area Under Curve，简称AUC)值，AUC作为数值可以直观的评价分类器的好坏，值越大则分类性能越好。对于航空发动机实例，把故障判为正常的代价是非常巨大的，这是在航空发动机故障检测中不希望看到的结果。综合考虑正常和故障的查准率或查全率是合理的，那么用G-mean作为评价指标就能同时关注到预测为正常和故障的情况，并能评价分类器的性能。其中

(TP代表预测为正且标签为正的样本数，TN代表预测为负且标签为负的样本数，FP代表预测为正但标签为负的样本数，FN代表预测为负但标签为正的样本数)。所有实验均选用AUC值和G-mean值作为评价指标，这两个指标均为越大越好，数值1为其可以取到的最佳值。参数优化过程中，使用5折交叉验证。具体做法为：将数据集等分成五份，轮流将其中的4份作为训练集，1份作为测试集进行试验。每次试验都会得出相应的AUC(或G-mean)。5次结果的AUC(或G-mean)平均值作为对算法性能的估计，对每一组σ和C都有一个估计的AUC(或G-mean)值，最大的AUC(或G-mean)值对应的那一组参数即为实验选取到的最优参数。所有实验均是在Intel(R)Core(TM)i5-7400 CPU@3.00GHz的Windows 10上进行的，采用MATLAB R2017a编程。

本发明用T700型涡轴发动机做实验，如图2所示。该发动机主要部件包括进气道(Inlet)，变速器(Transmission)，压气机(Compressor)，燃烧室(Combustor)，燃气涡轮(Gas Turbine，简称GT)，动力涡轮(Power Turbine，简称PT)和尾喷管(Nozzle)。压气机出口截面、燃气涡轮出口截面、功率涡轮出口截面以及尾喷管出口截面分别用代号3、42、5和9表示。气流经进气道流入压气机，通过压气机后气体为高压气。在燃烧室内，燃油喷入并和高压气体混合燃烧形成混合气，混合气流经燃气涡轮和动力涡轮时，通过高压轴和低压轴分别相连的压气机和减速器被驱动。混合气大部分能量都被转化为机械能，通过减速器传给了主旋翼。最终混合气以低速排入大气中。

与涡轴发动机转子相连的压气机，GT和PT在高转速下易发生故障。因此仅考虑这三个部件的故障。实验前收集全飞行包线内的仿真数据。本发明选5个性能参数，分别有压气机效率η_C、压气机流量W_C、燃气涡轮效率η_TG、燃气涡轮流量W_TG、动力涡轮效率η_TP，性能参数蜕化量以及相应的样本数量如表1所示。根据已装配发动机的传感器类型以及各参数的测量难易程度，经分析选取以下11个传感器测量参数：飞行高度H、前飞速度v_x、燃油流量W_f、压气机出口总温T₃、压气机出口总压P₃、功率涡轮输出转速PNP、燃气涡轮输出转速PNC、燃气涡轮出口总温T₄₂、燃气涡轮出口总压P₄₂、动力涡轮出口总温T₅、动力涡轮出口总压P₅。为了进一步说明本文提出的SOC-ELM算法的有效性，本文将该算法与标准OC-ELM和标准一类支持向量机OCSVM进行比较。将采集得到的正常状态的数据标签置为+1，作为目标样本集；将5种故障数据的标签均置为-1，作为异常样本集。本文根据设置的5种故障形式，分别设计5组实验，即以目标数据集作为正常数据，分别以5种故障数据作为异常样本进行实验仿真。在每组仿真实验开始之前，使用Min-Max Scaling方式对数据进行归一化。对每组仿真实验，随机挑选正常样本中的40％样本作为训练集的一部分，随机挑选占比整个训练集1％的故障数据作为训练集的另一部分，并将该故障数据的标签人为的改为+1，即，训练集中正常样本个数为1320个，故障样本个数为13个。测试集的样本构成则为剩余的正常样本以及剩余的故障样本。参数优化结束后，在整个训练集中随机挑选70％的样本用于训练分类器，使用测试集来测试训练好的分类器的性能。需要注意的是，发动机的真实数据是使用传感器测量得到的，传感器测量的数据难免会混入噪声，在训练数据中加入占比1％的故障数据并将其标签改为+1的目的就是为了模拟正常数据中混入噪声的情况。为了能进一步考查正常样本中混入了更多噪声的情况，本次实验还设置了故障样本占训练集5％的实验，此时训练集中正常样本的个数为1320个，故障样本的个数为69个，测试集的样本构成则为剩余的正常样本以及剩余的故障样本。为了减少训练数据的随机选取对分类结果的影响，使算法独立运行50次并取其平均值和方差作为最终的评估值。故障样本占整个训练集1％和5％时的实验结果以及对应的ROC曲线图分别如表2、表3和图3.1-3.10所示。

表1性能参数的主要信息

从表2可以看出，当故障样本占整个训练集1％时，在CED、GTED和GTFD三个数据集上，无论是用AUC还是用G-mean作为衡量指标，SOC-ELM的性能都是最优的，尤其是在用G-mean衡量时，与OC-ELM相比，SOC-ELM的值分别提高了4.82％，2.52％和3.08％。在CFD和PTED数据集上，使用AUC值衡量时，与OC-ELM相比，虽然SOC-ELM的值分别降低了0.25％和0.56％，但在使用G-mean衡量时，SOC-ELM的值分别提高了6.29％和0.13％。这说明在对涡轴发动机进行故障检测实验时，与OC-ELM和OC-SVM相比，SOC-ELM具有更强的检测性能。继续分析表2可以发现，在CFD、GTED、GTFD和PTED四个数据集中，SOC-ELM的训练时间比OC-ELM的要长，这是因为SOC-ELM的目标边界向量τ和输出权重向量β均需要优化，这使得其解算过程更复杂，从而花费了较多的训练时间。在CED数据集中，SOC-ELM的训练时间比OC-ELM的要短，一个可能的原因是OC-ELM在求解阈值参数θ时耗费的时间比SOC-ELM在求解θ、τ和β时耗费的时间都要多，这种现象是一个特例，与具体的数据有关系，在此不详细研究其形成机理。虽然SOC-ELM的训练时间要更长，但是这些算法都是采用离线训练、在线测试的方式进行故障检测的，所以训练时间稍长并不会影响到实际的检测过程。由表2还可以看出，虽然在GTFD数据集中，SOC-ELM的测试时间比OC-ELM的时间要稍长，但是在另外的CED、CFD、GTED和PTED四个数据集中，SOC-ELM的测试时间都更短。这说明当故障样本占整个训练集1％时，与OC-ELM相比，SOC-ELM更稀疏。在五个数据集中，与SOC-ELM和OC-ELM相比，虽然OC-SVM的测试时间要更短，但是其故障检测性能却是最差的。这进一步说明了在进行涡轴发动机的故障检测时，SOC-ELM具有很强的优势。

表2故障样本占整个训练集1％时的涡轴发动机实验结果

/>

表3故障样本占整个训练集5％时的涡轴发动机实验结果

由表3可以看出，当故障样本占整个训练集5％时，在五个数据集中，无论是用AUC还是G-mean作为评价指标，SOC-ELM的性能都是最优的，而且其数值均在95％以上。从数值角度分析，在CED、CFD、GTED、GTFD和PTED五个数据集中，与OC-ELM相比，在使用AUC作为评价指标时，SOC-ELM的值分别提高了6.53％、8.03％、0.73％、4.99％和6.16％，在使用G-mean作为评价指标时，SOC-ELM的值分别提高了15.2％、14.08％、0.92％、13.21％和16.7％。与SOC-ELM和OC-ELM相比，OC-SVM的故障检测性能依然是最差的。关于训练时间和测试时间的分析，与故障样本占整个训练集1％时的情形类似，在此不再重复叙述。

图3.1-3.10所示的ROC曲线图与表2和表3的AUC值相对应。由图3.1-3.10可以直观的看出，SOC-ELM算法相对于另三种对比算法是具有优越性的。

由以上分析可知，在选择的5种故障模式里，本发明提出的SOC-ELM算法的故障检测性能是最好的，在AUC值和G-mean值两个指标的评价下均是如此。航空发动机故障检测算法优劣排序为SOC-ELM>OC-ELM>OC-SVM。

注：表中CED、CFD、GTED、GTFD和PTED分别对应压气机效率η_C故障、压气机流量W_C故障、燃气涡轮效率η_TG故障、燃气涡轮流量W_TG故障、动力涡轮效率η_TP故障这五种情况。

Claims

1.基于软一类极限学习机的涡轴发动机故障检测方法，其特征在于，包括如下步骤：

步骤1：采集全飞行包线内，涡轴发动机各部件正常状态下的数据和故障状态下的数据，构建样本集；

步骤2：用样本集训练软一类极限学习机分类器；

步骤3：用训练好的软一类极限学习机分类器对新采集的涡轴发动机的数据进行分类；

步骤2包括：

步骤2.1：建立软一类极限学习机的数学模型；

给定训练样本集{(x_i,t)|x_i∈R^d,t∈R,i＝1,2,...,N}，x_i＝[x_i1,x_i2,...,x_id]^T表示第i个训练样本，t是训练样本的标签，N表示训练样本的个数，R表示实数集合；可知输入层节点数为d，输出层节点数为1，设隐含层节点数为#HN，则SOC-ELM的优化目标可写为

其中算子⊙为Hadamard积，||·||₂为2范数，β＝[β₁,β₂,...,β_#HN]^T为输出向量，β_i为第i个隐含层节点与输出层节点的连接权重，e＝[e₁,e₂,...,e_N]^T为误差向量，e_i表示第i个训练样本的预测值与真实值之间的误差，t＝[1,1,...,1]^T，τ＝[τ₁,τ₂,...,τ_N]^T为目标边界向量，C为平衡参数，H为隐含层节点输出矩阵，其定义式为