CN114818811A

CN114818811A - 一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法

Info

Publication number: CN114818811A
Application number: CN202210476230.XA
Authority: CN
Inventors: 孙希明; 丁培轩; 费中阳; 李京杰; 吴桢
Original assignee: Dalian University of Technology
Current assignee: Dalian University of Technology
Priority date: 2022-05-02
Filing date: 2022-05-02
Publication date: 2022-07-29

Abstract

本发明属于滚动轴承故障诊断领域，提出一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法，将孪生网络与度量学习相结合，提出一种基于孪生网络结构，采用度量学习策略的航空发动机轴承故障诊断方法。改变孪生网络原有的学习策略，采用度量学习中对于样本特征的距离衡量样本间的差异性。在面对样本量严重不足的情况下，采用构造学习任务的形式，将一个样本量不足的多分类任务转化成多个二分类任务，极大扩充了可用的模型训练任务。为样本缺乏情况下的航空发动机轴承故障诊断问题提供了有力的支撑，同时本发明也具有较强的工程实际应用价值。

Description

一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法

技术领域

本发明涉及滚动轴承故障诊断领域，尤其涉及一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法。

背景技术

航空发动机被视为飞机的心脏，必须具有极高的可靠性，任何微小的故障都可能导致发动机损坏甚至严重人员伤亡。而维护航空发动机是一笔巨大的开支，轴承作为航空发动机的关键部件，决定着航空发动机的性能，直接影响其使用寿命。为了保证航空发动机能够安全工作并节约维护成本，轴承故障诊断至关重要，高效可靠的航空发动机轴承故障诊断系统对飞机的安全飞行具有重要意义。

现有的基于数据驱动的轴承故障诊断方法不依赖于专家的先验知识，直接利用传感器采集到的数据建立与设备健康状态的关系，可以省时省力地完成系统故障检测和诊断任务。当前基于深度学习故障诊断方法在构建网络模型时，考虑解决的是数据量充足的情况，然而，在真实的航空发动机轴系中，由于设备长时间处于正常工作状态，且轴承的机械故障无法通过软件模拟，所以很难收集到大量的有效数据，更难以收集到足够的标记数据来满足数据驱动方法的要求。

在样本量不足发展出来的小样本学习故障诊断领域中，模型泛化能力差是一个棘手的问题。解决样本不足问题通常从增加数据体量入手，这类方法在数据量具备一定规模的情况下是有效的，但在数据样本极度缺乏的情况下，并不能通过重采样手段有效地扩充数据体量。而如何解决这种数据量不足导致的不能有效进行模型训练的问题，是现有航空发动机轴承故障诊断需要进行探索的方向。

发明内容

为了避免数据量不足带来的模型训练难及过拟合问题，本发明提出一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法。

本发明的技术方案如下：一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法，具体步骤如下：

步骤1：获取原始振动信号x(m)，对振动信号x(m)进行短时傅里叶变换，得到振动信号的时频特征图，变换方法如下；

其中，x(m)是一维离散振动信号，w(·)为窗函数，n为窗函数的长度，X(n,ω)是在时间和频率定义下的离散二维函数；

步骤2：构造学习任务，每两张时频特征图(x_i,x_j)组成一个带差异性标签I_dis的学习任务T；

总数为M的所有时频特征图数据x从属于N个分类C，x_i∈C_k，i＝1,2,3,...,M，k＝1,2,3,...,N；

定义输入学习任务为T,每个学习任务T中包含两个数据样本x_i和x_j，定义相同类样本构成的学习任务为T_s，不同类样本构成的学习任务为T_d，T_s和T_d中包含的样本形式相同，对学习任务如下表示，

对学习任务进行添加带差异性标签I_dis，定义：

步骤3：将学习任务集{T}作为模型的训练集，训练孪生网络度量学习模型，得到网络各层的参数；

孪生网络度量学习模型主体采用孪生网络结构，以Adam为优化器，包括特征学习部分和差异度学习部分；特征学习部分包括多组由卷积层、批归一化层、非线性激活函数层和最大池化层组成的结构层，每组结构层的卷积核尺寸相同、卷积核数量不同；差异度学习部分包括激活函数不同的全连接层；

学习任务集{T}经过特征学习部分进行特征提取后，对得到的特征向量进行差异度学习，最终输出为两个时频特征图样本的差异程度；

步骤4：将待诊断的样本与已有的一组已知故障数据组成的查询集进行任务构造，输入到孪生网络度量学习模型中，得到当前数据与查询集的差异程度，根据差异度预测当前样本所属故障分类，完成航空发动机轴承故障诊断过程。

所述训练孪生网络度量学习模型的具体过程为：

首先对孪生网络度量学习模型的参数进行网络权值初始化，对所有的卷积层以及全连接层中的权值赋予初值；

对初始化后的模型进行训练，模型的输入为学习任务集{T}，将其输入到孪生网络度量学习模型中进行训练学习；

学习过程分为特征学习部分和差异性学习部分，具体过程描述如下：

a)特征学习部分

输入两张时频特征图(x_i,x_j)的学习任务T，经特征学习部分的二维卷积层进行特征提取，离散卷积计算方式为：

其中，X为待进行卷积运算的二维时频特征图，h为尺寸为m_c×n_c的卷积核，S为卷积运算后的输出结果，为二维特征图；

在二维卷积层中，分批次进行卷积运算，输出的二维特征图的计算方式为：

其中，N^batch为批计算的尺寸，b为偏置，w为权重，C表示通道数，C_in为输入通道数，C_out为输出通道数，k为相应的卷积核参数；

输出的二维特征图尺寸为：

其中，m_c、n_c表示卷积核的尺寸m_c×n_c，H_out，W_out表示输出特征图的尺寸H_out×W_out，p表示填充的数量，s为步长，表示卷积核在特征图上的移动距离；

经卷积层后输出的二维特征图进行批归一化处理，进行正则化后的输出为：

其中，γ、β为训练参数；

μ_B为X的均值，

为X的方差；

正则化后的输出结果经一次ReLU激活后输入至池化层中，进行降采样操作；后续依次经卷积层-批归一化层-非线性激活函数层-最大池化层结构进行特征提取；

b)差异度学习

将特征学习部分得到的特征图进行展开操作，得到多维特征向量，这一特征向量经过第一个全连接层，进行非线性映射，得到与故障类型相同的10维特征向量；第一个全连接层形式：

Z＝wX+b

其中，w、b分别为全连接层中各神经节点的权重和偏置，Z为神经节点的输出，为特征向量的形式，特征向量分别为h_i和h_j，h_i＝(x_i1,x_i2,...,x_i10)为x_i的特征向量，h_j＝(x_j1,x_j2,...,x_j10)为x_j的特征向量；两个特征向量的差异性向量h_dis如下：

h_dis＝|h_i-h_j|²＝(|x_i1-x_j1|²,|x_i2-x_j2|²,...,|x_i10-x_j10|²)

差异性向量h_dis经ReLU激活函数激活，通过第二个全连接层，将h_dis映射成为一个差异性度量值，差异性度量值经过sigmoid激活函数激活，得到输出为0到1之间的差异性表征，0代表两个特征向量相同，1表示两个特征向量完全不同，完成差异度学习过程；sigmoid函数形式为：

模型训练过程中的损失函数选择二分类情况下的交叉熵损失函数，表达式为

其中N_x为训练样本数量，y_i表示样本的标签，相同类为0，不同类为1，p_i为样本的预测值，即每个任务T中两个样本x_i和x_j的差异程度；

计算交叉熵损失函数通过反向传播过程对误差求导，得到网络权重的更新量，对所有的权值进行更新；直至模型训练结束，得到孪生网络度量学习模型。

所述模型训练结束准则如下：

取每类故障中的两个样本，构成验证集的数据来源，按照相同的构造学习任务的方式将其构造为样本对的形式，组成验证集，在验证集上计算模型对于二分类任务的准确率；

当准确率高于初始设定值，则提前结束训练过程；

当准确率高未达到初始设定值，进行下一步，判断模型是否达到设定的最大训练次数；

当还未达到最大的训练次数，则继续进行训练；当达到了最大的训练次数，则停止训练。

所述孪生网络度量学习模型主体采用孪生网络结构，使用的优化器为Adam，经过特征学习部分进行特征提取后，对得到的特征向量进行差异度学习，最终输出为两个样本的差异程度。

本发明的有益效果：本发明针对航空发动机轴承故障诊断中样本量非常少的情况，提出了一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法，重新构建了网络的学习任务，以解决训练样本不足的问题。在孪生网络结构下，划分出特征学习与差异度学习这两个部分，以实现任务样本中数据是否属于同类的区分。对原始的凯斯西储大学数据集进行了小样本的重组，得到了适用于研究样本量极小的情况下进行训练与测试的数据集，以便合理验证模型的诊断性能。

本发明结合孪生网络结构与度量学习，在特征学习部分，利用卷积操作的特征提取能力对学习任务中的两个样本进行数据特征提取，在差异度学习部分，基于度量学习计算两个样本的差异度，得到了较高的故障诊断准确率。本发明为进一步发展样本量缺乏情况下发动机轴承故障诊断研究提供了一定的经验，同时也具有较高的实际工程应用价值。

附图说明

图1为基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法流程图；

图2为网络结构示意图；

图3为模型训练过程的损失函数曲线；

图4为模型训练过程中验证集准确率曲线；

图5为故障诊断测试分类准确率；

图6为卷积网络故障分类结果。

具体实施方式

现结合实例、附图对本发明作进一步描述：

航空发动机轴承故障诊断流程如图1所示，下面详细描述每个步骤的具体实现步骤。

1)数据预处理

短时傅里叶变换

为了对采集的原始振动信号进行有效的特征提取，先对原始的一维振动信号做短时傅里叶变换，计算方法如下

其中x(m)是输入的一维振动信号，w(·)为窗函数，n为窗函数的长度，得到的X(n,ω)是在时间和频率定义下的二维函数。采用2048个数据点构成一个振动信号样本，经过短时傅里叶变换后，得到的时频特征图维度为2@257×103，其中2代表着傅里叶变换后的实部与虚部。

2)构造学习任务

先对基本的分类任务进行定义，总数为M的所有数据x从属于N个分类C，表示为数据x_i∈C_k，i＝1,2,3,...,M，k＝1,2,3,...,N。定义输入学习任务为T,每个学习任务T中包含两个数据样本，因为是多分类任务，所以两个数据样本可能来自于相同的故障分类，也可能来自不同的故障分类，现定义相同类样本构成的学习任务为T_s，不同类样本构成的学习任务为T_d，T_s和T_d中包含的样本形式相同，用x_i和x_j来表示每个T中的输入，则对学习任务可以有如下表示，

学习任务T中的两个数据样本(x_i,x_j)代表两个同类或是不同类样本的时频特征图，已知共计有N个分类，记每个分类中存在K(K≥2)个数据样本，总计有M＝NK个样本数据，其中两两取样本的特征图构造成学习任务T，共计可以得到M(M-1)/2个学习任务T，其中同类学习任务T_s有NK(K-1)/2个，不同类学习任务T_d有NK²(N-1)/2个。在对学习任务进行打标签I_dis时，我们这样定义：

通过这样的定义，得到NK(K-1)/2个标签为0的同类样本对学习任务T_s，得到NK²(N-1)/2个标签为1的不同类样本对学习任务T_d。

3)基于孪生网络度量学习模型的训练过程

孪生网络度量学习模型的特征学习部分主要采用由卷积网络构成的特征提取器，差异性学习部分由两个全连接层构成，以方便进行差异度计算的度量学习，得到两个样本的差异程度。

a)特征学习部分

网络结构如图2所示，输入的学习任务T为两张时频特征图(x_i,x_j)，两张时频特征图分别由上下两个参数共享的网络进行特征提取。输入x_i(x_j)为257×103的2通道时频特征图，其中两个通道分别为短时傅里叶变换后的实部和虚部。输入的学习任务首先经过二维卷积层进行特征提取，离散卷积计算方式为

其中，X为待进行卷积运算的二维时频特征图，h为尺寸为m_c×n_c的卷积核，S为卷积运算后的输出结果，同样为二维的特征图。因为在二维卷积层中，每个数据样本不是单独计算的，为了更好地对数据集进行拟合计算，往往都是以一个设定好的批次数来一批一批计算的，所以输出特征图的计算方式为

其中N^batch为批计算的尺寸，b为偏置，w为权重，都是卷积核中的待学习参数，C表示通道数，C_in为输入通道数，C_out为输出通道数，k为相应的卷积核参数；

卷积层的输出特征图尺寸计算为

其中m_c，n_c表示卷积核的尺寸m_c×n_c，H_out，W_out表示输出特征图的尺寸H_out×W_out，p表示填充的数量，这里采用的是补零的策略，以保证特征图边缘的数据能够被有效利用，s为步长，表示卷积核在特征图上的移动距离。设置卷积层1的卷积核大小为3×3，数量为32，即输出通道数为32，卷积核移动步长为1，填充补零大小为1。经过计算，卷积层1输出的特征图尺寸为257×103，通道数为32。

经过卷积层后，对特征图经过批归一化运算。批归一化是一种数据归一化方法，往往用在深度神经网络中激活层之前。其作用可以加快模型训练时的收敛速度，使得模型训练过程更加稳定，避免梯度爆炸或者梯度消失。并且起到一定的正则化作用，几乎代替了Dropout。在批归一化中，输入为特征图X＝{x₁,...,x_m}，首先计算X的均值μ_B和方差

计算方法为：

然后变换原本的特征图X的均值为0，方差为1，即：

此时设定γ、β为可训练的参数，得到正则化后的输出为：

经过批归一化计算后，特征图尺寸不发生变化。但收敛过程加速，且梯度消失的问题得到有效的缓解。经过批归一化后的特征图需要对其进行一次激活函数的非线性映射，选用的激活函数为ReLU函数，ReLU函数会使一部分神经元的输出为0，这样就造成了网络的稀疏性，并且减少了参数的相互依存关系，缓解了过拟合问题的发生。ReLU函数表达形式为：

f(x)＝max(0,x)

相比于线性函数而言，ReLU的表达能力更强，尤其体现在深度网络中。而对于非线性函数而言，ReLU由于非负区间的梯度为常数，因此不存在梯度消失问题，使得模型的收敛速度维持在一个稳定状态。

由于激活后的函数特征图尺寸较大，为了缩减模型的大小，提高计算速度，同时提高所提取特征的鲁棒性，对特征图进行最大池化操作。池化层的计算形式类似于卷积层，只不过池化层中没有需要学习更新的参数，池化层在特征图上平移，使用每个核内最大的数值代替其他数值，对特征图进行降采样操作。经过池化层后的特征图尺寸计算方法与卷积层相同，卷积核大小同样为3×3，通道数量为32，不同的是在最大池化层1中，步长为2，不进行填充补零的操作，经此计算，经过最大池化层1后的特征图尺寸为128×51，通道数为32。

后续特征提取模块与之相似，皆为卷积层-批归一化层-非线性激活函数层-最大池化层结构，具体参数进行了调整。卷积层2、最大池化层2、卷积层3、最大池化层3的参数除通道数依次变为64、64、128、128，其余参数均与卷积层1、最大池化层1相同。经过卷积层2，最大池化层2后，得到的特征图尺寸为63×25，通道数为64。经过卷积层3，最大池化层3后，得到的特征图尺寸为31×12，通道数为128。至此完成对于输入信号时频特征图的特征提取学习部分。

b)差异度学习

在差异度学习部分，将特征学习部分得到的特征图进行展开操作，得到1×47616维特征向量，这一特征向量经过全连接层1，进行非线性映射，得到与故障类型相同的1×10维特征向量。全连接层形式写作：

Z＝wX+b

其中w、b分别为全连接层中各神经节点的权重和偏置，Z为神经节点的输出，为特征向量的形式，记此时得到的特征向量为h_i和h_j，h_i＝(x_i1,x_i2,...,x_i10)为x_i的特征向量，h_j＝(x_j1,x_j2,...,x_j10)为x_j的特征向量。计算两个特征向量的差异性向量h_dis如下：

h_dis＝|h_i-h_j|²＝(|x_i1-x_j1|²,|x_i2-x_j2|²,...,|x_i10-x_j10|²)

将这个维度为1×10的差异性向量h_dis经过ReLU激活函数激活。再通过全连接层2，将h_dis映射成为一个差异性度量值，这一度量值经过sigmoid激活函数激活，sigmoid函数形式为：

得到输出为0到1之间的差异性表征,0代表两个特征向量相同，1表示两个特征向量完全不同，完成差异度学习过程。孪生网络度量学习模型参数如表1所示。

因为模型在训练过程中只包含两个分类，即同类样本与不同类样本，所以损失函数选择二分类情况下的交叉熵损失函数，表达式为

其中y_i表示样本的标签，相同类为0，不同类为1，p_i为样本的预测值，即每个任务T中两个样本x_i和x_j的差异程度。

表1孪生网络度量学习模型参数

4)故障诊断过程

模型训练好之后，将模型参数保存下来，采用比对查询集的方式进行故障的分类诊断。在诊断阶段，将验证集中使用的样本作为查询集{x_qi}，i＝(1,2,...,10)。将待诊断的样本和查询集中的所有样本依次组合构成10个样本对{x_t,x_qi}，i＝(1,2,...,10)，经由训练好模型计算出每一个样本对的差异性指标d_i，i＝(1,2,...,10)，进而得到由d_i构成的区分向量V_diag＝(v₁,v₂,...,v₁₀)，其中向量中的每一项对应着待诊断样本与查询集中每类样本的差异性程度，取最小的一项差异性指标对应的分类C＝arg_i min|v_i|，v_i∈V_diag,即待诊断的样本与查询集中所有样本中差异最小的一项，得到其所属的标签，即认作是待诊断样本从属的分类。进而我们可以知道当前输入的样本表征设备为正常的还是故障的。若是表征设备是故障的，对应能够从查询集的标签中找到其对应的故障类型，完成轴承的故障检测功能。

5)数据集构成

训练数据来自美国凯斯西储大学的轴承故障数据集，选择其中驱动端轴承(SKF深沟球轴承6205-2RS-JEM)故障数据进行测试，测试台工作在空载(0马力)条件下，使用采样频率为12k的加速度传感器对振动信号进行监测。为模拟轴承故障，采用电火花加工技术对轴承的不同位置(内圈、外圈、滚动体)加工出尺寸不同的故障(0.007、0.014、0.021inch)，这样对应得到9中不同的故障模式，加上使用正常轴承工作时采集到的数据，共计有10种轴承状态待分类。将不同故障模式的轴承安装在测试台的驱动端，同时对振动信号进行监测的加速度传感器也安装在驱动端，进行振动信号的采集。从收集到的数据文件中制作训练测试使用的数据集，对每一段振动信号以2048个点为长度制作原始振动信号样本，可以得到55个样本，对应10种故障模式得到550个样本，每种故障模式样本中随机取5个作为训练集，2个作为验证集，构成的训练集中有50个样本用来进行模型的训练。在故障诊断阶段，每种故障模式取1个样本作为查询集，45个作为测试集，以验证模型的故障诊断性能。详细的轴承故障模式分类信息如表2所示。

表2轴承故障模式分类信息

6)模型训练与测试结果分析

模型训练最大经历200次迭代，参数优化采用Adam优化器，其本质上为带有动量项的RMSProp算法，结合了Adagrad善于处理稀疏梯度和RMSprop善于处理非平稳目标的优点，对内存需求较小，为不同的参数计算不同的自适应学习率，同时也适用于大多非凸优化，即适用于大数据集和高维空间。设置其初始学习率为0.001。图3所示为模型训练过程中的损失函数曲线，图4为模型训练过程中验证集的准确率曲线，在训练过程中可以观察到，在进行第189次迭代时，模型已经达到了99.35％的准确率。图5为训练好的模型在测试集上测试结果，从图5中可以看出，模型对于10种不同的故障模式都实现了准确的分类，在测试集上整体的准确率也达到了100.00％，说明即使在故障样本量很小的情况下，模型也能实现优异的轴承故障诊断能力。为体现模型对于小样本故障诊断问题的有效性，对比于不使用孪生网络度量学习结构的常规卷积网络结构进行同样的小样本故障诊断，卷积网络部分与本发明中提出的模型的特征学习部分的结构相似，网络参数同原始LeNet参数设置，采用相同的训练集和测试集进行对比实验，得到的分类结果如图6所示。由于训练样本量不足，虽然在训练集上表现良好，能够全部区分故障模式，但是在测试集上，卷积网络模型没有对分类0，即0.007英寸的内圈故障进行完全准确的识别，部分数据被识别成为分类1，识别准确率只有82.22％。而对于分类8，即0.021英寸的滚动体故障，则完全不能识别，全部预测成为分类0。卷积网络的整体故障识别准确率仅有88.22％，远低于本发明中提出的孪生网络度量学习模型。

本发明提出了一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法，结果表明，构建的孪生网络度量学习模型可以有效地在数据量不足情况下进行较高的故障识别率。综上所述，本发明提出的模型达到了较好的应用效果。