CN117592543A - 一种基于自监督学习的航空发动机滚动轴承故障诊断方法 - Google Patents
一种基于自监督学习的航空发动机滚动轴承故障诊断方法 Download PDFInfo
- Publication number
- CN117592543A CN117592543A CN202311503840.5A CN202311503840A CN117592543A CN 117592543 A CN117592543 A CN 117592543A CN 202311503840 A CN202311503840 A CN 202311503840A CN 117592543 A CN117592543 A CN 117592543A
- Authority
- CN
- China
- Prior art keywords
- layer
- training
- self
- output
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000003745 diagnosis Methods 0.000 title claims abstract description 35
- 238000005096 rolling process Methods 0.000 title claims abstract description 23
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 78
- 230000006870 function Effects 0.000 claims description 47
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 31
- 239000013598 vector Substances 0.000 claims description 27
- 238000010606 normalization Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 23
- 230000004913 activation Effects 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 230000002401 inhibitory effect Effects 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000009467 reduction Effects 0.000 abstract description 3
- 238000012360 testing method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 3
- 230000008034 disappearance Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000010892 electric spark Methods 0.000 description 1
- 238000005461 lubrication Methods 0.000 description 1
- 238000003754 machining Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明属于滚动轴承故障诊断技术领域,公开了一种基于自监督学习的航空发动机滚动轴承故障诊断方法。该方法解决了监督学习在故障诊断中由于标记数据不足导致的泛化性能差的问题。本发明创新性地在自监督学习模型中加入了一个去噪模块,该模块有效地集成了软阈值和深度学习技术,从而在降噪、特征提取和故障识别方面具有出色的性能,并且在不同数量的标记和未标记数据下都保持了有效性,在实际工作条件下使用有限的标记数据能够保持较高的诊断准确性。相比于传统监督学习方法,本发明具有更高的实用性和经济性,是一种值得推广的故障诊断方法。
Description
技术领域
本发明涉及滚动轴承故障诊断技术领域,尤其涉及一种基于自监督学习的航空发动机滚动轴承故障诊断方法。
背景技术
航空发动机是飞机的关键组成部分,其中滚动轴承作为传动系统的重要组件,起着支撑和减少摩擦的关键作用。然而,由于航空发动机的特殊工作环境和高负荷运行,滚动轴承往往会面临各种故障风险,如疲劳破坏、润滑不良和轴承失效等。及早准确地诊断滚动轴承故障对于确保发动机安全运行、减少维修成本和延长使用寿命至关重要。
越来越多基于数据驱动的方法应用于滚动轴承故障诊断领域,在数据量充足的情况下这些方法表现出了优越的性能。但是基于数据驱动的故障诊断方法存在一个不可避免的弊端:需要大量的标记训练数据和先验知识,以便正确分类和诊断轴承故障。然而,获取足够数量的标记故障数据是一个昂贵和耗时的过程,这不仅涉及到航空发动机运行的极端环境,如高温、高压和高速等,使得数据采集设备的选择和部署非常困难且昂贵,还涉及到维修和停机时间成本、数据标记和验证的困难以及数据保密性和安全性要求的高标准,尤其对于特定类型和罕见故障的数据来说。这极大限制了传统深度学习方法的应用范围,严重的样本不足问题导致传统的深度学习方法在航空发动机滚动轴承故障诊断问题上表现不佳。
为了克服传统方法的限制,近年来,基于小样本学习的深度学习方法在滚动轴承故障诊断领域的应用得到了广泛关注。这些方法利用深度神经网络结构,结合特定的学习算法,能够从少量标记样本中提取有用的特征,并实现准确的分类和诊断任务。对于滚动轴承故障诊断,小样本学习的应用可以大大提高故障分类的准确性和可靠性,尤其在面对复杂的故障类型和数据量存在限制的情况下。
因此,基于小样本学习的方法对于滚动轴承故障诊断具有重要的作用。它不仅可以减少数据需求和降低成本,还可以提高故障诊断的精度和可靠性。这种方法的发展和应用有望推动航空发动机维护领域的技术进步,提高航空安全性并降低维修成本。
发明内容
为了降低故障诊断模型训练对大量数据的依赖,本发明提出一种基于自监督学习的航空发动机滚动轴承故障诊断方法。
本发明的技术方案如下:一种基于自监督学习的航空发动机滚动轴承故障诊断方法,具体步骤如下:
步骤1:构造自监督学习的输入样本对,将来自于故障信号数据集的未标记输入信号样本x1添加随机高斯噪声得到样本x2;未标记输入信号样本x1和样本x2构成输入样本对;
步骤2:构建自监督学习模型;首先对自监督学习模型的参数进行初始化,所有参数赋予初值;对始化后的自监督学习模型基于输入样本对和大规模无标记的正常轴承数据进行训练,学习过程分为对预训练任务进行训练和对下游任务进行训练。
所述自监督学习模型以简单孪生网络Simple Siamese为基础;所述预训练任务中,使用简单孪生网络Simple Siamese对大规模无标记的正常轴承数据进行训练;通过共享参数的方式构建两个相同的子网络,这两个子网络被称为孪生网络,分别接受输入数据的两个实例,并提取它们的特征表示;这些特征表示经过进一步处理后,用于计算输入实例之间的相似度或距离;
所述简单孪生网络包括编码器部分、投影模块和预测模块;
编码器部分表示为f(·),输入样本对x1、x2经过编码器被编码为特征向量f(x1)、f(x2),其中一个特征向量传递到一个由全连接层、批归一化层和非线性激活函数层组成的投影模块h(·),输出投影向量;分别将两个输入样本对对应的特征向量和投影向量输入至预测模块,计算它们之间的距离,通过它们之间的距离,生成对同一图像不同视图的相似特征表示;度量预测模块输出的预测向量与另一个投影向量之间距离的对比损失函数为:
其中,为负余弦相似度,p1=h(f(x1))和p2=h(f(x2))为投影模块h(·)的输出,z1=z(h(f(x1)))和z2=z(h(f(x2)))为预测模块z(·)的输出,x1和x2为输入样本对。
所述简单孪生网络核心是编码器部分,编码器部分主要由多个卷积层、批归一化层和非线性激活函数层组成,每个卷积层提取不同层次的特征,通过堆叠多个卷积层逐渐提取出更高级别的抽象特征;
卷积层为一维卷积,每层卷积核尺寸不同,分批次进行运算,卷积计算公式为:
其中,y[i]表示输出特征图中位置i的值,w[k,j]是卷积核中的权重参数,K是卷积核的长度,C是输入样本对特征图的通道数,x[i+j-1]是输入样本对特征图中位置i+j-1的值;通过对输入样本对特征图的每个位置进行卷积操作,得到输出特征图中相应位置的值;
输出特征图的尺寸计算公式可以表示为:
经卷积层后输出的一维特征图进行批归一化处理;批归一化层的数学公式如下:
其中,Y表示批归一化层的输出,X表示输入样本对特征图,E(X)表示输入样本对特征图的均值,Var(X)表示输入样本对特征图的方差,γ和β分别表示缩放因子和偏置项,∈是一个常数;
经过批归一化处理后,得到的输出结果通过一次ReLU激活函数进行非线性映射,然后被输入到池化层中进行降采样操作;
在依次经过卷积层-批归一化层-非线性激活函数层组成的残差块进行特征提取后,通过一个跳跃连接,将输入样本对直接添加到残差块的输出上;残差块中的学习映射函数为:
其中,表示残差块中的第一个卷积层,/>表示残差块中的批归一化层,表示残差块中的非线性激活函数层;
残差块中的跳跃连接为:
其中,表示残差块的输出,/>表示残差块的跳跃连接,/>表示残差块的学习映射。
所述自监督学习模型的下游任务中,在原始孪生网络中的编码器后引入一个去噪模块,该去噪模块通过嵌入软阈值函数到预测模块部分中实现;
所述软阈值函数的定义如下:
其中,x是输入数据,τ是阈值参数,S(x,τ)是输出数据;用矩阵形式表示:
S(X,T)=sign(X)⊙max(|X|-T,0)
其中,X是输入矩阵,T是阈值矩阵,sign(·)是符号函数矩阵,⊙是哈达玛积,max(|X|-T,0)是逐元素取最大值的矩阵;
在去噪模块中,首先使用全局平均池化层GAP对编码器输出的特征向量进行降维;GAP层对编码器输出的特征图的每个通道进行平均操作,生成一个长度与通道数相等的向量;而后使用卷积层对特征图进行全局信息的扫描,并从每个通道中提取局部有用的信息;
最后,通过Sigmoid激活函数为每个通道的特征图生成一组缩放因子,对缩放因子大于软阈值的通道的特征进行增强并抑制冗余信息;在应用缩放因子后,每个通道的软阈值由以下公式给出:
其中z和y分别对应卷积层和GAP层的输出,j是通道索引,M是通道总数,τ是一个正阈值;
在对简单孪生网络的下游任务训练中,只有投影模块、预测模块和去噪模块的参数参与梯度计算和参数更新,编码器的参数在反向传播过程中不更新。
所述训练结束的准则如下所示:
1)当准确率高于初始设定值时,提前结束训练过程;
2)准确率未达到初始设定值,则进行下一步判断,判断自监督学习模型是否达到设定的最大训练次数;
3)未达到最大训练次数,则继续进行训练;否则,停止训练。
本发明具有以下有益效果:
1.提高故障诊断的准确性并充分利用未标记数据:通过采用自监督学习的预训练任务和简单孪生网络结构,可以对大规模未标记的正常轴承数据进行有效的特征学习。这样训练得到的模型具有更强的表征能力,能够更准确地区分不同的滚动轴承故障类型,从而提高故障诊断的准确性。同时,自监督学习的方法使得可以充分利用大规模未标记的数据进行预训练,从而提高模型的性能和泛化能力。
2.学习鲁棒和有用的特征表示:通过最小化对比损失函数,学习更加鲁棒和有用的特征表示。并在编码器后添加了软阈值去噪模块,以更好地捕捉故障信号的关键特征,提高故障诊断的能力。
3.强化下游任务的特征提取:在预训练阶段,模型已经学习到了良好的特征表示。在使用少量标记数据进行微调的过程中,编码器参数固定,其余部分负责学习特定任务的相关特征。这样可以在下游任务中有效利用预训练阶段学习到的特征,提高任务的性能和效果。
附图说明
图1为简单孪生网络结构图;
图2为基于自监督学习的航空发动机滚动轴承故障诊断方法流程图;
图3为编码器的深度残差神经网络结构图;
图4为去噪模块网络结构图;
图5为训练过程中的损失函数曲线;
图6为自监督学习模型的故障诊断测试分类准确率;
图7为实施过程中故障诊断测试分类准确率。
具体实施方式
现结合实例、附图对本发明作进一步描述:
航空发动机轴承故障诊断流程如图2所示,下面详细描述每个步骤的具体实现步骤。
1)构造自监督学习的输入样本对;
构造自监督学习的输入样本对,具体构造方式为从故障信号数据集中获取未标记的输入信号样本x1,并对其添加随机高斯噪声以生成样本x2。具体而言,可以使用以下公式表示这一过程:
x2[n]=x1[n]+∈
其中:x1[n]是原始输入信号在时间点n的取值;x2[n]是添加了噪声后的信号在时间点n的取值;∈是从高斯分布中采样得到的随机噪声,均值设置为0,标准差为σ,可以表示为噪声的标准差σ决定了噪声的强度,较大的标准差表示噪声的幅度较大,较小的标准差表示噪声的幅度较小。
本发明对原始的凯斯西储大学数据集进行了小样本数据集的重新组合,其中每个振动信号样本由2048个数据点组成。
2)构建自监督学习的预训练任务
在预训练阶段,本发明利用了自监督学习技术,这意味着在只使用少量手动标记样本的情况下,使用了大量未标记的正常轴承数据进行训练,采用的网络结构为简单孪生网络,该网络结构由两个相同的部分组成。训练过程中,输入数据通过编码器部分进行特征提取,然后通过对比学习任务计算特征向量的相似度。编码器部分由多组残差块组成,输入样本对经过编码器被编码为两个特征向量,通过最小化这两个特征向量的对比损失函数,使得相似的输入样本在特征空间中更接近,不相似的样本则被推开,这有助于训练编码器能够学习到更鲁棒和有用的特征表示,帮助网络能够理解数据,从而提高模型的性能和准确性。
在训练模型参数的过程中,通过使用梯度停止技术防止预训练过程中对编码器部分的参数进行梯度反向传播,保持编码器的特征表示稳定。模型的训练过程中选择SGD作为优化器,并采用余弦退火策略动态地调整学习率。该策略会逐渐降低学习率,帮助模型更好地收敛到最优解。
3)构建自监督学习的下游任务。
在预训练完成后,使用预训练得到的编码器作为下游任务的特征提取器。下游任务模型基于原始孪生网络中的编码器后引入一个去噪模块。该模型将预训练得到的特征表示f(x1)和f(x2)作为输入,并在少量有标记的训练数据上进行微调。在微调过程中,我们通过最小化损失函数来优化模型,只更新投影模块、预测模块和去噪模块的参数。训练所述自监督学习模型的具体过程如图2所示。
首先对自监督学习模型的参数进行初始化,对所有的模型参数赋予初值,确保模型的初始状态是未经训练的,并为后续的训练过程提供一个起点;
对初始化后的模型进行训练,学习过程分为对预训练任务进行训练和对下游任务进行训练,具体过程描述如下:
a)预训练任务
简单孪生网络结构如图1所示,以原始数据为锚点,添加了随机噪声的数据为正样本,分别被左右参数共享的孪生网络进行特征提取。模型中用来提取特征的编码器采用了深度残差神经网络结构,包括卷积层、批归一化层、非线性激活函数层以及跳跃连接。在卷积层之后,通常会对特征图进行批归一化操作。批归一化是一种数据归一化方法,通过将数据归一化,可以减少梯度消失和梯度爆炸问题,使得模型能够更快地收敛。并且能在一定程度上起到正则化的效果,降低模型对噪声和过拟合的敏感性。
简单孪生网络的核心是编码器网络,负责将输入数据转换为有意义的特征表示。编码器为由多个卷积层、批归一化层和非线性激活函数层组成的深度残差网络。每个卷积层可以提取不同层次的特征,通过堆叠多个卷积层逐渐提取出更高级别的抽象特征。卷积层为一维卷积,每层卷积核尺寸不同,分批次进行运算,卷积计算公式为:
其中,y[i]表示输出特征图中位置i的值,w[k,j]是卷积核中的权重参数,K是卷积核的长度(滤波器尺寸),C是输入特征图的通道数,x[i+j-1]是输入特征图中位置i+j-1的值。通过对输入特征图的每个位置进行卷积操作,得到输出特征图中相应位置的值。输出特征图的尺寸计算公式可以表示为:
通过将输入特征图的宽度减去滤波器尺寸,加上双倍的边界填充大小,这里采用的是补零的策略,以保证特征图边缘的数据能够被有效利用。得到的结果再除以步长,最后加上1,即可得到输出特征图的宽度。
在批归一化中,输入为特征图X={X1,......,Xm},首先计算X的均值μB和方差σB 2,计算方法为:
然后变换原本的特征图X的均值为0,方差为1,即:
此时设定γ、β为可训练的参数,得到正则化后的输出为:
经过批归一化计算后,再进行一次激活函数的非线性映射引入非线性,选用的激活函数为ReLU函数,表现形式为:
f(x)=max(0,x)
经过激活后,为了降低特征图的空间维度,并提取出主要的特征信息,采用池化层对输入特征图进行分区,并在每个分区内选择最大值作为代表性特征。在经过多个卷积层进行堆叠后,随着网络层数的增加,梯度在反向传播过程中容易消失。残差连接将梯度直接传递给较早的层,缓解梯度消失问题、提高信息流动性、加速收敛速度和提升网络性能。每个残差块由多个卷积核尺寸相等的卷积层组成,其结构如图3所示。
每个残差块依次经卷积层-批归一化层-非线性激活函数层进行特征提取后,通过一个跳跃连接(skip connection),将输入直接添加到块的输出上,以便在训练过程中解决梯度消失和梯度爆炸的问题。残差块中的学习映射函数为:
其中,表示残差块中的第一个卷积层,/>表示残差块中的批归一化层,表示残差块中的第二个卷积层。
残差块中的跳跃连接为:
其中,表示残差块的输出,/>表示残差块的恒等映射(跳跃连接),/>表示残差块的学习映射。
至此完成对于输入信号时频特征图的特征提取学习部分。
通过最小化预测向量与另一个投影向量之间的距离,模型对同一图像的不同视图生成相似的特征表示。用来度量预测向量与另一个投影向量之间的距离的对比损失函数为:
其中,为负余弦相似度,p1=h(f(x1))和p2=h(f(x2))为投影头h(·)的输出,z1=z(h(f(x1)))和z2=z(h(f(x2)))为预测模块z(·)的输出,x1和x2为输入样本对。
b)下游任务
在预训练任务完成后,模型进入下游任务部分,这是模型的微调阶段。下游任务利用预训练得到的特征表示,对少量有标记的训练数据进行训练,来完成对故障数据进行分类的任务。在下游任务中,模型旨在利用预训练阶段学习到的特征表示解决特定的任务。针对多种工况下故障数据的诊断和分类需求,本发明引入了一个去噪模块在编码器后,以提高编码器的表征能力并消除输出特征中的不利因素,该去噪模块通过嵌入软阈值函数到神经网络中来实现。
软阈值函数是一种常用的非线性函数,定义如下:
其中,x是输入数据,τ是阈值参数,S(x,τ)是输出数据。软阈值函数的作用是将输入数据的绝对值小于阈值的部分置为零,而将大于阈值的部分减去或加上阈值。这样可以实现对数据的降噪和压缩,同时保留数据的主要特征。
软阈值函数可以用以下的矩阵形式表示:
S(X,T)=sign(X)⊙max(|X|-T,0)
其中,X是输入矩阵,T是阈值矩阵,sign(·)是符号函数矩阵,⊙是哈达玛积(逐元素相乘),max(|X|-T,0)是逐元素取最大值的矩阵。这种表示方式可以方便地进行矩阵运算。
在去噪模块中,首先使用全局平均池化GAP层对编码器输出的表征向量进行降维,减少参数量和复杂度。GAP层对特征图的每个通道进行平均操作,生成一个长度与通道数相等的向量。而后使用卷积层对特征图进行全局信息的扫描,并从每个通道中提取局部有用的信息。
最后,通过Sigmoid函数为每个通道集合生成一组缩放因子,对有用信息进行增强并抑制冗余信息。这种方式实现了对特征图中有用信息的增强和冗余信息的抑制。在应用缩放因子后,每个通道的软阈值由以下公式给出:
其中z和y分别对应卷积层和GAP层的输出,j是通道索引,M是通道总数,τ是一个正阈值。软阈值函数根据输入特征图每个通道的均值和方差动态地调整阈值,从而达到去噪的目的。软阈值函数充当一个门控机制,根据每个通道的重要性选择性地通过或阻断某些通道。
通过引入去噪模块并结合全局平均池化和卷积层,本发明提供了一种有效的方法,使得模型能够更好地利用编码器输出的特征表示,并在下游任务中取得更好的性能。
去噪模块的伪代码如表1所示,网络结构如图4所示。
表1去噪模块伪代码
在对简单孪生网络的下游任务训练中,只有投影模块、预测模块和去噪模块的参数会参与梯度计算和参数更新,而编码器的参数在反向传播过程中不会更新,防止由于梯度更新过程中的信息传递导致特征表示的不稳定性。此外,针对故障数据的分类任务要求,我们在网络的末端引入了一个分类器网络,用于对故障数据进行分类。该分类器由一系列不同类型的网络层组成,包括全连接层、批归一化层、激活函数层和另一个全连接层。
投影模块、预测模块及分类器的具体模型参数如表2所示。
表2投影头及预测头模型参数
通过反向传播对误差进行求导,损失函数越接近-1,训练结果越好。为了实现这一目标,在计算梯度时,采用梯度停止的方法。具体而言,一侧网络的梯度被停止,而另一侧网络的梯度用于更新网络权重,从而对所有权值进行更新。这一过程会不断重复直至模型训练结束,最终得到自监督学习模型。
在使用少量标记数据进行微调的过程中,编码器参数是固定的,而其余部分则负责学习与特定任务相关的特征。通过这种方式,模型可以利用预训练阶段学习到的通用特征表示,并通过微调来适应特定任务的需求。
模型训练结束的准则如下所示:
1.当准确率高于初始设定值时,可以提前结束训练过程;
2.如果准确率未达到初始设定值,则进行下一步判断,检查模型是否达到设定的最大训练次数;
3.如果还未达到最大训练次数,则继续进行训练;
如果达到了最大训练次数,则停止训练。
4)故障诊断过程
本发明所使用的模型训练数据源自美国凯斯西储大学(CWRU)的轴承故障数据集。我们选择了其中驱动端轴承的故障数据进行测试。测试台工作在空载条件下,使用采样频率为12k的加速度传感器对振动信号进行监测。为模拟轴承故障,采用电火花加工技术对轴承的不同位置加工出尺寸不同的故障,这样对应得到9种不同的故障模式,加上正常工作时采集到的数据,共计有10种轴承状态待分类。
从收集到的数据文件中,我们构建了用于训练和测试的数据集。对于每一段振动信号,我们以长度为2048个点的窗口制作原始振动信号样本,获得对应着10种故障模式的共计550个样本。在每种故障模式的样本中,我们随机选择20个样本作为预训练任务的训练集,因此预训练任务的训练集总共包含200个无标签样本。选择1个样本作为下游任务的训练集,因此下游任务的训练集总共包含10个标签样本。
表3轴承故障模式分类信息
详细的轴承故障模式分类信息如表3所示。
5)模型训练与测试结果分析
模型训练最大经历200次迭代,参数优化采用SGD优化器,设置其初始学习率为1×e-5。图5所示为模型训练过程中的损失函数曲线,根据该曲线,我们观察到损失函数在第25次迭代时已经收敛在-1附近,表明训练过程的稳定性和收敛性。
另外,我们还评估了Simsiam模型和本发明在故障诊断测试中的分类准确率,并将结果分别绘制在图6和图7中。根据图6的结果,Simsiam模型在故障诊断测试中的分类准确率达到了93.86%。然而,通过图7可以观察到,本发明在相同的测试条件下实现了更高的分类准确率,达到了98.35%。这表明本发明相对于Simsiam模型在故障诊断任务上具有更优越的性能。
综上所述,基于我们的实验结果,我们得出结论:本发明在数据量不足情况下的故障诊断测试中表现出较高的分类准确率,并且相较于Simsiam模型,具有更优越的性能。这表明本发明在故障诊断领域具有潜在的应用前景和优势。
Claims (5)
1.一种基于自监督学习的航空发动机滚动轴承故障诊断方法,其特征在于,具体步骤如下:
步骤1:构造自监督学习的输入样本对,将来自于故障信号数据集的未标记输入信号样本x1添加随机高斯噪声得到样本x2;未标记输入信号样本x1和样本x2构成输入样本对;
步骤2:构建自监督学习模型;首先对自监督学习模型的参数进行初始化,所有参数赋予初值;对始化后的自监督学习模型基于输入样本对和大规模无标记的正常轴承数据进行训练,学习过程分为对预训练任务进行训练和对下游任务进行训练。
2.根据权利要求1所述的基于自监督学习的航空发动机滚动轴承故障诊断方法,其特征在于,所述自监督学习模型以简单孪生网络Simple Siamese为基础;所述预训练任务中,使用简单孪生网络Simple Siamese对大规模无标记的正常轴承数据进行训练;通过共享参数的方式构建两个相同的子网络,这两个子网络被称为孪生网络,分别接受输入数据的两个实例,并提取它们的特征表示;这些特征表示经过进一步处理后,用于计算输入实例之间的相似度或距离;
所述简单孪生网络包括编码器部分、投影模块和预测模块;
编码器部分表示为f(·),输入样本对x1、x2经过编码器被编码为特征向量f(x1)、f(x2),其中一个特征向量传递到一个由全连接层、批归一化层和非线性激活函数层组成的投影模块h(·),输出投影向量;分别将两个输入样本对对应的特征向量和投影向量输入至预测模块,计算它们之间的距离,通过它们之间的距离,生成对同一图像不同视图的相似特征表示;度量预测模块输出的预测向量与另一个投影向量之间距离的对比损失函数为:
其中,为负余弦相似度,p1=h(f(x1))和p2=h(f(x2))为投影模块h(·)的输出,z1=z(h(f(x1)))和z2=z(h(f(x2)))为预测模块z(·)的输出,x1和x2为输入样本对。
3.根据权利要求2所述的基于自监督学习的航空发动机滚动轴承故障诊断方法,其特征在于,所述简单孪生网络核心是编码器部分,编码器部分主要由多个卷积层、批归一化层和非线性激活函数层组成,每个卷积层提取不同层次的特征,通过堆叠多个卷积层逐渐提取出更高级别的抽象特征;
卷积层为一维卷积,每层卷积核尺寸不同,分批次进行运算,卷积计算公式为:
其中,y[i]表示输出特征图中位置i的值,w[k,j]是卷积核中的权重参数,K是卷积核的长度,C是输入样本对特征图的通道数,x[i+j-1]是输入样本对特征图中位置i+j-1的值;通过对输入样本对特征图的每个位置进行卷积操作,得到输出特征图中相应位置的值;
输出特征图的尺寸计算公式可以表示为:
经卷积层后输出的一维特征图进行批归一化处理;批归一化层的数学公式如下:
其中,Y表示批归一化层的输出,X表示输入样本对特征图,E(X)表示输入样本对特征图的均值,Var(X)表示输入样本对特征图的方差,γ和β分别表示缩放因子和偏置项,∈是一个常数;
经过批归一化处理后,得到的输出结果通过一次ReLU激活函数进行非线性映射,然后被输入到池化层中进行降采样操作;
在依次经过卷积层-批归一化层-非线性激活函数层组成的残差块进行特征提取后,通过一个跳跃连接,将输入样本对直接添加到残差块的输出上;残差块中的学习映射函数为:
其中,表示残差块中的第一个卷积层,/>表示残差块中的批归一化层,/>表示残差块中的非线性激活函数层;
残差块中的跳跃连接为:
其中,表示残差块的输出,H(x)表示残差块的跳跃连接,/>表示残差块的学习映射。
4.根据权利要求2或3所述的基于自监督学习的航空发动机滚动轴承故障诊断方法,其特征在于,所述自监督学习模型的下游任务中,在原始孪生网络中的编码器后引入一个去噪模块,该去噪模块通过嵌入软阈值函数到预测模块部分中实现;
所述软阈值函数的定义如下:
其中,x是输入数据,τ是阈值参数,S(x,τ)是输出数据;用矩阵形式表示:
S(X,T)=sign(X)⊙max(|X|-T,0)
其中,X是输入矩阵,T是阈值矩阵,sign(·)是符号函数矩阵,⊙是哈达玛积,max(∣X∣-T,0)是逐元素取最大值的矩阵;
在去噪模块中,首先使用全局平均池化层GAP对编码器输出的特征向量进行降维;GAP层对编码器输出的特征图的每个通道进行平均操作,生成一个长度与通道数相等的向量;而后使用卷积层对特征图进行全局信息的扫描,并从每个通道中提取局部有用的信息;
最后,通过Sigmoid激活函数为每个通道的特征图生成一组缩放因子,对缩放因子大于软阈值的通道的特征进行增强并抑制冗余信息;在应用缩放因子后,每个通道的软阈值由以下公式给出:
其中z和y分别对应卷积层和GAP层的输出,j是通道索引,M是通道总数,τ是一个正阈值;
在对简单孪生网络的下游任务训练中,只有投影模块、预测模块和去噪模块的参数参与梯度计算和参数更新,编码器的参数在反向传播过程中不更新。
5.根据权利要求1、2或3所述的基于自监督学习的航空发动机滚动轴承故障诊断方法,其特征在于,所述训练结束的准则如下所示:
1)当准确率高于初始设定值时,提前结束训练过程;
2)准确率未达到初始设定值,则进行下一步判断,判断自监督学习模型是否达到设定的最大训练次数;
3)未达到最大训练次数,则继续进行训练;否则,停止训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311503840.5A CN117592543A (zh) | 2023-11-13 | 2023-11-13 | 一种基于自监督学习的航空发动机滚动轴承故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311503840.5A CN117592543A (zh) | 2023-11-13 | 2023-11-13 | 一种基于自监督学习的航空发动机滚动轴承故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117592543A true CN117592543A (zh) | 2024-02-23 |
Family
ID=89912564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311503840.5A Pending CN117592543A (zh) | 2023-11-13 | 2023-11-13 | 一种基于自监督学习的航空发动机滚动轴承故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117592543A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117786507A (zh) * | 2024-02-27 | 2024-03-29 | 中国海洋大学 | 全局和局部特征耦合指导的滚动轴承未知故障检测方法 |
-
2023
- 2023-11-13 CN CN202311503840.5A patent/CN117592543A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117786507A (zh) * | 2024-02-27 | 2024-03-29 | 中国海洋大学 | 全局和局部特征耦合指导的滚动轴承未知故障检测方法 |
CN117786507B (zh) * | 2024-02-27 | 2024-04-30 | 中国海洋大学 | 全局和局部特征耦合指导的滚动轴承未知故障检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111709292B (zh) | 基于递归图和深度卷积网络的压气机振动故障检测法 | |
CN109035149B (zh) | 一种基于深度学习的车牌图像去运动模糊方法 | |
Pan et al. | A novel deep learning network via multiscale inner product with locally connected feature extraction for intelligent fault detection | |
CN110595780B (zh) | 基于振动灰度图像和卷积神经网络的轴承故障识别方法 | |
CN111968193B (zh) | 一种基于StackGAN网络的文本生成图像方法 | |
CN112200244A (zh) | 一种基于递阶对抗训练的航天发动机异常智能检测方法 | |
CN110702411A (zh) | 一种基于时频分析的残差网络滚动轴承故障诊断方法 | |
Zhang et al. | A multi-module generative adversarial network augmented with adaptive decoupling strategy for intelligent fault diagnosis of machines with small sample | |
Tang et al. | A robust deep learning network for low-speed machinery fault diagnosis based on multikernel and RPCA | |
CN117592543A (zh) | 一种基于自监督学习的航空发动机滚动轴承故障诊断方法 | |
CN113627375A (zh) | 一种行星齿轮故障诊断方法、系统、存储介质及计算设备 | |
CN117290771A (zh) | 基于改进辅助分类生成对抗网络的旋转机械故障诊断方法 | |
CN114169377A (zh) | 基于g-mscnn的有噪环境中滚动轴承故障诊断方法 | |
CN113256443A (zh) | 核电水泵导轴承故障检测方法、系统、设备及可读存储介质 | |
CN113378943A (zh) | 基于小波-灰度共生矩阵的发动机转子碰磨故障诊断方法 | |
CN116702076A (zh) | 一种基于cnn特征融合的小样本迁移学习故障诊断方法、系统、计算机及存储介质 | |
CN116361723A (zh) | 一种基于多尺度特征和注意力的轴承故障诊断分类方法 | |
CN117030263A (zh) | 多传感器信号融合下基于改进残差网络的轴承故障诊断方法 | |
CN117473414A (zh) | 一种基于少噪声时频图像的轴承故障位置识别方法 | |
CN113409213B (zh) | 柱塞泵故障信号时频图降噪增强方法和系统 | |
Wang et al. | A novel rolling bearing fault diagnosis method based on adaptive denoising convolutional neural network under noise background | |
CN115017939A (zh) | 一种飞机燃油泵故障智能诊断方法、装置和存储介质 | |
CN112149804B (zh) | 一种新型卷积神经网络模型及应用 | |
CN117313003A (zh) | 一种基于改进深度残差收缩网络的旋转机械故障诊断方法 | |
CN116993322A (zh) | 一种基于卷积网络的故障诊断方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |