CN115758130A - 一种无监督迁移学习的滚动轴承故障诊断方法及系统 - Google Patents

一种无监督迁移学习的滚动轴承故障诊断方法及系统 Download PDF

Info

Publication number
CN115758130A
CN115758130A CN202211230446.4A CN202211230446A CN115758130A CN 115758130 A CN115758130 A CN 115758130A CN 202211230446 A CN202211230446 A CN 202211230446A CN 115758130 A CN115758130 A CN 115758130A
Authority
CN
China
Prior art keywords
fault
domain
target domain
batch
rolling bearing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211230446.4A
Other languages
English (en)
Inventor
郑波
黄健豪
陈国庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Civil Aviation Flight University of China
Original Assignee
Civil Aviation Flight University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Civil Aviation Flight University of China filed Critical Civil Aviation Flight University of China
Priority to CN202211230446.4A priority Critical patent/CN115758130A/zh
Publication of CN115758130A publication Critical patent/CN115758130A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明属于轴承故障诊断技术领域,具体提供了一种无监督迁移学习的滚动轴承故障诊断方法及系统,其中方法包括:在迁移学习网络训练过程中,对源域和目标域进行特征提取和域适配;目标域样本批量输入矩阵经过网络训练得到故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数‖G‖*;构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。该方案在噪声环境下对不同工况的轴承迁移学习故障诊断效果有明显提升,特别是在噪声较高的环境下提升效果更为明显;不仅故障诊断的效果更好,而且稳定性也更高,对迁移学习实验中各故障类型的诊断效果提升更为均衡。

Description

一种无监督迁移学习的滚动轴承故障诊断方法及系统
技术领域
本发明涉及轴承故障诊断技术领域,更具体地,涉及一种无监督迁移学习的滚动轴承故障诊断方法及系统。
背景技术
滚动轴承是旋转机械的关键部件,滚动轴承发生故障时会对设备造成重大损伤,严重影响设备的安全性和可靠性。传统的轴承故障诊断多采用信号分析的方法,如经验小波变换(empirical wavelet transform,EWT)法,变分模态分解(variational modedecomposition,VMD),信号时频峭度谱频带划分法。但信号分析方法通常需要人为地设计轴承故障特征提取的算法,依赖于大量的先验知识和专家经验。
相比于信号分析方法,在进行轴承故障诊断时,深度学习可以自动提取故障特征,大幅降低工作难度,深度学习在实际应用中取得了较好地诊断效果。文献于2017年就提出了首层大卷积核神经网络(Deep Convolutional Neural Networks with Wide First-layer Kernels,WDCNN)故障诊断方法,提高了网络在噪声环境下的轴承故障诊断效果。文献[6]提出了双dropout、FC层的网络(Convolution Neural Network with two Dropoutlayers and two Fully-connected layers,DFCNN),将轴承原始一维时域信号转化为二维灰度图。文献提出了一种融合多种故障类别信息的深度自编码器网络(StackedDiscriminant Information-based Auto-Encoder,SDIAE),引入了结构判别信息来设计新的损失函数,提高网络的特征提取能力。文献提出了一种融合多模态传感器信号的方法,提高了轴承在噪音环境下的故障诊断准确率。文献提出了一种基于双向长短期记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)的故障诊断模型,将原始振动信号直接输入该模型中,可以诊断出轴承的具体故障类型及损伤程度。文献提出了多尺度卷积和长短期记忆神经网络模型(Multi-scale Convolutional Neural Network and Long Shor-Term Memory,MCNN-LSTM)故障诊断模型,该模型通过两个不同大小卷积核的CNN对轴承原始振动信号进行特征提取,再利用堆叠LSTM网络对学习到的特征进行故障识别。
使用深度学习进行轴承故障诊断有许多成功的应用案列,但同时也带来了一些问题,如:随着网络模型层数的增加,模型参数也会大量增加,此时网络训练所需的时间和算力也会大幅度的增加;利用深度学习进行故障诊断,需要大量有标签的故障数据,而在实际的工业制造环境中,机械设备很少会在故障状态下运行,难以获取得到所需的故障数据。
发明内容
本发明针对现有技术中存在的现有利用深度学习方法进行滚动轴承故障诊断,主要采用有监督学习的方式,需要大量带标签的轴承故障数据,但实际工业运行中,此类数据通常难以获取的技术问题。
本发明提供了一种无监督迁移学习的滚动轴承故障诊断方法,包括以下步骤:
S1,将某工况下带有故障标签的数据集称为源域,另一工况下不带故障标签的数据集称为目标域,在网络的迁移学习训练过程中,将两者的样本批量输入矩阵同时输入网络进行特征提取,对两者被提取到的特征进行域适配;
S2,用于目标域样本批量输入矩阵经过网络训练得到的故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数||G||*
S3,构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。
优选地,所述S1具体包括:在进行迁移学习网络训练时,将最大均值差异与交叉熵损失函数结合,以最小化源域特征与目标域特征之间的分布差异。
优选地,所述S1中将目标域样本批量输入矩阵经过网络计算得到故障类别输出批量矩阵G具体包括:
采用一维卷积网络的卷积运算对故障特征进行自动提取,所述一维卷积网络包含特征提取模块和分类器,特征提取模块包含了输入层Input、卷积层Conv、批量归一化层BN、池化层Pooling;分类器包含全连接层FC和Softmax函数。
优选地,所述最大均值差异是迁移学习中常用的源域和目标域分布差异度量准测,通过最大均值差异MMD函数可以计算出将源域和目标域映射到再生希尔伯特空间后的均值差异,MMD的值越小,代表源域和目标域分布越相似,MMD计算表达式如下:
Figure SMS_1
式(1.3)中,xs表示源域样本向量,xt表示目标域样本向量,ms表示源域样本数量,mt表示目标域样本数量,
Figure SMS_2
代表再生希尔伯特空间,f(*)表示将源域和目标域数据映射到希尔伯特空间的非线性映射函数,本发明采用高斯核函数k(*)作为映射函数,表达式如下:
Figure SMS_3
式(1.4)中,a表示向量,σ表示带宽,它影响着k(*)的局部作用范围。
优选地,所述S2具体包括:
通过G的F范数||G||F定量地表示该矩阵的可分辨性;
Figure SMS_4
Gi,j表示批量输出矩阵中的第i个输出向量中的第j个元素,由于||G||F为非负数,则定义损失值LossF为:
LossF=-||G||F (1.6)
G的核范数||G||*可以定义为:
Figure SMS_5
式中,k=min(m,n),m表示训练集每次训练样本数量,n表示轴承的故障类别数,σi表示最大的k个奇异值中的第i个,||G||F也可用奇异值表示:
Figure SMS_6
通过式(1.7)和式(1.8),可证得||G||F和||G||*的关系为:
Figure SMS_7
已知||G||F最大值为
Figure SMS_8
通过式(1.9)可得||G||*的最大值为:
Figure SMS_9
优选地,所述S2还包括:
当||G||F接近上限
Figure SMS_10
时,第i个最大奇异值可以近似表示为:
Figure SMS_11
通过求出G的奇异值的近似值,可以得到||G||*为:
Figure SMS_12
定义核范数损失LossFBNM为:
LossFBNM=-||G||* (1.13)
通过核范数损失来计算深度卷积神经网络模型的分类损失。
本发明还提供了一种无监督迁移学习的滚动轴承故障诊断系统,所述系统用于实现无监督迁移学习的滚动轴承故障诊断方法,包括:
域适配模块,用于将某工况下带有故障标签的数据集称为源域,另一工况下不带故障标签的数据集称为目标域,在网络的迁移学习训练过程中,将两者的样本批量输入矩阵同时输入网络进行特征提取,对两者被提取到的特征进行域适配;
核范数最大化模块,用于将目标域样本批量输入矩阵经过网络计算得到故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数||G||*
诊断模块,用于构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。
本发明还提供了一种电子设备,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现无监督迁移学习的滚动轴承故障诊断方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现无监督迁移学习的滚动轴承故障诊断方法的步骤。
有益效果:本发明提供的一种无监督迁移学习的滚动轴承故障诊断方法及系统,其中方法包括:将某工况下带有故障标签的数据集称为源域,另一工况下不带故障标签的数据集称为目标域,在迁移学习网络训练过程中,对源域和目标域进行特征提取和域适配;目标域样本批量输入矩阵经过网络训练得到故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数G*;构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。该方案将原始的轴承一维振动信号数据作为输入,无需对数据进行小波变换、模态分解等信号处理,可实现端到端的轴承故障诊断,降低了算法实现的复杂度;在噪声环境下对不同工况的轴承迁移学习故障诊断效果有明显提升,特别是在噪声较高的环境下提升效果更为明显;不仅故障诊断的效果更好,而且稳定性也更高,对迁移学习实验中各故障类型的诊断效果提升更为均衡。
附图说明
图1为本发明提供的一种无监督迁移学习的滚动轴承故障诊断方法流程图;
图2为本发明提供的一维卷积网络SOWDCNN原理示意图;
图3为本发明提供的A→B迁移学习示意图;
图4为本发明提供的类别批量输出矩阵G1、G2示意图;
图5为本发明提供的最大化输出批量矩阵F范数示意图;
图6为本发明提供的TL-SOWDCNN-FBNM网络模型架构;
图7为本发明提供的一种可能的电子设备的硬件结构示意图;
图8为本发明提供的一种可能的计算机可读存储介质的硬件结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
图1为本发明提供的一种无监督迁移学习的滚动轴承故障诊断方法,包括以下步骤:
S1,将某工况下带有故障标签的数据集称为源域,另一工况下不带故障标签的数据集称为目标域,在网络的迁移学习训练过程中,将两者的样本批量输入矩阵同时输入网络进行特征提取,对两者被提取到的特征进行域适配;
S2,用于目标域样本批量输入矩阵经过网络训练得到的故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数||G||*
S3,构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。
本发明结合结构优化深度卷积神经网络(Structure Optimized DeepConvolutional Neural Networks,SSOWDCN)的无监督迁移学习(Transfer Learning,TL)故障诊断模型,该模型主要对带标签的源域数据和不带标签的目标域数据进行无监督迁移学习,并利用最大均值差异(Maximum Mean Discrepancy,MMD)来提升源域和目标域分布相似度。同时,为提高目标域批量输出矩阵的可分辨性和多样性,还将快速批量核范数最大化(Fast Batch Nuclear-norm Maximization,FBNM)方法引入模型,构造出TL-FBNM-SOWDCNN方法。为增强故障诊断的难度和针对性,将德国帕德博恩大学轴承数据进行加噪处理,以检验不同类型网络模型的诊断效果。对比结果表明:本发明所提的TL-FBNM-SOWDCNN方法在不同噪声环境中具有较高的诊断精度,能够为轴承故障诊断提供有效技术支撑。
下面针对各个步骤的原理进行细化解释说明。
(1)迁移学习网络算法
(1.1)结构优化深度卷积神经网络即SOWDCNN网络
在滚动轴承故障诊断方法中,传统的机器学习方法往往需要人工提取振动信号的故障特征,而卷积神经网络可通过卷积运算实现对故障特征的自动提取。如图2所示,本发明采用的一维卷积网络SOWDCNN由特征提取模块和分类器组成,特征提取模块包含了输入层(Input)、卷积层(Conv)、批量归一化层(BN)、池化层(Pooling)。因为轴承故障诊断属于分类问题,所以网络的分类器由全连接层(FC)和Softmax函数组成,并采用交叉熵损失函数(Cross Entropy Loss,CEL)来计算网络的分类损失。
Softmax函数表达式如下:
Figure SMS_13
式(1.1)中,n表示轴承的故障类别数,z表示神经网络的输出向量,zj,zi表示向量z的第j,第i个输出值,Softmax(zj)的取值为(0,1)。Softmax(zj)越接近1,表示网络预测z所对应的轴承输入样本为第j类故障的概率越大。
交叉熵损失函数表达式如下:
Figure SMS_14
式(1.2)中,m表示训练集每次训练的样本数量,n表示轴承的故障类别数,yj,i表示第j个样本标签向量的第i个真实值,
Figure SMS_15
表示第j个输出向量的第i个预测值。
(1.2)无监督迁移学习
要实现滚动轴承跨工况下的无监督迁移学习,本发明实施例采用的是将神经网络模型和迁移学习中的领域自适应(Domain Adaptation)方法相结合,在迁移学习网络训练过程中,对源域和目标域进行域适配,以减少源域和目标域的分布差异,提高网络模型对目标域的预测效果。以A→B为例,A代表带有故障标签的源域数据集(后统称A),B代表没有故障标签的目标域数据集(后统称B)。如图3所示,A、B经迁移学习后,两者分布差异明显变小。
最大均值差异MMD是迁移学习中常用的源域和目标域分布差异度量准测,通过最大均值差异MMD函数可以计算出将源域和目标域映射到再生希尔伯特空间后的均值差异,MMD的值越小,代表源域和目标域分布越相似,MMD计算表达式如下:
Figure SMS_16
式(1.3)中,xs表示源域样本向量,xt表示目标域样本向量,ms表示源域样本数量,mt表示目标域样本数量,
Figure SMS_17
代表再生希尔伯特空间,f(*)表示将源域和目标域数据映射到希尔伯特空间的非线性映射函数,本发明采用高斯核函数k(*)作为映射函数,表达式如下:
Figure SMS_18
式(1.4)中,a表示向量,σ表示带宽,它影响着k(*)的局部作用范围。
在进行迁移学习网络训练时,通常会将最大均值差异MMD与交叉熵损失函数结合,在提高模型预测数据分布和真实数据分布相似度的同时,也可以减少源域和目标域的分布差异。
(1.3)快速最大化批量核范数(Fast Batch Nuclear-norm Maximization,FBNM)
将目标域样本批量输入矩阵经过网络计算后,可得到其故障类别输出批量矩阵G,由于无监督迁移学习的目标域数据不带故障标签,虽然将源域和目标域进行域适配可以减少两者的分布差异,但依然会导致网络学习到的决策边界附近有较多混淆数据,使得G的可分辨性和多样性不高,影响网络对目标域的故障诊断效果。可分辨性表示网络预测故障类别是否坚决,多样性近似于输出批量矩阵中的类别数。如图4所示,显示了不同G之间分辨性差异,Label下的数字代表G内样本的真实标签类别。其中,G1预测样本1有0.8的概率为第1类,预测样本2有0.7的概率为第2类。G2只有0.6的概率预测样本1为第1类,预测样本2为第2类。可看出G1的可分辨性高于矩阵G2。
G的F范数(Frobenius-norm)||G||F可以定量地表示该矩阵的可分辨性,式(1.5)为F范数表达式。通过F范数表达式可算出,||G1||F≈1.122>||G2||F≈1.020。在G1可分辨性高于G2可分辨性的同时,||G1||F也高于||G2||F。由此可知G可分辨性的高低与||G||F正相关。
Figure SMS_19
式(1.5)中,m是网络每次训练样本数量,n是轴承的故障类别数,Gi,j表示批量输出矩阵中的第i个输出向量中的第j个元素。由于||G||F为非负数,可定义损失值LossF为:
LossF=-||G||F#(1.6)
神经网络迭代训练时,可通过不断减少损失值LossF来最大化||G||F,从而提高输出批量矩阵的可分辨性。如图5所示,G3通过F范数最大化得到G4,||G4||F≈1.122>||G3||F≈1.010,G4的可分辨性高于G3。G4预测样本2有0.7的概率属于第1类故障,但样本2原本为第2类故障。对G3进行F范数最大化后,出现了错误分类的情况,导致其多样性降低。
利用FBNM方法可以实现同时提高输出批量矩阵的可分辨性和多样性。通过对G研究可知,当||G||F接近最大值
Figure SMS_20
时,G中不同类别的输出向量互为线性独立,相同类别的输出向量之间可认为差异很小并近似线性相关,所以G的类别数近似于G的秩。但在网络优化过程,G中相同类别的输出向量并不是严格线性相关,所以无法通过计算G的秩来近似于G的类别数,也无法通过直接约束G的秩来约束G的多样性。
由于对于批量输出矩阵G,当
Figure SMS_21
G的秩凸近似于
Figure SMS_22
由于m是网络模型的超参数,不会随着模型学习而改变,所以通过最大化||G||*可以保证G的多样性。G的核范数||G||*可以定义为:
Figure SMS_23
式中,k=min(m,n),m表示训练集每次训练样本数量,n表示轴承的故障类别数,σi表示最大的k个奇异值中的第i个。||G||F也可用奇异值表示:
Figure SMS_24
通过式(1.7)和式(1.8),可证得||G||F和||G||*的关系为:
Figure SMS_25
已知||G||F最大值为
Figure SMS_26
通过式(1.9)可得||G||*的最大值为:
Figure SMS_27
通过式(1.9)和式(1.10)可知||G||*和||G||F是互相约束的,当||G||*增大时,||G||F也会随之增大,通过最大化||G||*,不仅可以提高G的多样性,还可以使||G||F最大化,从而提高G的可分辨性。
要得到核范数||G||*,需要计算矩阵G的所有奇异值,当||G||F接近上限
Figure SMS_28
时,第i个最大奇异值可以近似表示为:
Figure SMS_29
通过求出G的奇异值的近似值,可以得到||G||*为:
Figure SMS_30
由于矩阵的奇异值为非负数,所以||G||*也为非负数。在神经网络训练时,为能同时实现减少损失值和增大||G||*,可定义核范数损失LossFBNM为:
LossFBNM=-||G||* (1.13)
(2)构造TL-FBNM-SOWDCNN方法模型
将SOWDCNN、MMD和FBNM相结合的无监督迁移学习方法,具体模型结构如图6所示。
在迁移学习网络搭建中,所有数据集的训练和测试过程都是在Visual StudioCode平台上实现,代码选取的深度学习框架是基于Python3.8版本的PyTorch框架,网络训练和验证是在计算平台NVIDIA Quadro P2200上进行。本发明实施例对源域和目标域的网络训练采用批量样本输入的方式,训练时每一批量含有32个样本。网络参数的优化器为Adam优化器,学习率为0.001。
以A→B为例,算法的流程如下:
步骤(1):将一批次的源域A数据集训练样本和目标域B数据集训练样本同时输入SOWDCNN网络中进行训练,其中A的训练样本带有故障标签,B的训练样本不带故障标签,两者在网训练中共享权重。
步骤(2):采用文献“Tzeng E,Hoffman J,Zhang N,et al.Deep DomainConfusion:Maximizing for Domain Invariance[J].Computer Science,2014”的DDC方法,在SOWDCNN网络的平均自适应池化层((Adaptive Average Pool,Avg)后加入MMD分布差异计算,得到A数据和B数据经过Avg层后两者特征矩阵的分布差异值LossMMD
步骤(3):将OutputA与本批次目标域的真实标签矩阵进行交叉熵损失函数计算得到分类损失LossCEL,将OutputB进行FBNM计算,得到OutputB的核范数损失LossFBNM
步骤(4):将网络模型的损失函数结合成下式(1.14)所示:
LossCMF=LossCEL+0.5*LossMMD+0.5*LossFBNM (1.14)
步骤(5):采用Adam优化函数,对网络进行反向传播,优化网络权重,减少网络损失LossCMF
(3)数据预处理和实验结果验证
(3.1)本发明实施例实验数据来源于德国帕德伯恩大学(Paderborn University,PU)的滚动轴承数据集,实验轴承类型为6203深沟球轴承。
为了实现不同工况下的轴承故障诊断,本发明选取了帕德伯恩大学轴承实验装置三种不同工况的参数设置,实验环境具体参数如表2所示:
表2实验环境具体参数
Figure SMS_31
轴承实验装置在上述三种不同工况下所采集到的轴承原始振动信号构成了本发明的实验数据。其中,A实验环境下的轴承故障数据集信息如表3所示。为了提高网络模型的对轴承相似故障类型的诊断能力,本发明选取了轴承的9种故障类型,其中包括1种正常类型,5种外圈故障类型和3种内圈故障类型。每种故障类型的数据集共有550个样本,每个样本包含2000个数据点,每种故障类型的数据集按10:1分割成500个训练集样本和50个测试集样本。B、C实验环境下的轴承数据集信息格式同A。
表3滚动轴承数据集
Figure SMS_32
(3.2)为验证TL-FBNM-SOWDCNN方法的有效性,本发明方法将与以下三种方法进行实验结果对比:
(1)SOWDCNN方法中源域和目标域不进行迁移学习和FBNM,利用对源域数据集训练的网络直接预测目标域样本的故障类型,网络损失函数为LossCLF
(2)SOWDCNN-DDC方法,该方法引用了文献“Tzeng E,Hoffman J,Zhang N,etal.Deep Domain Confusion:Maximizing for Domain Invariance[J].ComputerScience,2014”的DDC方法,将SOWDCNN模型和MMD相结合,把MMD应用在SOWDCNN网络Avg层的输出特征中,用来度量源域和目标域特征的分布差异,网络损失为LossCLF+0.5*LossMMD
(3)SOWDCNN-FBNM方法,该方法结合了SOWDCNN模型和FBNM方法,网络训练中源域和目标域共享参数,求出目标域的LossFBNM,网络损失为LossCLF+0.5*LossFBNM
为了验证本发明方法在噪声环境下的迁移学习故障诊断效果,在振动信号中数据集添加了常见的加性高斯噪声(Additive white Gaussian Noise)作为噪声环境的模拟,分别设置了信噪比为4dB、2dB、0dB、-2dB和-4dB这5种噪声实验环境。在每种噪声环境下均设置了A→B、A→C、B→A、B→C、C→A和C→B这6种不同工况组合的,独立的迁移学习故障诊断实验,在每种工况组合中,箭头前的数据集代表有标签的源域数据集,箭头后的数据集代表无标签的目标域数据集。具体实验结果如表4-表8所示,每个迁移学习实验的最终精度均为3次实验所得结果的平均值。
表4 4dB环境的迁移学习实验结果
Figure SMS_33
表5 2dB环境的迁移学习实验结果
Figure SMS_34
Figure SMS_35
表6 0dB环境的迁移学习实验结果
Figure SMS_36
表7 -2dB环境的迁移学习实验结果
Figure SMS_37
表8 -4dB环境的迁移学习实验结果
Figure SMS_38
从表4-表8中可以看出,对于A→B、A→C、B→A、B→C和C→B这5种迁移学习实验,TL-SOWDCNN-FBNM方法在不同噪声的25个实验组中均取得了最高故障诊断准确率。其中,有22个实验组取得唯一最大值,3个实验组取得并列最大值。表明了噪声环境下,TL-SOWDCNN-FBNM方法对于这5种迁移学习实验的故障诊断效果提升明显。对于C→A迁移学习的5个实验组,TL-SOWDCNN-FBNM方法在0dB噪声环境下取得第二高准确率,与其实验组的最高准确率相差了0.223%,在其余4组均取得最高准确率,并高出其实验组第二准确率的平均值为0.407%。从二者可以看出,TL-SOWDCNN-FBNM方法对于C→A迁移学习更多是提升作用。
各噪音环境下,TL-SOWDCNN-FBNM方法在30组实验组中有29组取得最高故诊断准确率,比例为96.67%。表明了本发明提出的方法相较于另外三种方法,在滚动轴承的不同工况迁移学习实验中有着更好的故障诊断效果和更高的泛化性。此外,TL-SOWDCNN-FBNM方法在4dB到-4dB下的平均故障诊断准确率均为最高值,分别高于第二准确率0.791%、1.012%、1.642%、1.543%和2.222%。表明了TL-SOWDCNN-FBNM方法相较于另外三种的方法有着更高的鲁棒性并且在高噪声环境下对迁移学习实验效果的提升更为明显。
本发明的TL-SOWDCNN-FBNM方法不仅显著提高了故障类型的故障诊断效果,此外,TL-SOWDCNN-FBNM方法对9类轴承故障类型的诊断准确率标准差为0.084,低于另外三种方法的故障诊断准确率标准差,表明了TL-SOWDCNN-FBNM方法不仅有更好的故障诊断效果,还有更高的稳定性。
本发明实施例还提供了一种无监督迁移学习的滚动轴承故障诊断系统,所述系统用于实现如前所述的任何一种无监督迁移学习的滚动轴承故障诊断方法,包括:
域适配模块,用于将某工况下带有故障标签的数据集称为源域,另一工况下不带故障标签的数据集称为目标域,在网络的迁移学习训练过程中,将两者的样本批量输入矩阵同时输入网络进行特征提取,对两者被提取到的特征进行域适配;
核范数最大化模块,用于目标域样本批量输入矩阵经过网络训练得到的故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数G*
诊断模块,用于构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。
请参阅图7为本发明实施例提供的电子设备的实施例示意图。如图7所示,本发明实施例提了一种电子设备,包括存储器1310、处理器1320及存储在存储器1310上并可在处理器1320上运行的计算机程序1311,处理器1320执行计算机程序1311时实现以下步骤:S1,将某工况下带有故障标签的数据集称为源域,另一工况下不带故障标签的数据集称为目标域,在网络的迁移学习训练过程中,将两者的样本批量输入矩阵同时输入网络进行特征提取,对两者被提取到的特征进行域适配;
S2,用于目标域样本批量输入矩阵经过网络训练得到的故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数G*
S3,构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。
请参阅图8为本发明提供的一种计算机可读存储介质的实施例示意图。如图8所示,本实施例提供了一种计算机可读存储介质1400,其上存储有计算机程序1411,该计算机程序1411被处理器执行时实现如下步骤:S1,将某工况下带有故障标签的数据集称为源域,另一工况下不带故障标签的数据集称为目标域,在网络的迁移学习训练过程中,将两者的样本批量输入矩阵同时输入网络进行特征提取,对两者被提取到的特征进行域适配;
S2,用于目标域样本批量输入矩阵经过网络训练得到的故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数G*
S3,构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。

Claims (9)

1.一种无监督迁移学习的滚动轴承故障诊断方法,其特征在于,包括以下步骤:
S1,将某工况下带有故障标签的数据集称为源域,另一工况下不带故障标签的数据集称为目标域,在网络的迁移学习训练过程中,将两者的样本批量输入矩阵同时输入网络进行特征提取,对两者被提取到的特征进行域适配;
S2,用于目标域样本批量输入矩阵经过网络训练得到的故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数‖G‖*
S3,构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。
2.根据权利要求1所述的无监督迁移学习的滚动轴承故障诊断方法,其特征在于,所述S1具体包括:在进行迁移学习网络训练时,将最大均值差异与交叉熵损失函数结合,以最小化源域特征与目标域特征之间的分布差异。
3.根据权利要求1所述的无监督迁移学习的滚动轴承故障诊断方法,其特征在于,所述S1中将源域和目标域的样本批量输入矩阵经过网络训练进行特征提取具体包括:
采用一维卷积网络的卷积运算对故障特征进行自动提取,所述一维卷积网络包含特征提取模块和分类器,特征提取模块包含了输入层Input、卷积层Conv、批量归一化层BN、池化层Pooling;分类器包含全连接层FC和Softmax函数。
4.根据权利要求2所述的无监督迁移学习的滚动轴承故障诊断方法,其特征在于,所述最大均值差异是迁移学习中常用的源域和目标域分布差异度量准测,通过最大均值差异MMD函数可以计算出将源域和目标域映射到再生希尔伯特空间后的均值差异,MMD的值越小,代表源域和目标域分布越相似,MMD计算表达式如下:
Figure FDA0003880887480000021
式(1.3)中,xs表示源域样本向量,xt表示目标域样本向量,ms表示源域样本数量,mt表示目标域样本数量,
Figure FDA0003880887480000024
代表再生希尔伯特空间,f(*)表示将源域和目标域数据映射到希尔伯特空间的非线性映射函数,本发明采用高斯核函数k(*)作为映射函数,表达式如下:
Figure FDA0003880887480000022
式(1.4)中,a表示向量,σ表示带宽,它影响着k(*)的局部作用范围。
5.根据权利要求1所述的无监督迁移学习的滚动轴承故障诊断方法,其特征在于,所述S2具体包括:
Figure FDA0003880887480000023
表示批量输出矩阵中的第i个输出向量中的第j个元素,由于‖G‖F为非负数,则定义损失值LossF为:
LossF=-‖G‖F (1.6)
G的核范数‖G‖*可以定义为:
Figure FDA0003880887480000031
式中,k=min(m,n),m表示训练集每次训练样本数量,n表示轴承的故障类别数,σi表示最大的k个奇异值中的第i个,‖G‖F也可用奇异值表示:
Figure FDA0003880887480000032
通过式(1.7)和式(1.8),可证得‖G‖F和‖G‖*的关系为:
Figure FDA0003880887480000033
已知‖G‖F最大值为
Figure FDA0003880887480000034
通过式(1.9)可得‖G‖*的最大值为:
Figure FDA0003880887480000035
6.根据权利要求4所述的无监督迁移学习的滚动轴承故障诊断方法,其特征在于,所述S2还包括:
当‖G‖F接近上限
Figure FDA0003880887480000036
时,第i个最大奇异值可以近似表示为:
Figure FDA0003880887480000037
通过求出G的奇异值的近似值,可以得到‖G‖*为:
Figure FDA0003880887480000038
定义核范数损失LossFBNM为:
LossFBNM=-‖G‖* (1.13)
通过核范数损失来计算深度卷积神经网络模型的分类损失。
7.一种无监督迁移学习的滚动轴承故障诊断系统,其特征在于,所述系统用于实现如权利要求1-6任一项所述的无监督迁移学习的滚动轴承故障诊断方法,包括:
域适配模块,用于将某工况下带有故障标签的数据集称为源域,另一工况下不带故障标签的数据集称为目标域,在网络的迁移学习训练过程中,将两者的样本批量输入矩阵同时输入网络进行特征提取,对两者被提取到的特征进行域适配;
核范数最大化模块,用于目标域样本批量输入矩阵经过网络训练得到的故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数‖G‖*
诊断模块,用于构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。
8.一种电子设备,其特征在于,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现如权利要求1-6任一项所述的无监督迁移学习的滚动轴承故障诊断方法的步骤。
9.一种计算机可读存储介质,其特征在于,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现如权利要求1-6任一项所述的无监督迁移学习的滚动轴承故障诊断方法的步骤。
CN202211230446.4A 2022-09-30 2022-09-30 一种无监督迁移学习的滚动轴承故障诊断方法及系统 Pending CN115758130A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211230446.4A CN115758130A (zh) 2022-09-30 2022-09-30 一种无监督迁移学习的滚动轴承故障诊断方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211230446.4A CN115758130A (zh) 2022-09-30 2022-09-30 一种无监督迁移学习的滚动轴承故障诊断方法及系统

Publications (1)

Publication Number Publication Date
CN115758130A true CN115758130A (zh) 2023-03-07

Family

ID=85350953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211230446.4A Pending CN115758130A (zh) 2022-09-30 2022-09-30 一种无监督迁移学习的滚动轴承故障诊断方法及系统

Country Status (1)

Country Link
CN (1) CN115758130A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116383757A (zh) * 2023-03-09 2023-07-04 哈尔滨理工大学 一种基于多尺度特征融合和迁移学习的轴承故障诊断方法
CN116502131A (zh) * 2023-06-26 2023-07-28 清华大学 基于迁移学习的轴承故障诊断模型训练方法及装置
CN116541713A (zh) * 2023-06-27 2023-08-04 清华大学 基于局部时频特征迁移学习的轴承故障诊断模型训练方法
CN117370851A (zh) * 2023-08-31 2024-01-09 西南交通大学 基于无监督迁移学习的自适应输入长度轴承故障诊断方法
CN117473412A (zh) * 2023-09-08 2024-01-30 西南交通大学 一种噪声条件下无监督迁移学习轴承故障诊断方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110717526A (zh) * 2019-09-23 2020-01-21 华南理工大学 一种基于图卷积网络的无监督迁移学习方法
CN111709448A (zh) * 2020-05-20 2020-09-25 西安交通大学 一种基于迁移关系网络的机械故障诊断方法
CN113567130A (zh) * 2021-07-28 2021-10-29 江南大学 基于设备多工况的轴承故障诊断方法
CN114034486A (zh) * 2021-10-11 2022-02-11 中国人民解放军92578部队 基于无监督迁移学习的泵类机械设备轴承故障诊断方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110717526A (zh) * 2019-09-23 2020-01-21 华南理工大学 一种基于图卷积网络的无监督迁移学习方法
CN111709448A (zh) * 2020-05-20 2020-09-25 西安交通大学 一种基于迁移关系网络的机械故障诊断方法
CN113567130A (zh) * 2021-07-28 2021-10-29 江南大学 基于设备多工况的轴承故障诊断方法
CN114034486A (zh) * 2021-10-11 2022-02-11 中国人民解放军92578部队 基于无监督迁移学习的泵类机械设备轴承故障诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GUOQIANG JIN ETAL.: ""Bearing Fault Diagnosis Using Structure Optimized Deep Convolutional Neural Network under Noisy Environment"", 《ICIPCE》, pages 1 - 5 *
SHUHAO CUI ETAL.: ""Fast Batch Nuclear-norm Maximization and Minimization for Robust Domain Adaptation"", 《ARXIV》, pages 1 - 16 *
杨海乐: ""基于数据挖掘的航空发动机故障诊断技术"", 《工程科技Ⅱ辑》, pages 1 - 4 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116383757A (zh) * 2023-03-09 2023-07-04 哈尔滨理工大学 一种基于多尺度特征融合和迁移学习的轴承故障诊断方法
CN116383757B (zh) * 2023-03-09 2023-09-05 哈尔滨理工大学 一种基于多尺度特征融合和迁移学习的轴承故障诊断方法
CN116502131A (zh) * 2023-06-26 2023-07-28 清华大学 基于迁移学习的轴承故障诊断模型训练方法及装置
CN116502131B (zh) * 2023-06-26 2023-11-24 清华大学 基于迁移学习的轴承故障诊断模型训练方法及装置
CN116541713A (zh) * 2023-06-27 2023-08-04 清华大学 基于局部时频特征迁移学习的轴承故障诊断模型训练方法
CN116541713B (zh) * 2023-06-27 2023-12-12 清华大学 基于局部时频特征迁移学习的轴承故障诊断模型训练方法
CN117370851A (zh) * 2023-08-31 2024-01-09 西南交通大学 基于无监督迁移学习的自适应输入长度轴承故障诊断方法
CN117370851B (zh) * 2023-08-31 2024-04-16 西南交通大学 基于无监督迁移学习的自适应输入长度轴承故障诊断方法
CN117473412A (zh) * 2023-09-08 2024-01-30 西南交通大学 一种噪声条件下无监督迁移学习轴承故障诊断方法和系统
CN117473412B (zh) * 2023-09-08 2024-05-07 西南交通大学 一种噪声条件下无监督迁移学习轴承故障诊断方法和系统

Similar Documents

Publication Publication Date Title
CN115758130A (zh) 一种无监督迁移学习的滚动轴承故障诊断方法及系统
CN108133188B (zh) 一种基于运动历史图像与卷积神经网络的行为识别方法
US20220019855A1 (en) Image generation method, neural network compression method, and related apparatus and device
Kang et al. Operation-aware soft channel pruning using differentiable masks
CN111598881A (zh) 基于变分自编码器的图像异常检测方法
CN108764072B (zh) 一种基于多尺度融合的血细胞亚型图像分类方法
CN106599864B (zh) 一种基于极值理论的深度人脸识别方法
CN113435509B (zh) 基于元学习的小样本场景分类识别方法及系统
CN110929836B (zh) 神经网络训练及图像处理方法和装置、电子设备、介质
CN111222457B (zh) 一种基于深度可分离卷积的鉴别视频真伪性的检测方法
CN112818893A (zh) 一种面向移动终端的轻量化开集地标识别方法
CN113095370A (zh) 图像识别方法、装置、电子设备及存储介质
CN110929839A (zh) 训练神经网络的方法和装置、电子设备和计算机存储介质
EP4343616A1 (en) Image classification method, model training method, device, storage medium, and computer program
CN113420651B (zh) 深度卷积神经网络的轻量化方法、系统及目标检测方法
CN112132207A (zh) 基于多分支特征映射目标检测神经网络构建方法
Uddin et al. A convolutional neural network for real-time face detection and emotion & gender classification
CN111507396A (zh) 缓解神经网络对未知类样本产生错误分类的方法及装置
CN110728352A (zh) 一种基于深度卷积神经网络的大规模图像分类方法
CN114202746B (zh) 路面状态识别方法、装置、终端设备及存储介质
CN113409213B (zh) 柱塞泵故障信号时频图降噪增强方法和系统
CN114997214A (zh) 一种残差密集网络故障诊断方法以及装置
CN111797732B (zh) 一种对采样不敏感的视频动作识别对抗攻击方法
KR20230087268A (ko) 오토-인코더를 이용한 신용평가모델 운영 방법
CN113435321A (zh) 一种主轴轴承状态评估方法、系统、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination