CN117708656B - 一种面向单源域的滚动轴承跨域故障诊断方法 - Google Patents
一种面向单源域的滚动轴承跨域故障诊断方法 Download PDFInfo
- Publication number
- CN117708656B CN117708656B CN202410160245.4A CN202410160245A CN117708656B CN 117708656 B CN117708656 B CN 117708656B CN 202410160245 A CN202410160245 A CN 202410160245A CN 117708656 B CN117708656 B CN 117708656B
- Authority
- CN
- China
- Prior art keywords
- domain
- pseudo
- sample
- representing
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000005096 rolling process Methods 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 54
- 238000009826 distribution Methods 0.000 claims abstract description 44
- 230000036541 health Effects 0.000 claims abstract description 24
- 230000008569 process Effects 0.000 claims abstract description 11
- 238000005457 optimization Methods 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 6
- 230000001965 increasing effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000003042 antagnostic effect Effects 0.000 claims 1
- 239000000284 extract Substances 0.000 claims 1
- 230000006870 function Effects 0.000 description 26
- 238000012360 testing method Methods 0.000 description 21
- 238000013507 mapping Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- 230000004913 activation Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000003862 health status Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012733 comparative method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012418 validation experiment Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本发明属于故障诊断技术领域,公开了一种面向单源域的滚动轴承跨域故障诊断方法。通过源域样本训练域生成模块,生成多个伪域样本;源域样本和生成的伪域样本同时训练任务诊断模块,输出预测的轴承健康状态;交替训练域生成模块和任务诊断模块;训练过程中,域生成模块通过最大限度地提高伪域样本与源域样本之间的分布差异以及伪域样本之间的分布差异,模拟未知目标域,同时通过正则化保持伪域样本与源域样本的语义一致性和流形一致性保证生成伪域样本的有效性;通过训练得到的域生成模块和任务诊断模块,从单域泛化得到未知目标域。本发明的方法相比于现有主流方法具有更强的有效性和优越性。
Description
技术领域
本发明涉及故障诊断技术领域,具体涉及一种面向单源域的滚动轴承跨域故障诊断方法。
背景技术
在航空航天、交通运输和石油化工等领域,旋转机械扮演着不可或缺的角色。在这些旋转机械的众多组件中,滚动轴承占据着关键地位。鉴于旋转设备运行条件的复杂性,滚动轴承常常不得不在相对恶劣的环境中工作。一旦发生故障,可能会带来巨大的财产损失,甚至危及人员的生命安全。因此,对滚动轴承进行故障诊断显得刻不容缓。由于旋转机械在运行过程中受到运行条件的多变性以及设备的磨损和退化等多种因素的影响,往往在不同工况下运行,这给基于深度学习的故障诊断方法在实际工程中的应用带来了一定的挑战。可变工况引起的分布差异通常会严重影响深度诊断模型的有效性。因此,领域偏移问题成为开发准确且可靠的故障诊断方法时不可忽视的重要挑战。最近,基于领域泛化的方法被设计用来解决跨域故障诊断问题,其核心思想是在训练阶段使用多个不同源域的数据来训练一个泛化模型,在测试阶段使用该模型来预测未知域的故障情况。虽然基于领域泛化的方法已被证明具有实现跨域故障诊断的能力,但是仍然存在一个主要的限制,即需要来自多个源域的充足且多样的样本。然而,在实际工业应用中,由于诊断任务的特殊性,来自可变工作条件的有用样本可能难以收集,因此通常只能利用从单一工作条件采样的数据,这是一个更实际且更具挑战性的场景,可以称为基于单域泛化的故障诊断。现有研究虽然在一定程度上实现了单域泛化故障诊断,但都存在生成伪域多样性不足的问题,仍需要更多有效的方法来解决只有单个源域可用的跨域故障诊断问题。
首先,本发明分析了现有的问题,现有研究虽然在一定程度上实现了单源域泛化故障诊断,但都存在生成伪域多样性不足的问题,仍需要更多有效的方法来解决只有单个源域可用的跨域故障诊断问题。一方面,现有的研究根据旋转机械故障特征频率与转速成线性关系的动力学特性,通过水平缩放时间振动数据来人为地创建额外的假域,这种方式虽然可以增加样本的多样性,但并不能完全模拟出真实的工况变化数据。因为真实的工况变化包括很多方面的因素,比如温度、负载等,而仅仅通过时间缩放来模拟这些变化是不够的。此外,此类方法生成的假域可能会引入一些噪声,降低其预测性能。另一方面,现有的研究采用直接对抗学习的方式,这在一定程度上限制了生成伪域的多样性,因为随着迭代次数的增加,域生成模块生成的伪域和源域分布差异趋于收敛,难以生成具有更大差异性的伪域样本。因此,现有研究存在生成伪域多样性不足的问题,仍需要更有效的方法来解决只有单个源域可用的跨域故障诊断问题。本发明在满足实际工程场景中存在单一可用源域问题的前提下,尽可能提高跨域故障诊断方法的诊断精度和泛化性能,以实现更加准确、可靠的滚动轴承故障诊断。
发明内容
为解决单一可用源域的有限多样性,本发明针对性地提出一种面向单源域的滚动轴承跨域故障诊断方法。本发明主要包含两个模块,一个是丰富源域样本集分布的域生成模块,另一个是实现跨域故障诊断的任务诊断模块。通过生成多个伪域、域生成模块与任务诊断模块交替训练的方式,生成了更具多样性的伪域样本,进一步提高了对未知目标域的泛化性能。
本发明的技术方案如下:一种面向单源域的滚动轴承跨域故障诊断方法,建立故障诊断模型,所述故障诊断模型包括域生成模块和任务诊断模块;通过源域样本训练域生成模块,生成多个伪域样本;源域样本和生成的伪域样本同时训练任务诊断模块,输出预测的轴承健康状态;交替训练域生成模块和任务诊断模块;训练过程中,域生成模块通过最大限度地提高伪域样本与源域样本之间的分布差异以及伪域样本之间的分布差异,模拟未知目标域,同时通过正则化保持伪域样本与源域样本的语义一致性和流形一致性保证生成伪域样本的有效性;通过训练得到的域生成模块和任务诊断模块,进行故障诊断;增强在单一源域上训练的故障诊断模型在未知目标域上的泛化性能,进而使得故障诊断模型能够在未知目标域中进行准确故障诊断。
所述域生成模块的输入为源域样本,输出为与源域样本具有相同长度、不同分布的伪域样本;域生成模块包括多伪域生成器/>和分类器/>;所述多伪域生成器/>由个生成器网络/>组成,/>;生成器网络/>将源域样本集/>转换为对应的伪域样本集/>;分类器/>包括特征提取器/>和状态预测器/>;特征提取器/>从源域样本集/>和生成的伪域样本集/>中分别提取源域嵌入特征/>和伪域嵌入特征/>;状态预测器/>根据源域嵌入特征/>和伪域嵌入特征/>预测轴承健康状态,根据预测轴承健康状态使生成的伪域样本和源域样本具有语义一致性。
所述域生成模块的总体目标函数/>定义如下:
(1)
其中,表示多伪域生成器/>的网络参数,/>表示特征提取器/>的网络参数,/>表示状态预测器/>的网络参数,/>表示每个伪域样本集嵌入特征和源域样本集嵌入特征之间的分布差异损失;/>表示不同伪域样本集嵌入特征之间的分布差异损失;表示源域样本集的分类损失;/>表示伪域样本集的分类损失;/>表示流形正则化损失;/>和/>为五项损失的平衡超参数;
域生成模块训练期间,优化参数/>、/>和/>,最大化/>和/>,最小化/>;优化参数/>和/>,最小化/>;优化参数/>和/>,最小化/>;
域生成模块网络参数优化问题表述如下,
(2)
其中,表示多伪域生成器/>的最优网络参数,/>表示特征提取器/>的最优网络参数,/>表示状态预测器/>的最优网络参数。
所述表示如下:
(3)
其中,表示源域样本集经过特征提取器/>映射到嵌入空间/>中的源域嵌入特征,即/>,/>表示生成的第/>个伪域样本集经过特征提取器/>映射到嵌入空间/>中的伪域嵌入特征,/>,/>表示嵌入特征概率分布的提取函数,表示分布之间差异的度量。
所述表示如下,
(4)
其中,表示生成的第/>个伪域样本集经过分类器的特征提取器/>映射到嵌入空间/>中的伪域嵌入特征;/>表示生成的第/>个伪域样本集经过分类器的特征提取器映射到嵌入空间/>中的伪域嵌入特征,/>表示嵌入特征概率分布的提取函数。
所述表示如下,
(5)
其中,表示源域的样本个数,/>表示源域中第/>个样本,/>表示用于训练深度网络的交叉熵损失函数;/>定义如下,
(6)
其中,表示状态预测器/>最后一层的输出向量,/>表示/>的第/>个元素,/>表示轴承健康状态标签,/>表示轴承健康状态个数,/>表示指示函数。
为最小化所有生成伪域样本的分类损失,所述表示如下,
(7)
其中,表示第/>个生成器网络,/>表示源域的样本个数,/>表示源域中第个样本,/>表示交叉熵损失函数,/>表示交叉熵损失函数。
为保持伪域样本与源域样本在流形上的一致性,所述表示如下,
(8)
其中,,/>作为超参数被设置为/>,/>表示Frobenius范数。
所述任务诊断模块主要由特征提取器、状态预测器/>和域鉴别器/>组成;所述特征提取器/>用于自动提取源域样本和伪域样本的嵌入特征;状态预测器/>根据嵌入特征预测轴承健康状态;域鉴别器/>通过梯度反转层连接到特征提取器/>,通过嵌入特征识别样本的域标签;特征提取器/>和域鉴别器/>之间实施对抗性训练;
任务诊断模块的总体目标函数定义如下,
(9)
其中,表示特征提取器/>的网络参数,/>表示状态预测器/>的网络参数,/>表示域鉴别器/>的网络参数,/>表示所有源域样本和伪域样本的分类损失;/>表示域分类损失;/>表示三元组损失;/>为三项损失的平衡超参数;
在任务诊断模块训练期间,优化参数和/>,最小化/>;优化参数/>和/>,最小化/>;优化参数/>,最小化/>;任务诊断模块网络参数优化问题表述如下,
(10)
其中,表示特征提取器/>的最优网络参数,/>表示状态预测器/>的最优网络参数,/>表示域鉴别器/>的最优网络参数。
所述计算如下,
(11)
其中,表示源域的样本个数,/>表示源域中第/>个样本,/>表示第/>个伪域的样本个数,/>表示第/>个伪域中第/>个样本,/>表示交叉熵损失函数;所述计算如下,
(12)
其中,表示源域的样本个数,/>表示源域中第/>个样本,/>表示第/>个伪域的样本个数,/>表示第/>个伪域中第/>个样本,/>表示交叉熵损失函数,/>定义如下,
(13)
其中,表示域鉴别器最后一层的输出向量,/>表示/>的第/>个元素,/>表示用于训练的域数量,/>,/>表示域标签,/>表示指示函数;
为保证同一类样本的特征相互靠近,而不同类样本的特征相互远离,即减小类内距离和增大类间距离,所述三元组损失计算如下,
(14)
其中,为训练集中所有的三元组/>的数量,/>表示取/>和/>中的较大值。
本发明的有益效果:通过设计一种面向单源域的滚动轴承跨域故障诊断方法,通过同时增强生成样本的多样性、有效性、模型提取域不变特征的效率的方式,提供更有效的方法增强在单一源域上训练的故障诊断模型在未知目标域上的泛化性能,进而使得诊断模型能够在未知目标域中进行准确故障诊断。
附图说明
图1是一种面向单源域的滚动轴承跨域故障诊断方法的整体框架图。
图2是域生成模块损失示意图。
图3是任务诊断模块网络结构图。
图4是最小化三元组损失示意图。
具体实施方式
本发明提出一种面向单源域的滚动轴承跨域故障诊断方法,首先,利用源域样本训练域生成模块,生成多个伪域样本,通过最大限度地提高伪域样本与源域样本之间的分布差异以及伪域样本之间的分布差异,以模拟可能的未知目标域,同时通过正则化保持伪域样本与源域样本的语义一致性和流形一致性,以保证生成有效的样本;在此基础上,利用源域样本和生成的伪域样本同时训练任务诊断模块,以泛化到未知目标域。为了使任务诊断模块能够从不同时期的伪域样本中学习,获取更为丰富的知识,交替训练域生成模块和任务诊断模块。
本发明提出了一种面向单源域的滚动轴承跨域故障诊断方法,整体框架如图1所示。主要包含两个部分,域生成模块和任务诊断模块/>。其中,域生成模块的输入为源域样本,输出为与源域样本具有相同长度、不同分布的伪域样本;任务诊断模块的输入为源域样本和域生成模块生成的伪域样本,输出为预测的轴承健康状态。
所述域生成模块如图2所示,其旨在生成与源域样本具有显著分布差异的伪域样本,同时需要确保生成伪域样本的有效性。具体来说,域生成模块由多伪域生成器和分类器/>组成。其中,多伪域生成器由/>个生成器网络/>组成,即/>,生成器网络/>将源域样本集/>转换为对应的伪域样本集/>;分类器由特征提取器/>和状态预测器/>组成,特征提取器用于从源域样本集/>和生成的伪域样本集/>中自动提取嵌入特征/>和/>,状态预测器利用嵌入特征/>预测轴承健康状态。通过最大化每个伪域样本集和源域样本集嵌入特征之间的分布差异/>,使多伪域生成器生成与源域具有不同领域信息的伪域/>。通过最大化不同伪域样本集嵌入特征之间的分布差异/>,进一步增加生成伪域的多样性。通过最小化源域样本集的分类损失/>确保分类器网络得到的嵌入空间的有效性,即在该嵌入空间中能够准确预测所有源域样本的健康状态。此外,为了保证生成伪域样本的有效性,最小化伪域样本集的分类损失/>,使生成的伪域样本和源域样本具有语义一致性;利用流形正则化/>,使生成的伪域样本保持在源域样本所处的流形中。
所述任务诊断模块如图3所示,其旨在学习域不变特征,实现跨域故障诊断。具体来说,任务诊断模块由特征提取器、状态预测器/>和域鉴别器/>组成。其中,特征提取器用于自动提取嵌入特征;状态预测器利用嵌入特征预测轴承健康状态;域鉴别器通过梯度反转层(Gradient Reversal Layer, GRL)连接到特征提取器,利用嵌入特征识别样本的域标签。通过最小化状态预测损失/>,实现对轴承健康状态的准确预测;通过最小化域分类损失/>,学习域不变特征;此外,通过最小化三元组损失/>,如图4所示,进一步增加诊断模型的区分度,提高泛化性能。
下面对本发明的具体实施方式做详细说明。本实施方式的方法为:操作系统为Ubuntu 20,深度学习框架为PyTorch。
步骤一:实现域生成模块。
第一步:实现域生成模块的生成器网络。生成器网络将源域样本集/>转换为对应的伪域样本集/>,即/>。具体来说,该网络由一个初始层(start-layer)、两个步长为2的下采样层(down-layer)、两个残差层(res-layer)、两个步长为2的上采样层(up-layer)和一个结束层(end-layer)组成。
在表1中,Conv1d表示一维卷积,图1中为1D-Conv,ConvTranspose1d表示一维转置卷积,图1中为1D-ConvT,InstanceNorm1d表示实例归一化,ReLU表示修正线性单元激活函数,in表示输入通道个数,out表示输出通道个数,k表示卷积核大小,s表示卷积步长,p表示零补。其中,初始层接收输入信号并应用一维卷积(1D-Conv),从输入信号中提取低级特征;下采样层通过应用步长为2的一维卷积来降低特征的维度,增加了网络的感受野,并提供了一种捕获输入数据的全局特征的方法;残差层由一系列重复的残差块组成,有助于捕获复杂的非线性特征,构建更深层次的模型;上采样层通过应用步长为2的一维转置卷积(1D-ConvT)来增加特征的维度,有助于恢复下采样期间丢失的空间信息;结束层由一个一维卷积层和一个双曲正切(Tanh)激活函数组成,从前面层学习到的压缩表示中重建信号,并将输出缩放到范围,以匹配输入信号,用于后续的任务诊断模块训练。除了结束层外,在每个一维卷积层和一维转置卷积层后,都使用了实例归一化(Instance Normalization,IN)和ReLU激活函数处理。其中,IN有助于减少内部协变量偏移,从而提高网络在训练期间的稳定性;ReLU激活函数实现非线性变换,将非线性引入网络,使模型能够学习复杂的非线性特征。
表1 生成器网络的网络结构参数
第二步:实现域生成模块的分类器网络。分类器网络由特征提取器和状态预测器/>组成。分类器网络的网络结构参数见表2。在表2中,Conv1d表示一维卷积,MaxPool1d表示一维最大池化,BatchNorm1d表示批量归一化,ReLU表示修正线性单元激活函数,Flatten表示展平操作,Linear表示全连接层,in表示输入通道个数,out表示输出通道个数,k表示卷积核大小,s表示卷积步长,p表示零补。特征提取器采用一维卷积神经网络,从频域信号中自动学习用于预测健康状态的特征,由五个卷积层和五个最大值池化层组成。状态预测器由两个全连接层和一个Softmax激活函数组成,利用特征提取器学习的嵌入特征预测轴承健康状态。
表2 分类器网络的网络结构参数
第三步:域生成模块联合优化。域生成模块旨在生成与源域样本具有显著分布差异,并与源域样本保持语义和流形一致性的伪域样本,如图2所示,需考虑五个优化目标:(1)最大化每个伪域样本集和源域样本集嵌入特征之间的分布差异;(2)最大化伪域样本集嵌入特征之间的分布差异/>;(3)最小化源域样本集的分类损失/>;(4)最小化伪域样本集的分类损失/>;(5)流形正则化/>。域生成模块的总体目标函数/>定义如下,
(1)
其中,表示多伪域生成器/>的网络参数,/>表示特征提取器/>的网络参数,/>表示状态预测器/>的网络参数,/>为五项损失的平衡超参数,可通过验证集调优选取合适的值。
以端到端的方式对域生成模块中的所有参数进行优化。在模型训练期间,优化参数,最大化/>和/>,最小化/>;优化参数/>和/>,最小化/>;优化参数/>和/>,最小化/>。域生成模块网络参数优化问题可以表述如下,
(2)
其中,表示多伪域生成器/>的最优网络参数,/>表示特征提取器/>的最优网络参数,/>表示状态预测器/>的最优网络参数。
使用Adam优化算法用于在每个训练周期更新网络参数,参数的具体优化过程可表述如下,
(3)
其中,表示学习率,/>表示第/>次迭代更新,/>表示第/>次迭代的网络参数。
步骤二:实现任务诊断模块。
第一步:设计任务诊断模块架构。任务诊断模块由特征提取器、状态预测器/>和域鉴别器/>组成。任务诊断模块采用对抗训练的思想,以提取域不变特征,实现跨域故障诊断。首先,特征提取器/>对源域和生成伪域的输入样本/>进行处理,得到嵌入特征。然后,将其分别输入到状态预测器/>和域鉴别器/>。状态预测器/>对嵌入特征进行处理,预测轴承健康状态/>,域鉴别器/>对嵌入特征/>进行处理,预测域标签。特征提取器/>和域鉴别器/>之间实施对抗性训练,其中特征提取器/>被训练从不同域的样本中生成非鉴别性特征/>,即无法区分该特征来自哪个域,而域鉴别器/>被更新以准确区分域标签。这样,通过不断迭代优化,期望特征提取器提取域不变特征。总体来说,通过特征提取器和状态预测器的监督学习,以及特征提取器和域鉴别器之间的对抗训练,可以将不同域的样本投影到包含轴承健康状态判别特征的学习子空间中的同一区域,从而促进了故障诊断知识在不同领域的泛化。
在故障诊断任务中,轴承健康状态应该被准确识别。因此,任务诊断模块的首要目标是最小化所有源域样本和伪域样本的状态预测损失。假设域生成模块生成了/>个伪域,则/>可以计算如下,
(4)
其中,表示源域的样本个数,/>表示源域中第/>个样本,/>表示第/>个伪域的样本个数,/>表示第/>个伪域中第/>个样本,/>表示交叉熵损失函数。
为了实现跨域故障诊断,学习域不变特征,任务诊断模块的第二个目标是最小化域分类损失。由于特征提取器和域鉴别器之间进行对抗训练,域鉴别器通过GRL层连接到特征提取器,GRL层在反向传播期间对/>的梯度乘以某个负常数,使域鉴别器网络参数更新后最小化/>,而特征提取器网络参数更新后最大化/>,确保了特征提取器在不同域上学习的特征是相似的,即对于域鉴别器是尽可能不可区分的,从而产生域不变特征。假设域生成模块生成了/>个伪域,则/>分别表示/>个伪域的域标签,/>表示源域的域标签,/>可以计算如下,
(5)
其中,表示源域的样本个数,/>表示源域中第/>个样本,/>表示第/>个伪域的样本个数,/>表示第/>个伪域中第/>个样本,/>表示交叉熵损失函数,定义如下,
(6)
其中,表示域鉴别器最后一层的输出向量,/>表示/>的第/>个元素,/>表示用于训练的域数量,/>,/>表示域标签,/>表示指示函数。
第二步:设计最大化分布差异方法。为了模拟未知域,需要保证生成伪域样本与源域样本分布不同。具体来说,域生成模块的首要目标是最大化每个伪域和源域在嵌入空间中的分布差异,其中度量分布差异的嵌入空间利用优化后的分类器/>得到。假设生成个伪域,/>可以计算如下,
(7)
其中,表示源域样本集经过特征提取器/>映射到嵌入空间/>中的嵌入特征,即/>,/>表示生成的第/>个伪域样本集经过特征提取器/>映射到嵌入空间/>中的嵌入特征,即/>,/>表示嵌入特征的概率分布,/>表示分布之间差异的度量,选取Wasserstein距离作为分布差异度量。
其次,为了确保生成伪域之间具有一定差异性,进一步增加生成伪域样本的多样性,域生成模块的第二个目标是最大化不同伪域在嵌入空间中的分布差异,其中度量分布差异的嵌入空间仍然利用优化后的分类器/>得到。假设生成/>个伪域,/>可以计算如下,
(8)/>
其中,和/>分别表示生成的第/>个伪域和第/>个伪域样本集经过分类器的特征提取器/>映射到嵌入空间/>中的嵌入特征,/>表示嵌入特征的概率分布。
此外,由于上述度量分布差异的嵌入空间由分类器得到,为了确保嵌入空间的有效性,即保证在该嵌入空间中所有源域样本都能够被正确分类,域生成模块的第三个目标是最小化所有源域样本的分类损失/>,/>可以计算如下,
(9)
其中,表示源域的样本个数,/>表示源域中第/>个样本,/>表示用于训练深度网络的交叉熵损失函数。/>定义如下,
(10)
其中,表示状态预测器/>最后一层的输出向量,/>表示/>的第/>个元素,/>表示轴承健康状态标签,/>表示轴承健康状态个数,/>表示指示函数。利用优化后的特征提取器/>,即可得到度量分布差异的嵌入空间。
第三步:设计任务诊断模块的联合优化方法。任务诊断模块旨在学习域不变特征,实现跨域故障诊断,考虑三个优化目标:(1)最小化所有源域样本和伪域样本的分类损失;(2)最小化域分类损失/>;(3)最小化三元组损失/>。任务诊断模块的总体目标函数/>定义如下,
(11)
其中,表示特征提取器/>的网络参数,/>表示状态预测器/>的网络参数,/>表示域鉴别器/>的网络参数,/>为三项损失的平衡超参数,可通过验证集调优选取合适的值。
以端到端的方式对任务诊断模块中的所有参数进行优化。在模型训练期间,优化参数和/>,最小化/>;优化参数/>和/>,最小化/>;优化参数/>,最小化/>。任务诊断模块网络参数优化问题可以表述如下,
(12)
其中,表示特征提取器/>的最优网络参数,/>表示状态预测器/>的最优网络参数,/>表示域鉴别器/>的最优网络参数。/>
使用Adam优化算法用于在每个训练周期更新网络参数,参数的具体优化过程可表述如下,
(13)
其中,表示学习率,/>表示第/>次迭代更新,/>表示第/>次迭代的网络参数。
步骤三:设计实验验证方法。
第一步,在进行模型训练前,本发明在PyTorch框架下完成网络的构建、初始化以及相关配置等预备工作。
第二步,载入训练数据,并对数据进行预处理。考虑到只有单一可用源域用于训练,使用训练域验证集(Training-domain validation set)模型选择方法评估模型性能,即将每个训练域分成训练和验证子集,选择最大化验证子集准确性的模型。设置本算法的训练参数,框架会根据配置好的参数进行读取。本算法的超参数设置如下表3所示。
表3 超参数设置
第三步,为了更便于进行训练和测试,我们将更新后的权重保存到指定位置。本研究采用了一种方便的方法,将训练过程封装成一个脚本文件。在启动训练时,首先调用这个封装好的训练脚本,其中设置了命令行参数,包括支持文件和工具类的路径、预训练权重等。这个封装使用户无需了解底层细节,只需调用脚本即可。具体来说,使用Python来处理配置文件和命令行参数,然后通过调用训练函数来执行核心训练过程,并将结果保存到指定目录中。
第四步,对模型进行测试。测试阶段的目标在于获得测试数据上的预测结果,以供进一步效果分析之用。为此,本发明采用PyTorch框架,进行了测试模型的初始化网络和配置准备工作,并对测试数据进行必要的预处理。在测试过程中,将已经训练好的权重加载到网络中,逐一对所有测试数据进行测试,直至全部测试任务完成。为了提高测试的便捷性,本发明将测试步骤封装成了一个脚本。在测试开始时,首先调用位于根目录下的测试脚本,该脚本负责设置命令行参数,包括测试网络结构文件的路径、已训练好的权重路径以及其他测试参数配置文件等。同时,该脚本还负责指定日志文件的保存路径。随后,调用测试脚本启动测试流程。在Python环境下,本发明完成了测试过程中的配置文件和命令行参数的读取。接着,通过调用测试函数执行核心测试流程,进行预测操作,并将最终的预测结果保存在指定目录下的.pth文件中,以供后续评估模块直接读取和使用。
为了评估本发明所提出方法的性能,在江南大学和帕德伯恩大学的轴承故障数据集进行了验证实验。首先,通过将本发明所提出的面向单源域的滚动轴承跨域故障诊断方法、基于分布混合的诊断方法、基于最大均值差异的诊断方法、基于相关对齐的诊断方法四种方法在江南大学和帕德伯恩大学的轴承故障数据集上进行验证,所提出的方法比其他方法获得了更好的性能,在江南大学数据集和帕德伯恩数据集上分别取得了92.28%和96.39%的准确率,将准确率分别提升了5.97%和3.53%,证明了所提方法的有效性和优越性。
其次,进行了消融实验验证和故障特征可视化,不同源域中相同健康状态的特征具有最好的聚类效果,并且目标域特征与源域特征实现了分布对齐,说明特征提取模块学习了域不变特征,具有应对跨域分布差异的能力,不同健康状态的特征具有明显的可分性。
最后,为探索所提出方法在不同参数设置下的性能表现,进一步研究了所提出的方法在不同不平衡度和在不同大小的训练数据集上的性能表现。实验结果表明,随着不平衡程度的加大和样本数量的减少,虽然所提出的方法和对比方法的诊断性能都随之退化,但是相比之下,所提出的方法总能获得最高的诊断精度,这进一步显示出其具有更强的适应性和鲁棒性。
Claims (8)
1.一种面向单源域的滚动轴承跨域故障诊断方法,其特征在于,建立故障诊断模型,所述故障诊断模型包括域生成模块和任务诊断模块;通过源域样本训练域生成模块,生成多个伪域样本;源域样本和生成的伪域样本同时训练任务诊断模块,输出预测的轴承健康状态;交替训练域生成模块和任务诊断模块;训练过程中,域生成模块通过最大限度地提高伪域样本与源域样本之间的分布差异以及伪域样本之间的分布差异,模拟未知目标域,同时通过正则化保持伪域样本与源域样本的语义一致性和流形一致性保证生成伪域样本的有效性;通过训练得到的域生成模块和任务诊断模块,进行故障诊断;
所述任务诊断模块主要由特征提取器ET、状态预测器PT和域鉴别器DT组成;所述特征提取器ET用于自动提取源域样本和伪域样本的嵌入特征;状态预测器PT根据嵌入特征预测轴承健康状态;域鉴别器DT通过梯度反转层连接到特征提取器ET,通过嵌入特征识别样本的域标签;特征提取器ET和域鉴别器DT之间实施对抗性训练;
任务诊断模块的总体目标函数LD定义如下,
LT(ψT,θT,τ)=λcLclass(ψT,θT)+λtLtriplet(ψT)-λdLdomain(ψT,τ) (9)
其中,ψT表示特征提取器ET的网络参数,θT表示状态预测器PT的网络参数,τ表示域鉴别器DT的网络参数,Lclass表示所有源域样本和伪域样本的分类损失;Ldomain表示域分类损失;Ltriplet表示三元组损失;λt、λt和λd为三项损失的平衡超参数;
在任务诊断模块训练期间,优化参数ψT和θT,最小化Lclass;优化参数ψT和τ,最小化Ldomain;优化参数ψT,最小化Ltriplet;任务诊断模块网络参数优化问题表述如下,
其中,表示特征提取器ET的最优网络参数,/>表示状态预测器PT的最优网络参数,/>表示域鉴别器DT的最优网络参数;
所述域生成模块D的总体目标函数LD定义如下:
LD(ρ,ψD,θD)=-λdisLdis(ρ,ψD)-λdivLdiv(ρ,ψD)+λcrLcla-r(ψ,θD)+λcfLcla-f(ρ,ψD,θD)+λmLmanifold(ρ,ψD) (1)
其中,ρ表示多伪域生成器MG的网络参数,ψD表示特征提取器ED的网络参数,θD表示状态预测器PD的网络参数,Ldis表示每个伪域样本集嵌入特征和源域样本集嵌入特征之间的分布差异损失;Ldiv表示不同伪域样本集嵌入特征之间的分布差异损失;Lcla-r表示源域样本集的分类损失;Lcla-f表示伪域样本集的分类损失;Lmanifold表示流形正则化损失;λdis、λdiv、λtr、λcf和λm为五项损失的平衡超参数;
域生成模块D训练期间,优化参数ρ、ψD和θD,最大化Ldis和Ldiv,最小化Lcla-f;优化参数ψD和θD,最小化Lcla-r;优化参数ρ和ψD,最小化Lmanifold;
域生成模块网络参数优化问题表述如下,
其中,表示多伪域生成器MG的最优网络参数,/>表示特征提取器ED的最优网络参数,/>表示状态预测器PD的最优网络参数。
2.根据权利要求1所述的面向单源域的滚动轴承跨域故障诊断方法,其特征在于,所述域生成模块D的输入为源域样本,输出为与源域样本具有相同长度、不同分布的伪域样本;域生成模块包括多伪域生成器MG和分类器C;所述多伪域生成器MG由K个生成器网络G组成,生成器网络Gk将源域样本集Xs转换为对应的伪域样本集/>分类器C包括特征提取器ED和状态预测器PD;特征提取器ED从源域样本集Xs和生成的伪域样本集Xp中分别提取源域嵌入特征Zs和伪域嵌入特征Zp;状态预测器PD根据源域嵌入特征Zs和伪域嵌入特征Zp预测轴承健康状态,根据预测轴承健康状态使生成的伪域样本和源域样本具有语义一致性。
3.根据权利要求2所述的面向单源域的滚动轴承跨域故障诊断方法,其特征在于,所述Ldis表示如下:
其中,Zs表示源域样本集经过特征提取器ED映射到嵌入空间Z中的源域嵌入特征,即Zs=ED(Xs),表示生成的第k个伪域样本集经过特征提取器ED映射到嵌入空间z中的伪域嵌入特征,/>p(·)表示嵌入特征概率分布的提取函数,d(·,·)表示分布之间差异的度量。
4.根据权利要求2所述的面向单源域的滚动轴承跨域故障诊断方法,其特征在于,所述Ldiv表示如下,
其中,表示生成的第i个伪域样本集经过分类器的特征提取器ED映射到嵌入空间Z中的伪域嵌入特征;/>表示生成的第j个伪域样本集经过分类器的特征提取器ED映射到嵌入空间z中的伪域嵌入特征,p(·)表示嵌入特征概率分布的提取函数。
5.根据权利要求2所述的面向单源域的滚动轴承跨域故障诊断方法,其特征在于,所述Lcla-r表示如下,
其中,ns表示源域的样本个数,表示源域中第i个样本,LCE表示用于训练深度网络的交叉熵损失函数;LCE定义如下,
其中,w表示状态预测器PD最后一层的输出向量,wj表示w的第j个元素,y表示轴承健康状态标签,Nc表示轴承健康状态个数,1{·}表示指示函数。
6.根据权利要求2所述的面向单源域的滚动轴承跨域故障诊断方法,其特征在于,为最小化所有生成伪域样本的分类损失,所述Lcla-f表示如下,
其中,Gk表示第k个生成器网络,ns表示源域的样本个数,表示源域中第i个样本,LCE表示交叉熵损失函数,LCE表示交叉熵损失函数。
7.根据权利要求2所述的面向单源域的滚动轴承跨域故障诊断方法,其特征在于,为保持伪域样本与源域样本在流形上的一致性,所述Lmanifold表示如下,
其中,∈作为超参数被设置为10-5,/>表示Frobenius范数。
8.根据权利要求1-7任一所述的面向单源域的滚动轴承跨域故障诊断方法,其特征在于,所述Lclass计算如下,
其中,ns表示源域的样本个数,表示源域中第i个样本,/>表示第k个伪域的样本个数,/>表示第k个伪域中第i个样本,LCE表示交叉熵损失函数;所述Ldomain计算如下,
其中,ns表示源域的样本个数,表示源域中第i个样本,/>表示第k个伪域的样本个数,/>表示第k个伪域中第i个样本,Ld-CE表示交叉熵损失函数,Ld-CE定义如下,
其中,w表示域鉴别器最后一层的输出向量,wj表示w的第j个元素,Ndnum表示用于训练的域数量,Ndnum=K+1,d表示域标签,1{·}表示指示函数;
为保证同一类样本的特征相互靠近,而不同类样本的特征相互远离,减小类内距离和增大类间距离,所述三元组损失计算如下,
其中,Ntri为训练集中所有的三元组的数量,max(a,b)表示取α和b中的较大值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410160245.4A CN117708656B (zh) | 2024-02-05 | 2024-02-05 | 一种面向单源域的滚动轴承跨域故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410160245.4A CN117708656B (zh) | 2024-02-05 | 2024-02-05 | 一种面向单源域的滚动轴承跨域故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117708656A CN117708656A (zh) | 2024-03-15 |
CN117708656B true CN117708656B (zh) | 2024-05-10 |
Family
ID=90162779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410160245.4A Active CN117708656B (zh) | 2024-02-05 | 2024-02-05 | 一种面向单源域的滚动轴承跨域故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117708656B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117909854A (zh) * | 2024-03-20 | 2024-04-19 | 东北大学 | 基于多模态对比嵌入的零样本复合故障诊断方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112629863A (zh) * | 2020-12-31 | 2021-04-09 | 苏州大学 | 变工况下动态联合分布对齐网络的轴承故障诊断方法 |
CN114936575A (zh) * | 2022-05-07 | 2022-08-23 | 重庆大学 | 基于样本生成和深度迁移学习的电机轴承故障诊断方法 |
CN115221958A (zh) * | 2022-07-18 | 2022-10-21 | 西安交通大学 | 一种基于复合权重的机械设备选择性迁移故障诊断方法 |
CN116313080A (zh) * | 2022-12-22 | 2023-06-23 | 江苏鱼跃凯立特生物科技有限公司 | 一种基于迁移学习的葡萄糖浓度预测方法及设备 |
-
2024
- 2024-02-05 CN CN202410160245.4A patent/CN117708656B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112629863A (zh) * | 2020-12-31 | 2021-04-09 | 苏州大学 | 变工况下动态联合分布对齐网络的轴承故障诊断方法 |
CN114936575A (zh) * | 2022-05-07 | 2022-08-23 | 重庆大学 | 基于样本生成和深度迁移学习的电机轴承故障诊断方法 |
CN115221958A (zh) * | 2022-07-18 | 2022-10-21 | 西安交通大学 | 一种基于复合权重的机械设备选择性迁移故障诊断方法 |
CN116313080A (zh) * | 2022-12-22 | 2023-06-23 | 江苏鱼跃凯立特生物科技有限公司 | 一种基于迁移学习的葡萄糖浓度预测方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN117708656A (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lin et al. | Structural damage detection with automatic feature‐extraction through deep learning | |
CN117708656B (zh) | 一种面向单源域的滚动轴承跨域故障诊断方法 | |
CN110657984B (zh) | 一种基于强化胶囊网络的行星齿轮箱故障诊断方法 | |
CN113281048B (zh) | 一种基于关系型知识蒸馏的滚动轴承故障诊断方法和系统 | |
CN113255882B (zh) | 一种基于改进卷积胶囊网络的轴承故障诊断方法 | |
CN111323228B (zh) | 一种基于时间序列映射与卷积神经网络的故障诊断方法 | |
CN113095413B (zh) | 变工况故障诊断方法、系统、存储介质及设备 | |
CN113065581B (zh) | 基于参数共享对抗域自适应网络的振动故障迁移诊断方法 | |
CN113255432B (zh) | 基于深度神经网络与流形对齐的汽轮机振动故障诊断方法 | |
CN112001110A (zh) | 一种基于振动信号空间时时递归图卷积神经网络的结构损伤识别监测方法 | |
CN111595541A (zh) | 一种海量振动传递率数据卷积神经网络处理的多维结构损伤识别方法 | |
CN112765890A (zh) | 基于动态域适应网络的多工况旋转机械剩余寿命预测方法 | |
CN112414715B (zh) | 基于混合特征与改进灰度共生算法的轴承故障诊断方法 | |
CN117077579B (zh) | 翼型流场预测方法、装置、设备及存储介质 | |
CN117236188A (zh) | 一种仿真数据辅助的轴承迁移诊断方法、系统及设备介质 | |
CN114676733A (zh) | 一种基于稀疏自编码辅助分类生成式对抗网络的复杂供输机构故障诊断方法 | |
Wang et al. | Distilling the knowledge of multiscale densely connected deep networks in mechanical intelligent diagnosis | |
CN115935187B (zh) | 基于核敏感度对齐网络的变工况下机械故障诊断方法 | |
CN114925724A (zh) | 一种机械设备故障诊断方法、装置及存储介质 | |
CN113435321A (zh) | 一种主轴轴承状态评估方法、系统、设备及可读存储介质 | |
Sun et al. | AANet: adaptive attention network for rolling bearing fault diagnosis under varying loads | |
CN117664567B (zh) | 一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法 | |
CN117494588B (zh) | 一种风机轴承剩余有效寿命优化方法、设备及介质 | |
Franken et al. | Emprox: Neural network performance estimation for neural architecture search | |
Liyanagedera et al. | Vibration signal analysis for fault detection of combustion engine using neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |