CN117664567A - 一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法 - Google Patents

一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法 Download PDF

Info

Publication number
CN117664567A
CN117664567A CN202410122877.1A CN202410122877A CN117664567A CN 117664567 A CN117664567 A CN 117664567A CN 202410122877 A CN202410122877 A CN 202410122877A CN 117664567 A CN117664567 A CN 117664567A
Authority
CN
China
Prior art keywords
domain
source
samples
loss
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410122877.1A
Other languages
English (en)
Other versions
CN117664567B (zh
Inventor
毕远国
蒋存宇
付饶
刘炯驿
Original Assignee
东北大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 东北大学 filed Critical 东北大学
Priority to CN202410122877.1A priority Critical patent/CN117664567B/zh
Publication of CN117664567A publication Critical patent/CN117664567A/zh
Application granted granted Critical
Publication of CN117664567B publication Critical patent/CN117664567B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Acoustics & Sound (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于故障诊断技术领域,公开了一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法。特征提取模块从轴承原始振动信号中自动提取故障特征。状态预测模块,利用特征提取模块提取的特征预测轴承健康状态,最小化所有源域样本的分类损失。对比语义对齐模块,利用特征提取模块提取的特征计算对比语义对齐损失,最小化各个源域之间的对比语义对齐损失。权重生成模块,利用每个源域中各个故障类别的样本数量分布情况生成权重,分别对分类损失和对比语义对齐损失进行加权。最终利用特征提取模块和状态预测模块实现跨域故障诊断。本发明既解决跨域潜在的巨大分布差异,又可以处理多源域的数据不平衡问题。

Description

一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法
技术领域
本发明涉及故障诊断技术领域,尤其涉及一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法。
背景技术
旋转机械在航空航天、交通运输、石油化工等行业中发挥着重要作用。在旋转机械的众多部件中,滚动轴承是一个重要的部件。由于旋转设备运行条件的复杂性,滚动轴承常在相对恶劣的环境下运行,一旦发生事故,可能造成严重的财产损失,甚至威胁人员生命安全。因此,对滚动轴承进行故障诊断是十分必要的。旋转机械由于运行条件的变化、设备的磨损退化等原因,往往在不同的工况下运行,这阻碍了基于深度学习的故障诊断方法在实际工程中的应用。由可变工况引起的分布差异通常会导致深度诊断模型在其有效性方面显著恶化。因此,领域偏移是开发准确、可靠的故障诊断方法的一个关键挑战。最近,基于领域泛化的方法被设计用来解决跨域故障诊断问题,其核心思想是通过匹配不同领域样本在高层子空间中的分布,并提取域不变特征来消除跨域分布差异,这些方法已经被证实能够在跨域故障诊断中取得较好的性能。然而,这些方法大多假设用于模型训练的故障数据集中各个故障类别的样本数量相同,由于实际采集数据时往往会受到多种限制,这种假设并不一定成立,即存在域内标签不平衡和跨域标签分布差异问题。多源域故障类别不平衡问题会导致现有领域泛化方法诊断精度低和泛化能力差。
针对上述问题,本发明针对性地提出一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法。既解决了跨域潜在的巨大分布差异,同时可以处理多源域的数据不平衡问题。
发明内容
本发明提出了一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法,其主要思想是既学习域不变特征,同时又鼓励从代表性不足的故障类别中学习。本发明主要基于四个模块实现。首先,采用特征提取模块从输入的原始振动信号中自动提取有效特征;然后,采用对比语义对齐模块最小化各个源域之间的分布差异,学习域不变特征;在此基础上,采用状态预测模块利用学习的嵌入特征预测轴承健康状态;最后,权重生成模块根据各个类别的样本数量分布生成权重,利用权重对分类和对比语义对齐损失加权,鼓励学习少数故障类别的特征。
本发明的技术方案如下:一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法,建立一种跨域故障诊断模型;所述跨域故障诊断模型包括特征提取模块、状态预测模块、对比语义对齐模块和权重生成模块;
从第个源域样本集中采样个样本,构成样本集代表第个源域中的第b个样本,个源域中的第b个样本对应的标签,样本集经特征提取模块前向传播,得到嵌入特征
将得到的嵌入特征经状态预测模块前向传播,得到预测输出;预测过程中最小化所有源域样本的分类损失;
所述对比语义对齐模块,用于促使特征提取模块学习域不变特征以抵抗未知域的分布偏移,根据特征提取模块提取的嵌入特征进行源域间特征的对比语义对齐,最小化来自不同源域但标签相同的样本嵌入特征分布之间的距离,最大化来自不同源域且标签不同的样本嵌入特征分布之间的距离;
所述权重生成模块,根据每个类别的样本数量与其所在源域样本总数的比值倒数生成权重,通过权重对该类别的分类损失加权得到加权分类损失;将域和域中类别定义为域-类对,将分属于不同域中的相同类别的域-类对进行对齐;权重生成模块根据每个域-类对组合的样本数量与所有域-类对组合的样本总数的比值倒数生成权重,根据权重对该域-类对组合的对比语义对齐损失加权得到加权对比语义对齐损失;
根据加权分类损失和加权对比语义对齐损失的信息,以及上一迭代轮次的梯度信息,进行反向传播更新跨域故障诊断模型网络梯度,直到跨域故障诊断模型的准确度达到要求,得到最终的跨域故障诊断模型;
利用最终的跨域故障诊断模型中特征提取模块和状态预测模块进行跨域故障诊断。
所述特征提取模块采用多分支的孪生网络架构,每个分支对应一个特定源域;分支之间采取权值共享策略,孪生网络架构的所有分支共享相同的权重和偏置参数;在每个分支中,采用首层宽卷积核深度卷积神经网络,包括五个卷积层和五个最大值池化层;首层卷积层以外的其余各卷积层均采用3×1的卷积核;每层卷积操作后采用批量归一化和激活函数处理,再采用2×1的最大值池化;经过所有卷积层和最大池化层处理之后,进行整平操作,将提取的特征展平为一维特征嵌入,映射到嵌入空间。
所述状态预测模块包括两个全连接层、一个ReLU激活函数和一个Softmax激活函数;首先,两个全连接层将特征提取模块提取的嵌入特征由嵌入空间映射到输出空间;然后,ReLU激活函数对输出空间中的特征进行非线性变换;最后,Softmax激活函数对输出空间中的线性变换后的特征计算输入样本属于每个健康状态的概率,最终根据概率输出预测结果。
所述分类损失具体如下:
对于具有个源域,每个源域具有个健康状态的数据集,健康状态分类损失计算如下,
(1)
其中,表示第个源域的健康状态分类损失,表示第个源域的样本个数,表示第个源域中第个样本在嵌入空间中的特征,表示状态预测模块,表示第个源域中第个样本的健康状态,表示用于训练状态预测模块的交叉熵损失函数;定义如下,
(2)
其中,表示状态预测模块最后一层的输出向量,表示的第个元素,表示轴承健康状态标签,表示轴承健康状态个数,表示指示函数。
所述对比语义对齐损失包括语义对齐损失和分离损失
所述语义对齐损失为最小化来自不同源域但标签相同的样本嵌入特征分布之间的距离;语义对齐损失定义如下,
(3)
其中,表示第个源域中第个类别的样本集经过特征提取模块映射到嵌入空间中的嵌入特征;表示第个源域中第个类别的样本集经过特征提取模块映射到嵌入空间中的嵌入特征,表示轴承健康状态个数,表示嵌入特征的概率分布,表示嵌入特征分布之间的距离度量;定义如下,
(4)
其中,表示第个源域中第个类别的样本数量,表示第个源域中第个类别的样本数量,表示第个源域的第个类别中第个样本的嵌入特征,表示第个源域的第个类别中第个样本的嵌入特征,两个样本嵌入特征的距离,采用欧氏距离计算如下,
(5)
其中,表示Frobenius范数;
分离损失为最大化来自不同源域且标签不同的样本嵌入特征分布之间的距离;分离损失定义如下,
(6)
其中,表示第个源域中第个类别的样本集在嵌入空间中的特征,表示第个源域中第个类别的样本集在嵌入空间中的特征,是不同的故障类别,表示嵌入特征的概率分布,表示样本集在嵌入空间中分布之间的相似性度量;对分布相似性增加一个惩罚,定义如下,
(7)
其中,表示第个源域中第个类别的样本数量,分别表示第个源域中第个类别的样本数量,表示第个源域的第个类别中第个样本的嵌入特征,表示第个源域的第个类别中第个样本的嵌入特征,表示两个样本嵌入特征的相似性,采用欧氏距离计算如下,
(8)
其中,表示Frobenius范数,表示在嵌入空间中两个分布的分离程度,为惩罚项,表示取中的较大值;对比语义对齐损失定义如下,
(9)
其中,表示源域个数,分别表示第个源域样本集和第个源域样本集,是不同的源域,表示第个源域和第个源域之间的对比语义对齐损失;定义如下,
(10)
其中,表示特征提取模块。
所述权重生成模块具体如下:
权重生成模块根据每个类别的样本数量与其所在源域样本总数的比值倒数生成权重,通过权重对该类别的分类损失加权得到加权分类损失;将域和域中类别定义为域-类对,将分属于不同域中的相同类别的域-类对进行对齐;权重生成模块根据每个域-类对组合的样本数量与所有域-类对组合的样本总数的比值倒数生成权重,根据权重对该域-类对组合的对比语义对齐损失加权得到加权对比语义对齐损失。
所述加权分类损失定义如下:
(11)
其中,表示源域个数,表示第个源域的加权分类损失,表示健康状态个数,表示第个源域中第个类别的权重,表示第个源域中第个类别的分类损失,定义如下,
(12)
(13)
其中,表示在第个源域中,第个类别的样本数量与样本总数的比值,定义如下,
(14)
所述加权对比语义对齐损失定义如下:
(15)
其中,表示源域个数,表示第个源域和第个源域之间的加权对比语义对齐损失,定义如下,
(16)
其中,表示健康状态个数,表示域-类对之间的对比语义对齐损失, 表示域-类对的组合被联合采样的权重,定义如下,
(17)
其中,表示域-类对组合的样本数量与所有域-类对组合的样本总数的比值,定义如下,
(18)
其中,分别表示第个源域和第个源域的样本总数,表示第个源域中第个样本的标签,表示第个源域中第个样本的标签,表示指示函数。
本发明的有益效果:为了实现准确预测,最小化所有源域样本的分类损失。为了学习域不变特征,最小化各个源域之间的对比语义对齐损失。设计了生成模块,促使特征提取模块和状态预测模块从代表性不足类别中学习,以鼓励从代表性不足的类别中学习。本发明在满足实际工程场景中存在多源域数据不平衡问题的前提下,既解决跨域潜在的巨大分布差异,同时可以处理多源域的数据不平衡问题,尽可能提高跨域故障诊断方法的诊断精度和泛化性能,以实现更加准确、可靠的滚动轴承故障诊断。
附图说明
图1是一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法的整体框架图。
图2是对比语义对齐损失示意图。
图3是加权分类损失示意图。
图4是加权对比语义对齐损失示意图。
具体实施方式
面向多源域不平衡数据的滚动轴承跨域故障诊断方法的整体框架如图1所示。整体框架包括特征提取模块、状态预测模块、对比语义对齐模块和权重生成模块。框架的输入为多个源域的一维原始振动信号、对应的健康状态以及各个健康状态的样本分布情况,输出为预测的轴承健康状态。
首先,本发明分析了现有的问题,即当前主流的基于领域泛化的跨域故障诊断方法均假设用于模型训练的故障数据集中各个故障类别样本数量相同,而这在实际工程应用中并不一定满足。一方面,现有方法的模型可能过度关注那些出现频率较高的故障状态,而对于那些出现频率较低的故障状态则学习效果较差,难以学习到少数类别的特征,进而导致模型对未知域的诊断准确率降低。另一方面,对于样本数量少的域-类对,无法准确估计其统计特性(比如均值、方差),即该域-类对的特征分布不足以代表其真实分布;模型同样会过度关注联合采样频率较高的域-类对组合,对联合采样频率较低的域-类对组合的分布对齐效果较差;上述问题会导致现有方法不能很好地学习域不变特征,使模型对未知域的泛化性能变差。因此,当前主流的跨域故障诊断方法均无法满足跨域诊断任务对诊断精度和泛化性能的要求。本发明在满足实际工程场景中存在多源域数据不平衡问题的前提下,尽可能提高跨域故障诊断方法的诊断精度和泛化性能,以实现更加准确、可靠的滚动轴承故障诊断。
深度神经网络具有自动学习特征的能力,能够自适应地从原始振动信号中捕获和提取故障敏感特征,为故障诊断提供一个端到端的框架,因此本发明采用首层宽卷积核深度卷积神经网络(Deep Convolutional Neural Networks with Wide First-layerKernel, WDCNN)作为特征提取模块的骨干网络,从原始振动信号中自动学习特征并预测健康状态。需要注意的是,为了最小化各个源域之间的分布差异,寻找公共子空间,在子空间学习的算法中,孪生网络Siamese被证明对于不同的任务都有很好的效果。因此,特征提取模块使用孪生体系结构学习特征嵌入,以便来自同一类别的样本尽可能靠近。在训练时,特征提取模块被用于同时处理来自多个源域的输入样本,WDCNN网络参数将像孪生体系结构一样被多个源域共享。
为了完成跨域故障诊断,本发明所提出的方法应该能够识别健康状态并学习域不变特征。本发明设计了状态预测模块用于识别轴承的健康状况,设计了对比语义对齐模块用于学习域不变特征。为了有效识别轴承健康状态,所提出的方法的首要优化目标是最小化所有源域样本的健康状态分类损失。此外,为了更好地学习域不变特征,所提出的方法第二个优化目标是最小化每对源域之间的对比语义对齐损失。其中,对比语义对齐损失由语义对齐损失和分离损失组成,如图2所示,语义对齐损失通过最小化来自不同源域但标签相同的样本嵌入特征分布之间的距离实现语义对齐,分离损失通过最大化来自不同源域且标签不同的样本嵌入特征分布之间的距离,鼓励不同类别样本在嵌入空间中相互分离,进一步获得更好的性能。
权重生成模块,根据每个源域的故障类别样本数量分布生成权重,分别对分类损失和对比语义对齐损失加权,鼓励从代表性不足的类别中学习,以解决多源域数据集存在域内标签不平衡和跨域标签分布差异的跨域故障诊断问题。为了使状态预测模块能够平衡对多数类和少数类的预测效果,如图3所示,权重生成模块利用每个类别的样本数量与其所在源域样本总数的比值的倒数生成权重,然后使用权重对该类别的分类损失加权,即样本数量越少的类别,其对应分类损失被赋予越高的权重,进而达到平衡的效果。为了使对比语义对齐模块能够平衡具有不同联合采样概率的域-类对组合之间的对比语义对齐效果,更好地学习域不变特征,如图4所示,权重生成模块利用每个域-类对组合的样本数量与所有域-类对组合的样本总数的比值的倒数生成权重,然后使用权重对该域-类对组合的对比语义对齐损失加权,即样本数量越少的域-类对组合,其对应对比语义对齐损失被赋予越高的权重,进而达到平衡的效果。
为了评估本发明所提出方法的性能,在两个公开的轴承故障数据集(PU数据集和JNU数据集)上进行了实验。首先,与几种流行的方法进行了对比实验验证,验证了所提出方法的有效性和优越性;其次,进行了消融实验验证和特征可视化,验证了所提出方法中各个模块的有效性和必要性;最后,进行了不同参数的对比实验验证,探索了所提出方法在不同参数设置下的性能表现。实验结果表明,所提出的方法有效解决了跨域故障诊断任务中的多源域数据不平衡的问题,在诊断精度和泛化性能等方面优于其他现有主流的方法,具有重要的实际应用价值,进一步促进了跨域故障诊断模型在实际工业中的应用。
下面对本发明的具体实施方式做详细说明。
本实施方式的方法为:操作系统为Ubuntu 20,深度学习框架为PyTorch。
步骤一:实现各部分模块的内容。
第一步:充分借鉴深度神经网络的自动学习特征和分类的能力,为了能够自适应地从原始信号中捕获和提取故障敏感特征,并且为故障诊断提供一个端到端的框架,采用WDCNN网络作为骨干网络,实现特征提取模块和状态预测模块。其中,特征提取模块包含五个卷积层和五个最大值池化层。针对一维原始振动信号的特点,首个卷积层采用大卷积核,这有利于提取短时特征。与短时傅里叶变换不同,通过优化训练,首层大卷积核既能自动学习面向诊断的特征,同时又能去除对诊断没有帮助的特征。除了首层外,其余各卷积层均采用3×1的小卷积核,这有利于加深网络,同时抑制过拟合。每层卷积操作后都采用批量归一化(Batch Normalization, BN)和激活函数处理,然后采用2×1的最大值池化。其中,BN通过将输入分布转换为高斯分布来减少内部协变量转移,加快了计算速度,稳定了训练过程;激活函数采用修正线性单元(Rectified Linear Unit, ReLU)来实现非线性变换,提高神经网络的非线性表示能力,并在一定程度上增加网络的泛化能力;池化层用于下采样,为了尽可能多地保留原始数据中的故障峰值信息特征,选用最大值池化。在经过所有卷积层和最大池化层等处理之后,使用Flatten操作,将提取的特征展平为一维特征嵌入,映射到嵌入空间。特征提取模块网络结构参数见下表1。需要注意的是,在训练时,特征提取模块被用于同时处理来自多个源域的输入样本,WDCNN网络参数将像孪生体系结构一样被多个源域共享。
状态预测模块由两个全连接层、一个ReLU激活函数和一个Softmax激活函数组成。其中,全连接层将特征提取模块学习的特征由嵌入空间映射到输出空间;ReLU激活函数实现非线性变换,提高网络的非线性表示能力;Softmax激活函数根据输出空间中的特征计算出输入样本属于每个健康状态的概率,最终根据概率输出预测结果。状态预测模块网络结构参数见表2。
表1 特征提取模块的网络结构参数
表2 状态预测模块的网络结构参数
第二步:本发明以最小化分类损失和对比语义对齐损失为优化目标,学习域不变特征并准确预测轴承健康状态,以实现跨域故障诊断。对于具有个源域,每个源域具有个健康状态的数据集,健康状态分类损失可以计算如下,
其中,表示第个源域的健康状态分类损失,表示第个源域的样本个数,表示第个源域中第个样本在嵌入空间中的特征,表示状态预测模块,表示第个源域中第个样本的健康状态,表示用于训练深度网络的交叉熵损失函数。定义如下,
其中,表示状态预测模块最后一层的输出向量,表示的第个元素,表示轴承健康状态标签,表示轴承健康状态个数,表示指示函数。对比语义对齐损失(Contrastive Semantic Alignment Loss, )由语义对齐损失(Semantic AlignmentLoss, )和分离损失(Separation Loss, )组成。语义对齐损失通过最小化来自不同源域但标签相同的样本嵌入特征分布之间的距离,解决了混淆对齐方法缺乏语义对齐的问题。语义对齐损失定义如下,
其中,分别表示第个源域和第个源域中第个类别的样本集经过特征提取模块映射到嵌入空间中的嵌入特征,表示轴承健康状态个数,表示嵌入特征的概率分布,表示嵌入特征分布之间的距离度量。定义如下,
其中,分别表示第个源域和第个源域中第个类别的样本数量,表示第个源域的第个类别中第个样本的嵌入特征,表示第个源域的第个类别中第个样本的嵌入特征,表示两个样本嵌入特征的距离,采用欧氏距离计算如下,
其中,表示Frobenius范数。分离损失通过最大化来自不同源域且标签不同的样本嵌入特征分布之间的距离,鼓励不同类别样本在嵌入空间中相互分离,进一步获得更好的性能。分离损失定义如下,
其中,表示第个源域中第个类别的样本集在嵌入空间中的特征,表示第个源域中第个类别的样本集在嵌入空间中的特征,是不同的故障类别,表示嵌入特征的概率分布,表示样本集在嵌入空间中分布之间的相似性度量。当分布接近时,会降低分类器的分类精度,因此,需要对分布相似性增加一个惩罚,定义如下,
其中,表示第个源域中第个类别的样本数量,分别表示第个源域中第个类别的样本数量,表示第个源域的第个类别中第个样本的嵌入特征,表示第个源域的第个类别中第个样本的嵌入特征,表示两个样本嵌入特征的相似性,采用欧氏距离计算如下,
其中,表示Frobenius范数,表示在嵌入空间中两个分布的分离程度,即对相似性的惩罚,表示取中的较大值。结合语义对齐损失和分离损失,对比语义对齐损失定义如下,
其中,表示源域个数,分别表示第个源域样本集和第个源域样本集,是不同的源域,表示第个源域和第个源域之间的对比语义对齐损失。定义如下,
其中,表示特征提取模块。
第三步:设计了权重生成模块,以解决多源域数据不平衡问题。具体来讲,利用样本数量生成权重,对分类损失和对比语义对齐损失加权,即对第二步中优化目标进一步改进为加权分类损失和加权对比语义对齐损失。为了使状态预测模块能够平衡对多数类和少数类的预测效果,权重生成模块利用每个类别的样本数量与其所在源域样本总数的比值的倒数生成权重,然后使用权重对该类别的分类损失加权,即样本数量越少的类别,其对应分类损失被赋予越高的权重,进而达到平衡的效果。加权分类损失定义如下:
其中,表示源域个数,表示第个源域的加权分类损失,表示健康状态个数,表示第个源域中第个类别的权重,表示第个源域中第个类别的分类损失,定义如下,
其中,表示交叉熵损失函数。
其中,表示在第个源域中,第个类别的样本数量与样本总数的比值,定义如下,
其中,表示第个源域的样本总数,表示第个源域中第个样本的标签,表示指示函数。为了使对比语义对齐模块能够平衡具有不同联合采样概率的域-类对组合之间的对比语义对齐效果,更好地学习域不变特征,权重生成模块利用每个域-类对组合的样本数量与所有域-类对组合的样本总数的比值的倒数生成权重,然后使用权重对该域-类对组合(即域-类对的对比语义对齐损失加权,即样本数量越少的域-类对组合,其对应对比语义对齐损失被赋予越高的权重,进而达到平衡的效果。结合对比语义对齐损失,加权对比语义对齐损失定义如下:
其中,表示源域个数,表示第个源域和第个源域之间的加权对比语义对齐损失,定义如下,
其中,表示健康状态个数,表示域-类对之间的对比语义对齐损失,表示域-类对的组合被联合采样的权重,定义如下,
其中,表示域-类对组合的样本数量与所有域-类对组合的样本总数的比值,定义如下,
其中,分别表示第个源域和第个源域的样本总数,表示第个源域中第个样本的标签,表示第个源域中第个样本的标签,表示指示函数。
第四步:本发明为了实现存在域内标签不平衡和跨域标签分布差异问题的跨域故障诊断,共考虑两个优化目标:(1)最小化加权分类损失;(2)最小化加权对比语义对齐损失。总体目标函数定义如下,
其中,表示特征提取模块的网络参数,表示状态预测模块的网络参数,表示加权分类损失和加权分布对齐损失的平衡超参数,确保分类损失在总体目标函数中的主导地位,取值范围为0.1到0.5之间。以端到端的方式对特征提取模块和状态预测模块中的所有参数进行优化。在模型训练期间,优化参数以最小化加权分类损失,优化参数以最小化加权对比语义对齐损失。网络参数优化问题可以表述如下,
其中,表示特征提取模块的最优网络参数,表示状态预测模块的最优网络参数。通常,参数更新可以通过优化算法来实现,如随机梯度下降、Adadelta、Adam等。本发明采用Adadelta优化算法优化网络参数,相较于其他优化算法,Adadelta没有初始学习率参数,而是使用变化量作为未来变化的校准。
步骤二:实验数据集。
数据集的作用是为了验证算法的诊断性能。JNU数据集和PU数据集作为公开的轴承故障数据集,在故障诊断领域中被广泛使用。因此,本发明选用JNU数据集和PU数据集作为评测数据集。为了保证实验的顺利进行,本发明对数据集的进行了数据预处理。数据预处理从采集的原始信号中生成用于训练和评估模型的数据集,主要包括三个步骤:样本分割、归一化和构建不平衡数据集。其中,样本分割从采集的原始信号中截取样本。在不同的工作条件下,信号的幅值变化很大。对于深度神经网络来说,很难处理振幅变化范围如此之大的样本。因此,每个样本都用自己的均值和方差进行归一化,以限制样本的幅度,这有助于提高深度神经网络的泛化能力。为了模拟实际存在的类不平衡问题,利用归一化后的样本构建多源域不平衡数据集。长尾不平衡更符合样本数量分布的实际情况,因此主要构建具有长尾不平衡的训练集,即训练集中各个类别的样本数量遵循指数衰减,而测试集中各个类别数量保持平衡。假设参数表示样本数量最多的类和样本数量最少的类的样本数量之间的比值,那么可以使用参数来描述训练集的不平衡程度,即越小,越不平衡。为了确保模型评估的公平性,测试集样本总数和训练集样本总数相同。
步骤三:对跨域故障诊断模型进行训练。
训练环节是测试和诊断的基础,在数据集处理好后首要进行的步骤就是进行训练。具体步骤如下:
第一步,使用PyTorch框架为训练模型做网络构建、初始化和配置等准备工作。
第二步,载入训练数据,并对数据进行预处理,生成多源域不平衡数据集。设置本算法的训练参数,框架会根据配置好的参数进行读取。本算法的超参数设置如下表3所示。
表3 超参数设置
第三步,网络训练。首先是前向传播过程。从第个源域样本集中采样个样本,构成,将样本集经特征提取模块前向传播,得到嵌入特征,将得到的嵌入特征经状态预测模块前向传播,得到预测输出。训练过程中深度学习框架根据式(11)和式(15)对应的加权分类损失和加权对比语义对齐损失函数的相关信息,并根据上一步产生的数据信息,进行反向传播操作更新网络梯度,该操作是深度网络各卷积核权重更新的过程,目的是迭代更新权重直到模型的准确度达到本发明的要求。
第四步,将更新完成的权重保存到指定的位置。为了训练和测试更加方便,本发明将训练过程封装为脚本文件,训练开始时首先调用封装好的训练脚本,该脚本中会设置命令行的参数,包括要训练所需要的支撑文件和工具类的路径、预训练权重等等。封装好后用户不必了解底层细节,直接调用脚本即可。本方案在Python下完成配置文件、命令行参数的读取操作,然后通过调用训练函数完成训练的核心过程。最终并把结果保存到指定目录下。
步骤四:对跨域故障诊断模型进行测试。
测试环节的目的是为了得到测试数据上的预测值,是效果分析的基础。用PyTorch框架为测试模型做初始化网络和配置的准备工作,对得到的测试数据进行预处理。将训练好的权值载入到网络中,即特征提取模块和状态预测模块加载最优网络参数,将测试样本集通过特征提取模块前向传播,得到嵌入特征,将得到的嵌入特征通过状态预测模块前向传播,得到预测输出。依次测试所有测试数据,直至全部测试完成。为了测试方便,本发明将测试步骤封装为脚本。测试开始时首先调用根目录下的测试脚本,该脚本中会设置命令行的参数,包括测试网络结构文件的路径、训练好的权重路径和其他的一些测试参数配置文件等等。然后在该脚本中设置日志文件的保存路径。然后调用测试脚本开始进行测试。本算法在Python文件下完成测试过程中的配置文件、命令行参数的读取,然后通过调用测试函数完成测试的核心过程,然后开始进行预测,最终并把预测结果保存到指定目录下的pth文件中,可以直接被后续评价模块读取。

Claims (6)

1.一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法,其特征在于,建立一种跨域故障诊断模型;所述跨域故障诊断模型包括特征提取模块、状态预测模块、对比语义对齐模块和权重生成模块;
从第个源域样本集中采样个样本,构成样本集代表第个源域中的第b个样本,个源域中的第b个样本对应的标签,样本集经特征提取模块前向传播,得到嵌入特征
将得到的嵌入特征经状态预测模块前向传播,得到预测输出;预测过程中最小化所有源域样本的分类损失;
所述对比语义对齐模块,用于促使特征提取模块学习域不变特征以抵抗未知域的分布偏移,根据特征提取模块提取的嵌入特征进行源域间特征的对比语义对齐,最小化来自不同源域但标签相同的样本嵌入特征分布之间的距离,最大化来自不同源域且标签不同的样本嵌入特征分布之间的距离;
所述权重生成模块,根据每个类别的样本数量与其所在源域样本总数的比值倒数生成权重,通过权重对该类别的分类损失加权得到加权分类损失;将域和域中类别定义为域-类对,将分属于不同域中的相同类别的域-类对进行对齐;权重生成模块根据每个域-类对组合的样本数量与所有域-类对组合的样本总数的比值倒数生成权重,根据权重对该域-类对组合的对比语义对齐损失加权得到加权对比语义对齐损失;
根据加权分类损失和加权对比语义对齐损失的信息,以及上一迭代轮次的梯度信息,进行反向传播更新跨域故障诊断模型网络梯度,直到跨域故障诊断模型的准确度达到要求,得到最终的跨域故障诊断模型;
利用最终的跨域故障诊断模型中特征提取模块和状态预测模块进行跨域故障诊断。
2.根据权利要求1所述的面向多源域不平衡数据的滚动轴承跨域故障诊断方法,其特征在于,所述特征提取模块采用多分支的孪生网络架构,每个分支对应一个特定源域;分支之间采取权值共享策略,孪生网络架构的所有分支共享相同的权重和偏置参数;在每个分支中,采用首层宽卷积核深度卷积神经网络,包括五个卷积层和五个最大值池化层;首层卷积层以外的其余各卷积层均采用3×1的卷积核;每层卷积操作后采用批量归一化和激活函数处理,再采用2×1的最大值池化;经过所有卷积层和最大池化层处理之后,进行整平操作,将提取的特征展平为一维特征嵌入,映射到嵌入空间。
3.根据权利要求2所述的面向多源域不平衡数据的滚动轴承跨域故障诊断方法,其特征在于,所述状态预测模块包括两个全连接层、一个ReLU激活函数和一个Softmax激活函数;首先,两个全连接层将特征提取模块提取的嵌入特征由嵌入空间映射到输出空间;然后,ReLU激活函数对输出空间中的特征进行非线性变换;最后,Softmax激活函数对输出空间中的线性变换后的特征计算输入样本属于每个健康状态的概率,最终根据概率输出预测结果。
4.根据权利要求3所述的面向多源域不平衡数据的滚动轴承跨域故障诊断方法,其特征在于,所述分类损失具体如下:
对于具有个源域,每个源域具有个健康状态的数据集,健康状态分类损失计算如下,
(1)
其中,表示第个源域的健康状态分类损失,表示第个源域的样本个数,表示第个源域中第个样本在嵌入空间中的特征,表示状态预测模块,表示第个源域中第个样本的健康状态,表示用于训练状态预测模块的交叉熵损失函数;定义如下,
(2)
其中,表示状态预测模块最后一层的输出向量,表示的第个元素,表示轴承健康状态标签,表示轴承健康状态个数,表示指示函数。
5.根据权利要求3所述的面向多源域不平衡数据的滚动轴承跨域故障诊断方法,其特征在于,所述对比语义对齐损失包括语义对齐损失和分离损失
所述语义对齐损失为最小化来自不同源域但标签相同的样本嵌入特征分布之间的距离;语义对齐损失定义如下,
(3)
其中,表示第个源域中第个类别的样本集经过特征提取模块映射到嵌入空间中的嵌入特征;表示第个源域中第个类别的样本集经过特征提取模块映射到嵌入空间中的嵌入特征,表示轴承健康状态个数,表示嵌入特征的概率分布,表示嵌入特征分布之间的距离度量;定义如下,
(4)
其中,表示第个源域中第个类别的样本数量,表示第个源域中第个类别的样本数量,表示第个源域的第个类别中第个样本的嵌入特征,表示第个源域的第个类别中第个样本的嵌入特征,两个样本嵌入特征的距离,采用欧氏距离计算如下,
(5)
其中,表示Frobenius范数;
分离损失为最大化来自不同源域且标签不同的样本嵌入特征分布之间的距离;分离损失定义如下,
(6)
其中,表示第个源域中第个类别的样本集在嵌入空间中的特征,表示第个源域中第个类别的样本集在嵌入空间中的特征,是不同的故障类别,表示嵌入特征的概率分布,表示样本集在嵌入空间中分布之间的相似性度量;对分布相似性增加一个惩罚,定义如下,
(7)
其中,表示第个源域中第个类别的样本数量,分别表示第个源域中第个类别的样本数量,表示第个源域的第个类别中第个样本的嵌入特征,表示第个源域的第个类别中第个样本的嵌入特征,表示两个样本嵌入特征的相似性,采用欧氏距离计算如下,
(8)
其中,表示Frobenius范数,表示在嵌入空间中两个分布的分离程度,为惩罚项,表示取中的较大值;对比语义对齐损失定义如下,
(9)
其中,表示源域个数,分别表示第个源域样本集和第个源域样本集,是不同的源域,表示第个源域和第个源域之间的对比语义对齐损失;定义如下,
(10)
其中,表示特征提取模块。
6.根据权利要求4或5所述的面向多源域不平衡数据的滚动轴承跨域故障诊断方法,其特征在于,所述加权分类损失定义如下:
(11)
其中,表示源域个数,表示第个源域的加权分类损失,表示健康状态个数,表示第个源域中第个类别的权重,表示第个源域中第个类别的分类损失,定义如下,
(12)
(13)
其中,表示在第个源域中,第个类别的样本数量与样本总数的比值,定义如下,
(14)
所述加权对比语义对齐损失定义如下:
(15)
其中,表示源域个数,表示第个源域和第个源域之间的加权对比语义对齐损失,定义如下,
(16)
其中,表示健康状态个数,表示域-类对之间的对比语义对齐损失, 表示域-类对的组合被联合采样的权重,定义如下,
(17)
其中,表示域-类对组合的样本数量与所有域-类对组合的样本总数的比值,定义如下,
(18)
其中,分别表示第个源域和第个源域的样本总数,表示第个源域中第个样本的标签,表示第个源域中第个样本的标签,表示指示函数。
CN202410122877.1A 2024-01-30 2024-01-30 一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法 Active CN117664567B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410122877.1A CN117664567B (zh) 2024-01-30 2024-01-30 一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410122877.1A CN117664567B (zh) 2024-01-30 2024-01-30 一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法

Publications (2)

Publication Number Publication Date
CN117664567A true CN117664567A (zh) 2024-03-08
CN117664567B CN117664567B (zh) 2024-04-02

Family

ID=90073472

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410122877.1A Active CN117664567B (zh) 2024-01-30 2024-01-30 一种面向多源域不平衡数据的滚动轴承跨域故障诊断方法

Country Status (1)

Country Link
CN (1) CN117664567B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050096873A1 (en) * 2002-12-30 2005-05-05 Renata Klein Method and system for diagnostics and prognostics of a mechanical system
US20170011306A1 (en) * 2015-07-06 2017-01-12 Microsoft Technology Licensing, Llc Transfer Learning Techniques for Disparate Label Sets
CN112580518A (zh) * 2020-12-22 2021-03-30 杭州电子科技大学 基于原型聚类域适应算法的跨被试eeg认知状态识别方法
CN113486987A (zh) * 2021-08-04 2021-10-08 电子科技大学 基于特征解耦的多源域适应方法
WO2022011754A1 (zh) * 2020-07-16 2022-01-20 苏州大学 一种基于自适应流形嵌入动态分布对齐的故障诊断方法
CN114241208A (zh) * 2021-12-25 2022-03-25 南京理工大学 图像间变化检测的局部和全局深度对比特征学习网络构建方法
CN116310496A (zh) * 2023-01-30 2023-06-23 南京航空航天大学 基于域间注意力机制的航空发动机部分无监督跨域故障诊断方法
CN116465628A (zh) * 2023-03-13 2023-07-21 哈尔滨理工大学 一种基于改进多源域异构模型参数传递的滚动轴承故障诊断方法
CN116662861A (zh) * 2023-06-01 2023-08-29 燕山大学 基于数字孪生模型驱动的多域图迁移轴承寿命预测方法
CN116956048A (zh) * 2023-09-19 2023-10-27 北京航空航天大学 一种基于跨域泛化标签的工业设备故障诊断方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050096873A1 (en) * 2002-12-30 2005-05-05 Renata Klein Method and system for diagnostics and prognostics of a mechanical system
US20170011306A1 (en) * 2015-07-06 2017-01-12 Microsoft Technology Licensing, Llc Transfer Learning Techniques for Disparate Label Sets
WO2022011754A1 (zh) * 2020-07-16 2022-01-20 苏州大学 一种基于自适应流形嵌入动态分布对齐的故障诊断方法
CN112580518A (zh) * 2020-12-22 2021-03-30 杭州电子科技大学 基于原型聚类域适应算法的跨被试eeg认知状态识别方法
CN113486987A (zh) * 2021-08-04 2021-10-08 电子科技大学 基于特征解耦的多源域适应方法
CN114241208A (zh) * 2021-12-25 2022-03-25 南京理工大学 图像间变化检测的局部和全局深度对比特征学习网络构建方法
CN116310496A (zh) * 2023-01-30 2023-06-23 南京航空航天大学 基于域间注意力机制的航空发动机部分无监督跨域故障诊断方法
CN116465628A (zh) * 2023-03-13 2023-07-21 哈尔滨理工大学 一种基于改进多源域异构模型参数传递的滚动轴承故障诊断方法
CN116662861A (zh) * 2023-06-01 2023-08-29 燕山大学 基于数字孪生模型驱动的多域图迁移轴承寿命预测方法
CN116956048A (zh) * 2023-09-19 2023-10-27 北京航空航天大学 一种基于跨域泛化标签的工业设备故障诊断方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SHAOWEI LIU, HONGKAI JIANG: "Intelligent fault diagnosis of rotating machinery using a multi-source domain adaptation network with adversarial discrepancy matching", RELIABILITY ENGINEERING AND SYSTEM SAFETY, 17 December 2022 (2022-12-17), pages 1 - 9 *
刘 立, 朱健成, 韩光洁, 毕远国: "基于1D-CNN 联合特征提取的轴承健康监测与故障诊断", 软件学报, vol. 32, no. 8, 31 August 2021 (2021-08-31), pages 2379 - 2390 *
杨胜康,孔宪光,王奇斌,程涵,李中权: "基于多源域深度迁移学习的机械故障诊断 杨", 振动与冲击, vol. 41, no. 9, 30 September 2022 (2022-09-30), pages 32 - 40 *

Also Published As

Publication number Publication date
CN117664567B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
CN111898095B (zh) 深度迁移学习智能故障诊断方法、装置、存储介质和设备
CN112284736B (zh) 一种基于多通道注意力模块的卷积神经网络故障诊断方法
CN111914883B (zh) 一种基于深度融合网络的主轴轴承状态评估方法及装置
CN111598881A (zh) 基于变分自编码器的图像异常检测方法
CN108062572A (zh) 一种基于DdAE深度学习模型的水电机组故障诊断方法与系统
CN109766277A (zh) 一种基于迁移学习与dnn的软件故障诊断方法
CN111680788B (zh) 基于深度学习的设备故障诊断方法
CN111680706A (zh) 一种基于编码和解码结构的双通道输出轮廓检测方法
CN107842713B (zh) 基于knn-svr的海底管道漏磁数据缺失插补方法
CN109993236A (zh) 基于one-shot Siamese卷积神经网络的少样本满文匹配方法
CN115127814A (zh) 一种基于自适应残差对抗网络的无监督轴承故障诊断方法
CN113887136A (zh) 一种基于改进GAN和ResNet的电动汽车电机轴承故障诊断方法
CN116805061B (zh) 基于光纤传感的泄漏事件判断方法
CN116894187A (zh) 一种基于深度迁移学习的齿轮箱故障诊断方法
CN113869286A (zh) 一种自适应多任务智能故障诊断模型及故障诊断方法
CN112860183B (zh) 基于高阶矩匹配的多源蒸馏-迁移机械故障智能诊断方法
CN114997211A (zh) 一种基于改进对抗网络和注意力机制的跨工况故障诊断方法
Islam et al. Motor bearing fault diagnosis using deep convolutional neural networks with 2d analysis of vibration signal
CN115791174B (zh) 一种滚动轴承异常诊断方法、系统、电子设备及存储介质
CN111639697B (zh) 基于非重复采样与原型网络的高光谱图像分类方法
Shahid et al. Performance comparison of 1d and 2d convolutional neural networks for real-time classification of time series sensor data
Yang et al. Few-shot learning for rolling bearing fault diagnosis via siamese two-dimensional convolutional neural network
CN116011507A (zh) 融合元学习与图神经网络的稀有故障诊断方法
Liu et al. Multi-Scale Fusion Attention Convolutional Neural Network for Fault Diagnosis of Aero-Engine Rolling Bearing
CN115345255A (zh) 一种故障诊断方法、控制装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant