CN117312984A - 一种域间数据标签关系未知的滚动轴承跨域故障诊断方法及系统 - Google Patents
一种域间数据标签关系未知的滚动轴承跨域故障诊断方法及系统 Download PDFInfo
- Publication number
- CN117312984A CN117312984A CN202311268690.4A CN202311268690A CN117312984A CN 117312984 A CN117312984 A CN 117312984A CN 202311268690 A CN202311268690 A CN 202311268690A CN 117312984 A CN117312984 A CN 117312984A
- Authority
- CN
- China
- Prior art keywords
- domain
- data
- unknown
- target
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 146
- 238000003745 diagnosis Methods 0.000 title claims abstract description 63
- 238000005096 rolling process Methods 0.000 title claims abstract description 54
- 230000006978 adaptation Effects 0.000 claims abstract description 76
- 238000013508 migration Methods 0.000 claims abstract description 31
- 230000005012 migration Effects 0.000 claims abstract description 31
- 238000009826 distribution Methods 0.000 claims abstract description 24
- 230000007246 mechanism Effects 0.000 claims abstract description 21
- 238000000926 separation method Methods 0.000 claims abstract description 20
- 238000005457 optimization Methods 0.000 claims description 29
- 238000012549 training Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 23
- 230000003862 health status Effects 0.000 claims description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 20
- 238000012360 testing method Methods 0.000 claims description 13
- 230000036541 health Effects 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000013145 classification model Methods 0.000 claims description 8
- 230000000052 comparative effect Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 230000003416 augmentation Effects 0.000 claims description 2
- 238000005303 weighing Methods 0.000 claims 1
- 238000013526 transfer learning Methods 0.000 abstract description 3
- 238000002474 experimental method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000012546 transfer Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012800 visualization Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007794 visualization technique Methods 0.000 description 2
- 241000254158 Lampyridae Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7747—Organisation of the process, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种域间数据标签关系未知的滚动轴承跨域故障诊断方法及系统,涉及滚动轴承故障诊断技术领域,用以解决现有迁移学习中由于源域和目标域数据标签关系未知而导致故障诊断准确率低的问题。本发明的技术要点包括:构建对比通用域适应模型:引入BYOL网络挖掘目标域数据特有结构,并提出利用熵分离策略拒绝未知类样本;同时,设计一种源类加权机制来改进迁移语义增强方法,赋予源类别不同的类级权重,使两域的特征分布在共享标签空间中更好地对齐,进一步构建故障诊断模型;并通过训练好的故障诊断模型进行故障诊断。本发明在不同工况下均具有优越的故障诊断准确率。
Description
技术领域
本发明涉及滚动轴承故障诊断技术领域,具体涉及一种域间数据标签关系未知的滚动轴承跨域故障诊断方法及系统。
背景技术
滚动轴承作为旋转机械中的关键基础部件,广泛应用于关乎国民经济和国防事业的诸多领域[1]。实际应用中,滚动轴承所处工况复杂多变,一旦发生故障,轻则影响机器性能,重则造成大型事故,并导致人员伤亡[2]。因此,对不同工况下滚动轴承进行故障诊断,具有重要的意义[3]。
近年来,深度学习凭借其出众的特征提取能力,被广泛应用于智能故障诊断领域。文献[4]通过双向长短期记忆网络提取故障特征,并输入Softmax层完成故障分类。文献[5]采用萤火虫算法进行参数寻优,并利用多通道卷积神经网络提取特征,实现了滚动轴承故障诊断。文献[6]通过将原始振动信号转换为二维图像,输入到改进的卷积神经网络中,取得良好的故障诊断效果。文献[7]利用自适应斜率块改进残差收缩单元,成功应用于噪声背景下的故障诊断。
上述基于深度学习的故障诊断方法需要两个前提条件:有大规模高质量的带标签数据,以及待测数据与训练数据来自相同的分布[8]。然而,滚动轴承在不同工况条件下,训练数据和测试数据通常存在显著的分布差异。此外,收集大量带标签数据进行训练往往是困难和昂贵的。
针对基于深度学习的故障诊断方法存在的问题,将迁移学习引入到跨域故障诊断中,旨在从源域学习到的知识转移到目标域[9]。域适应技术作为最流行的迁移学习方法之一,受到越来越多的关注。文献[10]使用多核解决非线性问题,并动态对齐边缘分布和条件分布,提升了在跨域故障诊断中的鲁棒性。文献[11]提出基于高斯引导的特征对齐策略,获得了较高的跨域故障诊断准确率。文献[12]提出一种改进的条件对抗机制,同时自适应特征及标签,成功应用于轴承跨域故障诊断。文献[13]构建了基于深度注意力网络的迁移诊断模型,实现了不同转速下滚动轴承故障诊断。
上述故障诊断中均采用的是闭集域适应,即源域和目标域数据拥有相同的健康状态类型。然而在实际工业场景中,无法提前获取源域和目标域数据标签之间的关系。源域和目标域数据可能存在共享和私有的健康状态,直接对齐两域的特征分布将导致诊断模型出现负迁移现象[14]。
针对闭集域适应存在的局限性,通用域适应可以在域间数据标签关系未知的情况下,将目标域中与源域共享的健康状态正确分类。文献[15]提出源类和目标实例混合加权的通用域适应方法,实现未知故障模式和共享健康状态的类级别对齐,在旋转机械数据集上验证了所提方法的有效性。文献[16]通过提取每种故障类型样本的特征,形成故障诊断的特征中心,该通用域适应方法在解决未知机械故障状态方面具有较好的故障诊断性能。文献[17]通过Transformer网络提取特征信息,利用基于阈值的熵最大最小损失,以进一步对齐共享健康状态样本,实现了通用域适应场景下轴承状态的准确识别。
然而,上述基于通用域适应的故障诊断方法过分强调学习领域不变特征,而未充分利用目标域特有数据结构,导致可能无法从已知源类别中学习到区分目标域未知类别的有用特征。
另一方面,对比学习作为自监督学习领域的代表性方法,利用代理任务训练模型区分相似和不同的样本,从而学习无标签数据的一般特征。目前,已提出大量的对比学习网络,如视觉表示的简单对比学习(Simple Contrastive Learning ofRepresentations,SimCLR)[18]、动量对比学习(Momentum Contrast,MoCo)[19]等,通过构造正负样本提取有效特征。而基于自我预测的对比学习(Bootstrap Your Own Latent,BYOL)[20]只需要正样本进行训练,减少了对数据集的需求,从而提高模型的鲁棒性。文献[21]提出一种截断和下采样相结合的数据增强方法,利用BYOL网络提取无标签振动数据的故障特征,获得较高的诊断准确率。文献[22]提出一种基于多目标的对比学习方法,在实现故障诊断的同时进一步提高了模型的泛化性。
由于对比学习没有考虑领域差距问题,直接使用对比学习提取不同工况滚动轴承特征,模型无法实现特征对齐,易导致模型故障诊断性能较差;而现有的通用域适应方法过度依赖源域标签信息,致使在目标域上难以获取具有判别性的特征。
发明内容
针对上述问题,本发明提出一种域间数据标签关系未知的滚动轴承跨域故障诊断方法及系统。
根据本发明的一方面,提出一种域间数据标签关系未知的滚动轴承跨域故障诊断方法,该方法包括以下步骤:
1)数据选取及预处理:
获取某工况已知标签的滚动轴承所有状态振动信号作为源域数据,将无标签的其他工况滚动轴承振动信号作为目标域数据;对源域与目标域数据作短时傅里叶变换构造二维图像数据集,作为模型输入;
2)对比通用域适应模型构建:
构建的对比通用域适应模型包括两个模块:对比学习模块和域适应模块;其中对比学习模块用于增强模型特征提取能力,最大化相同健康状态样本间的相似性,减少分类边界附近的样本数量;域适应模块用于解决域间数据标签关系未知情况下的负迁移,并减小数据分布差异和标签差异;
将不同数据增强后的目标域数据输入到对比学习模块中,获得最优编码器网络;接着利用域适应模块中的熵分离策略拒绝目标域未知类样本,使用源分类器得到目标域无标签数据的伪标签,并通过源类加权机制改进的迁移语义增强方法赋予每个源类别不同的类级权重,进而对齐源域和目标域共享类的特征;
3)多状态识别:
在多状态分类模型训练过程中,使用LARS优化算法加快模型收敛速度,并动态改变对比损失的权重;通过目标损失不断更新模型参数,根据阈值将私有健康状态样本标记为未知类,共享健康状态样本正确分类;经过多次迭代优化,建立不同工况下滚动轴承多状态识别模型;将测试数据输入至诊断模型中,获得最终故障分类结果。
进一步地,将不同数据增强后的目标域数据输入到对比学习模块中,获得最优编码器网络的过程包括:
对于每一个图像,随机选取两个增强图像方法,计算在线网络投影特征zθ;计算目标网络投影特征z′θ;计算自监督表征学习方法BYOL的损失LCL;迭代循环N次后,根据梯度更新在线网络参数,更新目标网络参数,获得最优编码器网络。
进一步地,利用域适应模块中的熵分离策略拒绝目标域未知类样本的过程包括:
熵H(y)和阈值ρ之间的距离定义为|H(y)-ρ|,其中y是目标样本的分类输出;未知类样本的熵高于ρ,共享类样本的熵低于ρ,使用置信阈值参数m,只对置信区间内的样本计算熵分离损失:
其中,B为批次尺寸。
进一步地,通过源类加权机制改进的迁移语义增强方法赋予每个源类别不同的类级权重的过程包括:
利用目标域样本的熵值估计源类的权重,权重设计为:
其中,G为分类器,和/>分别表示第c个类别的权重和目标域样本,nt,c是类别为c的目标域样本数量;Fθ为编码器。
采用最小最大归一化方法对权重进行归一化处理:
其中,ωc为的归一化值,ψ是缩放参数,/>是较小的正数;
迁移语义增强损失LCLS中的参数改进为:
其中,是样本xsi预测为类别c的概率;/>表示类别ysi样本的域间均值差异;/>表示预测为类别c样本的类内协方差;/>表示类别ysi的最后一个全连接层的权重矩阵;
最大化目标域数据的互信息为:
其中,Cs表示源域类别总数;nt表示目标域样本总数;表示目标域样本预测为类别c的概率。
进一步地,在多状态分类模型训练过程中,动态改变对比损失的权重,动态权衡参数β(x)定义为:
其中,i为当前迭代次数,N为总迭代次数;
模型最终的优化目标如下所示:
L=LCLS+α1LMI+α2LES+β(x)LCL
其中,α1和α2为权衡超参数。
进一步地,按照下述公式计算在线网络投影特征zθ:zθ←gθ(Fθ(t(xi)))。
进一步地,按照下述公式计算目标网络投影特征z′θ:z′θ←g′θ(F′θ(t′(xi)))。
进一步地,按照下述公式计算自监督表征学习方法BYOL的损失LCL:
其中,qθ(zθ1)、z′θ1是交换视图后在线网络和目标网络的输出特征。
进一步地,按照下述公式更新目标网络参数:θ′←τθ′+(1-τ)θ。
根据本发明的另一方面,提出一种域间数据标签关系未知的滚动轴承跨域故障诊断系统,该系统包括:
数据预处理模块,其配置成获取某工况已知标签的滚动轴承所有状态振动信号作为源域数据,将无标签的其他工况滚动轴承振动信号作为目标域数据;对源域与目标域数据作短时傅里叶变换构造二维图像数据集,作为模型输入;
对比通用域适应模型构建模块,其配置成将不同数据增强后的目标域数据输入到对比学习模块中,获得最优编码器网络;接着利用域适应模块中的熵分离策略拒绝目标域未知类样本,使用源分类器得到目标域无标签数据的伪标签,并通过源类加权机制改进的迁移语义增强方法赋予每个源类别不同的类级权重,进而对齐源域和目标域共享类的特征;构建的对比通用域适应模型包括两个模块:对比学习模块和域适应模块;其中对比学习模块用于增强模型特征提取能力,最大化相同健康状态样本间的相似性,减少分类边界附近的样本数量;域适应模块用于解决域间数据标签关系未知情况下的负迁移,并减小数据分布差异和标签差异;
状态识别模块,其配置成在多状态分类模型训练过程中,使用LARS优化算法加快模型收敛速度,并动态改变对比损失的权重;通过目标损失不断更新模型参数,根据阈值将私有健康状态样本标记为未知类,共享健康状态样本正确分类;经过多次迭代优化,建立不同工况下滚动轴承多状态识别模型;将测试数据输入至诊断模型中,获得最终故障分类结果。
本发明的有益技术效果是:
本发明采用对比学习训练目标域数据,使模型更加注重目标域的特征学习,并通过熵分离策略识别目标域未知健康状态,同时设计一种源类加权机制改进迁移语义增强方法,减小振动数据分布差异和标签差异。最后,利用线性增长自适应学习率缩放(Layer-wise Adaptive Rate Scaling,LARS)优化算法加速模型收敛过程,实现域间数据标签关系未知的滚动轴承跨域故障诊断。
附图说明
本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。
图1是本发明所述的一种域间数据标签关系未知的滚动轴承跨域故障诊断方法的流程框图。
图2是BYOL结构示意图。
图3是投影器和预测器结构示意图。
图4是模型原理示意图。
图5是熵分离策略过程示意图。
图6是轴承试验台示意图。
图7是本发明所提方法与其他方法对比实验结果示例图。
图8是不同方法的t-SNE可视化示例图。
图9是加入源类加权机制前后准确率对比结果示例图。
图10是不使用对比学习的混淆矩阵。
图11是使用对比学习的混淆矩阵。
图12是优化算法对比结果示例图。
图13是任务T5下本发明方法的源类权重。
图14是超参数α1和α2敏感性测试。
图15是超参数m敏感性测试。
图16是跨规格泛化对比实验结果示例图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,在下文中将结合附图对本发明的示范性实施方式或实施例进行描述。显然,所描述的实施方式或实施例仅仅是本发明一部分的实施方式或实施例,而不是全部的。基于本发明中的实施方式或实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式或实施例,都应当属于本发明保护的范围。
本发明实施例提出一种域间数据标签关系未知的滚动轴承跨域故障诊断方法,如图1所示,该方法的具体步骤为:
1)数据选取及预处理。
获取某工况已知标签的滚动轴承所有状态振动信号作为源域数据,将无标签的其他工况滚动轴承振动信号作为目标域数据;对源域与目标域数据作短时傅里叶变换构造二维图像数据集,作为模型的输入。
2)对比通用域适应模型构建。
将不同数据增强后的目标域数据输入到对比学习模块中;接着利用域适应模块中的熵分离策略拒绝目标域未知类样本,使用源分类器得到目标域无标签数据的伪标签,并通过所提源类加权机制改进的迁移语义增强方法,赋予每个源类别不同的类级权重,进而对齐源域和目标域共享类的特征。
3)多状态识别。
在多状态分类模型训练过程中,使用LARS优化算法加快模型收敛速度,并动态改变对比损失的权重。通过目标损失不断更新模型参数,根据阈值将私有健康状态样本标记为未知类,共享健康状态样本正确分类。经过多次迭代优化,建立不同工况下滚动轴承多状态识别模型。将测试数据输入至诊断模型中,获得最终故障分类结果。
下面对本发明实施例进行详细说明。
1、对比学习
对比学习作为典型的自监督学习方法,旨在通过代理任务学习无标签数据的一般特征。其核心思想是利用数据增强实现代理任务,使同一图像不同数据增强后的样本对特征相似度尽可能增加,而不同图像特征间的相似度尽可能减小[23]。本发明使用对比学习方法中的BYOL算法,其在训练过程中无需负样本对,在避免产生大量计算的同时,又可以提升模型的性能。BYOL结构如图2所示。BYOL利用在线网络和目标网络进行模型训练,在线网络由编码器Fθ、投影器gθ和预测器qθ组成,网络中的编码器采用ResNet-50,投影器和预测器使用2层非线性多层感知器(Multilayer Perceptron,MLP),结构如图3所示。目标网络体系结构与不含预测器qθ的在线网络相同,网络权重参数更新方式不同,使用梯度更新在线网络的权重θ,而目标网络权重θ'由在线网络的指数移动平均更新:
θ′←τθ′+(1-τ)θ(1)
其中,τ为超参数,τ∈[0,1)。
通过两种不同的数据增强方法t和t',生成x的不同视图v和v',分别输入到编码器Fθ和Fθ′得到相应的特征。BYOL网络将同一张图像的不同数据增强后的视图看作正样本对,损失函数的目标是最小化正样本对之间的相似性距离:
其中,qθ(zθ)、z′θ分别是在线网络和目标网络的输出特征,<·>为向量点乘运算,||·||2表示L2正则化。
由于BYOL网络分支不对称,故将不同数据增强后的视图交换,使其沿着另一分支前向传播,计算损失Lθ′,θ。BYOL网络的最终损失可表示为:
其中,qθ(zθ1)、z′θ1是交换视图后在线网络和目标网络的输出特征。
2、迁移语义增强
迁移语义增强方法通过朝着目标域的语义方向,隐式增强源域特征,从而提高分类器的泛化能力[24]。由于域偏移,同类别的源域样本特征和目标域样本特征的均值不同,反映了该类整体语义的偏差。对于类别c,计算源域和目标域的平均特征向量和/>使用伪标签解决目标域数据缺失标签的问题。通过域间均值差异/>减小整体语义偏差,并利用类内协方差/>捕获目标域的语义变化。
为了以端到端的方式训练模型,采用存储体M缓存源域和目标域的所有特征,从而便于计算Δμc和在迭代批次j中,更新M中的特征和相应的标签:
其中,i是批次B(j)内的样本索引,分别是存储在M中的特征和标签。
为了进行有效的跨域语义增强,将源域特征沿着多元分布方向随机进行各种语义转换,生成增强特征/>在保留源域标签的情况下,将每个源域样本的特征fsi增强H次,并在增强后的特征集上使用交叉熵损失训练模型:
其中,ns、Cs分别是源域样本总数和类别总数,分别是模型最后一个全连接层的权重矩阵和偏置向量,fsi是源域第i个样本xsi的特征。
当增强次数H趋于无穷时,为避免造成过大的计算成本,隐式生成无限的增强特征,并根据大数定律推导损失的上限:
其中,是样本xsi预测为类别c的概率。
3、通用域适应
域适应中目标域样本通常缺乏标签,故无法获知源域和目标域数据标签的关系。为了实现域间数据标签关系未知情况下的跨域故障诊断,本发明使用通用域适应减小不同工况数据之间的分布差异和标签差异。
在通用域适应中,将位于公共标签空间的源域和目标域样本划分为共享类,将目标域中私有类别的样本划分为未知类。通用域适应的任务是利用带标签的源域数据,实现共享类别的对齐,同时识别未知类别[25]。设分别表示由ns个带标签样本组成的源域和nt个无标签样本组成的目标域。源域标签空间Cs和目标域标签空间Ct的关系未知,即源域数据从已知的机械故障模式中采集,而目标域数据从部分已知和额外的未知故障模式中采样。C=Cs∩Ct是源域和目标域的共享标签空间,/>分别是源域和目标域的私有标签空间。源域数据特征分布Ps和目标域数据特征分布Pt不同,即Ps≠Pt。源域和目标域的共性定义为标签空间的Jaccard距离[26]:
其中,ξ∈[0,1],当ξ=1时,通用域适应退化为闭集域适应;ξ的值越小,表明源域和目标域共享较少的类级知识,任务更具挑战性。
4、本发明中对比通用域适应模型的构建
对比通用域适应模型主要分为两个模块:对比学习模块和域适应模块,其中对比学习模块用以增强模型特征提取能力,挖掘目标域数据特有结构,并最大化相同健康状态样本间的相似性,减少分类边界附近的样本数量;域适应模块用于解决域间数据标签关系未知情况下的负迁移问题,并减小数据分布差异和标签差异。因此,理论上所提模型在减少域差异的同时,可以识别未知类样本。模型的原理示意图如图4所示。
4.1对比学习模块
对比学习模块通过对输入图像进行随机裁剪、随机灰度和颜色抖动等数据增强操作,形成正样本对,并利用正样本对之间的相似性学习到更具判别性的特征表示。对比学习模块算法流程如算法1所示。
4.2域适应模块
1)熵分离策略
通用域适应的主要挑战是利用无标签的目标域数据提高源分类器的性能。然而,大部分通用域适应方法只是试图增加共享类的置信度,为了使目标域未知类远离源域已知类,还需降低目标域未知类的置信度。因此,本发明利用熵分离策略拒绝目标域未知类样本。由于未知类与已知类没有共同的属性,故未知类样本的源分类器输出熵比共享类样本的熵更大。基于此思想,熵分离策略使用源分类器输出的熵在未知类和共享类之间划定边界。熵分离策略的过程如图5所示。
熵H(y)和阈值ρ之间的距离定义为|H(y)-ρ|,其中y是目标样本的分类输出。未知类样本的熵高于ρ,而共享类样本的熵低于ρ,可以通过最大化该距离,使H(y)远离ρ。然而大部分情况下,阈值是不明确的,并且可能由于域偏移而改变。因此,使用置信阈值参数m,只对置信区间内的样本计算熵分离损失:
其中,B为批次尺寸。当|H(y)-ρ|足够大时,模型对未知类和共享类的决策有信心。
2)改进的迁移语义增强
熵分离策略可以识别目标域中的未知类和共享类,但仍需对齐源域和目标域的共享类。对比学习可以有效提取目标域无标签数据的底层特征,但加入的分类器泛化能力有限,故通过迁移语义增强方法对齐源域和目标域数据的特征分布,从而提高模型的泛化性。由于域间数据标签关系未知,若将迁移语义增强方法直接应用于通用域适应场景会出现负迁移现象。因此,本发明提出一种源类加权机制,用于改进迁移语义增强方法。改进后的方法对均值和协方差矩阵进行加权,将语义转换方向改为从而促进共享标签空间中样本的分布对齐,抑制私有标签空间中的样本造成的负迁移。
在设计源类权重时,由于目标域未知类的熵值相较于共享类更大,故本发明利用目标域样本的熵值估计源类的权重。具体来说,为了保证共享类获得更高的权重,私有类获得较低的权重,将权重设计为:
其中G为分类器,和/>分别表示第c个类别的权重和目标域样本,nt,c是类别为c的目标域样本数量,Fθ为编码器。
采用最小最大归一化方法对权重进行归一化处理:
其中,ωc为的归一化值,ψ是缩放参数,/>是较小的正数。因此,迁移语义增强损失LCLS中的参数/>改进为:
其中,是样本xsi预测为类别c的概率;/>表示类别ysi样本的域间均值差异;/>表示预测为类别c样本的类内协方差;/>表示类别ysi的最后一个全连接层的权重矩阵。
互信息可以衡量两个随机变量的相关性,目标域特征和预测之间的强相关性将有利于迁移语义增强,使提取的特征更有信息量,包含更有用的预测语义。因此,最大化目标域数据的互信息:
其中,Cs表示源域类别总数;nt表示目标域样本总数;表示目标域样本预测为类别c的概率。
3)优化目标
为避免在训练过程中过度关注对比学习给模型带来的偏置,本发明将动态改变对比损失的权重,使模型在训练后期侧重于分类任务,从而提高模型的分类准确率。动态权衡参数β(x)定义为:
其中,i为当前迭代次数,N为总迭代次数。
综上所述,模型最终的优化目标如式(19),并采用具有自适应学习率的LARS优化方法对目标函数L进行优化,使模型不同层拥有不同的学习率,减少模型出现梯度大幅度波动的问题,从而提升优化效果。
L=LCLS+α1LMI+α2LES+β(x)LCL (19)
其中,α1和α2为权衡超参数。
5、实验验证
本发明实验所用的CWRU数据集来自美国凯斯西储大学[27]。试验台示意图如图6所示,主要由电动机、扭矩传感器、功率测试计和电子控制器组成,其中电动机驱动端和风扇端分别装有规格SKF6205和SKF6203的滚动轴承。
实验在1797rpm、1772rpm、1750rpm、1730rpm不同转速下,利用16通道数据记录仪采集轴承振动信号,采样频率为12kHz,包含正常状态以及3种故障状态的数据,每种故障状态又包括三种损伤直径,共计10种类别。为方便叙述数据集,使用符号N表示正常状态,9种故障状态的描述如表1所示。
表1实验数据表示方法
实验数据集以SKF6205为例,每种类别选取150个样本,且每个样本长度为1024点。具体描述如表2所示。通过设置12组不同的跨转速任务来验证所提方法的有效性。实验任务设置如表3所示,不同任务的源域健康状态和目标域健康状态通常是随机选取的。
表2轴承实验数据集
所有实验均在GPU型号NVIDIA GeForce RTX3060和配备16GB内存的计算机上进行。训练过程采用LARS优化方法,学习率设置为0.01,批大小设置为16,权重参数α1和α2均设置为0.1,阈值参数m设置为0.2,迭代次数为100。为减少实验的随机性,每次实验重复五次并取平均值作为最终结果。
表3不同转速下的域适应任务
将本发明所提方法与以下4种域适应方法进行对比研究,以验证所提方法的优越性:
1)域对抗神经网络(Domain Adversarial Training of Neural Networks,DANN)[28]作为典型的闭集域适应方法,通过域鉴别器进行对抗训练,进而学习跨域不变特征。
2)域条件适应网络(Domain Conditioned Adaptation Network,DCAN)[29]作为闭集域适应方法,利用域条件通道注意力机制激发不同的卷积通道,实现数据分布差异较大时的故障诊断。
3)通用域适应网络(Universal Domain Adaptation,UAN)[23]利用样本的相似性进行加权,实现源域和目标域共享类适应。
4)通用域适应的一对多网络(Universal Domain Adaptation using the One-vs-All Network,OVANet)[30]通过学习源域中的最小类间距离,以识别目标域中的共享类和未知类。
不同域适应任务的故障诊断结果如图7所示。从比较结果可以看出,所提方法具有较好的跨域诊断准确率,大多数都在92%以上。
DANN和DCAN方法在闭集域适应任务T3、T6和T9中获得了较好的诊断性能。然而,这两种方法无法识别未知类样本,当源域和目标域私有类及共享类同时存在时,会出现明显的负迁移现象。例如在任务T7中,闭集域适应方法的诊断准确率仅为50%左右,通用域适应方法UAN和OVANet可达到78%的准确率,而本发明所提方法的准确率能达到99.6%,相较于上述对比方法都有很大程度的提升。在更具挑战性的任务T2、T11和T12中,共性ξ较小,所提方法准确率依旧可达到90%左右,相较于UAN及OVANet方法,准确率提高至少20%,表明所提方法的性能更稳定。在不同的域适应任务中,所提方法的性能均优于其他方法,证明了该方法在解决跨域问题上的优越性。
为更加直观的评估所提方法的有效性,将实现特征可视化。具体来说,以任务T5为例,利用t-分布邻域嵌入(t-distributionstochastic neighbor embedding,t-SNE)算法将模型所提取的最后一层特征进行降维可视化处理。不同方法的可视化结果如图8所示,其中不同形状代表不同的健康状况。
从图8的5个子图可以看出,使用DANN和DCAN方法提取的特征可视化后,不同类别的特征混合在一起,表明闭集域适应方法直接应用于通用域适应场景会存在大量的误分类样本。此外,采用UAN和OVANet方法得到的特征分布图,类别边界基本清晰,但仍存在部分重叠特征。相比之下,通过所提方法提取的深层特征可视化后,同类别的特征聚集在一起,而不同类别的特征之间距离较远,且大多数未知类样本聚类并与其他类分离。进一步证明了所提方法可以有效区分不同健康状态特征。
为了验证所提方法中各部分对性能的影响,对引入迁移语义增强方法前后、采用源类加权机制改进特征对齐方法前后、利用对比学习改进目标域网络前后、使用LARS优化算法前后进行对比实验。为了验证使用迁移语义增强方法的有效性,篇幅所限,以任务T5为例,分别使用基于MMD的统计差异度量方法、基于域鉴别器的传统对抗域适应方法进行特征对齐,并对比本发明采用的迁移语义增强方法的诊断效果,结果如表4所示。
表4不同特征对齐方法准确率对比结果
对比表4中不同特征对齐方法的准确率可知,在跨域诊断过程中不使用任何对齐方法的准确率最低,仅有31.4%,表明源域和目标域之间的特征分布存在显著差异。利用迁移语义增强方法的准确率分别高于统计差异度量方法和对抗域适应方法22.4%和14.0%。由此可以证明利用迁移语义增强方法可以更好地对齐两域之间的特征,提高故障诊断的准确率。
为了探究当域间数据标签关系未知时,加入源类加权机制改进迁移语义增强方法后的分类效果,设置一个不含源类加权机制的所提模型进行比较,具体实验结果如图9所示。
由图9可知,使用源类加权机制的故障识别准确率有明显提高。尤其在任务T1和T7中,加入源类加权机制后的准确率提高12.3%和10.2%。由此可以证明在源域和目标域的特征分布和标签空间存在显著差异的情况下,采用源类加权机制改进后的迁移语义增强方法可以在共享标签空间中最大限度地对齐两域特征。
为了验证使用对比学习能够提升模型的分类效果,利用混淆矩阵可视化方法,清晰反映所提方法将私有健康状态标为未知类的准确效果,以及共享健康状态的正确识别效果。在任务T5下的混淆矩阵如图10和图11所示。比较图10和图11可知,不使用对比学习时,由于目标域特有数据结构未被充分挖掘,致使诊断效果较差,错分现象较为明显,共23个错分样本;使用本发明所提方法,在目标域引入对比学习进行训练后,错分的样本数量明显减少,只有IR14、OR14、B14、未知类的4类故障存在错分现象,共13个错分样本。实验表明,使用对比学习可增强滚动轴承故障特征的提取能力。
实验仍以任务T5为例,模型在训练过程中,采用LARS优化算法提高梯度收敛速度,与传统优化算法Adam对比的实验结果如图12所示。
由图12可知,使用Adam优化算法时,损失函数在迭代初期存在严重抖动现象,且在80次左右准确率趋向稳定。使用LARS优化算法时,损失函数在迭代初期抖动现象不明显,且在30次左右准确率保持稳定不变。LARS优化算法节约60%左右的训练时间,可有效加快收敛速度。
以任务T5为例,研究模型学习到的源类权重,结果如图13所示。观察可知,通过所提方法,共享健康状态可以获得较大的权重,私有健康状态获得较小的权重,从而关注权重较大的共享类的自适应结果,并忽略私有类。故在跨域故障诊断中,所提方法可以保证两个域之间的共享类对齐,私有类远离。
此外,通过改变以下参数的值来研究所提出方法的超参数敏感性:1)LMI的权衡参数α1;2)LES的权衡参数α2;3)LES的置信阈值参数m。为了减少超参数的数量,规定实验中α1和α2相等。结果如图14和图15所示。可以观察到,在给定的参数范围内获得的诊断准确度并没有显著变化。因此,表明所提出方法的超参数在合理范围内不敏感。
为进一步探究本发明所提方法的泛化性,将在SKF6205、SKF6203和江南大学数据集(Jiangnan University Dataset,JNU)[31]之间进行不同规格下故障诊断泛化实验。
JNU采样频率为50kHz,包括4种不同的健康状态。实验选取转速为每分钟600转下的4种状态数据,每种状态450个样本。
为了匹配实验数据集的故障程度,选取SKF6205和SKF6203数据集的4种状态数据。具体实验的数据集及跨规格任务设置分别如表5、6所示。
表5轴承泛化实验数据集
表6不同规格下的域适应任务
按照表6中的任务设置进行实验,结果如图16所示。由图16可知,在6个迁移任务中,对不同规格轴承进行故障状态分类时,所提方法的故障诊断准确率均高于其余4种域适应方法,且准确率至少提高13%。经实验验证,本发明所提方法不仅能够解决不同转速下的故障诊断问题,还能够解决不同规格下滚动轴承故障诊断问题,进一步证明了本发明所提方法泛化性较强。
6、结论
基于对比学习具有强大的特征提取能力,本发明提出使用对比学习充分挖掘目标域特有结构,通过混淆矩阵可视化方法,证明了改进后的目标域网络可增强滚动轴承故障特征提取能力;提出源类加权机制,并改进迁移语义增强方法,以对齐共享类的特征分布,此外,引入熵分离策略,达到拒绝未知类样本的目的,经实验验证,所提改进的迁移语义增强方法可提高通用域适应场景下的故障识别准确率;提出一种基于对比通用域适应的滚动轴承跨域故障诊断方法,能够在域间数据标签关系未知且目标域带标签数据缺乏的情况下建立有效的故障诊断模型。
实验结果可知,本发明所提方法在两域特征分布和标签空间存在显著差异情况下也具有较高的故障诊断准确率,平均可达95.6%,相较于本发明所对比的其他域适应方法准确率提升至少8%。同时,所提方法在训练过程中采用LARS优化算法加快模型收敛速度,可节约60%左右的训练时间。经泛化实验表明,所提方法在不同规格迁移场景下也具有较强的泛化能力。
本发明另一实施例提出一种域间数据标签关系未知的滚动轴承跨域故障诊断系统,该系统包括:
数据预处理模块,其配置成获取某工况已知标签的滚动轴承所有状态振动信号作为源域数据,将无标签的其他工况滚动轴承振动信号作为目标域数据;对源域与目标域数据作短时傅里叶变换构造二维图像数据集,作为模型输入;
对比通用域适应模型构建模块,其配置成将不同数据增强后的目标域数据输入到对比学习模块中,获得最优编码器网络;接着利用域适应模块中的熵分离策略拒绝目标域未知类样本,使用源分类器得到目标域无标签数据的伪标签,并通过源类加权机制改进的迁移语义增强方法赋予每个源类别不同的类级权重,进而对齐源域和目标域共享类的特征;构建的对比通用域适应模型包括两个模块:对比学习模块和域适应模块;其中对比学习模块用于增强模型特征提取能力,最大化相同健康状态样本间的相似性,减少分类边界附近的样本数量;域适应模块用于解决域间数据标签关系未知情况下的负迁移,并减小数据分布差异和标签差异;
状态识别模块,其配置成在多状态分类模型训练过程中,使用LARS优化算法加快模型收敛速度,并动态改变对比损失的权重;通过目标损失不断更新模型参数,根据阈值将私有健康状态样本标记为未知类,共享健康状态样本正确分类;经过多次迭代优化,建立不同工况下滚动轴承多状态识别模型;将测试数据输入至诊断模型中,获得最终故障分类结果。
本发明实施例一种域间数据标签关系未知的滚动轴承跨域故障诊断系统的功能可以由前述一种域间数据标签关系未知的滚动轴承跨域故障诊断方法说明,因此系统实施例未详述部分,可参见以上方法实施例,在此不再赘述。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
本发明援引的文献如下:
[1]董绍江,周存芳,陈里里,等.基于判别性特征提取和双重域对齐的轴承跨域故障诊断[J/OL].中国机械工程:1-10[2023-05-27].http://kns.cnki.net/kcms/detail/42.1294.TH.20230508.1159.004.html.
[2]ZHAO B,ZHANG X,Li H,et al.Intelligent fault diagnosis of rollingbearings based on normalized CNN considering data imbalance and variableworking conditions[J].Knowledge-Based Systems,2020,199:105971.
[3]SHI H,SHANG Y.Initial fault diagnosis ofrolling bearing based ondecond-order cyclic autocorrelation and DCAE combined with transfer learning[J].IEEE Transactions on Instrumentation andMeasurement,2021,71:1-18.
[4]金江涛,许子非,李春,等.基于卷积双向长短期记忆网络与混沌理论的滚动轴承故障诊断[J].振动与冲击,2022,41(17):160-169.
[5]刘好博,郝洪涛,丁文捷,等.基于IMCKD和MCCNN的滚动轴承故障诊断方法[J].振动与冲击,2022,
41(07):241-249.
[6]WEN L,LI X,GAO L,et al.Anew convolutional neural network-baseddata-driven fault diagnosis method[J].
IEEE Transactions on Industrial Electronics,2017,65(7):5990-5998.
[7]TONG J,TANG S,WU Y,et al.A fault diagnosis method ofrollingbearing based on improved deep residual shrinkage networks[J].Measurement,2023,206:112282.
[8]WU Z,JIANG H,LIU S,et al.Conditional distribution-guidedadversarial transfer learning network with multi-source domains for rollingbearing fault diagnosis[J].Advanced Engineering Informatics,2023,56:101993.
[9]ZHENG H,WANG R,YANG Y,et al.Cross-domain fault diagnosis usingknowledge transfer strategy:A review[J].IEEEAccess,2019,7:129260-129290.
[10]XIONG J,CUI S,TANG H.A novel intelligent bearing fault diagnosismethod based on signal process and multi-kerneljoint distribution adaptation[J].Scientific Reports,2023,13(1):4535.
[11]WU Z,JIANG H,LIU S,et al.A gaussian-guided adversarial adaptationtransfer network for rolling bearing fault diagnosis[J].Advanced EngineeringInformatics,2022,53:101651.
[12]王玉静,吕海岩,康守强,等.不同型号滚动轴承故障诊断方法[J].中国电机工程学报,2021,41(01):267-276.
[13]陈仁祥,唐林林,胡小林,等.不同转速下基于深度注意力迁移学习的滚动轴承故障诊断方法[J].振动与冲击,2022,41(12):95-101.
[14]范苍宁,刘鹏,肖婷,等.深度域适应综述:一般情况与复杂情况[J].自动化学报,2021,47(03):515-548.
[15]ZHANG W,LI X,MA H,et al.Universal domain adaptation in faultdiagnostics with hybrid weighted deep adversarial learning[J].IEEETransactions on Industrial Informatics,2021,17(12):7957-7967.
[16]YAN Z,LIU G,WANG J,et al.A new universal domain adaptive methodfor diagnosing unknown bearing faults[J].Entropy,2021,23(8):1052.
[17]ZHANG Y,REN Z,FENG K,et al.Universal source free domainadaptation method for cross-domain fault diagnosis ofmachines[J].MechanicalSystems and Signal Processing,2023,191:110159.
[18]CHEN T,KORNBLITH S,NOROUZI M,et al.A simple framework forcontrastive learning of visual representations[C].International Conference onMachine Learning,Vienna,Austria,2020:1597-1607.
[19]HE K,FAN H.Momentum contrast for unsupervised visualrepresentation learning[C].Proceedings of the IEEEConference onComputerVision andPattern Recognition,Seattle,WA,USA,2020:9729-9738.
[20]GRILL J B,STRUB F,ALTCHE F,et al.Bootstrap your own latent-a newapproach to self-supervised learning[J].Advances in Neural InformationProcessing Systems,2020,33:21271-21284.
[21]PENG T,SHEN C,SUN S,et al.Fault feature extractor based onbootstrap your own latent and data augmentation algorithm for unlabeledvibration signals[J].IEEE Transactions on Industrial Electronics,2021,69(9):9547-9555.
[22]ZHANG W,CHEN D,XIAO Y,et al.Semi-supervised contrast learningbased on multi-scale attention and multi-target contrast learning forbearingfault diagnosis[J].IEEE Transactions on Industrial Informatics,2023,19:1-13.
[23]KAN S,HE Z,CEN Y,et al.Contrastive bayesian analysis for deepmetric learning[J].IEEE Transactions on PatternAnalysis andMachineIntelligence,2022,45(6):7220-7238.
[24]LI S,XIE M,GONG K,et al.Transferable semantic augmentation fordomain adaptation[C].Proceedings of the IEEE Conference on Computer Visionand Pattern Recognition,Nashville,TN,USA,2021:11516-11525.[25]SU W,HAN Z,HER,et al.Neighborhood-based credibility anchor learning for universal domainadaptation[J].Pattern Recognition,2023,142:109686.
[26]YOU K.,LONG M,CAO Z,et al.Universal domain adaptation[C].Proceedings ofthe IEEE Conference on Computer Vision and PatternRecognition,Long Beach,CA,USA,2019:2720–2729.
[27]LOPARO,K A.Bearing data center[M/OL].Cleveland:Case WesternReserve University,2013.
http://csegroups.case.edu/bearingdatacenter/home.
[28]GANIN Y,USTINOVA E,AJAKAN H,et al.Domain-adversarial trainingofneural networks[J].The Journal ofMachine Learning Research,2016,17(1):2096-2030.
[29]LI S,LIU C,LIN Q,et al.Domain conditioned adaptation network[C].Proceedings ofthe AAAI Conference on Artificial Intelligence,New York,NewYork,USA,2020:11386-11393.
[30]SAITO K,SAENTO K.Ovanet:One-vs-all network for universal domainadaptation[C].Proceedings of the IEEE Conference on Computer Vision andPattern Recognition,Nashville,TN,USA,2021:9000-9009.
[31]LI K,PING X,WANG H,et al.Sequential fuzzy diagnosis method formotor roller bearing in variable operating conditions based on vibrationanalysis[J].Sensors,2013,13(6):8013-8041.
Claims (10)
1.一种域间数据标签关系未知的滚动轴承跨域故障诊断方法,其特征在于,包括以下步骤:
1)数据选取及预处理:
获取某工况已知标签的滚动轴承所有状态振动信号作为源域数据,将无标签的其他工况滚动轴承振动信号作为目标域数据;对源域与目标域数据作短时傅里叶变换构造二维图像数据集,作为模型输入;
2)对比通用域适应模型构建:
构建的对比通用域适应模型包括两个模块:对比学习模块和域适应模块;其中对比学习模块用于增强模型特征提取能力,最大化相同健康状态样本间的相似性,减少分类边界附近的样本数量;域适应模块用于解决域间数据标签关系未知情况下的负迁移,并减小数据分布差异和标签差异;
将不同数据增强后的目标域数据输入到对比学习模块中,获得最优编码器网络;接着利用域适应模块中的熵分离策略拒绝目标域未知类样本,使用源分类器得到目标域无标签数据的伪标签,并通过源类加权机制改进的迁移语义增强方法赋予每个源类别不同的类级权重,进而对齐源域和目标域共享类的特征;
3)多状态识别:
在多状态分类模型训练过程中,使用LARS优化算法加快模型收敛速度,并动态改变对比损失的权重;通过目标损失不断更新模型参数,根据阈值将私有健康状态样本标记为未知类,共享健康状态样本正确分类;经过多次迭代优化,建立不同工况下滚动轴承多状态识别模型;将测试数据输入至诊断模型中,获得最终故障分类结果。
2.根据权利要求1所述的一种域间数据标签关系未知的滚动轴承跨域故障诊断方法,其特征在于,将不同数据增强后的目标域数据输入到对比学习模块中,获得最优编码器网络的过程包括:
对于每一个图像,随机选取两个增强图像方法,计算在线网络投影特征zθ;计算目标网络投影特征z′θ;计算自监督表征学习方法BYOL的损失LCL;迭代循环N次后,根据梯度更新在线网络参数,更新目标网络参数,获得最优编码器网络。
3.根据权利要求1所述的一种域间数据标签关系未知的滚动轴承跨域故障诊断方法,其特征在于,利用域适应模块中的熵分离策略拒绝目标域未知类样本的过程包括:
熵H(y)和阈值ρ之间的距离定义为|H(y)-ρ|,其中y是目标样本的分类输出;未知类样本的熵高于ρ,共享类样本的熵低于ρ,使用置信阈值参数m,只对置信区间内的样本计算熵分离损失:
其中,B为批次尺寸。
4.根据权利要求1所述的一种域间数据标签关系未知的滚动轴承跨域故障诊断方法,其特征在于,通过源类加权机制改进的迁移语义增强方法赋予每个源类别不同的类级权重的过程包括:
利用目标域样本的熵值估计源类的权重,权重设计为:
其中,G为分类器,和/>分别表示第c个类别的权重和目标域样本,nt,c是类别为c的目标域样本数量;Fθ为编码器。
采用最小最大归一化方法对权重进行归一化处理:
其中,ωc为的归一化值,ψ是缩放参数,/>是较小的正数;
迁移语义增强损失LCLS中的参数改进为:
其中,是样本xsi预测为类别c的概率;/>表示类别ysi样本的域间均值差异;/>表示预测为类别c样本的类内协方差;/>表示类别ysi的最后一个全连接层的权重矩阵;
最大化目标域数据的互信息为:
其中,Cs表示源域类别总数;nt表示目标域样本总数;表示目标域样本预测为类别c的概率。
5.根据权利要求1所述的一种域间数据标签关系未知的滚动轴承跨域故障诊断方法,其特征在于,在多状态分类模型训练过程中,动态改变对比损失的权重,动态权衡参数β(x)定义为:
其中,i为当前迭代次数,N为总迭代次数;
模型最终的优化目标如下所示:
L=LCLS+α1LMI+α2LES+β(x)LCL
其中,α1和α2为权衡超参数。
6.根据权利要求2所述的一种域间数据标签关系未知的滚动轴承跨域故障诊断方法,其特征在于,按照下述公式计算在线网络投影特征zθ:zθ←gθ(Fθ(t(xi)))。
7.根据权利要求2所述的一种域间数据标签关系未知的滚动轴承跨域故障诊断方法,其特征在于,按照下述公式计算目标网络投影特征z′θ:z′θ←g′θ(F′θ(t′(xi)))。
8.根据权利要求2所述的一种域间数据标签关系未知的滚动轴承跨域故障诊断方法,其特征在于,按照下述公式计算自监督表征学习方法BYOL的损失LCL:
其中,qθ(zθ1)、z′θ1是交换视图后在线网络和目标网络的输出特征。
9.根据权利要求2所述的一种域间数据标签关系未知的滚动轴承跨域故障诊断方法,其特征在于,按照下述公式更新目标网络参数:θ′←τθ′+(1-τ)θ。
10.一种域间数据标签关系未知的滚动轴承跨域故障诊断系统,其特征在于,包括:
数据预处理模块,其配置成获取某工况已知标签的滚动轴承所有状态振动信号作为源域数据,将无标签的其他工况滚动轴承振动信号作为目标域数据;对源域与目标域数据作短时傅里叶变换构造二维图像数据集,作为模型输入;
对比通用域适应模型构建模块,其配置成将不同数据增强后的目标域数据输入到对比学习模块中,获得最优编码器网络;接着利用域适应模块中的熵分离策略拒绝目标域未知类样本,使用源分类器得到目标域无标签数据的伪标签,并通过源类加权机制改进的迁移语义增强方法赋予每个源类别不同的类级权重,进而对齐源域和目标域共享类的特征;构建的对比通用域适应模型包括两个模块:对比学习模块和域适应模块;其中对比学习模块用于增强模型特征提取能力,最大化相同健康状态样本间的相似性,减少分类边界附近的样本数量;域适应模块用于解决域间数据标签关系未知情况下的负迁移,并减小数据分布差异和标签差异;
状态识别模块,其配置成在多状态分类模型训练过程中,使用LARS优化算法加快模型收敛速度,并动态改变对比损失的权重;通过目标损失不断更新模型参数,根据阈值将私有健康状态样本标记为未知类,共享健康状态样本正确分类;经过多次迭代优化,建立不同工况下滚动轴承多状态识别模型;将测试数据输入至诊断模型中,获得最终故障分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311268690.4A CN117312984A (zh) | 2023-09-28 | 2023-09-28 | 一种域间数据标签关系未知的滚动轴承跨域故障诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311268690.4A CN117312984A (zh) | 2023-09-28 | 2023-09-28 | 一种域间数据标签关系未知的滚动轴承跨域故障诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117312984A true CN117312984A (zh) | 2023-12-29 |
Family
ID=89280667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311268690.4A Pending CN117312984A (zh) | 2023-09-28 | 2023-09-28 | 一种域间数据标签关系未知的滚动轴承跨域故障诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117312984A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118094367A (zh) * | 2024-04-25 | 2024-05-28 | 广东石油化工学院 | 无源领域自适应轴承故障分类方法及系统 |
CN118710400A (zh) * | 2024-08-30 | 2024-09-27 | 南京审计大学 | 一种跨平台异构信用迁移学习方法 |
CN119004044A (zh) * | 2024-10-22 | 2024-11-22 | 中国矿业大学 | 一种基于加权对抗的轴承故障诊断方法、装置及设备 |
CN119438604A (zh) * | 2025-01-09 | 2025-02-14 | 细胞生态海河实验室 | 一种基于血小板rna、蛋白及血浆细胞因子的三阴性血小板增多症的诊断试剂盒 |
-
2023
- 2023-09-28 CN CN202311268690.4A patent/CN117312984A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118094367A (zh) * | 2024-04-25 | 2024-05-28 | 广东石油化工学院 | 无源领域自适应轴承故障分类方法及系统 |
CN118094367B (zh) * | 2024-04-25 | 2024-08-13 | 广东石油化工学院 | 无源领域自适应轴承故障分类方法及系统 |
CN118710400A (zh) * | 2024-08-30 | 2024-09-27 | 南京审计大学 | 一种跨平台异构信用迁移学习方法 |
CN119004044A (zh) * | 2024-10-22 | 2024-11-22 | 中国矿业大学 | 一种基于加权对抗的轴承故障诊断方法、装置及设备 |
CN119004044B (zh) * | 2024-10-22 | 2025-02-25 | 中国矿业大学 | 一种基于加权对抗的轴承故障诊断方法、装置及设备 |
CN119438604A (zh) * | 2025-01-09 | 2025-02-14 | 细胞生态海河实验室 | 一种基于血小板rna、蛋白及血浆细胞因子的三阴性血小板增多症的诊断试剂盒 |
CN119438604B (zh) * | 2025-01-09 | 2025-04-08 | 细胞生态海河实验室 | 一种基于血小板rna、蛋白及血浆细胞因子的三阴性血小板增多症的诊断试剂盒 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117312984A (zh) | 一种域间数据标签关系未知的滚动轴承跨域故障诊断方法及系统 | |
Song et al. | An optimized CNN-BiLSTM network for bearing fault diagnosis under multiple working conditions with limited training samples | |
Yu et al. | Deep-learning-based open set fault diagnosis by extreme value theory | |
Pang et al. | Time-frequency supervised contrastive learning via pseudo-labeling: An unsupervised domain adaptation network for rolling bearing fault diagnosis under time-varying speeds | |
CN111442926B (zh) | 一种基于深层特征迁移的变负载下不同型号滚动轴承故障诊断方法 | |
Yin et al. | Research on stock trend prediction method based on optimized random forest | |
Yang et al. | Learning adaptive embedding considering incremental class | |
CN112418525B (zh) | 社交话题群体行为的预测方法、装置及计算机存储介质 | |
Wang et al. | Dialogue intent classification with character-CNN-BGRU networks | |
Kang et al. | Cross-domain fault diagnosis method for rolling bearings based on contrastive universal domain adaptation | |
CN112217787A (zh) | 一种基于ed-gan的仿冒域名训练数据生成方法及系统 | |
CN109977118A (zh) | 一种基于词嵌入技术和lstm的异常域名检测方法 | |
Zhang et al. | CNN and LSTM based encoder-decoder for anomaly detection in multivariate time series | |
Zhu et al. | Few-shot class-incremental learning with adjustable pseudo-incremental sessions for bearing fault diagnosis | |
CN116150509A (zh) | 社交媒体网络的威胁情报识别方法、系统、设备及介质 | |
Xi et al. | Robust semi-supervised learning for self-learning open-world classes | |
Liu et al. | Online multiple object tracking using confidence score‐based appearance model learning and hierarchical data association | |
Liu et al. | A novel method for diagnosis of bearing fault using hierarchical multitasks convolutional neural networks | |
CN117056902A (zh) | 物联网密码管理方法及系统 | |
Lee et al. | Induction motor bearing fault classification using deep neural network with particle swarm optimization‐extreme gradient boosting | |
Zhang et al. | Prototypical unknown-aware multiview consistency learning for open-set cross-domain remote sensing image classification | |
Jin et al. | Deep domain adversarial residual neural network for sustainable wind turbine cyber‐physical system fault diagnosis | |
Alsafari et al. | Effect of word embedding models on hate and offensive speech detection | |
Jang et al. | Teacher–explorer–student learning: A novel learning method for open set recognition | |
Lee et al. | LiteFDNet: a lightweight network for current sensor-based bearing fault diagnosis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |