CN113780230A - 一种基于不变时空注意融合网络的不平衡故障诊断方法 - Google Patents
一种基于不变时空注意融合网络的不平衡故障诊断方法 Download PDFInfo
- Publication number
- CN113780230A CN113780230A CN202111107244.6A CN202111107244A CN113780230A CN 113780230 A CN113780230 A CN 113780230A CN 202111107244 A CN202111107244 A CN 202111107244A CN 113780230 A CN113780230 A CN 113780230A
- Authority
- CN
- China
- Prior art keywords
- network
- data
- invariant
- attention
- fault diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000004927 fusion Effects 0.000 title claims abstract description 38
- 238000003745 diagnosis Methods 0.000 title claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 28
- 230000006870 function Effects 0.000 claims abstract description 20
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 238000001514 detection method Methods 0.000 claims abstract description 10
- 238000005457 optimization Methods 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000004806 packaging method and process Methods 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000002474 experimental method Methods 0.000 description 23
- 230000008569 process Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000009826 distribution Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000002679 ablation Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000007500 overflow downdraw method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000002902 bimodal effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 101150064138 MAP1 gene Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 230000009901 attention process Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000000571 coke Substances 0.000 description 1
- 238000012733 comparative method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000000155 isotopic effect Effects 0.000 description 1
- 101150077939 mapA gene Proteins 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 230000001617 migratory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明提供一种基于不变时空注意融合网络的不平衡故障诊断方法,包括以下步骤:S1、建立不平衡数据故障检测框架;S2、采集数据集并对数据进行预处理S3、将处理好的类别平衡的振动、电流数据分别输入到参数不同卷积自编码器并进行预训练;S4、将类别不平衡的振动、电流依次输入预训练CAE、卷积注意模块、长短记忆网络以获取不变时空注意特征;S5、将两个模态的不变时空注意特征拼接后输入推断网络以进行推断表示;S6、结合网格搜索寻优算法,以基于焦损失函数的联合损失训练网络,以获取最优的不变时空注意融合网络。本发明通过设计了一种不变时空注意融合网络,能够在有效地捕捉各模态时空特征注意特征的同时,解决样本类别不平衡情况下的故障诊断问题。
Description
技术领域
本发明涉及基于多模态数据融合的不平衡故障诊断方法,更具体地,涉及一种基于不变时空注意融合网络的不平衡故障诊断方法。
背景技术
近年来,数据驱动技术代替基于模型的方法被广泛应用于机械故障诊断中。基于模型的方法通常使用系统的数学模型来实现,性能太依赖于物理规则。同时,建立合适的数学模型需要专家知识,这对于复杂的工业系统来说尤其困难。因此,数据驱动的故障诊断已变得普遍。然而,数据驱动的故障诊断通常被归类为对数据质量要求较高的分类问题,数据的不确定性会干扰模型的预测性能。数据不平衡是旋转机械故障诊断的主要挑战之一,因为许多故障诊断方法无法识别少数类别的样本,从而导致错误分类。针对不平衡问题的主要解决思路目前分为数据级方法、算法级方法两种。数据级方法主要通过重采样方式来平衡数据集,但该类方法一方面可能会遗漏潜在的有用信息,另一方面还会增加网络额外的计算负担。算法级方法通过调整误分类代价成本,以使网络训练对代价成本敏感,但是这些方法的关键在于确定每个类别的成本,在实际情况中不同类别的实际错误分类成本通常很难确定。
发明内容
本发明针对以上问题提供种基于不变时空注意融合网络的不平衡故障诊断方法,旨在结合特征融合方法与算法级训练惩罚机制来解决类别不平衡问题。
为实现上述目的,本发明采用以下技术方案:
S1、建立不平衡数据故障检测框架;
S2、采集数据集并对数据进行预处理;
S3、将处理好的类别平衡的振动、电流数据分别输入到参数不同卷积自编码器(CAE)并进行预训练;
S4、将类别不平衡的振动、电流依次输入预训练CAE、卷积注意模块(CBAM)、长短记忆网络(LSTM)以获取不变时空注意特征;
S5、将两个模态的不变时空注意特征拼接后输入推断网络(MLP)以进行推断表示;
S6、结合网格搜索寻优算法,以基于焦损失函数的联合损失训练网络,以获取最优的不变时空注意融合网络。
进一步的,在步骤S1中不平衡数据故障检测框架包括依次连接的数据采集模块、预处理模块、预训练模型获取模块、不变时空注意特征获取模块、融合推断模块、网络训练模块等六个模块。
更进一步的,采集模块通过电流传感器、加速度传感器来获取电流、振动信号用于当做训练集、测试集,并将所获得的不同工况下的信号划为源域(不平衡)、目标域(平衡)数据集。
进一步的,在步骤S2中数据预处理包括数据归一化流程,将原始的振动、电流数据分别进行归一化以消除量纲影响。
更进一步的,将归一化后的包装设备振动、电流数据进行分段截取后,分段将1-D数据重组为2-D网格矩阵形式。
进一步的,在步骤S3中将处理好的类别平衡的数据集输入到不同卷积自编码中并进行训练,以获取预训练CAE模型。
进一步的,在步骤S4中将类别不平衡的目标域数据依次通过预训练CAE、卷积注意模块(CBAM)、长短记忆网络(LSTM),以获取数据的时空注意表示。
进一步的,在步骤S5中将时空注意表示拼接后输入到推断网络(MLP),获取网络推断输出。
进一步的,在步骤S6中结合网格搜索寻优算法,以基于焦损失函数的联合损失训练网络,以获取最优的不变时空注意融合网络。
本发明的有益效果为:建立了不平衡数据故障检测框;设计了一个基于焦损失的联合约束损失函数用于指导网络学习相应特征以及调节不平衡条件给训练过程带来的负面影响;通过网格搜索算法来获取网络超参数、损失函数权重参数,从而获得最优的模型。最终,本网络在不同的不平衡条件下的故障诊断性能皆取得了良好的效果。
附图说明
图1为本发明方法整体流程框架图;
图2预训练CAE模型拓扑图;
图3为卷积注意模块拓扑图;
图4为网络组件详细参数拓扑图;
图5为对比方法结构图;
图6为网络在测试集上的聚类融合效果T-SNE层次可视化图;
图7为网络在测试集上的不同方法的混淆矩阵图;
图8为网络在不同不平衡率数据集下的性能比较图之一;
图9为网络在不同不平衡率数据集下的性能比较图之二;
具体实施方式
为便于理解本发明,下面给出了本发明较佳的实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
除非另有定义,本文中所使用的所有的技术和科学术语与本发明的技术领域的技术人员通常理解的含义相同。说明书中所使用的术语只是为了描述具体的实施目的,不是旨在于限制本发明。
一种基于不变时空注意融合网络的不平衡故障诊断方法:
S1、建立不平衡数据故障检测框架。
如图1所示,不平衡数据故障检测框架包括依次连接的数据采集模块、预处理模块、预训练模型获取、不变时空注意特征获取、融合推断、网络训练。机械设备数据采集模块中通过加速度感器、电流传感器来获取训练、测试数据集,并将所获得的不同工况下的信号划为源域(不平衡)、目标域(平衡)数据集。
S2、采集数据集并对数据进行预处理。
数据预处理包括数据归一化和将1-D数据转换为2-D网格矩阵的数据升维流程。具体流程为先将输入数据进行归一化处理以消除不同数据间量纲差异造成的影响;再将归一化后的数据进行数据重新排列从1-D升到2-D,为卷积输入做准备。
S3、将处理好的类别平衡的振动、电流数据分别输入到参数不同卷积自编码器(CAE)并进行预训练。
将经过步骤S2中处理的平衡条件下的振动、电流数据输入到两个参数不共享的卷积自编码器中进行预训练,预训练模型的结构拓扑图如图2所示。
S4、将目标域中类别不平衡的振动、电流依次输入预训练CAE、卷积注意模块(CBAM)、长短记忆网络(LSTM)以获取不变时空注意特征。
首先,在学得平衡样本分布后,将不平衡的振动信号(xv)、电流信号(xc)输入网络进行微调以获取数据底层特征,其过程为编码-解码过程,表示如下:
为了获取数据的空间和通道特征,将m模态预训练CAE模型的编码表示hm输入到卷积注意快中,表示如下:
式中:Attm、CBAMm、分别表示m模态的通道-空间注意力表示、卷积块注意力网络及其网络参数。其中,CBAM是一种简单而有效的前馈卷积神经网络注意模块,其定义如图3所示,给定一个中间特征映射作为输入,该模块沿着两个独立的维度(通道和空间)按顺序推断注意映射,整个注意过程概括如下:
式中:表示同位素乘法;CBAM为卷积块注意模块;F'表示通道注意力映射;F″表示最终通道-空间注意力映射;Mc∈RC×1×1表示1D通道注意映射;Ms∈R1×H×W表示2D空间注意映射;MLP表示多层感知机映射表示;AvgPool为平均池化操作;MaxPool为最大池化操作;f7×7表示滤波器大小为7×7的卷及操作;σ2为Sigmoid激活函数。
然后,为了获取时间特性,将注意力表示导入LSTM网络以获取时间特性,表示如下:
S5、将两个模态的不变时空注意特征拼接后输入推断网络(MLP)以进行推断表示。
为了获取融合表示,先将两个模态时空注意表示拼接,过程如下:
Inf=MLP(Fusion;θMLP) (7)
式中:Inf为推断表示结果;θMLP为推断网络参数;MLP为由Leaky Relu和Tanh激活的多层感知机。
S6、结合网格搜索寻优算法,以基于焦损失函数的联合损失训练网络,以获取最优的不变时空注意融合网络。
所提方法的对于不平衡问题的解决主要体现在损失函数中,因此基于焦损失的联合损失函数的表示如下:
式中:β、λ、η、δ为损失函数调控因子,用于调节各损失的贡献,网络以最小化以上损失函数为目的进行训练。其中Ltask、Lsim、Ltrip分别为焦损失、重构损失、相似性损失、三元组损失,其定义分别如下:
焦损失通过在交叉熵损失上添加调剂因子,能够自适应地调节不同样本量的影响,其计算公式如下:
Lfocal(P)=-α(1-P)γlog(P) (9)
式中:P表示样本属于正确类别的概率;α表示权重因子;(1-P)γ表示调剂因子,γ为可调聚焦参数。此外,P=Inf为推断网络输出,α=0.25和γ=2。
重构损失旨在最小化输入数据和重构数据的距离,用于对预训练CAE模型进行微调训练。此外,在学习中添加重构损失能够促使网络学习琐碎表示(无法全面地学习输入特征)和起到抑制输入噪声的作用。实验采用均方差函数作为重构损失,其计算公式如下:
由于网络仅在MLP层对各模态数据进行拼接融合无法有效地探索模态之间的交互关系以及模态间的不变性特征。因此,为了获取更全面的融合表示,发明在两个模态时空注意表示间添加了相似性约束来帮助网络捕获不变时空注意表示。中心矩偏差(CMD)度量通过匹配高阶矩差异来测量两个分布的距离,具有计算简洁高效地特点,能够减少网络的计算成本。因此,发明引入CMD来作为相似性损失,定义如下:
设X和Y是有界随机样本,在紧密区间[a,b]N上具有各自的概率分布p和q,则中心距偏差正则化器CMDK被定义为CMD度量的经验估计如下:
其中Ck和E(X)表示如下:
式中:E(X)为样本X的经验期望向量,Ck(X)是所有k阶样本中心矩在X坐标下的向量。发明采用的CMD相似性损失如下:
Lsim=CMDK(Mv,Mc) (13)
在对不变时空注意表示进行融合之前,为了保证两者之间相似性的高等级关系,发明通过添加三元组边界约束(Ltrip)来最小化来自不同模态的所有语义(类别)相似样本表示之间的距离,同时最大化不相似表示的距离。对于振动模态,建立一个三元组表示其中电流表示在语义上与振动表示Mv正相关,与此同时电流是与Mv负相关。则以振动模态为锚点的三元组边界损失如下所示:
同理,以电流模态为锚点的三元组边界损失如下:
结合公式(14-15),总的三重边界损失如下:
实验分析:
为了验证该模型的检测精度和检测效果,本实验是通过python代码得到实现的,实验的设备为:(1)处理器(AMD Ryzen 5 2600X Six-Core Processor,3.60GHz);(2)运行内存(16G);(3)显卡(NVIDIA GeForce GTX 1660,6G);(4)代码操作环境(Pytorch=1.2.0,Python=3.7.9)。
实验采用电机轴承测试数据,具体采用的数据为:在两种不同运行条件下(目标域:转速N=900rpm、负载转矩T=0.7Nm、径向力F=1000N;源域:转速N=1500rpm、负载转矩T=0.1Nm、径向力F=1000N),设备在分别装配5种不同健康状态的轴承时所测得的振动、电流信号数据,如表1所示。表中,每种运行条件(转速、转矩、径向力)包括20个传感器收集的文件,发明从中选择其中之一。此外,在每个数据文件中提取160000(400×400)个数据用于实验(其中400个数据点为一个样本,共有400个样本),并以3:1的比例划分训练、测试集。
表1.数据集参数
此外,针对不平衡问题,实验所设置实验所用的数据分布如表2所示。其中,展示了不同不平衡率下各数据类别的样本取用数量。需要注意的是,在数据预处理部分需要对数据进行归一化处理时,为了更符合振动和电流数据的特点,需要将数据映射到[-1,1]的区间。此外,本实验使用网格搜索算法来解决网络超参数选择问题。在执行网格搜索时,实验从以下超参数有限选项集里选取最优参数:β∈{0.6,0.7,0.8,0.9,1.0}、λ∈{0.1,0.2,0.3,0.4,0.5}、η∈{0.5,0.6,0.7,0.8,0.9,1.0}、δ∈{0.01,0.1,0.2,0.3}、K∈{1,2,3,4,5}、lstm dim∈{32,50,64}、mlp dim∈{128,256,512,1024}。
其中,β、λ、η、δ为损失函数调剂因子,K为CMD中阶数大小,lstm dim为LSTM隐层维度,mlp dim为多层感知机维度。经网格搜索后保存最优模型并返回对应超参数分别为:β=0.7、λ=0.1、η=1.0、δ=0.1、K=3、lstm dim=64、mlpdim=128。
表2.实验数据分布
在迭代训练过程中,将优化器、学习率、随机种子、Epoch、Batch size,分别设置为Adam、0.01、123、300、100。此外,除了以上关键超参数,实验所用网络组件的结构细节如图4所示。
为了验证本发明的有效性,实验针对不同类别比的不平衡样本分别设计了基于卷积神经网络(CNN)、卷积自编码神经网络(CAE)、卷积长短记忆网络(CNN+LSTM)的单模态(振动或者电流)故障诊断模型和基于卷积融合神经网络(CNN-Fusion)、卷积自编码融合神经网络(CAE-Fusion)的双模态融合模型,用于与所提模型进行对比。实验所用对比模型拓扑结构如图5所示,其中卷积层、MLP的参数与所提网络一致。此外,对比实验结果可见表3、4所示。
表3实验结果I
表4实验结果II
在表3、4中前三种单模态的方法的结果中,左为振动、右为电流。根据其结果可知,在传统的深度学习模型中振动信号的故障特征要明显于电流信号,这与实际情况相符合。此外,相较于CNN模型,CNN-LSTM模型在不同不平衡条件下具更好的性能,这是LSTM的记忆功能和网络深度加深共同带来的效果。表中后三者皆为双模态融合的方法,与前三种单模态方法相比,可以清晰地观察到结合电压和电流模态的融合模型在诊断性能上具有显著的提升,这意味着通过使用特征融合的方法来丰富信息能够有效提高网络的置信度和性能。值得注意的是,本发明所提方法在以上实验中取得了最优性能,这是可能与该方法在特征表示过程考虑了其时空特性以及采用了合理的约束学习策略有关。因此,为了进一步验证和分析所提方法的性能以及合理性,将对提网络的过程表示进行可视化分析并对网络结构和损失函数进行消融研究。
实验结合T-SNE、混淆矩阵等可视化方法来验证本发明所提方法的合理性和有效性。为了减少工作量,实验以具有代表性的不平衡数据集(不平衡比例为10:5:4:3:2)进行实验,对网络的特征表示过程进行T-SNE可视化分析。如图6所示,图中5个图形分别为原始输入、编码表示、时空注意表示、多层感知机融合表示、最终推断表示的语义特征分布图。每个图中不同颜色的点代表不同类型的样本,且同种颜色的点之间距离越小,不同颜色的点之间距离越大则表示网络性能越好。观察图示7可知,样本聚类的效果根据网络模块递进的顺序提升。由此可见,本发明所提网络在执行不平衡条件下的故障诊断任务时,其过程是合理性的。然后,为了进一步验证网络的分类性能的优越性,将对比实验中的CNN-LSTM(振动模态)、CNN-Fusion、CAE-Fusion和本发明所提方法的结果用于混淆矩阵可视化,如图7所示。
由混淆矩阵的结果可以看出,故障类型4和5相较于其他故障类型更难判断,并且本发明所提方法在每种故障类型的分类结果上都取得了最佳效果。此外,混淆矩阵总的分类结果与相同不平衡条件下(10:5:4:3:2)对比实验结果一致,本发明方法同样取得了最优性能。这不但验证了对比实验结果的真实性,也说明了所提模型在分类性能上相较于传统深度学习模型也具有优越性。
在实验中对所提网络的表示过程进行了可视化并且还对通过混淆矩阵验证了网络的分类性能,但对于模型本身的设计来说缺乏用于评估的量化指标。因此,实验还针对模型的结构设计和学习策略进行了消融研究实验,并以网络推断精度作为用于评估的量化指标(不平衡比:10:5:4:3:2),实验结果如表5所示:
表5消融研究实验结果
观察表6中损失函数研究结果可知,损失函数对网络影响的程度按照顺序排列为:Focal loss、Similirity loss、Recon loss、Triplet loss。其中,网络对Focal loss最敏感的原因为:Focal loss作为任务损失对网络的结果起着决定性的作用,并且其惩罚机制能够有效地抑制不平衡问题;Similirity loss对网络也具有比较大的影响,这是因为在执行融合任务前使用该损失获取两个模态间的模态不变性(即获取模态间的交互信息)能够在减少网络计算负担的同时获得更全面的故障特征信息;Recon loss对网络的影响相对较小,这是由在没有该损失情况下任务损失已经能较好地学习琐碎表示所造成;Triple loss作用最小的原因是融合操作和Similirity loss皆能起到该损失的聚类效果,因此该损失的作用被弱化。此外,从网络结构消融的结果来看,预训练模型、CBAM、LSTM、MLP模块的缺失都会给网络带了负面影响,这表示迁移学习、时空注意机制、融合操作皆对网络有效且具有积极影响。
此外,为了验证本发明所提方法的泛化能力,除了使用伯德大学轴承数据,实验还引入西安交通大学轴承数据(XJTU-SY)、西储大学轴承数据(CWRU)来进行测试。其中,伯德大学数据为实验部分目标域数据集中两个不同传感器的振动信号;西交数据包括外圈、内圈、内圈+外圈、保持架、内圈+滚动体+保持架等五类故障的振动信号;西储大学数据包括不同故障直径下的滚珠1(故障直径=0.007英寸)、滚珠2(故障直径=0.014英寸)、内圈(0.007英寸)、外圈(0.007英寸)故障和正常数据等五种类型的振动数据。测试结果如图8、9所示,可以看出本发明所提模型在不同不平衡条件下,依然能够在不同的数据集上取得不错的表现,这也证明了模型具有良好的泛化性能。
本发明所述的实施例仅仅是对本发明的优选实施方式进行的描述,并非对本发明构思和范围进行限定,在不脱离本发明设计思想的前提下,本领域中技术人员对本发明的技术方案作出的各种变型和改进,均应落入本发明的保护范围,本发明请求保护的技术内容,已经全部记载在权利要求书中。
Claims (9)
1.一种基于不变时空注意融合网络的不平衡故障诊断方法,其特征在于包括以下步骤:
S1、建立不平衡数据故障检测框架;
S2、采集数据集并对数据进行预处理;
S3、将处理好的类别平衡的振动、电流数据分别输入到参数不同卷积自编码器并进行预训练;
S4、将类别不平衡的振动、电流依次输入预训练CAE、卷积注意模块、长短记忆网络以获取不变时空注意特征;
S5、将两个模态的不变时空注意特征拼接后输入推断网络以进行推断表示;
S6、结合网格搜索寻优算法,以基于焦损失函数的联合损失训练网络,以获取最优的不变时空注意融合网络。
2.根据权利要求1所述的一种基于不变时空注意融合网络的不平衡故障诊断方法,其特征在于,在步骤S1中不平衡数据故障检测框架包括依次连接的数据采集模块、预处理模块、预训练模型获取模块、不变时空注意特征获取模块、融合推断模块和网络训练模块。
3.根据权利要求2所述的一种基于不变时空注意融合网络的不平衡故障诊断方法,其特征在于,数据采集模块通过电流传感器、加速度传感器来获取电流、振动信号,并将所获得的不同工况下的信号划为源域、目标域数据集。
4.根据权利要求1所述的一种基于不变时空注意融合网络的不平衡故障诊断方法,其特征在于,在步骤S2中数据预处理包括数据归一化流程,将原始的振动、电流数据分别进行归一化以消除量纲影响。
5.根据权利要求4所述的一种基于不变时空注意融合网络的不平衡故障诊断方法,其特征在于,将归一化后的包装设备振动、电流数据进行分段截取后,分段将1-D数据重组为2-D网格矩阵形式。
6.根据权利要求1所述的一种基于不变时空注意融合网络的不平衡故障诊断方法,其特征在于,在步骤S3中将处理好的类别平衡的数据集输入到不同卷积自编码中并进行训练,以获取预训练CAE模型。
7.根据权利要求1所述的一种基于不变时空注意融合网络的不平衡故障诊断方法,其特征在于,在步骤S4中将类别不平衡的目标域数据依次通过预训练CAE、卷积注意模块、长短记忆网络,以获取数据的时空注意表示。
8.根据权利要求1所述的一种基于不变时空注意融合网络的不平衡故障诊断方法,其特征在于,在步骤S5中将时空注意表示拼接后输入到推断网络,获取网络推断输出。
9.根据权利要求1所述的一种基于不变时空注意融合网络的不平衡故障诊断方法,其特征在于,在步骤S6中结合网格搜索寻优算法,以基于焦损失函数的联合损失训练网络,以获取最优的不变时空注意融合网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111107244.6A CN113780230B (zh) | 2021-09-22 | 2021-09-22 | 一种基于不变时空注意融合网络的不平衡故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111107244.6A CN113780230B (zh) | 2021-09-22 | 2021-09-22 | 一种基于不变时空注意融合网络的不平衡故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113780230A true CN113780230A (zh) | 2021-12-10 |
CN113780230B CN113780230B (zh) | 2024-08-23 |
Family
ID=78852723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111107244.6A Active CN113780230B (zh) | 2021-09-22 | 2021-09-22 | 一种基于不变时空注意融合网络的不平衡故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113780230B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114511521A (zh) * | 2022-01-21 | 2022-05-17 | 浙江大学 | 基于多重表示与多重子域自适应的轮胎瑕疵检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111339908A (zh) * | 2020-02-24 | 2020-06-26 | 青岛科技大学 | 基于多模态信息融合与决策优化的组群行为识别方法 |
US20210190882A1 (en) * | 2019-12-10 | 2021-06-24 | Wuhan University | Transformer failure identification and location diagnosis method based on multi-stage transfer learning |
-
2021
- 2021-09-22 CN CN202111107244.6A patent/CN113780230B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210190882A1 (en) * | 2019-12-10 | 2021-06-24 | Wuhan University | Transformer failure identification and location diagnosis method based on multi-stage transfer learning |
CN111339908A (zh) * | 2020-02-24 | 2020-06-26 | 青岛科技大学 | 基于多模态信息融合与决策优化的组群行为识别方法 |
Non-Patent Citations (2)
Title |
---|
刘嘉莹;张孙杰;: "融合视频时空域运动信息的3D CNN人体行为识别", 电子测量技术, no. 07, 8 April 2018 (2018-04-08) * |
刘建华;欧阳萍;刘戈灵;钟泽辉;曾凡齐;袁子钧: "基于图像处理的多视觉特征融合方法及其应用", 湖南工业大学学报, no. 06, 30 November 2020 (2020-11-30) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114511521A (zh) * | 2022-01-21 | 2022-05-17 | 浙江大学 | 基于多重表示与多重子域自适应的轮胎瑕疵检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113780230B (zh) | 2024-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022077901A1 (zh) | 一种面向小样本数据集的轴承故障模式诊断方法及系统 | |
CN112418277B (zh) | 旋转机械零部件剩余寿命预测方法、系统、介质、设备 | |
Li et al. | Unsupervised rotating machinery fault diagnosis method based on integrated SAE–DBN and a binary processor | |
CN111046945A (zh) | 基于组合卷积神经网络的故障类型及损坏程度诊断方法 | |
CN114358124B (zh) | 基于深度对抗卷积神经网络的旋转机械新故障诊断方法 | |
CN112308147A (zh) | 基于多源域锚适配器集成迁移的旋转机械故障诊断方法 | |
CN114429152A (zh) | 基于动态指数对抗性自适应的滚动轴承故障诊断方法 | |
CN111881627A (zh) | 一种核动力装置故障诊断方法和系统 | |
CN111899905A (zh) | 一种基于核动力装置的故障诊断方法及系统 | |
CN110110809A (zh) | 基于机器故障诊断的模糊自动机的构建方法 | |
CN115859077A (zh) | 一种变工况下多特征融合的电机小样本故障诊断方法 | |
CN114091504A (zh) | 一种基于生成对抗网络的旋转机械小样本故障诊断方法 | |
CN115791174B (zh) | 一种滚动轴承异常诊断方法、系统、电子设备及存储介质 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN112699597A (zh) | 一种核电启动水泵滚动轴承故障检测方法及系统 | |
CN117113170A (zh) | 一种基于多尺度信息融合的轻量化旋转机械故障诊断方法 | |
CN113780230A (zh) | 一种基于不变时空注意融合网络的不平衡故障诊断方法 | |
Li et al. | Incrementally contrastive learning of homologous and interclass features for the fault diagnosis of rolling element bearings | |
CN114459760A (zh) | 一种强噪声环境下的滚动轴承故障诊断方法及系统 | |
Sun et al. | Physics-inspired multimodal machine learning for adaptive correlation fusion based rotating machinery fault diagnosis | |
CN111783941B (zh) | 一种基于概率置信度卷积神经网络的机械设备诊断分类方法 | |
CN114383846B (zh) | 基于故障标签信息向量的轴承复合故障诊断方法 | |
CN114239402A (zh) | 基于优化胶囊网络的核动力循环水泵故障诊断方法及系统 | |
Li et al. | Deep learning based end-to-end rolling bearing fault diagnosis | |
Shang et al. | Multi-view feature fusion fault diagnosis method based on an improved temporal convolutional network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |