CN117475191A - 一种特征对齐域对抗神经网络的轴承故障诊断方法 - Google Patents
一种特征对齐域对抗神经网络的轴承故障诊断方法 Download PDFInfo
- Publication number
- CN117475191A CN117475191A CN202310791257.2A CN202310791257A CN117475191A CN 117475191 A CN117475191 A CN 117475191A CN 202310791257 A CN202310791257 A CN 202310791257A CN 117475191 A CN117475191 A CN 117475191A
- Authority
- CN
- China
- Prior art keywords
- sample
- domain
- model
- feature
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 36
- 238000003745 diagnosis Methods 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000003042 antagnostic effect Effects 0.000 title claims description 17
- 238000009826 distribution Methods 0.000 claims abstract description 24
- 230000007246 mechanism Effects 0.000 claims abstract description 16
- 238000005096 rolling process Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 33
- 238000011176 pooling Methods 0.000 claims description 28
- 238000000605 extraction Methods 0.000 claims description 25
- 238000005070 sampling Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000008014 freezing Effects 0.000 claims description 3
- 238000007710 freezing Methods 0.000 claims description 3
- 230000001172 regenerating effect Effects 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Complex Calculations (AREA)
Abstract
一种特征对齐域对抗神经网络故障诊断方法,步骤如下:(1)信号采集;(2)数据扩充;(3)特征学习;(4)故障分类。改进特征对齐生成对抗网络构建真实数据与生成数据的最大均值差异机制,以卷积模块代替全连接模块,以实现对不平衡数据的扩充,可以满足域对抗神经网络DANN中源域与目标域数量平衡需求。DANN领域判别器对齐域间特征分布的同时会弱化特征提取器提取到的域内分类特征,为了使DANN标签分类器分类更准确,建立多尺度注意力机制筛选出重要故障相关信息,提取域判别不变下分类相关特征,并构建熵最小标签分类器,提高模型泛化能力。改进的域对抗神经网络可以更好的识别目标域样本的故障类别,完成滚动轴承不平衡样本下的故障识别。
Description
技术领域
本发明涉及一种特征对齐域对抗神经网络故障诊断方法,属于故障诊断领域。
背景技术
滚动轴承作为大型旋转机械设备中至关重要的零件之一,一旦发生故障将对机械运行造成严重威胁,更会危害人身财产安全。因此对滚动轴承的振动信号进行合理分析,可以提前预警机械故障,减少安全隐患。轴承智能故障诊断模型通常需要充足的带标签样本进行训练,但在实际生产过程中,工业设备通常处于正常状态下运行。很难提前采集充足的轴承故障信号用于设备诊断,同时收集的故障数据类别间比例也不一致,导致难以对滚动轴承进行故障诊断,发生故障时可能导致严重生产损失和高昂研究费用。为解决收集样本存在不平衡的问题,生成对抗网络Generative Adversarial Networks,GAN是扩充样本至平衡状态的优秀措施,受到广大学者的青睐。而应对真实样本稀缺导致故障诊断准确率较低的问题,域对
抗神经网络Domain Adversarial Neural Networks,DANN由于具有弱化特征提取器提取到的域内分类特征,提取域判别不变下分类相关特征的能力,是识别目标域样本的故障类别,完成滚动轴承不平衡样本下的故障识别的重要方法之一。
发明内容
本发明创造提供本发明提供本发明涉及一种特征对齐域对抗神经网络故障诊断方法,解决现有技术中存在的智能故障诊断未能解决采集充足的轴承故障信号和已有故障数据类别间比例不一致问题,导致深层特征挖掘不充分,精度低的问题。
本发明是通过以下技术方案实现的:一种特征对齐域对抗神经网络故障诊断方法,步骤如下:
1)信号采集:利用传感器收集滚动轴承的原始一维振动信号,选取数字信号的采样频率为5000Hz的轴承数据。
2)数据扩充:提出特征对齐的生成对抗模型,特征对齐的生成对抗网络分为两个部分:一个是生成器G,一个是判别器D;随机噪声通过生成器的反卷积操作生成样本,将低维噪声上采样为与真实样本维度相同的生成样本,随后将生成样本与真实样本混合输入至判别器中进行训练,输入数据通过判别器的卷积操作提取样本特征,通过最大均值差异衡量真实样本与生成样本间特征分布差异,减少特征分布间距离损失,反向更新参数,指导生成器生成符合真实样本特征分布的生成样本;
具体方法如下:
特征对齐的生成对抗模型由三部分组成,分别是生成器G、判别器D和最终损失函数Loss;其中Loss分为三个部分,极小化生成器损失函数极大化判别器损失函数以及特征分布最大均值差异损失函数/>具体流程如下:
2.1)对目标域真实样本进行滑动窗口采样,样本大小为1024,为模拟不平衡样本输入,每类故障样本随机选取不同个数样本作为输入;
2.2)将大小为100维且服从正态分布的高斯噪声输入改进GAN的生成器中进行上采样,输出大小为1024的生成样本;
2.3)设置生成样本标签为1,真实样本标签为0;
2.4)固定生成器参数,将真实样本和生成样本混合送入判别器中,训练判别器;
2.5)固定判别器参数,将混合样本送入模型中,计算生成样本与真实样本特征间最大均值差异和判别结果,反向更新生成器参数;生成的最大均值差异可由公式(1)所示:
其中,fi s表示源域数据,fi t表示目标域数据,表示极小化生成器损失函数,/>表示极大化判别器损失函数;
2.6)固定生成器参数,重新生成样本,设置生成样本标签为0,训练判别器;
2.7)循环迭代训练模型,保存生成样本作为扩充数据。
3)特征学习:通过改进特征对齐的生成对抗模型、改进域对抗神经网络组成的旋转机械故障诊断模型进行深层特征学习。
4)轴承故障诊断:
4.1)随机取10个带标签目标域样本,同为一个类别,与随机变量生成样本等量混合;其中生成样本标签为1,真实样本标签为0;
4.2)混合样本输入判别器进行训练;
4.3)冻结判别器权重,混合样本输入模型中训练生成器,计算生成样本和真实样本特征之间最大均值差异,最小化特征间重建距离损失;
4.4)设置生成样本标签为0,输入模型训练生成器;
4.5)从训练好的模型中取出适量样本充当目标域样本;
4.6)源域样本、扩充后带标签目标域样本以及真实带标签目标域样本混合成训练集,输入改进域对抗神经网络IDANN中进行训练;
改进域对抗神经网络IDANN由三个部分组成,分别是特征提取器、标签分类器以及领域判别器;
特征提取器:通过构建多尺度注意力机制模块,提取领域判别不变下的分类相关特征;首先输入数据经特征提取模块得到输出特征,每个特征提取模块包括卷积层,注意力机制模块以及池化层组成,源域Ds和目标域Dt样本作为输入数据首先进行卷积操作,如式(2)所示:
其中,代表上一层的输出,/>代表当前输出,N代表卷积核数目,k代表卷积核,卷积核大小为3,b代表偏差,f(·)代表ReLU激活函数;
卷积提取特征后进行全局平均池化,如式(3)所示:
其中,x代表输入数据,m代表第m个通道,n代表该通道中的一个数据点,w代表当前通道样本数,vm代表经全局平均池化计算得到的通道权重值;
池化后得到通道权重值经两层1*1卷积操作,得到最终的通道注意力权重v,对输入数据进行调整,并增加残差连接结构,得到输出特征;如式(4)所示:
其中,d代表通道维数,代表上一层输出,/>代表当前输出,v代表通道注意力权重;
输出特征经最大池化计算后,输入到下一个特征提取模块;如式(5)所示:
其中,w为池化区域大小3,为最大池化后输出值,/>为上一层输出特征;
输入数据经过三个特征提取模块得到最终输出特征,通过特征提取模块计算获得每个通道的重要程度,为每个特征赋予一个权重值,让模型重点关注特征通道,抑制不重要的特征通道,提高模型的分类准确率;
标签分类器:最小化熵损失能够提高目标域样本分类自信程度,通过最小化熵损失训练模型标签分类器,使得目标域样本熵值达到最小;熵最小化技术让模型的决策边界远离边缘数据,提高模型分类器的自信程度,熵最小化如式(6)所示:
其中,代表目标域中第i个样本,N代表样本数,G(·)代表特征提取器,C(·)代表分类器;
输入数据经特征提取器G提取特征,输入到分类器C中,通过softmax函数计算该样本预测为每个类别的概率,计算熵值后进行累加得到我们最终目标函数;熵值越小,分类器的自信程度越高,更好的刻画目标域数据内不同类别样本的决策边界,提高模型泛化能力;
4.7)最小化分类损失、域分类损失以及目标域熵损失;
基于带注意力机制特征提取器及基于熵最小化标签分类器的原理及具体实现过程,设计一种改进域对抗神经网络,模型优化目标函数发生变化,最小熵损失函数应用于目标域样本,提高模型泛化能力,改进DANN总体损失由式(4.6)表示:
LDANN=Lc(Ds,ys)+Lc(DT,yT)+Len(DT,yT)+λLd(Ds,DT) (7)
其中,Lc(Ds,ys)为源域数据域内分类损失,Lc(DT,yT)为目标域数据域内分类损失,Len(DT,yT)为目标域数据最小熵损失,Ld(Ds,DT)为两域数据域间分类损失,λ为领域判别损失的权重系数;
4.8)保存训练好的网络模型;
4.9)利用目标域无标签样本进行测试,输出最终故障识别结果。
本发明创造的有益效果为:
发明主要设计并实现一种注意力降噪的残差时间卷积故障诊断方法,针对在实际工况中震动信号中存在噪声这一问题,设计一种自注意力机制以获取输入数据的注意力权重,通过注意力值为每个信号特征生成特定的阈值,再经软阈值化操作消除无关冗余信息,以达到降噪效果。设计批归一化方法加入到时间卷积网络中,进一步优化模型的特征提取能力。使用设计的方法在制作的数据集上进行实验,验证所设计方法的抗噪性和有效性。
附图说明
图1是整体流程图;
图2是注意力降噪的残差时间卷积网络的模型图;
图3是不同信噪比数据集下的准确率对比图;
图4是不同信噪比数据集下的损失值对比图。
图5是模型诊断精度图。
具体实施方式
一种特征对齐域对抗神经网络故障诊断方法,其步骤为:
1)信号采集:利用传感器收集滚动轴承的原始一维振动信号,选取数字信号的采样频率为5000Hz的轴承数据。
2)数据扩充:提出特征对齐的生成对抗模型,特征对齐的生成对抗网络分为两个部分:一个是生成器G,一个是判别器D;随机噪声通过生成器的反卷积操作生成样本,将低维噪声上采样为与真实样本维度相同的生成样本,随后将生成样本与真实样本混合输入至判别器中进行训练,输入数据通过判别器的卷积操作提取样本特征,通过最大均值差异衡量真实样本与生成样本间特征分布差异,减少特征分布间距离损失,反向更新参数,指导生成器生成符合真实样本特征分布的生成样本;
具体方法如下:
特征对齐的生成对抗模型由三部分组成,分别是生成器G、判别器D和最终损失函数Loss;其中Loss分为三个部分,极小化生成器损失函数极大化判别器损失函数以及特征分布最大均值差异损失函数/>具体流程如下:
2.1)对目标域真实样本进行滑动窗口采样,样本大小为1024,为模拟不平衡样本输入,每类故障样本随机选取不同个数样本作为输入;
2.2)将大小为100维且服从正态分布的高斯噪声输入改进GAN的生成器中进行上采样,输出大小为1024的生成样本;
2.3)设置生成样本标签为1,真实样本标签为0;
2.4)固定生成器参数,将真实样本和生成样本混合送入判别器中,训练判别器;
2.5)固定判别器参数,将混合样本送入模型中,计算生成样本与真实样本特征间最大均值差异和判别结果,反向更新生成器参数;生成的最大均值差异可由公式(1)所示:
其中,fi s表示源域数据,fi t表示目标域数据,表示极小化生成器损失函数,表示极大化判别器损失函数;
2.6)固定生成器参数,重新生成样本,设置生成样本标签为0,训练判别器;
2.7)循环迭代训练模型,保存生成样本作为扩充数据。
3)特征学习:通过改进特征对齐的生成对抗模型、改进域对抗神经网络组成的旋转机械故障诊断模型进行深层特征学习。
4)轴承故障诊断:
4.1)随机取10个带标签目标域样本,同为一个类别,与随机变量生成样本等量混合;其中生成样本标签为1,真实样本标签为0;
4.2)混合样本输入判别器进行训练;
4.3)冻结判别器权重,混合样本输入模型中训练生成器,计算生成样本和真实样本特征之间最大均值差异,最小化特征间重建距离损失;
4.4)设置生成样本标签为0,输入模型训练生成器;
4.5)从训练好的模型中取出适量样本充当目标域样本;
4.6)源域样本、扩充后带标签目标域样本以及真实带标签目标域样本混合成训练集,输入改进域对抗神经网络IDANN中进行训练;
改进域对抗神经网络IDANN由三个部分组成,分别是特征提取器、标签分类器以及领域判别器;
特征提取器:通过构建多尺度注意力机制模块,提取领域判别不变下的分类相关特征;首先输入数据经特征提取模块得到输出特征,每个特征提取模块包括卷积层,注意力机制模块以及池化层组成,源域Ds和目标域Dt样本作为输入数据首先进行卷积操作,如式(2)所示:
其中,代表上一层的输出,/>代表当前输出,N代表卷积核数目,k代表卷积核,卷积核大小为3,b代表偏差,f(·)代表ReLU激活函数;
卷积提取特征后进行全局平均池化,如式(3)所示:
其中,x代表输入数据,m代表第m个通道,n代表该通道中的一个数据点,w代表当前通道样本数,vm代表经全局平均池化计算得到的通道权重值;
池化后得到通道权重值经两层1*1卷积操作,得到最终的通道注意力权重v,对输入数据进行调整,并增加残差连接结构,得到输出特征;如式(4)所示:
其中,d代表通道维数,代表上一层输出,/>代表当前输出,v代表通道注意力权重;
输出特征经最大池化计算后,输入到下一个特征提取模块;如式(5)所示:
其中,w为池化区域大小3,为最大池化后输出值,/>为上一层输出特征;
输入数据经过三个特征提取模块得到最终输出特征,通过特征提取模块计算获得每个通道的重要程度,为每个特征赋予一个权重值,让模型重点关注特征通道,抑制不重要的特征通道,提高模型的分类准确率;
标签分类器:最小化熵损失能够提高目标域样本分类自信程度,通过最小化熵损失训练模型标签分类器,使得目标域样本熵值达到最小;熵最小化技术让模型的决策边界远离边缘数据,提高模型分类器的自信程度,熵最小化如式(6)所示:
其中,代表目标域中第i个样本,N代表样本数,G(·)代表特征提取器,C(·)代表分类器;
输入数据经特征提取器G提取特征,输入到分类器C中,通过softmax函数计算该样本预测为每个类别的概率,计算熵值后进行累加得到我们最终目标函数;熵值越小,分类器的自信程度越高,更好的刻画目标域数据内不同类别样本的决策边界,提高模型泛化能力;
4.7)最小化分类损失、域分类损失以及目标域熵损失;
基于带注意力机制特征提取器及基于熵最小化标签分类器的原理及具体实现过程,设计一种改进域对抗神经网络,模型优化目标函数发生变化,最小熵损失函数应用于目标域样本,提高模型泛化能力,改进DANN总体损失由式(4.6)表示:
LDANN=Lc(Ds,ys)+Lc(DT,yT)+Len(DT,yT)+λLd(Ds,DT) (7)
其中,Lc(Ds,ys)为源域数据域内分类损失,Lc(DT,yT)为目标域数据域内分类损失,Len(DT,yT)为目标域数据最小熵损失,Ld(Ds,DT)为两域数据域间分类损失,λ为领域判别损失的权重系数;
4.8)保存训练好的网络模型;
4.9)利用目标域无标签样本进行测试,输出最终故障识别结果。
实施例1:
一、本发明方案的理论依据:
1、数据扩充
提出特征对齐的生成对抗模型,特征对齐的生成对抗网络可以分为两个部分:一个是生成器G,一个是判别器D。随机噪声通过生成器的反卷积操作生成样本,将低维噪声上采样为与真实样本维度相同的生成样本,随后将生成样本与真实样本混合输入至判别器中进行训练,输入数据通过判别器的卷积操作提取样本特征,通过最大均值差异衡量真实样本与生成样本间特征分布差异,减少特征分布间距离损失,反向更新参数,指导生成器生成符合真实样本特征分布的生成样本,数据扩充获得最大均值差异可由公式(1)所示:
其中,fi s表示源域数据,fi t表示目标域数据。表示极小化生成器损失函数,表示极大化判别器损失函数。
2、改进域对抗神经网络IDANN
IDNAA由三个部分组成,分别是特征提取器、标签分类器以及领域判别器。
特征提取器:通过构建多尺度注意力机制模块,提取领域判别不变下的分类相关特征。首先输入数据经特征提取模块得到输出特征,每个特征提取模块包括卷积层,注意力机制模块以及池化层组成。源域Ds和目标域Dt样本作为输入数据首先进行卷积操作,如式(2)所示:
其中,代表上一层的输出,/>代表当前输出,N代表卷积核数目,K代表卷积核,卷积核大小为3,b代表偏差,f(·)代表ReLU激活函数。
卷积提取特征后进行全局平均池化,如式(3)所示:
其中,m代表第m个通道,n代表该通道中的一个数据点,w代表当前通道样本数,vm代表经全局平均池化计算得到的通道权重值。
池化后得到通道权重值经两层1*1卷积操作,得到最终的通道注意力权重v,对输入数据进行调整,并增加残差连接结构,得到输出特征。如式(4)所示:
其中,d代表通道维数,代表上一层输出,/>代表当前输出,v代表通道注意力权重。
输出特征经最大池化计算后,输入到下一个特征提取模块。如式(5)所示:
其中,w为池化区域大小3,为最大池化后输出值,/>为上一层输出特征。
输入数据经过三个特征提取模块得到最终输出特征,通过特征提取模块计算获得每个通道的重要程度,为每个特征赋予一个权重值,从而让模型重点关注某些特征通道,并抑制不重要的特征通道,提高模型的分类准确率。
标签分类器:最小化熵损失可以提高目标域样本分类自信程度,通过最小化熵损失训练模型标签分类器,使得目标域样本熵值达到最小。熵最小化技术可以让模型的决策边界远离边缘数据,提高模型分类器的自信程度。熵最小化如式(6)所示:
其中,代表目标域中第i个样本,N代表样本数,G(·)代表特征提取器,C(·)代表分类器。
输入数据经特征提取器G提取特征,输入到分类器C中,通过softmax函数计算该样本预测为每个类别的概率,计算熵值后进行累加得到我们最终目标函数。熵值越小,分类器的自信程度也就越高,可以更好的刻画目标域数据内不同类别样本的决策边界,提高模型泛化能力。
3、最小化分类损失、域分类损失以及目标域熵损失
基于带注意力机制特征提取器及基于熵最小化标签分类器的原理及具体实现过程,设计了一种改进域对抗神经网络。我们注意到模型优化目标函数发生了变化,最小熵损失函数应用于目标域样本,可以提高模型泛化能力。改进DANN总体损失可以由式(4.6)表示:
LDANN=Lc(Ds,ys)+Lc(DT,yT)+Len(DT,yT)+λLd(Ds,DT) (7)
其中,Lc(Ds,ys)为源域数据域内分类损失,Lc(DT,yT)为目标域数据域内分类损失,Len(DT,yT)为目标域数据最小熵损失,Ld(Ds,DT)为两域数据域间分类损失,λ为领域判别损失的权重系数。
二、本发明技术方案的实现过程:
1、信号采集:利用传感器收集轴承的振动信号,选取数字信号的采样频率为5000Hz的轴承数据。
2、数据扩充:提出特征对齐的生成对抗模型,特征对齐的生成对抗网络可以分为两个部分:一个是生成器G,一个是判别器D。随机噪声通过生成器的反卷积操作生成样本,将低维噪声上采样为与真实样本维度相同的生成样本,随后将生成样本与真实样本混合输入至判别器中进行训练,输入数据通过判别器的卷积操作提取样本特征,通过最大均值差异衡量真实样本与生成样本间特征分布差异,减少特征分布间距离损失,反向更新参数,指导生成器生成符合真实样本特征分布的生成样本。
3、特征学习:通过改进特征对齐的生成对抗模型、改进域对抗神经网络组成的旋转机械故障诊断模型进行深层特征学习;
4、故障诊断:首先利用传感器收集轴承的振动信号,选取数字信号的采样频率5000Hz的轴承数据,将收集到的不平衡目标域一维振动数据输入到改进特征对齐的生成对抗模型中,得到可以更好的保留原始数据特征,以便生成高质量的类别平衡样本数据。将源域和目标域数据放入改进域对抗神经网络组成的旋转机械故障诊断模型中,建立多尺度注意力机制筛选出重要故障相关信息,提取域判别不变下分类相关特征,并构建熵最小标签分类器,提高模型泛化能力。改进的域对抗神经网络可以更好的识别目标域样本的故障类别,完成滚动轴承不平衡样本下的故障识别。
5、一种特征对齐域对抗神经网络故障诊断方法将CWRU数据集和实验室旋转机械滚动轴承PT300试验台产生的一维原始数据作为数据集作为对比实验。每个数据集收集七类振动数据,一类正常数据,故障数据分为三大类,分别是轴承内圈故障,外圈故障和滚动体故障,每类故障又分为两种,因此,一共六类故障数据和一类正常数据。在不同的转速下获得的数据成为目标域数据或者源域数据。
为评价模型故障诊断效果,在CWRU数据集下,将原始目标域振动数据预处理后输入特征对齐的生成对抗网络中进行扩充,扩充后的目标域样本与源域样本送入改进域对抗神经网络中进行故障诊断,实验准确度如表1所示:
表1:CWRU变工况准确率对比
表2:PT300试验台变工况准确率对比
其中A→B表示在A转速的数据集下训练,在B转速下数据集进行测试,此时A是源域,B是目标域,以此类推。从表1看,是基于CWRU数据集,进行域迁移学习实验。其中,源域为充足数据,每个类别包含500个真实样本,目标域不平衡比例设置为10:1。选取三次实验结果并计算均值,可以看到模型在不同跨域故障识别准确率均能保持在99%以上,即对于CWRU不平衡数据集时可以保持较高的识别率。从表2看,是基于LNU数据集,进行域迁移学习实验。其中,源域每个类别包含500个真实样本,目标域不平衡比例设置为10:1。选取三次实验结果并计算均值,可以看到模型在F→G迁移实验中表现效果较好,在G→H迁移实验中表现效果较差,但模型总体跨域故障识别准确率均能保持在90%以上,验证模型可以很好的学习到目标域的故障分类特征,对于PT300不平衡数据集也能保持良好的识别率。
本发明对所提出的故障诊断模型和旋转机械滚动轴承数据进行了详细阐述,本发明提出的模型由通过改进特征对齐的生成对抗模型、改进域对抗神经网络组成。首先针对不平衡小样本直接送入深度学习模型中容易出现过拟合的问题,提出改进特征对齐的生成对抗模型,通过改进的最大均值差异衡量生成样本和真实样本间的特征分布,通过不断缩小样本间分布距离,指导生成器生成更拟合真实样本的生成数据,将目标域不平衡小样本扩充至与源域数量相同且平衡状态。然后输入改进域对抗神经网络中进行训练,为更好实现模型的准确分类,构建多尺度注意力特征机制提取域内故障分类相关特征,提升模型识别能力,同时,熵最小化技术可以让模型决策边界远离边缘数据点,增加分类器自信程度,在面对目标域样本分类时,建立熵最小化分类器可以提高模型对于目标域样本的适配能力,增强模型泛化能力。最后将数据送入到分类器中得出分类结果。提出方法为旋转机械故障诊断的故障识别提供了一种高精度、高稳定的分类方法,为故障诊断提供了一种新的思路以及更智能的故障诊断方法。
Claims (4)
1.一种特征对齐域对抗神经网络的故障诊断方法,其特征在于,步骤如下:
1)信号采集:利用传感器收集滚动轴承的原始一维振动信号,选取数字信号的采样频率为5000Hz的轴承数据;
2)数据扩充:提出特征对齐的生成对抗模型,特征对齐的生成对抗网络分为两个部分:一个是生成器G,一个是判别器D;随机噪声通过生成器的反卷积操作生成样本,将低维噪声上采样为与真实样本维度相同的生成样本,随后将生成样本与真实样本混合输入至判别器中进行训练,输入数据通过判别器的卷积操作提取样本特征,通过最大均值差异衡量真实样本与生成样本间特征分布差异,减少特征分布间距离损失,反向更新参数,指导生成器生成符合真实样本特征分布的生成样本;
3)特征学习:通过改进特征对齐的生成对抗模型、改进域对抗神经网络组成的旋转机械故障诊断模型进行深层特征学习;
4)轴承故障诊断:
4.1)随机取10个带标签目标域样本,同为一个类别,与随机变量生成样本等量混合;其中生成样本标签为1,真实样本标签为0;
4.2)混合样本输入判别器进行训练;
4.3)冻结判别器权重,混合样本输入模型中训练生成器,计算生成样本和真实样本特征之间最大均值差异,最小化特征间重建距离损失;
4.4)设置生成样本标签为0,输入模型训练生成器;
4.5)从训练好的模型中取出适量样本充当目标域样本;
4.6)源域样本、扩充后带标签目标域样本以及真实带标签目标域样本混合成训练集,输入改进域对抗神经网络IDANN中进行训练;
4.7)最小化分类损失、域分类损失以及目标域熵损失;
4.8)保存训练好的网络模型;
4.9)利用目标域无标签样本进行测试,输出最终故障识别结果。
2.根据权利要求1所述的一种特征对齐域对抗神经网络的故障诊断方法,其特征在于:所述的步骤2)中,具体方法如下:
特征对齐的生成对抗模型由三部分组成,分别是生成器G、判别器D和最终损失函数Loss;其中Loss分为三个部分,极小化生成器损失函数极大化判别器损失函数以及特征分布最大均值差异损失函数/>具体流程如下:
2.1)对目标域真实样本进行滑动窗口采样,样本大小为1024,为模拟不平衡样本输入,每类故障样本随机选取不同个数样本作为输入;
2.2)将大小为100维且服从正态分布的高斯噪声输入改进GAN的生成器中进行上采样,输出大小为1024的生成样本;
2.3)设置生成样本标签为1,真实样本标签为0;
2.4)固定生成器参数,将真实样本和生成样本混合送入判别器中,训练判别器;
2.5)固定判别器参数,将混合样本送入模型中,计算生成样本与真实样本特征间最大均值差异和判别结果,反向更新生成器参数;生成的最大均值差异可由公式(1)所示:
其中,fi s表示源域数据,fi t表示目标域数据,表示极小化生成器损失函数,表示极大化判别器损失函数;
2.6)固定生成器参数,重新生成样本,设置生成样本标签为0,训练判别器;
2.7)循环迭代训练模型,保存生成样本作为扩充数据。
3.根据权利要求1所述的一种特征对齐域对抗神经网络的故障诊断方法,其特征在于:所述的步骤4.6)中,具体方法如下:
改进域对抗神经网络IDANN由三个部分组成,分别是特征提取器、标签分类器以及领域判别器;
特征提取器:通过构建多尺度注意力机制模块,提取领域判别不变下的分类相关特征;首先输入数据经特征提取模块得到输出特征,每个特征提取模块包括卷积层,注意力机制模块以及池化层组成,源域Ds和目标域Dt样本作为输入数据首先进行卷积操作,如式(2)所示:
其中,代表上一层的输出,/>代表当前输出,N代表卷积核数目,k代表卷积核,卷积核大小为3,b代表偏差,f(·)代表ReLU激活函数;
卷积提取特征后进行全局平均池化,如式(3)所示:
其中,x代表输入数据,m代表第m个通道,n代表该通道中的一个数据点,w代表当前通道样本数,vm代表经全局平均池化计算得到的通道权重值;
池化后得到通道权重值经两层1*1卷积操作,得到最终的通道注意力权重v,对输入数据进行调整,并增加残差连接结构,得到输出特征;如式(4)所示:
其中,d代表通道维数,代表上一层输出,/>代表当前输出,v代表通道注意力权重;
输出特征经最大池化计算后,输入到下一个特征提取模块;如式(5)所示:
其中,w为池化区域大小3,为最大池化后输出值,/>为上一层输出特征;
输入数据经过三个特征提取模块得到最终输出特征,通过特征提取模块计算获得每个通道的重要程度,为每个特征赋予一个权重值,让模型重点关注特征通道,抑制不重要的特征通道,提高模型的分类准确率;
标签分类器:最小化熵损失能够提高目标域样本分类自信程度,通过最小化熵损失训练模型标签分类器,使得目标域样本熵值达到最小;熵最小化技术让模型的决策边界远离边缘数据,提高模型分类器的自信程度,熵最小化如式(6)所示:
其中,代表目标域中第i个样本,N代表样本数,G(·)代表特征提取器,C(·)代表分类器;
输入数据经特征提取器G提取特征,输入到分类器C中,通过softmax函数计算该样本预测为每个类别的概率,计算熵值后进行累加得到我们最终目标函数;熵值越小,分类器的自信程度越高,更好的刻画目标域数据内不同类别样本的决策边界,提高模型泛化能力。
4.根据权利要求1所述的一种特征对齐域对抗神经网络的故障诊断方法,其特征在于:所述的步骤4.7)中,具体方法如下:
基于带注意力机制特征提取器及基于熵最小化标签分类器的原理及具体实现过程,设计一种改进域对抗神经网络,模型优化目标函数发生变化,最小熵损失函数应用于目标域样本,提高模型泛化能力,改进DANN总体损失由式(4.6)表示:
LDANN=Lc(Ds,ys)+Lc(DT,yT)+Len(DT,yT)+λLd(Ds,DT)(7)其中,Lc(Ds,ys)为源域数据域内分类损失,Lc(DT,yT)为目标域数据域内分类损失,Len(DT,yT)为目标域数据最小熵损失,Ld(Ds,DT)为两域数据域间分类损失,λ为领域判别损失的权重系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310791257.2A CN117475191A (zh) | 2023-06-30 | 2023-06-30 | 一种特征对齐域对抗神经网络的轴承故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310791257.2A CN117475191A (zh) | 2023-06-30 | 2023-06-30 | 一种特征对齐域对抗神经网络的轴承故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117475191A true CN117475191A (zh) | 2024-01-30 |
Family
ID=89628141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310791257.2A Pending CN117475191A (zh) | 2023-06-30 | 2023-06-30 | 一种特征对齐域对抗神经网络的轴承故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117475191A (zh) |
-
2023
- 2023-06-30 CN CN202310791257.2A patent/CN117475191A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111914883B (zh) | 一种基于深度融合网络的主轴轴承状态评估方法及装置 | |
CN109186973B (zh) | 一种无监督深度学习网络的机械故障诊断方法 | |
CN110110768B (zh) | 基于并行特征学习和多分类器的滚动轴承故障诊断方法 | |
CN107784325A (zh) | 基于数据驱动增量融合的螺旋式故障诊断模型 | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN110647830B (zh) | 基于卷积神经网络和高斯混合模型的轴承故障诊断方法 | |
CN112629851B (zh) | 基于数据增强方法与图像识别的海上风电机组齿轮箱故障诊断方法 | |
CN110334764A (zh) | 基于集成深度自编码器的旋转机械智能故障诊断方法 | |
CN112819059B (zh) | 一种基于流行保持迁移学习的滚动轴承故障诊断方法 | |
CN112396109A (zh) | 基于递归图与多层卷积神经网络的电机轴承故障诊断方法 | |
CN114048568B (zh) | 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 | |
CN114358123B (zh) | 一种基于深度对抗迁移网络的广义开放集故障诊断方法 | |
CN101907681A (zh) | 基于gsd_svdd的模拟电路动态在线故障诊断方法 | |
CN110443117B (zh) | 一种风电机组故障诊断方法 | |
Li et al. | Joint attention feature transfer network for gearbox fault diagnosis with imbalanced data | |
CN112860183B (zh) | 基于高阶矩匹配的多源蒸馏-迁移机械故障智能诊断方法 | |
CN114492642A (zh) | 一种多尺度元深度残差收缩网络的机械故障在线诊断方法 | |
CN108509701A (zh) | 一种基于振动信号的旋转机械故障直接智能诊断方法 | |
CN112364706A (zh) | 一种基于类不平衡的小样本轴承故障诊断方法 | |
CN115165366A (zh) | 一种旋转机械变工况故障诊断方法及系统 | |
CN113887136A (zh) | 一种基于改进GAN和ResNet的电动汽车电机轴承故障诊断方法 | |
CN116894187A (zh) | 一种基于深度迁移学习的齿轮箱故障诊断方法 | |
CN110728377B (zh) | 一种面向机电设备的智能故障诊断方法及系统 | |
CN114997211A (zh) | 一种基于改进对抗网络和注意力机制的跨工况故障诊断方法 | |
CN113283467A (zh) | 一种基于平均损失和逐类选择的弱监督图片分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |