CN116578940A - 一种基于混合深度自编码的轴承故障新类识别与诊断方法 - Google Patents
一种基于混合深度自编码的轴承故障新类识别与诊断方法 Download PDFInfo
- Publication number
- CN116578940A CN116578940A CN202310572685.6A CN202310572685A CN116578940A CN 116578940 A CN116578940 A CN 116578940A CN 202310572685 A CN202310572685 A CN 202310572685A CN 116578940 A CN116578940 A CN 116578940A
- Authority
- CN
- China
- Prior art keywords
- fault
- depth self
- coding
- layer
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 60
- 238000012360 testing method Methods 0.000 claims abstract description 44
- 238000001514 detection method Methods 0.000 claims abstract description 30
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 57
- 210000002569 neuron Anatomy 0.000 claims description 11
- 238000011478 gradient descent method Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 230000001133 acceleration Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 5
- 238000013136 deep learning model Methods 0.000 abstract description 6
- 239000000284 extract Substances 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 7
- 239000006185 dispersion Substances 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003313 weakening effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明属于智能故障诊断的技术领域,更具体地,涉及一种基于混合深度自编码的轴承故障新类识别与诊断方法,包括S1、采集不同故障条件下的轴承振动信号数据作为样本;S2、对S1中采集的样本进行预处理,并分为训练集和测试集;S3、搭建混合深度自编码网络,包括第一编码器、解码器、第二编码器和Softmax分类层的结构;S4、将训练集输入混合深度自编码网络,进行预训练得到新类故障检测阈值,实现故障分类;S5、将测试集输入训练好的混合深度自编码网络中进行诊断。本发明解决了现有技术中深度学习模型需要大量的标记数据来训练,单个深度学习模型提取相似特征时容易造成故障的误分类和模型的过拟合的问题。
Description
技术领域
本发明属于智能故障诊断的技术领域,更具体地,涉及一种基于混合深度自编码的轴承故障新类识别与诊断方法。
背景技术
轴承作为机械设备中的关键零部件,在旋转机械发生故障时,约30%是轴承故障,其运行状态的正常与否直接影响到整台设备的使用性能。对轴承进行实时状态检测和故障诊断技术的研究,不仅能保证设备安全、可靠地运行,而且对于延长设备使用寿命,节约经济成本具有重要意义。
现有的新类识别方法往往基于自编码网络模型,它能够将输入编码更为紧凑的表示的同时保留重要的判别特征,并且还能够将特定编码解码回原始形式。Zhe Yang等人设计了一种基于稀疏自动编码器的深度神经网络,使用编码器网络提取故障数据集特征,在此基础上分别采用解码器网络和分类模块进行无监督重建和监督分类,通过将重构误差与预定义的阈值进行比较以实现新类识别。刘辉海建立了自编码器网络模型,通过对重构误差的变化特点不断深入分析,分别设定了不同的阈值对其变化趋势进行检测,采用极值理论设定自适应阈值监测重构误差的趋势变化,最终作为状态异常预警的判定准则,减少误报警和重构误差极值的影响。刘钊瑞等人提出基于深度自编码器高斯混合模型的用户窃电行为检测方法,将样本能量超过异常阈值的用户识别为窃电,据此实现用户窃电行为检测。
中国专利文献CN114199570A公开了一种基于改进变分模态分解的风电齿轮箱轴承故障识别方法,公开了:首先,利用功率谱熵优化变分模态分解的本征模态函数数目和模态初始中心约束强度;然后,利用样本熵阈值将本征模态函数分为高噪声和低噪声分量,接着用小波阈值对高噪声本征模态函数分量进行降噪重构;之后,利用深度自编码器对故障特征进行提取和降维;最后,利用支持向量机对轴承故障进行识别。
综上,在轴承的故障分类领域与新类故障识别领域,国内外学者都已经进行了相关的探索研究,但将二者相结合的研究仍处于初步阶段,目前存在的不足之处主要体现在以下几个方面:(1)深度学习模型往往需要大量的标记数据进行训练,而在实际工业应用中,标记收集的机械信号需要专业的领域知识和经验,且需要大量的时间。(2)现有的新类识别模型往往基于自编码网络模型,但单个深度学习模型往往对相同类别的数据样本提取相似的特征,容易造成故障的误分类和模型的过拟合。
发明内容
本发明旨在克服上述现有技术的至少一种缺陷,提供一种基于混合深度自编码的轴承故障新类识别与诊断方法。
本发明详细的技术方案如下:
本发明为了解决上述技术问题,提供了一种基于混合深度自编码的轴承故障新类识别与诊断方法,降低故障诊断对标记数据的依赖,解决小样本故障数据与深度学习模型需要大量样本训练之间的矛盾,并结合混合深度自编码网络的重构数据设定阈值,实现轴承的新类故障识别,解决机械设备故障诊断所面临的新增故障识别难的问题,大大提高轴承故障识别的准确率。
为实现上述目的,本发明提供了一种基于混合深度自编码的轴承故障新类识别与诊断方法,包括以下步骤:
步骤S1、采集不同故障条件下的轴承振动信号数据作为样本,包括已知故障类别样本、未知故障类别样本;
所述振动信号的横坐标为时间,纵坐标为加速度即轴承运作时采集的驱动端的加速度;
步骤S2、对S1中采集的样本进行预处理得到原始图像,取70%的已知故障类别的样本作为训练集并赋予类标签,剩余30%的已知故障类别样本(无类标签)和未知故障类别样本组成测试集;
所述预处理为小波变换将一维数据转化为二维时频图,和利用one-hot编码将编码作为类标签;
步骤S3、搭建混合深度自编码网络,所述混合深度自编码网络包括卷积层、全连接层、反卷积层、和Softmax分类层,组成第一编码器、解码器、第二编码器和Softmax分类层的双编码器结构;
所述第一编码器包括4个卷积层和2个全连接层;
所述解码器包括4个反卷积层和2个全连接层;
所述第二编码器包括4个卷积层和2个全连接层;
步骤S4、将训练集输入混合深度自编码网络,结合最小批随机梯度下降法和无监督学习方法对网络进行预训练得到新类故障检测阈值,并基于类标签和隐藏特征实现故障分类;
步骤S5、将测试集输入训练好的混合深度自编码网络进行诊断,若为新类故障,则完成诊断;若不属于新类故障,再通过匹配类标签,得出故障类型,完成诊断。
进一步地,所述步骤S3的具体处理步骤为:
步骤S31、原始图像x经第一编码器处理得到隐藏层特征表示z;
步骤S32、隐藏层特征表示z经解码器处理生成重构图像x′;
步骤S33、重构图像x′经第二编码器进行处理得到重构图像的特征表示z′;
步骤S34、Softmax分类层基于S31-S33进行分类处理。
进一步地,经卷积层处理后的输出特征图经ReLU激活函数处理,分别在所述第一编码器和所述第二编码器的第2层卷积层进行批归一化处理;每层卷积层处理后都会得到对应的输出特征图;
当输入值的绝对值较大时,Sigmoid与Tanh函数的导数值均接近于0,这会造成利用误差反向传播来更新权值时,随着神经网络层数的增加,误差值无法向下传播,从而底层网络训练不透,这也被称为梯度弥散现象,而ReLU函数在输入值大于0的导数值始终为1,很好的克服了梯度弥散现象;因此,采用ReLU函数作为卷积神经网络的激活函数,并为了防止过拟合,在第2层卷积层进行批归一化(BatchNormalization,BN)处理。
进一步地,所述混合深度自编码网络还包括在4个卷积层之后添加一个展平层,作为卷积层和全连接层中间的衔接层,衔接层会将二维的特征图转化为一维数据,将一维的数据输入到全连接层实现进一步的特征提取。
进一步地,分类层是一个Softmax分类层,Softmax常用于解决多分类问题,会将编码器输出的隐藏特征映射到[0,1]之间,并且所有值相加为1,直接输出分类的概率,从而实现故障类型的分类;
所述Softmax分类层的输入为第一编码器的输出z;经过具有C个神经元的Softmax分类层,得到概率向量P,P={P1,P2,…,PC},当P中存在最大值Pk,则认为隐藏层特征表示z代表的是第k类标签,k=1,2,…,C;
并在Softmax分类层采用dropout对神经元节点进行随机舍弃,减弱神经元之间的共适应关系以及节点间的相关性,从而防止网络训练过拟合。
进一步地,由于所述混合深度自编码网络的最终目的有两个,一个是使用上述网络进行无监督训练,获取输入数据的隐藏特征,然后再通过分类器进行有监督分类,实现故障的分类任务;第二个是通过比较原始数据和重构数据之间的误差,判断是否为新类故障,实现新类故障的识别任务;因此该网络需定义3个损失函数以实现网络的迭代优化,通过这3个损失函数来制定不同训练阶段所需要的目标函数,每个损失函数都优化了各个部分
定义以下3个损失函数以实现所述混合深度自编码网络的迭代优化:
定义重构损失Lcon测量原始输入图像x和重构图像x′之间重构损失。损失函数如下:
定义编码器损失Lenc来最小化原始数据的隐藏层特征表示z和重构图像的特征表示z′之间的欧式距离,损失函数表示如下:
Lenc=||z-z′||2 (4);
定义分类器监督训练损失Lst来测量Softmax分类层预测与标记数据的真实标签之间的距离,损失函数如下:
其中,i表示隐藏层的神经元个数,i=1,2,…,N,k为故障类型,k=1,2,…,C,yi为原始数据标签,为经过Softmax分类层映射后的预测标签。
进一步地,所述步骤S4具体包括:
步骤S41、混合深度自编码网络的无监督训练阶段:将所有的已知故障类数据输入上述网络中进行无监督训练,获取这些数据的隐藏特征,利用最小批梯度下降法,最小化以下目标函数:
Loss=αLcon+βLenc (6)
其中,α和β是调整单个损失对整体目标函数影响的权重;
步骤S42、混合深度自编码网络的有标签训练,输入有标签数据到所述混合深度自编码网络中进行有监督训练,通过梯度下降法不断更新Softmax分类层中的权值和偏置向量,基于标签和隐藏特征使网络具有故障分类的功能,有监督训练阶段的目标函数如下
Loss=αLnon+βLenc+γLst (7)
其中,α、β和γ是调整单个损失对整体目标函数影响的权重;
步骤S43、记录已知故障类的原始图像和重构图像之间的误差,并根据此误差设定新类故障检测阈值,所述混合深度自编码网络采用均方差损失计算重构误差:
通过上式计算新类故障检测阈值δ,δ的表达式如下:
δ=Q3+1.5(Q3-Q1) (9)
其中,Q1为训练集重构误差的下四分位数,即25%分位数;Q3为重构误差的上四分位数,即75%分位数。
进一步地,步骤S5具体包括:
S51、将测试集输入进训练好的混合深度自编码网络中,得到测试集的隐藏层特征表示zTEST重构图像和重构图像的特征表示zTEST′;
S52、通过计算测试集原始图像xTEST和重构图像之间的重构误差,并与步骤4中所述新类故障检测阈值δ进行比较,若重构误差MSETEST大于新类故障检测阈值δ,则被检测为新类故障,完成诊断,如下公式:
若重构误差MSETEST小于新类故障检测阈值δ,则不属于新类故障,再通过匹配类标签,得出故障类型,完成诊断。
以上所述卷积层与反卷积层每层的步幅都设为2,填充为1。
与现有技术相比,本发明的有益效果为:
(1)本发明提供的一种基于混合深度自编码的轴承故障新类识别与诊断方法,实现了新类故障的检测功能和已知类故障的分类功能,根据重构误差设定新类检测阈值,自动判断是否属于未知类型的故障,解决了未知类型故障会错误分类到已知类的问题。
(2)本发明提供的一种基于混合深度自编码的轴承故障新类识别与诊断方法,该方法使用已知类型数据对网络进行无监督训练,获取样本的重构数据并提取低维特征,然后利用少量的有类标签数据对网络进行有监督微调,有效解决了小样本故障数据与深度学习模型需要大量样本训练之间的矛盾。
(3)本发明提供的一种基于混合深度自编码的轴承故障新类识别与诊断方法,结合了卷积神经网络和自编码网络的优点,设计了三个不同的损失函数用来优化网络,能够有效提高网络的特征提取能力,避免在小样本数据集下提取单一特征,减小过拟合,从而提高故障分类的准确率。
附图说明
图1是本发明故障识别与诊断流程图。
图2是本发明实施例1中小波变换生成的时频图。
图3是本发明实施例1中混合深度自编码网络结构图。
图4是本发明实施例1中测试样本诊断流程图。
图5是本发明实施例1中有类标签样本数量为264时的运行结果图。
具体实施方式
下面结合附图与实施例对本公开做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
实施例1
本实施例提供一种基于混合深度自编码的轴承故障新类识别与诊断方法,如图1所示:
步骤S1、采集不同故障条件下的轴承振动信号数据作为样本,包括已知故障类别样本、未知故障类别样本;
所述振动信号的横坐标为时间,纵坐标为加速度即轴承运作时采集的驱动端的加速度;
步骤S2、对S1中采集的样本进行预处理得到原始图像,取70%的已知故障类别的样本作为训练集并赋予类标签,剩余30%的已知故障类别样本(无类标签)和未知故障类别样本组成测试集;
所述预处理为小波变换将一维数据转化为二维时频图如图2所示,和利用one-hot编码将编码作为类标签。
步骤S3、搭建混合深度自编码网络,所述混合深度自编码网络包括卷积层、全连接层、反卷积层、和Softmax分类层,组成第一编码器、解码器、第二编码器和Softmax分类层的双编码器结构,如图3所示;
所述第一编码器包括4个卷积层和2个全连接层;
所述解码器包括4个反卷积层和2个全连接层;
所述第一编码器包括4个卷积层和2个全连接层;
优选地,在第一编码器和第一编码器的4个卷积层之后添加一个展平层,作为卷积层和全连接层中间的衔接层,衔接层会将二维的特征图转化为一维数据,将一维的数据输入到全连接层实现进一步的特征提取
所述步骤S3的具体处理步骤为:
步骤S31、原始图像x经第一编码器处理得到隐藏层特征表示z;
步骤S32、隐藏层特征表示z经解码器处理生成重构图像x′;
步骤S33、重构图像x′经第二编码器进行处理得到重构图像的特征表示z′;
步骤S34、Softmax分类层基于S31-S33进行分类处理;
其中,卷积层使用卷积核对输入信号(或特征)的局部区域进行卷积运算,并产生相应的特征。卷积层最重要的特点是权值共享,即同一个卷积核将以固定的步长遍历一次输入。权值共享减少了卷积层的网络参数,避免了由于参数过多造成的过拟合,并且降低了系统所需内存。卷积层具体运算如下式所示:
其中,为第l层的输出特征图,fl为第l层的激活函数,/>为第l层的卷积核,bl为第l层的偏置,*为卷积操作;
每层卷积都应用3*3的卷积核,步幅为2,填充为1;在每个卷积层中将特征映射的大小缩小二分之一,特征图会随着网络的深入而逐渐减小;在经过4个连续的卷积层后,原始的64*64时频图将会转换为4*4的特征图;
经卷积层处理后的输出特征图经ReLU激活函数处理即每个卷积层后都要添加一个Relu激活函数,分别在所述第一编码器和所述第二编码器的第2层卷积层进行批归一化处理;每层卷积层处理后都会得到对应的输出特征图;当输入值的绝对值较大时,Sigmoid与Tanh函数的导数值均接近于0,这会造成利用误差反向传播来更新权值时,随着神经网络层数的增加,误差值无法向下传播,从而底层网络训练不透,这也被称为梯度弥散现象,而ReLU函数在输入值大于0的导数值始终为1,很好的克服了梯度弥散现象;因此,采用ReLU函数作为卷积神经网络的激活函数,并为了防止过拟合,在第2层卷积层进行批归一化(BatchNormalization,BN)处理;
在得到4*4的特征图后,即在最后一层卷积之后添加一个展平层,作为卷积层和全连接层中间的衔接层。衔接层会将二维的特征图转化为一维数据,将一维的数据输入到全连接层实现进一步的特征提取,全连接层的具体运算如下所示:
a=f(Wlx+bl) (2)
其中,a=[a1,a2,…,al]是隐藏层数据,f为激活函数,Wl为第l个隐藏层的权值矩阵,bl为第l个隐藏层的偏置向量;经过两个全连接层的压缩运算,便得到了第一编码器提取的特征;
输入图像x经卷积层和全连接层进行特征提取,然后使用反卷积层进行图像上采样,执行的操作与卷积层相似,不同的是,卷积层使用步幅等参数来缩小图像的大小,而反卷积层是使用步幅等参数来扩大图像的大小,在本发明提出的网络结构中,反卷积层层数仍为4,每层的步幅都设为2,填充为1,这样能让每一层的输出都是输入的2倍大小,与卷积层对应,便于得到与网络输入大小相同的重构图像;
将得到的重构图像再输入到第二编码器中,进行第二遍特征提取;第二编码器与第一编码器相同,由4个卷积层和2个全连接层组成。第二编码器提取的特征和第一编码器提取的特征维数相同,可以进行比较,并计算两者之间的损失,后续通过不断缩小损失来优化网络,增强网络特征提取能力;
分类层是一个Softmax分类层,Softmax常用于解决多分类问题,会将编码器输出的隐藏特征映射到[0,1]之间,并且所有值相加为1,可以直接输出分类的概率,从而实现故障类型的分类;
所述Softmax分类层的输入为第一编码器的输出z;经过具有C个神经元的Softmax分类层,得到概率向量P,P={P1,P2,…,PC},当P中存在最大值Pk,则认为隐藏层特征表示z代表的是第k类标签,k=1,2,…,C;
并在Softmax分类层采用dropout对神经元节点进行随机舍弃,减弱神经元之间的共适应关系以及节点间的相关性,从而防止网络训练过拟合;
进一步地,由于所述混合深度自编码网络的最终目的有两个,一个是使用上述网络进行无监督训练,获取输入数据的隐藏特征,然后再通过分类器进行有监督分类,实现故障的分类任务;第二个是通过比较原始数据和重构数据之间的误差,判断是否为新类故障,实现新类故障的识别任务;因此该网络需定义3个损失函数以实现网络的迭代优化,通过这3个损失函数来制定不同训练阶段所需要的目标函数,每个损失函数都优化了各个部分
定义以下3个损失函数以实现所述混合深度自编码网络的迭代优化:
定义重构损失Lcon测量原始输入图像x和重构图像x′之间重构损失。损失函数如下:
定义编码器损失Lenc来最小化原始数据的隐藏层特征表示z和重构图像的特征表示z′之间的欧式距离,损失函数表示如下:
Lenc=||z-z′||2 (4);
定义分类器监督训练损失Lst来测量Softmax分类层预测与标记数据的真实标签之间的距离,损失函数如下:
其中,i表示隐藏层的神经元个数,i=1,2,…,N,k为故障类型,k=1,2,…,C,yi为原始数据标签,为经过Softmax分类层映射后的预测标签。
步骤S4、将训练集输入混合深度自编码网络,结合最小批随机梯度下降法和无监督学习方法对网络进行预训练得到新类故障检测阈值,并基于类标签和隐藏特征实现故障分类,如图4所示;
所述步骤S4具体包括:
步骤S41、混合深度自编码网络的无监督训练阶段:将所有的已知故障类数据输入上述网络中进行无监督训练,获取这些数据的隐藏特征,利用最小批梯度下降法,最小化以下目标函数:
Loss=αLcon+βLenc (6)
其中,α和β是调整单个损失对整体目标函数影响的权重;
步骤S42、混合深度自编码网络的有标签训练,输入有标签数据到所述混合深度自编码网络中进行有监督训练,通过梯度下降法不断更新Softmax分类层中的权值和偏置向量,基于标签和隐藏特征使网络具有故障分类的功能,有监督训练阶段的目标函数如下
Loss=αLcon+βLenc+γLst (7)
其中,α、β和γ是调整单个损失对整体目标函数影响的权重;此权重属于网络参数,需要自己根据实验结果调整并设定最佳参数;
步骤S43、由于在整个训练过程中只输入了已知故障类数据进行学习,网络能够很好的还原已知类故障,但是对于新类故障却无法很好的还原,从而造成新类故障的重构误差会远大于已知故障类的重构误差;所以需要记录已知故障类的原始图像和重构图像之间的误差,并根据此误差设定新类故障检测阈值,所述混合深度自编码网络采用均方差损失计算重构误差:
通过上式计算新类故障检测阈值δ,δ的表达式如下:
δ=Q3+1.5(Q3-Q1) (9)
其中,Q1为训练集重构误差的下四分位数,即25%分位数;Q3为重构误差的上四分位数,即75%分位数。
步骤S5、将测试集输入训练好的混合深度自编码网络进行诊断,若为新类故障,则完成诊断;若不属于新类故障,再通过匹配类标签,得出故障类型,完成诊断;
具体的,步骤S5具体包括:
S51、将测试集输入进训练好的混合深度自编码网络中,得到测试集的隐藏层特征表示zTEST重构图像和重构图像的特征表示zTEST′;
S52、通过计算测试集原始图像xTEST和重构图像之间的重构误差,并与步骤4中所述新类故障检测阈值δ进行比较,若重构误差MSETEST大于新类故障检测阈值δ,则被检测为新类故障,完成诊断,如下公式:
若重构误差MSETEST小于新类故障检测阈值δ,则不属于新类故障,再通过匹配类标签,得出故障类型,完成诊断;
当已知类故障输入网络时,由于网络经过步骤4的训练,网络生成的重构图像会和原始图像极为相似,其重构误差会小于δ,便得知此数据对应的是已知类故障,当检测出已知故障时,再将网络得到的隐藏特征输入到Softmax分类器中,由分类器判断出具体是哪种故障,实现网络的故障识别和分类任务;
然而当新类故障输入网络时,由于步骤4中并未对新类故障进行学习,所以网络无法很好的还原,所以由重构图像和原始图像计算出来的重构误差会远大于步骤4中所设置的阈值δ,因此得出结论,此故障类型为新类故障,实现新类故障的识别功能。
为了评估混合深度自编码网络的故障识别与诊断的有效性和准确性,利用轴承数据集进行实验验证。本发明具体实施例的训练样本和测试样本数据集的实验数据来自美国凯斯西储大学轴承实验中心获得的轴承振动数据。该实验设备由一个2马力的电动机、一个扭矩传感器和译码器、一个功率测试仪和电子控制器组成。本发明实施例采用的数据是12kHz采样频率下的驱动轴承故障数据和正常状态下的轴承数据。
该轴承主要有3类故障:内圈故障、外圈故障和滚动体故障,其故障直径包括0.007英寸、0.014英寸、0.021英寸。数据集所使用到的故障类型如表1所示:
该实验是在window步骤S系统上的pycharm平台,使用pytorch深度学习框架实现的。
首先对上述数据进行小波变换,将一维数据转化为64*64的二维时频图,转化后的样本数目如表中所示。
划分数据集。假设正常状态、内圈故障和滚动体故障为已知故障类型(0-6类),外圈故障(7-9类)为未知故障。对轴承的已知故障类别进行one-hot编码,作为类标签,取已知故障样本的70%作为训练集,剩下的30%和未知故障类别的全部数据组成测试集。
该网络训练包括两个阶段,无监督训练和有监督微调,为了验证所提方法的有效性,在无监督训练阶段,将无类标签数据输入至网络中,利用最小批梯度下降法,采用Adam优化器不断更新网络训练参数,最小化目标函数,当误差小于可接受的数值时,无监督训练结束。
然后输入少量的有类标签数据进行有监督训练,微调网络的权值和偏置向量,基于类标签和隐藏特征使网络具有故障分类的功能,例如,当有200个有类标签样本的情况下,剩下的全部用无类标签样本进行无监督训练。
训练完成后,将包含10种故障的测试集输入进网络,根据其重构误差判断是否属于新类未知故障,并根据其隐藏特征诊断其故障类型。
经多次试验证明,训练集中有类标签样本越多,故障分类和新类识别的准确率越高,当训练集中有一半是标记数据时,故障分类和新类识别的准确率都达到了90%以上,基本上可以满足故障识别与分类的要求。附图5为有类标签样本数量为264时的运行结果图,横轴为迭代次数,纵轴为准确率和损失值,曲线1为测试集的重构损失,曲线2为测试集的准确率,曲线3为训练集的损失,从表中可以看出,训练集和测试集的损失随着迭代次数的增加而减小,测试集的综合准确率随着迭代次数的增加而增加,并稳定在98%附近,具有较高的识别与分类精度。
显然,本发明的上述实施例仅仅是为清楚地说明本发明技术方案所作的举例,而并非是对本发明的具体实施方式的限定。凡在本发明权利要求书的精神和原则之内所做的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种基于混合深度自编码的轴承故障新类识别与诊断方法,其特征在于,包括;
步骤S1、采集不同故障条件下的轴承振动信号数据作为样本,包括已知故障类别样本、未知故障类别样本;
步骤S2、对S1中采集的样本进行预处理得到原始图像,取70%的已知故障类别的样本作为训练集并赋予类标签,剩余30%的已知故障类别样本和未知故障类别样本组成测试集;
步骤S3、搭建混合深度自编码网络,所述混合深度自编码网络包括第一编码器、解码器、第二编码器和Softmax分类层;
所述第一编码器包括4个卷积层和2个全连接层;
所述解码器包括4个反卷积层和2个全连接层;
所述第二编码器包括4个卷积层和2个全连接层;
步骤S4、将训练集输入混合深度自编码网络,结合最小批随机梯度下降法和无监督学习方法对网络进行预训练得到新类故障检测阈值,并基于类标签和隐藏特征实现故障分类;
步骤S5、将测试集输入经训练集训练的混合深度自编码网络进行诊断;
若为新类故障,则完成诊断;
若不属于新类故障,再通过匹配类标签,得出故障类型,完成诊断。
2.根据权利要求1所述的一种基于混合深度自编码的轴承故障新类识别与诊断方法,其特征在于,所述步骤S3的具体处理步骤为:
步骤S31、原始图像x经第一编码器处理得到隐藏层特征表示z;
步骤S32、隐藏层特征表示z经解码器处理生成重构图像x′;
步骤S33、重构图像x′经第二编码器进行处理得到重构图像的特征表示z′;
步骤S34、Softmax分类层基于S31-S33进行分类处理。
3.根据权利要求1或2所述的一种基于混合深度自编码的轴承故障新类识别与诊断方法,其特征在于,经所述卷积层处理后的输出特征图经ReLU激活函数处理,分别在所述第一编码器和所述第二编码器的第2层卷积层进行批归一化处理。
4.根据权利要求3所述的一种基于混合深度自编码的轴承故障新类识别与诊断方法,其特征在于,所述混合深度自编码网络还包括在4个卷积层之后添加一个展平层,作为卷积层和全连接层中间的衔接层。
5.根据权利要求2所述的一种基于混合深度自编码的轴承故障新类识别与诊断方法,其特征在于,所述Softmax分类层的输入为第一编码器的输出z;
经过具有C个神经元的Softmax分类层,得到概率向量P,P={P1,P2,…,PC},当P中存在最大值Pk,则认为隐藏层特征表示z代表的是第k类标签,k=1,2,…,C;
并在Softmax分类层采用dropout对神经元节点进行随机舍弃。
6.根据权利要求2所述的一种基于混合深度自编码的轴承故障新类识别与诊断方法,其特征在于,定义以下3个损失函数以实现所述混合深度自编码网络的迭代优化:
定义重构损失Lcon测量输入的原始图像x和重构图像x′之间重构损失,损失函数如下:
定义编码器损失Lenc来最小化原始数据的隐藏层特征表示z和重构图像的特征表示z′之间的欧式距离,损失函数表示如下:
Lenc=||z-z′||2 (4);
定义分类器监督训练损失Lst来测量Softmax分类层预测与标记数据的真实类标签之间的距离,损失函数如下:
其中,i表示隐藏层的神经元个数,i=1,2,…,N,k为故障类型,k=1,2,…,C,yi为原始数据类标签, 为经过Softmax分类层映射后的预测类标签。
7.根据权利要求5所述的一种基于混合深度自编码的轴承故障新类识别与诊断方法,其特征在于,所述步骤S4具体包括:
步骤S41、混合深度自编码网络的无监督训练阶段:将所有的已知故障类数据输入上述网络中进行无监督训练,获取这些数据的隐藏特征,利用最小批梯度下降法,最小化以下目标函数:
Loss=αLcon+βLenc (6)
其中,α和β是调整单个损失对整体目标函数影响的权重;
步骤S42、混合深度自编码网络的有类标签训练,输入有类标签数据到所述混合深度自编码网络中进行有监督训练,通过梯度下降法不断更新Softmax分类层中的权值和偏置向量,有监督训练阶段的目标函数如下
Loss=αLcon+βLenc+γLst (7)
其中,α、β和γ是调整单个损失对整体目标函数影响的权重;
步骤S43、记录已知故障类的原始图像和重构图像之间的误差,并根据此误差设定新类故障检测阈值,所述混合深度自编码网络采用均方差损失计算重构误差:
通过上式计算新类故障检测新类故障检测阈值δ,δ的表达式如下:
δ=Q3+1.5(Q3-Q1) (9)
其中,Q1为训练集重构误差的下四分位数,即25%分位数;Q3为重构误差的上四分位数,即75%分位数。
8.根据权利要求6所述的一种基于混合深度自编码的轴承故障新类识别与诊断方法,其特征在于,步骤S5具体包括:
S51、将测试集输入进训练好的混合深度自编码网络中,得到测试集的隐藏层特征表示zTEST重构图像和重构图像的特征表示zTEST′;
S52、通过计算测试集原始图像xTEST和重构图像之间的重构误差,并与步骤4中所述新类故障检测阈值δ进行比较,若重构误差MSETEST大于新类故障检测阈值δ,则被检测为新类故障,完成诊断,如下公式:
若重构误差MSETEST小于新类故障检测阈值δ,则不属于新类故障,再通过匹配类标签,得出故障类型,完成诊断。
9.根据权利要求1所述的一种基于混合深度自编码的轴承故障新类识别与诊断方法,其特征在于,所述振动信号的横坐标为时间,纵坐标为加速度即轴承运作时采集的驱动端的加速度。
10.根据权利要求1所述的一种基于混合深度自编码的轴承故障新类识别与诊断方法,其特征在于,步骤S2所述预处理为小波变换和one-hot编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310572685.6A CN116578940A (zh) | 2023-05-18 | 2023-05-18 | 一种基于混合深度自编码的轴承故障新类识别与诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310572685.6A CN116578940A (zh) | 2023-05-18 | 2023-05-18 | 一种基于混合深度自编码的轴承故障新类识别与诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116578940A true CN116578940A (zh) | 2023-08-11 |
Family
ID=87540960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310572685.6A Pending CN116578940A (zh) | 2023-05-18 | 2023-05-18 | 一种基于混合深度自编码的轴承故障新类识别与诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116578940A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117034020A (zh) * | 2023-10-09 | 2023-11-10 | 贵州大学 | 一种基于cvae-gan模型的无人机传感器零样本故障检测方法 |
CN117349491A (zh) * | 2023-12-04 | 2024-01-05 | 云翔赛博(山东)数字技术有限公司 | 振动筛的故障诊断算法、方法及系统 |
CN117390407A (zh) * | 2023-12-13 | 2024-01-12 | 国网山东省电力公司济南供电公司 | 变电站设备的故障识别方法、系统、介质和设备 |
CN117668690A (zh) * | 2023-11-20 | 2024-03-08 | 国网江苏省电力有限公司南京供电分公司 | 基于数字孪生实现的电力hplc台区故障监测方法 |
CN118468143A (zh) * | 2024-07-11 | 2024-08-09 | 中国海洋大学 | 基于声学信号的螺旋桨速度解缠域泛化故障诊断方法 |
-
2023
- 2023-05-18 CN CN202310572685.6A patent/CN116578940A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117034020A (zh) * | 2023-10-09 | 2023-11-10 | 贵州大学 | 一种基于cvae-gan模型的无人机传感器零样本故障检测方法 |
CN117034020B (zh) * | 2023-10-09 | 2024-01-09 | 贵州大学 | 一种基于cvae-gan模型的无人机传感器零样本故障检测方法 |
CN117668690A (zh) * | 2023-11-20 | 2024-03-08 | 国网江苏省电力有限公司南京供电分公司 | 基于数字孪生实现的电力hplc台区故障监测方法 |
CN117349491A (zh) * | 2023-12-04 | 2024-01-05 | 云翔赛博(山东)数字技术有限公司 | 振动筛的故障诊断算法、方法及系统 |
CN117390407A (zh) * | 2023-12-13 | 2024-01-12 | 国网山东省电力公司济南供电公司 | 变电站设备的故障识别方法、系统、介质和设备 |
CN117390407B (zh) * | 2023-12-13 | 2024-04-05 | 国网山东省电力公司济南供电公司 | 变电站设备的故障识别方法、系统、介质和设备 |
CN118468143A (zh) * | 2024-07-11 | 2024-08-09 | 中国海洋大学 | 基于声学信号的螺旋桨速度解缠域泛化故障诊断方法 |
CN118468143B (zh) * | 2024-07-11 | 2024-09-20 | 中国海洋大学 | 基于声学信号的螺旋桨速度解缠域泛化故障诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116578940A (zh) | 一种基于混合深度自编码的轴承故障新类识别与诊断方法 | |
CN112101220B (zh) | 一种无监督模型参数迁移的滚动轴承寿命预测方法 | |
CN107505133B (zh) | 基于自适应mrvm的滚动轴承故障概率性智能诊断方法 | |
CN109188211B (zh) | 一种高压设备绝缘故障诊断方法和系统 | |
CN115115921B (zh) | 基于残差网路的晶圆缺陷模式识别方法 | |
CN111353373A (zh) | 一种相关对齐域适应故障诊断方法 | |
CN108869145B (zh) | 基于复合特征指标和深度极限学习机的泵站机组诊断方法 | |
CN110991471B (zh) | 一种高速列车牵引系统故障诊断方法 | |
CN115563563A (zh) | 基于变压器油色谱分析的故障诊断方法及装置 | |
CN115791174B (zh) | 一种滚动轴承异常诊断方法、系统、电子设备及存储介质 | |
CN112115922A (zh) | 一种增强深度特征学习的旋转机械故障诊断方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN114462508A (zh) | 基于多模态神经网络的电力变压器健康状态评估方法 | |
CN117909668B (zh) | 基于卷积神经网络的轴承故障诊断方法及系统 | |
CN116383747A (zh) | 基于多时间尺度深度卷积生成对抗网络的异常检测方法 | |
CN116680643A (zh) | 一种深度对比学习与密度聚类结合的异常检测方法 | |
CN117475191A (zh) | 一种特征对齐域对抗神经网络的轴承故障诊断方法 | |
CN114595753A (zh) | 面向数据稀缺场景的综合供能服务站油气回收系统故障检测方法 | |
CN112149804B (zh) | 一种新型卷积神经网络模型及应用 | |
CN112069621B (zh) | 基于线性可靠度指标的滚动轴承剩余使用寿命的预测方法 | |
CN117972585A (zh) | 一种基于pca-ddpm和cnn的小样本条件下故障增强诊断方法 | |
CN117668689A (zh) | 基于元学习算法的轨道交通列车轴承故障诊断方法及装置 | |
CN112560674A (zh) | 一种声音信号质量的检测方法及系统 | |
CN117191396A (zh) | 一种基于两阶段迁移的齿轮箱故障诊断方法 | |
CN116127398B (zh) | 一种基于机理模型与多源数据融合的液压泵故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |