CN114722952B - 一种基于表示学习的轴承故障检测和分类的一体化方法 - Google Patents
一种基于表示学习的轴承故障检测和分类的一体化方法 Download PDFInfo
- Publication number
- CN114722952B CN114722952B CN202210416390.5A CN202210416390A CN114722952B CN 114722952 B CN114722952 B CN 114722952B CN 202210416390 A CN202210416390 A CN 202210416390A CN 114722952 B CN114722952 B CN 114722952B
- Authority
- CN
- China
- Prior art keywords
- fault
- neural network
- bearing
- layer
- fault detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 title claims abstract description 93
- 238000013528 artificial neural network Methods 0.000 claims abstract description 123
- 238000012549 training Methods 0.000 claims abstract description 67
- 230000008569 process Effects 0.000 claims abstract description 45
- 230000007246 mechanism Effects 0.000 claims abstract description 38
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 48
- 210000002569 neuron Anatomy 0.000 claims description 45
- 238000013507 mapping Methods 0.000 claims description 33
- 230000036541 health Effects 0.000 claims description 28
- 239000011159 matrix material Substances 0.000 claims description 20
- 238000013508 migration Methods 0.000 claims description 15
- 230000005012 migration Effects 0.000 claims description 15
- 230000014509 gene expression Effects 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 12
- 238000005457 optimization Methods 0.000 claims description 12
- 238000001228 spectrum Methods 0.000 claims description 7
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000003745 diagnosis Methods 0.000 abstract description 13
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000005096 rolling process Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000013526 transfer learning Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009760 electrical discharge machining Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
一种基于表示学习的轴承故障检测和分类的一体化方法,本发明涉及轴承故障检测和分类的一体化方法。本发明的目的是为了解决现有采用数据驱动的方法进行轴承故障诊断过程中,获得大量的轴承故障样本是十分困难的,以及为不同的故障类型的数据设计准确的标签存在很大的限制的问题。过程为:1、提取轴承的振动数据;2、特征提取:从时域、频域2个角度提取数据的特征;3、搭建故障检测神经网络:故障检测神经网络包括编码器、噪声引入、自注意力机制层以及解码器;4、训练故障检测神经网络;5、搭建故障分类神经网络;6、训练故障分类神经网络;7、在线故障检测与故障分类。本发明用于轴承故障诊断与人工智能相结合的学科交叉领域。
Description
技术领域
本发明属于轴承故障诊断与人工智能相结合的学科交叉领域,具体涉及基于表示学习的轴承故障检测和分类的一体化方法。
背景技术
作为精密机械设备中的重要部件,轴承的健康状态对于机器的正常运行具有至关重要的作用。如何及时诊断轴承故障,减少因其故障产生的损失,对于机械设备的安全性和可靠性具有关键性意义。
故障诊断主要包含故障的检测和分类这两个方面。目前针对轴承的故障诊断方法从总体上可以分为基于模型的方法、数据驱动的方法。基于模型的故障诊断方法需要依靠丰富的先验知识来构建轴承的故障模型。然而,考虑到轴承的工作情况多变,工作环境复杂,精确的故障建模存在着很大的困难,基于模型的故障诊断方法存在着一定的局限性。另一方面,数据驱动的方法无需事先了解轴承故障的先验知识,通过分析轴承工作过程中产生的振动信号便可以实现轴承的故障诊断。近年来,新兴的深度学习方法,例如卷积神经网络、循环神经网络及其变体长短时记忆网络被广泛地应用于轴承的故障诊断的研究中。作为学习类算法的一个重要分支,表示学习包含了自编码器、迁移学习以及流形学习等多种方式。值得注意的是,表示学习通过将原始特征转化为机器能够处理的方式,具备很强的可靠性与可解释性。近年来,表示学习以其在数据挖掘任务的优势,在智能系统的故障诊断和预测性维护领域中获得了越来越广泛的关注。
虽然数据驱动的方法在轴承故障诊断方面应用广泛,但是大多数据驱动的方法都需要充足的故障标签数据训练算法模型,并且要求神经网络的训练数据和测试数据之间遵循相同的分布假设。然而,大多数的精密机械设备都被要求在正常状态下工作,获得大量的轴承故障样本是十分困难的。如何在无监督的条件下,仅仅采用轴承健康状态下工作的数据进行故障检测存在着很大的挑战。与此同时,工作条件、负载情况以及轴承类型等多种变化因素都会影响着数据分布,为不同的故障类型的数据设计准确的标签存在很大的限制。因此,如何将在小样本故障数据的条件下,将正常数据下进行预训练所获得的源域模型迁移到故障样本所代表的目的域进行故障诊断需要深入的研究。
发明内容
本发明的目的是为了解决现有采用数据驱动的方法进行轴承故障诊断过程中,获得大量的轴承故障样本是十分困难的,以及为不同的故障类型的数据设计准确的标签存在很大的限制的问题,而提出一种基于表示学习的轴承故障检测和分类的一体化方法。
一种基于表示学习的轴承故障检测和分类的一体化方法具体过程为:
步骤1、提取轴承的振动数据:
通过在轴承座上的传感器设备,采集轴承在工作过程中的振动数据;
所述振动数据包括健康数据和故障数据;
步骤2、特征提取:
从时域、频域2个角度提取轴承在工作过程中的振动数据的特征;
所述振动数据的特征包括健康数据的特征和故障数据的特征;
步骤3、搭建故障检测神经网络:
故障检测神经网络包括编码器、噪声引入、自注意力机制层以及解码器;
步骤4、训练故障检测神经网络:
将步骤2提取到的健康数据的特征输入到步骤3搭建的故障检测神经网络中,获得训练好的故障检测神经网络;
步骤5、搭建故障分类神经网络:
将步骤4训练好的故障检测神经网络中编码器、噪声引入和自注意力机制层部分作为预训练模型实现模型迁移,最后通过全连接层模块实现向故障标签的映射;
步骤6、训练故障分类神经网络:
将步骤2提取到的故障数据的特征输入到步骤5搭建的故障分类神经网络中,获得训练好的故障分类神经网络;
步骤7、在线故障检测与故障分类。
本发明的有益效果为:
本发明旨在解决轴承的故障检测和分类问题,而提出的一种基于表示学习的轴承故障检测和分类的一体化方法。在离线阶段,对于无监督条件下基于MDAE-SAMB的轴承故障检测,仅仅采用轴承在健康状态下的振动数据进行特征提取,训练MDAE-SAMB网络;对于基于模型迁移的轴承故障分类,则是将离线训练获得的MDAE-SAMB中从输入层到瓶颈层的部分进行模型迁移,仅采用少量的样本(10%)训练故障分类网络。接着,对于在线阶段,通过故障检测网络实现在线故障检测。如果检测到发生故障,则通过训练好的故障分类网络中,便可以实现在线故障分类。最后,采用准确率评估提出的基于表示学习的轴承故障检测和分类的一体化方法对于轴承在线工作过程中故障的检测和分类效果。本发明的工作流程图如图1所示。
本发明的目的是无需任何故障标签数据,便可以实现对于轴承故障检测,以及在小样本故障条件下,仅仅采用很少量的故障样本进行离线训练,实现轴承的故障分类,而提出一种基于表示学习的轴承故障检测和分类的一体化方法。
本发明提出了基于表示学习的轴承故障检测和分类的一体化方法,无需任何故障标签数据,能够实现在无监督的条件下故障的检测。与此同时,在小样本故障条件下,仅仅采用很少的故障样本进行离线训练,从而实现轴承的故障分类。
(1)无需任何故障标签数据,本发明提出了一种无监督条件下基于MDAE-SAMB的轴承故障检测表示学习方法。在瓶颈层神经元引入自注意力机制,能够为不同的瓶颈层神经元分配不同的权重,提升数据样本的重构效果,由此提高故障检测的准确率。
(2)在小样本故障条件下,本发明提出了一种基于模型的迁移学习的轴承故障分类方法。将经过正常数据预训练所获得的源域模型,迁移到故障样本所代表的目的域中,仅仅采用很少的故障样本进行离线训练,同样可以实现高准确率的故障在线分类。
(3)本发明将故障检测任务和故障分类任务结合起来,由此构建出一种基于表示学习的轴承故障检测和分类的一体化方法,从而实现轴承在线工作过程中故障的检测和分类,能够实现在无监督的条件下对于轴承故障的检测,以及小样本故障条件下轴承的故障分类。
附图说明
图1是本发明的工作流程图;
图2是本发明中针对故障检测任务的基于对瓶颈层神经元的自注意力机制修正去噪自编码器(Modified denoising auto-encoder with Self-attention mechanism forbottleneck layer,MDAE-SAMB)的神经网络结构图;
图3是本发明中针对故障分类任务的基于迁移学习的对瓶颈层神经元的自注意力机制修正去噪自编码器的神经网络结构图;
图4a是关于轴承内圈故障的在线检测结果图;JRes,th表示残差故障阈值;JRes表示单个样本的残差;
图4b是关于轴承滚动体故障的在线检测结果图;JRes,th表示残差故障阈值;JRes表示单个样本的残差;
图4c是关于轴承Centered外圈故障的在线检测结果图;JRes,th表示残差故障阈值;JRes表示单个样本的残差;
图4d是关于轴承Orthogonal外圈故障的在线检测结果图;JRes,th表示残差故障阈值;JRes表示单个样本的残差;
图4e是关于轴承Opposite外圈故障的在线检测结果图;JRes,th表示残差故障阈值;JRes表示单个样本的残差;
图5是本发明中在线故障分类的结果图。
具体实施方式
具体实施方式一:本实施方式一种基于表示学习的轴承故障检测和分类的一体化方法具体过程为:
本发明中表示学习方法用的是神经网络;
步骤1、提取轴承的振动数据:
通过在轴承座上的传感器设备,例如无线传感器等,采集轴承在工作过程中的振动数据,作为基于表示学习的轴承故障检测和分类的一体化方法的输入;
所述振动数据包括健康数据和故障数据(故障数据10%用于离线训练);
步骤2、特征提取:
为了更好地反映轴承工作过程中的健康状态,考虑从时域、频域2个角度提取轴承在工作过程中的振动数据的特征,由此作为神经网络的输入;
所述振动数据的特征包括健康数据的特征和故障数据的特征;
步骤3、搭建故障检测神经网络:
故障检测神经网络包括编码器、噪声引入、自注意力机制层以及解码器;
为了减少噪声信号对于样本重构的影响,并为不同的瓶颈层神经元分配不同的权重,进而有效实现故障检测,本发明提出了一种基于对瓶颈层神经元的自注意力机制修正去噪自编码器(Modified denoising auto-encoder with Self-attention mechanismfor bottleneck layer,MDAE-SAMB)的神经网络。仅仅采用轴承在健康状态下的振动数据进行特征提取获得的特征,由此训练MDAE-SAMB网络。MDAE-SAMB结构主要由编码器、噪声引入、自注意力机制层以及解码器这四部分组成。
步骤4、训练故障检测神经网络:
将步骤2提取到的健康数据的特征输入到步骤3搭建的故障检测神经网络中,获得训练好的故障检测神经网络,构建输入的健康数据之间的耦合关系;
步骤5、搭建故障分类神经网络:
将轴承的健康数据作为源域,将轴承的故障数据作为目的域;
将第4步通过离线训练获得的MDAE-SAMB中从输入层到瓶颈层的部分,换句话说,将步骤4训练好的故障检测神经网络中编码器、噪声引入和自注意力机制层部分作为预训练模型实现模型迁移,最后通过全连接层模块实现向故障标签的映射;
步骤6、训练故障分类神经网络:
将步骤2提取到的故障数据的特征输入到步骤5搭建的故障分类神经网络中,获得训练好的故障分类神经网络,仅仅采用少量的故障样本(10%)进行训练,构建输入的故障数据和故障标签之间的映射关系;
步骤7、在线故障检测与故障分类。
评估神经网络的故障检测与分类的效果:
采用准确率(Accuracy)指标评估提出的基于表示学习的轴承故障检测和分类的一体化方法对于轴承在线工作过程中故障的检测和分类效果。准确率为检测任务或者分类任务正确的样本和所有样本之间的比值。
具体实施方式二:本实施方式与具体实施方式一不同的是,所述步骤2中特征提取:为了更好地反映轴承工作过程中的健康状态,考虑从时域、频域2个角度提取轴承在工作过程中的振动数据的特征,由此作为神经网络的输入;
所述振动数据的特征包括健康数据的特征和故障数据的特征;
具体过程为:
为了更好地反映轴承工作过程中的健康状态,本发明考虑从时域、频域和这两个角度,提取轴承在工作阶段中所产生振动数据的特征,由此作为神经网络的输入。作为常用的信号特征,时域特征目前已被广泛地应用于描述轴承的健康状态。时域特征包含无量纲统计参数(如偏度、峰度因子等)以及有量纲统计参数(如最大值、最小值、均方根值等)。考虑到无量纲统计参数的波动较为剧烈,其稳定性也较差,为此本发明采用对时域信号特征敏感的7种有量纲统计参数作为时域特征TF1~TF7;
时域特征表达式如公式(1)—(7)所示:
TF5=|min{xi|i=1,2,...,L}| (5)
TF6=|max{xi|i=1,2,...,L}| (6)
TF7=TF6-TF5 (7)
其中L为轴承振动信号的长度,i是时间的编号,xi为i时刻轴承振动信号幅度,max和min分别为最大值和最小值;TF1为信号的绝对平均值,TF2为信号的标准差,TF3为信号的均方根值,TF4为信号的均方根值和绝对平均值的比值,TF5为信号的最小值,TF6为信号的最大值,TF7为信号的极差;
由于轴承在发生故障时,从频域的角度来看,某些故障对应频段的能量会发生明显的变化。因此,本发明考虑采用快速傅里叶变换(FastFourier Transform,FFT)的方式将轴承振动信号转化为频谱数据,进而提取其频域特征FF1~FF7;
频域特征表达式如公式(8)—(14)所示:
其中K是频谱总长度,j是频率的编号,sj是振动信号FFT变换之后的频谱幅度,fj为对应sj的频率;FF1为频率对于频谱总长度的均值,FF2为频谱幅度标准差,FF3为频率幅度的加权平均值,FF4为频率幅度的加权标准差,FF5为频率幅度的加权标准差与加权平均值的比值,FF6为频谱幅度的均方根值,FF7为描述功率谱收敛情况的统计量;
综上,对于轴承每一个方向(例如横向、纵向)上的振动信号,可以提取出时域、频域共计14种特征,用于描述轴承在工作过程中的健康状态。
其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是,所述步骤3中搭建故障检测神经网络:故障检测神经网络包括编码器、噪声引入、自注意力机制层以及解码器;
为了减少噪声信号对于样本重构的影响,并为不同的瓶颈层神经元分配不同的权重,进而有效实现故障检测,本发明提出了一种基于对瓶颈层神经元的自注意力机制修正去噪自编码器(Modified denoising auto-encoder with Self-attention mechanismfor bottleneck layer,MDAE-SAMB)的神经网络。仅仅采用轴承在健康状态下的振动数据进行特征提取获得的特征,由此训练MDAE-SAMB网络。MDAE-SAMB结构主要由编码器、噪声引入、自注意力机制层以及解码器这四部分组成。
具体过程为:
自动编码器是一种重要的无监督表示学习方法。自动编码器包含了编码层、瓶颈层以及解码层。为了减少噪声信号对于样本重构的影响,并为不同的瓶颈层神经元分配不同的权重,进而有效实现故障检测,本发明提出了一种基于对瓶颈层神经元的自注意力机制修正去噪自编码器的神经网络。仅仅采用轴承在健康状态下的振动数据进行特征提取,便可以训练MDAE-SAMB网络。MDAE-SAMB的灵感来自于去噪自编码器(Denoising auto-encoder,DAE)。作为深度学习中一种重要的无监督表示学习方法,传统DAE通过在输入层加入噪声以提高网络模型的鲁棒性。本发明提出的MDAE-SAMB相对于DAE存在2个方面的改进:(1)在瓶颈层加入噪声信号,在瓶颈层神经元的输入上叠加噪声,以增强网络鲁棒性;(2)对于瓶颈层神经元引入自注意力机制,为不同的瓶颈层神经元分配不同的权重,提升网络的重构效果。MDAE-SAMB的结构如图2所示。该网络结构主要由编码器、噪声引入、自注意力机制层以及解码器这四部分组成,分别描述如下:
(1)编码器:
编码器用于构建输入特征向量xf和编码向量xe之间的映射关系,表达成公式(15)所示的形式:
其中f(.)表示编码层映射函数,h(.)表示非线性激活函数,和/>分别表示第k个编码层的权重矩阵和偏置向量;W1 e和/>分别表示第1个编码层的权重矩阵和偏置向量;具体地,/>m为特征向量的维数,/>q为瓶颈层神经元的个数;
编码器包含了输入层、隐含层、瓶颈层。本发明在自编码器的基础上进行了改进,体现在对瓶颈层神经元运用了自注意力机制。
(2)噪声引入:
(3)自注意力机制层:
通过自注意力机制层获得瓶颈层的各个神经元与各个神经元的重要性程度之间的映射关系,如表达式(17)所示:
其中,s表示瓶颈层神经元的重要性程度,s=[s1,…,sa,…,sq]T,q为瓶颈层神经元个数,T为转置,Ws和bs分别表示自注意力机制层的权重矩阵和偏置向量,φ为sigmoid激活函数,sa表示第a个神经元的重要性程度;
在获得瓶颈层每一个神经元的重要性程度后,通过softmax函数获得归一化后的重要性程度,如表达式(18)所示:
其中αa表示瓶颈层第a个神经元归一化后的重要性程度,将瓶颈层每个神经元的归一化重要性程度α1,α2,...,αq同加入噪声后的瓶颈层各个神经元所代表的值相乘后即可获得自注意力机制网络层的输出xs,作为后续解码器的输入,表达式如式(19)所示:
(4)解码器:
为了最小化输入向量和输出向量之间的差异,基于MDAE-SAMB的故障检测神经网络参数将由公式(21)所示的损失函数进行参数更新:
对于离线训练阶段,仅仅采用轴承在健康状态下的振动数据经过特征提取可以获得特征,训练MDAE-SAMB网络。由于在离线训练阶段网络所学习到的是正常数据之间的耦合关系。因此,一旦将发生故障的轴承数据输入到训练好的神经网络中,MDAE-SAMB产生的重构误差便会高于健康工作状态时的重构误差。具体地,重构误差可以表示为公式(22)所示的形式:
其中,n为训练样本的编号, 为第n个样本的第1个特征的残差值,/>为第n个样本的第m个特征的残差值,m为输入特征向量的维数;f(.)表示编码层映射函数,g(.)表示解码层映射函数,φ为sigmoid激活函数,⊙为点积运算表示符;
在此基础上,一旦输入到故障检测神经网络的轴承在线数据所计算出的残差JRes大于公式(23)中的阈值,则说明此时的轴承发生了故障;否则轴承便是健康的工作状态。
其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是,所述步骤4中训练故障检测神经网络:
将步骤2提取到的健康数据的特征输入到步骤3搭建的故障检测神经网络中,获得训练好的故障检测神经网络,构建输入的健康数据之间的耦合关系;
具体过程为:
整个训练故障检测神经网络的过程在1块GTX3080Ti的GPU硬件环境下进行,故障检测神经网络的优化算法为Adam优化算法,损失函数为公式(21)中所示的平方误差损失函数,故障检测神经网络的批量训练尺寸为256个样本,学习速率为0.001。
其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是,所述步骤5中搭建故障分类神经网络:
将轴承的健康数据作为源域,将轴承的故障数据作为目的域;
将第4步通过离线训练获得的MDAE-SAMB中从输入层到瓶颈层的部分,换句话说,将步骤4训练好的故障检测神经网络中编码器、噪声引入和自注意力机制层部分作为预训练模型实现模型迁移,最后通过全连接层模块实现向故障标签的映射;
具体过程为:
作为一种重要的表示学习方法,迁移学习指的是将在相似源任务中学习到的模型迁移到目标任务中,从而达到提升实现目标任务的泛化能力。基于模型迁移的迁移学习方法是一种重要的迁移学习方法。具体而言,迁移学习的源任务和目标任务可能存在类似的特征表示,基于模型迁移的方法便是将在源任务上经过预训练获得的模型迁移到目标任务的模型中,实现模型参数的共享,进而提升模型的性能。基于此,本发明将轴承的健康数据作为源域,将轴承故障数据作为目的域。本发明将利用在离线训练获得的MDAE-SAMB中从输入层到瓶颈层的部分,换句话说,将编码器、噪声引入和自注意力机制层等部分作为预训练模型迁移到故障分类任务中。最后通过全连接层模块实现向故障标签的映射。
其中,n为样本的编号,φ为sigmoid激活函数,softmax为归一化函数,v为噪声信号,f(.)表示编码层映射函数;
考虑到轴承存在内圈、外圈以及滚动体等多种故障,本发明采用one-hot编码的形式将故障类型进行编码(假设有3种故障那么这3种故障的标签分别就是[1,0,0],[0,1,0],[0,0,1],将标签表示成计算机能够处理的方式);在此基础上,构建预训练模型的输出和故障分类结果之间的映射关系,如公式(25)所示:
值得注意的是,基于表示学习的迁移学习方法能够实现模型参数的共享,提升模型的训练效率。考虑到故障样本很难在实际工业设备中获得,为此,本发明仅采用少量的故障样本(10%)进行训练。
其它步骤及参数与具体实施方式一至四之一相同。
具体实施方式六:本实施方式与具体实施方式一至五之一不同的是,所述步骤6中训练故障分类神经网络:
将步骤2提取到的故障数据的特征输入到步骤5搭建的故障分类神经网络中,获得训练好的故障分类神经网络,仅仅采用少量的故障样本(10%)进行训练,构建输入的故障数据和故障标签之间的映射关系;
具体过程为:
将步骤1中故障数据的10%进行步骤2的特征提取,提取到的故障数据的特征输入到步骤5搭建的故障分类神经网络中,获得训练好的故障分类神经网络,构建输入的故障数据和故障标签之间的映射关系;
对于第5步中搭建的故障分类神经网络,仅仅采用少量的故障样本(10%)进行训练,构建输入的故障数据和故障标签之间的映射关系。
整个训练故障检测神经网络的过程在1块GTX3080Ti的GPU硬件环境下进行,故障检测神经网络的优化算法为Adam优化算法,损失函数为公式(26)所示的交叉熵损失函数,网络的批量训练尺寸为256个样本,学习速率为0.001。
其它步骤及参数与具体实施方式一至五之一相同。
具体实施方式七:本实施方式与具体实施方式一至六之一不同的是,所述步骤7中在线故障检测与故障分类;具体过程为:
步骤71、提取轴承在线振动数据(按照步骤1的过程);
步骤72、从时域、频域2个角度提取轴承在线振动数据的特征(按照步骤2的过程);
步骤73、将提取的轴承在线振动数据的特征输入到步骤4训练好的故障检测神经网络,便可以实现在线故障检测,如果未检测到发生故障,继续执行步骤71;如果检测到发生故障,执行步骤74;
步骤74、将故障对应的振动数据的特征输入到步骤6获得训练好的故障分类神经网络,实现在线故障分类。
其它步骤及参数与具体实施方式一至六之一相同。
采用以下实施例验证本发明的有益效果:
实施例一:
本发明采用了美国凯斯西储大学凯斯工程学院提供的实际滚动轴承振动数据验证本发明所提出的基于表示学习的轴承故障检测和分类的一体化方法。轴承实验台由电动机、电磁负载、联轴器以及基座组成。实验过程中采用加速度传感器采集轴承的振动数据,并详细记录了电动机的实际测试条件以及轴承故障类型。实验装置中的轴承是型号为6205-2RS JEM和6203-2RS JEM的深沟球滚动体轴承。值得一提的是,轴承采用电火花加工(EDM)的方式设置故障。根据位置的不同可以划分为:内圈故障、滚动体故障、Centered外圈故障、Orthogonal外圈故障以及Opposite外圈故障。本发明采用轴承在健康状态4种电机负载条件下工作产生的数据,以及4种电机负载条件在12k驱动端所施加的直径为0.007英寸的故障数据为案例来验证本发明所提出的方法,其具体步骤如下:
第1步:提取轴承的振动数据。由于轴承在健康状态下工作产生的数据有两个测量通道,因此能够获得轴承在两个方向上的振动信号。轴承实验台在轴承处于健康状态时产生了大量的数据,健康状态下的采样频率为12000HZ,将512个采样点设置为单个样本。在此基础上,每一种工况可以获得829个样本。因此,在健康状态下的4种负载条件下一共可以获得3316个健康样本。另一方面,对于每一种类型的故障,在4种电机负载条件下一共可以获得950个样本。
第2步:特征提取。为了更好地反映轴承工作过程中的健康状态,考虑从时域和频域这两个角度,提取轴承在工作阶段中所产生振动数据的特征,由此作为神经网络的输入。对于轴承在横向和纵向两个方向上产生的振动信号,经过特征处理对于每一个方向可以获得轴承工作过程中在时域和频域上共计14维特征。因此,通过横向和纵向两个方向一共可以获得28维特征。总结而言,通过对轴承健康状态下的振动数据经过特征处理可以获得维数为3316*28的特征矩阵。
第3步:搭建故障检测神经网络。为了减少噪声信号对于样本重构的影响,并为不同的瓶颈层神经元分配不同的权重,本发明搭建基于MDAE-SAMB的轴承故障检测网络。
第4步,训练故障检测神经网络。将步骤2中经过特征处理的健康数据输入到步骤3中搭建的故障检测神经网络中,构建输入的健康数据之间的耦合关系。其中,整个训练故障检测神经网络的过程在1块GTX3080Ti的GPU硬件环境下进行,故障检测神经网络的优化算法为Adam优化算法,损失函数为公式(21)中的平方误差损失函数,网络的批量训练尺寸为256个样本,学习速率为0.001。为了确定最佳的网络超参数,本发明针对MDAE-SAMB中隐含层的层数以及瓶颈层神经元的个数对于网络重构误差的影响设计对比实验。考虑到输入样本的特征维数为28,因此瓶颈层神经元的个数应当小于输入特征维数28。通过输入向量xf和之间的重构均方根误差RMSE评估网络的性能。对比结果如表格1所示。从表格1可以看出,RMSE始终位于10-4这一数量级,由此可知本发明提出的MDAE-SAMB网络有着很好的重构效果。当瓶颈层神经元数目为24、隐含层的数目为3时,网络的重构效果最好。
表1神经网络的超参数配置
第5步,搭建故障分类神经网络。将轴承的健康数据作为源域,将在线的工作数据作为目的域。将第4步通过离线训练获得的MDAE-SAMB中从输入层到瓶颈层的部分,换句话说,将编码器、噪声引入和自注意力机制层等部分作为预训练模型实现模型迁移。最后通过全连接层模块实现向故障标签的映射。
第6步,训练故障检测神经网络。对于第5步中搭建的故障分类神经网络,仅仅采用少量的故障样本(10%)进行训练,也就是95个样本进行训练,构建输入的故障数据和故障标签之间的映射关系。其中,整个训练故障检测神经网络的过程在1块GTX3080Ti的GPU硬件环境下进行,故障检测神经网络的优化算法为Adam优化算法,损失函数为交叉熵损失函数,网络的批量训练尺寸为256个样本,学习速率为0.001。
第7步,在线故障检测与故障分类。对于在线阶段,通过第1步提取的轴承在线振动数据经过第2步特征提取后输入到第4步训练好的故障检测网络中,便可以实现在线故障检测。如果检测到发生故障,则再将特征输入到第5步训练好的故障分类网络中,便可以实现在线故障分类。图4a、4b、4c、4d、4e和图5分别展示了在线故障检测与故障分类的结果图。从图4a、4b、4c、4d、4e中可以看出,对于每一种故障,根据公式(22)计算获得的样本重构残差均位于由公式(23)计算获得的阈值以上,由此可知本发明所提出的MDAE-SAMB在无监督条件下对于轴承有着很好的故障检测效果。图5为故障分类结果的混淆矩阵,可以看出在仅仅采用少量的故障样本(10%)进行训练的条件下,本发明所提出的基于迁移学习的对瓶颈层神经元的自注意力机制修正去噪自编码器的神经网络对于每一种故障的分类准确率能够达到95%以上。
第8步,评估神经网络的故障检测与分类的效果。采用准确率(Accuracy)指标评估提出的基于表示学习的轴承故障检测和分类的一体化方法对于轴承在线工作过程中故障的检测和分类效果。其中,故障检测的准确率结果如表格2所示;故障分类的准确率结果如表格3所示。
表2故障检测的准确率结果
表3故障分类的准确率结果
本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (6)
1.一种基于表示学习的轴承故障检测和分类的一体化方法,其特征在于:所述方法具体过程为:
步骤1、提取轴承的振动数据:
通过在轴承座上的传感器设备,采集轴承在工作过程中的振动数据;
所述振动数据包括健康数据和故障数据;
步骤2、特征提取:
从时域、频域2个角度提取轴承在工作过程中的振动数据的特征;
所述振动数据的特征包括健康数据的特征和故障数据的特征;
步骤3、搭建故障检测神经网络:
故障检测神经网络包括编码器、噪声引入、自注意力机制层以及解码器;
步骤4、训练故障检测神经网络:
将步骤2提取到的健康数据的特征输入到步骤3搭建的故障检测神经网络中,获得训练好的故障检测神经网络;
步骤5、搭建故障分类神经网络:
将步骤4训练好的故障检测神经网络中编码器、噪声引入和自注意力机制层部分作为预训练模型实现模型迁移,最后通过全连接层模块实现向故障标签的映射;
步骤6、训练故障分类神经网络:
将步骤2提取到的故障数据的特征输入到步骤5搭建的故障分类神经网络中,获得训练好的故障分类神经网络;
步骤7、在线故障检测与故障分类;
所述步骤2中特征提取:
从时域、频域2个角度提取轴承在工作过程中的振动数据的特征;
所述振动数据的特征包括健康数据的特征和故障数据的特征;
具体过程为:
时域特征表达式如公式(1)—(7)所示:
TF5=|min{xi|i=1,2,...,L}| (5)
TF6=|max{xi|i=1,2,...,L}| (6)
TF7=TF6-TF5 (7)
其中L为轴承振动信号的长度,i是时间的编号,xi为i时刻轴承振动信号幅度,max和min分别为最大值和最小值;TF1为信号的绝对平均值,TF2为信号的标准差,TF3为信号的均方根值,TF4为信号的均方根值和绝对平均值的比值,TF5为信号的最小值,TF6为信号的最大值,TF7为信号的极差;
频域特征表达式如公式(8)—(14)所示:
其中K是频谱总长度,j是频率的编号,sj是振动信号FFT变换之后的频谱幅度,fj为对应sj的频率;FF1为频率对于频谱总长度的均值,FF2为频谱幅度标准差,FF3为频率幅度的加权平均值,FF4为频率幅度的加权标准差,FF5为频率幅度的加权标准差与加权平均值的比值,FF6为频谱幅度的均方根值,FF7为描述功率谱收敛情况的统计量;
综上,对于轴承每一个方向上的振动信号,可以提取出时域、频域共计14种特征。
2.根据权利要求1所述一种基于表示学习的轴承故障检测和分类的一体化方法,其特征在于:所述步骤3中搭建故障检测神经网络:
故障检测神经网络包括编码器、噪声引入、自注意力机制层以及解码器;
具体过程为:
(1)编码器:
编码器用于构建输入特征向量xf和编码向量xe之间的映射关系,表达成公式(15)所示的形式:
其中f(.)表示编码层映射函数,h(.)表示非线性激活函数,和/>分别表示第k个编码层的权重矩阵和偏置向量;W1 e和/>分别表示第1个编码层的权重矩阵和偏置向量;m为特征向量的维数,/>q为瓶颈层神经元的个数;
(2)噪声引入:
(3)自注意力机制层:
通过自注意力机制层获得瓶颈层的各个神经元与各个神经元的重要性程度之间的映射关系,如表达式(17)所示:
其中,s表示瓶颈层神经元的重要性程度,s=[s1,…,sa,…,sq]T,q为瓶颈层神经元个数,T为转置,Ws和bs分别表示自注意力机制层的权重矩阵和偏置向量,φ为sigmoid激活函数,sa表示第a个神经元的重要性程度;
在获得瓶颈层每一个神经元的重要性程度后,通过softmax函数获得归一化后的重要性程度,如表达式(18)所示:
其中αa表示瓶颈层第a个神经元归一化后的重要性程度,将瓶颈层每个神经元的归一化重要性程度α1,α2,...,αq同加入噪声后的瓶颈层各个神经元所代表的值相乘后即可获得自注意力机制网络层的输出xs,作为后续解码器的输入,表达式如式(19)所示:
(4)解码器:
故障检测神经网络参数将由公式(21)所示的损失函数进行参数更新:
其中,n为训练样本的编号, 为第n个样本的第1个特征的残差值,/>为第n个样本的第m个特征的残差值,m为输入特征向量的维数;f(.)表示编码层映射函数,g(.)表示解码层映射函数,φ为sigmoid激活函数,⊙为点积运算表示符;
输入到故障检测神经网络的轴承在线数据所计算出的残差JRes大于公式(23)中的阈值,则说明此时的轴承发生了故障;否则轴承便是健康的工作状态。
3.根据权利要求2所述一种基于表示学习的轴承故障检测和分类的一体化方法,其特征在于:所述步骤4中训练故障检测神经网络:
将步骤2提取到的健康数据的特征输入到步骤3搭建的故障检测神经网络中,获得训练好的故障检测神经网络;
具体过程为:
整个训练故障检测神经网络的过程在1块GTX3080Ti的GPU硬件环境下进行,故障检测神经网络的优化算法为Adam优化算法,损失函数为公式(21)中所示的损失函数,故障检测神经网络的批量训练尺寸为256个样本,学习速率为0.001。
4.根据权利要求3所述一种基于表示学习的轴承故障检测和分类的一体化方法,其特征在于:所述步骤5中搭建故障分类神经网络:
将步骤4训练好的故障检测神经网络中编码器、噪声引入和自注意力机制层部分作为预训练模型实现模型迁移,最后通过全连接层模块实现向故障标签的映射;
具体过程为:
其中,n为样本的编号,φ为sigmoid激活函数,softmax为归一化函数,v为噪声信号,f(.)表示编码层映射函数;
采用one-hot编码的形式将故障类型进行编码;
5.根据权利要求4所述一种基于表示学习的轴承故障检测和分类的一体化方法,其特征在于:所述步骤6中训练故障分类神经网络:
将步骤2提取到的故障数据的特征输入到步骤5搭建的故障分类神经网络中,获得训练好的故障分类神经网络;
具体过程为:
将步骤1中故障数据的10%进行步骤2的特征提取,提取到的故障数据的特征输入到步骤5搭建的故障分类神经网络中,获得训练好的故障分类神经网络,构建输入的故障数据和故障标签之间的映射关系;
整个训练故障检测神经网络的过程在1块GTX3080Ti的GPU硬件环境下进行,故障检测神经网络的优化算法为Adam优化算法,损失函数为公式(26)所示的交叉熵损失函数,网络的批量训练尺寸为256个样本,学习速率为0.001。
6.根据权利要求5所述一种基于表示学习的轴承故障检测和分类的一体化方法,其特征在于:所述步骤7中在线故障检测与故障分类;具体过程为:
步骤71、提取轴承在线振动数据;
步骤72、从时域、频域2个角度提取轴承在线振动数据的特征;
步骤73、将提取的轴承在线振动数据的特征输入到步骤4训练好的故障检测神经网络,如果未检测到发生故障,继续执行步骤71;如果检测到发生故障,执行步骤74;
步骤74、将故障对应的振动数据的特征输入到步骤6获得训练好的故障分类神经网络,实现在线故障分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210416390.5A CN114722952B (zh) | 2022-04-20 | 2022-04-20 | 一种基于表示学习的轴承故障检测和分类的一体化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210416390.5A CN114722952B (zh) | 2022-04-20 | 2022-04-20 | 一种基于表示学习的轴承故障检测和分类的一体化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114722952A CN114722952A (zh) | 2022-07-08 |
CN114722952B true CN114722952B (zh) | 2023-05-26 |
Family
ID=82245207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210416390.5A Active CN114722952B (zh) | 2022-04-20 | 2022-04-20 | 一种基于表示学习的轴承故障检测和分类的一体化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114722952B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115587294B (zh) * | 2022-12-08 | 2023-02-28 | 中国空气动力研究与发展中心设备设计与测试技术研究所 | 一种基于叶尖间隙和轴承振动的压缩机故障诊断方法 |
CN115628910B (zh) * | 2022-12-22 | 2023-03-17 | 广东技术师范大学 | 一种基于迁移学习的嵌入式轴承故障诊断装置及设备 |
CN115683631B (zh) * | 2023-01-03 | 2023-03-14 | 山东天瑞重工有限公司 | 轴承故障检测方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109902393B (zh) * | 2019-03-01 | 2022-06-14 | 哈尔滨理工大学 | 一种基于深层特征和迁移学习的变工况下滚动轴承故障诊断方法 |
CN110995475B (zh) * | 2019-11-20 | 2023-04-11 | 国网湖北省电力有限公司信息通信公司 | 一种基于迁移学习的电力通信网故障检测方法 |
CN111709292B (zh) * | 2020-05-18 | 2023-05-26 | 杭州电子科技大学 | 基于递归图和深度卷积网络的压气机振动故障检测法 |
CN113392881B (zh) * | 2021-05-27 | 2023-04-18 | 重庆大学 | 一种基于迁移学习的旋转机械故障诊断方法 |
CN113867307B (zh) * | 2021-08-20 | 2022-10-21 | 天津大学 | 基于深度神经网络的航天器智能故障诊断方法 |
-
2022
- 2022-04-20 CN CN202210416390.5A patent/CN114722952B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114722952A (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114722952B (zh) | 一种基于表示学习的轴承故障检测和分类的一体化方法 | |
CN112629863B (zh) | 变工况下动态联合分布对齐网络的轴承故障诊断方法 | |
Xia et al. | Fault diagnosis for rotating machinery using multiple sensors and convolutional neural networks | |
Kong et al. | Attention recurrent autoencoder hybrid model for early fault diagnosis of rotating machinery | |
CN112161784B (zh) | 基于多传感器信息融合迁移网络的机械故障诊断方法 | |
Xia et al. | Multi-stage fault diagnosis framework for rolling bearing based on OHF Elman AdaBoost-Bagging algorithm | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN113935406A (zh) | 基于对抗流模型的机械设备无监督故障诊断方法 | |
CN112257862B (zh) | 一种基于关系网络标记样本扩充的半监督辨识方法 | |
CN110991471B (zh) | 一种高速列车牵引系统故障诊断方法 | |
CN112396088A (zh) | 一种小样本下隐式激励对抗训练的机械故障智能诊断方法 | |
CN114297918A (zh) | 基于全注意力深度网络和动态集成学习的航空发动机剩余寿命预测方法 | |
CN116465623B (zh) | 一种基于稀疏Transformer的齿轮箱寿命预测方法 | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN117473411A (zh) | 基于改进Transformer模型的轴承寿命预测方法 | |
CN116842379A (zh) | 一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法 | |
CN111562109A (zh) | 一种机械设备深度学习状态识别与诊断方法 | |
CN114861778A (zh) | 一种改进宽度迁移学习的不同负载下滚动轴承状态快速分类方法 | |
CN113984389A (zh) | 一种基于多感受野与改进胶囊图神经网络的滚动轴承故障诊断方法 | |
CN111428788A (zh) | 基于深度学习的汽轮机发电机组转子多故障诊断方法及系统 | |
CN114626625A (zh) | 基于多模块U-BiLSTM网络的轴承寿命预测方法 | |
Techane et al. | Rotating machinery prognostics and application of machine learning algorithms: Use of deep learning with similarity index measure for health status prediction | |
CN113723592A (zh) | 一种基于风电齿轮箱监测系统的故障诊断方法 | |
CN113094996A (zh) | 基于dda域自适应机制的智能故障迁移诊断方法 | |
Ahsan et al. | Advanced Fault Diagnosis in Rotating Machines Using 2D Grayscale Images with Improved Deep Convolutional Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |