CN114152442B - 基于迁移卷积神经网络的滚动轴承跨工况故障检测方法 - Google Patents
基于迁移卷积神经网络的滚动轴承跨工况故障检测方法 Download PDFInfo
- Publication number
- CN114152442B CN114152442B CN202111599703.7A CN202111599703A CN114152442B CN 114152442 B CN114152442 B CN 114152442B CN 202111599703 A CN202111599703 A CN 202111599703A CN 114152442 B CN114152442 B CN 114152442B
- Authority
- CN
- China
- Prior art keywords
- neural network
- convolutional neural
- rolling bearing
- network model
- migration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 105
- 238000005096 rolling process Methods 0.000 title claims abstract description 69
- 238000013508 migration Methods 0.000 title claims abstract description 62
- 230000005012 migration Effects 0.000 title claims abstract description 62
- 238000001514 detection method Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 36
- 238000005516 engineering process Methods 0.000 claims abstract description 8
- 238000000605 extraction Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 32
- 210000002569 neuron Anatomy 0.000 claims description 15
- 238000011176 pooling Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 230000008014 freezing Effects 0.000 claims description 2
- 238000007710 freezing Methods 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 238000003745 diagnosis Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 210000002364 input neuron Anatomy 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Acoustics & Sound (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了一种基于迁移卷积神经网络的滚动轴承跨工况故障检测方法。本发明首先利用滑动窗口技术进行数据切割,并对每个窗口的振动信号进行归一化处理。其次,搭建一维卷积神经网络模型与迁移卷积神经网络模型,一维卷积神经网络简单方便,训练参数少,能够满足故障检测领域实时性的需求;在源域训练数据训练一维卷积神经网络模型的基础上,使用MMD微调卷积网络特征提取模块,构造微调迁移卷积神经网络使得迁移卷积神经网络提取的特征具有域不变性,进而进行目标域数据的故障检测。本发明所使用的迁移卷积神经网络结构简单,训练速度快,且具有较高的跨工况准确率,为滚动轴承跨工况故障检测提供了一种新方法。
Description
技术领域
本发明涉及滚动轴承故障检测方法,具体涉及基于迁移卷积神经网络的滚动轴承跨工况故障检测方法。
背景技术
滚动轴承作为旋转机械的核心部分,长时间暴露在恶劣的工作环境下,持续受到外界的冲击和干扰,极易在不同的位置出现不同程度的损伤。滚动轴承一旦出现损伤,随着时间的推移,就会出现一系列的连锁反应,轻则导致机械设备生产偏离指定指标,影响产品的质量,重则导致设备损坏,造成重大的经济损失,甚至严重的人员伤亡。因此,对旋转机械及其关键部件进行状态监测和故障诊断,对保障设备健康稳定运行、提升运转效率和避免重大事故发生具有重要的意义。
然而,在现实环境中,常常由于工作的需求,导致机械设备需要在不同的转速或负载工况条件下运行,也就导致了实际所采集的数据与历史数据概率分布不一致情况。当存在上述问题时,基于设备的历史故障数据建立而得的诊断模型就会出现预测准确率低的现象,这是因为该模型自动提取的特征并不具有域不变性,当出现未知的目标域振动信号样本时,该模型不能够预测出其所属类型。因此,在实际诊断任务中,一个关键的难题是如何对不同时期的数据进行有效挖掘和关联,实现知识的迁移和复用,从而提高模型的分类和泛化能力。
发明内容
针对上述问题,本发明的目的是提出一种基于迁移卷积神经网络的滚动轴承跨工况故障检测方法。其可以在工况和转速发生改变时,仍旧获得较为理想的故障检测结果,而且大大减少了诊断时间。
本发明技术方案所需步骤如下:
基于迁移卷积神经网络的滚动轴承跨工况故障检测方法,其特征在于包含如下步骤:
步骤1、数据预处理;收集已有工况S下的滚动轴承原始振动信号,构建源域振动信号数据集;收集目标工况T下的滚动轴承原始振动信号,构建目标域振动信号数据集;利用滑动窗口技术对每一组原始振动信号进行分割,并对每个窗口的振动信号进行归一化处理,构建源域样本数据集和目标域样本数据集;
步骤2、模型搭建;构建一维卷积神经网络模型M和迁移卷积神经网络模型I;
步骤3、模型训练;训练一维卷积神经网络模型M和迁移卷积神经网络模型I;
步骤4、滚动轴承状态识别;
将步骤1处理后的滚动轴承目标域数据集输入到训练好的迁移卷积神经网络模型I中,预测数据集中滚动轴承的状态信息,验证模型表现;
步骤5、滚动轴承实时监测;
利用滑动窗口技术,对滚动轴承振动信号进行截取,并依次送入训练好的迁移卷积神经网络模型I;可根据迁移卷积神经网络模型I的输出值获取滚动轴承对应的状态信息。
具体的步骤1数据预处理实现如下:
1-1.数据截取:为了构建训练迁移卷积神经网络模型I所需要的数据集,需要使用滑动窗口方法对不同工况下的滚动轴承原始振动信号进行截取,构建源域数据集与目标域数据集。
所述的已有工况S下的滚动轴承原始振动信号,按照故障位置和故障程度分类为w个类型,每种故障类型下的原始振动信号为
所述的目标工况T下的滚动轴承原始振动信号,按照故障位置和故障程度分为w个类型,每种故障类型下的原始振动信号为
1-2.设定滑动窗口长度为L,滑动步长为S,生成样本数为t;样本di={x0,…xL},i=1,2,3,…,t;得到源域样本数据集DS={d1,d2,d3...,dt}和目标域样本数据集DT={d1,d2,d3,...,dt};
1-3.样本归一化:为了加快迁移卷积神经网络模型I的训练过程,需要对截取后的滚动轴承原始振动信号样本进行归一化处理。对源域样本数据集和目标域样本数据集的样本进行归一化处理,处理方法为zero-mean方法;
1-4.源域样本数据集与目标域样本数据集切分:将源域样本数据集DS切分为和将目标域样本数据集DT切分为/>和/>
步骤2、模型搭建
2-1.构建一维卷积神经网络模型M:
构建的一维卷积神经网络模型M的结构为输入层-卷积层-池化层-卷积层-池化层-卷积层-池化层-全连接层-全连接层-输出层;将输入一维卷积神经网络模型M进行训练,得到网络参数;
2-2.构建迁移卷积神经网络模型I:
构建的迁移卷积神经网络模型I的结构与一维卷积神经网络模型M相同;将训练好的一维卷积神经网络模型M的参数迁移至迁移卷积神经网络模型I;将源域样本数据集和目标域样本数据集/>输入迁移卷积神经网络模型I,冻结特征提取层,进行微调;
2-3.将目标域样本数据集输入迁移卷积神经网络模型I,验证模型表现。
步骤3、模型训练
3-1、训练一维卷积神经网络模型M:
将输入一维卷积神经网络模型M进行训练,得到网络参数;训练过程包括前向传播和误差反向传播。
3-2、训练迁移卷积神经网络模型I:
将训练好的一维卷积神经网络模型M参数迁移至迁移卷积神经网络模型I;将源域样本数据集和目标域样本数据集/>输入迁移卷积神经网络模型I进行训练,计算/>的分类误差;同时计算数据集/>和/>经过特征提取层之后的最大平均差异,进行微调;
步骤4、分类识别
4-1、滚动轴承状态识别:将步骤1处理后的滚动轴承目标域数据集输入到训练好的迁移卷积神经网络模型I中,预测数据集中滚动轴承的状态信息,验证模型表现。
步骤5、滚动轴承实时监测
利用滑动窗口技术,对滚动轴承振动信号进行截取,并依次送入训练好的迁移卷积神经网络模型I。可根据迁移卷积神经网络模型I的输出值获取滚动轴承对应的状态信息。
进一步的,步骤1所述的预处理方式是一种有效的深度学习数据集增强方法方法。采用滑动窗口截取滚动轴承原始振动信号能够扩大模型训练数据集的容量。
进一步的,步骤1所述的归一化处理方法为zero-mean方法,该方法是一种有效的加快神经网络训练过程的方法。
进一步的,步骤3所述的模型训练过程包括前向传播和误差反向传播两个过程。
前向传播过程如下:
①卷积层操作:公式表达为:其中,yl(i,j)表示第l层的第i个卷积核与第j个输入的卷积输出值;/>表示第l层的第i个卷积核的权值向量;表示第l层中第j个被卷积区域;/>为第l层的第i个卷积核的第j′个权值,xl(j+j′)为第l层中第j个至第j′个被卷积区域,W为卷积核宽度;
②激活层操作:公式表达为:al(i,j)=σ(yl(i,j)),其中,σ(·)是非线性激活函数,al (i,j)是卷积层输出yl(i,j)的激活值。
③池化层操作:公式表达为:pl(i,j)=down(al(i,j)),式中down(·)表示下采样函数,pl(i,j)是激活层输出al(i,j)的降采样值。
④全连接层:公式表达为:式中zl+1(j)是第l+1层第j个神经元的logits值;/>是第l层第i个神经元与第l+1层第j个神经元之间的权值;al(i)是第l层第i个神经元的激活值;/>是第l层所有神经元对第l+1层第j个神经元的偏置值。
⑤目标函数:采用交叉熵损失函数,其公式表达分别为:
其中为第k个样本经过卷积神经网络Softmax层第j个类别的实际输出值,/>为第k个样本的真实目标分布,即当目标类别为j时,/>否则/>m为输入的小批量的大小。
误差反向传播过程如下:
①全连接层的梯度计算:首先计算目标函数L关于zl+1(j)的导数,其公式表达式为:然后计算目标函数关于权值/>与偏置/>的导数,其公式表达式为:
②池化层的梯度计算:池化层没有权值,所以只需要计算目标函数L关于池化层输入神经元的导数。具体公式描述为:
③卷积层的梯度计算:首先需要计算目标函数L关于卷积层输出值的导数,其公式表达为:然后计算目标函数L关于卷积核的导数,其公式表达为:
进一步的,步骤3所述的最大平均差异是一种核学习方法,可用来度量两个分布在再生希尔伯特空间的距离。具体公式描述为:
其中,|XS|表示源域数据集个数,|XT|表示目标域数据集个数;xs表示源域样本,xt表示目标域样本;φ(·)表示映射函数。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明采用了深度学习的方法用于故障检测。相比于传统方法,基于深度学习的方法学习能力强,能够深层次挖掘出数据潜在的信息,具有更强的表征能力。基于深度学习的方法在面临海量的数据时,表现更加优异。
2、本发明使用了一维卷积神经网络方法。现有的大部分基于卷积神经网络方法的异常检测算法多是使用二维卷积神经网络。由于滚动轴承原始振动信号是一维信号,从而避免了转换操作带来的耗时,同时一维卷积神经网络相比于二维卷积神经网络参数更少,降低了系统的复杂度,更容易操作。
3、本发明使用了迁移学习方法,能够有效的解决滚动轴承因转速与负载发生变化而引起的训练集与测试集概率分布不一致的情况。使用迁移学习的方法一方面能够利用基于历史数据学习到的故障特征,另一方面大大减少了时间,避免了重新训练一个神经网络模型,有利于轴承状态的实时监测。
本发明测试了凯斯西储大学滚动轴承数据集,具有较强的跨工况故障检测能力。基于迁移卷积神经网络的故障诊断方法能够有效地解决源域数据集与目标域数据集分布不一致带来的模型表现退化问题。本发明一共测试了12个迁移故障诊断实验,经典的一维卷积神经网络方法在12个实验上的平均准确率为85%。相比之下,基于迁移卷积神经网络方法的平均准确率由85%提升至95%。
附图说明
图1是本发明实施例中滚动轴承跨工况故障检测方法的流程图。
图2是本发明实施例中一维卷积神经网络模型M结构示意图。
图3是本发明实施例中卷积神经网络具体参数配置。
图4是本发明实施例中神经网络全连接层的参数设置。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本实施例是一种基于迁移卷积神经网络的滚动轴承跨工况故障检测方法。采集不同工况下的滚动轴承原始振动信号,并做预处理。根据轴承故障位置和故障程度,构建包含多种故障状态和正常状态的滚动轴承源域数据集和目标域数据集。将源域数据集分为两个部分,其中一部分将作为一维卷积神经网络模型M的输入,由卷积神经网络自动学习具有可分性的故障特征。然后使用迁移学习方法,将其参数迁移至迁移卷积神经网络模型I,并利用源域数据集的另一半与目标域数据集的一半进行微调,获得最终的迁移卷积神经网络模型I,实现滚动轴承跨工况故障检测。
如图1所示,为本发明实施例的滚动轴承跨工况故障检测方法的流程图,包括如下步骤:
步骤1、数据预处理
1-1、数据截取:为了构建训练一维卷积神经网络模型M所需要的数据集,需要使用滑动窗口技术对滚动轴承原始振动信号进行截取,设置滑动窗口窗长为包含1200个采样点,窗口步长设置为300个采样点。
1-2、归一化处理:为了加快模型训练过程,对截取后的滚动轴承信号样本进行归一化处理,所采用的方法是zero-mean normalization方法。其计算方法如下:
其中,x是滚动轴承信号样本,μ是样本数据的均值,σ是样本数据的标准差。
步骤2、模型搭建
2-1、构建卷积神经网络模型:卷积神经网络是一种特殊的前向传播神经网络,是仿造动物的视知觉机制构建而成的。如图2所示,卷积神经网络通常包括卷积层、池化层和全连接层。它们共同完成特征学习与分类的任务。在本实施例中,因为输入信号为一维信号,所以所使用的卷积神经网络为一维卷积神经网络模型M。
针对滚动轴承故障检测,卷积神经网络的输入为滚动轴承振动信号样本数据X。若第i层是卷积层,则其输出可以表示为ai=σ(ai-1*Wi+bi);其中ai-1是第i-1层卷积神经网络输出值,Wi是第i层的权值向量,*为一维卷积操作,bi为第i层的偏置向量,σ(·)为激活函数。在本实施例中,激活函数设置为ReLU,其公式表达为:f(x)=max(0,x);若第i层是池化层,则其输出为:pl(i,j)=down(al(i,j)),其中down(·)表示下采样函数函数。在本实施例中,下采样函数设置为最大值采样,其公式表达为:
为了将所有提取的特征进行整合,将池化后的特征传输,作为全连接层的输入。最终输出C个元素向量,其中C是类别的数量。在此实施例中,类别数量设置为10。此外,在最终采用Softmax分类器来计算每个类的预测概率,其公式表达为:
上式中输出的qj值是从0到1的正数,表示为目标类别的预测概率。
在本发明实施例中,构建的卷积神经网络包括3个卷积层和3个池化层以及3个全连接层,如图3所示,为实施例中卷积神经网络的具体参数设置,如图4所示,为实施例中全连接层的具体参数设置。
步骤3、模型训练
3-1、训练卷积神经网络:完成网络的搭建任务之后,便可以采用有监督学习的方式进行网络训练。该步骤的目的是能够让模型以极小的误差拟合滚动轴承数据,得到最优的网络参数,接着便可以利用优化完成后的模型进行迁移学习,并得到最终的迁移卷积神经网络模型I。
卷积神经网络的训练包括前向训练和反向优化两个步骤。前向训练的过程如下:
①卷积层操作:公式表达为:其中,/>为第l层的第i个卷积核的第j′个权值,xl(j+j′)为第l层中第j个被卷积的局部区域,W为卷积核宽度;
②激活层操作:公式表达为:al(i,j)=σ(yl(i,j)),其中,σ(·)是非线性激活函数,al (i,j)是卷积层输出yl(i,j)的激活值。
③池化层操作:公式表达为:pl(i,j)=down(al(i,j)),式中down(·)表示下采样函数,pl(i,j)是激活层输出al(i,j)的降采样值。
④全连接层:公式表达为:式中zl+1(j)是第l+1层第j个神经元的logits值;/>是第l层第i个神经元与第l+1层第j个神经元之间的权值;al(i)是第l层第i个神经元的激活值;/>是第l层所有神经元对第l+1层第j个神经元的偏置值。
⑤目标函数:采用交叉熵损失函数,其公式表达分别为:其中/>为第k个样本经过卷积神经网络Softmax层第j个类别的实际输出值,/>为第k个样本的真实目标分布,即当目标类别为j时,/>否则/>m为输入的小批量的大小。在本实施例中,选取交叉熵损失函数作为目标函数,其主要用于衡量两个概率分布的差异性。
反向优化是采用有监督的学习方式进行调优,通过调优之后使得卷积神经网络模型中的每一层隐层的网络权重和偏置都能够达到最优值。反向优化具体的计算过程如下:
①全连接层的梯度计算:首先计算目标函数L关于zl+1(j)的导数,其公式表达式为:然后计算目标函数关于权值/>与偏置/>的导数,其公式表达式为: 最后,计算目标函数L关于激活函数为ReLU的全连接隐藏层的激活值al(i)以及logits值zl(j)的导数:
②池化层的梯度计算:池化层没有权值,所以只需要计算目标函数L关于池化层输入神经元的导数。对于最大值池化具体做法是:在
正向传播时记录下池化区域的最大值位置tm,设当t=tm时,
在反向传播过程中,将导数值传递给第tm个神经元,其他神经元不参与传递,即导数为0。具体公式描述为:
③卷积层的梯度计算:首先需要计算目标函数L关于卷积层输出值的导数,由于卷积层使用的激活函数是ReLU,其公式表达为:
然后计算目标函数L关于卷积核的导数,其公式表达为:
本发明实施例中所采用的反向传播算法为Adam(adaptive moments)算法。设θ为模型中可训练参数,如权重和偏置,那么Adam算法更新流程为:
①计算梯度:
②更新有偏一阶矩估计:mt←β1·mt-1+(1-β1)·gt
③更新有偏二阶矩估计:
④修正一阶矩偏差:
⑤修正二阶矩偏差:
⑥更新参数:
其中,β1和β2为矩阵计指数衰减率,默认值分别为0.9和0.999,数值稳定常数ε=10-8,m,ν和t分别为一阶矩、二阶矩和训练次数,并且都初始化为0。在训练过程中,超参数(如学习率、小批量大小、训练次数)对训练效果都有一定的影响,需要反复试验来调整它们以达到最佳的实验效果。
3-2、训练迁移卷积神经网络模型I:为了完成滚动轴承跨工况故障检测,需要对迁移卷积神经网络模型I进行微调,微调过程是一种半监督学习方法,使用带标签源域数据集与不带标签目标域数据集/>作为模型的输入,对迁移卷积神经网络模型I进行训练。使用迁移卷积神经网络模型I的特征提取层对源域数据集/>与目标域数据集/>进行特征提取,并计算提取后特征的最大平均差异,然后将源域数据集/>的抽象特征作为全连接层的输入,计算带标签源域数据集/>的分类误差。最后执行反向优化过程,逐步最小化分类误差与最大平均差异。
步骤4、分类识别
4-1、分类识别:在完成迁移卷积神经网络模型I微调之后,需要使用目标域数据集验证模型的泛化能力,输出目标域各个故障类型的故障概率分布,其最大概率对应故障类别作为诊断结果。
步骤5、滚动轴承状态实时监测
5-1、检测流程:
经过步骤4验证之后的模型具有较强的预测能力,能够正确分类滚动轴承状态,因此可以使用该模型进行状态检测,具体做法为:利用滑动窗口技术,连续地将滚动轴承振动信号进行切割,并送入迁移卷积神经网络模型I,通过观察网络的输出值,得到最终的轴承状态。
通过实施例的实验结果可以看出,本发明能够有效实时地检测轴承状态信息,为提前采用防护措施提供了重要参考依据。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (6)
1.基于迁移卷积神经网络的滚动轴承跨工况故障检测方法,其特征在于包含如下步骤:
步骤1、数据预处理;收集已有工况S下的滚动轴承原始振动信号,构建源域振动信号数据集;收集目标工况T下的滚动轴承原始振动信号,构建目标域振动信号数据集;利用滑动窗口技术对每一组原始振动信号进行分割,并对每个窗口的振动信号进行归一化处理,构建源域样本数据集和目标域样本数据集;
步骤2、模型搭建;构建一维卷积神经网络模型M和迁移卷积神经网络模型I;
步骤3、模型训练;训练一维卷积神经网络模型M和迁移卷积神经网络模型I;
步骤4、滚动轴承状态识别;
将步骤1处理后的滚动轴承目标域数据集输入到训练好的迁移卷积神经网络模型I中,预测数据集中滚动轴承的状态信息,验证模型表现;
步骤5、滚动轴承实时监测;
利用滑动窗口技术,对滚动轴承振动信号进行截取,并依次送入训练好的迁移卷积神经网络模型I;可根据迁移卷积神经网络模型I的输出值获取滚动轴承对应的状态信息;
步骤1中原始振动信号进行分割实现如下:
设定滑动窗口长度为L,滑动步长为S,生成样本数为t;样本di={x0,…,xL},i=1,2,3,…,t;得到源域样本数据集DS={d1,d2,d3...,dt}和目标域样本数据集DT={d1,d2,d3,...,dt};然后对源域样本数据集与目标域样本数据集切分:将源域样本数据集DS切分为和/>将目标域样本数据集DT切分为/>和/>
步骤2具体实现如下:
2-1.构建一维卷积神经网络模型M:
构建的一维卷积神经网络模型M的结构为输入层-卷积层-池化层-卷积层-池化层-卷积层-池化层-全连接层-全连接层-输出层;将Da S输入一维卷积神经网络模型M进行训练,得到网络参数;
2-2.构建迁移卷积神经网络模型I:
构建的迁移卷积神经网络模型I的结构与一维卷积神经网络模型M相同;将训练好的一维卷积神经网络模型M的参数迁移至迁移卷积神经网络模型I;将源域样本数据集和目标域样本数据集/>输入迁移卷积神经网络模型I,冻结特征提取层,进行微调;
2-3.将目标域样本数据集输入迁移卷积神经网络模型I,验证模型表现。
2.根据权利要求1所述的基于迁移卷积神经网络的滚动轴承跨工况故障检测方法,其特征在于步骤1所述的已有工况S下的滚动轴承原始振动信号,按照故障位置和故障程度分类为w个类型,每种故障类型下的原始振动信号为步骤1所述的目标工况T下的滚动轴承原始振动信号,按照故障位置和故障程度分为w个类型,每种故障类型下的原始振动信号为/>
3.根据权利要求1所述的基于迁移卷积神经网络的滚动轴承跨工况故障检测方法,其特征在于所述一维卷积神经网络模型M训练方法包括前向传播和反向传播两个过程。
4.根据权利要求3所述的基于迁移卷积神经网络的滚动轴承跨工况故障检测方法,其特征在于所述的迁移卷积神经网络模型I微调属于半监督学习方法,将源域样本数据集和目标域样本数据集/>输入迁移卷积神经网络模型I,计算源域样本数据集/>的分类误差,同时计算源域样本数据集/>和目标域样本数据集/>经过特征提取后的最大平均差异。
5.根据权利要求4所述的基于迁移卷积神经网络的滚动轴承跨工况故障检测方法,其特征在于所采用的最大平均差异可用来度量两个分布在再生希尔伯特空间的距离,其公式为:
其中,|XS|表示源域数据集个数,|XT|表示目标域数据集个数;xs表示源域样本,xt表示目标域样本;φ(·)表示映射函数。
6.根据权利要求4所述的基于迁移卷积神经网络的滚动轴承跨工况故障检测方法,其特征在于滚动轴承故障实时监测实现如下:
将滚动轴承振动信号样本数据X输入迁移卷积神经网络模型I,若第i层是卷积层,则其输出表示为ai=σ(ai-1*Wi+bi);其中ai-1是第i-1层迁移卷积神经网络模型I的输出值,Wi是第i层的权值向量,*为一维卷积操作,bi为第i层的偏置向量,σ(·)为激活函数;若第i层是池化层,则其输出为:pl(i,j)=down(al(i,j)),其中down(·)表示下采样函数函数;pl(i,j)是输出al(i,j)的降采样值;下采样函数设置为最大值采样,其公式表达为:
为了将所有提取的特征进行整合,将池化后的特征作为全连接层的输入;最终输出C个元素向量,其中C是类别的数量;最终采用Softmax分类器来计算每个类的预测概率;其公式表达为:
上式中输出的qj值是从0到1的正数,表示为目标类别的预测概率;式中zl+1(j)是第l+1层第j个神经元的logits值,其中qj为经过卷积神经网络Softmax层第j个类别的实际输出值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111599703.7A CN114152442B (zh) | 2021-12-24 | 2021-12-24 | 基于迁移卷积神经网络的滚动轴承跨工况故障检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111599703.7A CN114152442B (zh) | 2021-12-24 | 2021-12-24 | 基于迁移卷积神经网络的滚动轴承跨工况故障检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114152442A CN114152442A (zh) | 2022-03-08 |
CN114152442B true CN114152442B (zh) | 2024-05-24 |
Family
ID=80452223
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111599703.7A Active CN114152442B (zh) | 2021-12-24 | 2021-12-24 | 基于迁移卷积神经网络的滚动轴承跨工况故障检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114152442B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115037641B (zh) * | 2022-06-01 | 2024-05-03 | 网络通信与安全紫金山实验室 | 基于小样本的网络流量检测方法、装置、电子设备及介质 |
CN114970044B (zh) * | 2022-06-20 | 2023-05-19 | 华北电力大学 | 一种基于阈值卷积神经网络的滚动轴承故障诊断方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918752A (zh) * | 2019-02-26 | 2019-06-21 | 华南理工大学 | 基于迁移卷积神经网络的机械故障诊断方法、设备及介质 |
CN110398369A (zh) * | 2019-08-15 | 2019-11-01 | 贵州大学 | 一种基于1-dcnn和lstm融合的滚动轴承故障诊断方法 |
CN110595775A (zh) * | 2019-09-19 | 2019-12-20 | 电子科技大学 | 基于多分支多尺度卷积神经网络的滚动轴承故障诊断方法 |
CN111238814A (zh) * | 2019-09-30 | 2020-06-05 | 杭州安脉盛智能技术有限公司 | 一种基于短时希尔伯特变换的滚动轴承故障诊断方法 |
CN111709292A (zh) * | 2020-05-18 | 2020-09-25 | 杭州电子科技大学 | 基于递归图和深度卷积网络的压气机振动故障检测法 |
CN113111923A (zh) * | 2021-03-23 | 2021-07-13 | 浙江工业大学 | 一种基于一维迁移学习卷积神经网络集成模型的供水管网泄漏检测与定位方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK2316009T3 (da) * | 2008-07-24 | 2014-05-05 | Siemens Ag | Fremgangsmåde og anordning til bestemmelse og overvågning af tilstanden af et rulleleje |
-
2021
- 2021-12-24 CN CN202111599703.7A patent/CN114152442B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918752A (zh) * | 2019-02-26 | 2019-06-21 | 华南理工大学 | 基于迁移卷积神经网络的机械故障诊断方法、设备及介质 |
CN110398369A (zh) * | 2019-08-15 | 2019-11-01 | 贵州大学 | 一种基于1-dcnn和lstm融合的滚动轴承故障诊断方法 |
CN110595775A (zh) * | 2019-09-19 | 2019-12-20 | 电子科技大学 | 基于多分支多尺度卷积神经网络的滚动轴承故障诊断方法 |
CN111238814A (zh) * | 2019-09-30 | 2020-06-05 | 杭州安脉盛智能技术有限公司 | 一种基于短时希尔伯特变换的滚动轴承故障诊断方法 |
CN111709292A (zh) * | 2020-05-18 | 2020-09-25 | 杭州电子科技大学 | 基于递归图和深度卷积网络的压气机振动故障检测法 |
CN113111923A (zh) * | 2021-03-23 | 2021-07-13 | 浙江工业大学 | 一种基于一维迁移学习卷积神经网络集成模型的供水管网泄漏检测与定位方法 |
Non-Patent Citations (1)
Title |
---|
融合迁移卷积神经网络的跨域滚动轴承故障诊断;王廷轩 等;《电子测量技术》;20210531;第167-174页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114152442A (zh) | 2022-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lei et al. | Fault diagnosis of wind turbine based on Long Short-term memory networks | |
CN111830408B (zh) | 一种基于边缘计算和深度学习的电机故障诊断系统及方法 | |
CN111898634B (zh) | 一种基于深度对抗域自适应的智能故障诊断方法 | |
Zhang et al. | An enhanced convolutional neural network for bearing fault diagnosis based on time–frequency image | |
Xu et al. | A novel multi-scale CNN and attention mechanism method with multi-sensor signal for remaining useful life prediction | |
CN113255848B (zh) | 基于大数据学习的水轮机空化声信号辨识方法 | |
CN106874957A (zh) | 一种滚动轴承故障诊断方法 | |
CN114152442B (zh) | 基于迁移卷积神经网络的滚动轴承跨工况故障检测方法 | |
Lindemann et al. | Anomaly detection and prediction in discrete manufacturing based on cooperative LSTM networks | |
Ye et al. | AKSNet: A novel convolutional neural network with adaptive kernel width and sparse regularization for machinery fault diagnosis | |
CN206504869U (zh) | 一种滚动轴承故障诊断装置 | |
Wang et al. | Random convolutional neural network structure: An intelligent health monitoring scheme for diesel engines | |
CN116010900A (zh) | 基于自注意力机制的多尺度特征融合齿轮箱故障诊断方法 | |
Xu et al. | Fault diagnosis of rolling bearing based on online transfer convolutional neural network | |
CN118154174B (zh) | 一种工业设备智慧运维云平台 | |
CN112147432A (zh) | 基于注意力机制的BiLSTM模块、变压器状态诊断方法和系统 | |
Deng et al. | Remaining useful life prediction of machinery: A new multiscale temporal convolutional network framework | |
CN113988136B (zh) | 一种基于深度学习与智能优化的中压断路器故障诊断方法 | |
CN114528547B (zh) | 基于社区特征选择的icps无监督在线攻击检测方法和设备 | |
Li et al. | Fault diagnosis of motor bearings based on a convolutional long short-term memory network of bayesian optimization | |
CN117009916A (zh) | 基于多传感器信息融合与迁移学习的促动器故障诊断方法 | |
CN116894215A (zh) | 一种基于半监督动态图注意的齿轮箱故障诊断方法 | |
Zheng et al. | An unsupervised transfer learning method based on SOCNN and FBNN and its application on bearing fault diagnosis | |
Dang et al. | seq2graph: Discovering dynamic non-linear dependencies from multivariate time series | |
Shan et al. | Semisupervised fault diagnosis of gearbox using weighted graph-based label propagation and virtual adversarial training |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |