CN117030263A - 多传感器信号融合下基于改进残差网络的轴承故障诊断方法 - Google Patents
多传感器信号融合下基于改进残差网络的轴承故障诊断方法 Download PDFInfo
- Publication number
- CN117030263A CN117030263A CN202311004708.XA CN202311004708A CN117030263A CN 117030263 A CN117030263 A CN 117030263A CN 202311004708 A CN202311004708 A CN 202311004708A CN 117030263 A CN117030263 A CN 117030263A
- Authority
- CN
- China
- Prior art keywords
- sensor signal
- fault
- signals
- channel
- network under
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000003745 diagnosis Methods 0.000 title claims abstract description 48
- 230000004927 fusion Effects 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 20
- 230000008569 process Effects 0.000 claims abstract description 16
- 230000001360 synchronised effect Effects 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 15
- 230000007246 mechanism Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 11
- 238000011176 pooling Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 230000006835 compression Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 2
- 239000013598 vector Substances 0.000 claims description 2
- 239000012634 fragment Substances 0.000 claims 1
- 230000009191 jumping Effects 0.000 claims 1
- 230000000630 rising effect Effects 0.000 claims 1
- 108091006146 Channels Proteins 0.000 description 19
- 238000012360 testing method Methods 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 7
- 230000004913 activation Effects 0.000 description 6
- 230000000052 comparative effect Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000010892 electric spark Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012733 comparative method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Acoustics & Sound (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,属于轴承故障诊断技术领域。本发明步骤如下:1、利用多个传感器,获取轴承部件在不同的同步振动信号数据,将数据进行归一化;2、截取数据集中的一维振动信号,将该一维振动信号转换成二维信号,再将不同位置得到的二维信号融合成多通道输入;3、利用包含3个双连接注意力残差模块的诊断模型,学习多通道输入数据中的故障特征,对提取的通道特征进行差异性划分,并计算模型训练过程中的损失值;4、根据得到的损失值,利用误差反向传播算法对整个网络的权重参数进行更新,直至达到最大更新次数。本发明在变工况和噪声环境干扰下,具有良好的故障分类精度。
Description
技术领域
本发明涉及轴承故障诊断技术领域,具体涉及一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法。
背景技术
轴承作为旋转机械的关键部件,一旦发生故障直接影响设备性能,甚至会造成安全事故。因此,精确地诊断轴承健康状态对设备平稳运行有着重要意义。
随着信息化技术的广泛应用,各种工业场景下收集的振动数据,被越来越多地应用到故障监测中,这使得基于数据驱动的故障诊断技术得到了快速发展,并在实际生产中得到广泛应用。传统的故障诊断方法主要包含振动信号的预处理、特征提取和故障状态分类三个部分。传统方法虽然对提升故障诊断效果有一定价值,但存在数据预处理需要大量先验知识、特征提取不充分、不同场景下的泛化性能差等不足。
研究者利用深度学习理论开发出了多种深层网络模型,用于故障数据的自适应学习,实现数据间非线性关系的深度挖掘,从而摆脱对专家知识的依赖。卷积神经网络作为一种典型的多级前馈式神经网络,有着利于模型训练的稀疏连接结构和权值共享特性,因此被学者们引入故障诊断领域并开展了深入研究。该类方法通过构建深层次的诊断模型增强特征提取能力,在一定程度上提高了分类准确率,但随着网络深度的增加,模型训练变得困难,难以进一步提高分类效果。一方面,深度网络在训练时会发生梯度弥散,进而出现过拟合;另一方面,该类网络模型仅学习来自一个传感器收集的信号数据,而其中包含的故障特征信息有限,使得模型难以适应恒定状态以外的负载或转速改变下的工作条件,这些因素使卷积神经网络在故障诊断领域的深入发展受到限制。因此,需要探索能有效提取故障特征信息,并在变工况条件下有良好故障诊断性能的轴承故障诊断方法。
发明内容
1.发明要解决的技术问题
考虑复杂工况条件下变负载、变转速以及环境噪声干扰等影响因素,本发明提出了多传感器信号融合下基于改进残差网络的轴承故障诊断方法。该方法简化了数据处理过程,提高了输入数据中包含的故障特征信息。同时,所设计的DARM堆叠而成的深层网络可以有效挖掘融合信号中包含的深层特征信息,利用DARM的注意力机制(Sequeeze-and-Excitation Networks,SE)可以使模型学习到更具有判别性的故障特征,从而提升模型在复杂环境下的识别性能。
2.技术方案
为达到上述目的,本发明提供的技术方案为:
本发明的一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,步骤如下:
步骤1、利用多个传感器,获取轴承部件在不同运行状态下,不同位置的同步振动信号数据,将数据进行归一化;
步骤2、以固定长度截取数据集中的一维振动信号,将该一维振动信号转换成二维信号,再将不同位置得到的二维信号融合成多通道输入;
步骤3、利用包含3个双连接注意力残差模块的诊断模型,学习多通道输入数据中的故障特征,对提取的通道特征进行差异性划分,并通过交叉熵损失函数计算模型训练过程中的损失值;
步骤4、根据得到的损失值,利用误差反向传播算法对整个网络的权重参数进行更新,直至达到网络设置的最大更新次数;
步骤5、将训练好的模型应用于轴承故障诊断,输出故障分类结果。
3.有益效果
采用本发明提供的技术方案,与已有的公知技术相比,具有如下显著效果:
(1)本发明针对单一传感器获取特征信息不足、深层卷积神经网络提取的故障特征缺乏重要性区分的问题,提出多传感器信号融合下基于改进残差网络的轴承故障诊断方法,本发明首先对从不同位置采集的振动信号,采用传感器信息融合策略转换成多通道输入,以获取更全面的故障特征信息;再针对融合后的多通道输入,设计双连接残差网络来增强模型对特征信息的提取,同时引入通道注意力机制模块,对输出的特征赋予不同权重,使模型提取到的特征更具有鉴别性,改善了识别准确率;最后,利用全局平均池化减少网络参数,缓和深层网络的梯度消失问题。将所提方法应用于复杂工况下的轴承数据集,实验表明,该方法在变工况和噪声环境干扰下,具有良好的故障分类精度。
(2)本发明采用的传感器信息融合策略,简化了数据处理过程,提高了输入数据中包含的故障特征信息。
(3)本发明中,由DARM堆叠而成的深层网络可以有效挖掘融合信号中包含的深层特征信息,且利用DARM的通道注意力机制可以使模型学习到更具有判别性的故障特征,从而提升模型在复杂环境下的识别性能。
附图说明
图1是本发明的故障诊断流程图;
图2是本发明的数据重构示意图;
图3是本发明的双连接残差网络示意图;
图4是本发明多传感器信号融合下基于改进残差网络的轴承故障诊断方法模型图;
图5是本发明变负载诊断精度对比结果图;
图6是本发明噪声变化诊断精度对比结果图;
图7是本发明在有噪声变化的变转速实验诊断精度对比图;
图8是本发明诊断过程降维可视化图。
具体实施方式
为进一步了解本发明的内容,结合附图和实施例对本发明作详细描述。
实施例1
本实施例提供了一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,该方法以不同位置的传感器为信号源,采用数据信息融合策略将单传感器对应时间收集的振动信号,融合成多通道输入。然后,设计了双连接注意力残差模块,实现网络对特征信息的差异性划分,使提取到的故障特征更具有鉴别力,并通过堆叠该模块加深网络,实现模型对融合信号中隐含故障特征的深度挖掘。最后,利用全局平均池化来减缓深层网络所带来的梯度消失问题。
如图1所示,该方法具体包含以下步骤:
步骤1、利用多个传感器,获取轴承部件在不同运行状态下,不同位置的同步振动信号数据,将其进行归一化,并将其划分为训练集和测试集。
本实施例使用凯斯西储大学轴承实验数据集(CWRU)对本发明提供的多传感器信号融合下基于改进残差网络的轴承故障诊断方法进行详细说明。CWRU的轴承数据集是利用电火花向测试轴承的内圈、滚动体和外圈引入单点故障,故障尺寸分别为0.007、0.014和0.021英寸。因此,轴承的故障状态可分为9种,加上正常状态就产生了10种不同的轴承运行状态。实验中数据采集频率为12kHz,分别在负载为0、1、2kW,对应转速为1797、1772、1750r/min的状态下,对风扇端、基座端和驱动端三个不同位置进行振动信号收集。对采集到的数据以1024个采样点为一个样本长度进行无重叠采样,其中80%作为训练集、20%作为测试集,得到的实验数据描述如表1所示。
表1CWRU数据描述
将采集的振动信号数据归一化到无量纲的同一范围,可以防止训练过程中的梯度消失,加快网络收敛速度。归一化操作具体方式为:
式中,表示第k段信号的第i个样本点;max(xk)和min(xk)分别表示第k段信号的最大值和最小值。
为了验证本发明在复杂工况条件下的有效性,创建了A、B、C三个数据集,如表2所示。
表2实验数据集描述
步骤2、以固定长度截取数据集中的一维振动信号,将其转换成二维信号,再将不同位置得到的二维信号融合成多通道输入。
步骤2.1、数据格式转换。如图2所示,将长度为1024个采样点的原始信号,按照32个采样点为一段的方式进行截取,得到32个等长的片段。然后将截取的信号依次进行堆叠,最终得到一个32×32的二维重构信号。
步骤2.2、多传感器数据融合。每个传感器收集到的信号按照步骤2.1所述转换方式得到数据格式为[32,32,1]的二维重构信号,其中1表示单通道。为有效利用来自不同传感器的信息,本实施例将同一时刻收集的信息转换成二维数据后,再由并联方式实现不同位置所收集信号的融合,形成多通道输入,从而增加模型输入包含的故障特征信息。融合后的输入数据格式为[32,32,3],其中3表示三通道。
步骤3、利用包含3个双连接注意力残差模块(DARM)的诊断模型,学习多通道输入数据中的故障特征,并对提取的通道特征进行差异性划分。并通过交叉熵损失函数计算模型训练过程中的损失值。
具体而言,本发明所设计的DARM的结构如图3所示,该结构基于跳跃连接的思想构建出一个带有双连接的残差模块,利用该模块来加深诊断网络的深度。同时为了使双连接残差模块获得对不同通道特征的重要性区分,提高特征学习的效率,在每个双连接残差模块后,连接一个通道注意力机制模块,由此构成DARM。本发明所提的诊断方法的模型结构参数如表3所示。
表3所提模型结构参数
步骤3.1、经预处理后的多通道输入,首先经过两层卷积核大小为5*5、数目为32的宽核卷积神经网络,以提取故障信号中的浅层特征,最终得到的输出尺寸为[24,24,32]。
步骤3.2、将提取的特征输入由三个DARM堆叠组成的深层特征提取结构,利用注意力机制优化的双连接残差网络,逐层提取多通道输入的高级特征信息。通过反复重用前次的信息,克服单向信息流动带来的梯度弥散,以此实现对输入信息的深层次挖掘。DARM1的多通道数据输入为x,分别通过其中的卷积1和卷积3操作提取故障特征,将卷积1的输出与输入x进行跳跃连接,并联得到高级特征为y:
y=f1(w1*x+b1)∪x
式中,输出y的尺寸为[24,24,64],f1为卷积操作的激活函数;w1及b1为对应的权重系数和偏置项;∪为并联操作。
将y通过卷积2操作,并将其输出与卷积3操作得到的升维后的输出再次进行跳跃连接,融合得到高级特征Y:
式中,输出Y的尺寸为[24,24,64],f2、f3为卷积操作的激活函数;为信息相加融合操作;w2、w3及b2、b3为对应的权重系数和偏置项。
接着,针对双连接残差网络提取的通道特征,利用注意力机制模块进行差异性划分,从而区别出不同通道特征信息的重要性,以获取不同通道特征的权重系数。首先在每个通道上执行全局平均池化操作(GAP),即压缩操作Fsq(·),它使H×W×C的输入特征沿通道方向变成1×1×C的特征图,计算过程如下:
式中,c为压缩的通道序号;zc为第c个通道压缩后的值;Yc(i,j)是i×j维的二维矩阵,i=1,2…H,j=1,2…W。
利用激活操作Fex(·,·)学习每个通道的特征权值。该步骤是SE模块建立通道特征与训练效果相互关系的关键一步,目的在于使学习到的权值能够激励重要的特征映射,抑制不重要的特征映射。具体操作是在压缩之后使用了两层全连接构成的门机制来学习不同通道的权值,门控单元计算方法为:
sc=σ(W2δ(W1zc))
式中,δ表示Relu激活函数;σ表示sigmoid激活函数;W1、W2分别为两个全连接层的网络参数;sc是激活操作后得到的门控单元。
通过乘积操作Fscale(·,·)输出门控单元sc与输入特征图子图Yc的向量积:
式中,通过DARM1得到的为加权后的特征映射,增强了双连接残差网络提取故障特征的鉴别性,其输出尺寸为[24,24,64]。
最后,将DARM1得到的高级特征映射图通过池化操作降维,得到的输出尺寸为[12,12,64]。
步骤3.3、将DARM1降维后的输出依次通过DARM2和DARM3,并分别进行池化降维,最终得到的输出尺寸为[3,3,256]
步骤3.4、将通过三个DARM逐层提取到的高级特征映射图输入GAP网络层,以减少网络训练参数、防止过拟合。
步骤3.5、利用softmax层完成故障类别输出,并通过交叉熵损失函数计算模型训练过程中的损失值。
式中,n代表了分类任务的类别数;x表示全连接层最后一层的输出。使用softmax函数实现分类任务,通过softmax的处理使得最后的输出满足在分类任务类别个数基础上的概率分布和为1。
交叉熵损失函数的表达式为:
式中,Loss表示交叉熵损失函数的值;n表示样本数目;yi表示样本以独热编码形式在i维度上的标签,既样本为i时,yi=1,其余位置为0;表示以独热编码形式输出的预测标签。
步骤4、根据得到的损失值,利用误差反向传播算法对整个网络的权重参数进行更新,降低损失函数值,提高诊断精度,直至达到网络设置的最大更新次数。
此过程主要是利用链式法则,通过求解损失函数对网络中各权值参数的倒数,并使用梯度下降算法对网络中的权值参数进行迭代更新,以此实现训练过程中的模型优化。
本发明提出的基于传感器信息融合及双连接注意力残差网络的故障诊断方法,增加了输入信号中故障特征的数量,改善了模型的特征学习效果,从而提高了故障诊断精度。为了能从多方面对本发明所提模型在复杂工况环境下的诊断效果进行评价,将其与宽核卷积神经网络(WDCNN)、普通残差网络(Resnet)、双连接残差网络(double-connectedresidual network,DRN)以及采用本实施例所提诊断模型的单传感器输入方法(improvedresidual network under single sensor input,IRN-SSF)进行比较。所选对比模型的参数如表4所示。
表4对比模型结构参数
为了验证本发明所提方法在负载变化时的实际诊断效果,本实施例中以某一恒定负载的数据集作为训练集,不同负载的数据集作为测试集,以此模拟负载变化。例如,A-B表示在数据集A上进行训练,采用数据集B来测试。每组实验进行10次,取其平均值作为实验结果。最终在负载变化条件下,得到不同方法的诊断结果,如图5所示。可以发现,所提方法在每种负载变化下的诊断精度均高于对比方法,平均诊断精度在94%以上。
同时,为了验证所提方法在复杂工况条件的抗噪性能,在数据集B的测试集中加入0~8db的高斯白噪声,用来测试不同方法抗噪能力。每组实验进行5次,实验结果的均值对比如图6所示。由图可知,噪声强度为0~8db时所提方法的诊断精度高于其他诊断模型,其平均识别准确率超过了98%。并且当SNR从0db到8db变化时,只有本发明的诊断模型能始终保持在93%以上的诊断精度,说明所提方法在噪声环境下仍具有较强的故障特征提取能力。
实施例2
本实施例的一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,基本同实施例1,不同之处在于:本实施例使用自制轴承实验数据集对本发明提供的多传感器信号融合下基于改进残差网络的轴承故障诊断方法进行详细说明。本实施例采用电火花分别对轴承的内圈、外圈和滚动体加工出不同的故障尺寸。通过放置在不同位置的加速度传感器对转速为900r/min、1200r/min和1500r/min三种工况,进行轴承振动信号的数据采集,采样频率为10.24kHz,分别得到数据集A、B、C。对采集到的振动信号,按每个样本长度1024进行无重合切分,其中80%作为训练集,20%作为测试集,每个数据集的构成如表5所示。
表5安工大数据描述
为了能从多方面对本发明所提模型在复杂工况环境下的诊断效果进行评价,将其与宽核卷积神经网络(WDCNN)、普通残差网络(Resnet)、双连接残差网络(double-connected residual network,DRN)以及采用本实施例所提诊断模型的单传感器输入方法(improved residual network under single sensor input,IRN-SSF)进行比较。所选对比模型的参数如表6所示。
表6对比模型结构参数
考虑到轴承工作时的转速变换以及噪声环境的干扰,本实施例设计了带有噪声变化的变转速实验。该实验具体过程为:将诊断模型在一个转速下收集的数据进行训练,然后利用另一个转速下采集的数据来测试训练完成的模型。如A-B表示在数据集A中进行训练,训练完成的模型在数据集B中进行测试。同时,为了测试诊断模型在变工况下的抗噪性能,在测试数据集中分别加入不同SNR的高斯白噪声。
为了避免实验过程中的随机性,对每一个噪声环境下的工况变化重复进行5次实验,然后取其平均值,实验结果如表7和图7所示。
表7中0、2、4、6表示在测试集中加入高斯白噪声的信噪比,结合表7可以看出,转速变化相同条件下,本发明所提方法在SNR为0~6的噪声环境中,故障类型识别的平均准确率均高于其他方法。同时在SNR相同的噪声环境下,所提方法在转速变化时的识别平均准确率也高于对比方法。特别在SNR=0的高噪声环境下,相比于IRN-SSF和DRN,所提方法的识别准确率都高于90%,进一步说明了本发明构建的诊断方法在不依赖人工提取特征情形下拥有较强的特征学习能力。此外,测试轴承在SNR为0~6、转速改变条件下,本发明模型的平均准确率可达96.46%,表明所提方法在复杂工况条件下具有良好的故障识别准确率和抗干扰性能。
表7对比模型实验诊断精度表
为了直观地展示本发明所提方法的诊断过程,本实施例采用t-SNE降维算法,分别将输入的振动信号、双层宽核卷积层的输出、模型中三个DARM的输出以及全连接网络最后一层输出中的高维特征降到二维,从而实现诊断方法的特征提取可视化。实验中采用的训练集为A,然后利用添加了噪声强度SNR为0db的测试集B来得出训练完成的诊断模型在特征提取不同阶段的可视化结果,如图8所示。
可以看出,诊断模型对于不同故障类型特征的可分性随着网络的加深逐渐增强。特别是,经过三个DARM模块的学习后,模型对于故障类型的区分能力明显增强,说明本发明采用的DARM有良好的特征提取能力,能够从振动信号中提取出能反映轴承运行状态的故障特征。同时,由处于不同深度的DARM输出的高维特征可视化结果可知,本发明在诊断模型中所采用的三个DARM模块堆叠而成的深层网络,更有利于模型对不同类别故障的区分。此外,由整个诊断流程的可视化结果看出,通过数据集A训练完成的模型,在SNR为0db的噪声环境中使用数据集B进行测试时,仍能清晰地得出不同类型故障之间的界限,进一步说明了所提方法在有噪声干扰的变工况环境下有较好的识别性能。
Claims (10)
1.一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,其特征在于,包括如下步骤:
步骤1、利用多个传感器,获取轴承部件在不同运行状态下,不同位置的同步振动信号数据,将数据进行归一化;
步骤2、以固定长度截取数据集中的一维振动信号,将该一维振动信号转换成二维信号,再将不同位置得到的二维信号融合成多通道输入;
步骤3、利用包含3个双连接注意力残差模块的诊断模型,学习多通道输入数据中的故障特征,对提取的通道特征进行差异性划分,并通过交叉熵损失函数计算模型训练过程中的损失值;
步骤4、根据得到的损失值,利用误差反向传播算法对整个网络的权重参数进行更新,直至达到网络设置的最大更新次数;
步骤5、将训练好的模型应用于轴承故障诊断,输出故障分类结果。
2.根据权利要求1所述的一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,其特征在于:步骤一以1024个采样点为一个样本长度进行无重叠采样,并将采集的原始同步振动信号数据归一化到无量纲的同一范围。
3.根据权利要求2所述的一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,其特征在于:步骤2中将长度为1024个采样点的原始信号,按照32个采样点为一段的方式进行截取,得到32个等长的片段;然后将截取的信号依次进行堆叠,最终得到一个32×32的二维重构信号。
4.根据权利要求3所述的一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,其特征在于:步骤2中,将每个传感器同一时刻采集的信号均转换成二维重构信号,再采用并联方式实现不同位置所收集信号的融合,形成多通道输入。
5.根据权利要求1-4任一项所述的一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,其特征在于:步骤3所述诊断模型包括依次连接的2个卷积层以及3个双连接注意力残差模块DARM1、DARM2、DARM3,DARM1、DARM2、DARM3后均连接池化层,DARM3所接池化层后接全局平均池化层和Softmax分类层。
6.根据权利要求5所述的一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,其特征在于:双连接注意力残差模块DARM基于跳跃连接构建带有双连接的残差模块,在每个双连接残差模块后,连接一个通道注意力机制模块。
7.根据权利要求6所述的一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,其特征在于:双连接残差模块包括卷积1、卷积2和卷积3,多通道输入数据x,分别通过卷积1和卷积3操作提取故障特征,将卷积1的输出与输入x进行跳跃连接,并联得到高级特征y;将y通过卷积2操作,并将其输出与卷积3操作得到的升维后的输出再次进行跳跃连接,融合得到高级特征Y。
8.根据权利要求7所述的一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,其特征在于:所述的通道注意力机制模块在每个通道上执行压缩操作Fsq(·),使H×W×C的输入特征沿通道方向变成1×1×C的特征图;在压缩之后使用两层全连接构成的门机制来学习不同通道的特征权值;通过乘积操作Fscale(·,·)输出门控单元与输入特征图子图的向量积,该向量积即为双连接注意力残差模块DARM得到的加权后的特征映射。
9.根据权利要求8所述的一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,其特征在于,步骤3的具体步骤为:
步骤3.1、经预处理后的多通道输入,经过两层宽核卷积神经网络,以提取故障信号中的浅层特征;
步骤3.2、将提取的特征输入由三个DARM堆叠组成的深层特征提取结构,利用注意力机制优化的双连接残差模块,逐层提取多通道输入的高级特征信息;针对双连接残差模块提取的通道特征,利用通道注意力机制模块进行差异性划分;将DARM1得到的高级特征映射图通过池化操作降维;
步骤3.3、将DARM1降维后的输出依次通过DARM2和DARM3,并分别进行池化降维;
步骤3.4、将通过三个DARM逐层提取到的高级特征映射图输入全局平均池化层;
步骤3.5、利用softmax层完成故障类别输出,并通过交叉熵损失函数计算模型训练过程中的损失值。
10.根据权利要求8所述的一种多传感器信号融合下基于改进残差网络的轴承故障诊断方法,其特征在于:步骤4利用链式法则,通过求解损失函数对网络中各权值参数的倒数,并使用梯度下降算法对网络中的权值参数进行迭代更新,以实现模型优化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311004708.XA CN117030263A (zh) | 2023-08-08 | 2023-08-08 | 多传感器信号融合下基于改进残差网络的轴承故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311004708.XA CN117030263A (zh) | 2023-08-08 | 2023-08-08 | 多传感器信号融合下基于改进残差网络的轴承故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117030263A true CN117030263A (zh) | 2023-11-10 |
Family
ID=88642491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311004708.XA Pending CN117030263A (zh) | 2023-08-08 | 2023-08-08 | 多传感器信号融合下基于改进残差网络的轴承故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117030263A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117571321A (zh) * | 2023-11-24 | 2024-02-20 | 浙江大学 | 轴承故障检测方法、装置、设备及存储介质 |
CN117648611A (zh) * | 2024-01-30 | 2024-03-05 | 太原理工大学 | 机械装备的故障诊断方法 |
-
2023
- 2023-08-08 CN CN202311004708.XA patent/CN117030263A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117571321A (zh) * | 2023-11-24 | 2024-02-20 | 浙江大学 | 轴承故障检测方法、装置、设备及存储介质 |
CN117571321B (zh) * | 2023-11-24 | 2024-04-30 | 浙江大学 | 轴承故障检测方法、装置、设备及存储介质 |
CN117648611A (zh) * | 2024-01-30 | 2024-03-05 | 太原理工大学 | 机械装备的故障诊断方法 |
CN117648611B (zh) * | 2024-01-30 | 2024-04-05 | 太原理工大学 | 机械装备的故障诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Deep multi-scale convolutional transfer learning network: A novel method for intelligent fault diagnosis of rolling bearings under variable working conditions and domains | |
CN112906644B (zh) | 基于深度迁移学习的机械故障智能诊断方法 | |
Hoang et al. | Rolling element bearing fault diagnosis using convolutional neural network and vibration image | |
CN110849626B (zh) | 一种自适应稀疏压缩自编码的滚动轴承故障诊断系统 | |
Liang et al. | Rolling bearing fault diagnosis based on one-dimensional dilated convolution network with residual connection | |
CN106124212B (zh) | 基于稀疏编码器和支持向量机的滚动轴承故障诊断方法 | |
CN117030263A (zh) | 多传感器信号融合下基于改进残差网络的轴承故障诊断方法 | |
CN110779746A (zh) | 改进深度稀疏自编码器网络旋转机械复合故障的诊断方法 | |
CN111539152B (zh) | 一种基于两级孪生卷积神经网络的滚动轴承故障自学习方法 | |
CN107316046A (zh) | 一种基于增量补偿动态自适应增强的故障诊断方法 | |
CN110657984A (zh) | 一种基于强化胶囊网络的行星齿轮箱故障诊断方法 | |
CN113705424A (zh) | 基于时间卷积降噪网络的演艺装备故障诊断模型构建方法 | |
CN113705407B (zh) | 基于时频残差神经网络的变转速下轴裂纹的故障诊断方法 | |
CN114169377A (zh) | 基于g-mscnn的有噪环境中滚动轴承故障诊断方法 | |
Liang et al. | Multibranch and multiscale dynamic convolutional network for small sample fault diagnosis of rotating machinery | |
CN112257862A (zh) | 一种基于关系网络标记样本扩充的半监督辨识方法 | |
Wei et al. | WSAFormer-DFFN: A model for rotating machinery fault diagnosis using 1D window-based multi-head self-attention and deep feature fusion network | |
CN116754230A (zh) | 基于深度卷积生成对抗网络的轴承异常检测和故障诊断方法 | |
CN114861740A (zh) | 基于多头注意力机制的自适应机械故障诊断方法及系统 | |
CN114459760B (zh) | 一种强噪声环境下的滚动轴承故障诊断方法及系统 | |
CN116680561A (zh) | 一种变转速和样本不均衡下基于gan-ae-lstm的锥齿轮故障诊断方法 | |
CN115099278A (zh) | 一种基于小波包时频图与ResNet迁移网络的设备状态诊断方法 | |
CN117592543A (zh) | 一种基于自监督学习的航空发动机滚动轴承故障诊断方法 | |
CN116993322A (zh) | 一种基于卷积网络的故障诊断方法及系统 | |
CN116484176A (zh) | 一种基于超小波的轴承故障诊断方法、系统和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |