CN113255882B - 一种基于改进卷积胶囊网络的轴承故障诊断方法 - Google Patents
一种基于改进卷积胶囊网络的轴承故障诊断方法 Download PDFInfo
- Publication number
- CN113255882B CN113255882B CN202110489570.1A CN202110489570A CN113255882B CN 113255882 B CN113255882 B CN 113255882B CN 202110489570 A CN202110489570 A CN 202110489570A CN 113255882 B CN113255882 B CN 113255882B
- Authority
- CN
- China
- Prior art keywords
- layer
- capsule network
- feature map
- scale
- fault diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000002775 capsule Substances 0.000 title claims abstract description 107
- 238000003745 diagnosis Methods 0.000 title claims abstract description 72
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000000605 extraction Methods 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 33
- 238000012360 testing method Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 57
- 210000002569 neuron Anatomy 0.000 claims description 53
- 239000013598 vector Substances 0.000 claims description 23
- 238000011176 pooling Methods 0.000 claims description 22
- 230000004913 activation Effects 0.000 claims description 21
- 230000008878 coupling Effects 0.000 claims description 15
- 238000010168 coupling process Methods 0.000 claims description 15
- 238000005859 coupling reaction Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 11
- 238000012795 verification Methods 0.000 claims description 9
- 235000009854 Cucurbita moschata Nutrition 0.000 claims description 3
- 240000001980 Cucurbita pepo Species 0.000 claims description 3
- 235000009852 Cucurbita pepo Nutrition 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 235000020354 squash Nutrition 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 abstract description 16
- 239000010410 layer Substances 0.000 description 128
- 238000010586 diagram Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013477 bayesian statistics method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Acoustics & Sound (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本发明公开了一种基于改进卷积胶囊网络的轴承故障诊断方法,包括S1,获取轴承的训练集,训练集包含多个带有故障标签的轴承二维时频数据;S2,构建改进卷积胶囊网络,改进卷积胶囊网络依次由特征提取网络及胶囊网络构成,特征提取网络包含2个分层卷积结构及注意力层;将训练集输入至特征提取网络得到二维时频数据的空间特征图,将空间特征图输入至胶囊网络得到预测故障类型;利用损失函数来反向更新特征提取网络及胶囊网络中的权重系数直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型;S3,将测试集输入训练好的轴承故障诊断模型得到轴承故障诊断结果,解决了现有卷积神经网络在变工况下轴承故障诊断性能差的问题。
Description
技术领域
本发明属于轴承故障诊断技术领域,更具体地,涉及一种基于改进卷积胶囊网络的轴承故障诊断方法。
背景技术
随着工业现代化的发展,机械设备正朝着自动化、规模化和智能化的方向发展。轴承是机械设备中重要的部分,其运行状态的正常与否直接影响整个系统的性能。由于轴承经常在强度大的环境下工作,会发生磨损和锈蚀等故障,可能会造成轴承的损坏和机械设备的故障。因此,对轴承进行故障诊断研究十分重要。
传统的故障诊断方法是通过人工提取信号特征,判断轴承是否发生故障。比如短时傅里叶变换和小波变换等方法。随着机器学习在工程应用领域的发展,一些算法被运用在轴承故障诊断方面。比如支持向量机和贝叶斯统计等算法。对信号进行特征提取,分析识别提取到的特征,完成故障诊断。这些方法虽然有着不错的故障诊断效果,但是特征提取和识别分类的过程比较复杂,十分依赖专家知识协助完成故障诊断。随着数据量的增大,专家知识很难协助完成大量数据下的故障诊断任务。
随着深度学习在工程应用领域的发展,一些方法被运用在轴承故障诊断方面。其中以卷积神经网络模型为代表的深度学习模型的运用,让故障诊断领域朝着智能化的方向发展。卷积神经网络虽然在故障诊断方面有一定的成效,但是在特征提取时,仍存在标量神经元提取特征性能不足,池化层丢失特征有用信息等问题。在实际工程应用中,轴承的运行状态会随着机械设备的负载的变化而发生变换,传感器获取的振动信号也会随之发生改变。卷积神经网络是通过对信号的特征提取,完成不同类型故障的诊断分类。在负载变化的情况下,同种类型故障的相似特征会减少,这会导致卷积神经网络诊断性能变差,难以很好地完成变工况下的故障诊断任务。因此需要对卷积神经网络进行改进,以完成轴承故障诊断任务。
发明内容
为解决现有卷积神经网络在变工况下轴承故障诊断性能差的技术问题,本发明提供一种基于改进卷积胶囊网络的轴承故障诊断方法,在单工况和变工况下轴承故障诊断准确高,能够完成不同工况下的轴承故障诊断任务。
为实现以上目的,本发明采用的一种技术方案如下:
一种基于改进卷积胶囊网络的轴承故障诊断方法,包括以下步骤:
步骤S1,获取轴承的训练集,所述训练集包含多个带有故障标签的轴承二维时频数据,所述轴承二维时频数据通过小波变换轴承的一维振动信号获得;
步骤S2,构建改进卷积胶囊网络,利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型;
所述改进卷积胶囊网络依次由特征提取网络及胶囊网络构成,所述特征提取网络包含第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层;
将训练集输入至特征提取网络得到二维时频数据的空间特征图,将空间特征图输入至胶囊网络得到预测故障类型;利用Margin Loss损失函数来反向更新特征提取网络及胶囊网络中的权重系数直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型;
步骤S3,将测试集输入训练好的轴承故障诊断模型得到轴承故障诊断结果。
进一步地,所述步骤S2中所述第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层的结构如下:
所述Inception7层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为7×7;第四尺度第一层为尺寸为5×5的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
所述Inception5层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为3×3;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第四尺度第一层为尺寸为3×3的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
所述的Attention层包含通道注意力模块和空间注意力模块组成,所述通道注意力模块的激活函数为relu和sigmoid函数,所述空间注意力模块的激活函数为sigmoid函数。
进一步地,所述步骤S2中利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型包括如下步骤:
步骤S21,将训练集输入至Inception7层的输入层,利用Inception7层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception7层的concat连接层进行特征汇总得到第一特征图;将第一特征图输入至Inception5层的输入层,利用Inception5层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception5层的concat连接层进行特征汇总得到第二特征图;将第二特征图输入至Attention层,利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,接着利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图;
步骤S22,将空间特征图输入至胶囊网络的主要帽层形成低层胶囊网络多个神经元,利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新,将高层胶囊网络多个神经元的输出向量输入至分类层得到预测故障类型;
步骤S23,分别计算高层胶囊网络多个神经元的输出向量对应的二范数得到各类故障类型的概率,将各类故障类型的概率输入至分类层得到预测故障类型,利用预测故障类型结合故障标签及各类故障类型的概率计算Margin Loss损失函数,利用Margin Loss损失函数反向更新特征提取网络及胶囊网络中的权重系数;
步骤S24,重复S21至S23,直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型。
进一步地,步骤S22中的利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新具体步骤如下:
第一阶段,记低层胶囊网络的第i个神经元为xi,i=1,2,…,n,n为低层胶囊网络神经元总数,wij为xi对应的权重矩阵,j=1,2,…,m,m为高层胶囊网络神经元总数,xij为预测值,其公式为:
xij=wijxi (1)
第二阶段中,对预测值xij进行加权求和得到高层胶囊网络神经元的第一输出向量Sj,其公式为:
公式(2)中,cij为低层胶囊网络神经元的耦合系数;
第三阶段中,对第一输出向量Sj通过squash函数进行处理,获得高层胶囊网络神经元的第二输出向量Zj,其公式为:
第四阶段中,计算低层胶囊网络神经元的耦合系数cij,其公式为:
bij=bij+Zixij (5)
在每次前向传播时,将bij初始化为0,由公式(4)计算出低层胶囊网络神经元的耦合系数cij的初始化值,再由公式(2)和公式(3)计算出高层胶囊网络神经元的第一输出向量Sj和第二输出向量Zj;由公式(5)更新bij的数值,从而更新cij、Sj和Zj,直至完成3次路由更新算法。
进一步地,所述步骤S23中所述Margin Loss损失函数公式如下所示:
公式(6)中,pj=||Zj||为各类故障的概率;Tj为分类判定函数,假如分类层输出的预测故障类型与故障标签一致时,则Tj=1,否则Tj=0;m+为概率上限值,若pj大于m+,则损失函数Lj为0;m-为概率下限值,若pj小于m-,则损失函数Lj为0;λ为比例系数。
进一步地,步骤S21中利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,具体步骤为:
所述通道注意力模块将第二特征图F∈RC×H×W经过池化及感知机操作实现通道特征提取形成通道注意力Mc(F),将通道注意力Mc(F)和第二特征图F∈RC×H×W相乘得到通道特征图F',其公式为:
步骤S21中利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图,具体步骤为:
所述空间注意力模块将通道特征图F'经过池化和卷积操作实现空间特征提取形成空间注意力Ms(F'),将空间注意力Ms(F')和通道特征图F'相乘得到空间特征图F”,其公式为:
进一步地,步骤S2还包含利用验证集对训练好的轴承故障诊断模型进行超参数调整得到优化好的轴承故障诊断模型,所述验证集和步骤S1中训练集获取方法一样;
步骤S3,将测试集输入优化好的轴承故障诊断模型得到轴承故障诊断结果。
与现有技术相比,本发明具有以下优点:
(1)本发明利用改进的胶囊网络代替卷积神经网络,用胶囊网络中的向量神经元(低层胶囊网络及高层胶囊网络的神经元均是向量神经元)代替卷积神经网络标量神经元,在负载变换的变工况的环境下,将振动信号的空间位置作为信息的一部分被保存使用,提升预测故障模型的故障诊断性能;本发明的诊断方法在单工况和变工况下轴承故障诊断准确高,能够完成不同工况下的轴承故障诊断任务;
(2)基础的胶囊网络仅采用单层卷积核进行特征提取,未能从信号中获得更多重要信息。本发明采用第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层形成特征提取网络,并与胶囊网络结合,可以从振动信号中提取多尺度的关键信息,提升预测故障模型的特征提取性能,提高预测故障模型的故障诊断性能。
附图说明
图1为本发明一实施例中一种基于改进卷积胶囊的轴承故障诊断方法流程图。
图2为本发明一实施例中利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型的算法流程图;
图3为本发明一实施例中的改进卷积胶囊网络的模型结构图;
图4为本发明一实施例中的Inception层结构图;
图5为本发明一实施例中的Attention层模块结构图;
图6为本发明一实施例中的胶囊网络的动态路由算法示意图;
图7为本发明一实施例中的不同负荷工况下的信号数据图;
图8为本发明一实施例中的利用部分重复采样获取训练集中每批样本(二维时频数据)的示意图。
具体实施方式
下面将结合本发明实施例的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于改进卷积胶囊网络的轴承故障诊断方法,包括以下步骤:
步骤S1,获取轴承的训练集,所述训练集包含多个带有故障标签的轴承二维时频数据,所述轴承二维时频数据通过小波变换轴承的一维振动信号获得;
步骤S2,构建改进卷积胶囊网络,利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型;
如图3所示,所述改进卷积胶囊网络依次由特征提取网络及胶囊网络构成,所述特征提取网络包含第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层;
将训练集输入至特征提取网络得到二维时频数据的空间特征图,将空间特征图输入至胶囊网络得到预测故障类型;利用Margin Loss损失函数来反向更新特征提取网络及胶囊网络中的权重系数直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型;
步骤S3,将测试集输入训练好的轴承故障诊断模型得到轴承故障诊断结果。
具体地,所述步骤S2中所述第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层的结构如下:
如图4所示,所述Inception7层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为7×7;第四尺度第一层为尺寸为5×5的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
如图4所示,所述Inception5层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为3×3;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第四尺度第一层为尺寸为3×3的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
如图5所示,所述的Attention层包含通道注意力模块和空间注意力模块组成,所述通道注意力模块的激活函数为relu和sigmoid函数,所述空间注意力模块的激活函数为sigmoid函数。
如图2所示,所述步骤S2中利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型包括如下步骤:
步骤S21,将训练集输入至Inception7层的输入层,利用Inception7层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception7层的concat连接层进行特征汇总得到第一特征图;将第一特征图输入至Inception5层的输入层,利用Inception5层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception5层的concat连接层进行特征汇总得到第二特征图;将第二特征图输入至Attention层,利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,接着利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图;
步骤S22,将通道特征图及空间特征图输入至胶囊网络的主要帽层形成低层胶囊网络多个神经元,利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现数字帽层中的高层胶囊网络多个神经元的更新,将高层胶囊网络多个神经元的输出向量输入至分类层得到预测故障类型;
如图6所示,步骤S22中利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新具体步骤如下:
第一阶段,记低层胶囊网络的第i个神经元为xi,i=1,2,…,n,n为低层胶囊网络神经元总数,wij为xi对应的权重矩阵,j=1,2,…,m,m为高层胶囊网络神经元总数和故障类型总数相等,xij为预测值,其公式为:
xij=wijxi (1)
第二阶段中,对预测值xij进行加权求和得到高层胶囊网络神经元的第一输出向量Sj,其公式为:
公式(2)中,cij为低层胶囊网络神经元的耦合系数;
第三阶段中,对第一输出向量Sj通过squash函数进行处理,获得高层胶囊网络神经元的第二输出向量Zj,其公式为:
第四阶段中,计算低层胶囊网络神经元的耦合系数cij,其公式为:
bij=bij+Zixij (5)
在每次前向传播时,将bij初始化为0,由公式(4)计算出低层胶囊网络神经元的耦合系数cij的初始化值,再由公式(2)和公式(3)计算出高层胶囊网络神经元的第一输出向量Sj和第二输出向量Zj;由公式(5)更新bij的数值,从而更新cij、Sj和Zj,直至完成3次路由更新算法,因为在胶囊网络中一般选取迭代次数为3次;
步骤S23,分别计算高层胶囊网络多个神经元的输出向量对应的二范数得到各类故障类型的概率,将各类故障类型的概率输入至分类层得到预测故障类型,利用预测故障类型结合故障标签及各类故障类型的概率计算Margin Loss损失函数,利用Margin Loss损失函数反向更新特征提取网络及胶囊网络中的权重系数;一般通过随机优化算法(Adam)的反向传播算法更新特征提取网络及胶囊网络中的权重系数,并通过自适应学习速率算法选择最佳学习速率,使得模型能够迅速收敛。
所述步骤S23中所述Margin Loss损失函数公式如下所示:
公式(6)中,pj=||Zj||为各类故障的概率;Tj为分类判定函数,假如分类层输出的预测故障类型与故障标签一致时,则Tj=1,否则Tj=0;m+为概率上限值,若pj大于m+,则损失函数Lj为0;m-为概率下限值,若pj小于m-,则损失函数Lj为0;λ为比例系数,一般可以选取λ=0.5;
步骤S24,重复S21至S23,直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型。
进一步地,步骤S21中利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,具体步骤为:
所述通道注意力模块将第二特征图F∈RC×H×W经过池化及感知机操作实现通道特征提取形成通道注意力Mc(F),将通道注意力Mc(F)和第二特征图F∈RC×H×W相乘得到通道特征图F',其公式为:
公式(7)中,表示逐个元素相乘;W0∈RC/r×C,W1∈RC×C/r,r为减少率一般选取r=16;表示对F进行平均池化处理,表示对F进行最大池化处理;σ为sigmoid激活函数,τ为relu激活函数;
步骤S21中利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图,具体步骤为:
所述空间注意力模块将通道特征图F'经过池化和卷积操作实现空间特征提取形成空间注意力Ms(F'),将空间注意力Ms(F')和通道特征图F'相乘得到空间特征图F”,其公式为:
进一步地,步骤S2还包含利用验证集对训练好的轴承故障诊断模型进行超参数调整得到优化好的轴承故障诊断模型,所述验证集和步骤S1中训练集获取方法一样。
下面以一具体实施对本发明的轴承故障诊断方法进行进一步说明,采用凯斯西储大学轴承数据集作为数据集。故障类型分为正常以及内圈、外圈和滚动体三种故障。其中,每种均有0.1778mm、0.3556mm和0.5334mm三种不同尺寸的损伤,对应不同类型的故障。数据集包含了正常和九种不同类型故障共十种,如表1所示。其中,每种数据类型均按5:1:2的比例划分,划分为250个训练样本形成训练集、50个验证样本形成验证集和100个测试样本形成测试集。每个数据样本都被打上故障标签,表示对应的故障类型。
表1
本发明的实施例中,改进卷积胶囊网络是通过开源的软件库Tensorflow2.0构建的,批处理次数Batch定为100。如图8所示,每次从训练集中抽取训练样本时采用部分重复采样的手段对训练集进行扩展,利用验证集对训练好的轴承故障诊断模型进行超参数调整得到优化好的轴承故障诊断模型,所述超参数包括学习效率设于0.0001使得轴承故障诊断模型能够迅速收敛。
为验证改进卷积胶囊网络(Improved Convolutional Capsule Network,IC-CN)模型性能,将卷积神经网络(Convolutional Neural Network,CNN)以及卷积胶囊网络(Convolutional Capsule Network,C-CN)两种深度学习模型进行对比。
参照表1数据集构建的方式,分别选取0hp、1hp、2hp、3hp负荷工况下的数据构建单工况下的数据集。模型权重迭代次数Epoch定为300。为更好地评估模型的故障诊断性能,将准确度以及F1分数作为评估指标。F1分数和准确度相似,是统计学中用来衡量分类模型精确度的一种指标。为减少诊断实验的偶然性,每个模型均在不同单工况上重复诊断三次,取平均值作为模型诊断的准确度和F1分数。实验结果如表2、表3所示。
表2
表3
从表2、表3中可以得出,IC-CN模型在四种不同单工况下的准确度和F1分数基本一致,均高于CNN,在0hp和1hp单工况下的准确度高于C-CN模型。在不同单工况下的平均准确度上,IC-CN模型比CNN和C-CN模型分别提高0.46%和0.03%,这说明IC-CN模型在单工况下诊断性能更加优异。
在变工况下的实施例中,如图7所示,损伤尺寸大小为0.5334mm的外圈故障在不同负荷工况下运转的信号数据是有差别的,信号在不同负荷工况下的加速度数据是有区别的,幅值和相位是不一样的。参照表1数据集构建的方式,所用的训练和测试集均采用不同负荷工况下的数据。变工况相对于单工况,样本数据增多,模型训练过程变复杂,为让模型更好地训练数据,增大模型迭代次数,将数Epoch定为500。实验结果如表4和表5所示。
表4
表5
从表4和表5可以得出,当负荷发生变化时,三种方法的准确度和F1分数均不同程度地发生了降低。虽然诊断性能发生了下降,但是IC-CN模型与其他两种模型相比,诊断性能下降的幅度小,在三种变工况下的准确度均高于CNN和C-CN模型。在三种变工况下的平均准确度上,相对于CNN和C-CN模型,IC-CN模型分别提高了8.24%和3.42%。IC-CN模型在三种变工况下的F1分数均高于其他两种模型。在三种变工况下的平均F1分数上,IC-CN模型相对于其他两种模型分别提高了10.2%和3.65%。这些说明IC-CN模型在变工况下诊断性能更加优异。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细但并不能因此而理解为对本申请专利范围的限制。对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,包括以下步骤:
步骤S1,获取轴承的训练集,所述训练集包含多个带有故障标签的轴承二维时频数据,所述轴承二维时频数据通过小波变换轴承的一维振动信号获得;
步骤S2,构建改进卷积胶囊网络,利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型;
所述改进卷积胶囊网络依次由特征提取网络及胶囊网络构成,所述特征提取网络包含第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层;
将训练集输入至特征提取网络得到二维时频数据的空间特征图,将空间特征图输入至胶囊网络得到预测故障类型;利用Margin Loss损失函数来反向更新特征提取网络及胶囊网络中的权重系数直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型;
步骤S3,将测试集输入训练好的轴承故障诊断模型得到轴承故障诊断结果;
所述步骤S2中所述第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层的结构如下:
所述Inception7层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为7×7;第四尺度第一层为尺寸为5×5的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
所述Inception5层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为3×3;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第四尺度第一层为尺寸为3×3的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
所述的Attention层包含通道注意力模块和空间注意力模块,所述通道注意力模块的激活函数为relu和sigmoid函数,所述空间注意力模块的激活函数为sigmoid函数;
所述步骤S2中利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型包括如下步骤:
步骤S21,将训练集输入至Inception7层的输入层,利用Inception7层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception7层的concat连接层进行特征汇总得到第一特征图;将第一特征图输入至Inception5层的输入层,利用Inception5层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception5层的concat连接层进行特征汇总得到第二特征图;将第二特征图输入至Attention层,利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,接着利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图;
步骤S22,将空间特征图输入至胶囊网络的主要帽层形成低层胶囊网络多个神经元,利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新,将高层胶囊网络多个神经元的输出向量输入至分类层得到预测故障类型;
步骤S23,分别计算高层胶囊网络多个神经元的输出向量对应的二范数得到各类故障类型的概率,将各类故障类型的概率输入至分类层得到预测故障类型,利用预测故障类型结合故障标签及各类故障类型的概率计算Margin Loss损失函数,利用Margin Loss损失函数反向更新特征提取网络及胶囊网络中的权重系数;
步骤S24,重复S21至S23,直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型。
2.根据权利要求1所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,步骤S22中的利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新具体步骤如下:
第一阶段,记低层胶囊网络的第i个神经元为xi,i=1,2,…,n,n为低层胶囊网络神经元总数,wij为xi对应的权重矩阵,j=1,2,…,m,m为高层胶囊网络神经元总数,xij为预测值,其公式为:
xij=wijxi (1)
第二阶段中,对预测值xij进行加权求和得到高层胶囊网络神经元的第一输出向量Sj,其公式为:
公式(2)中,cij为低层胶囊网络神经元的耦合系数;
第三阶段中,对第一输出向量Sj通过squash函数进行处理,获得高层胶囊网络神经元的第二输出向量Zj,其公式为:
第四阶段中,计算低层胶囊网络神经元的耦合系数cij,其公式为:
bij=bij+Zixij (5)
在每次前向传播时,将bij初始化为0,由公式(4)计算出低层胶囊网络神经元的耦合系数cij的初始化值,再由公式(2)和公式(3)计算出高层胶囊网络神经元的第一输出向量Sj和第二输出向量Zj;由公式(5)更新bij的数值,从而更新cij、Sj和Zj,直至完成3次路由更新算法。
4.根据权利要求1所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,步骤S21中利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,具体步骤为:
所述通道注意力模块将第二特征图F∈RC×H×W经过池化及感知机操作实现通道特征提取形成通道注意力Mc(F),将通道注意力Mc(F)和第二特征图F∈RC×H×W相乘得到通道特征图F',其公式为:
步骤S21中利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图,具体步骤为:
所述空间注意力模块将通道特征图F'经过池化和卷积操作实现空间特征提取形成空间注意力Ms(F'),将空间注意力Ms(F')和通道特征图F'相乘得到空间特征图F”,其公式为:
5.根据权利要求1-4中任一项所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,步骤S2还包含利用验证集对训练好的轴承故障诊断模型进行超参数调整得到优化好的轴承故障诊断模型,所述验证集和步骤S1中训练集获取方法一样;
步骤S3,将测试集输入优化好的轴承故障诊断模型得到轴承故障诊断结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110489570.1A CN113255882B (zh) | 2021-04-30 | 2021-04-30 | 一种基于改进卷积胶囊网络的轴承故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110489570.1A CN113255882B (zh) | 2021-04-30 | 2021-04-30 | 一种基于改进卷积胶囊网络的轴承故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113255882A CN113255882A (zh) | 2021-08-13 |
CN113255882B true CN113255882B (zh) | 2022-11-04 |
Family
ID=77223584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110489570.1A Active CN113255882B (zh) | 2021-04-30 | 2021-04-30 | 一种基于改进卷积胶囊网络的轴承故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113255882B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113984389B (zh) * | 2021-12-01 | 2023-09-01 | 广西大学 | 一种基于多感受野与改进胶囊图神经网络的滚动轴承故障诊断方法 |
CN114239402A (zh) * | 2021-12-17 | 2022-03-25 | 哈尔滨工程大学 | 基于优化胶囊网络的核动力循环水泵故障诊断方法及系统 |
CN114330439B (zh) * | 2021-12-28 | 2023-04-07 | 盐城工学院 | 一种基于卷积神经网络的轴承诊断方法 |
CN114548153B (zh) * | 2022-01-21 | 2023-06-02 | 电子科技大学 | 基于残差-胶囊网络的行星齿轮箱故障诊断方法 |
CN114444187B (zh) * | 2022-01-28 | 2023-07-18 | 河海大学 | 一种振动传递大数据与胶囊网络融合的桥梁损伤诊断方法 |
CN114897138B (zh) * | 2022-05-06 | 2025-01-03 | 东南大学 | 基于注意力机制和深度残差网络的系统故障诊断方法 |
CN114757239B (zh) * | 2022-06-15 | 2022-08-30 | 浙江大学 | 基于数据增强和胶囊神经网络的风机故障可迁移诊断方法 |
CN115406656B (zh) * | 2022-08-29 | 2024-08-02 | 桂林电子科技大学 | 轴承锈蚀智能诊断方法及系统 |
CN115238833B (zh) * | 2022-09-22 | 2022-11-25 | 中国民航大学 | 一种空气涡轮起动机轴承性能退化特征提取方法 |
CN118135402B (zh) * | 2024-03-18 | 2024-11-15 | 临沂大学 | 基于多级胶囊融合网络的sar目标识别方法及相关装置 |
CN118312879B (zh) * | 2024-04-08 | 2024-09-24 | 南京理工大学 | 一种基于注意力卷积胶囊网络的比例伺服阀故障诊断方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11010902B2 (en) * | 2018-06-04 | 2021-05-18 | University Of Central Florida Research Foundation, Inc. | Capsules for image analysis |
CN110657984B (zh) * | 2019-09-27 | 2020-06-02 | 重庆大学 | 一种基于强化胶囊网络的行星齿轮箱故障诊断方法 |
CN111046916A (zh) * | 2019-11-20 | 2020-04-21 | 上海电机学院 | 一种基于空洞卷积胶囊网络的电机故障诊断方法及系统 |
CN111967537B (zh) * | 2020-04-13 | 2022-04-08 | 江西理工大学 | 一种基于双路胶囊网络的sar目标分类方法 |
CN111626361B (zh) * | 2020-05-28 | 2023-08-11 | 辽宁大学 | 一种改进胶囊网络优化分层卷积的轴承亚健康识别方法 |
CN111832812A (zh) * | 2020-06-27 | 2020-10-27 | 南通大学 | 一种基于深度学习的风电功率短期预测方法 |
CN111832663A (zh) * | 2020-07-30 | 2020-10-27 | 上海电机学院 | 一种基于门控循环单元的胶囊网络滚动轴承故障诊断系统 |
CN112577747B (zh) * | 2020-12-07 | 2023-08-08 | 东南大学 | 一种基于空间池化网络的滚动轴承故障诊断方法 |
-
2021
- 2021-04-30 CN CN202110489570.1A patent/CN113255882B/zh active Active
Non-Patent Citations (1)
Title |
---|
A convolutional neural network based on a capsule network with strong generalization for bearing fault diagnosis;Zhiyu Zhu等;《Neurocomputing》;20180926;第62-75页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113255882A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113255882B (zh) | 一种基于改进卷积胶囊网络的轴承故障诊断方法 | |
Li et al. | Intelligent fault diagnosis of rolling bearings under imbalanced data conditions using attention-based deep learning method | |
CN109902399B (zh) | 一种基于att-cnn的变工况下滚动轴承故障识别方法 | |
CN111442926B (zh) | 一种基于深层特征迁移的变负载下不同型号滚动轴承故障诊断方法 | |
WO2020244134A1 (zh) | 一种基于多任务特征共享神经网络的智能故障诊断方法 | |
CN111964908A (zh) | 一种基于mwdcnn的变工况下轴承故障诊断方法 | |
Ayodeji et al. | Causal augmented ConvNet: A temporal memory dilated convolution model for long-sequence time series prediction | |
Su et al. | A novel method based on deep transfer unsupervised learning network for bearing fault diagnosis under variable working condition of unequal quantity | |
CN104792530B (zh) | 一种基于SDA和Softmax回归的深度学习滚动轴承故障诊断方法 | |
CN113486578B (zh) | 一种工业过程中设备剩余寿命的预测方法 | |
US20190130273A1 (en) | Sequence-to-sequence prediction using a neural network model | |
CN112964469B (zh) | 一种迁移学习的变负载下滚动轴承在线故障诊断方法 | |
CN111353373B (zh) | 一种相关对齐域适应故障诊断方法 | |
CN111046916A (zh) | 一种基于空洞卷积胶囊网络的电机故障诊断方法及系统 | |
Xu et al. | An imbalanced fault diagnosis method for rolling bearing based on semi-supervised conditional generative adversarial network with spectral normalization | |
CN108334936A (zh) | 基于迁移卷积神经网络的故障预测方法 | |
CN112926641A (zh) | 基于多模态数据的三阶段特征融合旋转机械故障诊断方法 | |
CN113281048A (zh) | 一种基于关系型知识蒸馏的滚动轴承故障诊断方法和系统 | |
CN116502175A (zh) | 一种图神经网络故障诊断方法、装置和存储介质 | |
CN113010774B (zh) | 一种基于动态深度注意力模型的点击率预测方法 | |
CN111397902A (zh) | 一种基于特征对齐卷积神经网络的滚动轴承故障诊断方法 | |
CN111046961A (zh) | 基于双向长短时记忆单元和胶囊网络的故障分类方法 | |
CN112203311B (zh) | 网元异常诊断方法、装置、设备及计算机存储介质 | |
CN116739154A (zh) | 一种故障预测方法及其相关设备 | |
CN114818811B (zh) | 一种基于孪生网络度量学习的航空发动机滚动轴承故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20241210 Address after: 230000 B-1015, wo Yuan Garden, 81 Ganquan Road, Shushan District, Hefei, Anhui. Patentee after: HEFEI MINGLONG ELECTRONIC TECHNOLOGY Co.,Ltd. Country or region after: China Address before: 226019 Jiangsu Province, Nantong City Chongchuan District sik Road No. 9 Patentee before: NANTONG University Country or region before: China |
|
TR01 | Transfer of patent right |