CN113255882A - 一种基于改进卷积胶囊网络的轴承故障诊断方法 - Google Patents

一种基于改进卷积胶囊网络的轴承故障诊断方法 Download PDF

Info

Publication number
CN113255882A
CN113255882A CN202110489570.1A CN202110489570A CN113255882A CN 113255882 A CN113255882 A CN 113255882A CN 202110489570 A CN202110489570 A CN 202110489570A CN 113255882 A CN113255882 A CN 113255882A
Authority
CN
China
Prior art keywords
layer
capsule network
scale
network
feature map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110489570.1A
Other languages
English (en)
Other versions
CN113255882B (zh
Inventor
王栗
李伟
华亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN202110489570.1A priority Critical patent/CN113255882B/zh
Publication of CN113255882A publication Critical patent/CN113255882A/zh
Application granted granted Critical
Publication of CN113255882B publication Critical patent/CN113255882B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Acoustics & Sound (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明公开了一种基于改进卷积胶囊网络的轴承故障诊断方法,包括S1,获取轴承的训练集,训练集包含多个带有故障标签的轴承二维时频数据;S2,构建改进卷积胶囊网络,改进卷积胶囊网络依次由特征提取网络及胶囊网络构成,特征提取网络包含2个分层卷积结构及注意力层;将训练集输入至特征提取网络得到二维时频数据的空间特征图,将空间特征图输入至胶囊网络得到预测故障类型;利用损失函数来反向更新特征提取网络及胶囊网络中的权重系数直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型;S3,将测试集输入训练好的轴承故障诊断模型得到轴承故障诊断结果,解决了现有卷积神经网络在变工况下轴承故障诊断性能差的问题。

Description

一种基于改进卷积胶囊网络的轴承故障诊断方法
技术领域
本发明属于轴承故障诊断技术领域,更具体地,涉及一种基于改进卷积胶囊网络的轴承故障诊断方法。
背景技术
随着工业现代化的发展,机械设备正朝着自动化、规模化和智能化的方向发展。轴承是机械设备中重要的部分,其运行状态的正常与否直接影响整个系统的性能。由于轴承经常在强度大的环境下工作,会发生磨损和锈蚀等故障,可能会造成轴承的损坏和机械设备的故障。因此,对轴承进行故障诊断研究十分重要。
传统的故障诊断方法是通过人工提取信号特征,判断轴承是否发生故障。比如短时傅里叶变换和小波变换等方法。随着机器学习在工程应用领域的发展,一些算法被运用在轴承故障诊断方面。比如支持向量机和贝叶斯统计等算法。对信号进行特征提取,分析识别提取到的特征,完成故障诊断。这些方法虽然有着不错的故障诊断效果,但是特征提取和识别分类的过程比较复杂,十分依赖专家知识协助完成故障诊断。随着数据量的增大,专家知识很难协助完成大量数据下的故障诊断任务。
随着深度学习在工程应用领域的发展,一些方法被运用在轴承故障诊断方面。其中以卷积神经网络模型为代表的深度学习模型的运用,让故障诊断领域朝着智能化的方向发展。卷积神经网络虽然在故障诊断方面有一定的成效,但是在特征提取时,仍存在标量神经元提取特征性能不足,池化层丢失特征有用信息等问题。在实际工程应用中,轴承的运行状态会随着机械设备的负载的变化而发生变换,传感器获取的振动信号也会随之发生改变。卷积神经网络是通过对信号的特征提取,完成不同类型故障的诊断分类。在负载变化的情况下,同种类型故障的相似特征会减少,这会导致卷积神经网络诊断性能变差,难以很好地完成变工况下的故障诊断任务。因此需要对卷积神经网络进行改进,以完成轴承故障诊断任务。
发明内容
为解决现有卷积神经网络在变工况下轴承故障诊断性能差的技术问题,本发明提供一种基于改进卷积胶囊网络的轴承故障诊断方法,在单工况和变工况下轴承故障诊断准确高,能够完成不同工况下的轴承故障诊断任务。
为实现以上目的,本发明采用的一种技术方案如下:
一种基于改进卷积胶囊网络的轴承故障诊断方法,包括以下步骤:
步骤S1,获取轴承的训练集,所述训练集包含多个带有故障标签的轴承二维时频数据,所述轴承二维时频数据通过小波变换轴承的一维振动信号获得;
步骤S2,构建改进卷积胶囊网络,利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型;
所述改进卷积胶囊网络依次由特征提取网络及胶囊网络构成,所述特征提取网络包含第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层;
将训练集输入至特征提取网络得到二维时频数据的空间特征图,将空间特征图输入至胶囊网络得到预测故障类型;利用Margin Loss损失函数来反向更新特征提取网络及胶囊网络中的权重系数直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型;
步骤S3,将测试集输入训练好的轴承故障诊断模型得到轴承故障诊断结果。
进一步地,所述步骤S2中所述第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层的结构如下:
所述Inception7层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为7×7;第四尺度第一层为尺寸为5×5的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
所述Inception5层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为3×3;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第四尺度第一层为尺寸为3×3的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
所述的Attention层包含通道注意力模块和空间注意力模块组成,所述通道注意力模块的激活函数为relu和sigmoid函数,所述空间注意力模块的激活函数为sigmoid函数。
进一步地,所述步骤S2中利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型包括如下步骤:
步骤S21,将训练集输入至Inception7层的输入层,利用Inception7层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception7层的concat连接层进行特征汇总得到第一特征图;将第一特征图输入至Inception5层的输入层,利用Inception5层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception5层的concat连接层进行特征汇总得到第二特征图;将第二特征图输入至Attention层,利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,接着利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图;
步骤S22,将空间特征图输入至胶囊网络的主要帽层形成低层胶囊网络多个神经元,利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新,将高层胶囊网络多个神经元的输出向量输入至分类层得到预测故障类型;
步骤S23,分别计算高层胶囊网络多个神经元的输出向量对应的二范数得到各类故障类型的概率,将各类故障类型的概率输入至分类层得到预测故障类型,利用预测故障类型结合故障标签及各类故障类型的概率计算Margin Loss损失函数,利用Margin Loss损失函数反向更新特征提取网络及胶囊网络中的权重系数;
步骤S24,重复S21至S23,直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型。
进一步地,步骤S22中的利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新具体步骤如下:
第一阶段,记低层胶囊网络的第i个神经元为xi,i=1,2,…,n,n为低层胶囊网络神经元总数,wij为xi对应的权重矩阵,j=1,2,…,m,m为高层胶囊网络神经元总数,xij为预测值,其公式为:
xij=wijxi (1)
第二阶段中,对预测值xij进行加权求和得到高层胶囊网络神经元的第一输出向量Sj,其公式为:
Figure BDA0003050316400000031
公式(2)中,cij为低层胶囊网络神经元的耦合系数;
第三阶段中,对第一输出向量Sj通过squash函数进行处理,获得高层胶囊网络神经元的第二输出向量Zj,其公式为:
Figure BDA0003050316400000032
第四阶段中,计算低层胶囊网络神经元的耦合系数cij,其公式为:
Figure BDA0003050316400000041
bij=bij+Zixij (5)
在每次前向传播时,将bij初始化为0,由公式(4)计算出低层胶囊网络神经元的耦合系数cij的初始化值,再由公式(2)和公式(3)计算出高层胶囊网络神经元的第一输出向量Sj和第二输出向量Zj;由公式(5)更新bij的数值,从而更新cij、Sj和Zj,直至完成3次路由更新算法。
进一步地,所述步骤S23中所述Margin Loss损失函数公式如下所示:
Figure BDA0003050316400000042
公式(6)中,pj=||Zj||为各类故障的概率;Tj为分类判定函数,假如分类层输出的预测故障类型与故障标签一致时,则Tj=1,否则Tj=0;m+为概率上限值,若pj大于m+,则损失函数Lj为0;m-为概率下限值,若pj小于m-,则损失函数Lj为0;λ为比例系数。
进一步地,步骤S21中利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,具体步骤为:
所述通道注意力模块将第二特征图F∈RC×H×W经过池化及感知机操作实现通道特征提取形成通道注意力Mc(F),将通道注意力Mc(F)和第二特征图F∈RC×H×W相乘得到通道特征图F',其公式为:
Figure BDA0003050316400000043
公式(7)中,
Figure BDA0003050316400000044
表示逐个元素相乘;W0∈RC/r×C,W0∈RC/r×C,r为减少率;
Figure BDA0003050316400000045
表示对F进行平均池化处理,
Figure BDA0003050316400000046
表示对F进行最大池化处理;σ为sigmoid激活函数,τ为relu激活函数;
步骤S21中利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图,具体步骤为:
所述空间注意力模块将通道特征图F'经过池化和卷积操作实现空间特征提取形成空间注意力Ms(F'),将空间注意力Ms(F')和通道特征图F'相乘得到空间特征图F”,其公式为:
Figure BDA0003050316400000051
公式(8)中,
Figure BDA0003050316400000052
表示对F'进行平均池化处理,
Figure BDA0003050316400000053
表示对F'进行最大池化处理;σ为sigmoid激活函数;7×7为卷积核的大小。
进一步地,步骤S2还包含利用验证集对训练好的轴承故障诊断模型进行超参数调整得到优化好的轴承故障诊断模型,所述验证集和步骤S1中训练集获取方法一样;
步骤S3,将测试集输入优化好的轴承故障诊断模型得到轴承故障诊断结果。
与现有技术相比,本发明具有以下优点:
(1)本发明利用改进的胶囊网络代替卷积神经网络,用胶囊网络中的向量神经元(低层胶囊网络及高层胶囊网络的神经元均是向量神经元)代替卷积神经网络标量神经元,在负载变换的变工况的环境下,将振动信号的空间位置作为信息的一部分被保存使用,提升预测故障模型的故障诊断性能;本发明的诊断方法在单工况和变工况下轴承故障诊断准确高,能够完成不同工况下的轴承故障诊断任务;
(2)基础的胶囊网络仅采用单层卷积核进行特征提取,未能从信号中获得更多重要信息。本发明采用第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层形成特征提取网络,并与胶囊网络结合,可以从振动信号中提取多尺度的关键信息,提升预测故障模型的特征提取性能,提高预测故障模型的故障诊断性能。
附图说明
图1为本发明一实施例中一种基于改进卷积胶囊的轴承故障诊断方法流程图。
图2为本发明一实施例中利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型的算法流程图;
图3为本发明一实施例中的改进卷积胶囊网络的模型结构图;
图4为本发明一实施例中的Inception层结构图;
图5为本发明一实施例中的Attention层模块结构图;
图6为本发明一实施例中的胶囊网络的动态路由算法示意图;
图7为本发明一实施例中的不同负荷工况下的信号数据图;
图8为本发明一实施例中的利用部分重复采样获取训练集中每批样本(二维时频数据)的示意图。
具体实施方式
下面将结合本发明实施例的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于改进卷积胶囊网络的轴承故障诊断方法,包括以下步骤:
步骤S1,获取轴承的训练集,所述训练集包含多个带有故障标签的轴承二维时频数据,所述轴承二维时频数据通过小波变换轴承的一维振动信号获得;
步骤S2,构建改进卷积胶囊网络,利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型;
如图3所示,所述改进卷积胶囊网络依次由特征提取网络及胶囊网络构成,所述特征提取网络包含第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层;
将训练集输入至特征提取网络得到二维时频数据的空间特征图,将空间特征图输入至胶囊网络得到预测故障类型;利用Margin Loss损失函数来反向更新特征提取网络及胶囊网络中的权重系数直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型;
步骤S3,将测试集输入训练好的轴承故障诊断模型得到轴承故障诊断结果。
具体地,所述步骤S2中所述第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层的结构如下:
如图4所示,所述Inception7层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为7×7;第四尺度第一层为尺寸为5×5的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
如图4所示,所述Inception5层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为3×3;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第四尺度第一层为尺寸为3×3的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
如图5所示,所述的Attention层包含通道注意力模块和空间注意力模块组成,所述通道注意力模块的激活函数为relu和sigmoid函数,所述空间注意力模块的激活函数为sigmoid函数。
如图2所示,所述步骤S2中利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型包括如下步骤:
步骤S21,将训练集输入至Inception7层的输入层,利用Inception7层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception7层的concat连接层进行特征汇总得到第一特征图;将第一特征图输入至Inception5层的输入层,利用Inception5层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception5层的concat连接层进行特征汇总得到第二特征图;将第二特征图输入至Attention层,利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,接着利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图;
步骤S22,将通道特征图及空间特征图输入至胶囊网络的主要帽层形成低层胶囊网络多个神经元,利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现数字帽层中的高层胶囊网络多个神经元的更新,将高层胶囊网络多个神经元的输出向量输入至分类层得到预测故障类型;
如图6所示,步骤S22中利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新具体步骤如下:
第一阶段,记低层胶囊网络的第i个神经元为xi,i=1,2,…,n,n为低层胶囊网络神经元总数,wij为xi对应的权重矩阵,j=1,2,…,m,m为高层胶囊网络神经元总数和故障类型总数相等,xij为预测值,其公式为:
xij=wijxi (1)
第二阶段中,对预测值xij进行加权求和得到高层胶囊网络神经元的第一输出向量Sj,其公式为:
Figure BDA0003050316400000071
公式(2)中,cij为低层胶囊网络神经元的耦合系数;
第三阶段中,对第一输出向量Sj通过squash函数进行处理,获得高层胶囊网络神经元的第二输出向量Zj,其公式为:
Figure BDA0003050316400000081
第四阶段中,计算低层胶囊网络神经元的耦合系数cij,其公式为:
Figure BDA0003050316400000082
bij=bij+Zixij (5)
在每次前向传播时,将bij初始化为0,由公式(4)计算出低层胶囊网络神经元的耦合系数cij的初始化值,再由公式(2)和公式(3)计算出高层胶囊网络神经元的第一输出向量Sj和第二输出向量Zj;由公式(5)更新bij的数值,从而更新cij、Sj和Zj,直至完成3次路由更新算法,因为在胶囊网络中一般选取迭代次数为3次;
步骤S23,分别计算高层胶囊网络多个神经元的输出向量对应的二范数得到各类故障类型的概率,将各类故障类型的概率输入至分类层得到预测故障类型,利用预测故障类型结合故障标签及各类故障类型的概率计算Margin Loss损失函数,利用Margin Loss损失函数反向更新特征提取网络及胶囊网络中的权重系数;一般通过随机优化算法(Adam)的反向传播算法更新特征提取网络及胶囊网络中的权重系数,并通过自适应学习速率算法选择最佳学习速率,使得模型能够迅速收敛。
所述步骤S23中所述Margin Loss损失函数公式如下所示:
Figure BDA0003050316400000083
公式(6)中,pj=||Zj||为各类故障的概率;Tj为分类判定函数,假如分类层输出的预测故障类型与故障标签一致时,则Tj=1,否则Tj=0;m+为概率上限值,若pj大于m+,则损失函数Lj为0;m-为概率下限值,若pj小于m-,则损失函数Lj为0;λ为比例系数,一般可以选取λ=0.5;
步骤S24,重复S21至S23,直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型。
进一步地,步骤S21中利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,具体步骤为:
所述通道注意力模块将第二特征图F∈RC×H×W经过池化及感知机操作实现通道特征提取形成通道注意力Mc(F),将通道注意力Mc(F)和第二特征图F∈RC×H×W相乘得到通道特征图F',其公式为:
Figure BDA0003050316400000091
公式(7)中,
Figure BDA0003050316400000092
表示逐个元素相乘;W0∈RC/r×C,W1∈RC×C/r,r为减少率一般选取r=16;
Figure BDA0003050316400000093
表示对F进行平均池化处理,
Figure BDA0003050316400000094
表示对F进行最大池化处理;σ为sigmoid激活函数,τ为relu激活函数;
步骤S21中利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图,具体步骤为:
所述空间注意力模块将通道特征图F'经过池化和卷积操作实现空间特征提取形成空间注意力Ms(F'),将空间注意力Ms(F')和通道特征图F'相乘得到空间特征图F”,其公式为:
Figure BDA0003050316400000095
公式(8)中,
Figure BDA0003050316400000096
表示对F'进行平均池化处理,
Figure BDA0003050316400000097
表示对F'进行最大池化处理;σ为sigmoid激活函数;7×7为卷积核的大小。
进一步地,步骤S2还包含利用验证集对训练好的轴承故障诊断模型进行超参数调整得到优化好的轴承故障诊断模型,所述验证集和步骤S1中训练集获取方法一样。
下面以一具体实施对本发明的轴承故障诊断方法进行进一步说明,采用凯斯西储大学轴承数据集作为数据集。故障类型分为正常以及内圈、外圈和滚动体三种故障。其中,每种均有0.1778mm、0.3556mm和0.5334mm三种不同尺寸的损伤,对应不同类型的故障。数据集包含了正常和九种不同类型故障共十种,如表1所示。其中,每种数据类型均按5:1:2的比例划分,划分为250个训练样本形成训练集、50个验证样本形成验证集和100个测试样本形成测试集。每个数据样本都被打上故障标签,表示对应的故障类型。
Figure BDA0003050316400000098
Figure BDA0003050316400000101
表1
本发明的实施例中,改进卷积胶囊网络是通过开源的软件库Tensorflow2.0构建的,批处理次数Batch定为100。如图8所示,每次从训练集中抽取训练样本时采用部分重复采样的手段对训练集进行扩展,利用验证集对训练好的轴承故障诊断模型进行超参数调整得到优化好的轴承故障诊断模型,所述超参数包括学习效率设于0.0001使得轴承故障诊断模型能够迅速收敛。
为验证改进卷积胶囊网络(Improved Convolutional Capsule Network,IC-CN)模型性能,将卷积神经网络(Convolutional Neural Network,CNN)以及卷积胶囊网络(Convolutional Capsule Network,C-CN)两种深度学习模型进行对比。
参照表1数据集构建的方式,分别选取0hp、1hp、2hp、3hp负荷工况下的数据构建单工况下的数据集。模型权重迭代次数Epoch定为300。为更好地评估模型的故障诊断性能,将准确度以及F1分数作为评估指标。F1分数和准确度相似,是统计学中用来衡量分类模型精确度的一种指标。为减少诊断实验的偶然性,每个模型均在不同单工况上重复诊断三次,取平均值作为模型诊断的准确度和F1分数。实验结果如表2、表3所示。
Figure BDA0003050316400000102
表2
Figure BDA0003050316400000103
表3
从表2、表3中可以得出,IC-CN模型在四种不同单工况下的准确度和F1分数基本一致,均高于CNN,在0hp和1hp单工况下的准确度高于C-CN模型。在不同单工况下的平均准确度上,IC-CN模型比CNN和C-CN模型分别提高0.46%和0.03%,这说明IC-CN模型在单工况下诊断性能更加优异。
在变工况下的实施例中,如图7所示,损伤尺寸大小为0.5334mm的外圈故障在不同负荷工况下运转的信号数据是有差别的,信号在不同负荷工况下的加速度数据是有区别的,幅值和相位是不一样的。参照表1数据集构建的方式,所用的训练和测试集均采用不同负荷工况下的数据。变工况相对于单工况,样本数据增多,模型训练过程变复杂,为让模型更好地训练数据,增大模型迭代次数,将数Epoch定为500。实验结果如表4和表5所示。
Figure BDA0003050316400000111
表4
Figure BDA0003050316400000112
表5
从表4和表5可以得出,当负荷发生变化时,三种方法的准确度和F1分数均不同程度地发生了降低。虽然诊断性能发生了下降,但是IC-CN模型与其他两种模型相比,诊断性能下降的幅度小,在三种变工况下的准确度均高于CNN和C-CN模型。在三种变工况下的平均准确度上,相对于CNN和C-CN模型,IC-CN模型分别提高了8.24%和3.42%。IC-CN模型在三种变工况下的F1分数均高于其他两种模型。在三种变工况下的平均F1分数上,IC-CN模型相对于其他两种模型分别提高了10.2%和3.65%。这些说明IC-CN模型在变工况下诊断性能更加优异。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细但并不能因此而理解为对本申请专利范围的限制。对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,包括以下步骤:
步骤S1,获取轴承的训练集,所述训练集包含多个带有故障标签的轴承二维时频数据,所述轴承二维时频数据通过小波变换轴承的一维振动信号获得;
步骤S2,构建改进卷积胶囊网络,利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型;
所述改进卷积胶囊网络依次由特征提取网络及胶囊网络构成,所述特征提取网络包含第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层;
将训练集输入至特征提取网络得到二维时频数据的空间特征图,将空间特征图输入至胶囊网络得到预测故障类型;利用Margin Loss损失函数来反向更新特征提取网络及胶囊网络中的权重系数直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型;
步骤S3,将测试集输入训练好的轴承故障诊断模型得到轴承故障诊断结果。
2.根据权利要求1所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,所述步骤S2中所述第一分层卷积结构Inception7层、第二分层卷积结构Inception5层及Attention层的结构如下:
所述Inception7层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为7×7;第四尺度第一层为尺寸为5×5的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
所述Inception5层,包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层;第一尺度通道数为32,卷积核为1×1;第二尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为3×3;第三尺度第一层通道数为32,卷积核为1×1,第二层通道数为32,卷积核为5×5;第四尺度第一层为尺寸为3×3的最大值池化层,第二层通道数为32,卷积核为1×1;整个层激活函数均为relu函数;
所述的Attention层包含通道注意力模块和空间注意力模块,所述通道注意力模块的激活函数为relu和sigmoid函数,所述空间注意力模块的激活函数为sigmoid函数。
3.根据权利要求2所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,所述步骤S2中利用训练集训练改进卷积胶囊网络得到训练好的轴承故障诊断模型包括如下步骤:
步骤S21,将训练集输入至Inception7层的输入层,利用Inception7层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception7层的concat连接层进行特征汇总得到第一特征图;将第一特征图输入至Inception5层的输入层,利用Inception5层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception5层的c0oncat连接层进行特征汇总得到第二特征图;将第二特征图输入至Attention层,利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,接着利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图;
步骤S22,将空间特征图输入至胶囊网络的主要帽层形成低层胶囊网络多个神经元,利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新,将高层胶囊网络多个神经元的输出向量输入至分类层得到预测故障类型;
步骤S23,分别计算高层胶囊网络多个神经元的输出向量对应的二范数得到各类故障类型的概率,将各类故障类型的概率输入至分类层得到预测故障类型,利用预测故障类型结合故障标签及各类故障类型的概率计算Margin Loss损失函数,利用Margin Loss损失函数反向更新特征提取网络及胶囊网络中的权重系数;
步骤S24,重复S21至S23,直至达到预设的权重迭代次数,从而形成训练好的轴承故障诊断模型。
4.根据权利要求3所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,步骤S22中的利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新具体步骤如下:
第一阶段,记低层胶囊网络的第i个神经元为xi,i=1,2,…,n,n为低层胶囊网络神经元总数,wij为xi对应的权重矩阵,j=1,2,…,m,m为高层胶囊网络神经元总数,xij为预测值,其公式为:
xij=wijxi (1)
第二阶段中,对预测值xij进行加权求和得到高层胶囊网络神经元的第一输出向量Sj,其公式为:
Figure FDA0003050316390000021
公式(2)中,cij为低层胶囊网络神经元的耦合系数;
第三阶段中,对第一输出向量Sj通过squash函数进行处理,获得高层胶囊网络神经元的第二输出向量Zj,其公式为:
Figure FDA0003050316390000031
第四阶段中,计算低层胶囊网络神经元的耦合系数cij,其公式为:
Figure FDA0003050316390000032
bij=bij+Zixij (5)
在每次前向传播时,将bij初始化为0,由公式(4)计算出低层胶囊网络神经元的耦合系数cij的初始化值,再由公式(2)和公式(3)计算出高层胶囊网络神经元的第一输出向量Sj和第二输出向量Zj;由公式(5)更新bij的数值,从而更新cij、Sj和Zj,直至完成3次路由更新算法。
5.根据权利要求3所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,所述步骤S23中所述Margin Loss损失函数公式如下所示:
Figure FDA0003050316390000033
公式(6)中,pj=||Zj||为各类故障的概率;Tj为分类判定函数,假如分类层输出的预测故障类型与故障标签一致时,则Tj=1,否则Tj=0;m+为概率上限值,若pj大于m+,则损失函数Lj为0;m-为概率下限值,若pj小于m-,则损失函数Lj为0;λ为比例系数。
6.根据权利要求3所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,步骤S21中利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获得通道特征图,具体步骤为:
所述通道注意力模块将第二特征图F∈RC×H×W经过池化及感知机操作实现通道特征提取形成通道注意力Mc(F),将通道注意力Mc(F)和第二特征图F∈RC×H×W相乘得到通道特征图F',其公式为:
Figure FDA0003050316390000035
Figure FDA0003050316390000034
公式(7)中,
Figure FDA0003050316390000046
表示逐个元素相乘;W0∈RC/r×C,W1∈RC×C/r,r为减少率;
Figure FDA0003050316390000041
表示对F进行平均池化处理,
Figure FDA0003050316390000042
表示对F进行最大池化处理;σ为sigmoid激活函数,τ为relu激活函数;
步骤S21中利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图,具体步骤为:
所述空间注意力模块将通道特征图F'经过池化和卷积操作实现空间特征提取形成空间注意力Ms(F'),将空间注意力Ms(F')和通道特征图F'相乘得到空间特征图F”,其公式为:
Figure FDA0003050316390000043
公式(8)中,
Figure FDA0003050316390000044
表示对F'进行平均池化处理,
Figure FDA0003050316390000045
表示对F'进行最大池化处理;σ为sigmoid激活函数;7×7为卷积核的大小。
7.根据权利要求1-6中任一项所述的一种基于改进卷积胶囊网络的轴承故障诊断方法,其特征在于,步骤S2还包含利用验证集对训练好的轴承故障诊断模型进行超参数调整得到优化好的轴承故障诊断模型,所述验证集和步骤S1中训练集获取方法一样;
步骤S3,将测试集输入优化好的轴承故障诊断模型得到轴承故障诊断结果。
CN202110489570.1A 2021-04-30 2021-04-30 一种基于改进卷积胶囊网络的轴承故障诊断方法 Active CN113255882B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110489570.1A CN113255882B (zh) 2021-04-30 2021-04-30 一种基于改进卷积胶囊网络的轴承故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110489570.1A CN113255882B (zh) 2021-04-30 2021-04-30 一种基于改进卷积胶囊网络的轴承故障诊断方法

Publications (2)

Publication Number Publication Date
CN113255882A true CN113255882A (zh) 2021-08-13
CN113255882B CN113255882B (zh) 2022-11-04

Family

ID=77223584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110489570.1A Active CN113255882B (zh) 2021-04-30 2021-04-30 一种基于改进卷积胶囊网络的轴承故障诊断方法

Country Status (1)

Country Link
CN (1) CN113255882B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113984389A (zh) * 2021-12-01 2022-01-28 广西大学 一种基于多感受野与改进胶囊图神经网络的滚动轴承故障诊断方法
CN114330439A (zh) * 2021-12-28 2022-04-12 盐城工学院 一种基于卷积神经网络的轴承诊断方法
CN114444187A (zh) * 2022-01-28 2022-05-06 河海大学 一种振动传递大数据与胶囊网络融合的桥梁损伤诊断方法
CN114548153A (zh) * 2022-01-21 2022-05-27 电子科技大学 基于残差-胶囊网络的行星齿轮箱故障诊断方法
CN114757239A (zh) * 2022-06-15 2022-07-15 浙江大学 基于数据增强和胶囊神经网络的风机故障可迁移诊断方法
CN114897138A (zh) * 2022-05-06 2022-08-12 东南大学 基于注意力机制和深度残差网络的系统故障诊断方法
CN115238833A (zh) * 2022-09-22 2022-10-25 中国民航大学 一种空气涡轮起动机轴承性能退化特征提取方法
CN115406656A (zh) * 2022-08-29 2022-11-29 桂林电子科技大学 轴承锈蚀智能诊断方法及系统
GB2623358A (en) * 2021-12-17 2024-04-17 Univ Harbin Eng Method and system for fault diagnosis of nuclear power circulating water pump based on optimized capsule network
CN118135402A (zh) * 2024-03-18 2024-06-04 临沂大学 基于多级胶囊融合网络的sar目标识别方法及相关装置
CN118312879A (zh) * 2024-04-08 2024-07-09 南京理工大学 一种基于注意力卷积胶囊网络的比例伺服阀故障诊断方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190370972A1 (en) * 2018-06-04 2019-12-05 University Of Central Florida Research Foundation, Inc. Capsules for image analysis
CN110657984A (zh) * 2019-09-27 2020-01-07 重庆大学 一种基于强化胶囊网络的行星齿轮箱故障诊断方法
CN111046916A (zh) * 2019-11-20 2020-04-21 上海电机学院 一种基于空洞卷积胶囊网络的电机故障诊断方法及系统
CN111626361A (zh) * 2020-05-28 2020-09-04 辽宁大学 一种改进胶囊网络优化分层卷积的轴承亚健康识别方法
CN111832663A (zh) * 2020-07-30 2020-10-27 上海电机学院 一种基于门控循环单元的胶囊网络滚动轴承故障诊断系统
CN111832812A (zh) * 2020-06-27 2020-10-27 南通大学 一种基于深度学习的风电功率短期预测方法
CN111967537A (zh) * 2020-04-13 2020-11-20 江西理工大学 一种基于双路胶囊网络的sar目标分类方法
CN112577747A (zh) * 2020-12-07 2021-03-30 东南大学 一种基于空间池化网络的滚动轴承故障诊断方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190370972A1 (en) * 2018-06-04 2019-12-05 University Of Central Florida Research Foundation, Inc. Capsules for image analysis
CN110657984A (zh) * 2019-09-27 2020-01-07 重庆大学 一种基于强化胶囊网络的行星齿轮箱故障诊断方法
CN111046916A (zh) * 2019-11-20 2020-04-21 上海电机学院 一种基于空洞卷积胶囊网络的电机故障诊断方法及系统
CN111967537A (zh) * 2020-04-13 2020-11-20 江西理工大学 一种基于双路胶囊网络的sar目标分类方法
CN111626361A (zh) * 2020-05-28 2020-09-04 辽宁大学 一种改进胶囊网络优化分层卷积的轴承亚健康识别方法
CN111832812A (zh) * 2020-06-27 2020-10-27 南通大学 一种基于深度学习的风电功率短期预测方法
CN111832663A (zh) * 2020-07-30 2020-10-27 上海电机学院 一种基于门控循环单元的胶囊网络滚动轴承故障诊断系统
CN112577747A (zh) * 2020-12-07 2021-03-30 东南大学 一种基于空间池化网络的滚动轴承故障诊断方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ZHIYU ZHU等: "A convolutional neural network based on a capsule network with strong generalization for bearing fault diagnosis", 《NEUROCOMPUTING》 *
刘玉良等: "《深度学习》", 30 November 2019 *
朱佳丽等: "基于迁移学习的注意力胶囊网络", 《智能计算机与应用》 *
邱存月: "改进胶囊网络优化分层卷积的亚健康识别算法研究", 《中国优秀硕士学位论文全文数据库信息科技II辑》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113984389A (zh) * 2021-12-01 2022-01-28 广西大学 一种基于多感受野与改进胶囊图神经网络的滚动轴承故障诊断方法
CN113984389B (zh) * 2021-12-01 2023-09-01 广西大学 一种基于多感受野与改进胶囊图神经网络的滚动轴承故障诊断方法
GB2623358B (en) * 2021-12-17 2024-10-09 Univ Harbin Eng Method and system for fault diagnosis of nuclear power circulating water pump based on optimized capsule network
GB2623358A (en) * 2021-12-17 2024-04-17 Univ Harbin Eng Method and system for fault diagnosis of nuclear power circulating water pump based on optimized capsule network
CN114330439A (zh) * 2021-12-28 2022-04-12 盐城工学院 一种基于卷积神经网络的轴承诊断方法
CN114548153A (zh) * 2022-01-21 2022-05-27 电子科技大学 基于残差-胶囊网络的行星齿轮箱故障诊断方法
CN114444187B (zh) * 2022-01-28 2023-07-18 河海大学 一种振动传递大数据与胶囊网络融合的桥梁损伤诊断方法
CN114444187A (zh) * 2022-01-28 2022-05-06 河海大学 一种振动传递大数据与胶囊网络融合的桥梁损伤诊断方法
CN114897138A (zh) * 2022-05-06 2022-08-12 东南大学 基于注意力机制和深度残差网络的系统故障诊断方法
CN114757239A (zh) * 2022-06-15 2022-07-15 浙江大学 基于数据增强和胶囊神经网络的风机故障可迁移诊断方法
CN114757239B (zh) * 2022-06-15 2022-08-30 浙江大学 基于数据增强和胶囊神经网络的风机故障可迁移诊断方法
CN115406656A (zh) * 2022-08-29 2022-11-29 桂林电子科技大学 轴承锈蚀智能诊断方法及系统
CN115238833B (zh) * 2022-09-22 2022-11-25 中国民航大学 一种空气涡轮起动机轴承性能退化特征提取方法
CN115238833A (zh) * 2022-09-22 2022-10-25 中国民航大学 一种空气涡轮起动机轴承性能退化特征提取方法
CN118135402A (zh) * 2024-03-18 2024-06-04 临沂大学 基于多级胶囊融合网络的sar目标识别方法及相关装置
CN118312879A (zh) * 2024-04-08 2024-07-09 南京理工大学 一种基于注意力卷积胶囊网络的比例伺服阀故障诊断方法
CN118312879B (zh) * 2024-04-08 2024-09-24 南京理工大学 一种基于注意力卷积胶囊网络的比例伺服阀故障诊断方法

Also Published As

Publication number Publication date
CN113255882B (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
CN113255882B (zh) 一种基于改进卷积胶囊网络的轴承故障诊断方法
CN110361176B (zh) 一种基于多任务特征共享神经网络的智能故障诊断方法
CN106682688B (zh) 基于粒子群优化的堆叠降噪自编码网络轴承故障诊断方法
CN112906644B (zh) 基于深度迁移学习的机械故障智能诊断方法
CN107066759B (zh) 一种汽轮机转子振动故障诊断方法及装置
CN114970605B (zh) 一种多模态特征融合神经网络的制冷设备故障诊断方法
CN112964469B (zh) 一种迁移学习的变负载下滚动轴承在线故障诊断方法
CN112347854A (zh) 滚动轴承故障诊断方法、系统、存储介质、设备及应用
CN110657984B (zh) 一种基于强化胶囊网络的行星齿轮箱故障诊断方法
CN111721536A (zh) 一种改进模型迁移策略的滚动轴承故障诊断方法
CN113111820B (zh) 基于改进cnn与关系模块的旋转部件故障诊断方法及其装置
CN113065581B (zh) 基于参数共享对抗域自适应网络的振动故障迁移诊断方法
CN111458148A (zh) 一种基于cbam的卷积神经网络滚动轴承故障诊断方法
CN114429150A (zh) 一种基于改进深度子域适应网络的变工况下滚动轴承故障诊断方法及系统
CN113887342A (zh) 基于多源信号和深度学习的设备故障诊断方法
CN111753891A (zh) 一种无监督特征学习的滚动轴承故障诊断方法
CN114355240A (zh) 配电网接地故障诊断方法及装置
CN117708656B (zh) 一种面向单源域的滚动轴承跨域故障诊断方法
CN115290326A (zh) 一种滚动轴承故障智能诊断方法
CN115374810A (zh) 基于动态可分离卷积神经网络的故障诊断方法及设备
CN112414715B (zh) 基于混合特征与改进灰度共生算法的轴承故障诊断方法
CN113705396A (zh) 一种电机故障诊断方法、系统及设备
CN113435321A (zh) 一种主轴轴承状态评估方法、系统、设备及可读存储介质
CN114925809B (zh) 基于lstm的印刷机轴承故障诊断方法及装置
CN112633362B (zh) 一种旋转机械自适应故障诊断方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant