CN117251680A

CN117251680A - 轴承故障诊断网络

Info

Publication number: CN117251680A
Application number: CN202311298778.0A
Authority: CN
Inventors: 马新娜; 郑雪鹏; 汤宇; 刘勤清; 李沂阳; 梁秀; 李豪; 胡畅霞; 何畔; 张策; 胡沛伶; 谷丽华
Original assignee: Shijiazhuang Tiedao University
Current assignee: Shijiazhuang Tiedao University
Priority date: 2023-10-09
Filing date: 2023-10-09
Publication date: 2023-12-19
Anticipated expiration: 2043-10-09
Also published as: CN117251680B

Abstract

本发明公开了一种轴承故障诊断网络，涉及轴承故障信号处理技术领域。所述网络包括两种结构，分别是轻型网络ResDenseNet‑CA与高精度网络多尺度交叉密集连接网络(MSCDNet)，都包括诊断网络振动信号预处理模块、特征提取模块以及故障诊断分类模块；第一种网络通过削减密集块数与密集层数，并逐层加入残差连接实现跳跃连接，减少特征损失，并利用密集连接的特性进行特征复用，在快速训练的同时也能实现较高的准确度；第二种网络用两个不同卷积尺度的并行密集块交叉连接进行多尺度特征融合，极大地利用了信号特征，并在密集块之间的dropout层和translation层之间加入SE注意力机制，实现了高精度的故障诊断，并拥有较强的抗噪性能。

Description

轴承故障诊断网络

技术领域

本发明涉及轴承故障信号处理技术领域，尤其涉及一种轴承故障诊断网络。

背景技术

滚动轴承故障诊断是机械工程领域中的一个重要研究领域，其研究现状一直备受关注。随着工业自动化的发展和机械设备的广泛应用，轴承的健康状况对设备的可靠性和性能至关重要。传统的数据驱动方法主要侧重于信号处理，着重研究如何有效地提取和表征故障信号中的特征信息。这些方法依赖于先验知识和手工设计的特征提取器，以便识别和分类不同的状态或故障模式。相比之下，深度学习方法更加注重于状态分类的功能性。它们利用深度神经网络的强大特征提取能力，通过对网络的结构和参数进行优化，实现对故障信号的自动化分类。深度学习方法的关键在于通过大规模数据的学习，使网络能够自动发现和利用信号中的重要特征，从而达到故障分类的目标。比如宫俊宇提出的CNN-LSTM-Attention融合模型，加入注意力机制使得模型更加关注明显的故障特征信息，忽略信号中的噪声。牛锐祥提出的改进密集连接网络方法，实现多尺度的特征提取，提高了模型在变工况下的诊断能力。

汪久根将深度残差网络用于RV减速器的故障诊断，并在轴承数据集上测试，证明了深度残差网络的泛化能力。孔子迁引入注意力机制，对提取的特征加权处理，有效提高了行星齿轮箱故障诊断的识别率。Zhuo Chen等提出了密集连接网络多特征连接，解决了信号混响问题。赵志宏等人提出了一种基于BiLSTM与注意力机制的剩余寿命预测方法，更准确地提取了设备的健康状态信息，具有很大的应用价值。孙俊静等提出了基于注意力机制多尺度卷积神经网络的轴承故障诊断，通过多尺度卷积核和注意力机制，实现了滚动轴承的高效率诊断，在多尺度特征融合方面具有很好的参考价值。但是上述现有技术存在的主要缺点在于故障诊断精度不高，且计算速度慢等缺点。

发明内容

本发明所要解决的技术问题是如何提供一种故障诊断精度高的轴承故障诊断网络。

为解决上述技术问题，本发明所采取的技术方案是：一种轴承故障诊断网络，包括：振动信号预处理模块、特征提取模块以及故障诊断分类模块；

振动信号预处理模块，用于从mat文件中随机截取若干个样本点，对每个像素点进行标准化，堆叠生成灰度图像，并对图像进行三通道填充，用作输入数据；

特征提取模块，特征提取模块共包括三层DRnet-SE模块，数据首先经过DRnet-SE模块中的Conv层、BN层和Relu层处理后进入密集块中进行特征提取，密集块中加入残差连接，将每个密集块的输入与最终的输出结果相结合，然后经过SE注意力模块对有效特征增加权重，增强模型的抗噪性，最后通过translation层调整灰度图通道数，适应下一层DRnet-SE的输入；

故障诊断分类模块，用于将特征提取模块的最终输出经全连接层，通过softmax做最终分类，输出轴承故障诊断结果。

进一步的技术方案在于：所述密集块包括第一归一化层(BN)，所述第一归一化层(BN)经第一Relu激活函数与第一卷积层的输入端连接，所述第一卷积层的输出端与第二归一化层的的输入端连接，所述第二归一化层经第二Relu激活函数与第二卷积层的输入端连接，所述第二卷积层的输出端与Dropout层的输入端连接，所述Dropout层的输出端为所述密集块的输出端。

进一步的技术方案在于：，所述SE注意力模块包括：Inputs层，所述Inputs层的输入端与全局平均池化的输入端连接，所述全局平均池化层的输出端与第一全连层的输入端连接，所述第一全连层的输出端与第二全连层的输入端连接，所述第二全连层的输出端与Scale层的输入端连接。

进一步的技术方案在于，全局平均池化：对输入inputs进行全局平均池化操作；这将对每个通道的特征进行平均，从每个通道产生一个标量值，存储在变量x中；公式表示如下，其中，h,w分别为通道的高度和宽度，c表示通道索引：

第一全连接层使用具有ReLU激活函数的全连接层将全局平均池化后的特征x压缩到较低维度，公式表示为：

x＝relu(W₁·x+b₁)

其中W₁是第一个全连接层的权重矩阵，b₁是偏置；

第二全连接层使用具有sigmoid激活函数的全连接层将压缩后的特征x解压缩回原始通道数，公式表示：

x＝sigmoid(W₂·x+b₂)

其中W₂是第一个全连接层的权重矩阵，b₂是偏置。

进一步的技术方案在于：所述translation层用于控制输出通道数，以实现维度的降低，包括BN层、RELU层、1*1卷积、正则化层和平均池化层，

本发明还公开了一种轴承故障诊断网络，包括：数据预处理模块、特征提取模块以及故障诊断分类模块；

所述数据预处理模块用于从mat文件中随机截取若干个样本点，对每个像素点进行标准化，堆叠生成灰度图像，并对图像进行三通道填充，用作输入数据；

所述特征提取模块用于通过卷积操作，再将灰度图数据分别输入到两个并行的3*3卷积密集块和5*5卷积密集块中，5*5卷积层的密集块需要在开始进行补零操作，否则会导致特征图大小不同；共有三个多尺度交叉密集块，每个多尺度交叉密集块包括并行的两组三层密集层，密集层中各层卷积的输出采用密集连接机制，两个密集块的输出通过concat层连接，并通过瓶颈层控制特征图的通道数为原来的1/4，将结果分别输入给下一层并行连接的密集层，重复此方法直到多尺度交叉密集块最后；多尺度交叉密集块的结尾是SE注意力模块和translation层，用于调整灰度图像通道数，适应下一个多尺度交叉密集块的输入大小直到最后一个多尺度交叉密集块结束；

故障诊断分类模块，用于经过全局平均池化层和全连接层，通过softmax进行故障分类，输出轴承故障诊断结果。

采用上述技术方案所产生的有益效果在于：本申请中，第一种网络通过削减密集块数与密集层数，并逐层加入残差连接实现跳跃连接，减少特征损失，并利用密集连接的特性进行特征复用，在快速训练的同时也能实现较高的准确度；第二种网络用两个不同卷积尺度的并行密集块交叉连接进行多尺度特征融合，极大地利用了信号特征，并在密集块之间的dropout层和translation层之间加入SE注意力机制，实现了高精度的故障诊断，并拥有较强的抗噪性能。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1是本发明实施例中密集连接网络的主体结构图；

图2是本发明实施例中第一种故障诊断网络的结构示意图；

图3是本发明实施例中振动信号转灰度图像的示意图；

图4是本发明实施例中第二种故障诊断网络的结构示意图；

图5是本发明实施例中学习率变化曲线图；

图6是本发明实施例中MSCDNet训练曲线图；

图7是本发明实施例中混淆矩阵；

图8是本发明实施例中原始灰度图与带dB＝-1(左2)和dB＝-6(右1)噪声干扰的灰度图；

图9为本发明实施例中dB＝-1(左)和dB＝-6(右)时，LResDenseNetSE网络准确率曲线；

图10为本发明实施例中dB＝-1(左)和dB＝-6(右)时，MSCDNet网络准确率曲线；

图11是本发明实施例中dB＝-6时，MSCDNet的混淆矩阵。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

原形网络

密集连接网络的主体结构如图1所示，每个密集块的结构如表1所示。密集块之间可以通过密集连接如图中左方虚框中所示，这种方法可以充分保留特征信息，这种通道结合的方式意味着不需要重复学习相同的特征，以及translation层可以控制特征图的大小和通道数量，能极大地减少参数量和计算量，在同性能的情况下，DenseNet网络参数量只有ResNet参数量的60％，文中卷积操作，归一化操作和激活函数公式如下。卷积计算公式可表示为：

式外x_l表示第l层输出，式内x_i表示第l层输入,“*”表示卷积操作，w表示卷积核权值，b表示对应的偏置。

批归一化(Batch Normalization，简称BN)是一种用于深度神经网络的正则化技术，它有助于训练更深、更稳定的神经网络，归一化层的计算公式可表示为：

计算批次特征维度中的均值及方差：

RELU激活函数的计算公式表示为：

f(x)＝max(0,x) (4)

表1密集块的具体结构

注意力机制：

注意力机制是一种用于增强神经网络在处理序列数据或其他结构化数据时的能力的技术。注意力机制的核心思想是，当处理输入序列的不同部分时，网络应该分配不同的注意力或权重给这些部分，以便更好地捕捉输入数据的相关信息。这有助于网络在处理长序列或具有不同重要性部分的序列时更有效地工作。

为提高网络的抗噪性，使网络能够更加注重故障相关的特征信息，减少无关信息的干扰，为文中的神经网络模型添加SE注意力模块，结构如下：

表2 SE注意力模块具体结构

全局平均池化：通过对输入inputs进行全局平均池化操作。这将对每个通道的特征进行平均，从每个通道产生一个标量值，存储在变量x中。公式表示如下，其中，h,w分别为通道的高度和宽度，c表示通道索引。

第一个全连接层使用具有ReLU激活函数的全连接层将全局平均池化后的特征x压缩到较低维度，公式表示为：

x＝relu(W₁·x+b₁) (6)

其中W₁是第一个全连接层的权重矩阵，b₁是偏置。

第二个全连接层使用具有sigmoid激活函数的全连接层将压缩后的特征x解压缩回原始通道数。公式表示：

x＝sigmoid(W₂·x+b₂) (7)

其中W₂是第一个全连接层的权重矩阵，b₂是偏置。

通过上述分析，本申请提出了两种具体的故障诊断网络，第一中为轻型网络LResDenseNetSE第二种为MSCDNet。

实施例一：

轻型网络LResDenseNetSE：

密集连接网络使用密集连接机制，实现了特征的重用和梯度流通，减轻了梯度消失问题并且提高了模型的泛化能力。本申请提出一种改进的轻型残差密集连接网络，通过对密集块数和密集层数进行削减，并逐层加入残差连接，在translation层之前加入SE注意力模型防止由于轻量化导致的信息丢失问题。该网络的基本结构如图2所示。图2中的translation层包含BN层、RELU层、1*1卷积，正则化层和平均池化层。主要作用是控制了输出通道数，以实现维度的降低。这可以帮助减少模型的计算复杂度和参数数量，调整通道数以适应下一层DRnet-SE模块的输入大小，同时保留重要的特征。

详细的，本发明实施例公开了一种轴承故障诊断网络，包括：振动信号预处理模块、特征提取模块以及故障诊断分类模块；

振动信号预处理模块，首先从mat文件中随机截取1024个样本点，对每个像素点进行标准化，堆叠生成32*32的灰度图像，并对图像进行三通道填充，用作输入数据，振动信号转灰度图像示意图如下3所示。

特征提取模块共包括三层DRnet-SE模块，数据经过Conv、BN、Relu层处理后进入密集块中进行特征提取，密集块中加入了残差连接，将每个密集块的输入与最终的输出结果相结合，如图2中下半部分所示，此结构能够有效减少特征冗余以及梯度消失问题。然后经过注意力机制SE模块，对有效特征增加权重，增强模型的抗噪性，最后通过translation层调整灰度图通道数，适应下一层DRnet-SE的输入。

故障诊断分类模块：特征提取模块的最终输出经过全连接层，通过softmax做最终分类，，输出轴承故障诊断结果，最后使用evaluate函数对模型做评估。

实施例二：

MSCDNet网络：

总体，本申请分别将卷积核为3*3与5*5的两种密集网络并行训练，提取不同层次的特征，再通过concat操作进行交叉连接，实现特征的融合。密集块内部使用融合特征的密集连接，通过补零操作使得特征图结构相同，进行逐层通道累加，并于密集块之间加入SE注意力机制，捕捉多尺度下的特征相关信息，减少噪声干扰。网络的主要诊断结构如下图4所示。

详细的，本发明实施例公开了一种轴承故障诊断网络：

诊断网络同样包含三个模块：振动信号预处理模块、特征提取模块以及故障诊断分类模块。振动信号预处理模块与实施例一信号预处理模块的处理方法相同；特征提取模块是通过卷积操作，再将灰度图数据分别输入到两个并行密集块中(3*3卷积和5*5卷积)，5*5卷积层的密集块需要在开始进行补零操作，否则会导致特征图大小不同。以此方法提取不同尺度的特征。共有三个多尺度交叉密集块，每个密集块有并行的两组三层密集层，密集层中各层卷积的输出采用密集连接机制，两个密集块的输出通过concat连接，并通过瓶颈层控制特征图的通道数为原来的1/4，将结果分别输入给下一层并行连接的密集层，重复此方法直到多尺度交叉密集块最后。多尺度交叉密集块的结尾是SE注意力机制和translation层，继承了传统密集连接网络的连接方式，调整灰度图像通道数，适应下一个多尺度交叉密集块的输入大小直到最后一个多尺度交叉密集块结束；故障诊断分类模块：经过全局平均池化层和全连接层，通过softmax进行故障分类。并以evaluate函数对模型进行评估。特征提取部分：相较于传统密集连接网络的BC版本，削减了密集块中的层数和密集块数，增加了一个新的并行块，通过多尺度特征的提取和交叉连接，加速了特征提取速度，最终提高了模型的故障分类准确率。

实验内容

实验环境

实验配置为i7 11800K的处理器、16G内存条、NVIDIA GeForce GTX 3050Ti显卡，Windows10 64位操作系统、python 3.9.7、CUDA 11.6，pytorch框架，使用JupyterNotebook作为编程工具。

数据集为在西储大学官方下载的CWRU轴承数据集。其中的滚珠轴承测试数据涵盖了直径从0.007英寸到0.040英寸的不同尺寸的轴承，并包括了内滚道、滚动元件和外滚道三个不同部位的故障。振动数据记录了在0至3马力(电机转速1797至1720RPM)电机负载下的轴承振动情况。数据文件采用Matlab格式存储，每个文件都包含了风扇和驱动端的振动数据以及电机转速信息。数据集中的振动数据采集速率分别为每秒12000个样本和每秒48000个样本，其中驱动端的数据包含了更高的采样率。数据集还包含了试验台的示意图，展示了数据的采集设置和实验条件。

本文数据集选用了西储大学轴承数据的12K 驱动端轴承故障数据，电机转速1730rpm下的正常振动数据和滚动体、内圈、外圈故障在三种故障等级下的振动数据，共有10种类型，分为正常类型normal以及9种故障类型IR007,IR014,IR021,OR007,OR014,OR021,B007,B014,B021。其中，IR，OR,B分别表示内圈，外圈，滚动体故障，007，014，021表示故障直径。实验验证所选取的数据集如下表3所示。

表3-实验验证所选取的数据集

采用每个样本数据包含1024个采样点的规格构建数据集，并采用了一些预处理手段来对原始数据集进行数据增强，数据标准化等操作，其中包括：随机切片、数据增强、BN归一化、绝对值化等方法。最后将得到的时序数据以行排列方式，由向量形式转化为32*32矩阵形式，以契合模型的输入。

得到共1200个二维样本，按照，800：200：200的比例划分训练集，验证集和测试集。模型诊断准确率一验证集准确率进行验证，并以测试集数据诊断准确率的平均值为准。

基于LResDenseNetSE的故障诊断实验

验证轻型网络LResDenseNetSE的诊断性能，设计实验对比原型网络，测验对模型轻量化是否会影响模型性能，并且对照原型网络参数，观察测量轻量化效果，以模型大小、平均准确率以及训练时长为准(epoch都为300，其余指标以各模型最佳参数为准)。实验结果如下表4所示。

表4-实验结果

很明显，在使用文中正常数据集下，该模型相较于原模型有很大的性能提升，很大地加快了训练速度，并且模型准确率下降很少，验证了模型的可行性。

基于MSCDNet的故障诊断实验

MSCDNet网络优化:

这种削减网络层数，修改网络结构组成的方式会导致模型欠拟合和准确率不稳定。对此情况，对网络的丢失率dropout_rate进行小幅度的削减，防止模型得不到充分训练。网络模型采用Adam优化器，学习率调整使用ExponentialLR-指数衰减方式，加强模型性能增长的稳定性。学习率更新公式如下所示：

lr_new＝lr_init*γ^epoch

其中，lr_new为初始学习率，lr_init为更新后的学习率，γ^epoch为当前训练迭代次数。

指定训练epoch为200，学习率变化曲线如图5所示。

模型训练与对比实验:

将处理好的训练数据输入模型，以验证集验证，保存表现最好的模型用于测试，对验证准确率做平均，最终准确率达到了99.87％。模型训练后得到的训练曲线(左)和混淆矩阵(右)如图6-图7所示。可以看到，模型在200个测试集样本中，只错误分类了1个2号标签的样本，模型测试达到了99.5％的诊断准确率。

以下是该模型相较于其他模型的准确率对比(实验条件相同)，得到的准确率表格如下表所示。

表5诊断准确率对比试验

抗噪性实验

先前实验都是在无噪声工况下进行的，但是实际工况中，无法避免的受到噪声信号的影响，得到不干净的噪声数据，在噪声的影响下，只有保证模型的性能不被噪声破坏，才能应用于实时工况中。本部分验证模型本身的抗噪能力，为模型的训练集添加高斯白噪声，在信噪比为-1dB，-3dB，-6dB的情况下，截取添加噪声后的灰度图片段，如图8所示，左1和右2为正常样本的灰度图像，左2和右1分别为信噪比为-1dB和-6dB的两种噪声信号的灰度图像。

通过对比图8可以看出，加噪后的信号堆叠生成的图像变得灰蒙蒙，细节变得模糊，对比度下降，普通模型难以分别出正常图片和高信噪比图片的区别。

在正常情况下展开训练，逐步减小信噪比，观察模型所受噪声信号的影响。在加入dB＝-1的噪声后，MSCDNet网络准确率从99.87％降低到了90.50％，而LResDenseNetSE则降到了89％相比而言，MSCDNet有更好的表现，因为它有更高的复杂度，而LResDenseNetSE因为加入了注意力模块，也有一定的抗噪能力。

表6两种模型在不同信噪比下的抗噪性实验

以下是在各噪声等级下，两种模型的训练与验证准确率曲线(图9-图10)，以及高噪声下MSCDNet的故障诊断混淆矩阵(图11)。

从训练曲线可以看出，模型LResDenseNetSE受噪声影响较大，而MSCDNet总体训练趋势受影响较小，但噪声会使得验证准确率变得不稳定，从混淆矩阵可以看出，受噪声影响，模型在第七类和第十类的分类效果不佳，其他类别的分类效果受噪声影响较小，具有抗噪能力。保留训练过程中在验证集表现最好的模型，以测试集进行验证，得到的表格如上表所示。

综上，本申请提出了两种不同类型的轴承故障诊断模型：轻型网络模型LResDenseNetSE和高精度网络模型MSCDNet，以解决滚动轴承故障诊断的挑战性问题。这两种模型各自具有独特的特点和应用场景，并在不同的故障诊断任务中发挥着重要作用。

首先，介绍了轻型网络模型，通过对比模型的训练速度、模型大小和平均准确率，得到了较为满意的结果，模型能够在低内存占用和更少的训练时间内达到与原型差不多的诊断准确率，并且拥有一定的抗噪能力，此模型较适用于资源受限的环境，如移动设备或边缘计算平台。通过模型裁剪与重构等方法，轻型网络模型在减小模型体积的同时，仍能保持良好的性能。

其次，深入研究了高精度网络模型，本模型通过并行的密集块之间的交叉连接，实现高精度故障诊断。通过调低丢失率、改变学习率调整策略等方式对模型优化，在较小的样本数据下依旧可以达到高于原模型的诊断准确率，并且因为密集交叉连接以及注意力机制，有着很好的抗噪性能。

Claims

1.一种轴承故障诊断网络，其特征在于包括：振动信号预处理模块、特征提取模块以及故障诊断分类模块；

2.如权利要求1所述的轴承故障诊断网络，其特征在于：所述密集块包括第一归一化层(BN)，所述第一归一化层(BN)经第一Relu激活函数与第一卷积层的输入端连接，所述第一卷积层的输出端与第二归一化层的的输入端连接，所述第二归一化层经第二Relu激活函数与第二卷积层的输入端连接，所述第二卷积层的输出端与Dropout层的输入端连接，所述Dropout层的输出端为所述密集块的输出端。

3.如权利要求1所述的轴承故障诊断网络，其特征在于，所述SE注意力模块包括：Inputs层，所述Inputs层的输入端与全局平均池化的输入端连接，所述全局平均池化层的输出端与第一全连层的输入端连接，所述第一全连层的输出端与第二全连层的输入端连接，所述第二全连层的输出端与Scale层的输入端连接。

4.如权利要求3所述的轴承故障诊断网络，其特征在于：

全局平均池化：对输入inputs进行全局平均池化操作；这将对每个通道的特征进行平均，从每个通道产生一个标量值，存储在变量x中；公式表示如下，其中，h,w分别为通道的高度和宽度，c表示通道索引：

x＝relu(W₁·x+b₁)

其中W₁是第一个全连接层的权重矩阵，b₁是偏置；

x＝sigmoid(W₂·x+b₂)

其中W₂是第一个全连接层的权重矩阵，b₂是偏置。

5.如权利要求1所述的轴承故障诊断网络，其特征在于：所述translation层用于控制输出通道数，以实现维度的降低，包括BN层、RELU层、1*1卷积、正则化层和平均池化层。

6.一种轴承故障诊断网络，其特征在于包括：数据预处理模块、特征提取模块以及故障诊断分类模块；

7.如权利要求6所述的轴承故障诊断网络，其特征在于：所述密集块包括第一归一化层(BN)，所述第一归一化层(BN)经第一Relu激活函数与第一卷积层的输入端连接，所述第一卷积层的输出端与第二归一化层的的输入端连接，所述第二归一化层经第二Relu激活函数与第二卷积层的输入端连接，所述第二卷积层的输出端与Dropout层的输入端连接，所述Dropout层的输出端为所述密集块的输出端。

8.如权利要求6所述的轴承故障诊断网络，其特征在于，所述SE注意力模块包括：Inputs层，所述Inputs层的输入端与全局平均池化的输入端连接，所述全局平均池化层的输出端与第一全连层的输入端连接，所述第一全连层的输出端与第二全连层的输入端连接，所述第二全连层的输出端与Scale层的输入端连接。

9.如权利要求8所述的轴承故障诊断网络，其特征在于：

x＝relu(W₁·x+b₁)

其中W₁是第一个全连接层的权重矩阵，b₁是偏置；

x＝sigmoid(W₂·x+b₂)

其中W₂是第一个全连接层的权重矩阵，b₂是偏置。

10.如权利要求6所述的轴承故障诊断网络，其特征在于：所述translation层用于控制输出通道数，以实现维度的降低，包括BN层、RELU层、1*1卷积、正则化层和平均池化层。