CN116399588A

CN116399588A - 一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法

Info

Publication number: CN116399588A
Application number: CN202310205470.0A
Authority: CN
Inventors: 丁华; 孙晓春; 王焱; 李宁; 赵伟卓; 廖瑶瑶; 杨琨; 马丁.劳易特
Original assignee: Taiyuan University of Technology
Current assignee: Taiyuan University of Technology
Priority date: 2023-03-06
Filing date: 2023-03-06
Publication date: 2023-07-07

Abstract

本发明涉及故障诊断技术领域，具体为一种小样本下基于WPD和AFRB‑LWUNet的滚动轴承故障诊断方法。包括以下步骤，S1：采集机械设备轴承发生各种故障时的振动信号，对振动信号进行小波包分解和能量特征提取，进行振动信号重构成为一维时序信号，完成前期数据预处理；S2：将UNet模型由原始的上采样层和下采样层各四层变为上采样层和下采样各两层形成LWUNet模型，在LWUNet模型的跳跃连接部分嵌入注意力融合残差块，搭建AFRB‑LWUNet模型；S3：对AFRB‑LWUNet模型进行训练、验证以及测试；S4：利用训练好的AFRB‑LWUNet模型对不同工况的故障进行诊断，检验模型的鲁棒性；S5：对机械设备运行过程中的轴承振动数据进行实时监测，预处理后输入到训练好的模型中，进行实时故障诊断。

Description

一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法

技术领域

本发明涉及故障诊断技术领域，具体为一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法。

背景技术

随着新兴技术的不断涌现，机械设备逐渐朝着自动化、快速化和智能化方向发展。滚动轴承作为旋转机械的核心部件，其可靠性和稳定性将直接影响到旋转机械的性能，研究表明40% ～ 50%的旋转机械故障都与滚动轴承失效有关，因此，为保障旋转机械作业安全，快速、准确地对轴承进行故障诊断就显得意义重大。

滚动轴承的故障诊断主要包括：信号采集、数据预处理、特征提取以及故障识别等步骤，在恶劣工况下，实测信号存在着样本少、噪声多等问题，导致信号的可利用价值大幅下降，所以从中实现更快、更准确地提取关键特征成为了故障诊断的重要环节。传统的故障诊断方法过度依赖人工经验和先验知识，导致诊断结果具有很大的不确定性，而先进的深度学习方法存在模型参数量大，能耗高，不便部署到移动端与边缘设备。

因此，提出一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法，通过对采集的振动信号进行小波包分解和能量特征提取，对能量占比和超过80%的频段进行信号重构，将重构信号以二维数据矩阵的形式输入到搭建的AFRB-LWUNet模型中进行故障诊断。轻量化UNet（LWUNet）模型跳跃连接部分融入注意力融合残差块（AFRB），进一步加强了浅层和深层网络之间的联系，保留了特征空间重要信息，提升了模型识别能力。

发明内容

本发明为了解决上述问题，提供一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法。

本发明采取以下技术方案：一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法，包括以下步骤，

S1：采集机械设备轴承发生各种故障时的振动信号，对振动信号进行小波包分解和能量特征提取，进行振动信号重构成为一维时序信号，完成前期数据预处理；

S2：将UNet模型由原始的上采样层和下采样层各四层变为上采样层和下采样各两层形成LWUNet模型，在LWUNet模型的跳跃连接部分嵌入注意力融合残差块，搭建AFRB-LWUNet模型；

S3：对AFRB-LWUNet模型进行训练、验证以及测试；

S4：利用训练好的AFRB-LWUNet模型对不同工况的故障进行诊断，检验模型的鲁棒性；

S5：对机械设备运行过程中的轴承振动数据进行实时监测，预处理后输入到训练好的模型中，进行实时故障诊断。

在一些实施例中，步骤S1包括，

S11：对每种状态下的振动信号进行小波包分解，既分解低频信号，又分解高频信号，得到2ⁿ个频带，根据采样频率以及采样定理得到每个频带所代表的频率范围，同时获得小波包分解的各个节点小波包系数，用于后续的数据重构；

S12：进行能量特征提取，得到每个频段能量所占的比例，进行排序，由高到低得到能量比例和超过80%的频带，完成信号重构得到一维时序信号。

在一些实施例中，步骤S11中，小波基函数选择为db8小波，小波包分解层数为3层。

在一些实施例中，步骤S2中注意力融合残差块包括，

注意力融合残差块由改进的SE注意力机制和改进的SegSE注意力机制并行连接组成，且最终与原始数据进行连接，

改进的SE注意力机制为在Squeeze部分增加全局最大池化层，与原始的全局平均池化层并行提取特征；

改进的SegSE注意力机制中的普通卷积全部替换为可分离卷积。

在一些实施例中，WPD和AFRB-LWUNet模型包括，

下采样层，下采样层由两个卷积块组成，每个卷积块由两个可分离卷积层、两个批量标准化层和两个Relu激活函数层组成，每个卷积块后接一个最大池化层用于降维和减少模型中的参数；

中间过渡层，中间过渡层由第三个卷积块组成，过滤器数量达到最大值，提取到最高维度的抽象特征图；

上采样层，上采样层由两个卷积块组成，每个卷积块包括两个可分离卷积层、两个批量标准化层和两个Relu激活函数层；

注意力融合残差块，注意力融合残差块连接在下采样层和上采样层之间；

全局平均池化层和Dropout层位于上采样层后面，起到降维、减少模型参数和防止过拟合的作用。

在一些实施例中，步骤S3包括，

S31：将预处理后的每个一维时序信号样本进行等长截取，排列成方阵的形式作为输入，从而将一维时序信号转换为二维数据矩阵；

S32：按照比例将二维数据矩阵设置为训练集、验证集和测试集；

S33：用训练集训练初始的AFRB-LWUNet模型，并用验证集进行验证，最后利用预处理后的测试集测试该模型。

在一些实施例中，步骤S32中，按照3:1:6的比例设置为训练集、验证集和测试集。

在一些实施例中，步骤S4利用训练好的模型对不同工况的轴承故障进行诊断包括以下步骤：

S401：进行泛化性实验，训练模型与测试模型利用不同工况的数据集进行实验测试。

S402：进行抗噪性实验，对数据集添加不同功率的高斯白噪声，用变工况的强噪声数据进行模型的检验。

与现有技术相比，本发明针对机械设备轴承故障样本少、诊断精度和效率低等问题，提出了一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法。该方法共分为两部分，第一部分进行数据预处理，对实测振动数据进行小波包分解和能量特征提取，对能量集中的频段进行信号重构；第二部分进行模型搭建，构造轻量化UNet网络模型，发挥对小样本数据特征提取的优势，提高诊断精度，跳跃连接部分添加注意力融合残差块，加强浅层和深层网络的联系，增强模型特征提取能力，进一步提高诊断准确率。该方法利用了小波包分解和轻量化UNet相融合的方法，既发挥了小波包分解强大的信号特征分析能力，也展现了UNet网络对小样本数据的特征提取能力，同时轻量化改进减少了参数，缩短了训练时间，降低了硬件设备要求，方便部署到更多移动端和边缘设备上，为机械设备轴承故障诊断提供了新思路。

附图说明

图1是本发明提供的一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法流程图；

图2是小波包分解图（3层分解）；

图3是各个频带能量占比图（以标签9的故障信号为例）；

图4是原始信号与重构信号（以标签9的故障信号为例）；

图5是重构信号（以标签9的故障信号为例）；

图6是维数转换示意图；

图7是本发明提供的一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法中的轻量化UNet（LWUNet）网络结构图；

图8是普通卷积的示意图；

图9是本发明具体实施例的可分离卷积层结构示意图；

图10是普通可分离卷积感受野示意图；

图11是扩张卷积感受野示意图；

图12是SE注意力机制示意图；

图13是SegSE注意力机制结构示意图；

图14是本发明具体实施例的注意力融合残差块（AFRB）结构示意图；

图15是本发明提供的一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法中的轻量化UNet（LWUNet）网络训练和测试流程图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

参见图1，本实施例公开了一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法，下面以凯斯西储大学轴承数据集为例，进行了详细的介绍，主要包括以下步骤：

S1:采集机械设备滚动轴承发生各种故障时的振动数据，对其进行小波包分解和能量特征提取，得出各种故障信号在底层每个频段能量所占的比例，由高到低选出能量比例和超过80%的频带，进行信号重构，完成前期数据预处理。

小波变换只能对信号的低频部分进行不断地分解，而对高频信号即信号的细节部分不能继续分解，所以小波变换常用于分析以低频信息为主要成分的信号，不能很好地分解和表示包含大量细节信息的信号，如非平稳机械振动信号等。而小波包分解既可以对低频部分信号进行分解，也可以对高频部分进行分解，而且这种分解既无冗余，也无疏漏，所以对包含大量中、高频信息的信号能够进行更好的时频局部化分析，有利于在轴承退化过程中捕获到细微的变化。

小波基函数选择工程中广泛应用的db8小波，具有较好的正则性，其特点是随着阶次（N）的增大，消失矩阶数变大，光滑性变好，频域的局部化能力变强，划分效果变好。

如图2所示，即为分解3层的小波包分解结构，每层节点的数量a与分解层数，n之间的关系为:a=2ⁿ。

每个节点会有两个分支，左分支代表对低频信号进行分解，右分支代表对高频信号进行分解。

每个节点所代表的频带由采样频率与采样定理决定，奈奎斯特定理规定采样速率必须至少是模拟信号带宽最大值的两倍，以便完全恢复信号。如果不能满足采样定理，采样后信号的频率就会重叠，即高于采样频率一半的频率成分将被重建成低于采样频率一半的信号，这种频谱的重叠导致的失真称为混叠，而重建出来的信号称为原信号的混叠替身，因为这两个信号有同样的样本值。以凯斯西储大学轴承数据集为例，选取驱动端采样频率为12kHz，负载为1hp、2hp、3hp的轴承数据，其信号频率根据采样定理设置为6000Hz，若进行小波包三层分解，图中（0,0）所代表的就是原始信号频率0～6000Hz，（1,0）和（1,1）代表将频带范围平均划分为两部分，分别代表0～3000Hz和3000～6000Hz，第二层每个节点代表信号频率的四分之一，底层每个节点所代表的的频带范围如表1所示：

表1

如图3所示，为轴承在负载3hp、滚动体损伤21mils时的底层各个频带能量占比图，由高到低排列选出占比和大于80%的频带即可，减少数据冗余，图中可明显看出，选择的频带为4、5节点，即2250～3000Hz和3000～3750Hz，以这两个频带的小波包系数为基础，其它节点系数设为0进行信号重构，如图4所示，即为原始信号与重构信号。由于进行了三层小波包分解，得到了8个小波包频带

计算每个频带的能量比重可由下式计算得出：

式中，

为每层频带的长度，能量比越大表明该层频带包含的信号信息越多，因此可根据此式选出信息多的频带，进行重构，从而减少数据冗余。

S2:将UNet模型由原始的上采样层和下采样层各四层变为上采样层和下采样各两层形成LWUNet模型，在LWUNet模型的跳跃连接部分嵌入注意力融合残差块，搭建AFRB-LWUNet模型。

WPD和AFRB-LWUNet模型包括：

注意力融合残差块，注意力融合残差块连接在下采样层和上采样层之间。

对UNet模型进行轻量化改进主要包括两部分，第一，为了防止出现梯度消失或爆炸，UNet模型由原始的上、下采样各四层缩减为上、下采样各两层；第二，为了进一步减少模型参数量，将普通卷积替换为深度可分离卷积。

为了进一步加强上下文联系，使用扩张卷积，在不增加卷积核参数的同时扩大感受野，提高对全局特征的提取能力。

为了加强前后卷积层之间的信息交流，提高重要特征的提取能力，在下采样和上采样之间添加了注意力融合残差块。

注意力融合残差块由改进的SE注意力机制和SegSE注意力机制并行连接组成，且最终与原始数据进行连接，在实现对全局与局部特征同步提取的同时，保留原始信息，提高特征提取的可行性。改进的SE注意力机制在Squeeze部分增加全局最大池化层（GMP），与原始的全局平均池化层并行提取特征，对特征实现更全面的提取；改进的SegSE注意力机制将其中的普通卷积全部替换为可分离卷积，在不降低模型诊断准确率的基础上，大幅提高模型的轻量化程度。

SegSE为了保留特征图中的空间信息，使用核为3×3的卷积层来实现挤压操作，区别于SE块中使用的全局平均池化。采用扩张卷积在不增加参数的同时扩大感受野，捕获更多的上下文信息。SegSE过程如下式所示：

（5）

（6）

（7）

式中：

是指卷积运算，/>

是大小为3×3的卷积核，d指扩张因子，

的值为/>

，r表示压缩因子，/>

表示批量标准化，/>

表示Sigmoid激活函数。计算s时，k的值为1，n的值为/>

，/>

表示逐元素乘法。在SegSE块中，特征图中的单元与在相同位置分割的体素之间存在空间对应关系。在获得的特征图中，具有较高重新校准因子的区域将受到更多关注。SE更加擅长提取全局特征，而SegSE则对小区域重要特征极其敏感，故选择将二者进行融合，提出了注意力融合残差块（AFRB）。图11、12和13分别是SE、SegSE和注意力融合残差块示意图。

训练样本的比例作为小样本的评价标准，一般认为当训练样本与总样本比例

时，便可称为小样本。故按照3:1:6的比例划分训练集、验证集和测试集，以最少量的数据训练模型，验证模型在小样本数据下的性能。以凯斯西储大学轴承数据集为例，选取驱动端采样频率为12kHz，负载为1hp、2hp、3hp的轴承数据，故障形式包括外圈故障、内圈故障和滚动体故障三种故障部位，同时每个部位又分为7mils、14mils和21mils三种故障直径，加上正常状态，一共有10种轴承状态数据。每种状态包含100个样本，样本容量设置为48×48=2304。

本发明的UNet模型结构如图6所示，主要由三部分构成，分别是下采样层、上采样层和过渡层，下采样层由两个卷积块组成，每个卷积块由两个可分离卷积层、两个批量标准化（BN）层和两个Relu激活函数层组成，每个卷积块后接一个最大池化层用于降维和减少模型中的参数。中间过渡层由第三个卷积块组成，过滤器数量达到最大值，提取到最高维度的抽象特征图。上采样层也由两个卷积块组成，每个卷积块包含两个可分离卷积层、两个批量标准化（BN）层和两个Relu激活函数层，通过上采样扩大特征图的大小，再用卷积层调整相应特征图的通道数，并与编码层中通过注意力融合残差块处理后的输出相融合，不断恢复到原始输入图的大小。最后在上采样层后面采用全局平均池化层和Dropout层，起到降维、减少模型参数和防止过拟合的作用。

UNet的主要贡献是跳跃连接，使深层（解码层）能够从浅层（编码器）获得互补的空间信息来重建细节。

模型的诊断过程可利用预处理后的训练集训练初始的轻量化UNet模型，并用验证集进行验证，防止模型过拟合，之后再将测试集输入到模型中进行测试，验证输出结果是否与实际故障类型相符。在训练的过程中采用的是Adam学习率自适应算法和交叉熵损失函数。

卷积层：卷积层使用卷积核对输入信号的局部区域进行卷积运算，并产生相应的特征。卷积层具有权值共享的特点，即同一个卷积核将以固定的步长遍历一次输入。本发明选用了深度可分离卷积，深度可分离卷积可看做将普通卷积分为两部分：空间卷积和通道卷积，如图8所示，首先通过

的卷积核进行空间卷积，然后再通过/>

的卷积核进行通道卷积，最终输出了与图7普通卷积相同的结果。通过计算普通卷积与深度可分离卷积的参数个数，可得出普通卷积的参数量为：

（1）

深度可分离卷积的参数量为：

（2）

在式子（1）和（2）中，

为输入层大小，/>

为卷积层大小，M为输入特征通道数，N为卷积核数量。

通过比较深度可分离卷积与普通卷积的参数量：

（3）

可得出：对于相同的输入层和输出层，深度可分离卷积相比普通卷积，可以大量的减少参数，从而缩短训练时长，提高训练效率。

在卷积层的计算中，卷积采用了输入矩阵与卷积核中的对应点进行点乘，然后求和，再加一个偏置，计算公式为：

（4）

式中K表示通道数，M为每个通道的卷积核的行数，N为每个通道的卷积核的列数。

表示卷积输出结果，/>

表示线性计算中的偏置，/>

为线性运算中的加权系数，

表示原始输入的特征元素值或上一层卷积层的输出结果。

为了加强上下文的联系，本发明对每一层可分离卷积均设置扩张系数，即为扩张卷积，在保证卷积核参数相同的情况下增加感受野，提取到更多的全局信息。扩张系数为1时为普通可分离卷积，大于1即为扩张卷积，卷积核为

，扩张率为r的扩张卷积感受野与卷积核为/>

普通可分离卷积的感受野相同，如图9、10所示，即为普通可分离卷积与扩张卷积的感受野。

池化层：本发明选用了最大池化层，主要作用为下采样、降维，去除冗余信息、对特征进行压缩、简化网络复杂度、减小计算量、减小内存消耗，同时还具有实现非线性、扩大感知野、实现不变性（平移不变性、旋转不变性和尺度不变性）等特点。对数据T∈

，池化后输出：

（8）

式中n：输入向量划分的部分，

表示第i个特征张量，W：池化窗口的大小，S：步长。

全局平均池化（GAP）：在卷积层之后，用全局平均池化层替代全连接层原因是：全局平均池化在特征图与最终的分类间转换更加简单自然，同时全局平均池化不像全连接层需要大量训练调优的参数，降低了空间参数会使模型更加健壮，抗过拟合效果更佳。

分类器层：输出层采用的激活函数是Softmax函数。通过Softmax函数作用，映射成为(0,1)的值，而这些值的累和为1（满足概率的性质），那么就可以将它理解成概率，在最后选取输出结点的时候，可以选取概率最大（也就是值对应最大的）结点，作为最终的预测目标。

（9）

损失函数:本发明中采用交叉熵损失函数：

（10）

式中：E为目标函数，n为样本数，y为真实值，t为预测值；

将训练样本的比例作为小样本的评价标准，一般认为当训练样本与总样本比例

时，便可称为小样本。故按照3:1:6的比例划分训练集、验证集和测试集，以最少量的数据训练模型，验证模型在小样本数据下的性能，如图14即为模型训练与测试过程，以凯斯西储大学轴承数据集为例，选取驱动端采样频率为12kHz，负载为1hp、2hp、3hp的轴承数据，故障形式包括外圈故障、内圈故障和滚动体故障三种故障部位，同时每个部位又分为7mils、14mils和21mils三种故障直径，加上正常状态，一共有10种轴承状态数据。每种状态包含100个样本，样本容量设置为48X48=2304，如表2所示，即为划分的样本数据集。

表2

。

S3：对AFRB-LWUNet模型进行训练、验证以及测试。

将预处理后的一维时序信号根据图5转化为二维数据矩阵，按照3:1:6的比例设置为训练集、验证集和测试集，利用训练集训练初始的轻量化UNet模型，并用验证集进行验证，防止模型过拟合，从而获得了一个小样本下滚动轴承故障诊断的模型，最后利用预处理后的测试集测试该模型对小样本下滚动轴承故障诊断的诊断性能。

S4：利用训练好的AFRB-LWUNet模型对不同工况的故障进行诊断，检验模型的鲁棒性。

交叉测试，例如以A工况数据集作为训练集训练模型，以B工况数据集进行模型测试，第二部分，添加高斯白噪声，用变工况的强噪声数据进行模型的检验，例如给数据集分别添加0db、2db、4db、6db的高斯白噪声，进行交叉测试，通过两部分来检验本发明所提出模型的鲁棒性和抗噪性能。

本发明的主要原理，首先利用小波包分解对原始信号进行分解和能量特征提取，发挥了小波包分解对高、低频信号的强大提取能力，之后通过计算每个频带能量所占的比例，由高到低排列出比例和超过80%的频带，从而对其进行信号重构，降低了信息的冗余，充分利用了有用信息；最后搭建轻量化UNet（LWUNet）故障诊断模型，发挥了UNet网络对于全局与细节特征的强大提取能力，利用可分离卷积层和全局平均池化层减少了参数，提高了模型的训练效率，防止过拟合，同时添加了注意力融合残差块（AFRB），对细节特征进一步提取，增加了诊断的准确率。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

Claims

1.一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法，其特征在于：包括以下步骤，

S3：对AFRB-LWUNet模型进行训练、验证以及测试；

2.根据权利要求1所述的小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法，其特征在于：所述步骤S1包括，

3.根据权利要求2所述的小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法，其特征在于：所述步骤S11中，小波基函数选择为db8小波，小波包分解层数为3层。

4.根据权利要求1所述的小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法，其特征在于：步骤S2中注意力融合残差块包括，

改进的SE注意力机制在Squeeze部分增加全局最大池化层，与原始的全局平均池化层并行提取特征；

5.根据权利要求2所述的小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法，其特征在于：所述WPD和AFRB-LWUNet模型包括，

全局平均池化层和Dropout层，全局平均池化层和Dropout层位于上采样层后面；

6.根据权利要求1所述的小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法，其特征在于：所述步骤S3包括，

S33：用训练集训练初始的LWUNet模型，并用验证集进行验证，最后利用预处理后的测试集测试该模型。

7.根据权利要求6所述的小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法，其特征在于：所述步骤S32中，按照3:1:6的比例设置为训练集、验证集和测试集。

8.根据权利要求1所述的小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法，其特征在于：所述步骤S4利用训练好的模型对不同工况的轴承故障进行诊断包括以下步骤：

S401：进行泛化性实验，训练模型与测试模型利用不同工况的数据集进行实验测试；