CN116754231A

CN116754231A - 一种基于RegNet-SES的快速诊断滚动轴承故障方法

Info

Publication number: CN116754231A
Application number: CN202310499153.4A
Authority: CN
Inventors: 戚晓利; 王兆俊; 毛俊懿; 王志文; 崔德海; 赵方祥
Original assignee: Anhui University of Technology AHUT
Current assignee: Anhui University of Technology AHUT
Priority date: 2023-05-04
Filing date: 2023-05-04
Publication date: 2023-09-15

Abstract

本发明公开了一种基于RegNet‑SES的快速诊断滚动轴承故障方法，其具体步骤包括：采集健康、不同故障类型和故障程度的滚动轴承一维振动加速度信号数据；使用连续小波变换将一维振动信号转换成特征信息明显的二维时频图，并制作成滚动轴承混合故障数据集；搭建RegNet‑SES网络模型并完成网络参数初始化，使用深度迁移学习迁移预训练模型的权重参数到RegNet‑SES网络上；将滚动轴承混合故障数据集用于RegNet‑SES网络进行训练，得到针对滚动轴承的混合故障诊断模型。本发明克服了现有模型对滚动轴承混合故障诊断效果不佳以及模型复杂度较高导致计算成本较大等问题，提高了模型诊断精度的同时提升了模型诊断故障的速度。

Description

一种基于RegNet-SES的快速诊断滚动轴承故障方法

技术领域

本发明属于故障诊断技术领域，具体涉及一种基于RegNet-SES的快速诊断滚动轴承故障方法。

背景技术

滚动轴承作为旋转机械设备的关键零部件，常常工作于磨损、高温以及重载等苛刻的环境下，导致其极易发生损坏，一旦滚动轴承发生故障，可能会导致整个机械系统的损坏，造成经济上的损失，甚至会发生严重的安全事故。因此，为了保证旋转机械设备正常运行，对滚动轴承运行状态进行实时监测以及故障诊断尤为重要。

卷积神经网络的提出为滚动轴承故障诊断开辟了一条新的方向。与传统的智能故障诊断方法不同，基于深度卷积神经网络的故障诊断方法更加强调模型的结构，使模型能够学习表征样本更深层次的特征，并且将特征提取和故障分类融为一体，避免了原始样本特征信息的丢失，使得故障类型聚类更加准确。有学者将原始轴承振动信号作为一维卷积神经网络的初始输入，以增量的方式将谱分析数据作为补充输入，有效实现了滚动轴承在强噪声下的故障诊断。有学者通过优化二维卷积神经网络，将原始信号转化为二维灰度图，神经网络通过提取图像特征来实现滚动轴承故障诊断。有学者使用SDP技术融合多个传感器采集的故障特征，并将得到的SDP特征图与VGG16网络相结合，获得比单个传感器更高的诊断精度。有学者应用改进的残差网络实现对复杂工况下滚动轴承的故障诊断，提高了故障诊断模型的抗噪和泛化能力。上述方法所提出的诊断模型具有一定的鲁棒性以及较高的准确率，然而，要使模型达到上述结果，需采用大样本故障数据集对其进行多层次训练，导致耗费极大的时间、人工和计算成本。

值得注意的是，训练使用的大样本数据集只是导致模型训练过程中耗费大量的时间和计算量的其中一个因素，而另一个因素则是模型设计策略。传统的卷积神经网络模型如VGG、GoogLeNet以及ResNet等使用标准卷积操作，虽然表达特征能力强，但由于所需的参数量和计算量大，导致模型存在复杂度过高、推理速度慢等问题。为了解决这些问题，近年来人工智能领域致力于研究轻量化、快速化推演模型。轻量化模型可以有效地减少模型的计算量和参数量，提高计算效率和推理速度，从而更适合实时计算和嵌入式设备等场景。例如，Google团队于2017年提出的MobileNet网络使用深度可分离卷积和网络宽度可调节等策略，能够有效减少模型的计算量。Facebook团队在2020年提出了一种高度可调的、模块化的卷积神经网络架构Regular Network(RegNet)，该架构基于基础模块的组合设计和自适应网络宽度的设计策略，可以搭建出不同复杂度的RegNet网络来适配相应的任务，从而更灵活地适应不同场景的需求。然而，轻量化模型也有一些不足之处。轻量化模型存在模型精度下降的问题，尤其是在处理更大、更复杂的数据集和任务时。另外，轻量化模型尽管已经成功应用于一些实际任务，但在滚动轴承故障诊断领域的应用甚少。

除了优化模型设计策略，采用深度迁移学习也是提高模型训练效率的一种常用策略。深度迁移学习在使用大型数据集训练得到的预训练模型的基础上，根据具体任务进行调整，同初始化训练模型相比，使得模型花费最少的训练时间成本获得更好的性能。有学者结合迁移学习与Resnet-50，有效诊断了不同工况任务下的滚动轴承各类故障。有学者使用GAF图像编码技术并结合基于迁移学习的ResNet34模型，实现变转速下滚动轴承单一故障的分类。有学者提出一种基于迁移ResNet18的滚动轴承故障快速诊断方法，改善了现有深度神经网络滚动轴承故障诊断模型训练参数量大，训练时间长的问题。

需要指出的是，以上方法主要用于识别和分析滚动轴承单一故障。然而，在旋转机械装备的实际使用中，随着时间的推移和环境的变化，滚动轴承的故障往往不再是单一的，而是多种故障模式混合的结果。将上文所述的滚动轴承单一故障诊断方法用于识别混合故障时容易出现误判。因此，需要在滚动轴承单一故障诊断算法的基础上，提出新的方法和模型来诊断滚动轴承混合故障。

发明内容

1.发明要解决的技术问题

鉴于现有方案在处理滚动轴承内外圈混合故障时诊断效果不佳，以及模型算法复杂度较高，导致计算成本较大等问题，本发明提供了一种基于RegNet-SES的快速诊断滚动轴承故障方法，本发明与现有的VGG16网络、GoogLeNet网络、ResNet34网络以及ResNet50网络相比，不仅具有更低的模型复杂度，减少了训练模型所需的时间成本和计算成本，而且在滚动轴承混合故障诊断任务中具有更优秀的表现，具有良好的实际应用价值。

2.技术方案

为达到上述目的，本发明提供的技术方案为：

本发明的一种基于RegNet-SES的快速诊断滚动轴承故障方法，包括：

S1:采集健康、不同故障类型和故障程度的滚动轴承一维振动加速度信号数据；

S2:对采集的一维振动加速度信号数据进行采样，对采样得到的数据样本使用连续小波变换生成二维时频图；

S3:制作滚动轴承混合故障数据集并划分训练集和测试集；

S4:搭建RegNet-SES网络，使用迁移学习迁移预训练模型权重参数到完成初始化的RegNet-SES网络；

S5:使用滚动轴承混合故障数据集训练RegNet-SES网络并更新网络权重参数，训练RegNet-SES网络至收敛，保存最优模型并将其作为混合故障诊断模型，进行滚动轴承故障诊断。

更进一步地，滚动轴承的故障类型包括：内圈故障、外圈故障以及内外圈混合故障，其中内圈故障、外圈故障和内外圈混合故障分别采集两种故障损伤程度，损伤程度分为1级和2级，1级代表损伤直径小于2mm，2级代表损伤直径大于2mm小于4.5mm。

更进一步地，步骤S2采用以Cmor为小波基函数的连续小波变换方法，对采样得到的数据样本进行连续小波变换生成二维时频图。

更进一步地，所述的RegNet-SES网络包括网络输入层、网络主体和网络输出层，迁移学习迁移预训练模型输入层和网络主体的权重参数到完成初始化的RegNet-SES网络上。

更进一步地，所述的网络主体包括4个Stage，每个Stage的结构都非常相似，但是包含的SES注意力组卷积残差模块的数量有所不同。这种结构的优点是可以调整网络深度和宽度，从而有效地提高模型性能并减少计算成本。4个Stage具体为：

Stage1：由一个带下采样的SES注意力组卷积残差模块构成；

Stage2：由一个带下采样的SES注意力组卷积残差模块和2个SES注意力组卷积残差模块构成；

Stage3：由一个带下采样的SES注意力组卷积残差模块和5个SES注意力组卷积残差模块构成；

Stage4：由一个带下采样的SES注意力组卷积残差模块和5个SES注意力组卷积残差模块构成。

更进一步地，SES注意力组卷积残差模块包括卷积核大小为1×1的标准卷积层、卷积核大小为3×3的分组卷积层、SES注意力机制模块和卷积核大小为1×1的标准卷积层，SES注意力组卷积残差模块通过在输入与输出处添加跨层连接来构成残差结构。

更进一步地，带下采样的SES注意力组卷积残差模块是在跨层连接处，添加一个卷积核大小为1×1的标准卷积层，带下采样的SES注意力组卷积残差模块执行下采样操作来保证与前一层的连接。

更进一步地，所述的SES注意力机制模块是SE注意力机制与空间注意力机制相结合的混合注意力机制模块。该模块能更好的关注到输入特征在不同通道和不同空间位置上的信息，从而提高模型的表征能力。

更进一步地，所述的网络输入层包括一个标准卷积层、一个BN层和一个激活函数ReLU层，BN层将输入特征张量进行归一化，激活函数ReLU层用于在神经网络中引入非线性因素；网络输出层包括一个自适应平均池化层、一个Dropout层和一个全连接层。

更进一步地，训练RegNet-SES网络时，选择SGD优化器来更新模型参数，采用余弦退火策略来调整学习速率。

3.有益效果

采用本发明提供的技术方案，与已有的公知技术相比，具有如下显著效果：

(1)本发明的一种基于RegNet-SES的快速诊断滚动轴承故障方法，使用以Cmor为小波基函数的连续小波变换将滚动轴承一维振动加速度信号数据转化为特征信息明显的二维时频图，更加契合RegNet-SES网络模型，有利于网络对其进行特征提取和故障判别。

(2)网络主体是RegNet-SES网络的重要组成部分，网络主体的构造与整个网络模型复杂度和特征提取能力是直接相关的，本发明的一种基于RegNet-SES的快速诊断滚动轴承故障方法，通过结合SES注意力机制与组卷积残差结构，保证模型的轻量化，实现模型的高计算效率和快速推理速度，同时提升模型的特征提取能力。

(3)为了更快实现模型对输入样本特征的有效提取，本发明的一种基于RegNet-SES的快速诊断滚动轴承故障方法，引入迁移学习，以此缩减模型实现高精度滚动轴承混合故障诊断所消耗的时间成本和计算成本。

(4)本发明的一种基于RegNet-SES的快速诊断滚动轴承故障方法，与现有的VGG16网络、GoogLeNet网络、ResNet34网络以及ResNet50网络相比，不仅具有更低的模型复杂度，减少了训练模型所需的时间成本和计算成本，而且在滚动轴承混合故障诊断任务中具有更优秀的表现，具有非常好的实际应用价值。

附图说明

图1为本发明的一种基于RegNet-SES的快速诊断滚动轴承故障方法流程图。

图2为根据本发明实施例的正常、内圈1级故障、内圈2级故障、外圈1级故障、外圈2级故障、内外圈混合1级故障和内外圈混合2级故障的时域振动信号示意图。

图3为连续小波变换转换过程示意图。

图4为SES注意力组卷积残差模块示意图。

图5为SE注意力机制模块示意图。

图6为空间注意力机制模块示意图。

图7为RegNet-SES网络结构示意图。

图8为迁移学习迁移预训练模型权重示意图。

具体实施方式

为进一步了解本发明的内容，结合附图和实施例对本发明作详细描述。

实施例1

如图1所示，本实施例的一种基于RegNet-SES的快速诊断滚动轴承故障方法，具体步骤包括：

S1:采集健康、不同故障类型和故障程度的滚动轴承一维振动加速度信号数据。

如图2所示，采集的滚动轴承不同状态类型包括：正常、内圈1级故障、内圈2级故障、外圈1级故障、外圈2级故障、内外圈混合1级故障和内外圈混合2级故障。1级代表损伤直径小于2mm，2级代表损伤直径大于2mm小于4.5mm。

S2:对采集的一维振动加速度信号数据进行采样，对采样得到的数据样本使用连续小波变换生成二维时频图。

具体来说，步骤S1共采集7类故障，分别保存每类故障到文件夹中，从0到6设置文件名。通过访问文件夹路径获取文件夹中相应的滚动轴承振动加速度信号数据，并对数据进行采样，本实施例中，采样频率为64KHz，样本长度为1024，同样新建7个文件夹，从0到6设置文件名，使用以Cmor为小波基函数的连续小波变换方法，对每类样本进行连续小波变换，生成大小为236×236×3的时频图样本，然后保存时频图样本到相应的文件夹中，变换过程如图3所示，最终文件名为0、1、2、3、4、5、6的7个文件夹中保存了正常、内圈1级故障、内圈2级故障、外圈1级故障、外圈2级故障、内外圈混合1级故障和内外圈混合2级故障这7类的二维时频图像。

S3:本实施例将步骤S2获得的7类故障二维时频图像作为滚动轴承混合故障数据集，数据集总样本数为6994，其中训练集样本数为6300，测试集样本数为694，具体样本分布如表1所示。

表1滚动轴承混合故障样本分布

S4:搭建RegNet-SES网络，使用迁移学习迁移预训练模型权重参数到完成初始化的RegNet-SES网络；具体而言：

如图4所示，本实施例构造了一种SES注意力组卷积残差模块，其中，组卷积残差模块是SES注意力组卷积残差模块的主要模块，SES注意力机制模块以嵌入的方式与组卷积残差模块相结合，目的是为了提升组卷积残差模块获取输入特征信息的能力，由该模块组成的RegNet-SES网络具有轻量化和特征提取能力强的优势。

SES注意力组卷积残差模块主要包括卷积核大小为1×1的标准卷积层、卷积核大小为3×3的分组卷积层、SES注意力机制模块和卷积核大小为1×1的标准卷积层，SES注意力组卷积残差模块通过在输入与输出处添加跨层连接来构成残差结构。

组卷积残差模块与一般残差模块不同之处在于将一般残差模块里卷积核大小为3×3的标准卷积层改为分组卷积层，这种分组操作可以减少参数量和计算量，具体表现为，在输入特征大小、卷积核大小和输出特征大小都相同的条件下，标准卷积运算时需要的参数量和计算量是分组卷积的g倍(被分g组)，详细对比见表2，此外，使用分组卷积操作还可以提高模型的计算效率，特别是在GPU上进行加速计算时。

表2标准卷积与分组卷积参数对比

SES注意力机制模块结合了SE(Squeeze-and-Excitation)注意力机制和空间注意力机制(Spatial Attention)的优点，具体实现如图5所示，给定一个输入特征X，通过一系列卷积操作后得到一个高度为H，宽度为W，特征通道数为C的特征U，将特征U输入SE注意力机制中。

SE注意力机制基于两个关键思想：Squeeze和Excitation。首先，Squeeze阶段使用全局平均池化(Global Average Pooling)对特征U每个通道的二维特征u_i(i∈[1,C])进行压缩，将该通道的特征降为一个标量Z_i，Squeeze操作数学定义如下：

式中，i表示通道的索引，u_i表示第i个通道的全局统计信息，这属于空间维度的一种特征压缩，因为标量Z_i是根据二维特征u_i所有值算出来的，所以在某种程度上具有全局的感受野，并且对特征U完成Squeeze操作后，得到特征U的全局信息Z，Z＝[z₁,z₂,…,z_c]∈R^C，R^C表示由C个实数组成的向量空间。

Excitation阶段使用两层全连接网络来学习每个通道的重要性权重，第一个全连接层将前面Squeeze操作得到的Z压缩到较小的维度，即：

f(z_i)＝W₁z_i+b₁

式中，W₁∈R^C×C/r和b₁∈R^C/r分别是第一个全连接层的权重和偏置，R^C×C/r表示一个大小为C/r×C的实数矩阵，r是一个可调节的缩放因子。

第一个全连接层把C个通道压缩为C/r个通道来降低计算量；然后，采用Relu作为激活函数得到：

a_i＝Relu(f(z_i))

然后通过第二个全连接层将通道恢复到C维，即：

s_i＝W₂a_i+b₂

式中W₂∈R^C×C/r和b₂∈R^C分别是第二个全连接层的权重和偏置。这两个全连接层的作用就是融合各通道的特征信息s_i，对s_i进行sigmoid归一化，得到所有通道的注意力权重S，S＝[s₁,s₂,…,s_c]^T，最后，将注意力权重S与输入特征U进行加权(Fscale)输出特征X'。

结合图6，本实施例使用空间注意力(Spatial Attention)机制对前文通道注意力机制处理后输出的特征图X'进行空间维度上的加权，目的是为了让模型更好的关注到输入特征X在不同通道和不同空间位置上的信息，从而提高模型的表征能力。具体实现分为两步，首先对特征图X'在空间维度上进行最大池化和平均池化操作，数学定义如下：

P＝[p_max(X'),p_avg(X')]

式中，P_max(X')和P_avg(X')是由最大池化和平均池化得到的两个统计特征。

将P_max(X')和P_avg(X')拼接到一起得到特征P，然后特征P经过一个卷积核大小为7×7的全连接层得到一个标量权重M，即：

M＝W₃P+b₃

式中W₃∈R²和b₃∈R分别是全连接层的权重和偏置。接着通过Sigmoid函数对M进行归一化得到权重Ms，即：

最后，将得到的权重Ms与输入的特征X'进行加权平均得到最终的输出特征F，特征F中包含了输入特征X在不同通道和不同空间位置上的特征信息，然后将特征F输入组卷积残差模块中第二个卷积核大小为1×1的标准卷积层进行下一步的特征提取。

本实施例搭建的RegNet-SES网络，网络结构如图7所示，包括网络输入层、网络主体和网络输出层。

网络输入层包括一个卷积核大小为3×3，卷积核个数为32的标准卷积层、一个BN(Batch Normalization)层和一个激活函数ReLU层，图7中仅显示了输入层中最主要的标准卷积层，而BN层和ReLU层并未显示。当大小为236×236×3的样本输入输入层中将会得到一个大小为118×118×32的特征，然后将大小为118×118×32的特征送入网络主体。

本发明搭建的RegNet-SES网络中使用的所有BN层作用是将输入特征张量进行归一化，以避免神经网络中出现梯度消失或爆炸的情况。它通过对每个通道在批量维度上的平均值和方差进行归一化，使得输入数据的均值为0，方差为1，并通过缩放因子和偏移项调整数据的分布，来增强网络的泛化能力。具体参数设置包括：

1)eps：用于防止分母太小而引起的数值不稳定问题，一般设置为1e-5即1×10^-5；

2)momentum：批量归一化中使用的动量项，一般为0.1，用于平滑均值和方差的更新；

3)affine：是否使用仿射变换，通常为True。如果为True，则还需要学习gamma和beta两个缩放参数。

4)track_running_stats：是否追踪全局均值和方差的运行统计信息，默认为True。

ReLU(修正线性单元)是一种常用的激活函数，用于在神经网络中引入非线性因素。ReLU函数的形式为f(x)＝max(0,x)，即在输入x小于0的情况下输出0，而在x大于0的情况下输出x本身。

本发明搭建RegNet-SES网络，包括网络主体。RegNet-SES网络主体由4个Stage构成，每个Stage的结构都非常相似，但是包含的SES注意力组卷积残差模块的数量有所不同。这种结构的优点是可以调整网络深度和宽度，从而有效地提高模型性能并减少计算成本。每个Stage具体为：

Stage1：由一个带下采样的SES注意力组卷积残差模块构成；具体包括：卷积核大小为1×1、卷积核个数为48的标准卷积层；卷积核大小为3×3、卷积核个数为48，分组数设置为6的分组卷积层；SES注意力机制模块和卷积核大小为1×1、卷积核个数为48的标准卷积层，带下采样的SES注意力组卷积残差模块是在SES注意力组卷积残差模块的跨层连接处添加一个卷积核大小为1×1、卷积核个数为48的标准卷积层实现对输入特征的下采样，使输入特征能够与输出特征相加。118×118×32的特征送入网络主体的Stage1后将得到大小为59×59×48的特征，然后传入Stage2。

Stage2：由一个带下采样的SES注意力组卷积残差模块和两个SES注意力组卷积残差模块构成，带下采样的SES注意力组卷积残差模块与两个SES注意力组卷积残差模块依次串联；

带下采样的SES注意力组卷积残差模块包括：卷积核大小为1×1、卷积核个数为104的标准卷积层；卷积核大小为3×3、卷积核个数为104，分组数设置为13的分组卷积层；SES注意力机制模块和卷积核大小为1×1、卷积核个数为104的标准卷积层，带下采样的SES注意力组卷积残差模块是在SES注意力组卷积残差模块的跨层连接处添加一个卷积核大小为1×1、卷积核个数为104的标准卷积层实现对输入特征的下采样，使输入特征能够与输出特征相加。

两个SES注意力组卷积残差模块配置相同，均为包括：卷积核大小为1×1、卷积核个数为104的标准卷积层；卷积核大小为3×3、卷积核个数为104，分组数设置为13的分组卷积层；SES注意力机制模块和卷积核大小为1×1、卷积核个数为104的标准卷积层，通过添加跨层连接将输入特征与输出特征相加。59×59×48的特征送入网络主体的Stage2后将得到大小为30×30×104的特征，然后传入Stage3。

Stage3：由一个带下采样的SES注意力组卷积残差模块和5个SES注意力组卷积残差模块构成，带下采样的SES注意力组卷积残差模块与5个SES注意力组卷积残差模块依次串联；

带下采样的SES注意力组卷积残差模块包括：卷积核大小为1×1、卷积核个数为208的标准卷积层；卷积核大小为3×3、卷积核个数为208，分组数设置为26的分组卷积层；SES注意力机制模块和卷积核大小为1×1、卷积核个数为208的标准卷积层，带下采样的SES注意力组卷积残差模块是在SES注意力组卷积残差模块的跨层连接处添加一个卷积核大小为1×1、卷积核个数为208的标准卷积层实现对输入特征的下采样，使输入特征能够与输出特征相加。

5个SES注意力组卷积残差模块配置相同，均为：卷积核大小为1×1、卷积核个数为208的标准卷积层；卷积核大小为3×3、卷积核个数为208，分组数设置为26的分组卷积层；SES注意力机制模块和卷积核大小为1×1、卷积核个数为208的标准卷积层，通过添加跨层连接将输入特征与输出特征相加。30×30×104的特征送入网络主体的Stage3后将得到大小为15×15×208的特征，然后传入Stage4。

Stage4：由一个带下采样的SES注意力组卷积残差模块和5个SES注意力组卷积残差模块构成，带下采样的SES注意力组卷积残差模块与5个SES注意力组卷积残差模块依次串联；

带下采样的SES注意力组卷积残差模块包括：卷积核大小为1×1、卷积核个数为440，的标准卷积层；卷积核大小为3×3、卷积核个数为440，分组数设置为55的分组卷积层；SES注意力机制模块和卷积核大小为1×1、卷积核个数为440的标准卷积层，带下采样的SES注意力组卷积残差模块是在SES注意力组卷积残差模块的跨层连接处添加一个卷积核大小为1×1、卷积核个数为440的标准卷积层实现对输入特征的下采样，使输入特征能够与输出特征相加。

5个SES注意力组卷积残差模块配置相同，均为包括：卷积核大小为1×1、卷积核个数为440的标准卷积层；卷积核大小为3×3、卷积核个数为440，分组数设置为55的分组卷积层；SES注意力机制模块和卷积核大小为1×1、卷积核个数为440的标准卷积层，通过添加跨层连接将输入特征与输出特征相加。15×15×208的特征送入网络主体的Stage3后将得到大小为7×7×440的特征，然后传入输出层。

本发明搭建RegNet-SES网络，包括网络输出层，输出层包括：自适应平均池化(Avgpool)层、Dropout层以及全连接(FC)分类层。

自适应平均池化层会将输入大小为7×7×440的特征自适应地缩放成Output_size的大小，然后在每个缩放后的区域上执行平均运算，得到与Output_size大小一致的输出特征，运算过程中不改变特征通道数，本发明设置Output_size大小为(1，1)，输出特征大小即为1×1×440。

Dropout层在神经网络中，Dropout操作是一种正则化方法，作用是将输入数据中的若干元素随机置零，目的是在模型训练阶段减少过拟合。根据dropout率p的值，dropout层会有p的概率随机将输入张量的每个元素置零，本发明设置dropout率p值为0.25。

全连接分类层将输入数据张量中的每个元素(因为是稠密层)都连接到输出数据张量中的每个元素上，从而将输入层的信息映射到输出层中。然后在输出数据张量上应用激活函数，从而得到一组非线性的特征表示，用于后续的分类任务，本发明设置输入张量为440，输出数据张量为7。

如图8所示，使用迁移学习将预训练好的模型权重参数迁移到RegNet-SES滚动轴承混合故障诊断模型上，这个过程包括以下步骤：

1)初始化RegNet-SES滚动轴承混合故障诊断模型：需要初始化一个RegNet-SES滚动轴承混合故障诊断模型，以便将预训练好的权重参数迁移到这个模型上。

2)迁移权重参数：将经过ImageNet数据集训练得到的预训练模型权重参数迁移到完成初始化的RegNet-SES滚动轴承混合故障诊断模型上。

3)冻结模型层：在迁移完权重参数之后，将模型输入层和网络主体的权重参数冻结，不参与训练，只更新输出层权重参数。

4)使用滚动轴承混合故障数据集训练RegNet-SES网络并更新网络权重参数，训练RegNet-SES网络从滚动轴承混合故障数据集中学习如何识别滚动轴承的混合故障。

训练网络前需要配置深度学习环境，在Windows10操作系统下，搭载Inter Corei3-12100f处理器，16G运行内存，GPU使用NVDIA GTX3060ti 8G，CUDA版本为11.6，深度学习框架为Pytorch，使用Python语言编程，Pycharm编译器编译。由于GPU对2的幂次的批大小(Batch Size)可以发挥更佳的性能，因此训练时设置数据集Batch Size大小为32，模型训练迭代30轮，选择SGD优化器来更新模型参数，采用余弦退火策略来调整学习速率η_t，公式如下所示：

式中η_max和η_min是学习率的范围，x为模型训练的第x轮，T为训练迭代总轮数。本实施例设置参数η_max和η_min分别为1和0.01，T为30。

配置好后开始训练，经过30轮迭代，保留每一轮迭代的模型参数权重到指定文件夹，使用滚动轴承混合测试集验证每一轮模型的故障识别性能，最终选择识别性能最好的模型作为滚动轴承混合故障诊断模型。本发明的RegNet-SES模型训练所需的参数量为3,907,815params、模型复杂度为487.41MFlops。最优模型对滚动轴承混合测试集每类故障识别预测结果和识别准确率如表3所示，结果显示，本发明的RegNet-SES滚动轴承混合故障诊断模型能够对滚动轴承是否存在故障的识别率达到100％，能够将健康、外圈1、混合1、混合2和内圈1这5类故障识别率达到100％，而对外圈2和内圈2这两类也只是预测错了一个样本，说明复杂度为400MF的RegNet-SES网络能够有效区分滚动轴承不同损伤程度的单一故障和混合故障。

表3测试集单类样本预测结果和识别准确率

本发明应用于滚动轴承不同损伤程度混合故障的识别分类。使用德国帕德博恩大学的滚动轴承数据集(PU数据集)来进行试验验证。PU数据集由健康轴承数据和故障轴承数据组成，其中故障轴承数据包括真实损伤和人工损伤轴承数据，PU数据集采集的是轴承型号为6203深沟球轴承的实验数据，采样频率为64kHz，本发明主要通过该数据集中的真实损伤的轴承振动信号数据来验证所提方法的有效性和优越性。试验数据在转速N＝900r/min，负载扭矩M＝0.7Nm，轴承承受径向力F＝1000N的工况下采集。

本发明与现有的VGG16网络、GoogLeNet网络、ResNet34网络以及ResNet50网络相比(见表4)，不仅具有更低的模型复杂度，减少了训练模型所需参数量，有效降低了训练模型的时间成本和计算成本，而且在滚动轴承混合故障诊断任务中具有更高的识别准确率，实际应用价值较好。

表4不同网络模型对比

以上示意性的对本发明及其实施方式进行了描述，该描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。所以，如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

Claims

1.一种基于RegNet-SES的快速诊断滚动轴承故障方法，其特征在于，包括：

S3:制作滚动轴承混合故障数据集并划分训练集和测试集；

2.根据权利要求1所述的一种基于RegNet-SES的快速诊断滚动轴承故障方法，其特征在于：滚动轴承的故障类型包括：内圈故障、外圈故障以及内外圈混合故障，其中内圈故障、外圈故障和内外圈混合故障分别采集两种故障损伤程度，损伤程度分为1级和2级。

3.根据权利要求2所述的一种基于RegNet-SES的快速诊断滚动轴承故障方法，其特征在于：步骤S2采用以Cmor为小波基函数的连续小波变换方法，对采样得到的数据样本进行连续小波变换生成二维时频图。

4.根据权利要求1-3任一项所述的一种基于RegNet-SES的快速诊断滚动轴承故障方法，其特征在于：所述的RegNet-SES网络包括网络输入层、网络主体和网络输出层，迁移学习迁移预训练模型输入层和网络主体的权重参数到完成初始化的RegNet-SES网络上。

5.根据权利要求4所述的一种基于RegNet-SES的快速诊断滚动轴承故障方法，其特征在于：所述的网络主体包括4个Stage，4个Stage具体为：

Stage1：由一个带下采样的SES注意力组卷积残差模块构成；

6.根据权利要求5所述的一种基于RegNet-SES的快速诊断滚动轴承故障方法，其特征在于：SES注意力组卷积残差模块包括卷积核大小为1×1的标准卷积层、卷积核大小为3×3的分组卷积层、SES注意力机制模块和卷积核大小为1×1的标准卷积层，SES注意力组卷积残差模块通过在输入与输出处添加跨层连接来构成残差结构。

7.根据权利要求6所述的一种基于RegNet-SES的快速诊断滚动轴承故障方法，其特征在于：带下采样的SES注意力组卷积残差模块是在跨层连接处，添加一个卷积核大小为1×1的标准卷积层，带下采样的SES注意力组卷积残差模块执行下采样操作来保证与前一层的连接。

8.根据权利要求7所述的一种基于RegNet-SES的快速诊断滚动轴承故障方法，其特征在于：所述的SES注意力机制模块是SE注意力机制与空间注意力机制相结合的混合注意力机制模块。

9.根据权利要求8所述的一种基于RegNet-SES的快速诊断滚动轴承故障方法，其特征在于：所述的网络输入层包括一个标准卷积层、一个BN层和一个激活函数ReLU层，BN层将输入特征张量进行归一化，激活函数ReLU层用于在神经网络中引入非线性因素；网络输出层包括一个自适应平均池化层、一个Dropout层和一个全连接层。

10.根据权利要求9所述的一种基于RegNet-SES的快速诊断滚动轴承故障方法，其特征在于：训练RegNet-SES网络时，选择SGD优化器来更新模型参数，采用余弦退火策略来调整学习速率。