CN117216681A

CN117216681A - 一种基于SAGAN-IResNet的少样本轴承故障诊断方法、系统及存储介质

Info

Publication number: CN117216681A
Application number: CN202311241008.2A
Authority: CN
Inventors: 王国强; 石念峰; 杨向兰; 武建伟; 赵利国; 朱德荣; 谢扬筱; 庞崇文
Original assignee: Luoyang Institute of Science and Technology
Current assignee: Luoyang Institute of Science and Technology
Priority date: 2023-09-25
Filing date: 2023-09-25
Publication date: 2023-12-12

Abstract

本发明提出了一种基于SAGAN‑IResNet的少样本轴承故障诊断方法、系统及存储介质，包括：首先，获取轴承振动信号，利用连续小波变换将信号转换成时频图像并将其划分为训练集、验证集和测试集；其次，将训练样本输入到自注意力生成对抗网络（SAGAN）中进行对抗训练，生成高质量新样本，解决轴承故障数据样本不足的问题；然后，构建基于改进残差网络的轴承故障诊断模型（IResNet），利用原始训练样本与新样本对模型进行学习，同时验证集调整模型参数，直至网络收敛，得到训练好的轴承故障诊断模型；最后，将测试样本输入到训练好的轴承故障诊断模型，实现轴承故障诊断任务。本发明在少样本，强噪声，变负载的情况下轴承故障诊断性能良好，具有较高的实际工程应用价值。

Description

一种基于SAGAN-IResNet的少样本轴承故障诊断方法、系统及存储介质

技术领域

本发明涉及滚动轴承故障诊断技术领域，具体的说是一种基于SAGAN-IResNet的少样本轴承故障诊断方法、系统及存储介质。

背景技术

随着工业制造的快速进步，机械设备正朝着高精度、高效率、自动化和复杂化的方向发展。滚动轴承作为旋转机械最重要的部件之一，在整个机械设备的运转过程中起着至关重要的作用。研究表明，近30％的旋转机械故障都与滚动轴承有关。因此，提出一个精度高、鲁棒性强的轴承故障诊断方法对提高机械设备的可靠性、降低工业成本、消除安全隐患具有深远意义。

目前，旋转机械故障诊断方法主要分为基于分析模型、基于知识和基于数据驱动三类。然而，通过建立高精度的数学模型或丰富的经验知识库来实现复杂机械系统的故障诊断是极其困难和昂贵的，同时在实际工业应用中也存在一些局限性。随着机器学习研究的深入，基于人工智能的数据驱动故障诊断算法已成为机械故障诊断领域的研究热点。其中，支持向量机、K近邻和BP神经网络得到广泛应用。尽管这种方法已经取得一定的效果，但由于网络结构较浅，特征提取能力不足，从而制约了轴承故障诊断精度的进一步提升。

随着深度学习技术与类脑认知机制结合，克服了标准神经网络在实际应用中的瓶颈。目前，深度学习在语音识别、自然语言处理和计算机视觉等多个领域都取得了良好的研究成果，并广泛应用于故障诊断领域。例如，赵小强等(赵小强,张青青.改进Alexnet的滚动轴承变工况故障诊断方法[J].振动.测试与诊断,2020,40(03):472-480+623)提出了一种改进AlexNet的滚动轴承变工况故障诊断方法。Xu等(Xu Zifei,Li Chun,Yang Yang.Faultdiagnosis of rolling bearing of wind turbines based on the Variational ModeDecomposition and Deep Convolutional Neural Networks[J].Applied SoftComputing,2020,95)将一维卷积神经网络与自动编码器结合，提高了轴承故障诊断准确性，减少了诊断延迟。Zhang等(Zhang K,Wang J,Shi H,et al.A fault diagnosis methodbased on improved convolutional neural network for bearings under variableworking conditions[J].Measurement,2021,182:109749)提出了一种改进的卷积神经网络模型，有效地提取丰富互补的故障特征，提高故障诊断性能。尽管上述轴承故障诊断方法取得了不错的效果，但在实际工业场景中，要实现高精度的故障诊断仍存在许多困难和挑战，其中最主要的两个挑战如下：

(1)样本量不足：对于深度学习模型，训练数据是影响其性能的重要因素。然而在实际的工业环境中，机械设备通常都是在正常的工作条件下运行，很难收集足够多的故障样本，获得大量且平衡的机械故障数据既耗时又昂贵，这极大影响了模型诊断结果的准确性。

(2)特征提取困难：在实际的工业生产中，环境噪声与负载变化都会对机械设备的运转产生干扰，进而导致收集到的振动信号具有较高的复杂性与不稳定性，很难从中提取出有效的特征用于机械故障诊断。

为解决轴承故障数据集不平衡的问题，Taylor等(Taylor L,NitschkeG.Improving deep learning with generic data augmentation[C]//2018IEEEsymposium series on computational intelligence(SSCI).IEEE,2018:1542-1547)使用翻转、旋转和极坐标变换等数据增强方法对图像进行处理，提高了模型诊断准确率。Zhang等(Zhang W,Peng G,Li C,et al.A New Deep Learning Model for Fault Diagnosiswith Good Anti-Noise and Domain Adaptation Ability on Raw Vibration Signals[J].Sensors,2017,17(2):425)提出了重叠采样的方法处理信号，增加样本数量，缓解了数据量不足的问题。然而，这些方法都是对样本的重复使用，容易造成拟合过度。近年来，生成对抗网络为少样本难题的解决提供了新思路。生成对抗网络(Generative AdversarialNets，GAN)最初被用作生成图像的框架，已被证明在图像生成方面具有强大能力，并且逐渐应用在机械故障诊断领域。例如，Xie等(Xie Y,Zhang T.Imbalanced learning for faultdiagnosis problem of rotating machinery based on generative adversarialnetworks[C]//2018 37th Chinese Control Conference(CCC).IEEE,2018:6017-6022)提出了一种深度卷积生成对抗模型来模拟少数类的原始分布，通过生成新样本扩充轴承故障数据集。Fu等(Fu W,Jiang X,Li B,et al.Rolling bearing fault diagnosis based on2D time-frequency images and data augmentation technique[J].MeasurementScience and Technology,2023,34(4):045005)提出了一种基于二维时频图像和数据增强的轴承故障诊断方法，解决样本不足的问题。针对复杂环境下轴承故障特征提取困难的问题，目前主流方法是对故障诊断模型优化。其中，Huang等(Huang Y J,Liao A H,Hu D Y,etal.Multi-scale convolutional network with channel attention mechanism forrolling bearing fault diagnosis[J].Measurement,2022,203:11193)将卷积神经网络与通道注意力机制相结合，对学习的特征进行自适应评分和权重分配，以提高卷积层特征的学习能力。谢扬筱等(谢扬筱,王国强,石念峰等.融合注意力机制的MSCNN-BiLSTM滚动轴承故障诊断方法[J/OL].轴承:1-9[2023-0901])提出了一种基于融合注意力机制的MSCNN-BiLSTM轴承故障诊断方法，充分提取振动信号故障特征。袁彩艳等(袁彩艳,孙洁娣,温江涛等.多域信息融合结合改进残差密集网络的轴承故障诊断[J].振动与冲击,2022,41(04):200-208+252)将注意力机制引入故障诊断模型，提高模型对重要信息的区分，改善识别准确率。虽然上述方法能达到提高轴承故障诊断准确率的效果，但难以在样本不足和故障特征提取困难中达到平衡。

发明内容

为了解决现有技术中的不足，本发明提供一种基于SAGAN-IResNet的少样本轴承故障诊断方法、系统及存储介质，使用该诊断方法在少样本，强噪声，变负载的情况下也能得到准确率较高的轴承故障诊断结果。

为了实现上述目的，本发明采用的具体方案为：

第一方面，本发明公开了一种基于SAGAN-IResNet的少样本轴承故障诊断方法，主要包括如下步骤：

S1、数据预处理：获取滚动轴承原始振动信号，利用连续小波变换对原始振动信号进行处理，得到适合二维卷积神经网络输入的时频图；将获取的时频图按照8:1:1的样本比例随机划分为训练集、验证集和测试集；

S2、样本扩充：构建基于自注意力生成对抗网络架构的SAGAN网络模型，将训练集样本作为输入对SAGAN网络模型进行训练，直至网络收敛，即得到与原始训练集样本分布相似的新样本；

S3、诊断模型训练：构建基于改进残差网络的IResNet轴承故障诊断模型，将原始训练集样本与步骤S2得到的新样本相结合共同作为输入对轴承故障诊断模型进行训练，同时利用验证集调整模型超参数，直至网络收敛，得到训练好的IResNet轴承故障诊断模型；

S4、轴承故障诊断：将测试集样本输入训练好的IResNet轴承故障诊断模型中进行测试，得到轴承故障诊断结果。

进一步地，步骤S2中的SAGAN网络模型包括生成器和判别器，在SAGAN训练中，迭代更新模型参数，batchsize为16，使用RMSprop优化器，生成器和鉴别器的学习率为0.0005，两者交替训练直到收敛。

进一步地，在生成器中，符合均匀分布的随机噪声变量被映射并重塑为卷积特征图表示，然后通过第一至第五共五层转置卷积运算生成大小为(64，64，3)的时频图像样本，在各个转置卷积层中，卷积核大小为4，步长为2，第一至第五转置卷积层的通道数分别为512，256，128，64和3；

其中，第一至第四转置卷积层均通过频谱归一化和ReLU激活函数进行处理，第三到第四层转置卷积、以及第四到第五层转置卷积时使用自注意力机制来获得全局相关性；

第五转置卷积层的激活函数是Tanh函数。

进一步地，在鉴别器中总共有第一至第五共五个卷积层，各层的卷积核大小均为4，步长均为2，第一至第五卷积层的通道数分别为64，128，256，512和1；卷积后，使用频谱归一化和LeakyReLU激活函数进行处理；第三到第四层卷积、以及第四到第五层卷积时使用自注意力机制来获得全局相关性。

进一步地，步骤S3中，所述改进残差网络是将多头注意力机制与残差网络相结合得到的。

进一步地，步骤S3中，将样本输入到IResNet轴承故障诊断模型进行训练，具体为：S31、将样本输入IResNet轴承故障诊断模型内的第一卷积层，经过第一卷积层处理得到的特征图输入第一池化层；

S32、经过第一池化层处理得到的特征图输入第二卷积层，经过第二卷积层处理得到的特征图输入第二池化层；

S33、经过第二池化层处理得到的特征图输入改进后的blockA残差模块；经过改进后的blockA残差模块处理得到的特征图输入第三池化层；

S34、经过第三池化层处理得到的特征图输入改进后的第一blockB残差模块；第一blockB残差模块处理得到的特征图输入第四池化层；

S35、经过第四池化层处理得到的特征图输入改进后的第二blockB残差模块；第二blockB残差模块输入第五池化层；

S36、将经过第五池化层处理得到的特征图展开，展开后输入两个全连接层；

S37、使用Softmax层作为分类器实现故障诊断；

其中，IResNet故障诊断模型训练时，batchsize为32；epoch为30；采用交叉熵损失作为误差损失函数；Adam为优化器；学习率为0.001；同时采用学习率衰减机制调整学习率，不断循环上述训练步骤，直到该误差小于设定值，保存权重文件，得到故障诊断模型。

进一步地，两个全连接层之间添加有用于提高模型鲁棒性与泛化能力的Dropout。

第二方面，本发明公开了一种基于SAGAN-IResNet的少样本轴承故障诊断系统，包括：

数据预处理模块，用于对轴承的原始振动信号进行数据处理，得到时频图，将获取的时频图划分成三个不同的样本集，所述样本集包含训练集、验证集和测试集；

样本扩充模块，基于SAGAN网络模型获得与原始训练集样本分布相似的新样本；

诊断模型训练模块，利用原始训练样本与生成新样本共同训练IResNet轴承故障诊断模型，同时利用验证集对诊断模型进行验证，调整模型参数，直至网络收敛，得到训练好的IResNet轴承故障诊断模型；

轴承故障诊断模块，用于将测试集样本输入训练好的IResNet轴承故障诊断模型中进行测试，得到轴承故障诊断结果。

进一步地，所述数据预处理模块包括信号获取模块、连续小波变换模块和样本划分模块；其中，信号获取模块用于获取轴承的原始振动信号，连续小波变换模块用于对原始振动信号进行连续小波变换，获得时频图，样本划分模块用于将获取的时频图进行分组划分。

第三方面，本发明公开了一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面所述的轴承故障诊断方法。

有益效果：

1)、本发明提出的基于SAGAN-IResNet的少样本轴承故障诊断方法包括数据预处理、样本扩充、诊断模型训练与轴承故障诊断步骤。其中数据预处理步骤包括信号获取、连续小波变换与样本划分，利用连续小波变换处理原始振动信号，获取信号中的时频域信息。样本扩充步骤是利用SAGAN获得与原始训练集样本分布相似的新样本，丰富样本数据集，解决轴承故障数据量不足的问题。诊断模型训练步骤将改进残差网络的IResNet轴承故障诊断模型进行训练，IResNet将多头注意力机制与残差网络相结合，提升网络在强噪声与变负载下轴承故障诊断的准确率。轴承故障诊断利用测试集对训练好的故障诊断模型进行测试，实现轴承故障诊断任务，输出故障诊断结果。

2)、本发明针对轴承故障样本量不足的问题，构建SAGAN网络模型，通过SAGAN网络模型对训练集样本进行扩充，经过数据扩充之后，模型训练的收敛速度明显加快，收敛更稳定，可以显著提高模型训练的稳定性和轴承故障诊断准确率。

3)、本发明针对强噪声、变负载等复杂工业环境下故障特征提取不充分的问题，构建基于改进残差网络的IResNet轴承故障诊断模型，将多头注意力机制与残差网络相结合。残差网络通过残差学习加深网络层数，获取深层特征，缓解卷积神经网络因网络层数过高而引起的网络退化的问题。多头注意力机制通过处理和聚合卷积捕获的特征信息，获取图像长距离依赖关系与全局特征。这样的混合设计，有利于提高模型关键特征提取的能力，实现网络对全局信息的掌控，增强模型对重要特征的敏感度，提高模型在强噪声与变负载下轴承故障诊断的准确率。

4)、本发明在IResNet故障诊断模型的两个全连接层之间添加Dropout，使一部分神经元失活，提高模型鲁棒性与泛化能力。

5)、本发明的轴承故障诊断方法与其他故障诊断方法相比具有更高的精度、抗干扰能力和泛化性能，可用于实际轴承故障诊断。

附图说明

图1为本发明中诊断方法图。

图2为本发明中的故障诊断流程图。

图3为自注意力机制的原理图。

图4为GAN的结构图。

图5为SAGAN生成器的结构图。

图6为SAGAN鉴别器的结构图。

图7为残差模块图。

图8为改进后的残差模块结构图。

图9为IResNet轴承故障诊断模型的网络结构图。

图10为轴承试验台示意图。

图11为轴承各状态时频图。

图12为不同epoch生成的图像。

图13为不同模型生成的图像。

图14为数据合成对模型训练的影响图。

图15为不同深度网络在噪声环境下的准确率图。

图16为模型准确性与训练时间对比图。

图17为不同方法变噪声故障诊断率图。

图18为不同噪声环境下模型混淆矩阵图。

图19为不同位置特征向量可视化图。

图20为变负载故障诊断结果图。

图示标记：1、风扇端轴承，2、电机，3、驱动端轴承，4、扭矩传感器。

具体实施方式

下面将结合具体实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明的保护范围。

一方面，本发明公开了一种基于SAGAN-IResNet的少样本轴承故障诊断方法，请参考图1和图2，主要包括如下步骤：

S1、获取滚动轴承原始振动信号，利用连续小波变换对原始振动信号进行处理，得到适合二维卷积神经网络输入的时频图；将获取的时频图按照8:1:1的样本比例随机划分为训练集、验证集和测试集

连续小波变换(CWT)是一种具有较强时频分析能力的多尺度分析方法，可以采集振动信号的高频和低频部分，确保特征信息的完整性。通常，假设输入信号为x(t)并且x(t)∈L²(R)，小波基函数ψ(t)∈L²(R)，其中L²(R)代表平方可积的实数空间，x(t)的连续小波变换表示为：

式中：a是尺度因子；b是位移因子；代表ψ(x)的共轭；CWT_x(a,b)表示信号x(t)和小波ψ_a,b(t)的内积。

通过对原始振动信号进行连续小波变换，不仅可以突出振动信号的原始特征信息，还可以进一步增强时间序列特征信息。

在复杂的工业生产中，获取的轴承振动信号包含大量非平稳信号，这使得生成模型和诊断模型很难提取用于样本生成和故障诊断的有效特征。CWT作为一种常用的时频分析方法，将轴承振动信号从一维时域转换为二维时频图，同时结合故障信号在时域和频域上的频率特性，能够有效地处理非平稳信号，进而有效地实现了轴承故障诊断任务。

S2、构建基于自注意力生成对抗网络架构的SAGAN网络模型，将训练集样本作为输入对SAGAN网络模型进行训练，直至网络收敛，即得到与原始训练集样本分布相似的新样本

大多数基于GAN的数据生成模型都是由卷积神经网络构建的，卷积操作用于处理局部邻域中的信息，因此单独使用卷积层对图像中的长距离关系进行建模时效率很低。为了解决这个问题，本发明利用自注意力生成对抗网络(Self-Attention GenerativeAdversarial Networks,SAGAN)实现对图像生成任务的长期依赖建模。SAGAN在GAN中引入了自注意机制，自注意力机制在长期依赖的建模能力、计算量和统计效率之间表现出良好的平衡。通过引入自注意力机制，生成器可以生成更加精细的样本图像，鉴别器可以更准确地对全局图像结构施加复杂的几何约束。除了自注意机制以外，SAGAN还引入了频谱归一化技术，以稳定模型训练，避免异常梯度。与其他归一化技术相比，频谱归一化不需要额外的超参数调整，计算成本相对较小。本发明利用SAGAN作为数据增强方法能够解决故障样本不平衡的问题。

自注意力机制属于注意力机制的一种，与传统的注意力机制作用类似，都是为了提升网络模型对重要特征的敏感度。在正常情况下，输入到网络中的数据往往只有少数部分是重要的，注意力机制通过对数据的不同部分赋予权重，使得模型更加关注重点部分，进而提升模型整体性能，其原理如图3所示。

自注意力机制计算公式如下：

式中：X为输入数据，Q为查询向量，K为键向量，V为值向量。Q,K,V是输入数据X经过线性变换得到，将得到的矩阵输入到注意力机制函数Self-Attention中，首先，查询向量Q和键向量K进行矩阵点积，将点积结果除以缩放因子避免点积结果过大；其次，利用Softmax进行相关度归一化得到注意力权重；最后，将得到的权重与值向量V加权求和，得到输入数据的自注意力表示。

生成对抗网络主要由生成器(G)和鉴别器(D)组成。生成器主要学习真实样本数据的分布，使生成的数据更真实，而鉴别器用于区分接收数据的真实性。在训练过程中，生成器努力生成更真实的数据来欺骗鉴别器，而鉴别器则努力区分数据的真实性，经过多轮博弈对抗后，二者达到纳什均衡。GAN的结构如图4所示。

GANs的目标函数定义为：

其中，G、D分别为生成器和判别器；V(D,G)为目标函数；E为期望值；z为随机噪声；x为真实数据；p_data(x)为真实数据的分布；p_(z)为输入的随机噪声分布。

生成器和鉴别器本质上是两个独立的网络，因此训练是独立执行的。在训练过程中，一个网络的参数是固定，而另一网络的参数更新调整。首先，对发生器G进行优化(鉴别器D参数是固定)，损失函数如下：

其次，对鉴别器D进行优化(发生器G参数是固定)，损失函数如下：

本发明中SAGAN网络模型包括生成器和鉴别器，生成器和鉴别器的结构如图5、图6所示，由图可知，在生成器G中，符合均匀分布的随机噪声变量Z被映射并重塑为卷积特征图表示，然后，通过五层转置卷积运算生成大小为(64，64，3)的时频图像样本。在每一个转置卷积中，卷积核大小为4，步长为2，通道数分别为512，256，128，64和3。其中，转置卷积的前四层通过频谱归一化和ReLU激活函数进行处理。第三到第四层转置卷积、以及第四到第五层转置卷积时使用自注意力机制来获得全局相关性。第五层的激活函数是Tanh函数。在鉴别器D中，总共有五个卷积层，卷积核大小为4，步长为2，通道数分别为64，128，256，512和1。卷积后，使用频谱归一化和LeakyReLU激活函数进行处理。第三到第四层卷积、以及第四到第五层卷积时使用自注意力机制来获得全局相关性。在SAGAN训练中，迭代更新模型参数，batchsize为16，使用RMSprop优化器，生成器和鉴别器的学习率为0.0005，两者交替训练直到收敛。训练完成后，生成器输出的伪数据与真实数据分布相似，鉴别器无法识别数据源。通过生成器和判别器的对抗学习，获得与真实数据接近的模拟数据，弥补少样本的不足。

S3、构建基于改进残差网络的IResNet轴承故障诊断模型，将原始训练集样本与步骤S2得到的新样本相结合共同作为输入对IResNet轴承故障诊断模型进行训练，同时利用验证集对诊断模型进行验证，调整模型参数，直至网络收敛，得到训练好的IResNet轴承故障诊断模型

卷积神经网络通过卷积操作能够有效地捕获图像局部信息，但视觉任务需要建立长距离依赖关系。为了对局部捕获的滤波器响应进行全局聚合，网络结构需要堆叠多层，但是当层数过大时，网络模型即将面临梯度弥散或爆炸与网络退化的问题，严重影响模型准确率。为解决以上问题，本发明对残差网络进行改进，将多头注意力机制(头数为4)与残差网络相结合。深度残差网络(Deep Residual Network，ResNet)利用跳跃连接将输入与输出逐元素相加，在不增加网络参数与计算量的情况下大大提升模型训练效果，解决了传统卷积神经网络中因层数增加造成的网络退化的问题。残差运算公式如下：

H(x)＝F(x)+x (8)

式中:x为恒等映射；F(x)为跳跃连接；H(x)为残差输出。残差模块如图7所示。

残差网络通过残差学习加深网络层数，获取深层特征，缓解卷积神经网络因网络层数过高而引起的网络退化的问题。

自注意力机制提高模型全局特征提取的能力，但单头注意力机制特征学习能力有限。相对于单头注意力机制，多头注意力机制(Multi-head Self-Attention)可以获取输入数据多个不同子空间的特征信息表示，增强模型获取全局特征和长距离依赖的能力，从而更有效的提取变量之间的内在联系。多头注意力机制计算公式如下：

MultiHead(Q,K,V)＝concat(H₁,H₂,…H_h)W (9)

H_i＝Self-Attention(Q_i,K_i,V_i) i＝1,2,…,h (10)

式中：h表示多头注意力机制的头数，H_i表示第i个注意力机制输出的结果，concat表示矩阵的拼接操作，将每个单头注意力机制的输出进行拼接，然后经过线性映射权重矩阵W进行融合，进而得到多头注意力机制的输出。

多头注意力机制通过处理和聚合卷积捕获的特征信息，获取图像长距离依赖关系与全局特征。这样的混合设计，有利于提高模型关键特征提取的能力，实现网络对全局信息的掌控，增强模型对重要特征的敏感度，提高模型在强噪声与变负载下轴承故障诊断的准确率，改进后的残差模块如图8所示。

由图8可知，多头注意力机制取代残差网络中的(3×3)卷积操作，实现2D特征图上的全局自注意力。通过改进残差网络模块，获得了长距离依赖性和全局特征信息，同时也解决了梯度分散和网络退化的问题。

本发明提出的IResNet轴承故障诊断模型主要解决强噪声与变负载下传统轴承故障诊断方法特征提取不充分的问题，通过将残差网络与多头注意力机制相结合，实现网络对全局信息的掌控，增强模型对重要特征的敏感度，减小复杂环境对数据的影响。

本发明提出的IResNet轴承故障诊断模型主要由卷积层、池化层、改进的blockA残差模块、改进的blockB残差模块和全连接层组成。网络结构如图9所示。将原始样本与生成样本共同作为模型输入，首先，经过两次卷积操作获取浅层抽象特征；其次，利用改进后的blockA残差模块和blockB残差模块加深网络层数，有效地获取全局特征和远距离依赖性，同时残差网络缓解因网络层数加深造成的网络退化的现象；然后，在两个全连接层之间添加Dropout，提高模型鲁棒性与泛化能力；最后，使用Softmax层作为分类器来实现故障诊断。IResNet轴承故障诊断模型训练时，batchsize为32；epoch为30；采用交叉熵损失作为误差损失函数；Adam为优化器；学习率为0.001；同时采用学习率衰减机制调整学习率，提高训练效果，降低训练成本。IResNet轴承故障诊断模型参数设置如表1所示。

表1 IResNet轴承故障诊断模型参数设置

S4、将测试集样本输入训练好的IResNet诊断模型中进行测试，得到轴承故障诊断结果。

下面结合具体的实验对诊断方法实施例的技术方案进行详细阐述和全方位论证。

以下所用数据来自于凯斯西储大学轴承数据中心公开数据集。试验台示意图如图10所示，试验台由风扇端轴承1、驱动端轴承3、电机2、扭矩传感器4和测功机组成。试验轴承型号为SKF6205电机轴承。轴承故障采用电火花加工，故障类型包括内圈故障(IR)、外圈故障(OR)和滚珠故障(BD)。故障直径分别为0.1778mm、0.3556mm和0.5334mm。电机的相应负载为0HP、1HP、2HP和3HP。采样频率为12kHz。

(1)原始振动信号预处理

利用重叠采样的方式对原始振动信号预处理，单类样本个数1000，样本长度为1024，其中训练集、验证集和测试集比例为8:1:1。数据参数统计如表2所示。通过连续小波变换将振动信号转换为二维时频图像，得到的时频图像如图11所示。

表2实验数据集

(2)基于SAGAN网络模型的样本扩充

本发明将基于SAGAN网络模型与传统的CNN故障诊断模型相结合，研究生成样本对轴承故障诊断准确率的影响。

图12展示了当训练epoch为50，100，300时SAGAN生成的样本图像。当训练轮次为50时，图像背景模糊，清晰度不均匀；当训练轮次为100时，可以粗略地表示时频图像的一些特征，但图像背景清晰度仍然有待提高。当训练轮次为300时，图像清晰度较高，生成样本和原始样本具有相似的特征分布，但仍然有细微的差别，因为生成样本是模型对真实样本学习训练得到的，而不是简单的图像复制。因此，本发明可以将300作为SAGAN最终训练轮次，并在此基础上进行后续分析。

不同生成对抗网络样本生成图像如图13所示。由图可知，GAN只能学习到原始样本的基本轮廓，生成样本与真实样本差距较大。DCGAN生成样本与真实样本相似度相对于GAN有所提升，但图像模糊，故障特征学习不足。SAGAN生成图像与原始图像较为相似，基本可以学习到原始样本的全部特征，说明通过引入自注意力机制，有效地提升了模型全局特征信息学习的能力。

为了验证生成图像数量对轴承故障诊断准确率的影响，将实验分为三类：第一类不进行数据扩充，仅使用原始数据训练故障诊断模型(No.1)；第二类仅使用生成的数据进行训练(No.2-No.7)；第三类使用数据扩充技术，将原始数据与生成的数据相结合，共同训练模型(No.8-No.13)；结果如表3所示。由No.1数据表明，在数据不平衡的情况下，虽然可以基本实现轴承故障诊断任务，但诊断精度仍有待提高。No.1与No.2-No.7比较说明，单独使用生成的数据作为训练数据并不能产生更准确的故障诊断结果。No.1和No.8-No.13对比结果表明，使用数据扩充，将真实数据和生成的数据相结合来训练模型可以明显提升诊断准确率，并且随着生成图像数量的增加，模型准确性越来越高，当生成数据总量为6000时，模型的准确率达到100％。因此，在原始样本数为8000、生成样本数为6000的基础上进行后续实验。

将生成数据与原始数据共同作为CNN故障诊断模型输入对网络进行训练，训练过程如图14所示。由图可知，经过数据扩充之后，模型训练的收敛速度明显加快，收敛更稳定，说明使用数据生成技术，将真实数据与生成的数据相结合来训练模型可以显著提高模型训练的稳定性和轴承故障诊断准确率。

表3不同数据集下的诊断准确率比较

No.	训练集	生成数据	验证集	测试集	准确率/％
						1	8000	0	1000	1000	99.900
2	0	500	1000	1000	92.567
						3	0	1000	1000	1000	95.233
4	0	2000	1000	1000	95.733
						5	0	4000	1000	1000	97.100
6	0	6000	1000	1000	98.467
						7	0	8000	1000	1000	98.500
8	8000	500	1000	1000	99.920
						9	8000	1000	1000	1000	99.925
10	8000	2000	1000	1000	99.933
						11	8000	4000	1000	1000	99.966
12	8000	6000	1000	1000	100
						13	8000	8000	1000	1000	100

(3)构建IResNet轴承故障诊断模型，下面对构建的IResNet轴承故障诊断模型进行论证分析。

(3-1)IResNet轴承故障诊断模型中网络深度分析

在实际的工业生产中，轴承运转环境较为复杂，采集到的信号不可避免的夹杂着各种噪声。因此，在原始信号中加入不同程度的高斯白噪声，模拟工业环境的噪声污染。评估噪声强度的标准是信噪比(SNR)，SNR的定义如下：

其中SNR_dB、P_signle和P_noise分别表示信噪比、信号幅度和噪声幅度。信号中包含的噪声越多，SNR值就越小。当SNR值为0dB时，信号和噪声中包含的能量相等。

从理论上讲，网络层数越深，模型精度越高，但模型复杂性与训练时间也会随之增加。为了平衡故障诊断精度、网络复杂性和模型训练时间之间的矛盾，本发明设计了四种不同深度的改进残差网络结构，即轴承故障诊断模型主要由传统的CNN和改进残差块IResNet堆叠而成，当IResNet模块的数量分别为0、1、2、3和4时，模型分别记为CNN、CNNI、CNNII，CNNIII和CNNIV。为减少随机因素对实验结果的影响，每个模型的最终准确率是5次重复实验结果的平均值，结果如图15所示。

由图15可知，与CNN相比，CNNI在噪声环境中轴承故障诊断性能显著提高。同时，随着网络深度的增加，模型识别准确率逐渐增强，但当网络深度增加到一定程度时，识别精度不会有太大提升。为了更直观地展示CNNI、CNNII、CNNIII、CNNIV故障诊断精度与训练时间之间的关系，图16展示这四个不同深度的模型在不同噪声环境(SNR＝-8、-6、-4)下的实验结果和模型平均训练时间。由图可知，随着网络深度的增加，模型训练时间增加，但当模型堆叠IResNet模块数量为3时轴承故障诊断性能最好。在综合分析模型精度和训练时间的基础上确定使用堆叠3个IResNet模块的改进残差网络实现轴承故障诊断。

(3-2)IResNet轴承故障诊断模型抗噪性分析

为了模拟噪声环境中采集的轴承振动信号，本实验选取运行负载为2HP的数据集，在原始振动信号中加入信噪比为-8至6dB的高斯白噪声。为证明本发明所提方法的抗噪性，分别与现有技术中的SVM、MLP、SECNN、DFCNN、DRL_ResNet、CNN和SAGAN_CNN进行比较。其中，CNN是基于卷积神经网络的轴承故障诊断模型。SAGAN_CNN首先使用SAGAN生成样本数据，增加样本数量，再使用CNN模型实现故障诊断。为了减少随机因素的影响，每种方法的最终结果是五次重复实验结果的平均值，结果如图17所示。由图可知，随着噪音强度的增加，所有诊断算法的平均识别精度都会降低，但是，不同算法的下降幅度存在显著差异。本发明方法在强噪声环境下的平均准确率达到97.13％，相对于其他七种方法分别提升了11.7％、14.86％、3.32％、0.97％、0.51％、4.45％、4.21％。说明通过改进残差网络，引入多头自注意机制，最大程度学习样本特征，减少噪声干扰，增强网络鲁棒性，提高了模型轴承故障诊断准确率。

为了排除所提方法对个别故障类型的极端识别，使用混淆矩阵对测试集分类结果进行了分析，分析结果如图18所示。从图18(a)可以看出，当SNR＝6时，测试集的准确率达到了99.9％，标签为B021的一个样本被误诊为B007，只是故障尺度识别错误，但都属于滚动体故障，说明该方法能有效识别不同故障情况下的滚动轴承，并具有较高的精度和稳定性。由图18(b)可知，在SNR＝-8的高噪声环境下，本发明方法的整体诊断准确率高于86％，具有较强的鲁棒性。

为验证本发明方法特征提取的能力，利用t-SNE技术对特征进行降维，实现特征向量的二维可视化，结果如图19所示。其中，图19(a)是模型第二层卷积特征t-SNE可视化的结果，数据互相重叠混合，聚类效果不佳；图19(b)为最后一层IResNet模块特征可视化的结果，全部样本已基本划分成十个类别，而且各样本聚集效果明显，证明引入多头注意力之后的残差神经网络能最大程度学习样本特征，有效地提高模型故障诊断性能。

(3-3)IResNet轴承故障诊断模型变负载分析

在实际的工业环境中，轴承的负载状况都是多变的，这就要求故障诊断方法具有较高的泛化性能。为验证本发明方法的泛化性，分别与SVM、MLP、SECNN、DFCNN、DRL_ResNet、CNN和SAGAN_CNN进行对比。首先使用0HP、1HP和2HP负载下的轴承数据来训练模型；然后使用剩余负载的样本数据进行故障诊断。每种方法在变负载条件下的故障诊断结果如图20所示，由图可知，SVM和MLP方法的故障诊断准确率较低，泛化性能最差；SECNN的平均准确率为91.41％，泛化性能一般；尽管DFCNN在变负载环境下具有良好的故障诊断性能，但该模型在变噪声情况下性能不佳；DRL_ResNet在噪声环境下具有更好的故障诊断能力，但在变负载下比本发明方法低4.16％。与CNN和SAGAN_CNN相比，本发明方法的识别准确率分别提高了2.88％和1.9％。具有较强的跨域自适应能力，适用于工业应用中的轴承故障诊断。

另一方面，本发明还包含以下诊断系统实施例。

一种基于SAGAN-IResNet的少样本轴承故障诊断系统包括：

诊断模型训练模块：利用原始训练样本与生成新样本共同训练IResNet轴承故障诊断模型，同时利用验证集对诊断模型进行验证，调整模型参数，直至网络收敛，得到训练好的IResNet轴承故障诊断模型；

所述数据预处理模块包括信号获取模块、连续小波变换模块和样本划分模块；其中，信号获取模块用于获取轴承的原始振动信号，连续小波变换模块用于对原始振动信号进行连续小波变换，获得时频图，样本划分模块用于将获取的时频图进行分组划分。

再一方面，结合上述的轴承故障诊断方法实施例，本发明可提供一种存储介质来实现。该存储介质上存储有计算机程序指令；该计算机程序指令被处理器执行时实现上述的轴承故障诊断方法。由于本发明实施例提供的存储介质，为实施本发明实施例的方法所采用的存储介质，故而基于本发明实施例所介绍的方法，本领域所属人员能够了解该存储介质的具体结构及变形，故而在此不再赘述。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述，仅是本发明的较佳实施例而已，并非随本发明作任何形式上的限制。凡根据本发明的实质所做的等效变换或修饰，都应该涵盖在本发明的保护范围之内。

Claims

1.一种基于SAGAN-IResNet的少样本轴承故障诊断方法，其特征在于，主要包括如下步骤：

2.根据权利要求1所述的一种基于SAGAN-IResNet的少样本轴承故障诊断方法，其特征在于，步骤S2中的SAGAN网络模型包括生成器和鉴别器，在SAGAN训练中，迭代更新模型参数，batchsize为16，使用RMSprop优化器，生成器和鉴别器的学习率为0.0005，两者交替训练直到收敛。

3.根据权利要求2所述的一种基于SAGAN-IResNet的少样本轴承故障诊断方法，其特征在于，在生成器中，符合均匀分布的随机噪声变量被映射并重塑为卷积特征图表示，然后通过第一至第五共五层转置卷积运算生成大小为(64，64，3)的时频图像样本，在各个转置卷积层中，卷积核大小为4，步长为2，第一至第五转置卷积层的通道数分别为512，256，128，64和3；

第五转置卷积层的激活函数是Tanh函数。

4.根据权利要求2所述的一种基于SAGAN-IResNet的少样本轴承故障诊断方法，其特征在于，在鉴别器中总共有第一至第五共五个卷积层，各层的卷积核大小均为4，步长均为2，第一至第五卷积层的通道数分别为64，128，256，512和1；卷积后，使用频谱归一化和LeakyReLU激活函数进行处理；第三到第四层卷积、以及第四到第五层卷积时使用自注意力机制来获得全局相关性。

5.根据权利要求1所述的一种基于SAGAN-IResNet的少样本轴承故障诊断方法，其特征在于，步骤S3中，所述改进残差网络是将多头注意力机制与残差网络相结合得到的。

6.根据权利要求1所述的一种基于SAGAN-IResNet的少样本轴承故障诊断方法，其特征在于，步骤S3中，将样本输入到IResNet轴承故障诊断模型进行训练，具体为：

S31、将样本输入IResNet轴承故障诊断模型内的第一卷积层，经过第一卷积层处理得到的特征图输入第一池化层；

S37、使用Softmax层作为分类器实现故障诊断；其中，IResNet故障诊断模型训练时，batchsize为32；epoch为30；采用交叉熵损失作为误差损失函数；Adam为优化器；学习率为0.001；同时采用学习率衰减机制调整学习率，不断循环上述训练步骤，直到该误差小于设定值，保存权重文件，得到故障诊断模型。

7.根据权利要求6所述的一种基于SAGAN-IResNet的少样本轴承故障诊断方法，其特征在于，两个全连接层之间添加有用于提高模型鲁棒性与泛化能力的Dropout。

8.一种基于SAGAN-IResNet的少样本轴承故障诊断系统，其特征在于，包括：

9.根据权利要求8所述的一种基于SAGAN-IResNet的少样本轴承故障诊断系统，其特征在于，所述数据预处理模块包括信号获取模块、连续小波变换模块和样本划分模块；

其中，信号获取模块用于获取轴承的原始振动信号，连续小波变换模块用于对原始振动信号进行连续小波变换，获得时频图，样本划分模块用于将获取的时频图进行分组划分。

10.一种存储介质，其特征在于，所述存储介质存储有轴承故障的诊断程序，所述轴承故障诊断程序被处理器执行时实施权利要求1-7中任一项所述的方法。