CN117290771A

CN117290771A - 基于改进辅助分类生成对抗网络的旋转机械故障诊断方法

Info

Publication number: CN117290771A
Application number: CN202311232001.4A
Authority: CN
Inventors: 汪红星; 朱华; 李华峰
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2023-09-22
Filing date: 2023-09-22
Publication date: 2023-12-26

Abstract

基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，步骤一、数据采集：采集旋转机械的关键传动部件各种健康状态下的振动信号；步骤二、数据预处理：利用短时傅里叶变换将采集的一维时域信号转换为二维时频图像；步骤三、模型搭建：构建辅助分类生成对抗网络，改进网络结构与损失函数；步骤四、模型训练：利用少量有标签数据与大量无标签数据进行生成器与判别器的对抗训练；步骤五、数据生成与故障诊断：利用训练好的生成器进行多模式样本生成，利用训练好的判别器进行故障识别。本发明实现了有限标签数据下的多模式样本生成和故障诊断，在不同标签比例下，所述方法不仅能够生成高质量的多模式样本，还具有较高的故障诊断精度和稳定性。

Description

基于改进辅助分类生成对抗网络的旋转机械故障诊断方法

技术领域

本发明属于旋转机械故障诊断技术领域，具体为基于改进辅助分类生成对抗网络的旋转机械故障诊断方法。

背景技术

随着现代工业系统的蓬勃发展，旋转机械在智能装备中发挥着不可替代的作用，其安全性受到学术界和工业界的广泛关注。旋转机械的关键传动部件(如轴承、齿轮)在高速、重载等复杂运行环境下不可避免地会出现磨损、腐蚀、变形、裂纹等故障。传动部件的故障直接影响旋转机械的运行可靠性，可能造成重大事故，导致经济损失甚至人员伤亡。因此，对旋转机械进行故障诊断和预测性维护具有重要的研究价值。

近年来，基于深度学习的故障诊断方法依靠着强大的故障特征学习能力以及端到端的诊断特性，逐渐成为研究热点，包括自编码器(AE)、深度信念网络(DBN)、卷积神经网络(CNN)和循环神经网络(RNN)等。尽管上述模型在故障诊断领域已经显示出了有效性，但它们需要依赖大量有标签数据进行监督学习。然而，在实际工程中很难获得足够的有标签样本，导致监督模型存在严重的过拟合问题。因此，利用有限的有标签样本训练准确可靠的基于深度学习的故障诊断模型是值得研究的。

生成对抗网络(GAN)作为无监督生成模型的关键技术之一，是基于零和博弈理论创建的，主要由生成器和判别器组成。GAN可以在只使用无标签样本的情况下生成与现有样本相似的新样本。半监督生成对抗网络SGAN是由GAN改进的一种半监督生成模型，通过强制判别器输出类别标签，将GAN扩展到半监督场景。传统GAN的判别器采用Sigmoid函数作为输出，而SGAN采用Softmax函数作为输出，对于一个具有N个类别的数据集，判别器将输出扩展为N+1维，包括1维判别输出与N维分类输出。辅助分类生成对抗网络ACGAN是由GAN改进的一种有监督生成模型，通过将类别标签作为辅助信息嵌入到随机噪声输入中，进而指导生成器生成多模式样本。ACGAN的判别器同时采用Sigmoid函数与Softmax函数作为输出，实现对输入样本的判别与分类。近些年来，ACGAN被用来解决多模式样本生成与故障诊断问题。

上述研究表明，SGAN为半监督学习机制，但由于没有类别信息的参与无法生成多模式样本；ACGAN通过将类别标签作为辅助信息可以生成多模式样本，但其监督学习机制需要大量有标签数据的参与。

与现有技术相比，本申请具有如下优势：

与专利CN114861789A“一种基于生成对抗机制的旋转机械故障诊断方法及系统”的技术对比

专利CN114861789 A属于旋转机械故障诊断领域，本专利虽然也属于旋转机械故障诊断领域，其区别在于解决的问题有所不同，专利CN114861789 A要解决的问题仅为旋转机械的故障诊断，而本专利要解决的问题包括两个部分：旋转机械的多模式样本生成与故障识别。

专利CN114861789 A采用的深度学习模型为自编码器，其将生成对抗机制引入到自编码器，构建了一种基于生成对抗机制的自编码深度学习网络；而本专利采用的深度学习模型为辅助分类生成对抗网络，将半监督学习机制引入到辅助分类生成对抗网络，构建了一种半监督辅助分类生成对抗网络。两者存在本质区别。

与专利CN112308038 B“基于课堂式生成对抗网络模型的机械设备故障信号识别方法”的技术对比

专利CN112308038 B属于机械故障诊断领域，本专利针对旋转机械的故障诊断，从属于机械故障诊断领域，其区别在于专利CN112308038 B是为了解决现有的机械设备故障信号识别方法准确率不高的问题，而本专利是为了解决有限标签数据下的旋转机械多模式样本生成与故障诊断问题。

专利CN112308038 B采用的深度学习模型为生成对抗网络，构建了一种包含一个生成器和多个判别器的基于课堂式生成对抗网络模型；而本专利采用的深度学习模型为辅助分类生成对抗网络，将半监督学习机制引入到辅助分类生成对抗网络，构建了一种半监督辅助分类生成对抗网络。两者虽然都属于生成对抗网络，但原理和结构均存在本质区别。

发明内容

为解决上述技术问题，本发明提出了基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，实现有限标签数据下的多模式样本生成和故障诊断。

为实现上述目的，本发明采取的技术方案是：

基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，具体步骤如下：

步骤一、数据采集：

采集旋转机械的关键传动部件各种健康状态下的振动信号；

步骤二、数据预处理：

利用短时傅里叶变换将各种健康状态的一维时域信号样本转换为二维时频图像；

所述短时傅里叶变换是关于时间与频率的函数，如下式所示：

其中，STFT(·)表示短时傅里叶变换，x(t)表示一维时域信号，t、w表示时间、频率，g(s-t)表示中心位于t时刻的窗函数；

所述经短时傅里叶变换得到的二维时频图像的时间与频率分辨率取决于窗函数长度，如下式所示：

其中，N_x表示待处理信号的长度，N_w表示窗函数的长度，N_o表示窗函数平移过程中的重叠长度，[·]表示向下取整，X表示经短时傅里叶变换得到的维度为F×T的时频矩阵；

步骤三、模型搭建：

构建辅助分类生成对抗网络，改进网络结构与损失函数；

步骤四、模型训练：

利用少量有标签数据与大量无标签数据进行生成器与判别器的对抗训练；

步骤五、数据生成与故障诊断：

利用训练好的生成器进行多模式样本生成，利用训练好的判别器进行故障识别。

作为本发明进一步改进，步骤一中，采集的振动信号包括K种健康状态即正常状态和K-1种故障状态的振动信号，通过滑动窗口采样得到一维时域信号样本。

作为本发明进一步改进，步骤二中，利用短时傅里叶变换将各种健康状态的一维时域信号样本转换为二维时频图像，并将所有样本归一化到[-1,1]，然后将样本集拆分为训练集和测试集，其中训练集按照比例划分为有标签训练样本与无标签训练样本。

作为本发明进一步改进，步骤三中，构建的辅助分类生成对抗网络包含一个生成器G和一个判别器D,生成器G由嵌入层和反卷积块组成，输入为噪声向量与标签向量，输出为生成样本；判别器D由卷积块和全连接层组成，输入为有标签样本、无标签样本以及生成样本，输出为判别结果与分类结果。

作为本发明进一步改进，所述生成器G的输入为200维的高斯随机噪声向量z与类别标签向量c，标签向量c通过嵌入层嵌入到噪声向量z中，经过五个反卷积块输出生成样本，每个反卷积块依次连接包括：一个反卷积层Deconv、一个批量归一化层BN、一个激活函数层；

前四个反卷积块的卷积核大小为3×3、步幅为2×2，激活函数为ReLU；最后一个反卷积块的卷积核大小为4×4、步幅为2×2，激活函数为Tanh，五个反卷积块的通道数量依次为200、64、32、16、1。

作为本发明进一步改进，所述判别器D的输入为真实样本或生成样本，经过三个卷积块和两个全连接层输出一个1维判别向量和一个K维分类向量，每个卷积块依次连接包括：一个卷积层Conv、一个批量归一化层BN、一个激活函数层、一个丢弃层Dropout，第一个卷积块的卷积核大小为5×5、步幅为4×4、填充2×2；后两个卷积块的卷积核大小为5×5、步幅为2×2、填充2×2，三个卷积块的激活函数均为Leaky ReLU，通道数量依次为32、64、128，两个全连接层FC分别使用Sigmoid与Softmax函数作为输出。

作为本发明进一步改进，所述辅助分类生成对抗网络的损失函数包含生成器G的损失函数和判别器D的损失函数，如下式所示：

其中，L_G、L_D分别表示生成器G与判别器D的损失函数；分别表示判别器D的有监督损失与无监督损失；λ₁、λ₂为比例因子；P_r(x)、P_r(x,y)分别表示无标签真实样本与有标签真实样本的分布，c为有标签真实样本的标签，P(c＝c|x)、P(c＝c|G(z,c))分别表示有标签真实样本与生成样本的类别标签的条件概率分布。

作为本发明进一步改进，步骤四中，利用有标签训练样本与无标签训练样本进行生成器G与判别器D的对抗训练，同步提升生成器G的多模式样本生成能力与判别器D的识别能力，训练流程如下：

(1)将噪声向量z与标签向量c输入到生成器G得到生成样本；

(2)将有标签训练样本、无标签训练样本以及生成样本输入到判别器D得到一个1维判别向量和一个K维分类向量；

(3)计算生成器G与判别器D的损失；

(4)固定生成器G的参数，优化判别器D的参数θ_D；

(5)固定判别器D的参数，优化生成器G的参数θ_G；

(6)重复第1-5步，直至达到迭代次数；

(7)保存训练好的生成器G和判别器D。

作为本发明进一步改进，所述生成器G与判别器D的对抗训练采用Adam优化算法对模型参数进行更新，Adam算法通过计算梯度的一阶矩估计和二阶矩估计，为不同的模型参数提供独立的自适应学习率，如下式所示：

其中，θ_G、θ_D分别表示生成器G与判别器D的模型参数，α、β₁、β₂分别表示Adam优化器的学习率、一阶矩估计的指数衰减率、二阶矩估计的指数衰减率，均为误差反向传播求导方式找到的模型最优点。

与现有技术相比，本发明的优点在于：

(1)本发明利用短时傅里叶变换将一维时域振动信号转换为二维时频图像。短时傅里叶变换是一种针对时变、非平稳信号的联合时频分析方法，它利用固定长度的窗函数在时域信号上平移，截取信号并进行傅立叶变换得到每个时间段的局部频谱集合。因此由短时傅里叶变换得到二维时频图像矩阵，同时包含了时域信息和频域信息，比原始的时域信号携带了更加丰富的特征，表征了更加复杂的结构分布，有助于基于深度学习的故障诊断模型的训练。

(2)本发明结合半监督生成对抗网络SGAN与辅助分类生成对抗网络ACGAN各自的特点，构建了一种半监督辅助分类生成对抗网络SACGAN，改进了网络结构与损失函数。利用SGAN的半监督学习机制，通过少量有标签数据与大量无标签数据的对抗训练来提高生成、判别与分类能力，将ACGAN由监督学习转变为半监督学习，实现有限标签数据下的多模式样本生成和故障诊断。

(3)本发明利用少量有标签数据与大量无标签数据进行生成器与判别器的对抗训练，同步提升生成器的多模式样本生成能力与判别器的识别能力。所述方法不仅能够生成高质量的多模式样本，还具有较高的故障诊断精度和稳定性。

附图说明

图1为本发明的方法的流程图；

图2为轴承各种健康状态的时域振动信号与转换后的时频图像；

图3为本发明的改进辅助分类生成对抗网络的结构示意图；

图4为本发明的生成器的结构示意图；

图5为本发明的判别器的结构示意图；

图6为本发明的改进辅助分类生成对抗网络的训练流程图；

图7轴承各种健康状态的真实样本到多模式生成样本的生成示意图；

图8轴承各种健康状态的多模式生成样本的SSIM质量评估图；

图9轴承数据不同标签比例下测试样本的识别结果。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本实施例中，如图1所示，一种基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，主要包括：步骤一、数据采集：采集旋转机械的关键传动部件(如轴承、齿轮)各种健康状态下的振动信号；步骤二、数据预处理：利用短时傅里叶变换将采集的一维时域信号转换为二维时频图像；步骤三、模型搭建：构建辅助分类生成对抗网络，改进网络结构与损失函数；步骤四、模型训练：利用少量有标签数据与大量无标签数据进行生成器与判别器的对抗训练；步骤五、数据生成与故障诊断：利用训练好的生成器进行多模式样本生成，利用训练好的判别器进行故障识别。

在本实施例中，步骤一，采集轴承的10种健康状态的振动数据，包括正常状态和9种故障状态(3种故障位置与3种故障大小)，各种健康状态的振动数据通过滑动窗口采样(窗口长度为1024)得到300个一维时域信号作为可用样本。轴承的健康状态与类别标签如下表1所示：

步骤二中，利用短时傅里叶变换将各种健康状态的一维时域信号样本转换为二维时频图像。

所述短时傅里叶变换是关于时间与频率的函数，如下式(1)所示：

其中，STFT(·)表示短时傅里叶变换，x(t)表示一维时域信号，t、w表示时间、频率，g(s-t)表示中心位于t时刻的窗函数。

所述经短时傅里叶变换得到的二维时频图像的时间与频率分辨率取决于窗函数长度，如下式(2)、(3)、(4)所示：

其中，N_x表示待处理信号的长度，N_w表示窗函数的长度，N_o表示窗函数平移过程中的重叠长度，[·]表示向下取整，X表示经短时傅里叶变换得到的维度为F×T的时频矩阵。

在本实施例中，所述短时傅里叶变换的窗函数为“hann”窗，窗函数长度N_w与重叠长度N_o分别为256和250。

在本实施例中，步骤二中，利用短时傅里叶变换将轴承各种健康状态的一维时域信号样本(长度为1024)转换为二维时频图像，并将所有样本归一化到[-1,1]，然后几何处理为64×64的图像样本。轴承每个健康状态包含300个时频图像样本，其中取100个样本作为测试样本，其余样本按照不同比例划分为有标签训练样本与无标签训练样本。

在本实施例中，如图2所示，轴承各种健康状态的一维时域振动信号转换为二维时频图像，可以看出不同健康状态之间的特征差异比原始时域信号更为显著。

在本实施例中，如图3所示，步骤三中，构建的半监督辅助分类生成对抗网络SACGAN包含一个生成器G和一个判别器D。生成器G由嵌入层和反卷积块组成，输入为噪声向量与标签向量，输出为生成样本；判别器D由卷积块和全连接层组成，输入为有标签样本、无标签样本以及生成样本，输出为判别结果与分类结果。

在本实施例中，如图4所示，所述生成器G的输入为200维的高斯随机噪声向量z与类别标签向量c，标签向量c通过嵌入层嵌入到噪声向量z中，经过五个反卷积块输出生成样本。每个反卷积块依次连接包括：一个反卷积层Deconv、一个批量归一化层BN、一个激活函数层。前四个反卷积块的卷积核大小为3×3、步幅为2×2，激活函数为ReLU；最后一个反卷积块的卷积核大小为4×4、步幅为2×2，激活函数为Tanh。五个反卷积块的通道数量依次为200、64、32、16、1。

在本实施例中，如图5所示，所述判别器D的输入为真实样本或生成样本，经过三个卷积块和两个全连接层输出一个1维判别向量和一个K维分类向量。每个卷积块依次连接包括：一个卷积层Conv、一个批量归一化层BN、一个激活函数层、一个丢弃层Dropout。第一个卷积块的卷积核大小为5×5、步幅为4×4、填充2×2；后两个卷积块的卷积核大小为5×5、步幅为2×2、填充2×2。三个卷积块的激活函数均为Leaky ReLU，通道数量依次为32、64、128。两个全连接层FC分别使用Sigmoid与Softmax函数作为输出。

所述SACGAN的损失函数包含生成器G的损失函数和判别器D的损失函数，如下式(5)、(6)、(7)、(8)所示：

在本实施例中，判别器D损失函数L_D的比例因子λ₁、λ₂均为0.5。

在本实施例中，如图6所示，步骤四中，利用有标签训练样本与无标签训练样本进行生成器G与判别器D的对抗训练，同步提升生成器G的多模式样本生成能力与判别器D的识别能力，训练流程如下：

(1)将噪声向量z与标签向量c输入到生成器G得到生成样本。

(2)将有标签训练样本、无标签训练样本以及生成样本输入到判别器D得到一个1维判别向量和一个K维分类向量。

(3)计算生成器G与判别器D的损失。

(4)固定生成器G的参数，优化判别器D的参数θ_D。

(5)固定判别器D的参数，优化生成器G的参数θ_G。

(6)重复第1-5步，直至达到迭代次数。

(7)保存训练好的生成器G和判别器D。

所述生成器G与判别器D的对抗训练采用Adam优化算法对模型参数进行更新，Adam算法通过计算梯度的一阶矩估计和二阶矩估计，为不同的模型参数提供独立的自适应学习率，如下式(9)、(10)、(11)所示：

在本实施例中，所述训练SACGAN的超参数配置如下：Adam算法的学习率α为0.0005，一阶矩估计的指数衰减率β₁为0.5，二阶矩估计的指数衰减率β₂为0.999，批量大小为K×10，迭代次数为200。

在本实施例中，使用标签比例为0.2的训练样本(各类40个有标签样本与160个无标签样本)对SACGAN进行训练。生成器G的样本生成能力通常通过评估生成样本的质量来验证，如图7所示，轴承各种健康状态的真实样本到多模式生成样本的生成示意图，可以看出生成样本与真实样本高度相似。

在本实施例中，为了更加客观的评估生成器G的样本生成能力，采用结构相似度(SSIM)来定量评估生成样本的质量。SSIM旨在从亮度、对比度以及结构衡量两幅图像的相似性，较大的SSIM值表示两幅图像具有较高的相似性。作为对比，使用相同条件对ACGAN进行了训练。随机选取各类5对真实样本与生成样本，如图8所示，比较了ACGAN与SACGAN的SSIM平均值。可以看出SACGAN各类的SSIM值均大于ACGAN，这表明SACGAN的生成样本更接近于真实样本。

在本实施例中，为了验证判别器D的故障识别能力，将各类训练样本按照不同比例划分为有标签样本与无标签样本对SACGAN进行训练。作为对比，使用相同条件对ACGAN与判别器D的CNN进行了训练。每组实验重复运行十次后结果取平均值，如图9所示，不同标签比例下测试样本的识别结果。结果表明，三种模型均具有较高的识别精度，这说明了判别器D结构的有效性；ACGAN与SACGAN通过对抗学习有效提高了判别器D的识别能力；限制有标签训练样本的数量对CNN与ACGAN的故障识别能力影响较大，而SACGAN能够削弱标签比例减小带来的影响，在不同标签比例下均表现出了最高的识别精度。

以上所述，仅是本发明的较佳实施例而已，并非是对本发明作任何其他形式的限制，而依据本发明的技术实质所作的任何修改或等同变化，仍属于本发明所要求保护的范围。

Claims

1.基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，其特征在于，具体步骤如下：

步骤一、数据采集：

采集旋转机械的关键传动部件各种健康状态下的振动信号；

步骤二、数据预处理：

步骤三、模型搭建：

构建辅助分类生成对抗网络，改进网络结构与损失函数；

步骤四、模型训练：

步骤五、数据生成与故障诊断：

2.根据权利要求1所述的基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，其特征在于：

步骤一中，采集的振动信号包括K种健康状态即正常状态和K-1种故障状态的振动信号，通过滑动窗口采样得到一维时域信号样本。

3.根据权利要求1所述的基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，其特征在于：

步骤二中，利用短时傅里叶变换将各种健康状态的一维时域信号样本转换为二维时频图像，并将所有样本归一化到[-1,1]，然后将样本集拆分为训练集和测试集，其中训练集按照比例划分为有标签训练样本与无标签训练样本。

4.根据权利要求1所述的基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，其特征在于：

步骤三中，构建的辅助分类生成对抗网络包含一个生成器G和一个判别器D,生成器G由嵌入层和反卷积块组成，输入为噪声向量与标签向量，输出为生成样本；判别器D由卷积块和全连接层组成，输入为有标签样本、无标签样本以及生成样本，输出为判别结果与分类结果。

5.根据权利要求4所述的基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，其特征在于：

所述生成器G的输入为200维的高斯随机噪声向量z与类别标签向量c，标签向量c通过嵌入层嵌入到噪声向量z中，经过五个反卷积块输出生成样本，每个反卷积块依次连接包括：

一个反卷积层Deconv、一个批量归一化层BN、一个激活函数层；

6.根据权利要求4所述的基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，其特征在于：

所述判别器D的输入为真实样本或生成样本，经过三个卷积块和两个全连接层输出一个1维判别向量和一个K维分类向量，每个卷积块依次连接包括：一个卷积层Conv、一个批量归一化层BN、一个激活函数层、一个丢弃层Dropout，第一个卷积块的卷积核大小为5×5、步幅为4×4、填充2×2；后两个卷积块的卷积核大小为5×5、步幅为2×2、填充2×2，三个卷积块的激活函数均为Leaky ReLU，通道数量依次为32、64、128，两个全连接层FC分别使用Sigmoid与Softmax函数作为输出。

7.根据权利要求4所述的基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，其特征在于：

所述辅助分类生成对抗网络的损失函数包含生成器G的损失函数和判别器D的损失函数，如下式所示：

8.根据权利要求4所述的基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，其特征在于：

步骤四中，利用有标签训练样本与无标签训练样本进行生成器G与判别器D的对抗训练，同步提升生成器G的多模式样本生成能力与判别器D的识别能力，训练流程如下：

(1)将噪声向量z与标签向量c输入到生成器G得到生成样本；

(3)计算生成器G与判别器D的损失；

(4)固定生成器G的参数，优化判别器D的参数θ_D；

(5)固定判别器D的参数，优化生成器G的参数θ_G；

(6)重复第1-5步，直至达到迭代次数；

(7)保存训练好的生成器G和判别器D。

9.根据权利要求4所述的基于改进辅助分类生成对抗网络的旋转机械故障诊断方法，其特征在于：

所述生成器G与判别器D的对抗训练采用Adam优化算法对模型参数进行更新，Adam算法通过计算梯度的一阶矩估计和二阶矩估计，为不同的模型参数提供独立的自适应学习率，如下式所示：