CN110823574B

CN110823574B - 一种基于半监督学习深度对抗网络的故障诊断方法

Info

Publication number: CN110823574B
Application number: CN201910938231.XA
Authority: CN
Inventors: 徐娟; 史永方; 任子晖; 刘磊; 赵玉坤
Original assignee: Anhui Fuhuang Technology Co ltd; Hefei University of Technology
Current assignee: Anhui Jiaoxin Technology Co ltd; Hefei University of Technology
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2021-04-06
Anticipated expiration: 2039-09-30
Also published as: CN110823574A

Abstract

本发明公开了一种基于半监督学习深度对抗网络的故障诊断方法，获取不同工作故障下轴承的振动信号，将故障轴承的振动时域信号进行小波变换为二维图像；通过生成对抗网络对少量有标签的数据进行监督学习，对大量无标签的数据进行无监督训练，用卷积神经网络提取高维特征实现数据的分类，从而识别轴承的故障类别。本发明实现了在有限的带标签数据的情况下训练得到高精度的故障诊断模型，得到更准确的判别器，从而能够基于滚动轴承的振动信号进行精准故障诊断。

Description

一种基于半监督学习深度对抗网络的故障诊断方法

技术领域

本发明涉及滚动轴承振动信号处理技术领域，尤其是一种基于半监督学习深度对抗网络的故障诊断方法。

背景技术

研究先进的机械故障诊断方法是保障设备与人员安全的重要内容，其中，轴承是旋转机械中最为重要的机械零件之一，广泛应用于电力、化工、冶金、航空等各个重要领域，同时轴承也是最容易损坏的元件之一，轴承性能和工况的好坏会直接影响到整台机器设备的性能，轴承性能和工况的缺陷会导致设备产生异常振动和噪声，甚至造成设备损坏。因此，对滚动轴承进行故障诊断，尤其对滚动轴承早期故障的分析，尤为重要。

现有技术中，深度学习理论以其强大的建模和表征能力成为数据驱动的智能故障诊断领域中最活跃的研究方向之一，基于深度学习的故障诊断框架具有强大的特征学习能力，能够通过多个隐藏层直接从原始传感器数据中学习分层表示，并自动选择有利于识别的特征，准确的进行故障分类。但是，使用深度学习训练故障分类模型需要提供大量带有标签的样本数据，然而在实际工况下，虽然能够采集到的大量的振动数据，但大部分振动数据不带有标签，针对每种故障下都收集大量带有标签的振动数据是不现实的。因此，基于深度学习的故障诊断方法不适用于对滚动轴承进行故障诊断。

发明内容

为了克服上述现有技术中的缺陷，本发明提供一种基于半监督学习深度对抗网络的故障诊断方法，实现了在有限的带标签数据的情况下训练得到高精度的故障诊断模型，得到更准确的判别器，从而能够基于滚动轴承的振动信号进行精准故障诊断。

为实现上述目的，本发明采用以下技术方案，包括：

一种基于半监督学习深度对抗网络的故障诊断方法，括以下步骤：

S1，获取包含有k类轴承故障的样本总集合Y＝{Y₁,Y₂,Y₃,…Y_k}，即Y＝{Y_i}， i＝1,2,3,…k；

Y_i表示第i类轴承故障所对应的样本集合，

即

表示第i类轴承故障所对应的样本集合Y_i中的第j个样本数据；

所述样本数据是指轴承的振动信号，且样本数据为一维向量；

S2，将样本数据转换为二维图像格式，得到二维样本数据，转换后的二维图像格式不仅包括振动信号的时域特征，还包括振动信号的频域特征；

S3，根据步骤S2所得的二维样本数据生成训练集；所述训练集中包括：带标签的二维样本数据，无标签的二维样本数据；其中，标签是指轴承故障类别；带标签的二维样本数据和无标签的二维样本数据均为真实样本；

S4，将训练集输入判别器D中，若判别器D的输入为带标签的二维样本数据时，则进行监督学习；若判别器D的输入为无标签的二维样本数据时，则进行无监督学习；

在监督学习阶段，将带标签的二维样本数据输入到判别器D进行监督学习，判别器D能够判别出带标签的二维样本数据的标签即故障类别即可达到要求；

在无监督学习阶段，构建一个生成器G与判别器D进行对抗训练，借助生成对抗网络进行无监督学习；所述生成器G将随机噪声v映射为伪样本数据，且伪样本数据也为二维图像格式，即将随机噪声v映射为二维伪样本数据；所述生成器G的模型结构如下：生成器G:v→z，z＝G(v,θ_g)；其中，G(·)表示将随机噪声v 映射为二维图像格式的伪样本数据的模型，θ_g表示模型参数，z表示输出的伪样本数据；将无标签的二维样本数据和二维伪样本数据输入到判别器D进行无监督学习，判别器D能够判别出无标签的二维样本数据为真实样本即可达到要求；即，不论输入无标签的二维样本数据的具体故障类别，判别器D只要能够输出该无标签的二维样本数据为真实样本即可达到要求；

S5，基于判别器D进行的监督学习，以及基于判别器D与生成器G之间的生成对抗网络以进行的无监督学习，构成了基于半监督学习深度对抗网络的故障诊断模型，并对该故障诊断模型进行训练；

S6，对训练完成后的故障诊断模型进行模型测试，以对判别器D进行优化；

S7，后续的，已知轴承的振动信号后，即可利用优化后的判别器D进行故障诊断。

步骤S2中，利用小波变换将样本数据转换为二维图像格式，得到二维样本数据；

所述小波变换的公式，如下式所示：

式中，a表示缩放因子，用于小波函数的伸缩；τ表示平移因子，用于控制小波函数的平移；f(t)表示振动信号即一维向量；t表示时间；ψ(·)表示小波函数； WT(·)表示小波变换；

小波函数ψ(·)的公式，如下式所示：

步骤S4中，所述生成器G的网络结构为：首先是一个全连接层将原始输入即随机噪声x映射到1024维向量，后面再依次连接四个反卷积模块组成，每个反卷积模块均依次连接包括：一个反卷积层，一个批归一化层即BN，一个relu激活函数层；

所述反卷积模块的形式化表示如下式所示：

式中，

表示反卷积运算；W^g表示反卷积核；b^g表示反卷积核偏置；h^θ表示反卷积运算的结果；上标g用于标识生成器G的参数；BN(·)表示批归一化； relu(·)表示relu激活函数；

此四个依次连接的反卷积模块中的反卷积核的大小均为5，此四个依次连接的反卷积模块中的反卷积核数目依次为256、128、64、1。

步骤S4中，所述判别器D模型结构为：判别器D由三个卷积模块组成，每个卷积模块均为：首先是一个二维卷积操作即一个卷积层，其次是一个最大池化层Maxpool，然后接一个批归一化层即BN，最后接一个leakrelu激活函数层；

所述卷积块的形式化表示如下式所示：

m^d＝Max_pool(W^d*x+b^d)；

h^d＝lrelu(BN(m^d))；

式中，*表示卷积运算；W^d表示卷积核；b^d表示卷积核偏置；h^d表示卷积运算的结果；上标d用于标识判别器D的参数；Max_pool(·)表示最大池化；BN(·) 表示批归一化；relu(·)表示leakrelu激活函数；

此三个卷积模块的卷积核大小依次为5、3、3，此三个卷积模块的卷积核数目分别为64、128、256。

步骤S4中，所述判别器D的输出类别共包括k+1类，判别器D的输出l为一个k+1维的向量，即l＝{l₁,l₂,l₃,…l_k,l_k+1}；其中，前k类均表示判别为真实样本，且分别对应k类轴承故障，即l＝{l₁,l₂,l₃,…l_k,0}；第k+1类表示判别为伪样本，即 l＝{l₁,l₂,l₃,…l_k,1}。

步骤S4中，采用softmax函数替换判别器的输出，将判别器的输出l转换为P＝{P₁,P₂,P₃,…P_k,P_k+1}；softmax函数如下式所示：

式中，P_n表示判别器输出结果为第n类的概率；n＝1,2,3…k均表示判别为真实样本，且分别对应k类轴承故障；n＝k+1表示判别为伪样本；e为自然常数。

步骤S5中，故障诊断模型的训练分为三部分，分别对以下三个损失函数进行优化：

对于训练集中的带标签的二维样本数据，判断其输出的标签是否正确，即，带标签的二维样本数据分类正确的概率L_label：

对于训练集中的无标签的二维样本数据，判断输出是否为真实样本，即无标签的二维样本数据不被判别为第k+1类的概率L_unlabel：

对于训练集中的二维伪样本数据，判断输出是否为伪样本，即二维伪样本数据被判别为第k+1类的概率L_fake：

上述式中，P_model(y|x，y＜k+1)表示判别器D的输出为前k类即真实样本的概率；P_model(y＝k+1|x)表示判别器D的输出为第k+1类即伪样本的概率；G_data表示生成器生成的伪样本；P_data表示真实样本；x表示判别器D的输入数据；y表示判别器D的输入数据的标签；x,y～P_data表示输入数据x为带有标签y的，且从P_data中选取的真实样本；x～P_data表示输入数据x为不带标签的，且从P_data中选取的真实样本；x～G_data表示输入数据x为生成器生成的，且从G_data选取的伪样本；E表示期望；

表示将所有带标签的输入数据被判断为真实样本的概率的期望；

表示将所有不带标签的输入数据被判断为真实样本的概率的期望；

表示将所有生成器生成的输入数据被判断为伪样本的概率的期望；

所述生成对抗网络的目标函数包括：判别器D的损失函数L_D和生成器G的损失函数L_G；其中，

所述判别器D的损失函数L_D，具体公式如下式所示：

L_D＝L_label+L_unlabel+L_fake+D_regular；

式中，D_regular表示对判别器D中的所有W^d做的L2正则化；W^d表示判别器D 中的网络参数；

所述生成器G的损失函数L_G，具体公式如下式(11)所示：

L_G＝-L_fake+0.01*G_{feature_matching}；

式中，G_{feature_matching}表示训练过程中生成器G匹配判别器D的中间层上的特征的预期值；判别器D的中间层是指卷积层；

得到所述生成对抗网络的目标函数后，使用反向传播算法对故障诊断模型的模型参数即θ_d和θ_g进行训练，使用Adam算法对模型参数进行更新，所述Adam 算法通过计算梯度的一阶矩估计和二阶矩估计，为不同的模型参数提供独立的自适应学习率，其中，θ_d和θ_g分别为判别器D和生成器G的模型参数；

上述式中，α、β₁、β₂均为Adam优化器参数；

均为故障诊断模型的整体网络模型参数；

均为用求导数的方式找的模型最优点。

本发明的优点在于：

(1)本发明采用小波变换的方法，将时域信号转换为二维图像，通过将一维数据转换为二维图像格式，不仅可以获得原始数据的时域特征，还可以获得原始数据的频域特征，通过小波变换能够充分突出问题某些方面的特征，能对时间和频率进行局部化分析，通过伸缩平移运算对信号逐步进行多尺度细化，最终达到高频处时间细分，低频处频率细分，能自动适应时频信号分析的要求，从而可聚焦到信号的任意细节。

(2)本发明将无监督学习的思想引入到模型的训练过程，通过引入半监督学习，将带标签的二维样本数据的监督学习与无标签的二维样本数据的无监督学习相结合，虽然无标签的二维样本数据并不会提供标签，但是它提供了关于数据分布的一种信息，这使本发明的模型对样本的整体分布有了进一步认识，能够得到新的、更准确的判别器，能够实现在有限的带标签数据的情况下训练得到高精度的故障诊断模型。

(3)本发明使用生成对抗网络的思想，即，将大量无标签的振动数据定义为真，将生成器生成的伪样本数据定义为假，使判断器与生成器相互竞争生成高质量数据，用于对判别器进行辅助训练，提高了分类的性能。

附图说明

图1为本发明的方法的整体示意图。

图2a～2d依次为轴承在滚动体故障、内圈故障、正常、外圈十二点钟位置故障下的振动信号的时域图。

图3a～3d依次为轴承在滚动体故障、内圈故障、正常、外圈十二点钟位置故障下的振动信号的二维格式即二维图像。

图4为本发明的半监督学习深度对抗网络的网络结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

由图1和图2所示，本发明的一种基于半监督学习深度对抗网络的故障诊断方法，包括以下具体步骤：

S1，获取包含有k类轴承故障的样本总集合Y＝{Y₁,Y₂,Y₃,…Y_k}，即Y＝{Y_i}， i＝1,2,3,…k；本实施例中，轴承故障类别k＝50；

Y_i表示第i类轴承故障所对应的样本集合，

即

所述样本数据是指轴承的振动信号，且样本数据为一个维数为H的一维向量；

本实施例中，由图3a～3d所示，依次为轴承滚动体故障、内圈故障、正常、外圈十二点钟位置故障下的振动信号的时域图。本实施例中，截取长度H＝512 的振动时域信号作为训练样本。

S2，利用小波变换将样本数据转换为二维图像格式，得到二维样本数据，转换后的二维图像格式不仅包括振动信号的时域特征，还包括振动信号的频域特征；

所述小波变换的公式，如下式(1)所示：

式(1)中，a表示缩放因子，用于小波函数的伸缩；τ表示平移因子，用于控制小波函数的平移；f(t)表示振动信号即一维向量；t表示时间；ψ(·)表示小波函数；WT(·)表示小波变换。

本实施例中，所采用的小波函数ψ(·)的公式，如下式(2)所示：

式(2)中，选取一维振动信号中的512个时域数据点进行小波变换，且小波变换过程中选取的中心率为0.8125，最后将小波变换后的结果转换为大小为 64×64的黑白图片，即得到振动信号经小波变换后的二维格式。

本实施例中，由图3a～3d所示，依次为轴承在滚动体故障、内圈故障、正常、外圈十二点钟位置故障下的振动信号的二维格式即二维图像。

S3，根据步骤S2所得的二维样本数据，生成训练集和测试集；所述训练集中包括：带标签的二维样本数据，无标签的二维样本数据；所述测试集中包括：无标签的二维样本数据。其中，标签是指轴承故障类别；带标签的二维样本数据和无标签的二维样本数据均为真实样本，且带标签的二维样本数据的数据量远小于无标签的二维样本数据的数据量。

S4，将训练集输入判别器D中，若判别器D的输入为带标签的二维样本数据时，则进行监督学习；若判别器D的输入为无标签的二维样本数据时，则进行无监督学习。

由图4所示，所述判别器D模型结构为：

判别器D由三个卷积模块组成，每个卷积模块均为：首先是一个二维卷积操作即一个卷积层，，其次是一个最大池化层Maxpool，然后接一个批归一化层即BN，最后接一个leakrelu激活函数层；

所述卷积块的形式化表示如下式(3)、(4)所示：

m^d＝Max_pool(W^d*x+b^d)； (3)

h^d＝lrelu(BN(m^d))； (4)

式(3)、(4)中，*表示卷积运算；W^d表示卷积核；b^d表示卷积核偏置； h^d表示卷积运算的结果；上标d用于标识判别器D的参数；Max_pool(·)表示最大池化；BN(·)表示批归一化；relu(·)表示leakrelu激活函数；

所述判别器D的此三个卷积模块的卷积核大小依次为5、3、3，此三个卷积模块的卷积核数目分别为64、128、256。

所述判别器D的输出类别共包括k+1类，判别器D的输出l为一个k+1维的向量，即l＝{l₁,l₂,l₃,…l_k,l_k+1}；其中，前k类均表示判别为真实样本，且分别对应k类轴承故障，即l＝{l₁,l₂,l₃,…l_k,0}；第k+1类表示判别为伪样本，即l＝{l₁,l₂,l₃,…l_k,1}；

为了识别多种对象，本实施例中对判别器D进行了增强，采用softmax函数替换判别器的输出，使判别器成为识别多种对象类型的标准判别器，将判别器的输出l转换为P＝{P₁,P₂,P₃,…P_k,P_k+1}；softmax函数如下式(5)所示：

式(6)中，P_n表示判别器输出结果为第n类的概率；n＝1,2,3…k均表示判别为真实样本，且分别对应k类轴承故障；n＝k+1表示判别为伪样本；e为自然常数，是数学中一个常数,是一个无限不循环小数，且为超越数,其值约为2.71828。

在监督学习阶段，将带标签的二维样本数据输入到判别器D进行监督训练，判别器D的输出为其所判别的标签即故障类别，判断判别器D所输出的标签是否正确。

在无监督学习阶段，将构建一个生成器G与判别器D进行对抗训练，通过借助生成对抗网络的思想实现无监督学习，可以从无标签的二维样本数据中进行学习，只要能够判别出无标签的二维样本数据为真实样本即可达到要求；即，不论输入无标签的二维样本数据的具体故障类别，只要能最大化的输出该无标签的二维样本数据不被判别为第k+1类的概率即可，不需要识别出具体的故障类别。

所述生成器G将随机噪声v映射为伪样本数据，且伪样本数据也为二维图像格式，即将随机噪声v映射为二维伪样本数据；所述生成器G的模型结构如下：

生成器G:v→z，z＝G(v,θ_g)；其中，v表示随机噪声，该随机噪声v为一个n 维的向量；G(·)表示将随机噪声v映射为二维图像格式的伪样本数据的模型；θ_g表示模型参数；z表示输出的二维伪样本数据；

由图4所示，所述生成器G的网络结构为：首先是一个全连接层将原始输入即随机噪声x映射到1024维向量，后面再依次连接四个反卷积模块组成，每个反卷积模块均依次连接包括：一个反卷积层，一个批归一化层即BN，一个relu 激活函数层，一个反卷积层；

所述反卷积模块的形式化表示如下式(6)所示：

式(6)中，

表示反卷积运算；W^θ表示反卷积核；b^θ表示反卷积核偏置； h^θ表示反卷积运算的结果；上标θ用于标识生成器G的参数；BN(·)表示批归一化； relu(·)表示relu激活函数；

所述生成器G的此四个依次连接的反卷积模块中的反卷积核的大小均为5，此四个依次连接的反卷积模块中的反卷积核数目依次为256、128、64、1。

S5，基于判别器D进行的监督学习，以及基于判别器D与生成器G之间的生成对抗网络以进行的无监督学习，构成了基于半监督学习深度对抗网络的故障诊断模型；对该故障诊断模型进行训练：

故障诊断模型的训练分为三部分，分别对以下三个损失函数进行优化：

所述判别器D的损失函数L_D，具体公式如下式(10)所示：

L_D＝L_label+L_unlabel+L_fake+D_regular； (10)

式(10)中，D_regular表示对判别器D中的所有W^d做的L2正则化；W^d表示判别器D中的网络参数；

所述生成器G的损失函数L_G，具体公式如下式(11)所示：

L_G＝-L_fake+0.01*G_{feature_matching}； (11)

式(11)中，G_{feature_matching}表示训练过程中生成器G以匹配判别器D的中间层上的特征的预期值来提高模型的稳定性，希望生成器G生成的伪样本输入至判别器D的每一层结构与真实样本输入至判别器D的每一层结构尽可能相似，判别器D的中间层是指卷积层；例如，假设a(·)为判别器D的中间层激活函数，v是对生成器G输入的噪声，那么G_{feature_matching}即为：

上述式中，α、β₁、β₂均为Adam优化器参数；本实施例中，α＝0.0001，β₁＝0.5， β₂＝0.9。

均为故障诊断模型的整体网络模型参数；

均为用求导数的方式找的模型最优点

S6，得到故障诊断模型的模型参数后，利用测试集对故障诊断模型进行模型测试：在半监督学习中，在无监督学习阶段，无标签的二维样本数据集送入故障诊断模型；在监督学习阶段，少量带标签的二维样本数据集被送入故障诊断模型。实验中的结果为多次实验取平均后的结果。深度学习框架TensorFlow 被用于每种方法实现，然后所有方法都使用Adam算法进行求解。每种方法使用网格搜索的方式寻找合适的超参数，然后记录最佳结果用于比较。为了验证 SACNN的小样本分类的能力，对于每个负载条件，在2005个测试样本的情况下获得最终测试准确度。

本实施例中，不同数量下的带标签的二维样本数据所训练生成的判别器D，对测试集中的各类振动信号的分类精度，如下表1所示：

表1

由表1可知，本发明在少量的带标签的二维样本数据的情况下，所训练生成的判别器D的分类精度能达到98％以上。

以上仅为本发明创造的较佳实施例而已，并不用以限制本发明创造，凡在本发明创造的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明创造的保护范围之内。

Claims

1.一种基于半监督学习深度对抗网络的故障诊断方法，其特征在于，包括以下步骤：

S1，获取包含有k类轴承故障的样本总集合Y＝{Y₁,Y₂,Y₃,…Y_k}，即Y＝{Y_i}，i＝1,2,3,…k；

Y_i表示第i类轴承故障所对应的样本集合，

即

在无监督学习阶段，构建一个生成器G与判别器D进行对抗训练，借助生成对抗网络进行无监督学习；所述生成器G将随机噪声v映射为伪样本数据，且伪样本数据也为二维图像格式，即将随机噪声v映射为二维伪样本数据；所述生成器G的模型结构如下：生成器G:v→z，z＝G(v,θ_g)；其中，G(·)表示将随机噪声v映射为二维图像格式的伪样本数据的模型，θ_g表示模型参数，z表示输出的伪样本数据；将无标签的二维样本数据和二维伪样本数据输入到判别器D进行无监督学习，判别器D能够判别出无标签的二维样本数据为真实样本即可达到要求；即，不论输入无标签的二维样本数据的具体故障类别，判别器D只要能够输出该无标签的二维样本数据为真实样本即可达到要求；

2.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法，其特征在于，步骤S2中，利用小波变换将样本数据转换为二维图像格式，得到二维样本数据；

所述小波变换的公式，如下式所示：

式中，a表示缩放因子，用于小波函数的伸缩；τ表示平移因子，用于控制小波函数的平移；f(t)表示振动信号即一维向量；t表示时间；ψ(·)表示小波函数；WT(·)表示小波变换；

小波函数ψ(·)的公式，如下式所示：

3.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法，其特征在于，步骤S4中，所述生成器G的网络结构为：首先是一个全连接层将原始输入即随机噪声v映射到1024维向量，后面再依次连接四个反卷积模块组成，每个反卷积模块均依次连接包括：一个反卷积层，一个批归一化层即BN，一个relu激活函数层；

所述反卷积模块的形式化表示如下式所示：

式中，

表示反卷积运算；W^g表示反卷积核；b^g表示反卷积核偏置；h^θ表示反卷积运算的结果；上标g用于标识生成器G的参数；BN(·)表示批归一化；relu(·)表示relu激活函数；

4.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法，其特征在于，步骤S4中，所述判别器D模型结构为：判别器D由三个卷积模块组成，每个卷积模块均为：首先是一个二维卷积操作即一个卷积层，其次是一个最大池化层Maxpool，然后接一个批归一化层即BN，最后接一个leakrelu激活函数层；

所述卷积模块的形式化表示如下式所示：

m^d＝Max_pool(W^d*x+b^d)；

h^d＝lrelu(BN(m^d))；

式中，*表示卷积运算；W^d表示卷积核；b^d表示卷积核偏置；h^d表示卷积运算的结果；上标d用于标识判别器D的参数；Max_pool(·)表示最大池化；BN(·)表示批归一化；relu(·)表示leakrelu激活函数；

5.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法，其特征在于，步骤S4中，所述判别器D的输出类别共包括k+1类，判别器D的输出l为一个k+1维的向量，即l＝{l₁,l₂,l₃,…l_k,l_k+1}；其中，前k类均表示判别为真实样本，且分别对应k类轴承故障，即l＝{l₁,l₂,l₃,…l_k,0}；第k+1类表示判别为伪样本，即l＝{l₁,l₂,l₃,…l_k,1}。

6.根据权利要求5所述的一种基于半监督学习深度对抗网络的故障诊断方法，其特征在于，步骤S4中，采用softmax函数替换判别器的输出，将判别器的输出l转换为P＝{P₁,P₂,P₃,…P_k,P_k+1}；softmax函数如下式所示：