CN110823574B - 一种基于半监督学习深度对抗网络的故障诊断方法 - Google Patents

一种基于半监督学习深度对抗网络的故障诊断方法 Download PDF

Info

Publication number
CN110823574B
CN110823574B CN201910938231.XA CN201910938231A CN110823574B CN 110823574 B CN110823574 B CN 110823574B CN 201910938231 A CN201910938231 A CN 201910938231A CN 110823574 B CN110823574 B CN 110823574B
Authority
CN
China
Prior art keywords
discriminator
dimensional
sample data
data
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910938231.XA
Other languages
English (en)
Other versions
CN110823574A (zh
Inventor
徐娟
史永方
任子晖
刘磊
赵玉坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Jiaoxin Technology Co ltd
Hefei University of Technology
Original Assignee
Anhui Fuhuang Technology Co ltd
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Fuhuang Technology Co ltd, Hefei University of Technology filed Critical Anhui Fuhuang Technology Co ltd
Priority to CN201910938231.XA priority Critical patent/CN110823574B/zh
Publication of CN110823574A publication Critical patent/CN110823574A/zh
Application granted granted Critical
Publication of CN110823574B publication Critical patent/CN110823574B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于半监督学习深度对抗网络的故障诊断方法,获取不同工作故障下轴承的振动信号,将故障轴承的振动时域信号进行小波变换为二维图像;通过生成对抗网络对少量有标签的数据进行监督学习,对大量无标签的数据进行无监督训练,用卷积神经网络提取高维特征实现数据的分类,从而识别轴承的故障类别。本发明实现了在有限的带标签数据的情况下训练得到高精度的故障诊断模型,得到更准确的判别器,从而能够基于滚动轴承的振动信号进行精准故障诊断。

Description

一种基于半监督学习深度对抗网络的故障诊断方法
技术领域
本发明涉及滚动轴承振动信号处理技术领域,尤其是一种基于半监督学习 深度对抗网络的故障诊断方法。
背景技术
研究先进的机械故障诊断方法是保障设备与人员安全的重要内容,其中, 轴承是旋转机械中最为重要的机械零件之一,广泛应用于电力、化工、冶金、 航空等各个重要领域,同时轴承也是最容易损坏的元件之一,轴承性能和工况 的好坏会直接影响到整台机器设备的性能,轴承性能和工况的缺陷会导致设备 产生异常振动和噪声,甚至造成设备损坏。因此,对滚动轴承进行故障诊断, 尤其对滚动轴承早期故障的分析,尤为重要。
现有技术中,深度学习理论以其强大的建模和表征能力成为数据驱动的智 能故障诊断领域中最活跃的研究方向之一,基于深度学习的故障诊断框架具有 强大的特征学习能力,能够通过多个隐藏层直接从原始传感器数据中学习分层 表示,并自动选择有利于识别的特征,准确的进行故障分类。但是,使用深度 学习训练故障分类模型需要提供大量带有标签的样本数据,然而在实际工况下, 虽然能够采集到的大量的振动数据,但大部分振动数据不带有标签,针对每种 故障下都收集大量带有标签的振动数据是不现实的。因此,基于深度学习的故 障诊断方法不适用于对滚动轴承进行故障诊断。
发明内容
为了克服上述现有技术中的缺陷,本发明提供一种基于半监督学习深度对 抗网络的故障诊断方法,实现了在有限的带标签数据的情况下训练得到高精度 的故障诊断模型,得到更准确的判别器,从而能够基于滚动轴承的振动信号进 行精准故障诊断。
为实现上述目的,本发明采用以下技术方案,包括:
一种基于半监督学习深度对抗网络的故障诊断方法,括以下步骤:
S1,获取包含有k类轴承故障的样本总集合Y={Y1,Y2,Y3,…Yk},即Y={Yi}, i=1,2,3,…k;
Yi表示第i类轴承故障所对应的样本集合,
Figure BDA0002222157940000021
Figure BDA0002222157940000022
Figure BDA0002222157940000023
Figure BDA0002222157940000024
表示第i类轴承故障所对应的样本集合Yi中的第j个样本数据;
所述样本数据是指轴承的振动信号,且样本数据为一维向量;
S2,将样本数据转换为二维图像格式,得到二维样本数据,转换后的二维 图像格式不仅包括振动信号的时域特征,还包括振动信号的频域特征;
S3,根据步骤S2所得的二维样本数据生成训练集;所述训练集中包括:带 标签的二维样本数据,无标签的二维样本数据;其中,标签是指轴承故障类别; 带标签的二维样本数据和无标签的二维样本数据均为真实样本;
S4,将训练集输入判别器D中,若判别器D的输入为带标签的二维样本数据 时,则进行监督学习;若判别器D的输入为无标签的二维样本数据时,则进行 无监督学习;
在监督学习阶段,将带标签的二维样本数据输入到判别器D进行监督学习, 判别器D能够判别出带标签的二维样本数据的标签即故障类别即可达到要求;
在无监督学习阶段,构建一个生成器G与判别器D进行对抗训练,借助生成 对抗网络进行无监督学习;所述生成器G将随机噪声v映射为伪样本数据,且伪 样本数据也为二维图像格式,即将随机噪声v映射为二维伪样本数据;所述生成 器G的模型结构如下:生成器G:v→z,z=G(v,θg);其中,G(·)表示将随机噪声v 映射为二维图像格式的伪样本数据的模型,θg表示模型参数,z表示输出的伪样 本数据;将无标签的二维样本数据和二维伪样本数据输入到判别器D进行无监 督学习,判别器D能够判别出无标签的二维样本数据为真实样本即可达到要求; 即,不论输入无标签的二维样本数据的具体故障类别,判别器D只要能够输出 该无标签的二维样本数据为真实样本即可达到要求;
S5,基于判别器D进行的监督学习,以及基于判别器D与生成器G之间的生 成对抗网络以进行的无监督学习,构成了基于半监督学习深度对抗网络的故障 诊断模型,并对该故障诊断模型进行训练;
S6,对训练完成后的故障诊断模型进行模型测试,以对判别器D进行优化;
S7,后续的,已知轴承的振动信号后,即可利用优化后的判别器D进行故 障诊断。
步骤S2中,利用小波变换将样本数据转换为二维图像格式,得到二维样本 数据;
所述小波变换的公式,如下式所示:
Figure BDA0002222157940000031
式中,a表示缩放因子,用于小波函数的伸缩;τ表示平移因子,用于控制 小波函数的平移;f(t)表示振动信号即一维向量;t表示时间;ψ(·)表示小波函数; WT(·)表示小波变换;
小波函数ψ(·)的公式,如下式所示:
Figure BDA0002222157940000032
步骤S4中,所述生成器G的网络结构为:首先是一个全连接层将原始输入 即随机噪声x映射到1024维向量,后面再依次连接四个反卷积模块组成,每个 反卷积模块均依次连接包括:一个反卷积层,一个批归一化层即BN,一个relu激 活函数层;
所述反卷积模块的形式化表示如下式所示:
Figure BDA0002222157940000033
式中,
Figure BDA0002222157940000034
表示反卷积运算;Wg表示反卷积核;bg表示反卷积核偏置;hθ表 示反卷积运算的结果;上标g用于标识生成器G的参数;BN(·)表示批归一化; relu(·)表示relu激活函数;
此四个依次连接的反卷积模块中的反卷积核的大小均为5,此四个依次连接 的反卷积模块中的反卷积核数目依次为256、128、64、1。
步骤S4中,所述判别器D模型结构为:判别器D由三个卷积模块组成,每 个卷积模块均为:首先是一个二维卷积操作即一个卷积层,其次是一个最大池 化层Maxpool,然后接一个批归一化层即BN,最后接一个leakrelu激活函数层;
所述卷积块的形式化表示如下式所示:
md=Max_pool(Wd*x+bd);
hd=lrelu(BN(md));
式中,*表示卷积运算;Wd表示卷积核;bd表示卷积核偏置;hd表示卷积 运算的结果;上标d用于标识判别器D的参数;Max_pool(·)表示最大池化;BN(·) 表示批归一化;relu(·)表示leakrelu激活函数;
此三个卷积模块的卷积核大小依次为5、3、3,此三个卷积模块的卷积核数 目分别为64、128、256。
步骤S4中,所述判别器D的输出类别共包括k+1类,判别器D的输出l为一 个k+1维的向量,即l={l1,l2,l3,…lk,lk+1};其中,前k类均表示判别为真实样本,且 分别对应k类轴承故障,即l={l1,l2,l3,…lk,0};第k+1类表示判别为伪样本,即 l={l1,l2,l3,…lk,1}。
步骤S4中,采用softmax函数替换判别器的输出,将判别器的输出l转换 为P={P1,P2,P3,…Pk,Pk+1};softmax函数如下式所示:
Figure BDA0002222157940000041
式中,Pn表示判别器输出结果为第n类的概率;n=1,2,3…k均表示判别为真 实样本,且分别对应k类轴承故障;n=k+1表示判别为伪样本;e为自然常数。
步骤S5中,故障诊断模型的训练分为三部分,分别对以下三个损失函数进 行优化:
对于训练集中的带标签的二维样本数据,判断其输出的标签是否正确,即, 带标签的二维样本数据分类正确的概率Llabel
Figure BDA0002222157940000042
对于训练集中的无标签的二维样本数据,判断输出是否为真实样本,即无 标签的二维样本数据不被判别为第k+1类的概率Lunlabel
Figure BDA0002222157940000043
对于训练集中的二维伪样本数据,判断输出是否为伪样本,即二维伪样本 数据被判别为第k+1类的概率Lfake
Figure BDA0002222157940000051
上述式中,Pmodel(y|x,y<k+1)表示判别器D的输出为前k类即真实样本的概 率;Pmodel(y=k+1|x)表示判别器D的输出为第k+1类即伪样本的概率;Gdata表示生 成器生成的伪样本;Pdata表示真实样本;x表示判别器D的输入数据;y表示判 别器D的输入数据的标签;x,y~Pdata表示输入数据x为带有标签y的,且从Pdata中 选取的真实样本;x~Pdata表示输入数据x为不带标签的,且从Pdata中选取的真实 样本;x~Gdata表示输入数据x为生成器生成的,且从Gdata选取的伪样本;E表示 期望;
Figure BDA0002222157940000053
表示将所有带标签的输入数据被判断为真实样本的概率的期望;
Figure BDA0002222157940000054
表示将所有不带标签的输入数据被判断为真实样本的概率的期望;
Figure BDA0002222157940000055
表示将所有生成器生成的输入数据被判断为伪样本的概率的期望;
所述生成对抗网络的目标函数包括:判别器D的损失函数LD和生成器G的 损失函数LG;其中,
所述判别器D的损失函数LD,具体公式如下式所示:
LD=Llabel+Lunlabel+Lfake+Dregular
式中,Dregular表示对判别器D中的所有Wd做的L2正则化;Wd表示判别器D 中的网络参数;
所述生成器G的损失函数LG,具体公式如下式(11)所示:
LG=-Lfake+0.01*Gfeature_matching
式中,Gfeature_matching表示训练过程中生成器G匹配判别器D的中间层上的特征 的预期值;判别器D的中间层是指卷积层;
得到所述生成对抗网络的目标函数后,使用反向传播算法对故障诊断模型 的模型参数即θd和θg进行训练,使用Adam算法对模型参数进行更新,所述Adam 算法通过计算梯度的一阶矩估计和二阶矩估计,为不同的模型参数提供独立的 自适应学习率,其中,θd和θg分别为判别器D和生成器G的模型参数;
Figure BDA0002222157940000052
Figure BDA0002222157940000061
Figure BDA0002222157940000062
上述式中,α、β1、β2均为Adam优化器参数;
Figure BDA0002222157940000063
均为故障诊断模型的 整体网络模型参数;
Figure BDA0002222157940000064
均为用求导数的方式找的模型最优点。
本发明的优点在于:
(1)本发明采用小波变换的方法,将时域信号转换为二维图像,通过将一 维数据转换为二维图像格式,不仅可以获得原始数据的时域特征,还可以获得 原始数据的频域特征,通过小波变换能够充分突出问题某些方面的特征,能对 时间和频率进行局部化分析,通过伸缩平移运算对信号逐步进行多尺度细化, 最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求, 从而可聚焦到信号的任意细节。
(2)本发明将无监督学习的思想引入到模型的训练过程,通过引入半监督 学习,将带标签的二维样本数据的监督学习与无标签的二维样本数据的无监督 学习相结合,虽然无标签的二维样本数据并不会提供标签,但是它提供了关于 数据分布的一种信息,这使本发明的模型对样本的整体分布有了进一步认识, 能够得到新的、更准确的判别器,能够实现在有限的带标签数据的情况下训练 得到高精度的故障诊断模型。
(3)本发明使用生成对抗网络的思想,即,将大量无标签的振动数据定义 为真,将生成器生成的伪样本数据定义为假,使判断器与生成器相互竞争生成 高质量数据,用于对判别器进行辅助训练,提高了分类的性能。
附图说明
图1为本发明的方法的整体示意图。
图2a~2d依次为轴承在滚动体故障、内圈故障、正常、外圈十二点钟位置 故障下的振动信号的时域图。
图3a~3d依次为轴承在滚动体故障、内圈故障、正常、外圈十二点钟位置 故障下的振动信号的二维格式即二维图像。
图4为本发明的半监督学习深度对抗网络的网络结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造 性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由图1和图2所示,本发明的一种基于半监督学习深度对抗网络的故障诊 断方法,包括以下具体步骤:
S1,获取包含有k类轴承故障的样本总集合Y={Y1,Y2,Y3,…Yk},即Y={Yi}, i=1,2,3,…k;本实施例中,轴承故障类别k=50;
Yi表示第i类轴承故障所对应的样本集合,
Figure BDA0002222157940000071
Figure BDA0002222157940000072
Figure BDA0002222157940000073
Figure BDA0002222157940000074
表示第i类轴承故障所对应的样本集合Yi中的第j个样本数据;
所述样本数据是指轴承的振动信号,且样本数据为一个维数为H的一维向 量;
本实施例中,由图3a~3d所示,依次为轴承滚动体故障、内圈故障、正常、 外圈十二点钟位置故障下的振动信号的时域图。本实施例中,截取长度H=512 的振动时域信号作为训练样本。
S2,利用小波变换将样本数据转换为二维图像格式,得到二维样本数据, 转换后的二维图像格式不仅包括振动信号的时域特征,还包括振动信号的频域 特征;
所述小波变换的公式,如下式(1)所示:
Figure BDA0002222157940000075
式(1)中,a表示缩放因子,用于小波函数的伸缩;τ表示平移因子,用 于控制小波函数的平移;f(t)表示振动信号即一维向量;t表示时间;ψ(·)表示小 波函数;WT(·)表示小波变换。
本实施例中,所采用的小波函数ψ(·)的公式,如下式(2)所示:
Figure BDA0002222157940000081
式(2)中,选取一维振动信号中的512个时域数据点进行小波变换,且小 波变换过程中选取的中心率为0.8125,最后将小波变换后的结果转换为大小为 64×64的黑白图片,即得到振动信号经小波变换后的二维格式。
本实施例中,由图3a~3d所示,依次为轴承在滚动体故障、内圈故障、正 常、外圈十二点钟位置故障下的振动信号的二维格式即二维图像。
S3,根据步骤S2所得的二维样本数据,生成训练集和测试集;所述训练集 中包括:带标签的二维样本数据,无标签的二维样本数据;所述测试集中包括: 无标签的二维样本数据。其中,标签是指轴承故障类别;带标签的二维样本数 据和无标签的二维样本数据均为真实样本,且带标签的二维样本数据的数据量 远小于无标签的二维样本数据的数据量。
S4,将训练集输入判别器D中,若判别器D的输入为带标签的二维样本数据 时,则进行监督学习;若判别器D的输入为无标签的二维样本数据时,则进行 无监督学习。
由图4所示,所述判别器D模型结构为:
判别器D由三个卷积模块组成,每个卷积模块均为:首先是一个二维卷积 操作即一个卷积层,,其次是一个最大池化层Maxpool,然后接一个批归一化层 即BN,最后接一个leakrelu激活函数层;
所述卷积块的形式化表示如下式(3)、(4)所示:
md=Max_pool(Wd*x+bd); (3)
hd=lrelu(BN(md)); (4)
式(3)、(4)中,*表示卷积运算;Wd表示卷积核;bd表示卷积核偏置; hd表示卷积运算的结果;上标d用于标识判别器D的参数;Max_pool(·)表示最大 池化;BN(·)表示批归一化;relu(·)表示leakrelu激活函数;
所述判别器D的此三个卷积模块的卷积核大小依次为5、3、3,此三个卷积 模块的卷积核数目分别为64、128、256。
所述判别器D的输出类别共包括k+1类,判别器D的输出l为一个k+1维的向 量,即l={l1,l2,l3,…lk,lk+1};其中,前k类均表示判别为真实样本,且分别对应k类 轴承故障,即l={l1,l2,l3,…lk,0};第k+1类表示判别为伪样本,即l={l1,l2,l3,…lk,1};
为了识别多种对象,本实施例中对判别器D进行了增强,采用softmax函 数替换判别器的输出,使判别器成为识别多种对象类型的标准判别器,将判别 器的输出l转换为P={P1,P2,P3,…Pk,Pk+1};softmax函数如下式(5)所示:
Figure BDA0002222157940000091
式(6)中,Pn表示判别器输出结果为第n类的概率;n=1,2,3…k均表示判别 为真实样本,且分别对应k类轴承故障;n=k+1表示判别为伪样本;e为自然常 数,是数学中一个常数,是一个无限不循环小数,且为超越数,其值约为2.71828。
在监督学习阶段,将带标签的二维样本数据输入到判别器D进行监督训练, 判别器D的输出为其所判别的标签即故障类别,判断判别器D所输出的标签是否 正确。
在无监督学习阶段,将构建一个生成器G与判别器D进行对抗训练,通过借 助生成对抗网络的思想实现无监督学习,可以从无标签的二维样本数据中进行 学习,只要能够判别出无标签的二维样本数据为真实样本即可达到要求;即, 不论输入无标签的二维样本数据的具体故障类别,只要能最大化的输出该无标 签的二维样本数据不被判别为第k+1类的概率即可,不需要识别出具体的故障类 别。
所述生成器G将随机噪声v映射为伪样本数据,且伪样本数据也为二维图像 格式,即将随机噪声v映射为二维伪样本数据;所述生成器G的模型结构如下:
生成器G:v→z,z=G(v,θg);其中,v表示随机噪声,该随机噪声v为一个n 维的向量;G(·)表示将随机噪声v映射为二维图像格式的伪样本数据的模型;θg表 示模型参数;z表示输出的二维伪样本数据;
由图4所示,所述生成器G的网络结构为:首先是一个全连接层将原始输 入即随机噪声x映射到1024维向量,后面再依次连接四个反卷积模块组成,每 个反卷积模块均依次连接包括:一个反卷积层,一个批归一化层即BN,一个relu 激活函数层,一个反卷积层;
所述反卷积模块的形式化表示如下式(6)所示:
Figure BDA0002222157940000101
式(6)中,
Figure BDA0002222157940000102
表示反卷积运算;Wθ表示反卷积核;bθ表示反卷积核偏置; hθ表示反卷积运算的结果;上标θ用于标识生成器G的参数;BN(·)表示批归一化; relu(·)表示relu激活函数;
所述生成器G的此四个依次连接的反卷积模块中的反卷积核的大小均为5, 此四个依次连接的反卷积模块中的反卷积核数目依次为256、128、64、1。
S5,基于判别器D进行的监督学习,以及基于判别器D与生成器G之间的生 成对抗网络以进行的无监督学习,构成了基于半监督学习深度对抗网络的故障 诊断模型;对该故障诊断模型进行训练:
故障诊断模型的训练分为三部分,分别对以下三个损失函数进行优化:
对于训练集中的带标签的二维样本数据,判断其输出的标签是否正确,即, 带标签的二维样本数据分类正确的概率Llabel
Figure BDA0002222157940000103
对于训练集中的无标签的二维样本数据,判断输出是否为真实样本,即无 标签的二维样本数据不被判别为第k+1类的概率Lunlabel
Figure BDA0002222157940000104
对于训练集中的二维伪样本数据,判断输出是否为伪样本,即二维伪样本 数据被判别为第k+1类的概率Lfake
Figure BDA0002222157940000105
上述式中,Pmodel(y|x,y<k+1)表示判别器D的输出为前k类即真实样本的概 率;Pmodel(y=k+1|x)表示判别器D的输出为第k+1类即伪样本的概率;Gdata表示生 成器生成的伪样本;Pdata表示真实样本;x表示判别器D的输入数据;y表示判 别器D的输入数据的标签;x,y~Pdata表示输入数据x为带有标签y的,且从Pdata中 选取的真实样本;x~Pdata表示输入数据x为不带标签的,且从Pdata中选取的真实 样本;x~Gdata表示输入数据x为生成器生成的,且从Gdata选取的伪样本;E表示 期望;
Figure BDA0002222157940000111
表示将所有带标签的输入数据被判断为真实样本的概率的期望;
Figure BDA0002222157940000112
表示将所有不带标签的输入数据被判断为真实样本的概率的期望;
Figure BDA0002222157940000113
表示将所有生成器生成的输入数据被判断为伪样本的概率的期望;
所述生成对抗网络的目标函数包括:判别器D的损失函数LD和生成器G的 损失函数LG;其中,
所述判别器D的损失函数LD,具体公式如下式(10)所示:
LD=Llabel+Lunlabel+Lfake+Dregular; (10)
式(10)中,Dregular表示对判别器D中的所有Wd做的L2正则化;Wd表示判 别器D中的网络参数;
所述生成器G的损失函数LG,具体公式如下式(11)所示:
LG=-Lfake+0.01*Gfeature_matching; (11)
式(11)中,Gfeature_matching表示训练过程中生成器G以匹配判别器D的中间层 上的特征的预期值来提高模型的稳定性,希望生成器G生成的伪样本输入至判 别器D的每一层结构与真实样本输入至判别器D的每一层结构尽可能相似,判别 器D的中间层是指卷积层;例如,假设a(·)为判别器D的中间层激活函数,v是对 生成器G输入的噪声,那么Gfeature_matching即为:
Figure BDA0002222157940000114
得到所述生成对抗网络的目标函数后,使用反向传播算法对故障诊断模型 的模型参数即θd和θg进行训练,使用Adam算法对模型参数进行更新,所述Adam 算法通过计算梯度的一阶矩估计和二阶矩估计,为不同的模型参数提供独立的 自适应学习率,其中,θd和θg分别为判别器D和生成器G的模型参数;
Figure BDA0002222157940000115
Figure BDA0002222157940000116
Figure BDA0002222157940000117
上述式中,α、β1、β2均为Adam优化器参数;本实施例中,α=0.0001,β1=0.5, β2=0.9。
Figure BDA0002222157940000118
均为故障诊断模型的整体网络模型参数;
Figure BDA0002222157940000119
均为用 求导数的方式找的模型最优点
S6,得到故障诊断模型的模型参数后,利用测试集对故障诊断模型进行模 型测试:在半监督学习中,在无监督学习阶段,无标签的二维样本数据集送入 故障诊断模型;在监督学习阶段,少量带标签的二维样本数据集被送入故障诊 断模型。实验中的结果为多次实验取平均后的结果。深度学习框架TensorFlow 被用于每种方法实现,然后所有方法都使用Adam算法进行求解。每种方法使用 网格搜索的方式寻找合适的超参数,然后记录最佳结果用于比较。为了验证 SACNN的小样本分类的能力,对于每个负载条件,在2005个测试样本的情况下 获得最终测试准确度。
本实施例中,不同数量下的带标签的二维样本数据所训练生成的判别器D, 对测试集中的各类振动信号的分类精度,如下表1所示:
Figure BDA0002222157940000121
表1
由表1可知,本发明在少量的带标签的二维样本数据的情况下,所训练生 成的判别器D的分类精度能达到98%以上。
S7,后续的,已知轴承的振动信号后,即可利用优化后的判别器D进行故 障诊断。
以上仅为本发明创造的较佳实施例而已,并不用以限制本发明创造,凡在 本发明创造的精神和原则之内所作的任何修改、等同替换和改进等,均应包含 在本发明创造的保护范围之内。

Claims (7)

1.一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,包括以下步骤:
S1,获取包含有k类轴承故障的样本总集合Y={Y1,Y2,Y3,…Yk},即Y={Yi},i=1,2,3,…k;
Yi表示第i类轴承故障所对应的样本集合,
Figure FDA0002856154290000011
Figure FDA0002856154290000012
Figure FDA0002856154290000013
Figure FDA0002856154290000014
表示第i类轴承故障所对应的样本集合Yi中的第j个样本数据;
所述样本数据是指轴承的振动信号,且样本数据为一维向量;
S2,将样本数据转换为二维图像格式,得到二维样本数据,转换后的二维图像格式不仅包括振动信号的时域特征,还包括振动信号的频域特征;
S3,根据步骤S2所得的二维样本数据生成训练集;所述训练集中包括:带标签的二维样本数据,无标签的二维样本数据;其中,标签是指轴承故障类别;带标签的二维样本数据和无标签的二维样本数据均为真实样本;
S4,将训练集输入判别器D中,若判别器D的输入为带标签的二维样本数据时,则进行监督学习;若判别器D的输入为无标签的二维样本数据时,则进行无监督学习;
在监督学习阶段,将带标签的二维样本数据输入到判别器D进行监督学习,判别器D能够判别出带标签的二维样本数据的标签即故障类别即可达到要求;
在无监督学习阶段,构建一个生成器G与判别器D进行对抗训练,借助生成对抗网络进行无监督学习;所述生成器G将随机噪声v映射为伪样本数据,且伪样本数据也为二维图像格式,即将随机噪声v映射为二维伪样本数据;所述生成器G的模型结构如下:生成器G:v→z,z=G(v,θg);其中,G(·)表示将随机噪声v映射为二维图像格式的伪样本数据的模型,θg表示模型参数,z表示输出的伪样本数据;将无标签的二维样本数据和二维伪样本数据输入到判别器D进行无监督学习,判别器D能够判别出无标签的二维样本数据为真实样本即可达到要求;即,不论输入无标签的二维样本数据的具体故障类别,判别器D只要能够输出该无标签的二维样本数据为真实样本即可达到要求;
S5,基于判别器D进行的监督学习,以及基于判别器D与生成器G之间的生成对抗网络以进行的无监督学习,构成了基于半监督学习深度对抗网络的故障诊断模型,并对该故障诊断模型进行训练;
S6,对训练完成后的故障诊断模型进行模型测试,以对判别器D进行优化;
S7,后续的,已知轴承的振动信号后,即可利用优化后的判别器D进行故障诊断。
2.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S2中,利用小波变换将样本数据转换为二维图像格式,得到二维样本数据;
所述小波变换的公式,如下式所示:
Figure FDA0002856154290000021
式中,a表示缩放因子,用于小波函数的伸缩;τ表示平移因子,用于控制小波函数的平移;f(t)表示振动信号即一维向量;t表示时间;ψ(·)表示小波函数;WT(·)表示小波变换;
小波函数ψ(·)的公式,如下式所示:
Figure FDA0002856154290000022
3.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S4中,所述生成器G的网络结构为:首先是一个全连接层将原始输入即随机噪声v映射到1024维向量,后面再依次连接四个反卷积模块组成,每个反卷积模块均依次连接包括:一个反卷积层,一个批归一化层即BN,一个relu激活函数层;
所述反卷积模块的形式化表示如下式所示:
Figure FDA0002856154290000023
式中,
Figure FDA0002856154290000024
表示反卷积运算;Wg表示反卷积核;bg表示反卷积核偏置;hθ表示反卷积运算的结果;上标g用于标识生成器G的参数;BN(·)表示批归一化;relu(·)表示relu激活函数;
此四个依次连接的反卷积模块中的反卷积核的大小均为5,此四个依次连接的反卷积模块中的反卷积核数目依次为256、128、64、1。
4.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S4中,所述判别器D模型结构为:判别器D由三个卷积模块组成,每个卷积模块均为:首先是一个二维卷积操作即一个卷积层,其次是一个最大池化层Maxpool,然后接一个批归一化层即BN,最后接一个leakrelu激活函数层;
所述卷积模块的形式化表示如下式所示:
md=Max_pool(Wd*x+bd);
hd=lrelu(BN(md));
式中,*表示卷积运算;Wd表示卷积核;bd表示卷积核偏置;hd表示卷积运算的结果;上标d用于标识判别器D的参数;Max_pool(·)表示最大池化;BN(·)表示批归一化;relu(·)表示leakrelu激活函数;
此三个卷积模块的卷积核大小依次为5、3、3,此三个卷积模块的卷积核数目分别为64、128、256。
5.根据权利要求1所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S4中,所述判别器D的输出类别共包括k+1类,判别器D的输出l为一个k+1维的向量,即l={l1,l2,l3,…lk,lk+1};其中,前k类均表示判别为真实样本,且分别对应k类轴承故障,即l={l1,l2,l3,…lk,0};第k+1类表示判别为伪样本,即l={l1,l2,l3,…lk,1}。
6.根据权利要求5所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S4中,采用softmax函数替换判别器的输出,将判别器的输出l转换为P={P1,P2,P3,…Pk,Pk+1};softmax函数如下式所示:
Figure FDA0002856154290000031
式中,Pn表示判别器输出结果为第n类的概率;n=1,2,3…k均表示判别为真实样本,且分别对应k类轴承故障;n=k+1表示判别为伪样本;e为自然常数。
7.根据权利要求6所述的一种基于半监督学习深度对抗网络的故障诊断方法,其特征在于,步骤S5中,故障诊断模型的训练分为三部分,分别对以下三个损失函数进行优化:
对于训练集中的带标签的二维样本数据,判断其输出的标签是否正确,即,带标签的二维样本数据分类正确的概率Llabel
Figure FDA0002856154290000041
对于训练集中的无标签的二维样本数据,判断输出是否为真实样本,即无标签的二维样本数据不被判别为第k+1类的概率Lunlabel
Figure FDA0002856154290000042
对于训练集中的二维伪样本数据,判断输出是否为伪样本,即二维伪样本数据被判别为第k+1类的概率Lfake
Figure FDA0002856154290000043
上述式中,Pmodel(y|x,y<k+1)表示判别器D的输出为前k类即真实样本的概率;Pmodel(y=k+1|x)表示判别器D的输出为第k+1类即伪样本的概率;Gdata表示生成器生成的伪样本;Pdata表示真实样本;x表示判别器D的输入数据;y表示判别器D的输入数据的标签;x,y~Pdata表示输入数据x为带有标签y的,且从Pdata中选取的真实样本;x~Pdata表示输入数据x为不带标签的,且从Pdata中选取的真实样本;x~Gdata表示输入数据x为生成器生成的,且从Gdata选取的伪样本;E表示期望;
Figure FDA0002856154290000044
表示将所有带标签的输入数据被判断为真实样本的概率的期望;
Figure FDA0002856154290000045
表示将所有不带标签的输入数据被判断为真实样本的概率的期望;
Figure FDA0002856154290000046
表示将所有生成器生成的输入数据被判断为伪样本的概率的期望;
所述生成对抗网络的目标函数包括:判别器D的损失函数LD和生成器G的损失函数LG;其中,
所述判别器D的损失函数LD,具体公式如下式所示:
LD=Llabel+Lunlabel+Lfake+Dregular
式中,Dregular表示对判别器D中的所有Wd做的L2正则化;Wd表示判别器D中的网络参数;
所述生成器G的损失函数LG,具体公式如下式所示:
LG=-Lfake+0.01*Gfeature_matching
式中,Gfeature_matching表示训练过程中生成器G匹配判别器D的中间层上的特征的预期值;判别器D的中间层是指卷积层;
得到所述生成对抗网络的目标函数后,使用反向传播算法对故障诊断模型的模型参数即θd和θg进行训练,使用Adam算法对模型参数进行更新,所述Adam算法通过计算梯度的一阶矩估计和二阶矩估计,为不同的模型参数提供独立的自适应学习率,其中,θd和θg分别为判别器D和生成器G的模型参数;
Figure FDA0002856154290000051
Figure FDA0002856154290000052
Figure FDA0002856154290000053
上述式中,α、β1、β2均为Adam优化器参数;
Figure FDA0002856154290000054
均为故障诊断模型的整体网络模型参数;
Figure FDA0002856154290000055
均为用求导数的方式找的模型最优点。
CN201910938231.XA 2019-09-30 2019-09-30 一种基于半监督学习深度对抗网络的故障诊断方法 Active CN110823574B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910938231.XA CN110823574B (zh) 2019-09-30 2019-09-30 一种基于半监督学习深度对抗网络的故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910938231.XA CN110823574B (zh) 2019-09-30 2019-09-30 一种基于半监督学习深度对抗网络的故障诊断方法

Publications (2)

Publication Number Publication Date
CN110823574A CN110823574A (zh) 2020-02-21
CN110823574B true CN110823574B (zh) 2021-04-06

Family

ID=69548479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910938231.XA Active CN110823574B (zh) 2019-09-30 2019-09-30 一种基于半监督学习深度对抗网络的故障诊断方法

Country Status (1)

Country Link
CN (1) CN110823574B (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111238815B (zh) * 2020-02-26 2022-05-06 中国民航大学 一种样本不平衡下基于数据增强的轴承故障识别方法
CN111275024B (zh) * 2020-03-22 2023-03-21 东北电力大学 含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法
CN111563455B (zh) * 2020-05-08 2023-07-11 南昌工程学院 基于时间序列信号和压缩卷积神经网络的伤损识别方法
CN111754478A (zh) * 2020-06-22 2020-10-09 怀光智能科技(武汉)有限公司 一种基于生成对抗网络的无监督域适应系统及方法
CN111832428B (zh) * 2020-06-23 2024-02-23 北京科技大学 一种应用于冷轧轧机断带故障诊断的数据增强方法
CN111814689B (zh) * 2020-07-09 2024-08-20 浙江大华技术股份有限公司 火灾识别网络模型的训练方法、火灾识别方法及相关设备
CN112039687A (zh) * 2020-07-14 2020-12-04 南京邮电大学 一种面向小样本特征的基于改进生成对抗网络的故障诊断方法
CN111982268A (zh) * 2020-08-24 2020-11-24 南通理工学院 一种齿轮箱便携式振动监测装置及其监测方法
CN112417954B (zh) * 2020-10-13 2022-12-16 同济大学 一种面向小样本数据集的轴承故障模式诊断方法及系统
CN112308038B (zh) * 2020-11-25 2022-09-27 哈尔滨工业大学 基于课堂式生成对抗网络模型的机械设备故障信号识别方法
CN112835709B (zh) * 2020-12-17 2023-09-22 华南理工大学 基于生成对抗网络的云负载时序数据生成方法、系统和介质
CN112649198B (zh) * 2021-01-05 2023-04-18 西交思创智能科技研究院(西安)有限公司 类不平衡滚动轴承智能故障诊断方法、系统、设备及应用
CN112991579B (zh) * 2021-01-14 2021-12-07 北京航空航天大学 一种基于生成对抗网络的直升机动部件异常检测方法
CN112729835B (zh) * 2021-01-30 2022-06-03 温州大学 一种轴向柱塞泵轴承的多域半监督故障诊断方法及装置
CN113128338B (zh) * 2021-03-15 2024-02-02 西安理工大学 一种小样本下印刷机滚筒故障的智能诊断方法
CN113177609A (zh) * 2021-05-21 2021-07-27 中国工商银行股份有限公司 数据类别不均衡的处理方法及设备、系统、存储介质
CN113324758B (zh) * 2021-05-27 2022-08-09 西安交通大学 一种基于半监督对抗网络的轴承故障诊断方法
CN113376516A (zh) * 2021-06-07 2021-09-10 科润智能控制股份有限公司 一种基于深度学习的中压真空断路器运行故障自诊断与预警方法
CN113624466B (zh) * 2021-07-08 2023-10-03 中南民族大学 汽轮机转子故障诊断方法、装置、设备及存储介质
CN113569685A (zh) * 2021-07-20 2021-10-29 华中科技大学 机床主轴轴承故障诊断模型建立、故障诊断方法和系统
CN113269174B (zh) * 2021-07-21 2021-10-12 北京航空航天大学 一种基于扩展卷积对抗自编码器的电作动器故障诊断测试方法
CN113721113B (zh) * 2021-09-02 2023-10-24 广西大学 一种基于半监督生成对抗网络的故障选线方法
CN114062511B (zh) * 2021-10-24 2024-09-17 北京化工大学 一种基于单传感器的航空发动机早期损伤声发射智能识别方法
CN114266339B (zh) * 2021-12-13 2024-09-03 南京理工大学 一种基于小样本和gaf-dcgan的滚动轴承故障诊断方法
CN114400940B (zh) * 2021-12-16 2023-06-13 湖南大学 电动汽车用永磁驱动电机退磁故障诊断方法及电动汽车
CN114383846B (zh) * 2022-01-06 2023-06-30 合肥工业大学 基于故障标签信息向量的轴承复合故障诊断方法
CN117807426B (zh) * 2023-11-20 2024-10-18 山东科技大学 一种注意力引导下多小波对抗网络的故障诊断方法及系统
CN117493980B (zh) * 2023-12-29 2024-03-19 合肥工业大学 一种集成特征提取和排序因果发现的轴承故障诊断方法
CN117669388B (zh) * 2024-01-30 2024-05-31 武汉理工大学 故障样本生成方法、装置、计算机介质
CN117875421B (zh) * 2024-03-13 2024-05-17 中国水利水电第一工程局有限公司 基于深度学习的光伏阵列故障诊断方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169611A (ja) * 2000-11-30 2002-06-14 Yaskawa Electric Corp 故障診断システムおよびその自動設計方法
CN108304927A (zh) * 2018-01-25 2018-07-20 清华大学 基于深度学习的轴承故障模式诊断方法及系统
CN109100142B (zh) * 2018-06-26 2019-09-13 北京交通大学 一种基于图论的轴承半监督故障诊断方法
CN109582003B (zh) * 2018-12-03 2021-04-20 东北林业大学 基于伪标签半监督核局部费舍尔判别分析轴承故障诊断方法
CN110110745A (zh) * 2019-03-29 2019-08-09 上海海事大学 基于生成对抗网络的半监督x光图像自动标注
CN110097103A (zh) * 2019-04-22 2019-08-06 西安电子科技大学 基于生成对抗网络的半监督图像分类方法

Also Published As

Publication number Publication date
CN110823574A (zh) 2020-02-21

Similar Documents

Publication Publication Date Title
CN110823574B (zh) 一种基于半监督学习深度对抗网络的故障诊断方法
Li et al. Multiscale local features learning based on BP neural network for rolling bearing intelligent fault diagnosis
CN113191215B (zh) 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法
CN110443293B (zh) 基于双判别生成对抗网络文本重构的零样本图像分类方法
CN110045015B (zh) 一种基于深度学习的混凝土结构内部缺陷检测方法
CN111046900A (zh) 基于局部流形正则化的半监督生成对抗网络图像分类方法
Zhang et al. A class-aware supervised contrastive learning framework for imbalanced fault diagnosis
CN114019467B (zh) 一种基于MobileNet模型迁移学习的雷达信号识别与定位方法
Wang et al. An efficient incremental learning of bearing fault imbalanced data set via filter StyleGAN
Fu et al. Rolling bearing fault diagnosis in limited data scenarios using feature enhanced generative adversarial networks
CN111428772B (zh) 基于k-近邻自适应投票的光伏系统深度异常检测方法
Felix et al. Multi-modal ensemble classification for generalized zero shot learning
CN112257741A (zh) 一种基于复数神经网络的生成性对抗虚假图片的检测方法
CN111461162B (zh) 一种零样本目标检测模型及其建立方法
Zhao et al. Fault diagnosis based on space mapping and deformable convolution networks
CN116152678A (zh) 小样本条件下基于孪生神经网络的海洋承灾体识别方法
CN114491823A (zh) 一种基于改进生成对抗网络的列车轴承故障诊断方法
Wang et al. Data-Augmentation Based CBAM-ResNet-GCN Method for Unbalance Fault Diagnosis of Rotating Machinery
Ning et al. Infrared object recognition based on monogenic features and multiple kernel learning
CN114383846B (zh) 基于故障标签信息向量的轴承复合故障诊断方法
CN114814436A (zh) 一种三电平逆变器故障诊断方法及装置
Jiang et al. An enhancement generative adversarial networks based on feature moving for solar panel defect identification
Ma et al. An optical image-aided approach for zero-shot SAR image scene classification
CN115115585A (zh) 一种电缆故障诊断方法、系统及可读存储介质
CN113421212A (zh) 一种医学影像的增强方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 230088 Anhui city of Hefei province No. 669 Changjiang West Road Branch Investment Building 9 floor

Patentee after: Anhui Jiaoxin Technology Co.,Ltd.

Patentee after: Hefei University of Technology

Address before: 230088 Anhui city of Hefei province No. 669 Changjiang West Road Branch Investment Building 9 floor

Patentee before: ANHUI FUHUANG TECHNOLOGY Co.,Ltd.

Patentee before: Hefei University of Technology

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20220223

Address after: Tunxi road in Baohe District of Hefei city of Anhui Province, No. 193 230009

Patentee after: Hefei University of Technology

Address before: 230088 Anhui city of Hefei province No. 669 Changjiang West Road Branch Investment Building 9 floor

Patentee before: Anhui Jiaoxin Technology Co.,Ltd.

Patentee before: Hefei University of Technology

TR01 Transfer of patent right