CN112380767B - 基于改进型生成对抗网络的设备故障诊断方法及系统 - Google Patents

基于改进型生成对抗网络的设备故障诊断方法及系统 Download PDF

Info

Publication number
CN112380767B
CN112380767B CN202011256522.XA CN202011256522A CN112380767B CN 112380767 B CN112380767 B CN 112380767B CN 202011256522 A CN202011256522 A CN 202011256522A CN 112380767 B CN112380767 B CN 112380767B
Authority
CN
China
Prior art keywords
fault
diagnosed
layer
equipment
countermeasure network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011256522.XA
Other languages
English (en)
Other versions
CN112380767A (zh
Inventor
李沂滨
韩庆阳
贾磊
宋艳
王代超
郭庆稳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202011256522.XA priority Critical patent/CN112380767B/zh
Publication of CN112380767A publication Critical patent/CN112380767A/zh
Application granted granted Critical
Publication of CN112380767B publication Critical patent/CN112380767B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Geometry (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明公开了基于改进型生成对抗网络的设备故障诊断方法及系统,获取待诊断设备故障信号;基于待诊断设备故障信号,获取待诊断噪声信号;对待诊断噪声信号进行随机采样,得到具有不同均值和方差的随机噪声;基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型。新提出的网络模型一定程度上解决了模态崩溃和训练不稳定的问题,提高了生成样本的多样性,模型的生成器可以生成高质量的样本,既包含了原始故障样本的特征,同时也生成了新的特征。

Description

基于改进型生成对抗网络的设备故障诊断方法及系统
技术领域
本申请涉及设备故障诊断技术领域,特别是涉及基于改进型生成对抗网络的设备故障诊断方法及系统。
背景技术
本部分的陈述仅仅是提到了与本申请相关的背景技术,并不必然构成现有技术。
在现代工业中,机械设备的健康是非常重要的。但是,一旦机械设备在工程应用中出现故障,就会造成巨大的经济损失,危及工人的安全。它甚至会对整个项目产生严重的影响。因此,利用有效的故障诊断技术提高机械设备的安全性和可靠性显得尤为重要。
故障诊断技术为提高系统的可靠性、可维护性和有效性开辟了一条新的途径。故障诊断技术是指在系统运行状态或工作状态下,通过各种监测手段判别其工作是否正常。故障诊断的任务就是当系统某一部位出现某种故障时,要从这些状态及其参数的变化推断出导致这些变化的故障及其所在部位,从已知征兆判定存在的故障的类型及其所在部位。
由于旋转机械是机械设备的重要组成部分,旋转机械的故障诊断和状态监测越来越受到社会的重视。在过去的几年中,随着越来越多的电流和振动信号数据的可用,许多数据驱动算法已经被研究来解决故障诊断问题。随着人工智能的不断发展,深度学习方法被广泛应用于图像处理、多模态图形、游戏制作等领域。它在网络安全和自动驾驶中也有重要的应用。例如,卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network)被用于图像识别、图像复原、自然语言处理、计算机视觉等。近年来,深度学习的相关算法也被应用到旋转机械的故障诊断中。
然而,由于运行条件的不稳定、环境噪声的干扰以及各种不可识别的复杂故障模式,实际故障数据的采集受到限制,导致缺乏带标签的真实故障数据。因此,利用机器学习和部分深度学习方法难以实现高精度故障诊断。Goodfellow等人在2014年提出了生成对抗网络(Generative Adversarial Networks),也称为GAN。该网络分别训练了鉴别器模型和生成器模型。生成器模型负责获取真实数据的分布,鉴别器模型负责判断输入的数据来自生成器还是真实样本。近几年来,人们尝试将生成对抗网络应用于故障诊断,通过扩充数据集来提高故障诊断准确性。然而,由于GAN网络自身训练存在不稳定以及模态崩溃的问题,可能会导致生成器只能捕捉部分模态,从而影响生成样本的多样性,最终影响故障诊断的准确性。
然而,发明人发现尽管目前人们尝试使用生成对抗网络进行故障诊断,但是它也存在两个主要的问题,也是本案要解决的两个技术问题:
1)输入噪声单一。在大多数情况下,很多研究输入到GAN网络的生成器中的噪声信号都是固定的分布,一定程度上会影响生成数据的随机性,使得输入到鉴别器中的数据多样性降低,影响模型的泛化能力,从而最终影响故障诊断的准确性。
2)模态崩溃和样本多样性问题。由于GAN自身网络结构的原因,目前的生成对抗网络方法用于故障诊断时会存在模态崩溃和不稳定的问题,影响生成样本的多样性,最终导致故障诊断结果不理想。
发明内容
为了解决现有技术的不足,本申请提供了基于改进型生成对抗网络的设备故障诊断方法及系统;
第一方面,本申请提供了基于改进型生成对抗网络的设备故障诊断方法;
基于改进型生成对抗网络的设备故障诊断方法,包括:
获取待诊断设备故障信号;基于待诊断设备故障信号,获取待诊断噪声信号;
对待诊断噪声信号进行随机采样,得到具有不同均值和方差的随机噪声;
基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型。
第二方面,本申请提供了基于改进型生成对抗网络的设备故障诊断系统;
基于改进型生成对抗网络的设备故障诊断系统,包括:
获取模块,其被配置为:获取待诊断设备故障信号;基于待诊断设备故障信号,获取待诊断噪声信号;
采样模块,其被配置为:对待诊断噪声信号进行随机采样,得到具有不同均值和方差的随机噪声;
输出模块,其被配置为:基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型。
第三方面,本申请还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述第一方面所述的方法。
第四方面,本申请还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
第五方面,本申请还提供了一种计算机程序(产品),包括计算机程序,所述计算机程序当在一个或多个处理器上运行的时候用于实现前述第一方面任意一项的方法。
与现有技术相比,本申请的有益效果是:
1)对噪声进行预处理,将不同均值和方差的噪声输入到生成器中,以增加生成数据的随机性。采用CWRU轴承数据集进行相关的验证,分别将不同均值和方差组合的高斯噪声输入到网络中。结果表明,采用噪声预处理的方法能有效增加生成数据的随机性和多样性,从而在很大程度上提高了故障诊断的准确度。
2)将多生成器结构与辅助分类器生成对抗网络(Auxiliary ClassifierGenerative Adversarial Networks,ACGAN)相结合。利用不同的生成器捕获不同的高概率模态,解决了模态崩溃问题;另一方面,在鉴别器中使用了辅助分类器。在对鉴别器和多个生成器进行训练时,对其结果分配一个真假标签和一个类标签,使不同的生成器可以生成不同类型的样本数据。采用CWRU轴承数据集,分别验证利用ACGAN、CNN和提出的多生成器结构的ACGAN对轴承数据进行诊断,实验结果证明新提出的网络结构的准确率明显高于另外两种结构。同时采用Paderborn轴承数据集进行进一步验证,将生成数据分别加入训练集和测试集并进行对比实验,实验结果显示将生成数据加入到训练集中效果有明显提高,说明新模型的生成数据包含了故障样本的特征,同时还生成了新的特征。因此得出结论:新提出的网络模型一定程度上解决了模态崩溃和训练不稳定的问题,提高了生成样本的多样性,模型的生成器可以生成高质量的样本,既包含了原始故障样本的特征,同时也生成了新的特征。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为第一个实施例的基于多生成器和多高斯噪声的生成对抗网络模型;
图2为第一个实施例的生成器模型的结构;
图3为第一个实施例的鉴别器模型的结构。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例提供了基于改进型生成对抗网络的设备故障诊断方法;
基于改进型生成对抗网络的设备故障诊断方法,包括:
S101:获取待诊断设备故障信号;基于待诊断设备故障信号,获取待诊断噪声信号;
S102:对待诊断噪声信号进行随机采样,得到具有不同均值和方差的随机噪声;
S103:基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型。
作为一个或多个实施例,S101中,所述基于待诊断设备故障信号,获取待诊断噪声信号;具体步骤包括:
将待诊断设备故障信号,与设备正常运转时的信号进行作差,获取待诊断噪声信号。
作为一个或多个实施例,S102中,对待诊断噪声信号进行随机采样,得到具有不同均值和方差的随机噪声;具体实现方式包括:
通过numpy.random.normal(loc,scale,size=None)方法得到随机噪声,其中loc表示概率分布的均值,scale表示概率分布的标准差,size表示输出的数据大小。首先固定方差,设置不同的均值得到几种随机噪声作为第一种组合方式,其次,固定均值,设置不同的方差得到几种随机噪声作为第二种组合方式。
作为一个或多个实施例,所述对待诊断噪声信号进行随机采样,得到具有不同均值和方差的随机噪声步骤之后;所述基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型步骤之前,还包括:
对基于不同均值和方差的随机噪声进行频域变换操作。频域变换主要是指将随机噪声信号从时域变换到频域,最终得到随机噪声的频域信号。
作为一个或多个实施例,所述基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型;具体步骤包括:
将每一个随机噪声,输入到改进型生成对抗网络的对应生成器中,输出生成结果;
将多个生成器对应的多个生成结果,输入到改进型生成对抗网络的鉴别器中;
改进型生成对抗网络的鉴别器,输出待诊断设备故障信号是否发生故障以及发生故障的类型。
作为一个或多个实施例,所述基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型;其中,改进型生成对抗网络的网络结构具体包括:
多个并列的生成器,每个生成器用于输入对应的随机噪声;
所有生成器的输出端均与鉴别器的输入端连接;
鉴别器的输出端与辅助分类器连接;
辅助分类器用于输出当前待诊断设备的故障信号是否发生故障,以及故障信号对应的故障类型。
进一步地,多个并列的生成器中的每个生成器,包括:
依次连接的第一全连接层、第二全连接层、第一一维卷积层、第一激活函数层、第一上采样层、第二一维卷积层、第二激活函数层、第二上采样层、第三一维卷积层、第三激活函数层和第四一维卷积层。
进一步地,每个生成器,工作原理包括:
第一全连接层和第二全连接层,通过神经元提取特征并且共享权值;
第一一维卷积层,通过卷积操作对输入的数据进行降维和特征提取;
第一激活函数层,引入非线性因素,提高模型的表达能力;
第一上采样层,提高数据的维度,最终使数据维度符合鉴别器的输入维度;
第二一维卷积层,通过卷积操作对输入的数据进行降维和特征提取;
第二激活函数层,引入非线性因素,提高模型的表达能力;
第二上采样层,提高数据的维度,最终使数据维度符合鉴别器的输入维度;
第三一维卷积层,通过卷积操作对输入的数据进行降维和特征提取;
第三激活函数层,引入非线性因素,提高模型的表达能力;
第四一维卷积层,通过卷积操作对输入的数据进行降维和特征提取;
进一步地,所述鉴别器,包括:
M个串联的卷积模块,第一个卷积模块,用于输入所有生成器的生成结果;最后一个卷积模块的输出端与平展层Flatten连接;平展层Flatten与Dropout层连接,Dropout层分别与Sigmoid层和Softmax分类器连接;M为大于等于2的正整数;
所述卷积模块的内部结构均是一致的;所述卷积模块,均包括依次连接的一维卷积层、激活函数层和最大池化层。
进一步地,所述鉴别器,工作原理包括:
所述卷积模块,用于通过卷积操作对输入的数据进行降维和特征提取;
所述平展层Flatten,用于将数据平展为一维数据;
所述Dropout层,用于防止过拟合;
所述Sigmoid层,用于使用Sigmoid激活函数引入非线性函数,得到真假判别结果;
所述Softmax分类器,用于使用Softmax激活函数引入非线性函数,得到多分类结果。
作为一个或多个实施例,所述基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型;其中,改进型生成对抗网络的训练步骤具体为:
构建改进型生成对抗网络;
构建训练集和测试集;所述训练集和测试集均包含已知故障类型的设备故障信号;
将随机噪声、训练集和测试集输入到改进型生成对抗网络中,对多个生成器和鉴别器进行训练;得到训练后的改进型生成对抗网络。
进一步地,所述构建训练集和测试集;具体步骤包括:
对已知故障类型的设备故障信号,在设定范围内的均值和方差下进行随机采样,得到不同均值和方差的随机采样信号;
对不同均值和方差的随机采样信号,进行频域变换,得到数据集;
将数据集按照设定比例划分为训练集和测试集,得到最后构建好的训练集和测试集。
本申请主要针对基于生成对抗网络的设备故障诊断方法在诊断过程存在的两个问题提出相应的解决方法。
首先,在之前的基于生成对抗网络的设备故障诊断方法中,输入到生成器的噪声信号往往是固定的高斯信号,一定程度上会影响生成样本的随机性。针对上述第一个问题,对噪声进行预处理,即通过随机采样得到不同均值和方差的噪声,将得到的噪声信号输入到生成器,从而增加生成数据的随机性。
另外,由于GAN网络自身网络结构的原因,在训练过程中存在模态崩溃和训练不稳定的问题。针对上述第二个问题,将多生成器结构替换掉ACGAN的生成器,利用不同的生成器捕获不同的高概率模态,同时通过鉴别器激励每个生成器生成特定类型的样本,保证了样本的多样性,解决了模态崩溃问题,从而提高了故障诊断的准确性。本案提出新模型的结构图如图1所示。
针对输入噪声单一问题,解决该问题的技术方案如下:
步骤1:对噪声信号在一定范围的均值和方差下进行随机采样,均值范围为[-2,2],方差范围为[0,2]。
步骤2:将得到的噪声信号进行频域变换等相关的数据预处理操作,得到可以输入到生成器中的噪声信号。
步骤3:将处理好的噪声信号分别输入到不同的生成器中,得到不同类型的生成样本。
通过上述步骤,解决了输入噪声单一的问题。由于之前提出基于生成对抗网络的设备故障诊断方法中,输入到GAN网络的生成器中的噪声信号大多是单一分布的高斯噪声,一定程度上限制了生成器生成样本的随机性和多样性,针对这个问题,上述的技术方案通过对噪声进行预处理,输入不同均值和方差的噪声到生成器中,很好地解决了输入噪声单一的问题,同时一定程度上增加了生成样本的随机性。
基于多生成器结构解决模型训练模态崩溃问题:由于GAN网络自身结构的原因,GAN网络用于故障诊断时,训练模型过程中会出现模态崩溃和训练不稳定的问题。针对模型训练模态崩溃问题,将多生成器结构替换掉ACGAN的生成器,使得不同的生成器可以捕捉不同的高概率模态。
新提出的故障诊断模型包括多个生成器和一个鉴别器。该鉴别器包含一个辅助分类器,最后输出真假判别结果和多分类结果。解决该问题的主要技术方案如下:
步骤1:对故障数据集中的真实故障样本进行数据预处理的操作,包括维度变换、添加故障标签和频域转换等,得到可以输入到鉴别器中的真实样本数据,其中选取三种工况下的数据作为训练集,剩下一种工况作为测试集。
步骤2:对噪声进行预处理,得到具有不同均值和方差的原始随机噪声。然后将通过随机噪声采样得到的噪声
Figure BDA0002773289250000111
输入到第i个生成器,然后通过反向传播映射到隐含层为
Figure BDA0002773289250000112
最后通过输出层生成新的样本
Figure BDA0002773289250000113
Figure BDA0002773289250000114
Figure BDA0002773289250000115
公式中,生成器的输入层和隐含层的参数分别表示为
Figure BDA0002773289250000116
Figure BDA0002773289250000117
反之亦然。权值矩阵表示为
Figure BDA0002773289250000118
Figure BDA0002773289250000119
和偏置向量可以表示为
Figure BDA00027732892500001110
Figure BDA00027732892500001111
激活函数可以写做f(*),其中*表示自变量。
初始多生成器模型之间的前两层共享权值。神经网络每一层的神经元之间连接都有一定的权值参数,一般初始是随机给定。共享权值意味着通过前两层的时候不同的生成器对应这两层神经元之间连接的权值参数是相同的。共享权值的好处是使得提取到的低维数据特征相同,从而保证生成数据在低维特征上的一致性。共享层使用全连接层,后续层使用一维卷积层。生成器的结构如图2所示。这时,鉴别器还没有经过训练,所以它没有辨别的能力。
图2中Dense1和Dense2分别表示第一层全连接层和第二层全连接层,两层神经元节点的个数分别为512和1024。Conv1D表示一维卷积层,一维卷积层总共有六层,前三层的神经元节点的个数、卷积核和步长为128、5和1,第四层和第五层的神经元节点的个数、卷积核和步长为64、5和1,第六层是整个生成器结构中的最后一层,神经元节点的个数、卷积核和步长分别为1、3和1。LeakyReLU是激活函数,函数表示公式如下
Figure BDA0002773289250000121
其中α为(1,∞)区间内的固定参数,设定为0.2。LeakyReLU激活函数层有五层,每层在一维卷积层之后。UpSampling层表示为上采样层,总共有两层,在前两个LeakyReLU层之后,大小为2。
步骤3:经过训练,生成器器获得了生成数据来迷惑鉴别器的能力。此时,生成器的参数是固定的,以便获得生成的数据。如图3所示,将原始样本和生成样本作为输入数据输入到鉴别器中,提高鉴别器的判别能力。生成样本
Figure BDA0002773289250000122
被标记为0,真实样本
Figure BDA0002773289250000123
被标记为1。通过该鉴别器模型最终得到了真假判别和多分类的结果。真假判别的结果分别用
Figure BDA0002773289250000124
Figure BDA0002773289250000125
表示,同时鉴别器也可以得到一个多分类的结果,两者通过对方的结果相互优化。
详细来说,输入样本后,需要最小化新模型的损失函数以优化鉴别器。模型的损失函数采用交叉熵使其最小。交叉熵的计算公式如下:
Figure BDA0002773289250000131
Figure BDA0002773289250000132
Figure BDA0002773289250000133
其中类标签和真实标签的交叉熵损失误差分别为Lc和Ld。LMA-ACGAN表示新模型的最终损失函数。Θ={θ12...θN+1}表示损失函数的参数集。
图3中MaxPooling1D表示最大池化层,池化窗口大小和移动步幅为3。Conv1D层的神经元节点的个数、卷积核和步长为64、3和1,LeakyReLU层的固定参数为0.4,Conv1D、LeakyReLU和MaxPooling1D各有三层,按图示顺序排列。Flatten层主要将多维的输入平展为一维数据,Dropout层主要用于防止过拟合。最终通过Sigmoid和Softmax两个输出层函数分别得到真假判别的结果和多分类的结果,两个函数的公式分别表示如下:
Figure BDA0002773289250000134
其中t表示Sigmoid函数的输入,S(t)为对应的输出结果。
Figure BDA0002773289250000135
Figure BDA0002773289250000136
其中zi表示softmax函数的输入,hj表示softmax前一层的输出,Wji表示连接softmax层和它前一层的权值。
鉴别器训练完成后,生成的样本设置标签为1,然后输入到鉴别器中。如果对生成的样本进行最终的真假判别的结果为0,则表示生成的样本被鉴别器检测到了。此时需要通过损失函数最小化来调整生成器的参数。公式如下:
Figure BDA0002773289250000141
Figure BDA0002773289250000142
真假判别的损失函数用交叉熵函数Lg表示。LMA-ACGAN-G为新模型生成器的损失函数,其参数集为Θ'={θz,θ′z},Lc表示类标签的交叉熵损失函数。
在训练过程中指定不同的类标签,强制每个生成器获得生成指定类型数据的能力,保证了数据的多样性。最后,通过交替优化学习机制,对新模型的生成器和鉴别器进行迭代训练,以提高其性能,直至达到纳什均衡,模型训练完成。
步骤4:完成模型训练之后,接下来进入故障诊断阶段,将测试集的数据输入训练好的新模型中进行测试,通过鉴别器的多分类器输出诊断结果,最终完成故障诊断。
使用Parderborn数据集和CWRU数据集进行实验验证,通过实验证明与以往的模型相比,新提出的模型具有更好的故障诊断性能。它不仅解决了模型崩溃的问题,而且可以提示不同的生成器生成指定类的样本,具有较好的可扩展性和泛化能力。
通过上述步骤,解决了模型训练模态崩溃问题。尝试将多生成器结构替换掉ACGAN的生成器,使得每个生成器能够捕获不同的高概率模态,激励生成器生成特定类型的样本,从而解决模态崩溃的问题,保证了生成器生成样本的多样性,进而提高了故障诊断的准确性。特定类型的是指假如有n类数据,n个生成器中每个生成器生成一种类型的数据。
本申请主要提出了一种基于多生成器和多高斯噪声的生成对抗网络的设备故障诊断方法,将噪声预处理之后输入到生成器中,同时将多生成器的结构与辅助分类器生成对抗网络相结合,应用于最终的故障分类,主要解决两个技术问题:输入噪声单一问题和模型训练模态崩溃问题。
对于第一个问题,采用CWRU轴承数据集,分别验证利用ACGAN、CNN和提出的多智能体的ACGAN对轴承数据进行诊断,实验结果证明新提出的网络结构的准确率明显高于另外两种结构,ACGAN和CNN分别可以达到87%和82%,而新提出的模型准确率可以达到95%。同时采用Paderborn轴承数据集进行进一步验证,将生成数据分别加入训练集和测试集并进行对比实验,实验结果显示将生成数据加入到训练集中效果有明显提高,可以达到96%。说明新模型的生成数据包含了故障样本的特征,同时还生成了新的特征。最后新提出的模型与其他的故障诊断模型作比较,诊断的准确率可以达到99.2%,显著提高了故障诊断能力。因此可以说明,新提出的网络模型一定程度上解决了模态崩溃和训练不稳定的问题,提高了生成样本的多样性,模型的生成器可以生成高质量的样本,既包含了原始故障样本的特征,同时也生成了新的特征。
对于第二个问题,对噪声进行预处理,将不同均值和方差的噪声输入到生成器中,以增加生成数据的随机性。采用CWRU轴承数据集进行相关的验证,分别将不同均值和方差组合的高斯噪声输入到网络中。结果表明,诊断的准确率从78%提升到89%,提升了11%,效果明显,说明通过对噪声进行预处理,可以解决输入噪声单一的问题,保证了生成样本的随机性和多样性。
由上述实验结果说明,将多生成器结构替换掉ACGAN的生成器,解决了模态崩溃和训练不稳定的问题,提高了模型的泛化能力和轴承故障诊断的性能;同时也说明本案提出的基于多生成器和辅助分类器的生成对抗网络的设备故障诊断方法是切实有效的。
实施例二
本实施例提供了基于改进型生成对抗网络的设备故障诊断系统;
基于改进型生成对抗网络的设备故障诊断系统,包括:
获取模块,其被配置为:获取待诊断设备故障信号;基于待诊断设备故障信号,获取待诊断噪声信号;
采样模块,其被配置为:对待诊断噪声信号进行随机采样,得到具有不同均值和方差的随机噪声;
输出模块,其被配置为:基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型。
此处需要说明的是,上述获取模块、采样模块和输出模块对应于实施例一中的步骤S101至S103,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。
所提出的系统,可以通过其他的方式实现。例如以上所描述的系统实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个系统,或一些特征可以忽略,或不执行。
实施例三
本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述实施例一所述的方法。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
实施例四
本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述的方法。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (9)

1.基于改进型生成对抗网络的设备故障诊断方法,其特征是,包括:
获取待诊断设备故障信号;基于待诊断设备故障信号,获取待诊断噪声信号;
对待诊断噪声信号进行随机采样,得到具有不同均值和方差的随机噪声;
根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型;其中,改进型生成对抗网络的网络结构具体包括:
多个并列的生成器,每个生成器用于输入对应的随机噪声;
所有生成器的输出端均与鉴别器的输入端连接;
鉴别器的输出端与辅助分类器连接;
辅助分类器用于输出当前待诊断设备的故障信号是否发生故障,以及故障信号对应的故障类型;
对噪声信号在一定范围的均值和方差下进行随机采样,均值范围为[-2,2],方差范围为[0,2];
通过numpy.random.normal(loc, scale, size=None)方法得到随机噪声,其中loc表示概率分布的均值,scale表示概率分布的标准差,size表示输出的数据大小,首先固定方差,设置不同的均值得到几种随机噪声作为第一种组合方式,其次,固定均值,设置不同的方差得到几种随机噪声作为第二种组合方式;
将多生成器结构替换掉ACGAN的生成器,利用不同的生成器捕获不同的高概率模态,同时通过鉴别器激励每个生成器生成特定类型的样本;
基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型。
2.如权利要求1所述的方法,其特征是,所述对待诊断噪声信号进行随机采样,得到具有不同均值和方差的随机噪声步骤之后;所述基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型步骤之前,还包括:
对基于不同均值和方差的随机噪声进行频域变换操作。
3.如权利要求1所述的方法,其特征是,所述基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型;具体步骤包括:
将每一个随机噪声,输入到改进型生成对抗网络的对应生成器中,输出生成结果;
将多个生成器对应的多个生成结果,输入到改进型生成对抗网络的鉴别器中;
改进型生成对抗网络的鉴别器,输出待诊断设备故障信号是否发生故障以及发生故障的类型。
4.如权利要求1所述的方法,其特征是,多个并列的生成器中的每个生成器,包括:
依次连接的第一全连接层、第二全连接层、第一一维卷积层、第一激活函数层、第一上采样层、第二一维卷积层、第二激活函数层、第二上采样层、第三一维卷积层、第三激活函数层和第四一维卷积层;
每个生成器,工作原理包括:
第一全连接层和第二全连接层,通过神经元提取特征并且共享权值;
第一一维卷积层,通过卷积操作对输入的数据进行降维和特征提取;
第一激活函数层,引入非线性因素,提高模型的表达能力;
第一上采样层,提高数据的维度,最终使数据维度符合鉴别器的输入维度;
第二一维卷积层,通过卷积操作对输入的数据进行降维和特征提取;
第二激活函数层,引入非线性因素,提高模型的表达能力;
第二上采样层,提高数据的维度,最终使数据维度符合鉴别器的输入维度;
第三一维卷积层,通过卷积操作对输入的数据进行降维和特征提取;
第三激活函数层,引入非线性因素,提高模型的表达能力;
第四一维卷积层,通过卷积操作对输入的数据进行降维和特征提取。
5.如权利要求1所述的方法,其特征是,所述鉴别器,包括:
M个串联的卷积模块,第一个卷积模块,用于输入所有生成器的生成结果;最后一个卷积模块的输出端与平展层Flatten连接;平展层Flatten与Dropout层连接,Dropout层分别与Sigmoid层和Softmax分类器连接;M为大于等于2的正整数;
所述卷积模块的内部结构均是一致的;所述卷积模块,均包括依次连接的一维卷积层、激活函数层和最大池化层;
所述鉴别器,工作原理包括:
所述卷积模块,用于通过卷积操作对输入的数据进行降维和特征提取;
所述平展层Flatten,用于将数据平展为一维数据;
所述Dropout层,用于防止过拟合;
所述Sigmoid层,用于使用Sigmoid激活函数引入非线性函数,得到真假判别结果;
所述Softmax分类器,用于使用Softmax激活函数引入非线性函数,得到多分类结果。
6.如权利要求1所述的方法,其特征是,所述基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型;其中,改进型生成对抗网络的训练步骤具体为:
构建改进型生成对抗网络;
构建训练集和测试集;所述训练集和测试集均包含已知故障类型的设备故障信号;
将随机噪声、训练集和测试集输入到改进型生成对抗网络中,对多个生成器和鉴别器进行训练;得到训练后的改进型生成对抗网络;
或者,
所述构建训练集和测试集;具体步骤包括:
对已知故障类型的设备故障信号,在设定范围内的均值和方差下进行随机采样,得到不同均值和方差的随机采样信号;
对不同均值和方差的随机采样信号,进行频域变换,得到数据集;
将数据集按照设定比例划分为训练集和测试集,得到最后构建好的训练集和测试集。
7.基于改进型生成对抗网络的设备故障诊断系统,其特征是,包括:
获取模块,其被配置为:获取待诊断设备故障信号;基于待诊断设备故障信号,获取待诊断噪声信号;
采样模块,其被配置为:对待诊断噪声信号进行随机采样,得到具有不同均值和方差的随机噪声;
根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型;其中,改进型生成对抗网络的网络结构具体包括:
多个并列的生成器,每个生成器用于输入对应的随机噪声;
所有生成器的输出端均与鉴别器的输入端连接;
鉴别器的输出端与辅助分类器连接;
辅助分类器用于输出当前待诊断设备的故障信号是否发生故障,以及故障信号对应的故障类型;
对噪声信号在一定范围的均值和方差下进行随机采样,均值范围为[-2,2],方差范围为[0,2];
通过numpy.random.normal(loc, scale, size=None)方法得到随机噪声,其中loc表示概率分布的均值,scale表示概率分布的标准差,size表示输出的数据大小,首先固定方差,设置不同的均值得到几种随机噪声作为第一种组合方式,其次,固定均值,设置不同的方差得到几种随机噪声作为第二种组合方式;
将多生成器结构替换掉ACGAN的生成器,利用不同的生成器捕获不同的高概率模态,同时通过鉴别器激励每个生成器生成特定类型的样本;
输出模块,其被配置为:基于不同均值和方差的随机噪声,根据训练后的改进型生成对抗网络,获取待诊断设备的故障信号对应的故障类型。
8.一种电子设备,其特征是,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述权利要求1-6任一项所述的方法。
9.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-6任一项所述的方法。
CN202011256522.XA 2020-11-11 2020-11-11 基于改进型生成对抗网络的设备故障诊断方法及系统 Active CN112380767B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011256522.XA CN112380767B (zh) 2020-11-11 2020-11-11 基于改进型生成对抗网络的设备故障诊断方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011256522.XA CN112380767B (zh) 2020-11-11 2020-11-11 基于改进型生成对抗网络的设备故障诊断方法及系统

Publications (2)

Publication Number Publication Date
CN112380767A CN112380767A (zh) 2021-02-19
CN112380767B true CN112380767B (zh) 2023-04-07

Family

ID=74582741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011256522.XA Active CN112380767B (zh) 2020-11-11 2020-11-11 基于改进型生成对抗网络的设备故障诊断方法及系统

Country Status (1)

Country Link
CN (1) CN112380767B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191186A (zh) * 2021-03-11 2021-07-30 西安交通大学 故障敏感编码网络驱动的直升机传动系统轴承检测方法
CN113159127A (zh) * 2021-03-23 2021-07-23 浙江大胜达包装股份有限公司 一种基于改进的生成对抗网络的凹版印刷机导向辊故障智能诊断方法
CN113221946B (zh) * 2021-04-02 2022-03-25 中国人民解放军92578部队 一种机械设备故障种类的诊断方法
CN113420495B (zh) * 2021-05-31 2023-02-03 西南电子技术研究所(中国电子科技集团公司第十研究所) 主动诱骗式智能抗干扰方法
CN113421538A (zh) * 2021-06-23 2021-09-21 珠海格力电器股份有限公司 主动降噪系统故障判断方法、家用电器、汽车、计算机装置和计算机可读存储介质
CN114092704B (zh) * 2021-10-22 2022-10-21 北京大数据先进技术研究院 基于近邻传播的实例匹配方法、装置、设备及存储介质
CN114444620B (zh) * 2022-04-08 2022-07-22 中国石油大学(华东) 一种基于生成式对抗神经网络的示功图故障诊断方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563493A (zh) * 2017-07-17 2018-01-09 华南理工大学 一种多生成器卷积合成图像的对抗网络算法
CN110567720A (zh) * 2019-08-07 2019-12-13 东北电力大学 非平衡小样本场景下风机轴承故障深度对抗诊断方法
CN110598843A (zh) * 2019-07-23 2019-12-20 中国人民解放军63880部队 一种基于判别器共享的生成对抗网络组织结构及其训练方法
CN111027439A (zh) * 2019-12-03 2020-04-17 西北工业大学 基于辅助分类生成对抗网络的sar目标识别方法
CN111178260A (zh) * 2019-12-30 2020-05-19 山东大学 一种基于生成对抗网络的调制信号时频图分类系统及其运行方法
CN111275024A (zh) * 2020-03-22 2020-06-12 东北电力大学 含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法
CN111337243A (zh) * 2020-02-27 2020-06-26 上海电力大学 基于acgan的风电机组行星轮齿轮箱故障诊断方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11598880B2 (en) * 2018-10-04 2023-03-07 The Boeing Company Detecting fault states of an aircraft

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563493A (zh) * 2017-07-17 2018-01-09 华南理工大学 一种多生成器卷积合成图像的对抗网络算法
CN110598843A (zh) * 2019-07-23 2019-12-20 中国人民解放军63880部队 一种基于判别器共享的生成对抗网络组织结构及其训练方法
CN110567720A (zh) * 2019-08-07 2019-12-13 东北电力大学 非平衡小样本场景下风机轴承故障深度对抗诊断方法
CN111027439A (zh) * 2019-12-03 2020-04-17 西北工业大学 基于辅助分类生成对抗网络的sar目标识别方法
CN111178260A (zh) * 2019-12-30 2020-05-19 山东大学 一种基于生成对抗网络的调制信号时频图分类系统及其运行方法
CN111337243A (zh) * 2020-02-27 2020-06-26 上海电力大学 基于acgan的风电机组行星轮齿轮箱故障诊断方法
CN111275024A (zh) * 2020-03-22 2020-06-12 东北电力大学 含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Conditional image Synthesis with Auxiliary classifier GANs";Augustus Odena.et al;《Proceeding of the 34th International Conference on Machine Learning》;20171231;第1-10页 *
"Towards principled methods foe training Generative adversarial network";M arjovsky.et al;《Arxiv》;20171231;第1-17页 *
"基于多生成器生成对抗网络的研究与实现";严毅;《中国优秀硕士学位论文全文数据库 信息科技辑》;20200715(第07期);第1-73页 *
"基于生成对抗网络的图像生成技术研究";何志鹏;《中国优秀硕士学位论文全文数据库 信息科技辑》;20200715(第07期);第1-81页 *

Also Published As

Publication number Publication date
CN112380767A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN112380767B (zh) 基于改进型生成对抗网络的设备故障诊断方法及系统
Viola et al. FaultFace: Deep convolutional generative adversarial network (DCGAN) based ball-bearing failure detection method
Xiao et al. Domain adaptive motor fault diagnosis using deep transfer learning
Li et al. Multi-layer domain adaptation method for rolling bearing fault diagnosis
Qin et al. DTCNNMI: A deep twin convolutional neural networks with multi-domain inputs for strongly noisy diesel engine misfire detection
Gao et al. A novel weak fault diagnosis method for rolling bearings based on LSTM considering quasi-periodicity
Zhang et al. Deep learning algorithms for bearing fault diagnostics-a review
Si et al. Unsupervised deep transfer learning with moment matching: A new intelligent fault diagnosis approach for bearings
Guo et al. Deep convolution feature learning for health indicator construction of bearings
Plakias et al. A novel information processing method based on an ensemble of Auto-Encoders for unsupervised fault detection
CN113923104B (zh) 基于小波神经网络的网络故障诊断方法、设备及存储介质
Wang et al. Long-range dependencies learning based on non-local 1D-convolutional neural network for rolling bearing fault diagnosis
CN110657984A (zh) 一种基于强化胶囊网络的行星齿轮箱故障诊断方法
Ma et al. Deep recurrent convolutional neural network for remaining useful life prediction
CN115114965A (zh) 风电机组齿轮箱故障诊断模型、方法、设备及存储介质
CN109787958A (zh) 网络流量实时检测方法及检测终端、计算机可读存储介质
CN113541985A (zh) 物联网故障诊断方法、模型的训练方法及相关装置
Huang et al. Residual attention net for superior cross-domain time sequence modeling
Liu et al. Counterfactual-augmented few-shot contrastive learning for machinery intelligent fault diagnosis with limited samples
Monday et al. A wavelet convolutional capsule network with modified super resolution generative adversarial network for fault diagnosis and classification
CN115791174A (zh) 一种滚动轴承异常诊断方法、系统、电子设备及存储介质
CN117113170A (zh) 一种基于多尺度信息融合的轻量化旋转机械故障诊断方法
Kumar et al. Normalizing flow based feature synthesis for outlier-aware object detection
Yu et al. Intelligent corner synthesis via cycle-consistent generative adversarial networks for efficient validation of autonomous driving systems
Hu et al. An improved metalearning framework to optimize bearing fault diagnosis under data imbalance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant