CN113095402B - 一种基于编码输入的生成对抗网络故障检测方法及系统 - Google Patents

一种基于编码输入的生成对抗网络故障检测方法及系统 Download PDF

Info

Publication number
CN113095402B
CN113095402B CN202110387887.4A CN202110387887A CN113095402B CN 113095402 B CN113095402 B CN 113095402B CN 202110387887 A CN202110387887 A CN 202110387887A CN 113095402 B CN113095402 B CN 113095402B
Authority
CN
China
Prior art keywords
sample
working condition
normal working
data set
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110387887.4A
Other languages
English (en)
Other versions
CN113095402A (zh
Inventor
熊伟丽
吴晓东
马君霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN202110387887.4A priority Critical patent/CN113095402B/zh
Publication of CN113095402A publication Critical patent/CN113095402A/zh
Application granted granted Critical
Publication of CN113095402B publication Critical patent/CN113095402B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于编码输入的生成对抗网络故障检测方法及系统,包括:获取原始正常工况数据集及待测样本;归一化处理所获得的数据分别的得到正常工况标准数据集、待测标准样本;利用正常工况标准数据集通过最小化重构误差训练自编码器模型,得到编码器,训练对抗网络得到生成器和判别器;分别求取正常工况标准数据集、待测标准样本对应的统计量,基于正常工况标准数据集的统计量利用核密度估计方法计算出控制限;基于待测标准样本统计量与控制限绘制控制图并比较判断是否发生故障,完成故障检测。本发明改善了训练过程缓慢的问题,提升了生成对抗网络的训练效果和检测性能,且本方法大大减少了计算成本,降低了检测延时。

Description

一种基于编码输入的生成对抗网络故障检测方法及系统
技术领域
本发明涉及复杂工业过程建模和故障诊断的技术领域,尤其涉及一种基于编码输入的生成对抗网络故障检测方法及系统。
背景技术
故障检测是通过统计学方法对生产过程中的数据进行定量分析,不仅可以改善产品质量还可以提升过程的安全性,随着生产过程工艺复杂性及自动化程度的提高,过程变量逐渐增多,生产过程数据量也成倍地增加。在这样的背景下,基于过程数据的多变量统计分析故障检测算法被广泛应用于过程监控领域,其中常见的多元统计过程监控方法主要有主元分析法(PCA)、偏最小二乘法(PLS)、独立元分析法(ICA)及k近邻(kNN)故障检测方法。
基于数据的故障检测方法中,建模数据对于故障检测的效果起着决定性作用,传统机器学习方法中的浅层模型往往无法满足过程大数据的解析需求,因此,专家学者提出了不同的深层模型以解决实际复杂问题。其中,生成对抗网络(Generative AdversarialNetwork,GAN)由于其特殊的训练思想及生成能力受到了研究人员的广泛关注,已被应用于图像、视频、文本处理等领域,近几年GAN研究和应用的不断扩展,逐渐应用到了复杂工业过程监控领域。
经典的故障检测方法,比如PCA通过选取方差贡献率大的主元检测故障,易忽略方差贡献率小的变量;基于kNN的故障检测方法假设异常样本较正常工况样本在变量上会存在较大偏差,从而计算距离统计量进行故障检测。上述两种传统算法在故障检测前都存在着先验假设,对故障检测的效果具有一定影响。对此Wang等提出了基于生成对抗网络的异常检测方法,并在手写数据集(National Institute of Standards and Technology,NIST)及TE过程仿真中验证了方法的有效性。基于GAN的故障检测方法采用正常工况数据训练生成对抗网络,根据网络中的生成器及判别器构建统计量进行故障检测,因此不存在对故障产生的先验假设,而是通过判别器从真实样本及虚假样本中提取出的潜隐特征并计算概率判断故障是否发生,更贴合检测过程中故障类型及发生原因未知的背景。但基于GAN的故障检测方法采用经典的生成对抗网络模型,不可避免地存在着训练困难及模式崩溃的问题,为此许多学者从生成对抗网络结构及寻找最佳GAN模型的角度进行了改进。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明解决的技术问题是:传统GAN故障检测中网络输入包含有效信息少、故障检出率低。
为解决上述技术问题,本发明提供如下技术方案:获取原始正常工况数据集及待测样本;对所述原始正常工况数据集进行最值归一化处理得到正常工况标准数据集,对所述待测样本进行归一化操作得到待测标准样本;利用所述正常工况标准数据集通过最小化重构误差训练自编码器模型,得到编码器,基于所述正常工况标准数据集及所述编码器训练对抗网络得到生成器和判别器;分别求取所述正常工况标准数据集、所述待测标准样本对应的统计量,基于所述正常工况标准数据集的统计量利用核密度估计方法计算出控制限;基于所述待测标准样本统计量与所述控制限绘制控制图并比较判断是否发生故障,完成故障检测。
作为本发明所述的基于编码输入的生成对抗网络故障检测方法的一种优选方案,其中:所述原始正常工况数据集Xtrain进行最值归一化处理得到正常工况标准数据集X′train过程包括,采用的如下数学模型:
Figure BDA0003015593980000021
其中,x表示所述原始正常工况数据集X∈Rm×n中的一个样本,x*表示所述样本x经过最值归一化后处理后得到的正常工况标准数据集X*∈Rm×n中对应的样本,min(X)表示正常工况数据集X按行比较得到的最小值向量,max(X)表示正常工况数据集X按行比较得到的最大值向量,m代表样本维数,n代表样本个数,所述原始正常工况数据集X为矩阵。
作为本发明所述的基于编码输入的生成对抗网络故障检测方法的一种优选方案,其中:利用所述正常工况标准数据集通过最小化重构误差L(θ)训练自编码器模型包括,采用的如下数学模型:
Figure BDA0003015593980000022
其中,θ表示自编码器网络参数,X表示自编码器输入,X′表示自编码器对输入X的重构输出。
作为本发明所述的基于编码输入的生成对抗网络故障检测方法的一种优选方案,其中:利用所述正常工况标准数据集及所述编码器训练对抗网络得到生成器和判别器包括,将所述自编码器E降维后的输入作为生成网络中生成器的输入,利用所述正常工况标准数据集X′train通过最小化生成器G及判别器D得到各自的代价函数LD,LG:采用的如下数学模型:
Figure BDA0003015593980000031
Figure BDA0003015593980000032
其中,E表示求期望,x~Pdata表示样本x服从真实样本的数据分布,z~Platent表示变量z服从隐变量空间的数据分布,G(z)表示将隐变量z映射到与真实样本维度一致的生成样本空间,D(·)表示判别器输出,其值位于0-1之间;定义样本u为某一未知样本,D(u)越趋向于1,则判别器认为样本u为真实样本的概率越大,反之为虚假样本的概率越大。
作为本发明所述的基于编码输入的生成对抗网络故障检测方法的一种优选方案,其中:所述分别求取所述正常工况标准数据集、所述待测标准样本对应的统计量过程包括,根据判别器输出及所述自编码器中所提取潜隐变量定义统计量,采用如下数学模型:
D_score=1-D(x)
Figure BDA0003015593980000033
其中,x表示需要计算统计量的样本,D(x)表示所述判别器以x作为输入时的输出,E(x)表示待测样本经自编码器编码后的降维输出,
Figure BDA0003015593980000034
表示训练集经自编码器编码后降维输出的均值。
作为本发明所述的基于编码输入的生成对抗网络故障检测方法的一种优选方案,其中:基于所述正常工况标准数据集的统计量利用核密度估计方法计算出控制限包括,采用如下数学模型:
TD=95 quantile of{D_score|x∈Xtrain}
TE=95 quantile of{E_score|x∈Xtrain}
其中,D_score|x∈Xtrain表示训练集即正常工况样本计算得到的D_score统计量,E_score|x∈Xtrain同理,95 quantile of{D_score|x∈Xtrain}表示根据核密度估计方法使得95%的正常样本统计量位于所得控制限以下,TD、TE表示D_score及E_score统计量的控制限。
作为本发明所述的基于编码输入的生成对抗网络故障检测方法的一种优选方案,其中:基于所述待测标准样本统计量与所述控制限比较判断是否发生故障准则包括,当D_score统计量大于等于控制限TD或E_score统计量大于等于控制限TE时,则确定待测样本发生了故障。
本发明解决的另一个技术问题是:提出一种基于编码输入的生成对抗网络故障检测系统,进一步提升了生成对抗网络的训练效果和检测性能。
为解决上述技术问题,本发明提供如下技术方案:标准化处理模块,用于获取所述原始正常工况数据集及所述待测样本,对所述原始正常工况数据集进行标准化处理得到原始正常工况标准数据集,及对所述待测样本进行标准化操作得到所述待测标准样本;统计量求取模块,用于分别求取所述正常工况标准数据集、所述待测标准样本对应的统计量,并根据所述正常工况标准数据集的统计量利用核密度估计方法计算出控制限TD及TE;故障诊断模块,用于结合所述待测样本的统计量与所述控制限判断是否故障。
本发明的有益效果:本发明一方面改善了传统生成对抗网络中生成器使用随机噪声作为输入带来的缺乏有效信息训练过程缓慢的问题,提升了生成对抗网络的训练效果和检测性能,另一方面相较于传统针对生成器的统计量,本方法所提针对自编码器的统计量大大减少了计算成本,降低了检测延时。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的基本流程示意图;
图2为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的整体结构示意图;
图3为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的确定样本是否故障的流程图;
图4为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的改进前生成器迭代一万次生成样本分布图;
图5为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的改进前生成器迭代四万次生成样本分布图;
图6为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的改进后生成器迭代一万次生成样本分布图;
图7为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的改进后生成器迭代四万次生成样本分布图;
图8为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的根据D_score统计量对TE过程故障1的控制图;
图9为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的根据D_score统计量对TE过程故障4的控制图;
图10为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的根据E_score统计量对TE过程故障2的控制图;
图11为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的根据E_score统计量对TE过程故障6的控制图;
图12为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的对TE过程训练集及故障2对应的测试集通过自编码器提取隐变量绘制的箱线图;
图13为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的对TE过程训练集及故障6对应的测试集通过自编码器提取隐变量绘制的箱线图;
图14为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的对TE过程训练集及故障14对应的测试集通过自编码器提取隐变量绘制的箱线图;
图15为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的传统GAN采用D_score统计量对磨煤机数据进行故障检测绘制得到的控制图;
图16为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的传统GAN采用G_score统计量对磨煤机数据进行故障检测绘制得到的控制图;
图17为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的PCA降维数据作为生成器输入的GAN(Principal Component based GAN,PCGAN)采用D_score统计量对磨煤机数据进行故障检测绘制得到的控制图;
图18为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的PCA降维数据作为生成器输入的GAN(Principal Component based GAN,PCGAN)采用G_score统计量对磨煤机数据进行故障检测绘制得到的控制图;
图19为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的改进GAN采用D_score统计量对磨煤机数据进行故障检测绘制得到的控制图;
图20为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的改进GAN采用G_score统计量对磨煤机数据进行故障检测绘制得到的控制图;
图21为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的采用T_score统计量对磨煤机数据进行故障检测绘制得到的控制图;
图22为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的采用E_score统计量对磨煤机数据进行故障检测绘制得到的控制图;
图23为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的对磨煤机数据训练集、测试集绘制得到的箱线图;
图24为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的对磨煤机数据训练集、测试集经自编码器编码后的隐变量空间绘制得到的箱线图;
图25为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的对磨煤机数据训练集、测试集经主成分分析法将为所得隐变量空间绘制得到的箱线图;
图26为本发明一个实施例提供的一种基于编码输入的生成对抗网络故障检测方法及系统的模块图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1~25,为本发明的一个实施例,提供了一种基于编码输入的生成对抗网络故障检测方法,包括:
S1:获取原始正常工况数据集Xtrain及待测样本xμ
S2:对原始正常工况数据集Xtrain进行最值归一化处理得到正常工况标准数据集X′train,对待测样本xμ进行归一化操作得到待测标准样本x′μ;需要说明的是,
对原始正常工况数据集Xtrain进行最值归一化处理得到正常工况标准数据集X′train过程包括,
采用的如下数学模型:
Figure BDA0003015593980000081
其中,x表示原始正常工况数据集X∈Rm×n中的一个样本,x*表示样本x经过最值归一化后处理后得到的正常工况标准数据集X*∈Rm×n中对应的样本,min(X)表示正常工况数据集X按行比较得到的最小值向量,max(X)表示正常工况数据集X按行比较得到的最大值向量,m代表样本维数,n代表样本个数,原始正常工况数据集X为矩阵。
S3:利用正常工况标准数据集通过最小化重构误差训练自编码器模型,得到编码器,基于正常工况标准数据集及编码器训练对抗网络得到生成器和判别器;需要说明的是,
利用正常工况标准数据集通过最小化重构误差L(θ)训练自编码器模型包括,
采用的如下数学模型:
Figure BDA0003015593980000082
其中,θ表示自编码器网络参数,X表示自编码器输入,X′表示自编码器对输入X的重构输出。
利用正常工况标准数据集X′train训练生成对抗网络得到生成器及判别器模型包括:
将自编码器E降维后的输入作为生成网络中生成器的输入,利用正常工况标准数据集X′train通过最小化生成器G及判别器D得到各自的代价函数LD,LG
采用的如下数学模型:
Figure BDA0003015593980000091
Figure BDA0003015593980000092
其中,E表示求期望,x~Pdata表示样本x服从真实样本的数据分布,z~Platent表示变量z服从隐变量空间的数据分布,G(z)表示将隐变量z映射到与真实样本维度一致的生成样本空间,D(·)表示判别器输出,其值位于0-1之间;定义样本u为某一未知样本,D(u)越趋向于1,则判别器认为样本u为真实样本的概率越大,反之为虚假样本的概率越大。
S4:分别求取正常工况标准数据集、待测标准样本对应的统计量,基于正常工况标准数据集的统计量利用核密度估计方法计算出控制限;需要说明的是,
根据判别器输出及自编码器中所提取潜隐变量定义统计量,采用如下数学模型:
D_score=1-D(x)
Figure BDA0003015593980000093
其中,x表示需要计算统计量的样本,D(x)表示判别器以x作为输入时的输出,E(x)表示待测样本经自编码器编码后的降维输出,
Figure BDA0003015593980000094
表示训练集经自编码器编码后降维输出的均值。
接着根据正常工况样本的统计量计算得出控制限,包括:
利用核密度估计方法计算D_score及E_score统计量的控制限,采用如下数学模型:
TD=95 quantile of{D_score|x∈Xtrain}
TE=95 quantile of{E_score|x∈Xtrain}
其中,D_score|x∈Xtrain表示训练集即正常工况样本计算得到的D_score统计量,E_score|x∈Xtrain同理,95 quantile of{D_score|x∈Xtrain}表示根据核密度估计方法使得95%的正常样本统计量位于所得控制限以下,TD、TE表示D_score及E_score统计量的控制限。
S5:基于待测标准样本统计量与控制限绘制控制图并比较判断是否发生故障,完成故障检测;需要说明的是,
基于待测标准样本统计量与控制限比较判断是否发生故障准则包括,
当D_score统计量大于等于控制限TD或E_score统计量大于等于控制限TE时,则确定待测样本发生了故障。
为对本方法中采用的技术效果加以验证说明,本实施例选择的不同方法和采用本方法进行对比测试,以科学论证的手段对比试验结果,以验证本方法所具有的真实效果。
以TE过程及某火力发电厂磨煤机数据为例,对TE过程的21种故障及进行了监测,其中,TE过程是Tenessee Eastman化学公司基于某实际化工生产过程提出的一个仿真系统,在过程系统工程领域的研究中,TE过程是一个常用的标准问题(Benchmark problem),其较好的模拟了实际复杂工业过程系统的许多典型特征,因此被作为仿真示例广泛应用于控制、优化、过程监控与故障诊断的研究中。TE过程主要有反应器、冷凝器、压缩机、分离器和汽提塔五个主要单元组成。该过程包含22个过程测量变量、19个成分测量变量以及12个操作变量。本实施例选取22个过程测量变量以及除搅拌速度外的11个操作变量用于建模与监测。TE过程共包含21种故障,本实施例采集正常工况下的960个样本作为训练数据集,各种故障工况时的960个样本用作故障测试集,其中故障均从第161个样本点处加入。
首先,获取正常工况下的960个样本作为原始正常工况数据集,并采用上述数学模型进行标准化处理,得到正常工况标准数据集;然后训练自编码器及改进后的生成对抗网络如图2所示,然后计算正常工况数据统计量、控制限及待测标准样本统计量,当待测样本统计量大于控制限时,确定该样本发生故障,具体流程参见图3所示。
将自编码器提取的隐变量作为生成器的输入,不同迭代次数后生成样本过程如图4~7所示。对比图4和5、6和7可以看出,改进生成器输入后,有效提升了生成器的生成能力,在相同迭代次数下,改进后的生成器生成的样本分布更接近真实数据分布,从而有效地避免了以随机正态分布作为生成器输入的不足。
对测试集计算统计量,结合控制限绘制控制图如图8~11所示,图8、9为根据D_score统计量对TE过程故障1和14的控制图,10、11为根据E_score统计量对TE过程故障2和6的控制图,可以看出本发明所提算法可以很好地通过统计量将正常工况样本与异常工况的样本区分开来,从而验证了其作为故障检测算法的有效性。
对TE过程训练集及故障2、6、14对应的测试集通过自编码器提取隐变量并绘制箱线图如图12~14所示,其中蓝色矩形的上边框和下边框代表数据的上四分位数和下四分位数,矩形中红线代表中位数,矩形外的黑线分别代表上下边缘。通过对比故障样本隐变量与正常工况样本隐变量数据分布情况可以发现:使用自编码器提取TE过程特征信息在还原原始数据集信息的同时,编码器提取出的故障样本的隐变量与正常样本隐变量具有明显的差异性,这也很好地解释了图10、11中统计量能很好地检出故障2、6的原因
对传统GAN、采用PCA降维数据作为生成器输入的GAN(Principal Componentbased GAN,PCGAN)及本发明所提的改进GAN三者进行相同的参数初始化及网络结构设置,即生成器与判别器层数、每一层神经元个数、每一层激活函数、梯度更新规则、学习率衰减速率均相同,训练相同次数后,采用D_score和G_score统计量对磨煤机数据进行故障检测,控制图如图12~13所示。
对采用PCA降维数据作为生成器输入的GAN(Principal Component based GAN,PCGAN)及本发明所提的改进GAN进行相同的参数初始化及网络结构设置,即生成器与判别器层数、每一层神经元个数、每一层激活函数、梯度更新规则、学习率衰减速率均相同,训练相同次数后,采用E_score和T_score统计量对磨煤机数据进行故障检测,控制图如图14~15所示。其中T_score为类比E_score统计量对采用主成分输入的GAN故障检测方法计算得到的统计量如以下数学模型所示:
X=XPPT+XPPT
Figure BDA0003015593980000111
对磨煤机数据训练集、测试集及其经自编码器编码后的隐变量空间绘制箱线图如图16~18所示。通过对比图16、17可以看出:经自编码器提取出的隐变量空间及PCA方法提取出的得分向量空间去除了线性相关及冗余的变量,以少量的变量最大程度地还原了原有数据集中的信息;但对比图17、18发现测试集经自编码器提取出的隐变量空间在变量2、3、5上均表现出了与训练集隐变量空间的差异性,而测试集经PCA方法提取出的隐变量空间仅在变量2上表现出了与训练集隐变量空间的差异性,此外,训练集经PCA方法提取出的隐变量分布的离散程度高于测试集隐变量分布,不利于故障检测,这也解释了本发明所提的E_score统计量较T_score统计量有利于故障检测的原因。
实施例2
参照图26为本发明另一个实施例,提出一种基于编码输入的生成对抗网络故障检测系统,上述实施例提出的方法依托于本实施例实现,包括:
标准化处理模块100,用于获取所述原始正常工况数据集及所述待测样本,对所述原始正常工况数据集进行标准化处理得到原始正常工况标准数据集,及对所述待测样本进行标准化操作得到所述待测标准样本;
统计量求取模块200,用于分别求取所述正常工况标准数据集、所述待测标准样本对应的统计量,并根据所述正常工况标准数据集的统计量利用核密度估计方法计算出控制限TD及TE
故障诊断模块300,用于结合所述待测样本的统计量与所述控制限判断是否故障。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“系统”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地系统、分布式系统中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系统进行交互)的信号,以本地和/或远程过程的方式进行通信。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (4)

1.一种基于编码输入的生成对抗网络故障检测方法,其特性在于,包括:
获取原始正常工况数据集及待测样本,对所述原始正常工况数据集进行最值归一化处理得到正常工况标准数据集,对所述待测样本进行归一化操作得到待测标准样本;
所述原始正常工况数据集Xtrain进行最值归一化处理得到正常工况标准数据集Xtrain过程包括,
采用的如下数学模型:
Figure FDF0000020833330000011
其中,x表示所述原始正常工况数据集X∈Rm×n中的一个样本,x*表示所述样本x经过最值归一化后处理后得到的正常工况标准数据集X*∈Rm×n中对应的样本,min(X)表示正常工况数据集X按行比较得到的最小值向量,max(X)表示正常工况数据集X按行比较得到的最大值向量,m代表样本维数,n代表样本个数,所述原始正常工况数据集X为矩阵;
利用所述正常工况标准数据集通过最小化重构误差训练自编码器模型,得到编码器,基于所述正常工况标准数据集及所述编码器训练对抗网络得到生成器和判别器;分别求取所述正常工况标准数据集、所述待测标准样本对应的统计量,基于所述正常工况标准数据集的统计量利用核密度估计方法计算出控制限;
所述分别求取所述正常工况标准数据集、所述待测标准样本对应的统计量过程包括,
根据判别器输出及所述自编码器中所提取潜隐变量定义统计量,采用如下数学模型:
D_score=1-D(x)
Figure FDF0000020833330000012
其中,x表示需要计算统计量的样本,D(x)表示所述判别器以x作为输入时的输出,E(x)表示待测样本经自编码器编码后的降维输出,
Figure FDF0000020833330000013
表示训练集经自编码器编码后降维输出的均值;
基于所述待测标准样本统计量与所述控制限绘制控制图并比较判断是否发生故障,完成故障检测;
其中,利用所述正常工况标准数据集通过最小化重构误差L(θ)训练自编码器模型包括,
采用的如下数学模型:
Figure FDF0000020833330000021
其中,θ表示自编码器网络参数,X表示自编码器输入,X′表示自编码器对输入X的重构输出;
利用所述正常工况标准数据集及所述编码器训练对抗网络得到生成器和判别器包括,
将所述自编码器E降维后的输入作为生成网络中生成器的输入,利用所述正常工况标准数据集X′train通过最小化生成器G及判别器D得到各自的代价函数LD,LG
采用的如下数学模型:
Figure FDF0000020833330000022
Figure FDF0000020833330000023
/>
其中,E表示求期望,x~Pdata表示样本x服从真实样本的数据分布,z~Platent表示变量z服从隐变量空间的数据分布,G(z)表示将隐变量z映射到与真实样本维度一致的生成样本空间,D(·)表示判别器输出,其值位于0-1之间;定义样本u为某一未知样本,D(u)越趋向于1,则判别器认为样本u为真实样本的概率越大,反之为虚假样本的概率越大。
2.如权利要求1所述的基于编码输入的生成对抗网络故障检测方法,其特征在于:基于所述正常工况标准数据集的统计量利用核密度估计方法计算出控制限包括,
采用如下数学模型:
TD=95quantile of{D_score|x∈Xtrain}
TE=95quantile of{E_score|x∈Xtrain}
其中,D_score|x∈Xtrain表示训练集即正常工况样本计算得到的D_score统计量,E_score|x∈Xtrain同理,95quantile of{D_score|x∈Xtrain}表示根据核密度估计方法使得95%的正常样本统计量位于所得控制限以下,TD、TE表示D_score及E_score统计量的控制限。
3.如权利要求2所述的基于编码输入的生成对抗网络故障检测方法,其特征在于:基于所述待测标准样本统计量与所述控制限比较判断是否发生故障准则包括,
当D_score统计量大于等于控制限TD或E_score统计量大于等于控制限TE时,则确定待测样本发生了故障。
4.一种基于编码输入的生成对抗网络故障检测系统,其特性在于,包括:
标准化处理模块(100),用于获取原始正常工况数据集及待测样本,对所述原始正常工况数据集进行最值归一化处理得到正常工况标准数据集,对所述待测样本进行归一化操作得到待测标准样本;
所述原始正常工况数据集Xtrain进行最值归一化处理得到正常工况标准数据集Xtrain过程包括,
采用的如下数学模型:
Figure FDF0000020833330000031
其中,x表示所述原始正常工况数据集X∈Rm×n中的一个样本,x*表示所述样本x经过最值归一化后处理后得到的正常工况标准数据集X*∈Rm×n中对应的样本,min(X)表示正常工况数据集X按行比较得到的最小值向量,max(X)表示正常工况数据集X按行比较得到的最大值向量,m代表样本维数,n代表样本个数,所述原始正常工况数据集X为矩阵;
统计量求取模块(200),用于利用所述正常工况标准数据集通过最小化重构误差训练自编码器模型,得到编码器,基于所述正常工况标准数据集及所述编码器训练对抗网络得到生成器和判别器;分别求取所述正常工况标准数据集、所述待测标准样本对应的统计量,基于所述正常工况标准数据集的统计量利用核密度估计方法计算出控制限;
所述分别求取所述正常工况标准数据集、所述待测标准样本对应的统计量过程包括,
根据判别器输出及所述自编码器中所提取潜隐变量定义统计量,采用如下数学模型:
D_score=1-D(x)
Figure FDF0000020833330000032
/>
其中,x表示需要计算统计量的样本,D(x)表示所述判别器以x作为输入时的输出,E(x)表示待测样本经自编码器编码后的降维输出,
Figure FDF0000020833330000041
表示训练集经自编码器编码后降维输出的均值;
故障诊断模块(300),用于基于所述待测标准样本统计量与所述控制限绘制控制图并比较判断是否发生故障,完成故障检测;
其中,利用所述正常工况标准数据集通过最小化重构误差L(θ)训练自编码器模型包括,
采用的如下数学模型:
Figure FDF0000020833330000042
其中,θ表示自编码器网络参数,X表示自编码器输入,X′表示自编码器对输入X的重构输出;
利用所述正常工况标准数据集及所述编码器训练对抗网络得到生成器和判别器包括,
将所述自编码器E降维后的输入作为生成网络中生成器的输入,利用所述正常工况标准数据集Xtrain通过最小化生成器G及判别器D得到各自的代价函数LD,LG
采用的如下数学模型:
Figure FDF0000020833330000043
Figure FDF0000020833330000044
其中,E表示求期望,x~Pdata表示样本x服从真实样本的数据分布,z~Platent表示变量z服从隐变量空间的数据分布,G(z)表示将隐变量z映射到与真实样本维度一致的生成样本空间,D(·)表示判别器输出,其值位于0-1之间;定义样本u为某一未知样本,D(u)越趋向于1,则判别器认为样本u为真实样本的概率越大,反之为虚假样本的概率越大。
CN202110387887.4A 2021-04-12 2021-04-12 一种基于编码输入的生成对抗网络故障检测方法及系统 Active CN113095402B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110387887.4A CN113095402B (zh) 2021-04-12 2021-04-12 一种基于编码输入的生成对抗网络故障检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110387887.4A CN113095402B (zh) 2021-04-12 2021-04-12 一种基于编码输入的生成对抗网络故障检测方法及系统

Publications (2)

Publication Number Publication Date
CN113095402A CN113095402A (zh) 2021-07-09
CN113095402B true CN113095402B (zh) 2023-06-13

Family

ID=76676344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110387887.4A Active CN113095402B (zh) 2021-04-12 2021-04-12 一种基于编码输入的生成对抗网络故障检测方法及系统

Country Status (1)

Country Link
CN (1) CN113095402B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113485863B (zh) * 2021-07-14 2023-05-05 北京航空航天大学 基于改进生成对抗网络生成异构不平衡故障样本的方法
CN113779790A (zh) * 2021-09-08 2021-12-10 江南大学 基于自编码器误差重构的故障监测方法、装置及介质
CN114136565B (zh) * 2021-10-22 2022-08-09 中南大学 一种多振源系统的故障诊断系统及方法
CN115291108A (zh) * 2022-06-27 2022-11-04 东莞新能安科技有限公司 数据生成方法、装置、设备及计算机程序产品
CN116049719A (zh) * 2023-01-09 2023-05-02 长沙理工大学 基于迁移式生成模型的故障检测和估计方法、系统及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000081A (zh) * 2020-08-31 2020-11-27 江南大学 基于多块信息提取和马氏距离的故障监测方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11423282B2 (en) * 2018-10-30 2022-08-23 Huawei Technologies Co., Ltd. Autoencoder-based generative adversarial networks for text generation
CN109580215B (zh) * 2018-11-30 2020-09-29 湖南科技大学 一种基于深度生成对抗网络的风电传动系统故障诊断方法
CN111275024B (zh) * 2020-03-22 2023-03-21 东北电力大学 含噪声标签有限数据驱动的变工况风机滚动轴承故障诊断方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000081A (zh) * 2020-08-31 2020-11-27 江南大学 基于多块信息提取和马氏距离的故障监测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Data Reconstruction Method based on Adversarial Conditional Variational Autoencoder;Yifu Ren等;《2020 IEEE 9th Data Driven Control and Learning Systems Conference (DDCLS)》;20201207;第622-626页 *
Outlier Detection for Monitoring Data Using Stacked Autoencoder;Fangyi Wan等;《IEEE Access》;20191128;第173827-173837页 *

Also Published As

Publication number Publication date
CN113095402A (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
CN113095402B (zh) 一种基于编码输入的生成对抗网络故障检测方法及系统
Zhu et al. Estimation of bearing remaining useful life based on multiscale convolutional neural network
Krause et al. Using visual analytics to interpret predictive machine learning models
CN112655004A (zh) 用于异常检测和/或预测性维护的计算机实现的方法、计算机程序产品以及系统
CN112036513B (zh) 基于内存增强潜在空间自回归的图像异常检测方法
CN114065862A (zh) 一种多维时序数据异常检测方法和系统
JP7126256B2 (ja) 異常診断装置、異常診断方法、及びプログラム
Shah et al. Abnormality detection using deep neural networks with robust quasi-norm autoencoding and semi-supervised learning
He et al. Developing ladder network for intelligent evaluation system: Case of remaining useful life prediction for centrifugal pumps
Chaleshtori et al. A novel bearing fault diagnosis approach using the Gaussian mixture model and the weighted principal component analysis
CN117076171A (zh) 一种面向多元时序数据的异常检测及定位方法及装置
CN115526847A (zh) 一种基于半监督学习的主板表面缺陷检测方法
Rani et al. Fault detection and isolation using probabilistic wavelet neural operator auto-encoder with application to dynamic processes
Shi et al. Intelligent fault diagnosis of rolling mills based on dual attention-guided deep learning method under imbalanced data conditions
Hu et al. A Wasserstein generative digital twin model in health monitoring of rotating machines
CN114595635A (zh) 火电机组主汽温度数据的特征选择方法、系统及设备
Xu et al. A graph-guided collaborative convolutional neural network for fault diagnosis of electromechanical systems
Szarek et al. Non-gaussian feature distribution forecasting based on ConvLSTM neural network and its application to robust machine condition prognosis
Li et al. An order-invariant and interpretable dilated convolution neural network for chemical process fault detection and diagnosis
CN117313015A (zh) 一种基于时序和多变量的时间序列异常检测方法及系统
CN117269742A (zh) 一种高海拔环境下断路器健康状态评估方法、装置及介质
CN116704208A (zh) 基于特征关系的局部可解释方法
CN113379326B (zh) 一种基于深度神经网络的电网灾情应急演练管理系统
CN111797732B (zh) 一种对采样不敏感的视频动作识别对抗攻击方法
Dang et al. Vibration-based building health monitoring using spatio-temporal learning model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant