CN113609569A - 一种判别式的广义零样本学习故障诊断方法 - Google Patents

一种判别式的广义零样本学习故障诊断方法 Download PDF

Info

Publication number
CN113609569A
CN113609569A CN202110746293.8A CN202110746293A CN113609569A CN 113609569 A CN113609569 A CN 113609569A CN 202110746293 A CN202110746293 A CN 202110746293A CN 113609569 A CN113609569 A CN 113609569A
Authority
CN
China
Prior art keywords
fault
sample
class
unseen
seen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110746293.8A
Other languages
English (en)
Other versions
CN113609569B (zh
Inventor
李祖欣
黄嘉诚
周哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huzhou University
Original Assignee
Huzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huzhou University filed Critical Huzhou University
Priority to CN202110746293.8A priority Critical patent/CN113609569B/zh
Publication of CN113609569A publication Critical patent/CN113609569A/zh
Application granted granted Critical
Publication of CN113609569B publication Critical patent/CN113609569B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
    • Y04S10/52Outage or fault management, e.g. fault detection or location

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Geometry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Automation & Control Theory (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明公开了一种判别式的广义零样本学习故障诊断方法,属于机器学习算法技术领域,用于解决不能同时对已见类故障(建立模型时用到的故障类别,即有样本的)和未见类故障(未参与模型建立的故障类别,即零样本的)进行分类的问题。在故障分类前先对故障样本进行已见类故障和未见类故障的判别,如果是已见类故障,那么就用监督学习的方法进行分类,如果是未见类故障,就用零样本学习的方法进行分类。通过引入判别器实现同时对已见类故障和未见类故障进行分类。本发明具有可解释性强、鲁棒性好、易实现等优点,可利用于广义零样学习的实际应用。

Description

一种判别式的广义零样本学习故障诊断方法
技术领域
本发明属于机器学习算法技术领域,具体涉及工业过程故障分类,特别是涉及一种判别式的广义零样本学习故障诊断方法。
背景技术
对于监督学习想要对特定故障进行高准确率的分类,那么在训练阶段就要该类别故障大量带标签的样本,并且监督学习只能对已见故障(参与模型训练的类别,即有样本的)进行分类,但在实际情况中事物的类别非常多,并且每天都可能产生新的类别,例如新上市的汽车。因此监督学习在分类任务中有很多局限性:1)收集大量带标签的样本耗时耗力;2)训练模型十分耗时;3)如果出现一种类别不同于已见类故障,那么就要重新收集其带标签的样本并重新训练模型实现对其分类。
为了解决监督学习不能对未见类故障(未参与模型训练的类别,即零样本的)进行分类的问题,现有文献提出了基于属性迁移的零样本学习方法。未见类故障的样本是很少甚至没有,然而少量的样本不能够在监督学习中取得较高的准确率,所以零样本学习没有使用未见类故障的样本。零样本学习的前提假设是参与模型建立的是已见类故障,在实际测试中只有未见类故障,然而在实际情况中已见类故障是常见的,未见类故障是不常见的,所以零样本学习不符合实际使用场景。
发明内容
为了克服现有技术的不足,本发明的目的是提供一种判别式的广义零样本学习故障诊断方法,提供了更为高效,高准确率的故障分类技术方案。
一种判别式的广义零样本学习故障诊断方法,利用已见类故障样本和故障语义描述信息训练模型,在测试阶段实现对已见类故障和未见类故障进行分离,完成分离后判别为已见类故障的样本用监督学习的方法来完成分类,判别为未见类故障的样本用零样本学习的方法完成分类;其中判别器的设计步骤如下:
1)数据采集
已见类故障数据集为:
Figure BDA0003142915830000011
其中
Figure BDA0003142915830000012
表示特征空间
Figure BDA0003142915830000013
的第i个样本;yi∈Ys,代表第i个样本对应的故障类别,Ys代表已见类故障标签的集合,Yu代表已见类故障标签的集合,其中
Figure BDA0003142915830000014
表示第i个样本对应的语义空间
Figure BDA0003142915830000015
的语义描述,其中已见类故障语义描述的集合是As,未见类故障语义描述的集合是Au,其中
Figure BDA0003142915830000016
ns代表已见类故障样本的数量,
Figure BDA0003142915830000017
Figure BDA0003142915830000018
分别代表n维和m维实数空间;对采集的数据先进行小波降噪再进行数据归一化;
2)训练条件生成模型
用已见类故障数据集S来训练条件变分自编码器得到生成器g(h,a),h和a为生成器的输入,h向量的各个元素服从均值为0,方差为1的标准正态分布,记h~N(0,I),保证样本生成的多样性,a为故障类别的语义描述信息,生成器的输出为
Figure BDA0003142915830000021
3)生成伪样本
用训练好的生成器g(h,a)通过a故障类别的不同来生成伪已见类故障数据集合
Figure BDA0003142915830000022
其中输入到生成器的故障语义描述a∈As,生成伪未见类故障数据集合
Figure BDA0003142915830000023
其中输入到生成器的故障语义描述
Figure BDA0003142915830000024
4)训练二分类器
得到
Figure BDA0003142915830000025
Figure BDA0003142915830000026
后再和真实的已见类故障样本集Xs一起训练一个二分类器,其中Xs
Figure BDA0003142915830000027
为已见类,
Figure BDA0003142915830000028
为未见类,生成
Figure BDA0003142915830000029
是为了平衡
Figure BDA00031429158300000210
的样本数量,训练好的判别器用于在测试阶段已见类故障和未见类故障的判别。
步骤2)中a为故障类别的语义描述信息,描述为:温度异常,压强异常,湿度正常,流速正常,描述为向量时异常为“1”,正常为“0”,则a=[1,1,0,0],此时的语义描述就是“0”,“1”的二值描述;若二值描述不能描述等级差异的故障,用0-9这10个等级来描述对应等级的异常程度,其中“0”表示正常,1-9表示异常程度逐渐递增,这时的语义描述就是连续值描述。
步骤2)中将故障类别的语义描述信息a作为约束条件来训练条件变分自编码器,其中条件变分自编码器包括:全连接层和激活层。
步骤3)用生成模型将已见类故障和未见类故障在语义描述空间中的差异来反映到已见类故障和未见类故障在特征空间中的差异。
本发明的有益效果:
监督学习只能对已见类故障进行分类,零样本学习只能对未见类故障进行分类,但是在线样本事先无法得知它属于已见或未见故障类,使得这两种分类方法都不能满足实际应用场景。本发明提出的广义零样本学习故障诊断方法能够同时对已见类故障和未见类故障进行分类,相比于监督学习和零样学习本发明提出的方法更加符合实际场景。本发明具有可解释性强、鲁棒性好、易实现等优点。
附图说明
图1是本发明实现广义零样本学习的基本框架。
具体实施方式
原理介绍
在线发生的故障既有可能是已见类故障也有可能是未见类故障,能够处理这种问题的方法称为广义零样本学习故障诊断方法。
为了实现广义零样本学习的分类目标,需要解决的关键问题是:如何在没有未见类故障样本的情况下实现同时对已见类故障和未见类故障的分类。
为了解决该关键问题需要引入辅助信息,并且辅助信息不能够来自样本,因为未见类故障由于各种原因是没有或很少有具体的样本信息,或者有样本但不能直接用到该系统中,但未见类故障已经被人所发现。事实上故障类别是可以通过语义描述来反映该类别,例如可以用“转速异常”,“温度异常”,“流速异常”等属性来描述一个具体的故障类别,语义描述信息不需要特定的故障样本信息也能够获得。因此通过语义描述来描述已见类故障和未见类故障是可行的。
引入辅助信息后通过已见类故障样本和语义描述信息来实现同时对已见类故障和未见类故障的分类。有了语义描述信息后可以通过生成模型来生成伪未见类故障样本将广义零样本学习转化为监督学习,我们称这种方法为生成式广义零样本学习,但该方法生成的伪未见类故障样本在训练模型前不能够和真实的未见类故障样本进行比较,即不能够保障生成的伪未见类故障样本和真实的未见类故障样本相似,因为未见类故障样本不参与模型建立,所以该方法的解释性弱,结果随机性强,并且出现一种新的未见类故障时需要重新训练模型。另一种方法是在分类前先对故障进行已见类故障和未见类故障的判别,如果判别样本是已见类故障,那么用监督学习的方法来实现对已见类故障的分类,如果判别样本是未见类故障,那么用零样本学习的方法来实现对未见类故障的分类,这样就将广义零样本学习的问题转化为了监督学习和零样本学习的问题通过在分类前先进行已见类故障和未见类故障的判别,而监督学习和零样本学习来实现分类有很多现有的方法,我们称这种方法为判别式广义零样本学习,相较于生成式广义零样本学习,该方法的解释性更强,但是经过判别器再进行分类后误差会累积。本发明用的是判别式广义零样本学习。
问题描述:S={(x,a,y)|x∈Xs,a∈As,y∈Ys}和U={(x,a,y)|x∈Xu,a∈Au,y∈Yu}分别是已见类故障和未见类故障的集合,其中
Figure BDA0003142915830000031
x是采集自传感器的样本数据,a是故障的语义描述,y是故障对应的标签。Xs是已见类故障样本的集合,As是已见类故障的语义描述信息的集合,Ys是已见类故障标签的集合;Xu,Au和Yu分别是未见类故障的样本数据集合,未见类故障的语义描述信息集合和未见类故障的标签集合。S参与模型的训练,Xu不参与模型的训练,在测试阶段如果样本x属于类别Yu,那么就称为零样本学习,如果测试阶段样本x属于类别Yall,其中Yall=Ys∪Yu,即测试样本既有已见类故障又有未见类故障,那么就称为广义零样本学习。
以下结合附图和实施例进行进一步的阐述。
如图1所示,具体步骤如下:
(1)数据介绍
假设已见类数据集为:
Figure BDA0003142915830000032
其中
Figure BDA0003142915830000033
表示特征空间
Figure BDA0003142915830000034
的第i个样本;yi∈Ys,代表第i个样本对应的类别,Ys代表已见类标签的集合;
Figure BDA0003142915830000035
表示第i个样本对应的语义空间
Figure BDA0003142915830000036
的语义描述,其中已见类语义描述的集合是As。ns代表已见类样本的数量。
Figure BDA0003142915830000037
Figure BDA0003142915830000038
分别代表n维和m维实数空间。对于未见类类别Yu
Figure BDA0003142915830000039
(2)训练条件生成模型
用已见类数据集S来训练条件生成模型得到生成器g(h,a),h和a为生成器的输入,h向量的各个元素服从均值为0,方差为1的标准正态分布,记h~N(0,I),保证样本生成的多样性,a为类别的语义描述信息;生成器的输出为x。
(3)生成伪样本
用训练好的生成器g(h,a)通过a类别的不同来生成伪已见类数据集合
Figure BDA0003142915830000041
其中输入到生成器的语义描述a∈As。生成伪未见类数据集合
Figure BDA0003142915830000042
其中输入到生成器的语义描述
Figure BDA0003142915830000043
(4)训练二分类器
得到
Figure BDA0003142915830000044
Figure BDA0003142915830000045
后再和真实的已见类样本集Xs一起训练一个二分类器,其中Xs
Figure BDA0003142915830000046
为已见类,
Figure BDA0003142915830000047
为未见类,生成
Figure BDA0003142915830000048
是为了平衡
Figure BDA0003142915830000049
的样本数量。训练好的二分类器用于已见类和未见类的判别。
进一步的,步骤2中我们用条件变分自编码器(CVAE)作为我们的条件生成模型,其中CVAE由编码器和解码器组成,编码器输出的样本均值(μx)和方差(σx)经过重参数化技巧变为隐藏向量h,其中h=μxx*ε,ε变量采样自标准正太分布
Figure BDA00031429158300000410
h再输入到解码器后得到重构样本
Figure BDA00031429158300000411
为重构误差,
Figure BDA00031429158300000412
为最小化优化方程,KL是Kullback-Leibler散度,KL散度的目的是让隐藏向量h服从标准正太分布,使变分推断过程学到更多更有价值的信息。
Figure BDA00031429158300000413
Figure BDA00031429158300000414
进一步的,步骤3中我们用训练好的生成器g(h,a),我们让a∈As,使得
Figure BDA00031429158300000415
Figure BDA00031429158300000416
使得
Figure BDA00031429158300000417
进一步的,步骤4中我们用来线性支持向量机(LSVM)来实现对已见类和未见类的分类。分离超平面对应的方程为w*·x+b*=0,其中法向量w*和截距b*决定超平面,其对应的分类决策函数和符号函数(sign)如下所示。
f(x)=sign(w*·x+b*)
Figure BDA00031429158300000418
应用实施例
1、实验数据集
本发明使用田纳西-伊斯曼基准过程(TEP)作为算法验证的数据集,TEP是一个在工业上得到充分研究的故障分类数据集,TEP提供21种故障,每种故障有52个特征。每个故障有两部分组成,一个部分是有480个数据点,并且全部是故障;另一个部分有960个数据点,其中前160个数据点是正常的工况,在160个数据点后引入故障。我们选取20个属性对故障进行描述见表2,由于后6个故障的描述过少,所以我们选取了前15个故障来进行我们的实验见表1,故障语义描述见表3,其中行代表表1的15种故障类别,列代表表2的20种属性的语义描述,我们使用二值描述来描述故障,我们按照对这15种故障进行已见类/未见类故障不同的划分将实验分成5组见表4,来验证方法的有效性和鲁棒性。本发明的实验部分使用960个数据点的部分的后800个数据作为训练集(12*800),480部分作为测试集(15*480),其中已见类故障12个,未见类故障3个。
表1数据集故障介绍
Figure BDA0003142915830000051
表2故障语义描述的20类属性介绍
Figure BDA0003142915830000052
Figure BDA0003142915830000061
表3故障的属性描述,20列分别对应着表2的属性,其中“1”代表有该属性,“0”代表没有该属性
Figure BDA0003142915830000062
Figure BDA0003142915830000071
表4故障已见类和未见类的不同划分
Figure BDA0003142915830000072
2、判别器测试实验
比较了本方法与孤立森林和单类支持向量机在5种数据集划分下的判别性能主要有两个指标表现:
整体准确率(A):由于已见类故障和未见类故障的样本数量是不一致的,测试阶段已见类故障样本数量是未见类故障样本数量的3倍,所以要计算判别器的整体准确率。判别器的整体分类准确率首先要大于50%,否则就是低于随机选择的准确率。整体准确率的表达式如下所示,其中Ncorrect为分类正确的样本数,Nall为参与分类的总样本数。
Figure BDA0003142915830000073
调和平均数(H):平均准确率远高于50%也不能证明判别器的性能足够好,因为已见类故障样本多于未见类故障样本,将所有样本分类给已见类故障也能达到很高的整体准确率。所以一个好的判别器应该能够平衡已见类(Ds)和未见类(Du)的准确率,如果已见类和未见类的准确率都很高那将获得较高的调和平均数,如果有一个准确率低,那么将不能获得较高的调和平均数。调和平均数的表达式如下,其中Ds是判别器对已见类故障的分类准确率,Du是判别器对未见类故障的分类准确率。
Figure BDA0003142915830000074
表5判别器对已见类和未见类分类的准确率
Figure BDA0003142915830000081
如表5所示,孤立森林和单类支持向量机分别对已见类故障和未见类故障有较高的分类准确率,我们提出的判别器则很难看出它的性能优于孤立森林和单类支持向量机,如上所述,评价一个判别器的好坏要根据判别器的整体准确率和调和平均数,即整体准确率要高于50%,调和平均数要尽可能高。
表6判别器的整体准确率和判别器对已见类故障和未见类故障准确率的调和平均数
Figure BDA0003142915830000082
由表6可以看出,单类支持向量机的整体准确率在50%左右,显然不是一个好的判别器,而孤立森林的整体准确率虽然都高于50%,但是不能很好平衡已见类和未见类的准确率,我们提出的判别器不仅整体准确率都高于50%,同时也能够获得较高的调和平均数,因此我们提出的方法更适合作为区分已见类故障和未见类故障的判别器。
3.广义零样本学习故障分类结果
上面已经对判别器的性能做出了比较,在这一部分我们将判别器判别为已见类故障的样本用随机森林算法进行监督分类,判别器判别为未见类故障的样本用朴素贝叶斯对其进行属性预测,再用最近邻搜索找出其对应的未见类故障。其中Au为经过判别器后用朴素贝叶斯对判别为未见类故障样本后进行分类的平均准确率,As为经过判别器后用随机森林对判别器判别为已见类故障样本进行分类后的平均准确率。H为Au和As调和平均数,其表达式如下所示。
Figure BDA0003142915830000091
表7广义零样本学习的分类准确率
Figure BDA0003142915830000092
由表7可以看出,我们的方法具有较强的鲁棒性,在5组不同的已见类/未见类故障划分下都能取得高于随机的准确率(1/15),并且能够很好地平衡Au和As从而取得较高的调和平均数。
我们将广义零样本问题转化为了对已见类故障进行监督学习和对未见类故障进行零样本学习通过在具体故障分类前先进行已见类故障和未见类故障的判别,我们通过已见类故障样本和故障语义描述实现了对已见类故障和未见类故障的区分,并且相比于孤立森林和单类支持向量机,我们提出的判别器拥有更好的性能。判别式广义零样本学习的优点是监督学习和零样本学习的方法都是现有的,我们只需要学习一个判别器即可实现广义零样本学习,但是其缺点是经过判别器再进行分类后误差会累积。
上述描述中的实施方案可以进一步组合或者替换,且实施方案仅仅是对本发明的优选实施例进行描述,并非对本发明的构思和范围进行限定,在不脱离本发明设计思想的前提下,本领域普通技术人员对本发明的技术方案做出的各种变化和改进,均属于本发明的保护范围。本发明的保护范围由所附权利要求及其任何等同物给出。

Claims (4)

1.一种判别式的广义零样本学习故障诊断方法,其特征在于,利用已见类故障样本和故障语义描述信息训练模型,在测试阶段实现对已见类故障和未见类故障进行分离,完成分离后判别为已见类故障的样本用监督学习的方法来完成分类,判别为未见类故障的样本用零样本学习的方法完成分类;其中判别器的设计步骤如下:
1)数据采集
已见类故障数据集为:
Figure FDA0003142915820000011
其中
Figure FDA00031429158200000114
表示特征空间
Figure FDA00031429158200000115
的第i个样本;yi∈Ys,代表第i个样本对应的故障类别,Ys代表已见类故障标签的集合,Yu代表已见类故障标签的集合,其中
Figure FDA0003142915820000012
Figure FDA00031429158200000116
表示第i个样本对应的语义空间
Figure FDA00031429158200000117
的语义描述,其中已见类故障语义描述的集合是As,未见类故障语义描述的集合是Au,其中
Figure FDA0003142915820000013
ns代表已见类故障样本的数量,
Figure FDA00031429158200000118
Figure FDA00031429158200000119
分别代表n维和m维实数空间;对采集的数据先进行小波降噪再进行数据归一化;
2)训练条件生成模型
用已见类故障数据集S来训练条件变分自编码器得到生成器g(h,a),h和a为生成器的输入,h向量的各个元素服从均值为0,方差为1的标准正态分布,记h~N(0,I),保证样本生成的多样性,a为故障类别的语义描述信息,生成器的输出为
Figure FDA0003142915820000014
3)生成伪样本
用训练好的生成器g(h,a)通过a故障类别的不同来生成伪已见类故障数据集合
Figure FDA0003142915820000015
其中输入到生成器的故障语义描述a∈As,生成伪未见类故障数据集合
Figure FDA0003142915820000016
其中输入到生成器的故障语义描述
Figure FDA0003142915820000017
4)训练二分类器
得到
Figure FDA0003142915820000018
Figure FDA0003142915820000019
后再和真实的已见类故障样本集Xs一起训练一个二分类器,其中Xs
Figure FDA00031429158200000110
为已见类,
Figure FDA00031429158200000111
为未见类,生成
Figure FDA00031429158200000112
是为了平衡
Figure FDA00031429158200000113
的样本数量,训练好的判别器用于在测试阶段已见类故障和未见类故障的判别。
2.根据权利要求1所述的一种判别式的广义零样本学习故障诊断方法,其特征在于,步骤2)中a为故障类别的语义描述信息,描述为:温度异常,压强异常,湿度正常,流速正常,描述为向量时异常为“1”,正常为“0”,则a=[1,1,0,0],此时的语义描述就是“0”,“1”的二值描述;若二值描述不能描述等级差异的故障,用0-9这10个等级来描述对应等级的异常程度,其中“0”表示正常,1-9表示异常程度逐渐递增,这时的语义描述就是连续值描述。
3.根据权利要求1所述的一种判别式的广义零样本学习故障诊断方法,其特征在于,步骤2)中将故障类别的语义描述信息a作为约束条件来训练条件变分自编码器,其中条件变分自编码器包括:全连接层和激活层。
4.根据权利要求1所述的一种判别式的广义零样本学习故障诊断方法,其特征在于,步骤3)用生成模型将已见类故障和未见类故障在语义描述空间中的差异来反映到已见类故障和未见类故障在特征空间中的差异。
CN202110746293.8A 2021-07-01 2021-07-01 一种判别式的广义零样本学习故障诊断方法 Active CN113609569B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110746293.8A CN113609569B (zh) 2021-07-01 2021-07-01 一种判别式的广义零样本学习故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110746293.8A CN113609569B (zh) 2021-07-01 2021-07-01 一种判别式的广义零样本学习故障诊断方法

Publications (2)

Publication Number Publication Date
CN113609569A true CN113609569A (zh) 2021-11-05
CN113609569B CN113609569B (zh) 2023-06-09

Family

ID=78337170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110746293.8A Active CN113609569B (zh) 2021-07-01 2021-07-01 一种判别式的广义零样本学习故障诊断方法

Country Status (1)

Country Link
CN (1) CN113609569B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114626415A (zh) * 2022-03-14 2022-06-14 广西大学 一种基于人工智能的风电机组复合故障诊断方法
CN114821162A (zh) * 2022-04-12 2022-07-29 天津大学 基于属性知识的轻量化零样本学习算法框架
CN117034020A (zh) * 2023-10-09 2023-11-10 贵州大学 一种基于cvae-gan模型的无人机传感器零样本故障检测方法
CN117075582A (zh) * 2023-09-08 2023-11-17 兰州理工大学 一种基于dsecmr-vae的工业过程广义零样本故障诊断方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017024691A1 (zh) * 2015-08-07 2017-02-16 合肥工业大学 一种模拟电路故障模式分类方法
WO2019046463A1 (en) * 2017-08-29 2019-03-07 Zhoa Tiancheng SYSTEM AND METHOD FOR THE DEFINITION OF DIALOGUE INTENTIONS AND THE CONSTRUCTION OF INTENTION RECOGNITION MODELS WITHOUT PRIOR KNOWLEDGE
US20190230107A1 (en) * 2018-01-24 2019-07-25 Hrl Laboratories, Llc System for continuous validation and threat protection of mobile applications
CN111476294A (zh) * 2020-04-07 2020-07-31 南昌航空大学 一种基于生成对抗网络的零样本图像识别方法及系统
CN112763214A (zh) * 2020-12-31 2021-05-07 南京信息工程大学 基于多标签零样本学习的滚动轴承故障诊断方法
CN112766386A (zh) * 2021-01-25 2021-05-07 大连理工大学 一种基于多输入多输出融合网络的广义零样本学习方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017024691A1 (zh) * 2015-08-07 2017-02-16 合肥工业大学 一种模拟电路故障模式分类方法
WO2019046463A1 (en) * 2017-08-29 2019-03-07 Zhoa Tiancheng SYSTEM AND METHOD FOR THE DEFINITION OF DIALOGUE INTENTIONS AND THE CONSTRUCTION OF INTENTION RECOGNITION MODELS WITHOUT PRIOR KNOWLEDGE
US20190230107A1 (en) * 2018-01-24 2019-07-25 Hrl Laboratories, Llc System for continuous validation and threat protection of mobile applications
CN111476294A (zh) * 2020-04-07 2020-07-31 南昌航空大学 一种基于生成对抗网络的零样本图像识别方法及系统
CN112763214A (zh) * 2020-12-31 2021-05-07 南京信息工程大学 基于多标签零样本学习的滚动轴承故障诊断方法
CN112766386A (zh) * 2021-01-25 2021-05-07 大连理工大学 一种基于多输入多输出融合网络的广义零样本学习方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YIZHE ZHU等: "A Generative Adversarial Approach for Zero-Shot Learning from Noisy Texts", 2018 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION *
孙显;梁伟;刁文辉;曹志颖;冯瑛超;王冰;付琨;: "遥感边缘智能技术研究进展及挑战", 中国图象图形学报 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114626415A (zh) * 2022-03-14 2022-06-14 广西大学 一种基于人工智能的风电机组复合故障诊断方法
CN114821162A (zh) * 2022-04-12 2022-07-29 天津大学 基于属性知识的轻量化零样本学习算法框架
CN117075582A (zh) * 2023-09-08 2023-11-17 兰州理工大学 一种基于dsecmr-vae的工业过程广义零样本故障诊断方法
CN117034020A (zh) * 2023-10-09 2023-11-10 贵州大学 一种基于cvae-gan模型的无人机传感器零样本故障检测方法
CN117034020B (zh) * 2023-10-09 2024-01-09 贵州大学 一种基于cvae-gan模型的无人机传感器零样本故障检测方法

Also Published As

Publication number Publication date
CN113609569B (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
Zhang et al. Machinery fault diagnosis with imbalanced data using deep generative adversarial networks
CN113609569A (zh) 一种判别式的广义零样本学习故障诊断方法
Yin et al. Wasserstein Generative Adversarial Network and Convolutional Neural Network (WG‐CNN) for Bearing Fault Diagnosis
Thomas et al. Data mining and clustering in chemical process databases for monitoring and knowledge discovery
CN110213222B (zh) 基于机器学习的网络入侵检测方法
Salunkhe et al. Classifier ensemble design for imbalanced data classification: a hybrid approach
Ortego et al. Evolutionary LSTM-FCN networks for pattern classification in industrial processes
Yuan et al. Review of resampling techniques for the treatment of imbalanced industrial data classification in equipment condition monitoring
Ramírez-Sanz et al. Semi-supervised learning for industrial fault detection and diagnosis: A systemic review
CN110581840B (zh) 基于双层异质集成学习器的入侵检测方法
CN113485863B (zh) 基于改进生成对抗网络生成异构不平衡故障样本的方法
CN113486931A (zh) 一种基于pda-wgangp的滚动轴承增强诊断方法
Yao et al. Improving rolling bearing fault diagnosis by DS evidence theory based fusion model
CN115112372A (zh) 轴承故障诊断方法、装置、电子设备及存储介质
CN114817856B (zh) 一种基于结构信息保持域适应网络的抽油机故障诊断方法
Xu et al. Wear particle classification using genetic programming evolved features
Hallaji et al. Detection of malicious SCADA communications via multi-subspace feature selection
Wang et al. An Empirical Study of Software Metrics Selection Using Support Vector Machine.
CN109902731B (zh) 一种基于支持向量机的性能故障的检测方法及装置
Khoza et al. Comparing machine learning and statistical process control for predicting manufacturing performance
Al-Dahidi et al. A novel ensemble clustering for operational transients classification with application to a nuclear power plant turbine
US20060179021A1 (en) Using supervised classifiers with unsupervised data
Ma et al. Data generation for rare transient events: A generative adversarial network approach
Liu et al. Study on Chinese text clustering algorithm based on K-mean and evaluation method on effect of clustering for software-intensive system
Oh et al. Multivariate time series open-set recognition using multi-feature extraction and reconstruction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant