CN112067053A - 一种面向少数类识别的多策略联合故障诊断方法 - Google Patents

一种面向少数类识别的多策略联合故障诊断方法 Download PDF

Info

Publication number
CN112067053A
CN112067053A CN202010927721.2A CN202010927721A CN112067053A CN 112067053 A CN112067053 A CN 112067053A CN 202010927721 A CN202010927721 A CN 202010927721A CN 112067053 A CN112067053 A CN 112067053A
Authority
CN
China
Prior art keywords
fault
sample
minority
data set
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010927721.2A
Other languages
English (en)
Inventor
李慧芳
樊锐
石其松
王一竹
王丹敬
柴森春
夏元清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202010927721.2A priority Critical patent/CN112067053A/zh
Publication of CN112067053A publication Critical patent/CN112067053A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01DMEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
    • G01D21/00Measuring or testing not otherwise provided for
    • G01D21/02Measuring two or more variables by means not covered by a single other subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种面向少数类识别的多策略联合故障诊断方法,通过对样本数据进行均衡化处理,然后采用均衡的样本数据对构建多策略联合故障诊断模型进行逐级训练,通过构建基于DBN的特征提取器,能够提取多数类样本的深层特征、融合少数类样本的浅层及深层特征,从而提升了少数类故障识别率。本发明从数据、特征及分类器多个层面入手,充分利用深度学习强大的数据表征和特征提取能力,解决因数据类别不平衡所导致的少数类故障识别困难问题,全面提高少数类故障的识别效果。

Description

一种面向少数类识别的多策略联合故障诊断方法
技术领域
本发明属于工业设备故障诊断技术领域,具体涉及一种面向少数类识别的多策略联合故障诊断方法。
背景技术
随着生产发展和科技进步,现代工业设备的大型化、复杂化大大增加了设备维护的难度与成本。设备磨损老化、运行工况复杂、生产环境动态多变等问题,使得故障不可避免,且故障一旦发生或未被及时修复,“轻者”将影响设备运行性能、生产进度甚至产品质量,“重者”可能导致生产系统瘫痪、人员伤亡等灾难性事故,给企业和社会造成巨大损失。因此,利用深度学习对工业设备的运行状态进行评估与预测,对于实时感知设备健康状况、开展预防性维护以及实现智能诊断、减少故障误判,并最终确保生产的无故障运行具有重要意义。
近年来,机器学习及深度学习已被广泛应用于故障诊断领域并取得了很好的成果。但是,实际工业设备故障数据类别数量存在不平衡性,即不同类别故障数据的数量差别较大,其中,数量少的类别称为少数类,数量多的称为多数类。而现有大多数基于机器学习的诊断方法很少考虑甚至忽略这种不平衡,所以在解决类别不平衡故障诊断问题时面临很大的局限性,例如容易将少数类故障识别为多数类故障,诊断精度明显降低。原因在于:一是少数类故障容易被多数类故障淹没,模型难以找到良好的决策边界;二是少数类故障数据量过少,模型很难学习到足够多的少数类特征
现有提升少数类故障识别率的方法(策略)主要分为两类:一是通过不同的采样技术减少多数类样本数量或者增加少数类样本数量,对数据集进行平衡化处理,从数据层面改善类别不平衡性的影响;二是根据数据集的不平衡程度改进现有分类器或者为少数类样本建立独特的单类分类器,从分类器层面增强模型对少数类样本的关注度,提高少数类识别率。虽然这些方法取得了一定效果,但仍存在以下不足:首先,现有采样技术在平衡数据集时,要么容易引入过多噪声,要么难以增加少数类样本的多样性,导致对少数类识别性能的提升很有限;其次,现有分类器改进方法在提升对少数类关注度的同时,难以兼顾对其它多数类的诊断效果,从而影响整体精度。
发明内容
有鉴于此,本发明提供了一种面向少数类识别的多策略联合故障诊断方法,能够实现对多数类及少数类的故障类别的精确识别。
本发明提供的一种面向少数类识别的多策略联合故障诊断方法,包括以下步骤:
步骤1、将工业故障数据集划分为少数类故障数据集和多数类故障数据集,对所述少数类故障数据集进行过采样得到少数类故障采样数据集;以所述少数类故障采样数据集与多数类故障数据集作为输入,以故障类别作为标签,构建故障诊断训练样本集;
步骤2、构建多策略联合故障诊断模型,所述多策略联合故障诊断模型包括基于DBN的特征提取器和故障分类器;所述特征提取器用于从输入数据中提取故障特征;所述故障分类器根据所述故障特征及输入数据判断输入数据的故障类别;所述特征提取器包含两个并联的全连接神经网络;所述故障分类器为深度堆叠网络;
步骤3、采用所述故障诊断训练样本集完成所述特征提取器的训练;将所述少数类故障采样数据集与多数类故障数据集分别输入训练好的特征提取器,将得到少数类故障特征集合与多数类故障特征集合合并为样本故障特征集;采用所述样本故障特征集完成故障分类器的训练;
步骤4、应用中,将待诊断的工业故障数据输入训练好的多策略联合故障诊断模型中,模型的输出即为所述待诊断的工业故障数据的故障类别。
进一步地,所述步骤1中对所述少数类故障数据集进行过采样得到少数类故障采样数据集,包括以下步骤:
计算所述少数类故障数据集中故障数据元素与其余元素之间的欧式距离和,将具有最小欧式距离和的故障数据元素确定为中心元素;由与所述中心元素的欧式距离小于设定值的元素构成中心区域样本集,由不属于所述中心区域样本集的元素构成边界区域样本集;
采用SMOTE算法对所述中心区域样本集进行过采样得到中心区域采样数据集,采用WGAN算法对所述边界区域样本集进行过采样得到边界区域采样数据,由所述中心区域采样数据集与边界区域采样数据构成少数类故障采样数据集。
进一步地,所述步骤2中的全连接神经网络包含两个级联的隐藏层。
进一步地,所述步骤2中的所述故障特征包括一个全连接神经网络的第一级隐藏层的输出和第二级隐藏层的输出,及另一个全连接神经网络的第二级隐藏层的输出。
进一步地,所述步骤2中的所述故障分类器的最后一级堆叠块,采用基于先验分布知识的损失函数Jp,如下式所示:
Figure BDA0002669044000000031
其中,N为所述故障诊断训练样本集中故障类别的个数;y为标签;1{·}为指示函数,即当条件为真时返回1,否则返回0;j与g均为故障类别的编号;aj为预测出的样本属于第j类的概率;ag为预测出的样本属于第g类的概率;wj为样本属于第j类的先验概率;wg为样本属于第g类的先验概率。
有益效果:
1、本发明通过对样本数据进行均衡化处理,然后采用均衡的样本数据对构建多策略联合故障诊断模型进行逐级训练,通过构建基于DBN的特征提取器,能够提取多数类样本的深层特征、融合少数类样本的浅层及深层特征,从而提升了少数类故障识别率。本发明从数据、特征及分类器多个层面入手,充分利用深度学习强大的数据表征和特征提取能力,解决因数据类别不平衡所导致的少数类故障识别困难问题,全面提高少数类故障的识别效果。
2、本发明通过对少数类样本进行区域划分,根据过采样方式各自的特点,在少数类样本的不同区域使用不同的过采样方式,在容易引入噪声的边界区域,采用可拟合样本分布的WGAN,增加边界样本数量的同时尽可能减少引入噪声;在样本的中心区域,采用SMOTE来增多中心样本数量,进一步平衡数据集的同时,增强样本的多样性。因此,实现了对少数类故障样本进行边界增强和多样性提升,从而达到了从数据层面缓解样本不平衡性的目的。
3、本发明通过在堆叠网络中采用基于样本先验分布知识的损失函数,实现了在提升模型对于少数类样本关注度的同时,保证了对其他类别样本的故障诊断性能。
附图说明
图1为本发明提供的一种面向少数类识别的多策略联合故障诊断方法的多策略联合故障诊断模型的训练过程示意图。
图2为本发明提供的一种面向少数类识别的多策略联合故障诊断方法的样本区域感知过采样算法示意图。
图3为本发明提供的一种面向少数类识别的多策略联合故障诊断方法的特征提取器的训练过程示意图。
图4为本发明提供的一种面向少数类识别的多策略联合故障诊断方法的少数类样本多层融合特征及多数类样本深层特征的提取过程示意图。
图5为本发明提供的一种面向少数类识别的多策略联合故障诊断方法的故障分类器示意图。
图6为本发明提供的一种面向少数类识别的多策略联合故障诊断方法的故障诊断精度对比图。
图7为本发明提供的一种面向少数类识别的多策略联合故障诊断方法的故障诊断Recall对比图。
图8为本发明提供的一种面向少数类识别的多策略联合故障诊断方法的故障诊断F1 score对比图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
本发明提供的一种面向少数类识别的多策略联合故障诊断方法,其基本思想是:构建包含基于DBN的特征提取器和故障分类器的多策略联合故障诊断模型,其中,基于DBN的特征提取器既能提取多数类样本的深层特征,又能提取并融合少数类样本的浅层及深层特征,从而提升了少数类故障识别率;故障分类器在提升模型对于少数类样本关注度的同时,也保证了对其他类别样本的故障诊断性能。
本发明提供的一种面向少数类识别的多策略联合故障诊断方法,具体包括以下步骤:
步骤1、将工业故障数据集划分为少数类故障数据集和多数类故障数据集,对所述少数类故障数据集进行过采样得到少数类故障采样数据集;以所述少数类故障采样数据集与多数类故障数据集作为输入,以故障类别作为标签,构建故障诊断训练样本集。
输入为带有故障类别标签的工业故障数据集D=(xi,yi),假设该数据集包括k个样本和N类故障,每个故障样本包含m个属性(特征),其中|D|=k,xi和yi分别表示数据集中第i个样本的样本属性(特征)向量及其相应的类别标签,
Figure BDA0002669044000000061
且i=1,2,...,k,yi=1,2,...,N;
将故障数据集D划分为少数类故障样本集Dmin={D1,D2,...,DS}和多数类故障样本集Dmaj={DS+1,DS+2,...,DN}。假设数据集D的N类故障包含S个少数类,其中D1,D2,...,DS分别表示D中S个不同的少数类故障样本集,DS+1,DS+2,...,DN分别表示D中N-S个不同的多数类故障样本集,且|D1|,|D2|,...,|DS|远小于DS+1|,|DS+2|,...,|DN|。
进一步地,为获得边界较为清晰同时多样性丰富的少数类样本集,本发明提出了对少数类故障样本集Dmin进行过采样的方法,如图2所示,即:首先将少数类样本集划分为“边界区域样本集”和“中心区域样本集”两部分;然后对边界区域样本集利用WGAN算法拟合边界区域样本分布并生成边界样本;最后利用SMOTE算法对中心区域样本进行过采样,以增强样本的多样性。
本发明提出的方法根据两种过采样方式各自的特点,在少数类样本的不同区域使用不同的过采样方式。在容易引入噪声的边界区域,采用可拟合样本分布的WGAN,增加边界样本数量的同时尽可能减少引入噪声。在样本的中心区域,采用SMOTE来增多中心样本数量,进一步平衡数据集的同时,增强样本的多样性。
具体包括如下步骤:
步骤1.1、从第j个少数类故障样本集Dj(j=1,2,...,S)中任选择一个样本i,计算该样本与Dj中其余样本之间的欧氏距离
Figure BDA0002669044000000076
并求和得到第i个样本的“欧氏距离和”Edi
同理,依次计算其余
Figure BDA0002669044000000071
个样本的“欧氏距离和”
Figure BDA0002669044000000072
步骤1.2、从中Dj所有样本的“欧氏距离和”即
Figure BDA0002669044000000073
中,选择最小的“欧氏距离和”对应的样本xc,并将xc作为Dj的中心样本。
步骤1.3、在Dj中,选择与中心样本xc距离最短的l个样本组成Dj的中心区域样本集Dj,c,其余
Figure BDA0002669044000000074
个样本作为Dj的边界区域样本集Dj,b,其中j=1,2,…,S。
步骤1.4、对除Dj外的其余S-1个少数类故障样本集D1,D2,...,Dj-1,Dj+1,...,DS,依次实施步骤1.1到1.3,可分别得到与S-1个少数类样本集相对应的中心区域样本集D1,c,D2,c,...,Dj-1,c,Dj+1,c,...,DS,c和边界区域样本集D1,b,D2,b,…,Dj-1,b,Dj+1,b,...,DS,b
步骤1.5、对S个少数类边界样本集D1,b,D2,b,…,Dj-1,b,Dj+1,b,...,DS,b,分别利用WGAN拟合原始边界样本分布,并生成对应的边界样本。通过将生成的样本依次添加到相应的原始边界样本集,构建新的边界样本集
Figure BDA0002669044000000075
步骤1.6、利用SMOTE分别对步骤1.4中划分出来的中心区域样本集D1,c,D2,c,...,Dj,c,...,DS,c进行过采样,得到新的中心区域样本集
Figure BDA0002669044000000081
步骤1.7、将由步骤1.5得到的
Figure BDA0002669044000000082
步骤1.6得到的
Figure BDA0002669044000000083
与多数类故障数据的{DS+1,DS+2,...,DN}合并,得到较为平衡的数据集Dpro
步骤2、构建多策略联合故障诊断模型,所述多策略联合故障诊断模型包括基于DBN的特征提取器和故障分类器;所述基于DBN的特征提取器用于从输入数据中提取故障特征;所述故障分类器根据所述故障特征及输入数据判断输入数据的故障类别;所述基于DBN的特征提取器包含两个并联的全连接神经网络;所述故障分类器为深度堆叠网络。
构建一个含两个隐层的全连接神经网络NN作为基于DBN的特征提取器,如图3所示,并假设NN:输入层神经元个数等于样本属性维数m,输出层神经元个数与故障类别数N相等,第一个、第二个隐层神经元的个数分别为L1、L2。将NN输入层与第一个隐层、第一个隐层与第二个隐层、第二个隐层与输出层之间的权重与偏置,分别初始化为
Figure BDA0002669044000000084
Wout
Figure BDA0002669044000000085
bout。通过步骤3的训练过程获得权重与偏置的取值。然后,利用训练好的基于DBN的特征提取器提取到的特征值完成故障分类器的训练。
步骤3、采用所述故障诊断训练样本集完成所述特征提取器的训练;将所述少数类故障采样数据集与多数类故障数据集分别输入训练好的特征提取器,将得到少数类故障特征集合与多数类故障特征集合合并为样本故障特征集;采用所述样本故障特征集完成故障分类器的训练。具体训练过程如图1所示。
基于DBN的特征提取器的训练过程:
步骤3.1、利用经过采样的数据集Dpro中的所有样本,训练隐层神经元个数为L1的第一个受限波尔兹曼机RBM1,并获取其可见层与隐层之间的权重
Figure BDA0002669044000000086
和偏置
Figure BDA0002669044000000091
步骤3.2、计算数据集Dpro中所有样本
Figure BDA0002669044000000092
经过RBM1后的输出
Figure BDA0002669044000000093
步骤3.3、将步骤3.2得到的
Figure BDA0002669044000000094
作为第二个受限玻尔兹曼机RBM2的输入,训练具有L2个隐层神经元的RBM2,并获取其可见层与隐层间的权重
Figure BDA0002669044000000095
和偏置
Figure BDA0002669044000000096
步骤3.4、计算数据集Dpro中所有样本依次经过RBM1、RBM2运算后的输出
Figure BDA0002669044000000097
步骤3.5、利用步骤3.4得到的
Figure BDA0002669044000000098
以及相应的原始样本标签
Figure BDA0002669044000000099
训练输入、输出层分别含有L2、N个神经元的分类器τ,并获取其权重Wout和偏置bout
步骤3.6、利用反向传播方法对全连接神经网络NN权重与偏置进行整体微调。假设NN的微调迭代次数为nfeature,通过对NN进行整体“有监督”训练来实现参数微调,直至达到迭代次数nfeature,即获得调整好的全连接神经网络NN′,并得到其输入层与第一个隐层、第一个隐层与第二个隐层、第二个隐层与输出层之间的权重与偏置,即
Figure BDA00026690440000000916
Wout
Figure BDA00026690440000000917
bout
步骤3.7、将数据集Dpro中的所有少数类样本
Figure BDA00026690440000000910
分别输入至神经网络NN′,以提取其浅层及深层特征,并进一步计算融合特征
Figure BDA00026690440000000911
如图4所示。
假设Dpro中有tmin个少数类样本
Figure BDA00026690440000000912
i∈[1,tmin],那么将第i个少数类样本
Figure BDA00026690440000000913
输入至NN′,即可得到第一个隐层输出向量
Figure BDA00026690440000000914
与第二个隐层输出向量
Figure BDA00026690440000000915
将样本
Figure BDA0002669044000000101
对应的第一个隐层输出
Figure BDA0002669044000000102
与第二个隐层输出
Figure BDA0002669044000000103
分别作为该少数类样本的浅层和深层特征,进行融合后得到融合特征
Figure BDA0002669044000000104
为:
Figure BDA0002669044000000105
同理,可得除第i个少数类样本
Figure BDA0002669044000000106
外的其余少数类样本的融合特征
Figure BDA0002669044000000107
步骤3.8、将Dpro中的多数类样本
Figure BDA0002669044000000108
分别输入到经微调后的全连接神经网络NN′,以提取其深层特征
Figure BDA0002669044000000109
假设数据集Dpro包含tmaj个多数类样本
Figure BDA00026690440000001010
i∈[1,tmaj],将第i个多数类样本
Figure BDA00026690440000001011
输入至NN′,得到NN′第二个隐层的输出向量
Figure BDA00026690440000001012
并对
Figure BDA00026690440000001013
进行拼接获得样本
Figure BDA00026690440000001014
的最终深层特征为
Figure BDA00026690440000001015
为:
Figure BDA00026690440000001016
同理,可得除第i个多数类样本
Figure BDA00026690440000001017
外的其余多数类样本的深层特征
Figure BDA00026690440000001018
步骤3.9、利用步骤四提取到的特征与原始样本训练堆叠网络,得到最终的故障分类器。
获得所有样本的特征表示以后,如图5所示,对构建的故障分类器进行训练,具体步骤如下:
步骤3.10、确定堆叠网络的堆叠块个数h及微调迭代次数nstack
步骤3.11、设计不同结构的堆叠块,假设每一个堆叠块包含输入层、隐含层和输出层,其中所有堆叠块的输出层维数都等于故障类别个数N,且设置为Softmax分类层。第一个堆叠块stack1的输入Input1维数等于原始样本属性个数m与其特征维数之和,第二个堆叠块stack2的输入Input2维数等于Input1与第一个堆叠块输出Output1的维数之和,…,依次类推。
步骤3.12、设置堆叠块的超参数。所述超参数包括批训练大小、学习率、迭代次数、正则化参数、激活函数。
步骤3.13、将除最后一个堆叠块stackh以外的所有堆叠块的损失函数设置为交叉熵损失函数,并利用反向传播和梯度下降法依次训练堆叠块。
步骤3.14、将最后一个堆叠块stackh的损失函数设为基于先验分布知识的损失函数,并利用反向传播和梯度下降法训练最后一个堆叠块。
进一步地,假设Dpro数据集中第j类样本的个数为kj,Dpro数据集中的样本总数为kall,令
Figure BDA0002669044000000111
基于先验分布知识的损失函数为:
Figure BDA0002669044000000112
其中,其中,Jp表示目标函数;1{·}表示一个指示函数,其条件为真时返回1,否则返回0;y表示样本的标签,N表示原始数据中样本类别的个数,aj,ag分别表示神经网络模型预测出的样本属于第j类、第g类的概率,且
Figure BDA0002669044000000113
zj为输出层的第j个神经元的输出值,wj,wg分别表示该样本属于第j类、第g类的先验概率。
步骤3.15、利用反向传播和梯度下降法对堆叠网络的参数进行整体微调,直至达到微调迭代次数nstack,即获得最终的故障分类器。
至此,本发明提出的面向少数类识别的多策略联合故障诊断模型已训练完毕。
步骤4、应用中,将待诊断的工业故障数据输入训练好的多策略联合故障诊断模型中,模型的输出即为所述待诊断的工业故障数据的故障类别。
为检验本发明方法的效果,使用python语言对算法进行编程,并采用凯斯西储大学(CWRU)轴承中心的开源轴承数据进行实验验证,以检验本发明提出的面向少数类识别的多策略联合故障诊断方法(MSCFD)的有效性。其中,实验部分的对比方法采用典型的针对不平衡数据的故障诊断方法:支持向量数据描述(SVDD)、加权合成少数类过采样技术(WSMOTE)、生成式对抗网络+卷积神经网络(GAN+CNN)以及深度森林(GcForest)。
在进行实验之前,首先对数据集进行处理。原始数据集包含正常数据、采样频率为12kHz的驱动端故障数据、采样频率为48kHz的驱动端故障数据、风扇端故障数据4个部分,其中:一类、二类为少数类故障,分别包含198和402个故障样本;三类、四类为多数类故障,分别包含1003、1010个故障样本。从中选择四类故障,并将其处理成具有两个少数类和两个多数类的故障数据训练集,即测试集包含四类故障数据样,且样本个数分别为98、95、102、103。。
选取准确率(Accuracy)、召回率(Recall)和F1分数(F1 score)作为算法的性能评价指标,从不同角度评估不同方法的故障诊断效果。各算法在评价指标Accuracy、Recall、F1 score下的对比如图6至图8所示。
各方法的Accuracy如图6所示。由图6可知,与其它方法相比,本发明方法获得了最高的准确率,相对于准确率最低的GcForest提高了约24%,相对于GAN+CNN提高了约3%,整体诊断结果更为准确。
各方法的Recall如图7所示。由图7可知,与其它方法相比,本发明方法的Recall值比Recall值最低的GcForest提高了约42%,虽然略低于SVDD,但从整体准确率和少数类识别率两方面综合来看,本方法能够较为全面地识别出更多的少数类故障,且不牺牲其它类故障的诊断性能。
各方法的F1 score对比如图8所示。本发明方法获得了最高的F1 score值,比WSMOTE高了约8%,比SVDD高了约6%,比F1 score值最低的GcForest高了约26%,证明本发明方法能够更加准确地识别出少数类故障。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种面向少数类识别的多策略联合故障诊断方法,其特征在于,包括以下步骤:
步骤1、将工业故障数据集划分为少数类故障数据集和多数类故障数据集,对所述少数类故障数据集进行过采样得到少数类故障采样数据集;以所述少数类故障采样数据集与多数类故障数据集作为输入,以故障类别作为标签,构建故障诊断训练样本集;
步骤2、构建多策略联合故障诊断模型,所述多策略联合故障诊断模型包括基于DBN的特征提取器和故障分类器;所述特征提取器用于从输入数据中提取故障特征;所述故障分类器根据所述故障特征及输入数据判断输入数据的故障类别;所述特征提取器包含两个并联的全连接神经网络;所述故障分类器为深度堆叠网络;
步骤3、采用所述故障诊断训练样本集完成所述特征提取器的训练;将所述少数类故障采样数据集与多数类故障数据集分别输入训练好的特征提取器,将得到少数类故障特征集合与多数类故障特征集合合并为样本故障特征集;采用所述样本故障特征集完成故障分类器的训练;
步骤4、应用中,将待诊断的工业故障数据输入训练好的多策略联合故障诊断模型中,模型的输出即为所述待诊断的工业故障数据的故障类别。
2.根据权利要求1所述的方法,其特征在于,所述步骤1中对所述少数类故障数据集进行过采样得到少数类故障采样数据集,包括以下步骤:
计算所述少数类故障数据集中故障数据元素与其余元素之间的欧式距离和,将具有最小欧式距离和的故障数据元素确定为中心元素;由与所述中心元素的欧式距离小于设定值的元素构成中心区域样本集,由不属于所述中心区域样本集的元素构成边界区域样本集;
采用SMOTE算法对所述中心区域样本集进行过采样得到中心区域采样数据集,采用WGAN算法对所述边界区域样本集进行过采样得到边界区域采样数据,由所述中心区域采样数据集与边界区域采样数据构成少数类故障采样数据集。
3.根据权利要求1所述的方法,其特征在于,所述步骤2中的全连接神经网络包含两个级联的隐藏层。
4.根据权利要求3所述的方法,其特征在于,所述步骤2中的所述故障特征包括一个全连接神经网络的第一级隐藏层的输出和第二级隐藏层的输出,及另一个全连接神经网络的第二级隐藏层的输出。
5.根据权利要求1所述的方法,其特征在于,所述步骤2中的所述故障分类器的最后一级堆叠块,采用基于先验分布知识的损失函数Jp,如下式所示:
Figure FDA0002669043990000021
其中,N为所述故障诊断训练样本集中故障类别的个数;y为标签;1{·}为指示函数,即当条件为真时返回1,否则返回0;j与g均为故障类别的编号;aj为预测出的样本属于第j类的概率;ag为预测出的样本属于第g类的概率;wj为样本属于第j类的先验概率;wg为样本属于第g类的先验概率。
CN202010927721.2A 2020-09-07 2020-09-07 一种面向少数类识别的多策略联合故障诊断方法 Pending CN112067053A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010927721.2A CN112067053A (zh) 2020-09-07 2020-09-07 一种面向少数类识别的多策略联合故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010927721.2A CN112067053A (zh) 2020-09-07 2020-09-07 一种面向少数类识别的多策略联合故障诊断方法

Publications (1)

Publication Number Publication Date
CN112067053A true CN112067053A (zh) 2020-12-11

Family

ID=73663751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010927721.2A Pending CN112067053A (zh) 2020-09-07 2020-09-07 一种面向少数类识别的多策略联合故障诊断方法

Country Status (1)

Country Link
CN (1) CN112067053A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749741A (zh) * 2020-12-30 2021-05-04 哈尔滨市科佳通用机电股份有限公司 一种基于深度学习的手闸紧固故障识别方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110060553A1 (en) * 2009-07-31 2011-03-10 Lg Electronics Inc. Diagnostic system and method for home appliance
CN106769048A (zh) * 2017-01-17 2017-05-31 苏州大学 基于Nesterov动量法的自适应深度置信网络轴承故障诊断方法
CN108614548A (zh) * 2018-04-03 2018-10-02 北京理工大学 一种基于多模态融合深度学习的智能故障诊断方法
CN109033476A (zh) * 2018-09-11 2018-12-18 北京航空航天大学 一种基于事件线索网络的智能时空数据事件分析方法
CN109490814A (zh) * 2018-09-07 2019-03-19 广西电网有限责任公司电力科学研究院 基于深度学习和支持向量数据描述的计量自动化终端故障诊断方法
CN109816044A (zh) * 2019-02-11 2019-05-28 中南大学 一种基于wgan-gp和过采样的不平衡学习方法
CN110285976A (zh) * 2019-07-09 2019-09-27 哈尔滨工业大学(威海) 基于dbn的多维时序信息驱动航空发动机故障诊断方法
CN111259924A (zh) * 2020-01-07 2020-06-09 吉林大学 一种边界合成、混合采样、异常检测算法及数据分类方法
CN111626336A (zh) * 2020-04-29 2020-09-04 南京理工大学 一种基于不平衡数据集的地铁故障数据分类方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110060553A1 (en) * 2009-07-31 2011-03-10 Lg Electronics Inc. Diagnostic system and method for home appliance
CN106769048A (zh) * 2017-01-17 2017-05-31 苏州大学 基于Nesterov动量法的自适应深度置信网络轴承故障诊断方法
CN108614548A (zh) * 2018-04-03 2018-10-02 北京理工大学 一种基于多模态融合深度学习的智能故障诊断方法
CN109490814A (zh) * 2018-09-07 2019-03-19 广西电网有限责任公司电力科学研究院 基于深度学习和支持向量数据描述的计量自动化终端故障诊断方法
CN109033476A (zh) * 2018-09-11 2018-12-18 北京航空航天大学 一种基于事件线索网络的智能时空数据事件分析方法
CN109816044A (zh) * 2019-02-11 2019-05-28 中南大学 一种基于wgan-gp和过采样的不平衡学习方法
CN110285976A (zh) * 2019-07-09 2019-09-27 哈尔滨工业大学(威海) 基于dbn的多维时序信息驱动航空发动机故障诊断方法
CN111259924A (zh) * 2020-01-07 2020-06-09 吉林大学 一种边界合成、混合采样、异常检测算法及数据分类方法
CN111626336A (zh) * 2020-04-29 2020-09-04 南京理工大学 一种基于不平衡数据集的地铁故障数据分类方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JOSEY MATHEW等: "Classification of Imbalanced Data by Oversampling in Kernel Space of Support Vector Machines", 《TRANSSACTION ON NEURAL NETWORKS AND LEARNING SYSTEMS》 *
ZHANGVALUE: "深度置信网络(Deep Belief Networks)DBN", 《CSDN博客》 *
张传雷等: "《基于图像分析的植物及其病虫害识别方法研究》", 31 October 2018, 中国经济出版社 *
张喆等: "一种带式输送机故障诊断方法", 《工矿自动化》 *
王健等: "《面向样本不平衡的故障特征提取方法》", 28 February 2016, 东北大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749741A (zh) * 2020-12-30 2021-05-04 哈尔滨市科佳通用机电股份有限公司 一种基于深度学习的手闸紧固故障识别方法
CN112749741B (zh) * 2020-12-30 2021-10-01 哈尔滨市科佳通用机电股份有限公司 一种基于深度学习的手闸紧固故障识别方法

Similar Documents

Publication Publication Date Title
CN105975573B (zh) 一种基于knn的文本分类方法
CN103729678B (zh) 一种基于改进dbn模型的水军检测方法及系统
CN110188047B (zh) 一种基于双通道卷积神经网络的重复缺陷报告检测方法
CN111368885B (zh) 一种航空发动机气路故障诊断方法
CN112070128A (zh) 一种基于深度学习的变压器故障诊断方法
CN110827923B (zh) 基于卷积神经网络的精液蛋白质的预测方法
CN111159396B (zh) 面向数据共享交换的文本数据分类分级模型的建立方法
CN114841257A (zh) 一种基于自监督对比约束下的小样本目标检测方法
Dara et al. Feature extraction in medical images by using deep learning approach
CN113283524A (zh) 一种基于对抗攻击的深度神经网络近似模型分析方法
CN111753751A (zh) 一种改进烟花算法的风机故障智能诊断方法
Anandhakrishnan et al. Identification of tomato leaf disease detection using pretrained deep convolutional neural network models
CN112067053A (zh) 一种面向少数类识别的多策略联合故障诊断方法
Rofik et al. The Optimization of Credit Scoring Model Using Stacking Ensemble Learning and Oversampling Techniques
CN108319935B (zh) 基于区域稀疏的人脸群体识别方法
CN113837266B (zh) 一种基于特征提取和Stacking集成学习的软件缺陷预测方法
CN115344695A (zh) 一种基于领域bert模型的服务文本分类方法
CN113723482B (zh) 基于多示例孪生网络的高光谱目标检测方法
CN112257765B (zh) 基于未知类相似类别集的零样本图像分类方法及系统
CN115083511A (zh) 基于图表示学习与注意力的外围基因调控特征提取方法
CN114547294A (zh) 一种基于传播过程综合信息的谣言检测方法及系统
Dattachaudhuri et al. Transparent neural based expert system for credit risk (TNESCR): an automated credit risk evaluation system
Li et al. Study on the Prediction of Imbalanced Bank Customer Churn Based on Generative Adversarial Network
CN110390309B (zh) 一种基于残差分布的手指静脉非法用户识别方法
Ram et al. Receiver Operating Characteristic Optimization Based on Convex Hull and Evolutionary Algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201211