CN108875771A - 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法 - Google Patents

一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法 Download PDF

Info

Publication number
CN108875771A
CN108875771A CN201810295725.6A CN201810295725A CN108875771A CN 108875771 A CN108875771 A CN 108875771A CN 201810295725 A CN201810295725 A CN 201810295725A CN 108875771 A CN108875771 A CN 108875771A
Authority
CN
China
Prior art keywords
lstm
sgrbm
rnn
data
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810295725.6A
Other languages
English (en)
Other versions
CN108875771B (zh
Inventor
葛志强
孙庆强
杨杰
宋执环
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201810295725.6A priority Critical patent/CN108875771B/zh
Publication of CN108875771A publication Critical patent/CN108875771A/zh
Application granted granted Critical
Publication of CN108875771B publication Critical patent/CN108875771B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法,它由稀疏高斯伯努利受限玻尔兹曼机、长短时记忆循环神经网络、感知器和Softmax输出层组成;稀疏高斯伯努利受限玻尔兹曼机能够从无标签数据中学习数据的非线性特征,循环神经网络可以很好的处理序列数据,采用长短时记忆单元则解决了网络训练过程中出现的梯度消失或梯度爆炸问题,感知器和Softmax输出层增强了网络的有监督分类能力,本发明的模型具有对非线性数据和动态性数据的优良的特征提取和感知能力,可以有效地解决因过程数据的非线性和故障数据动态性等特点导致的故障分类准确率低的问题。

Description

一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的 故障分类模型及方法
技术领域
本发明属于工业过程故障诊断和分类领域,涉及一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法。
背景技术
在过程监测中,当检测到故障发生时,根据异常的过程传感数据,及时准确的识别并判断故障类别,对于保障工业过程的安全运行和产品的优质产出具有至关重要的意义。精确的故障分类可以帮助操作人员进一步定位故障发生的环节和引发故障的过程变量,有助于故障清除和过程恢复,因此故障分类在工业生产中有不容忽视的地位。
随着现代工业规模日趋庞大,过程数据也越来越复杂,过程变量之间往往存在较强的非线性关系,导致基于线性假设的传统建模方法在工业数据的故障分类中往往会造成故障的错分或者无法准确识别故障发生的种类,因此具有很大的局限性,不再能适应数据特性越趋复杂的实际工业背景。近年来,随着深度学习的方法被广泛的研究和应用,基于神经网络的方法在处理非线性数据上具有优良的表现,其中稀疏高斯伯努利受限玻尔兹曼机作为生成模型可以从无标签数据中有效地提取训练数据的非线性特征,从而在很多领域得到广泛的应用。
在传统的受限玻尔兹曼机的训练过程中,都需要假设数据样本是独立的,然而由于过程的反馈、自相关的噪声干扰等,都会导致数据的动态性(也称为自相关性)。动态性已成为工业过程故障数据不容忽视的重要特征,因此在实际建模中就需要一个动态模型来克服数据的动态性问题,通过在故障分类模型中引入动态方法以期提高故障区分准确性。
发明内容
针对目前工业过程中有标签样本少、非线性和动态性强等问题,本发明提出了一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法,该方法将稀疏高斯伯努利受限玻尔兹曼机和长短时记忆循环神经网络相结合成为SGRBM-LSTM-RNN网络,实现了对工业过程中故障的精确分类。
本发明具体技术方案如下:
一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型,其特征在于,该模型简称为SGRBM-LSTM-RNN,共分为四部分,第一部分包含k个稀疏高斯伯努利受限玻尔兹曼机网络,即SGRBM,其中k为序列长度,每个SGRBM包含一个输入层和一个隐藏层;第二部分包含k个长短时记忆单元组成的长短时记忆循环神经网络,即LSTM-RNN;第三部分是一个单隐藏层的感知器,第四部分是Softmax网络层;其中第k个长短时记忆单元的隐藏层状态输出至感知器中,再由Softmax网络层输出每个类别的后验概率;模型相关的参数包括输入序列的长度k,SGRBM的输入层和隐藏层的连接权重W1,输入层和隐藏层的偏置a,b1,LSTM-RNN中遗忘门、输入门和输出门的权重和偏置Wf,bf,Wi,bi,Wo,bo,第k个LSTM单元到感知器的隐藏层的权重和偏置W2,b2,感知器的隐藏层到Softmax层的权重和偏置W3,b3;该模型对应数据的输入变量为序列X,输出变量为Y,LSTM-RNN的细胞状态和隐藏层输出分别为C和h;
所述的SGRBM-LSTM-RNN模型的训练过程分为三个阶段:
(1)SGRBM无监督预训练
利用单个采样时刻的无标签数据作为输入,应用对比散度算法更新参数θ1={W1,a,b1},然后更新隐藏层偏置b1使之满足稀疏约束条件,不断重复更新θ1和b1直至收敛,得到预训练完的SGRBM模型;
(2)LSTM-RNN、感知器和Softmax层参数初始化
采取深度学习Xavier初始化方法对LSTM中遗忘门、输入门和输出门的权重、偏置和感知器、Softmax层的连接权重以及每层的偏置Wf,bf,Wi,bi,Wo,bo,W2,b2,W3,b3进行初始化;
(3)SGRBM-LSTM-RNN有监督训练
将(1)、(2)得到的参数作为SGRBM-LSTM-RNN的模型参数初值,将序列数据集输入到SGRBM-LSTM-RNN模型中,经过SGRBM和LSTM-RNN的特征编码前向传播至感知器层后获取特征h,再将{(h1,y1),(h2,y2),...,(hL,yL)}输入至Softmax网络层中,最小化有监督学习分类误差,相当于最大化如下优化函数:
其中,θ代表整个网络的权重和偏置参数,P(·)表示概率;
基于优化函数,通过时间反向传播算法对整个SGRBM-LSTM-RNN网络参数进行调整,经多次迭代收敛后得到整个网络最优参数θ*,即获得训练好的SGRBM-LSTM-RNN模型。
优选地,所述的长短时记忆单元的个数k为8-10。
优选地,所述的LSTM-RNN、感知器和Softmax层参数初始化过程中,采用的是Xavier初始化方法,其目标为使所在层输入维度为ni,输出维度为no的参数满足下式的均匀分布:
优选地,所述的SGRBM-LSTM-RNN模型的训练过程中学习率指数衰减的衰减系数为0.01-0.1,SGRBM的隐藏层的稀疏概率值为0.85-0.95。
一种基于所述的基于叠稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型的故障分类方法,其特征在于,该方法包括如下步骤:
步骤一:收集历史工业过程的离线数据组成建模用的训练数据集,所述的训练数据集为含有故障类别标签的有标签数据集D={X,Y}={(xi,yi)},其中yi∈{1,2,...,C},i=1,2,...,n,n表示有标签数据集的样本个数,C为故障类别个数;
步骤二:将步骤一中收集到的训练数据集标准化,将过程变量化成均值为0,方差为1的新的数据集,并通过one-hot编码将表示类别的标量转化为一维向量,设定序列的长度为k,在每个类别的数据子集中用长度为k的时间窗滑取过程数据,并给定标签数据,从而得到新的序列样本集其中
步骤三:首先取有标签样本集Ds的无标签数据作为输入,对SGRBM进行无监督预训练,然后将LSTM-RNN、感知器和Softmax层的参数初始化,最后将整个有标签样本集Ds作为输入,对SGRBM-LSTM-RNN进行有监督训练,采用时间反向传播算法调整整个网络权重,得到训练好的SGRBM-LSTM-RNN网络;
步骤四:收集新的未知故障类别的工业过程数据,将过程变量标准化,然后按照离线建模时相同长度的时间窗滑取序列数据,得到新的序列样本集ds
步骤五:将序列样本集ds输入到步骤三训练好的SGRBM-LSTM-RNN网络中,通过网络的前向传播获取LSTM-RNN最后一个长短时记忆单元的隐藏层特征,将其输入感知器和Softmax分类器中,求取每个故障类别的后验概率,根据最大后验概率,实现对于该段序列的故障分类。
本发明的有益效果是,本发明可以获取每个时刻样本的非线性特征同时考虑了相邻时刻样本间的相互影响,进一步提升模型对过程非线性、动态性数据的特征提取能力,从而有效提升故障分类的精度。
附图说明
图1是基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的一个示例的模型结构示意图;
图2是Tennessee Eastman(TE)过程流程图;
图3是过程数据的序列化操作示意图;
图4是22类测试样本(含正常工况)的真实故障标签示意图;
图5是SGRBM-LSTM-RNN模型得到的故障分类结果示意图;
图6是LSTM-RNN和SGRBM-LSTM-RNN对22类TE过程故障情况(含正常工况)的平均准确率随时间步长变化对比图。
具体实施方式
下面结合具体实施方式对本发明基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类方法作进一步的详述。
一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型,其特征在于,该模型简称为SGRBM-LSTM-RNN,共分为四部分,第一部分包含k个稀疏高斯伯努利受限玻尔兹曼机网络,即SGRBM,其中k为序列长度,每个SGRBM包含一个输入层和一个隐藏层;第二部分包含k个长短时记忆单元组成的长短时记忆循环神经网络,即LSTM-RNN;第三部分是一个单隐藏层的感知器,第四部分是Softmax网络层;其中第k个长短时记忆单元的隐藏层状态输出至感知器中,再由Softmax网络层输出每个类别的后验概率;模型相关的参数包括输入序列的长度k,SGRBM的输入层和隐藏层的连接权重W1,输入层和隐藏层的偏置a,b1,LSTM-RNN中遗忘门、输入门和输出门的权重和偏置Wf,bf,Wi,bi,Wo,bo,第k个LSTM单元到感知器的隐藏层的权重和偏置W2,b2,感知器的隐藏层到Softmax层的权重和偏置W3,b3;该模型对应数据的输入变量为序列X,输出变量为Y,LSTM-RNN的细胞状态和隐藏层输出分别为C和h;
所述的SGRBM-LSTM-RNN模型的训练过程分为三个阶段:
(1)SGRBM无监督预训练
利用单个采样时刻的无标签数据作为输入,应用对比散度算法更新参数θ1={W1,a,b1},然后更新隐藏层偏置b1使之满足稀疏约束条件,不断重复更新θ1和b1直至收敛,得到预训练完的SGRBM模型;预训练的目标是通过最大概率拟合训练数据从而得到最优参数。因为在同一个过程数据集上k个SGRBM共享参数,故只需要训练一个SGRBM模型。
(2)LSTM-RNN、感知器和Softmax层参数初始化
采取深度学习Xavier初始化方法对LSTM中遗忘门、输入门和输出门的权重、偏置和感知器、Softmax层的连接权重以及每层的偏置Wf,bf,Wi,bi,Wo,bo,W2,b2,W3,b3进行初始化;
优选地,所述的LSTM-RNN、感知器和Softmax层参数初始化过程中,采用的是Xavier初始化方法,Xavier初始化方法是一种有效的神经网络初始化方法,为了使得网络中信息更好地流动,每一层输出的方差应该尽量相同,则Xavier初始化方法的目标为使所在层输入维度为ni,输出维度为no的参数满足下式的均匀分布:
(3)SGRBM-LSTM-RNN有监督训练
将(1)、(2)得到的参数作为SGRBM-LSTM-RNN的模型参数初值,将序列数据集输入到SGRBM-LSTM-RNN模型中,经过SGRBM和LSTM-RNN的特征编码前向传播至感知器层后获取特征h,再将{(h1,y1),(h2,y2),...,(hL,yL)}输入至Softmax网络层中,最小化有监督学习分类误差,相当于最大化如下优化函数:
其中,θ代表整个网络的权重和偏置参数,P(·)表示概率;
基于优化函数,通过时间反向传播算法对整个SGRBM-LSTM-RNN网络参数进行调整,经多次迭代收敛后得到整个网络最优参数θ*,即获得训练好的SGRBM-LSTM-RNN模型。
优选地,所述的长短时记忆单元的个数k为8-10。
优选地,所述的SGRBM-LSTM-RNN模型的训练过程中学习率指数衰减的衰减系数为0.01-0.1,SGRBM的隐藏层的稀疏概率值为0.85-0.95。
一种基于权利要求1所述的基于叠稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型的故障分类方法,其特征在于,该方法包括如下步骤:
步骤一:收集历史工业过程的离线数据组成建模用的训练数据集,所述的训练数据集为含有故障类别标签的有标签数据集D={X,Y}={(xi,yi)},其中yi∈{1,2,...,C},i=1,2,...,n,n表示有标签数据集的样本个数,C为故障类别个数;
步骤二:将步骤一中收集到的训练数据集标准化,将过程变量化成均值为0,方差为1的新的数据集,并通过one-hot编码将表示类别的标量转化为一维向量,设定序列的长度为k,在每个类别的数据子集中用长度为k的时间窗滑取过程数据,并给定标签数据,从而得到新的序列样本集其中
步骤三:首先取有标签样本集Ds的无标签数据作为输入,对SGRBM进行无监督预训练,然后将LSTM-RNN、感知器和Softmax层的参数初始化,最后将整个有标签样本集Ds作为输入,对SGRBM-LSTM-RNN进行有监督训练,采用时间反向传播算法调整整个网络权重,得到训练好的SGRBM-LSTM-RNN网络;
步骤四:收集新的未知故障类别的工业过程数据,将过程变量标准化,然后按照离线建模时相同长度的时间窗滑取序列数据,得到新的序列样本集ds
步骤五:将序列样本集ds输入到步骤三训练好的SGRBM-LSTM-RNN网络中,通过网络的前向传播获取LSTM-RNN最后一个长短时记忆单元的隐藏层特征,将其输入感知器和Softmax分类器中,求取每个故障类别的后验概率,根据最大后验概率,实现对于该段序列的故障分类。
为了评价该故障分类模型的分类效果,定义某类故障对应的分类准确率accuracy,计算公式如下:
其中,S为实际标签为该类故障的样本数,CT为实际标签为该类故障的样本被正确分为该类的样本数。
为了更好的说明基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的模型的结构,假设输入变量为Xs,则网络中包含有3(序列长度)个稀疏高斯伯努利受限玻尔兹曼机以及由3个长短时记忆细胞单元构成的循环神经网络,其中每个稀疏高斯伯努利受限玻尔兹曼机的输入层神经元个数为3,隐藏层神经元个数为6,感知器层和Softmax输出层的神经元个数分别为4和2(类别数),基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的模型结构示意图如图1所示。在实际应用过程中网络的输入、输出神经元个数由数据集决定,各隐藏层神经元个数、时间窗长度通过经验和调试得到。
以下结合一个具体的TE过程的例子来说明基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类方法的性能。TE过程是故障诊断与故障分类领域常用的标准数据集,整个数据集包括53个过程变量,其工艺流程如图2所示。该流程由气液分离塔,连续搅拌式反应釜,分凝器,离心式压缩机,再沸器等5个操作单元组成,该过程可以由多个代数和微分方程来表示,非线性和强耦合性是该过程传感数据的主要特点。
TE过程可人为设置21类故障,在这21类故障中,包括16类已知故障,5类未知故障,故障的种类包括流量的阶跃变化、缓慢斜坡增大、阀门的粘滞等等,包含典型的非线性故障和动态性故障,表1给出了21类故障的具体介绍。
表1 TE过程故障列表
针对该过程,将所有53个过程变量作为建模变量,在所有21类故障工况加上正常工况总共22类数据上测试分类性能。从TE标准数据集中的每类样本按采样时间由时间窗口滑取800个训练样本,总共17600段序列样本,随机从每类工况中挑选10%即80段序列样本作为测试数据,如图3所示为时间窗长度k=3的过程数据序列化操作示意图。
SGRBM-LSTM-RNN网络的SGRBM输入节点数为53,SGRBM隐藏层的节点数为120,LSTM隐藏层的节点数为100,时间步长为10,感知器隐藏层的节点数为100,Softmax输出层的节点数为22。所有网络在训练时的初始学习率设置为1e-3,每次选取一个批次数据进行随机梯度下降,批次大小256,一次迭代周期满足遍历完所有训练样本,总共迭代250次,学习率随着迭代次数指数衰减,衰减系数为0.1,SGRBM隐层的稀疏概率值为0.9。
图4是所有测试集的正确工况类别标签,图5是SGRBM-LSTM-RNN网络预测的所有测试集的结果。通过图4和图5的对比,可以看出所提出的基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类方法对不同的故障类别都能极好地区分出来,准确率达到99%以上。
图6展示了LSTM-RNN和SGRBM-LSTM-RNN两种算法的分类效果对比,将两种网络共有部分即LSTM的隐层节点和时间步长保持一致,通过调整时间步长,观察分类准确率的变化情况。可以看出SGRBM-LSTM-RNN总是比LSTM-RNN的准确率要高,验证了本方法中SGRBM所带来的分类性能提升;同时可以看出,随着时间步长的增大,两种方法的分类效果都有所提升,但是序列长度过长也会导致实际的故障诊断不够及时,并且步长增大到一定数值后,分类准确率提升渐趋缓慢,故实际应用时时间步长不宜选择过大,在本例中,时间步长为9时综合性能最佳。

Claims (5)

1.一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型,其特征在于,该模型简称为SGRBM-LSTM-RNN,共分为四部分,第一部分包含k个稀疏高斯伯努利受限玻尔兹曼机网络,即SGRBM,其中k为序列长度,每个SGRBM包含一个输入层和一个隐藏层;第二部分包含k个长短时记忆单元组成的长短时记忆循环神经网络,即LSTM-RNN;第三部分是一个单隐藏层的感知器,第四部分是Softmax网络层;其中第k个长短时记忆单元的隐藏层状态输出至感知器中,再由Softmax网络层输出每个类别的后验概率;模型相关的参数包括输入序列的长度k,SGRBM的输入层和隐藏层的连接权重W1,输入层和隐藏层的偏置a,b1,LSTM-RNN中遗忘门、输入门和输出门的权重和偏置Wf,bf,Wi,bi,Wo,bo,第k个LSTM单元到感知器的隐藏层的权重和偏置W2,b2,感知器的隐藏层到Softmax层的权重和偏置W3,b3;该模型对应数据的输入变量为序列X,输出变量为Y,LSTM-RNN的细胞状态和隐藏层输出分别为C和h。
所述的SGRBM-LSTM-RNN模型的训练过程分为三个阶段:
(1)SGRBM无监督预训练
利用单个采样时刻的无标签数据作为输入,应用对比散度算法更新参数θ1={W1,a,b1},然后更新隐藏层偏置b1使之满足稀疏约束条件,不断重复更新θ1和b1直至收敛,得到预训练完的SGRBM模型;
(2)LSTM-RNN,感知器和Softmax层参数初始化
采取深度学习Xavier初始化方法对LSTM中遗忘门、输入门和输出门的权重、偏置和感知器、Softmax层的连接权重以及每层的偏置Wf,bf,Wi,bi,Wo,bo,W2,b2,W3,b3进行初始化;
(3)SGRBM-LSTM-RNN有监督训练
将(1)、(2)得到的参数作为SGRBM-LSTM-RNN的模型参数初值,将序列数据集输入到SGRBM-LSTM-RNN模型中,经过SGRBM和LSTM-RNN的特征编码前向传播至感知器层后获取特征h,再将{(h1,y1),(h2,y2),...,(hL,yL)}输入至Softmax网络层中,最小化有监督学习分类误差,相当于最大化如下优化函数:
其中,θ代表整个网络的权重和偏置参数,P(·)表示概率;
基于优化函数,通过时间反向传播算法对整个SGRBM-LSTM-RNN网络参数进行调整,经多次迭代收敛后得到整个网络最优参数θ*,即获得训练好的SGRBM-LSTM-RNN模型。
2.根据权利要求1所述的基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型,其特征在于,所述的长短时记忆单元的个数k为8-10。
3.根据权利要求1所述的基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型,其特征在于,所述的LSTM-RNN、感知器和Softmax层参数初始化过程中,采用的是Xavier初始化方法,其目标为使所在层输入维度为ni,输出维度为no的参数满足下式的均匀分布:
4.根据权利要求1所述的基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型,其特征在于,所述的SGRBM-LSTM-RNN模型的训练过程中学习率指数衰减的衰减系数为0.01-0.1,SGRBM的隐藏层的稀疏概率值为0.85-0.95。
5.一种基于权利要求1所述的基于叠稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型的故障分类方法,其特征在于,该方法包括如下步骤:
步骤一:收集历史工业过程的离线数据组成建模用的训练数据集,所述的训练数据集为含有故障类别标签的有标签数据集D={X,Y}={(xi,yi)},其中yi∈{1,2,...,C},i=1,2,...,n,n表示有标签数据集的样本个数,C为故障类别个数;
步骤二:将步骤一中收集到的训练数据集标准化,将过程变量化成均值为0,方差为1的新的数据集,并通过one-hot编码将表示类别的标量转化为一维向量,设定序列的长度为k,在每个类别的数据子集中用长度为k的时间窗滑取过程数据,并给定标签数据,从而得到新的序列样本集其中
步骤三:首先取有标签样本集Ds的无标签数据作为输入,对SGRBM进行无监督预训练,然后将LSTM-RNN、感知器和Softmax层的参数初始化,最后将整个有标签样本集Ds作为输入,对SGRBM-LSTM-RNN进行有监督训练,采用时间反向传播算法调整整个网络权重,得到训练好的SGRBM-LSTM-RNN网络;
步骤四:收集新的未知故障类别的工业过程数据,将过程变量标准化,然后按照离线建模时相同长度的时间窗滑取序列数据,得到新的序列样本集ds
步骤五:将序列样本集ds输入到步骤三训练好的SGRBM-LSTM-RNN网络中,通过网络的前向传播获取LSTM-RNN最后一个长短时记忆单元的隐藏层特征,将其输入感知器和Softmax分类器中,求取每个故障类别的后验概率,根据最大后验概率,实现对于该段序列的故障分类。
CN201810295725.6A 2018-03-30 2018-03-30 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法 Active CN108875771B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810295725.6A CN108875771B (zh) 2018-03-30 2018-03-30 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810295725.6A CN108875771B (zh) 2018-03-30 2018-03-30 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法

Publications (2)

Publication Number Publication Date
CN108875771A true CN108875771A (zh) 2018-11-23
CN108875771B CN108875771B (zh) 2020-04-10

Family

ID=64326197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810295725.6A Active CN108875771B (zh) 2018-03-30 2018-03-30 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法

Country Status (1)

Country Link
CN (1) CN108875771B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210516A (zh) * 2019-04-25 2019-09-06 合刃科技(武汉)有限公司 基于深度学习的机床异常识别方法、系统及终端设备
CN110263949A (zh) * 2019-06-21 2019-09-20 安徽智寰科技有限公司 融合机器机理与人工智能算法系统的数据处理方法及系统
CN111046961A (zh) * 2019-12-16 2020-04-21 浙江大学 基于双向长短时记忆单元和胶囊网络的故障分类方法
CN111079836A (zh) * 2019-12-16 2020-04-28 浙江大学 基于伪标签方法和弱监督学习的过程数据故障分类方法
CN111191726A (zh) * 2019-12-31 2020-05-22 浙江大学 一种基于弱监督学习多层感知器的故障分类方法
CN111222549A (zh) * 2019-12-30 2020-06-02 航天时代飞鸿技术有限公司 一种基于深度神经网络的无人机故障预测方法
CN111240279A (zh) * 2019-12-26 2020-06-05 浙江大学 一种面向工业不平衡数据的对抗增强故障分类方法
CN111783252A (zh) * 2020-07-20 2020-10-16 浙江浙能台州第二发电有限责任公司 一种基于残差网络的控制回路阀门粘滞检测方法
CN113222035A (zh) * 2021-05-20 2021-08-06 浙江大学 基于强化学习和知识蒸馏的多类别不平衡故障分类方法
CN113837486A (zh) * 2021-10-11 2021-12-24 云南电网有限责任公司 一种基于rnn-rbm的配网馈线长期负荷预测方法
CN114298220A (zh) * 2021-12-28 2022-04-08 浙江大学 基于上下文注意力动态特征提取器的故障分类方法
CN117725454A (zh) * 2024-02-08 2024-03-19 国网四川省电力公司电力科学研究院 一种输电线路缺陷特征分布学习方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106769048A (zh) * 2017-01-17 2017-05-31 苏州大学 基于Nesterov动量法的自适应深度置信网络轴承故障诊断方法
CN106909989A (zh) * 2017-02-24 2017-06-30 国网河南省电力公司电力科学研究院 一种电网扰动预测方法及装置
CN107451760A (zh) * 2017-09-04 2017-12-08 西安交通大学 基于时窗滑移受限玻尔兹曼机的滚动轴承故障诊断方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106769048A (zh) * 2017-01-17 2017-05-31 苏州大学 基于Nesterov动量法的自适应深度置信网络轴承故障诊断方法
CN106909989A (zh) * 2017-02-24 2017-06-30 国网河南省电力公司电力科学研究院 一种电网扰动预测方法及装置
CN107451760A (zh) * 2017-09-04 2017-12-08 西安交通大学 基于时窗滑移受限玻尔兹曼机的滚动轴承故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIE YANG ETAL.: "Fault Diagnosis Based on Sparse Class Gaussian Restrict Boltzmann Machine Model", 《2017 IEEE 6TH DATA DRIVEN CONTROL AND LEARNING SYSTEMS CONFERENCE》 *
黎亚雄 等: "基于RNN-RBM语言模型的语音识别研究", 《计算机研究与发展》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210516A (zh) * 2019-04-25 2019-09-06 合刃科技(武汉)有限公司 基于深度学习的机床异常识别方法、系统及终端设备
CN110263949A (zh) * 2019-06-21 2019-09-20 安徽智寰科技有限公司 融合机器机理与人工智能算法系统的数据处理方法及系统
CN110263949B (zh) * 2019-06-21 2021-08-31 安徽智寰科技有限公司 融合机器机理与人工智能算法系统的数据处理方法及系统
CN111046961B (zh) * 2019-12-16 2022-10-04 浙江大学 基于双向长短时记忆单元和胶囊网络的故障分类方法
CN111046961A (zh) * 2019-12-16 2020-04-21 浙江大学 基于双向长短时记忆单元和胶囊网络的故障分类方法
CN111079836A (zh) * 2019-12-16 2020-04-28 浙江大学 基于伪标签方法和弱监督学习的过程数据故障分类方法
CN111079836B (zh) * 2019-12-16 2022-10-04 浙江大学 基于伪标签方法和弱监督学习的过程数据故障分类方法
CN111240279A (zh) * 2019-12-26 2020-06-05 浙江大学 一种面向工业不平衡数据的对抗增强故障分类方法
CN111222549B (zh) * 2019-12-30 2023-10-24 航天时代飞鸿技术有限公司 一种基于深度神经网络的无人机故障预测方法
CN111222549A (zh) * 2019-12-30 2020-06-02 航天时代飞鸿技术有限公司 一种基于深度神经网络的无人机故障预测方法
CN111191726B (zh) * 2019-12-31 2023-07-21 浙江大学 一种基于弱监督学习多层感知器的故障分类方法
CN111191726A (zh) * 2019-12-31 2020-05-22 浙江大学 一种基于弱监督学习多层感知器的故障分类方法
CN111783252A (zh) * 2020-07-20 2020-10-16 浙江浙能台州第二发电有限责任公司 一种基于残差网络的控制回路阀门粘滞检测方法
CN111783252B (zh) * 2020-07-20 2024-01-02 浙江浙能台州第二发电有限责任公司 一种基于残差网络的控制回路阀门粘滞检测方法
CN113222035B (zh) * 2021-05-20 2021-12-31 浙江大学 基于强化学习和知识蒸馏的多类别不平衡故障分类方法
CN113222035A (zh) * 2021-05-20 2021-08-06 浙江大学 基于强化学习和知识蒸馏的多类别不平衡故障分类方法
CN113837486A (zh) * 2021-10-11 2021-12-24 云南电网有限责任公司 一种基于rnn-rbm的配网馈线长期负荷预测方法
CN113837486B (zh) * 2021-10-11 2023-08-22 云南电网有限责任公司 一种基于rnn-rbm的配网馈线长期负荷预测方法
CN114298220A (zh) * 2021-12-28 2022-04-08 浙江大学 基于上下文注意力动态特征提取器的故障分类方法
CN117725454A (zh) * 2024-02-08 2024-03-19 国网四川省电力公司电力科学研究院 一种输电线路缺陷特征分布学习方法
CN117725454B (zh) * 2024-02-08 2024-04-16 国网四川省电力公司电力科学研究院 一种输电线路缺陷特征分布学习方法

Also Published As

Publication number Publication date
CN108875771B (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN108875771A (zh) 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法
CN108875772B (zh) 一种基于堆叠稀疏高斯伯努利受限玻尔兹曼机和强化学习的故障分类模型及方法
Chen et al. A just-in-time-learning-aided canonical correlation analysis method for multimode process monitoring and fault detection
CN109146246B (zh) 一种基于自动编码器和贝叶斯网络的故障检测方法
CN111079836B (zh) 基于伪标签方法和弱监督学习的过程数据故障分类方法
CN106649789B (zh) 一种基于集成半监督费舍尔判别的工业过程故障分类方法
CN111026058B (zh) 基于瓦瑟斯坦距离和自编码器的半监督深度学习故障诊断方法
CN111046961B (zh) 基于双向长短时记忆单元和胶囊网络的故障分类方法
CN111191726B (zh) 一种基于弱监督学习多层感知器的故障分类方法
CN112070128A (zh) 一种基于深度学习的变压器故障诊断方法
CN109298225B (zh) 一种电压量测数据异常状态自动识别模型系统及方法
CN111768000A (zh) 在线自适应微调深度学习的工业过程数据建模方法
CN109409425B (zh) 一种基于近邻成分分析的故障类型识别方法
CN112147432A (zh) 基于注意力机制的BiLSTM模块、变压器状态诊断方法和系统
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
WO2021114320A1 (zh) 一种oica和rnn融合模型的污水处理过程故障监测方法
CN115510975A (zh) 基于并行Transofmer-GRU的多变量时序异常检测方法及系统
Wang et al. An intelligent process fault diagnosis system based on Andrews plot and convolutional neural network
Zhang et al. Amplitude‐frequency images‐based ConvNet: Applications of fault detection and diagnosis in chemical processes
CN114021620B (zh) 基于bp神经网络特征提取的电潜泵故障诊断方法
CN113222045B (zh) 基于加权特征对齐自编码器的半监督故障分类方法
CN110717602A (zh) 一种基于噪音数据的机器学习模型鲁棒性评估方法
CN114169091A (zh) 工程机械部件剩余寿命的预测模型建立方法及预测方法
CN117349595A (zh) 一种面向工业场景的极端少样本故障诊断方法
CN114298413A (zh) 一种水电机组振摆趋势预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant