CN111914897A - 一种基于孪生长短时间记忆网络的故障诊断方法 - Google Patents

一种基于孪生长短时间记忆网络的故障诊断方法 Download PDF

Info

Publication number
CN111914897A
CN111914897A CN202010610712.0A CN202010610712A CN111914897A CN 111914897 A CN111914897 A CN 111914897A CN 202010610712 A CN202010610712 A CN 202010610712A CN 111914897 A CN111914897 A CN 111914897A
Authority
CN
China
Prior art keywords
fault diagnosis
network
lstm
layer
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010610712.0A
Other languages
English (en)
Inventor
邹见效
凡时财
张季阳
徐红兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010610712.0A priority Critical patent/CN111914897A/zh
Publication of CN111914897A publication Critical patent/CN111914897A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于孪生长短时间记忆网络的故障诊断方法,尤其针对化工过程故障诊断,包括S1、采集化工系统在各种运行状态下各测量设备的测量数据,对其进行降噪处理;S2、对测量数据进行标准化处理构建训练样本;S3、构建故障诊断模型,利用训练样本进行训练;S4、将待诊断的测量数据对应的标准化处理的数据输入到训练好的故障诊断模型中,得到故障类型结果。本发明将具有长短时间记忆功能的LSTM和能够放大相似样本之间微小差异的孪生网络结合起来,进行化工过程的故障诊断,不仅能够通过多层LSTM对复杂动态时序性的数据具有更强的表达能力,而且对微小故障也具有更优的识别能力,使得化工过程的故障诊断效果得到显著提高。

Description

一种基于孪生长短时间记忆网络的故障诊断方法
技术领域
本发明属于化工过程的故障诊断技术领域,具体涉及一种基于孪生长短时间记忆网络(Siamese LSTM)的故障诊断方法。
背景技术
随着计算机技术不断进步,化工工业迅速发展,其整个生产系统日趋复杂化。大规模的化工生产过程使得企业的生产效率加倍提高,从而带来更大的经济效益。然而,这样复杂化的化工过程给企业带来利益的同时也会加大故障发生的效率,若在生产过程中发生故障,轻则导致产品质量下降,重则导致难以估计的人员伤亡和财产损失,所以要保证生产过程可靠、高效运行,需要能准确、及时地诊断故障的技术。
由于化工过程日趋复杂化,其监测数据具有高维度、非线性、动态时序性的特征。因此,基于传统数据驱动的故障诊断方法应用在复杂化工过程中难度较高。深度学习作为数据驱动方法的一个新兴分支,其对高维非线性数据具有强大的学习能力。因此,近年来深度学习方法被广泛应用于化工过程的故障诊断研究。目前,基于深度学习的故障诊断方法主要有:深度置信网络(Deep Belief Networks,DBN)、堆叠自动编码器(Stacked AutoEncoders,SAE)、卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)、长短时间记忆网络(Long Short-Term Memory NeuralNetwork,LSTM)。除RNN和LSTM网络之外的其它深度学习方法虽然与传统的故障诊断方法相比,具有更强的学习能力,并取得更优的故障诊断效果;但是,这些方法忽略了化工过程监测数据之间的时序相关性。事实上,化工过程的观测信号之间并不是相互独立的,在化工过程中当前时刻的过程运行状态与之前时刻过程运行状态具有强关联性,因此,观测信号之间的动态时间依赖特性是故障诊断效果的主要影响因素。
同时,在实际的化工过程中常会出现幅值低、故障特性不明显、易被未知扰动和噪声掩盖的微小故障,虽然微小故障和正常工况没有明显变化,早期对系统没有太大的影响,但是如果没有尽早对这些故障进行诊断和采取相关维护措施,那么经过时间的积累就会给系统带来很大的安全隐患,使得系统不能正常运行。现有的化工过程故障诊断方法对微小故障的诊断效果仍不够理想。
发明内容
针对现有技术中的上述不足,本发明提出的基于孪生长短时间记忆网络的故障诊断方法解决了上述背景技术中的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于孪生长短时间记忆网络的故障诊断方法,包括以下步骤:
S1、采集化工系统在各种运行状态下各测量设备的测量数据,并对其进行降噪处理;
S2、对降噪后的测量数据进行标准化处理,并构建训练样本;
S3、构建基于Siamese LSTM的故障诊断模型,并利用构建的训练样本对其进行训练;
S4、将化工系统运行过程中测量设备的测量数据对应的标准化处理后的数据输入到训练好的故障诊断模型中,得到对应的故障类型诊断结果,实现化工过程的故障诊断。
进一步地,所述步骤S1中的运行状态包括正常状态和K种故障状态;
将第k种运行状态下采样时刻为r时的测量设备的测量数据记为数据向量
Figure BDA0002562031830000021
其中,上标k=0时,表示测量设备处于正常状态,k=1,2,...,K时,表示测量设备的故障状态序号,
Figure BDA0002562031830000031
表示第k种运行状态下采样时刻为r时第n种测量设备的测量数据,下标n为测量设备序号,n=1,2,...,N,N为测量设备总数;
所述步骤S1中降噪处理后的测量数据对应的数据向量为
Figure BDA0002562031830000032
进一步地,所述步骤S2具体为:
S21、将每种运行状态下经过降噪处理后的数据向量进行标准化,得到标准化后的数据向量
Figure BDA0002562031830000033
S22、将数据向量
Figure BDA0002562031830000034
按照采样时刻构成序列
Figure BDA0002562031830000035
式中,下标Tk表示采样时间序列标号;
S23、采用长度为T的滑动窗口对序列
Figure BDA0002562031830000036
进行滑窗处理,得到Hk个子序列
Figure BDA0002562031830000037
其中,Hk表示第k种运行状态下所提取到的子序列总数,下标h=1,2,...,Hk表示第k种运行状态下所提取到的第h个子序列,
Figure BDA0002562031830000038
表示在子序列
Figure BDA0002562031830000039
中第t个数据向量,t=1,2,...,T;
S24、将子序列
Figure BDA00025620318300000310
作为输入,其对应的运行状态序号k作为输出,得到训练样本。
进一步地,所述步骤S3中的故障诊断模型包括特征提取层、相似性度量层和故障诊断层;
所述特征提取层为改进的Siamese LSTM网络,所述特征提取层中将Siamese LSTM网络中用于特征表示的网络替换成两个结构相同的堆叠LSTM网络,分别记为第一堆叠LSTM网络和第二堆叠LSTM网络,用于提取输入序列的特征向量;
所述相似性度量层通过一阶范数的指数函数对第一堆叠LSTM网络输出的特征向量
Figure BDA0002562031830000041
和第二堆叠LSTM网络输出的特征向量
Figure BDA0002562031830000042
进行相似性度量;其中,
Figure BDA0002562031830000043
为第一堆叠LSTM网络输出的特征,
Figure BDA0002562031830000044
为第二堆叠LSTM网络输出的特征;
所述故障诊断层为softmax层,用于对第一堆叠LSTM网络输出的特征向量
Figure BDA0002562031830000045
进行分类得到输入数据对应的运行状态序号,进而确定当前测量设备的运行状态。
进一步地,所述第一堆叠LSTM网络和第二堆叠LSTM网络均由D层LSTM网络叠加而成,每层LSTM网络中的LSTM计算单元数量为T,第d层LSTM网络的第D时刻下LSTM计算单元的计算流程为:
Figure BDA0002562031830000046
Figure BDA0002562031830000047
Figure BDA0002562031830000048
Figure BDA0002562031830000049
Figure BDA00025620318300000410
Figure BDA00025620318300000411
式中,
Figure BDA00025620318300000412
分别表示第d层LSTM网络的第t时刻下LSTM计算单元
Figure BDA00025620318300000419
中的输入门、遗忘门、输出门、候选记忆细胞、记忆细胞以及隐藏状态的计算值,下标d=1,2,...,D;当d=1时,Y为输入序列中第t个数据向量,当d>1时,Y为第d-1层LSTM网络的第t时刻的输出值
Figure BDA00025620318300000413
为第d层LSTM网络中第t-1时刻计算单元的输出值,且当t=1时,
Figure BDA00025620318300000414
为0;
Figure BDA00025620318300000415
Figure BDA00025620318300000416
分别为输入门、遗忘门、输出门和候选记忆细胞预设的权重参数;
Figure BDA00025620318300000417
Figure BDA00025620318300000418
分别为输入门、遗忘门、输出门和候选记忆细胞预设的偏置参数;σ(·)为sigmoid函数,tanh(·)为双曲正切函数;⊙为同或运算符,[·]为矩阵乘法运算符。进一步地,,所述相似性度量层中通过一阶范数的指数函数进行相似性度量的公式为:
E(H1,H2)=exp(-||H1-H2||1)∈[0,1]
式中,E(H1,H2)表示特征向量H1和特征向量H2的距离,||·||表示范数运算符。
进一步地,所述步骤S3中,对故障诊断模型进行训练的方法具体为:
将训练样本中的子序列
Figure BDA0002562031830000051
作为故障诊断模型的输入序列,其中测量设备正常状态下k=0时的子序列
Figure BDA0002562031830000052
作为第二LSTM堆叠网络的输入序列,测量设备故障状态下的k>0时的子序列
Figure BDA0002562031830000053
作为第一LSTM堆叠网络的输入序列,将其对应的运行状态序号作为期望输出,对故障诊断模型进行训练。
进一步地,所述故障诊断模型的损失函数为:
Figure BDA0002562031830000054
式中,
Figure BDA0002562031830000055
为对比损失;
Figure BDA0002562031830000056
为交叉熵损失;λ1和λ2分别与对比损失和交叉熵损失的权重系数;V为样本个数;a为两个输入是否为相同类别的控制变量,当a=0时,两个输入属于同一类,a=1时,两个输入不属于同一类;E为两个输入的距离值;margin为设定的阈值,rj和p(j|x)分别为样本x属于类别j的真实概率与预测概率,d为样本类别数目。
进一步地,所述步骤S4中,将训练好的故障诊断模型输出的运行状态序号k对应的运行状态作为测量设备的故障类型诊断结果。
本发明的有益效果为:
本发明提供的基于孪生长短时间记忆网络的故障诊断方法,将具有长短时间记忆功能的LSTM和能够放大相似样本之间微小差异的孪生网络结合起来,进行化工过程的故障诊断,不仅能够通过多层LSTM对复杂动态时序性的数据具有更强的表达能力,而且对微小故障也具有更优的识别能力,使得化工过程的故障诊断效果得到显著提高。
附图说明
图1为本发明提供的基于孪生长短时间记忆网络故障诊断方法流程图。
图2为本发明提供的基于孪生长短时间记忆网络化工过程故障诊断模型结构图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种基于孪生长短时间记忆网络的故障诊断方法,包括以下步骤:
S1、采集化工系统在各种运行状态下各测量设备的测量数据,并对其进行降噪处理;
S2、对降噪后的测量数据进行标准化处理,并构建训练样本;
S3、构建基于Siamese LSTM的故障诊断模型,并利用构建的训练样本对其进行训练;
S4、将化工系统运行过程中测量设备的测量数据对应的标准化处理后的数据输入到训练好的故障诊断模型中,得到对应的故障类型诊断结果,实现化工过程的故障诊断。
本实施例步骤S1中的运行状态包括正常状态和K种故障状态;
将第k种运行状态下采样时刻为r时的测量设备的测量数据记为数据向量
Figure BDA0002562031830000071
其中,上标k=0时,表示测量设备处于正常状态,k=1,2,...,K时,表示测量设备的故障状态序号,
Figure BDA0002562031830000072
表示第k种运行状态下采样时刻为r时第n种测量设备的测量数据,下标n为测量设备序号,n=1,2,...,N,N为测量设备总数;分别对每种运行状态下的测量数据通过小波阈值降噪方法进行降噪处理,得到降噪处理后的测量数据对应的数据向量为
Figure BDA0002562031830000073
本实施例步骤S2具体为:
S21、将每种运行状态下经过降噪处理后的数据向量进行标准化,得到标准化后的数据向量
Figure BDA0002562031830000074
S22、将数据向量
Figure BDA0002562031830000075
按照采样时刻构成序列
Figure BDA0002562031830000076
式中,下标Tk表示采样时间序列标号;
S23、采用长度为T的滑动窗口对序列
Figure BDA0002562031830000077
进行滑窗处理,得到Hk个子序列
Figure BDA0002562031830000078
其中,Hk表示第k种运行状态下所提取到的子序列总数,下标h=1,2,...,Hk表示第k种运行状态下所提取到的第h个子序列,
Figure BDA0002562031830000079
表示在子序列
Figure BDA00025620318300000710
中第t个数据向量,t=1,2,...,T;
S24、将子序列
Figure BDA00025620318300000711
作为输入,其对应的运行状态序号k作为输出,得到训练样本;
上述步骤S21中,进行标准化处理时采用的公式为:
Figure BDA00025620318300000712
其中,
Figure BDA00025620318300000713
分别表示第k种运行状态下第n个测量设备在Tk个采样时刻的测量数据
Figure BDA0002562031830000081
的平均值和标准差;
如图2所示,本实施例的步骤S3中的故障诊断模型包括特征提取层、相似性度量层和故障诊断层;
所述特征提取层为改进的Siamese LSTM网络,所述特征提取层中将Siamese LSTM网络中用于特征表示的网络替换成两个结构相同的堆叠LSTM网络,分别记为第一堆叠LSTM网络和第二堆叠LSTM网络,用于提取输入序列的特征向量;
所述相似性度量层通过一阶范数的指数函数对第一堆叠LSTM网络输出的特征向量
Figure BDA0002562031830000082
和第二堆叠LSTM网络输出的特征向量
Figure BDA0002562031830000083
进行相似性度量;其中,
Figure BDA0002562031830000084
为第一堆叠LSTM网络输出的特征,
Figure BDA0002562031830000085
为第二堆叠LSTM网络输出的特征;
所述故障诊断层为softmax层,用于对第一堆叠LSTM网络输出的特征向量
Figure BDA0002562031830000086
进行分类得到输入数据对应的运行状态序号,进而确定当前测量设备的运行状态。
图2中的第一堆叠LSTM网络和第二堆叠LSTM网络均由D层LSTM网络叠加而成,每层LSTM网络中的LSTM计算单元数量为T,以第一堆叠LSTM网络的第t时刻计算单元的输入是所输入序列中第t个数据向量和上一时刻计算单元输出的隐层状态
Figure BDA0002562031830000087
和记忆细胞
Figure BDA0002562031830000088
其它层LSTM网络的计算单元输入值是上一层计算单元输出的隐藏状态
Figure BDA0002562031830000089
和该层上一时刻计算单元输出的隐藏状态
Figure BDA00025620318300000810
(d′表示LSTM层数,d′>1)和记忆细胞
Figure BDA00025620318300000811
因此,在特征提取层中,第d层LSTM网络的第D时刻下LSTM计算单元的计算流程为:
Figure BDA0002562031830000091
Figure BDA0002562031830000092
Figure BDA0002562031830000093
Figure BDA0002562031830000094
Figure BDA0002562031830000095
Figure BDA0002562031830000096
式中,
Figure BDA0002562031830000097
分别表示第d层LSTM网络的第t时刻下LSTM计算单元
Figure BDA0002562031830000098
中的输入门、遗忘门、输出门、候选记忆细胞、记忆细胞以及隐藏状态的计算值,下标d=1,2,...,D;当d=1时,Y为输入序列中第t个数据向量,当d>1时,Y为第d-1层LSTM网络的第t时刻的输出值
Figure BDA0002562031830000099
为第d层LSTM网络中第t-1时刻计算单元的输出值,且当t=1时,
Figure BDA00025620318300000910
为0;
Figure BDA00025620318300000911
Figure BDA00025620318300000912
分别为输入门、遗忘门、输出门和候选记忆细胞预设的权重参数;
Figure BDA00025620318300000913
Figure BDA00025620318300000914
分别为输入门、遗忘门、输出门和候选记忆细胞预设的偏置参数;σ(·)为sigmoid函数,tanh(·)为双曲正切函数;⊙为同或运算符,[·]为矩阵乘法运算符。
上述相似性度量层中通过一阶范数的指数函数进行相似性度量的公式为:
E(H1,H2)=exp(-||H1-H2||1)∈[0,1]
式中,E(H1,H2)表示特征向量H1和特征向量H2的距离,||·||表示范数运算符。
本实施例的步骤S3中,对故障诊断模型进行训练的方法具体为:
将训练样本中的子序列
Figure BDA00025620318300000915
作为故障诊断模型的输入序列,其中测量设备正常状态下k=0时的子序列
Figure BDA00025620318300000916
作为第二LSTM堆叠网络的输入序列,测量设备故障状态下的k>0时的子序列
Figure BDA00025620318300000917
作为第一LSTM堆叠网络的输入序列,将其对应的运行状态序号作为期望输出,对故障诊断模型进行训练。
上述训练过程中,为了防止模型的过拟合并加快模型的训练速度,在故障诊断模型中使用dropout技术,因为dropout在训练模型的过程中可以随机使得一定比例的隐藏节点不工作,而不工作的节点会在训练中不会进行权值更新,且在下一次训练中会重新按比例选择不工作的节点。本实施例在模型梯度下降训练时采用的是Adam优化算法,该算法相对于普通的梯度下降算法有更好的训练效果。故障诊断模型训练的目的是通过Adam算法训练,优化网络各参数,使得其损失函数值最小。Siamese LSTM模型的损失函数由对比损失函数和交叉熵损失函数两部分组成,因此,故障诊断模型的损失函数为:
Figure BDA0002562031830000101
式中,
Figure BDA0002562031830000102
为对比损失;
Figure BDA0002562031830000103
为交叉熵损失;λ1和λ2分别与对比损失和交叉熵损失的权重系数;V为样本个数;a为两个输入是否为相同类别的控制变量,当a=0时,两个输入属于同一类,a=1时,两个输入不属于同一类;E为两个输入的距离值;margin为设定的阈值,rj和p(j|x)分别为样本x属于类别j的真实概率与预测概率,d为样本类别数目。
当Loss<τ(τ表示损失函数最小化阈值)或者网络训练的次数iter>Num(Num表示网络训练迭代的最大次数),则训练结束,将当前模型的最优参数保存,得到训练好的基于Siamese LSTM的故障诊断模型。
本实施例的步骤S4中,在化工系统运行过程,按照预设采样周期采集N个测量设备的测量数据,对最近T个采样时刻的数据向量X′t=[x′t1,x′t2,…,x′tN]采用步骤S102中的降噪方法进行降噪处理,得到降噪后的数据向量
Figure BDA0002562031830000104
其中x′tN表示采样时刻t时第n个测量设备的测量数据;接着采用步骤S103中的标准化方法进行标准化处理,得到标准化的数据向量
Figure BDA0002562031830000105
然后构建得到序列
Figure BDA0002562031830000106
将其输入到训练好的基于Siamese LSTM的故障诊断模型中,将其输出的运行状态序号k对应的运行状态作为测量设备的故障类型诊断结果。
实施例2:
以一个化工过程模型为例,该模型为美国田纳西-伊士曼(Tennessee Eastman,TE)化工过程模型,其取自一个真实的化工过程。TE仿真过程模拟了复杂化工生产的基本工艺流程,具有实际化工过程的复杂、非线性特性,近年来被广泛应用于化工过程故障检测和故障诊断技术的研究。整个TE化工过程主要包含22个连续过程测量变量、19个成分测量变量和12个操作变量,其可以模拟正常工况和21种故障工况。在TE化工过程的21种故障中,有些故障很容易被识别(比如:故障1和故障2),因为它们严重地影响了TE过程的运行,明显地改变了过程变量之间的关系。然而,也有一些故障是难以被检测的(如故障3、9和15),因为它们对测量和操作变量的影响很小,因此对TE生产过程的运行状态影响不大,经常容易被忽略。然而,这些特征不明显的故障如果不能及时处理会存在很大的安全隐患。
为了使实验具有可操作性、实验结果具有可比性,采用由美国哈佛大学(HarvardUniversity)对该模型进行仿真并公开的数据集作为本实施例所使用的数据集。此数据集分为训练集和测试集两部分,两个部分均包含20种故障工况(除第21种故障之外)和正常工况的样本集,每个样本特征为52维。训练集中的每种工况分别在500种不同随机数下进行仿真实验,采集到的训练集数据中每种工况共有250000个样本;同样,测试集每种工况分别在500种不同随机数下进行仿真实验,采集到的测试集数据中每种工况共有480000个样本。
本实施例在实验的过程中,首先将所有的数据集进行预处理,然后将训练集数据用于训练模型,测试集数据用于测试所构建的Siamese LSTM模型的性能。
本实施例中采用F1分数作为本发明的评价指标,其计算公式为:
Figure BDA0002562031830000121
本实施例是一个多分类问题,计算第i类样本的评价指标时,将第i类作为正类,其它类作为负类。F1分数是精准率和召回率的平均值,表示故障模型的综合识别能力和稳定性,F1值越高说明模型的预测能力越理想。
本实施例中采用SSAE、RNN、GRU、Vanilla LSTM、Siamese RNN、Siamese GRU方法作为对比方法。表1是本实施例中Siamese LSTM方法和对比方法的故障诊断结果。
表1:Siamese LSTM方法和对比方法的故障诊断结果
Figure BDA0002562031830000122
由于故障诊断的F1越高表示模型的预测能力越强,由表1可以看出,本发明方法在化工生产过程的故障诊断效果优于其它方法,特别对微小故障3、9和15的诊断效果得到明显的提升。

Claims (9)

1.一种基于孪生长短时间记忆网络的故障诊断方法,其特征在于,包括以下步骤:
S1、采集化工系统在各种运行状态下各测量设备的测量数据,并对其进行降噪处理;
S2、对降噪后的测量数据进行标准化处理,并构建训练样本;
S3、构建基于Siamese LSTM的故障诊断模型,并利用构建的训练样本对其进行训练;
S4、将化工系统运行过程中测量设备的测量数据对应的标准化处理后的数据输入到训练好的故障诊断模型中,得到对应的故障类型诊断结果,实现化工过程的故障诊断。
2.根据权利要求1所述的基于孪生长短时间记忆网络的故障诊断方法,其特征在于,所述步骤S1中的运行状态包括正常状态和K种故障状态;
将第k种运行状态下采样时刻为r时的测量设备的测量数据记为数据向量
Figure FDA0002562031820000011
其中,上标k=0时,表示测量设备处于正常状态,k=1,2,...,K时,表示测量设备的故障状态序号,
Figure FDA0002562031820000012
表示第k种运行状态下采样时刻为r时第n种测量设备的测量数据,下标n为测量设备序号,n=1,2,...,N,N为测量设备总数;
所述步骤S1中降噪处理后的测量数据对应的数据向量为
Figure FDA0002562031820000013
3.根据权利要求2所述的基于孪生长短时间记忆网络的故障诊断方法,其特征在于,所述步骤S2具体为:
S21、将每种运行状态下经过降噪处理后的数据向量进行标准化,得到标准化后的数据向量
Figure FDA0002562031820000014
S22、将数据向量
Figure FDA0002562031820000021
按照采样时刻构成序列
Figure FDA0002562031820000022
式中,下标Tk表示采样时间序列标号;
S23、采用长度为T的滑动窗口对序列
Figure FDA0002562031820000023
进行滑窗处理,得到Hk个子序列
Figure FDA0002562031820000024
其中,Hk表示第k种运行状态下所提取到的子序列总数,下标h=1,2,...,Hk表示第k种运行状态下所提取到的第h个子序列,
Figure FDA0002562031820000025
表示在子序列
Figure FDA0002562031820000026
中第t个数据向量,t=1,2,...,T;
S24、将子序列
Figure FDA0002562031820000027
作为输入,其对应的运行状态序号k作为输出,得到训练样本。
4.根据权利要求3所述的基于孪生长短时间记忆网络的故障诊断方法,其特征在于,所述步骤S3中的故障诊断模型包括特征提取层、相似性度量层和故障诊断层;
所述特征提取层为改进的Siamese LSTM网络,所述特征提取层中将Siamese LSTM网络中用于特征表示的网络替换成两个结构相同的堆叠LSTM网络,分别记为第一堆叠LSTM网络和第二堆叠LSTM网络,用于提取输入序列的特征向量;
所述相似性度量层通过一阶范数的指数函数对第一堆叠LSTM网络输出的特征向量
Figure FDA0002562031820000028
和第二堆叠LSTM网络输出的特征向量
Figure FDA0002562031820000029
进行相似性度量;其中,
Figure FDA00025620318200000210
为第一堆叠LSTM网络输出的特征,
Figure FDA00025620318200000211
为第二堆叠LSTM网络输出的特征;
所述故障诊断层为softmax层,用于对第一堆叠LSTM网络输出的特征向量
Figure FDA00025620318200000212
进行分类得到输入数据对应的运行状态序号,进而确定当前测量设备的运行状态。
5.根据权利要求4所述的基于孪生长短时间记忆网络的故障诊断方法,其特征在于,所述第一堆叠LSTM网络和第二堆叠LSTM网络均由D层LSTM网络叠加而成,每层LSTM网络中的LSTM计算单元数量为T,第d层LSTM网络的第D时刻下LSTM计算单元的计算流程为:
Figure FDA0002562031820000031
Figure FDA0002562031820000032
Figure FDA0002562031820000033
Figure FDA0002562031820000034
Figure FDA0002562031820000035
Figure FDA0002562031820000036
式中,
Figure FDA0002562031820000037
分别表示第d层LSTM网络的第t时刻下LSTM计算单元
Figure FDA0002562031820000038
中的输入门、遗忘门、输出门、候选记忆细胞、记忆细胞以及隐藏状态的计算值,下标d=1,2,...,D;当d=1时,Y为输入序列中第t个数据向量,当d>1时,Y为第d-1层LSTM网络的第t时刻的输出值
Figure FDA0002562031820000039
为第d层LSTM网络中第t-1时刻计算单元的输出值,且当t=1时,
Figure FDA00025620318200000310
为0;
Figure FDA00025620318200000311
Figure FDA00025620318200000312
分别为输入门、遗忘门、输出门和候选记忆细胞预设的权重参数;
Figure FDA00025620318200000313
Figure FDA00025620318200000314
分别为输入门、遗忘门、输出门和候选记忆细胞预设的偏置参数;σ(·)为sigmoid函数,tanh(·)为双曲正切函数;⊙为同或运算符,[·]为矩阵乘法运算符。
6.根据权利要求4所述的基于孪生长短时间记忆网络的故障诊断方法,其特征在于,所述相似性度量层中通过一阶范数的指数函数进行相似性度量的公式为:
E(H1,H2)=exp(-||H1-H2||1)∈[0,1]
式中,E(H1,H2)表示特征向量H1和特征向量H2的距离,||·||表示范数运算符。
7.根据权利要求4所述的基于孪生长短时间记忆网络的故障诊断方法,其特征在于,所述步骤S3中,对故障诊断模型进行训练的方法具体为:
将训练样本中的子序列
Figure FDA0002562031820000041
作为故障诊断模型的输入序列,其中测量设备正常状态下k=0时的子序列
Figure FDA0002562031820000042
作为第二LSTM堆叠网络的输入序列,测量设备故障状态下的k>0时的子序列
Figure FDA0002562031820000043
作为第一LSTM堆叠网络的输入序列,将其对应的运行状态序号作为期望输出,对故障诊断模型进行训练。
8.根据权利要求7所述的基于孪生长短时间记忆网络的故障诊断方法,其特征在于,所述故障诊断模型的损失函数为:
Figure FDA0002562031820000044
式中,
Figure FDA0002562031820000045
为对比损失;
Figure FDA0002562031820000046
为交叉熵损失;λ1和λ2分别与对比损失和交叉熵损失的权重系数;V为样本个数;a为两个输入是否为相同类别的控制变量,当a=0时,两个输入属于同一类,a=1时,两个输入不属于同一类;E为两个输入的距离值;margin为设定的阈值,rj和p(j|x)分别为样本x属于类别j的真实概率与预测概率,d为样本类别数目。
9.根据权利要求7所述的基于孪生长短时间记忆网络的故障诊断方法,其特征在于,所述步骤S4中,将训练好的故障诊断模型输出的运行状态序号k对应的运行状态作为测量设备的故障类型诊断结果。
CN202010610712.0A 2020-06-30 2020-06-30 一种基于孪生长短时间记忆网络的故障诊断方法 Pending CN111914897A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010610712.0A CN111914897A (zh) 2020-06-30 2020-06-30 一种基于孪生长短时间记忆网络的故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010610712.0A CN111914897A (zh) 2020-06-30 2020-06-30 一种基于孪生长短时间记忆网络的故障诊断方法

Publications (1)

Publication Number Publication Date
CN111914897A true CN111914897A (zh) 2020-11-10

Family

ID=73226271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010610712.0A Pending CN111914897A (zh) 2020-06-30 2020-06-30 一种基于孪生长短时间记忆网络的故障诊断方法

Country Status (1)

Country Link
CN (1) CN111914897A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465124A (zh) * 2020-12-15 2021-03-09 武汉智能装备工业技术研究院有限公司 孪生深度时空神经网络模型获取/故障诊断方法、装置
CN113011248A (zh) * 2021-02-01 2021-06-22 西安交通大学 一种基于lstm的核动力装置故障诊断方法
CN113191215A (zh) * 2021-04-12 2021-07-30 西安理工大学 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法
CN113326881A (zh) * 2021-05-31 2021-08-31 西安思安云创科技有限公司 一种电力变压器故障诊断方法
CN114157552A (zh) * 2021-10-29 2022-03-08 国网河南省电力公司漯河供电公司 一种基于孪生时序图网络的配网故障检测方法
CN114298200A (zh) * 2021-12-23 2022-04-08 电子科技大学(深圳)高等研究院 基于深度并行时序关系网络的异常数据诊断方法
CN114330549A (zh) * 2021-12-28 2022-04-12 浙江工业大学 一种基于深度图网络的化工过程故障诊断方法
WO2024113574A1 (zh) * 2022-11-29 2024-06-06 北京航空航天大学 一种知识与孪生模型驱动的作动器关键故障注入与诊断方法
CN118349985A (zh) * 2024-06-14 2024-07-16 电子科技大学 一种基于对比学习和多模态生物特征的身份识别方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052512A (zh) * 2017-11-03 2018-05-18 同济大学 一种基于深度注意力机制的图像描述生成方法
CN108846426A (zh) * 2018-05-30 2018-11-20 西安电子科技大学 基于深度双向lstm孪生网络的极化sar分类方法
CN109766921A (zh) * 2018-12-19 2019-05-17 合肥工业大学 一种基于深度领域自适应的振动数据故障分类方法
CN110413924A (zh) * 2019-07-18 2019-11-05 广东石油化工学院 一种半监督多视图学习的网页分类方法
US20190349287A1 (en) * 2018-05-10 2019-11-14 Dell Products L. P. System and method to learn and prescribe optimal network path for sdn
CN110990608A (zh) * 2019-12-03 2020-04-10 哈尔滨工业大学 一种基于Siamese结构双向长短时记忆网络的三维模型检索方法
US20200126241A1 (en) * 2018-10-18 2020-04-23 Deepnorth Inc. Multi-Object Tracking using Online Metric Learning with Long Short-Term Memory
CN111273623A (zh) * 2020-02-25 2020-06-12 电子科技大学 基于Stacked LSTM的故障诊断方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052512A (zh) * 2017-11-03 2018-05-18 同济大学 一种基于深度注意力机制的图像描述生成方法
US20190349287A1 (en) * 2018-05-10 2019-11-14 Dell Products L. P. System and method to learn and prescribe optimal network path for sdn
CN108846426A (zh) * 2018-05-30 2018-11-20 西安电子科技大学 基于深度双向lstm孪生网络的极化sar分类方法
US20200126241A1 (en) * 2018-10-18 2020-04-23 Deepnorth Inc. Multi-Object Tracking using Online Metric Learning with Long Short-Term Memory
CN109766921A (zh) * 2018-12-19 2019-05-17 合肥工业大学 一种基于深度领域自适应的振动数据故障分类方法
CN110413924A (zh) * 2019-07-18 2019-11-05 广东石油化工学院 一种半监督多视图学习的网页分类方法
CN110990608A (zh) * 2019-12-03 2020-04-10 哈尔滨工业大学 一种基于Siamese结构双向长短时记忆网络的三维模型检索方法
CN111273623A (zh) * 2020-02-25 2020-06-12 电子科技大学 基于Stacked LSTM的故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
汪润 等: "DeepRD :基于 Siamese LSTM 网络的 Android 重打包应用检测方法", 《通信学报》 *
魏攀 等: "基于贝叶斯网络的故障诊断专家系统", 《计算机测量与控制》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465124B (zh) * 2020-12-15 2023-03-10 武汉智能装备工业技术研究院有限公司 孪生深度时空神经网络模型获取/故障诊断方法、装置
CN112465124A (zh) * 2020-12-15 2021-03-09 武汉智能装备工业技术研究院有限公司 孪生深度时空神经网络模型获取/故障诊断方法、装置
CN113011248A (zh) * 2021-02-01 2021-06-22 西安交通大学 一种基于lstm的核动力装置故障诊断方法
CN113191215A (zh) * 2021-04-12 2021-07-30 西安理工大学 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法
CN113191215B (zh) * 2021-04-12 2024-02-23 陕西少梁塬网络科技有限公司 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法
CN113326881A (zh) * 2021-05-31 2021-08-31 西安思安云创科技有限公司 一种电力变压器故障诊断方法
CN113326881B (zh) * 2021-05-31 2023-02-14 西安思安云创科技有限公司 一种电力变压器故障诊断方法
CN114157552A (zh) * 2021-10-29 2022-03-08 国网河南省电力公司漯河供电公司 一种基于孪生时序图网络的配网故障检测方法
CN114157552B (zh) * 2021-10-29 2024-04-05 国网河南省电力公司漯河供电公司 一种基于孪生时序图网络的配网故障检测方法
CN114298200A (zh) * 2021-12-23 2022-04-08 电子科技大学(深圳)高等研究院 基于深度并行时序关系网络的异常数据诊断方法
CN114298200B (zh) * 2021-12-23 2024-06-11 电子科技大学(深圳)高等研究院 基于深度并行时序关系网络的异常数据诊断方法
CN114330549A (zh) * 2021-12-28 2022-04-12 浙江工业大学 一种基于深度图网络的化工过程故障诊断方法
WO2024113574A1 (zh) * 2022-11-29 2024-06-06 北京航空航天大学 一种知识与孪生模型驱动的作动器关键故障注入与诊断方法
CN118349985A (zh) * 2024-06-14 2024-07-16 电子科技大学 一种基于对比学习和多模态生物特征的身份识别方法
CN118349985B (zh) * 2024-06-14 2024-08-27 电子科技大学 一种基于对比学习和多模态生物特征的身份识别方法

Similar Documents

Publication Publication Date Title
CN111914897A (zh) 一种基于孪生长短时间记忆网络的故障诊断方法
CN111273623B (zh) 基于Stacked LSTM的故障诊断方法
US20200150622A1 (en) Method for detecting abnormity in unsupervised industrial system based on deep transfer learning
CN113642754B (zh) 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法
Xia et al. Multi-stage fault diagnosis framework for rolling bearing based on OHF Elman AdaBoost-Bagging algorithm
CN108875771B (zh) 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法
CN111914873A (zh) 一种两阶段云服务器无监督异常预测方法
CN109116834B (zh) 一种基于深度学习的间歇过程故障检测方法
CN111562108A (zh) 一种基于cnn和fcmc的滚动轴承智能故障诊断方法
CN108875772B (zh) 一种基于堆叠稀疏高斯伯努利受限玻尔兹曼机和强化学习的故障分类模型及方法
CN112129534B (zh) 一种机床主轴轴承寿命预测方法及系统
CN111339712A (zh) 质子交换膜燃料电池剩余寿命预测方法
Remadna et al. Leveraging the power of the combination of CNN and bi-directional LSTM networks for aircraft engine RUL estimation
Chadha et al. Time series based fault detection in industrial processes using convolutional neural networks
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN113723007A (zh) 基于DRSN和麻雀搜索优化BiLSTM的机械设备剩余寿命预测方法
CN115580445B (zh) 一种未知攻击入侵检测方法、装置和计算机可读存储介质
CN111123894B (zh) 一种基于lstm和mlp结合的化工过程故障诊断方法
Fu et al. MCA-DTCN: A novel dual-task temporal convolutional network with multi-channel attention for first prediction time detection and remaining useful life prediction
CN114091525A (zh) 一种滚动轴承退化趋势预测方法
Xu et al. Global attention mechanism based deep learning for remaining useful life prediction of aero-engine
CN111046961A (zh) 基于双向长短时记忆单元和胶囊网络的故障分类方法
Liu et al. Deep & attention: A self-attention based neural network for remaining useful lifetime predictions
CN111079348B (zh) 一种缓变信号检测方法和装置
CN114266278A (zh) 一种基于双重注意力网络的设备剩余使用寿命预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201110