CN113159225B - 多变量工业过程故障分类方法 - Google Patents

多变量工业过程故障分类方法 Download PDF

Info

Publication number
CN113159225B
CN113159225B CN202110534721.0A CN202110534721A CN113159225B CN 113159225 B CN113159225 B CN 113159225B CN 202110534721 A CN202110534721 A CN 202110534721A CN 113159225 B CN113159225 B CN 113159225B
Authority
CN
China
Prior art keywords
data set
variable
variables
fault
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110534721.0A
Other languages
English (en)
Other versions
CN113159225A (zh
Inventor
邓晓刚
王晓慧
崔文志
王延江
曹玉苹
王平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202110534721.0A priority Critical patent/CN113159225B/zh
Publication of CN113159225A publication Critical patent/CN113159225A/zh
Application granted granted Critical
Publication of CN113159225B publication Critical patent/CN113159225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及一种多变量工业过程故障分类方法,首先使用正常操作工况数据集来分析过程变量之间的相关性,计算变量之间的相关性因子;其次根据过程变量之间的相关性因子构建新的过程变量排列顺序,并进一步构建变量自组织函数;使用卷积神经网络建模方法构建VSACNN故障分类模型,并利用训练数据集来进行网络参数的优化,将测试数据集输入至VSACNN故障诊断模型,根据VSACNN故障诊断模型输出确定故障类型。本发明将变量关系分析与CNN模型相结合,提高局部变量之间的相关性,从而帮助CNN充分挖掘相关过程变量之间的联系,改善CNN在提取局部特征的信息有效性,能够有效地提升故障分类的准确率。

Description

多变量工业过程故障分类方法
技术领域
本发明属于工业过程故障诊断技术领域,涉及多变量工业过程故障诊断技术,具体地说,涉及一种基于变量自组织卷积神经网络(英文:Variable Self Arrangementbased Convolutional Neural Networks,简称:VSACNN)的多变量工业过程故障分类方法。
背景技术
过程自动化技术的快速发展使得工业系统的复杂性不断增加。为了保证复杂工业系统的安全连续运行,故障诊断技术已成为业界和学术界关注的主要问题。由于复杂的工业过程涉及大量的测量变量、高度非线性的变量关系和难以区分的故障模式,故障分类是一个具有挑战性的课题。
卷积神经网络(英文:Convolutional Neural Networks,简称:CNN)是指那些至少在网络的某一层中使用了卷积运算来代替一般的矩阵乘法运算的神经网络,该卷积神经网络采用了局部连接和权值共享的方式,减少了模型内部的参数数量,降低了网络模型的复杂度。因其具有强大的特征提取能力,目前已经在计算机视觉、自然语言处理、故障诊断等多个领域得到广泛应用。尽管在故障诊断领域取得了一定的成功,但基于CNN的故障诊断方法仍有提升的空间。现有基于CNN的故障诊断方法存在的一个重要问题是普通CNN没有考虑输入层中的变量排列顺序。在理想情况下,无论过程变量如何排列,CNN都有很强的能力提取数据的内在信息进行分类。但是在实际操作中,CNN通过一个有限大小的卷积核来挖掘数据的局部特征。如果将相关变量放置在距离较远的位置,使得卷积核无法覆盖它们,那么CNN可能无法找到这些变量之间的联系,导致分类性能变差,故障诊断性能低。
发明内容
本发明针对现有技术存在的故障诊断性能低的问题,提供一种基于VSACNN的多变量工业过程故障分类方法,能够准确分析过程变量之间的相关性,并根据相关性对过程变量进行重新排列,确保CNN在做卷积运算时能够充分挖掘相关变量之间的联系,提高故障分类准确度。
为了达到上述目的,本发明提供了一种多变量工业过程故障分类方法,其具体步骤为:
S1、采集工业过程正常操作工况数据建立正常工况数据集X0,标准化处理后得到正常工况数据集
Figure GDA0003493760920000021
S2、采用正常工况数据集
Figure GDA0003493760920000022
进行变量相关性分析,计算过程变量之间的相关性因子RF(vi,vj),其中,vi与vj表示过程数据的任意两个变量;
S3、根据相关性因子RF(vi,vj)构建无向有权图G,对无向有权图G进行广度优先遍历,并根据变量之间的相关性进行分组,利用分组构建变量自组织函数X0′=DA(X0),其中,X0为原始过程数据,X0′为变量顺序重新组织后的过程数据;
S4、采集C类故障工况数据集{X1,X2,…,XC},并与正常工况数据集X0构成训练数据集Xtrain={X0,X1,…,XC},标准化处理后得到训练数据集
Figure GDA0003493760920000023
S5、以训练数据集
Figure GDA0003493760920000024
为输入,利用卷积神经网络建模方法构建VSACNN故障诊断模型,VSACNN故障诊断模型表示为:
Figure GDA0003493760920000025
其中,x表示输入样本,
Figure GDA0003493760920000026
表示模型输出,即模型针对输入样本x的故障预测类别,F(·)为一个多层的卷积神经网络函数;
S6、采集测试数据集Xtest,标准化后得到测试数据集
Figure GDA0003493760920000031
S7、利用变量自组织函数X0′=SA(X0)对测试数据集
Figure GDA0003493760920000032
进行过程变量重排列操作得到测试数据集
Figure GDA0003493760920000033
S8、将测试数据集
Figure GDA0003493760920000034
输入至VSACNN故障诊断模型,根据VSACNN故障诊断模型输出确定故障类型。
优选的,步骤S1中,利用正常操作工况数据集X0的均值m0与标准差s0通过公式(1)对正常操作工况数据集X0进行标准化处理,公式(1)的表达式为:
Figure GDA0003493760920000035
正常操作工况数据集X0经上述公式(1)标准化处理后即可获得正常工况数据集
Figure GDA0003493760920000036
优选的,步骤S2中,通过公式(2)计算过程变量之间的相关性因子RF(vi,vj),公式(2)表示为:
Figure GDA0003493760920000037
式中,Cor(vi,vj)为过程变量vi与vj的皮尔逊相关系数,PD(vi,vj)为过程变量vi与vj的概率分布差异,定义为:
Figure GDA0003493760920000038
式中,p(·)为变量概率密度函数,H(p(vi),p(vj))为变量概率密度在欧氏空间上的Hellinger距离,cos(p(vi),p(vj))为变量概率密度的余弦相似度。
优选的,步骤S3中,构建变量自组织函数的具体步骤为:
S31、构建各变量之间的相关性矩阵RF,表示为:
Figure GDA0003493760920000041
式中,RFij为过程变量vi与vj之间的相关性因子RF(vi,vj),即两变量之间的相关程度,i=1,2,…,m,j=1,2,…,m,m为过程变量个数;
以所有的过程变量索引为顶点,遍历相关性矩阵RF构建无向有权图G,其中,仅RFij≥γ时表示无向有权图G中顶点i和j邻接,即无向有权图G中顶点i和j之间有一条边,权重Gij=RFij,γ为设定阈值;
S32、令k=1,选择无向有权图G中未分组变量中相关性最强的两个过程变量vi与vj的索引构成集合Sk
S33、广度优先遍历过程变量vi与vj的邻接变量,计算每一个邻接变量vadj与集合Sk中变量的平均相关性因子
Figure GDA0003493760920000042
其中nk表示集合Sk中变量索引的个数,
Figure GDA0003493760920000043
表示集合Sk中的第l个变量;
S34、若
Figure GDA0003493760920000044
则邻接变量vadj的索引归入集合Sk;反之,邻接变量vadj等待下一轮遍历;
S35、完成一轮遍历,k=k+1;
S36、重复步骤S32-S35,直到遍历完无向有权图G中所有变量;
S37、将无向有权图G中未分组变量与不在无向有权图G中的变量的索引组合记为S,若通过遍历无向有权图G获得B个集合,则新的变量排列可以表示为O(X0)=[S1,S2,…,SB,S],进一步根据O(X0)构造变量自组织函数X0′=SA(X0),其中,X0′=O(X0)。
优选的,步骤S4中,利用训练数据集Xtrain的均值mtrain和标准差strain通过公式(5)对训练数据集Xtrain进行标准化处理,公式(5)表示为:
Figure GDA0003493760920000045
训练数据集Xtrain经上述公式(5)标准化处理后即可获得训练数据集
Figure GDA0003493760920000051
优选的,步骤S5中,利用卷积神经网络建模方法构建VSACNN故障诊断模型的步骤为:
S51、构建训练数据集
Figure GDA0003493760920000052
作为模型输入,设置卷积神经网络的层数为L、卷积核个数为n、卷积核大小为p、池化层窗口大小为s、学习率为lr;
S52、使用变量自组织函数X0′=SA(X0)对训练数据集
Figure GDA0003493760920000053
进行变量重排列操作;
S53、卷积神经网络函数F(·)包括卷积层、池化层与输出层,其中,卷积层的具体运算公式表示为:
Figure GDA0003493760920000054
式中,y(q)为第q层网络的卷积激活值,x(q-1)为第q层网络的输入,Wq为第q层网络的卷积核权重,
Figure GDA0003493760920000055
表示卷积运算,j代表在卷积核范围之内的元素索引,bq为第q层网络的偏置值,f(·)为ReLU(·)非线性激活函数;
池化层使用最大池化操作,即对卷积层激活特征进行如下操作:
z(q)=max(y(q),s) (7)
式中,z(q)为第q层网络通过最大池化操作得到的特征矩阵;
输出层首先对提取到的特征向量进行线性变换,然后使用Softmax分类器进行故障类型判别;
S54、采用公式(8)计算模型的预测损失并进行优化求解,公式(8)表示为:
Figure GDA0003493760920000056
式中,J(·)为优化目标函数,yi为样本真实标签,
Figure GDA0003493760920000057
为样本预测标签,θ表示模型的参数,λ为惩罚因子,L(·)为交叉熵损失函数,M为样本的数量;
则构建VSACNN故障诊断模型表示为:
Figure GDA0003493760920000061
优选的,步骤S6中,利用训练数据集
Figure GDA0003493760920000062
的均值mtrain和标准差strain通过公式(9)对测试数据集Xtest进行标准化处理,公式(9)表达式为:
Figure GDA0003493760920000063
测试数据集Xtest经上述公式(9)标准化处理后即可获得训练数据集
Figure GDA0003493760920000064
优选的,步骤S7中,利用变量自组织函数X0′=SA(X0)对测试数据集
Figure GDA0003493760920000065
进行过程变量重排列操作,则有:
Figure GDA0003493760920000066
由公式(10)得到测试数据集
Figure GDA0003493760920000067
过程变量重排列后的测试数据集
Figure GDA0003493760920000068
优选的,步骤S8中,测试数据集
Figure GDA0003493760920000069
的测试数据输入至VSACNN故障诊断模型中,则有:
Figure GDA00034937609200000610
式中,
Figure GDA00034937609200000611
为VSACNN故障诊断模型的输出;
VSACNN故障诊断模型的输出
Figure GDA00034937609200000612
即为测试数据的故障判别类型。
与现有技术相比,本发明的优点和积极效果在于:
本发明提供的多变量工业过程故障分类方法,使用正常操作工况数据集来分析过程变量之间的相关性,计算变量之间的相关性因子,并进一步根据变量之间的相关性因子构建变量自组织函数,使用卷积神经网络建模方法构建VSACNN故障分类模型,利用训练数据集来进行网络参数的优化,通过测试数据集评估该分类模型的性能,并根据VSACNN分类模型对故障类型进行判别。本发明将变量关系分析与CNN模型相结合,提高局部变量之间的相关性,从而帮助CNN充分挖掘相关过程变量之间的联系,改善CNN在提取局部特征的信息有效性,能够有效地提升故障分类的准确率。
附图说明
图1为本发明实施例所述多变量工业过程故障分类方法的流程图;
图2为本发明实施例所述田纳西-伊斯曼(简称:TE)系统的原理图。
具体实施方式
下面,通过示例性的实施方式对本发明进行具体描述。然而应当理解,在没有进一步叙述的情况下,一个实施方式中的元件、结构和特征也可以有益地结合到其他实施方式中。
参见图1,本发明提供了一种多变量工业过程故障分类方法,其具体步骤为:
S1、采集工业过程正常操作工况数据建立正常工况数据集X0,利用正常操作工况数据集X0的均值m0与标准差s0通过公式(1)对正常操作工况数据集X0进行标准化处理,公式(1)的表达式为:
Figure GDA0003493760920000071
正常操作工况数据集X0经上述公式(1)标准化处理后即可获得正常工况数据集
Figure GDA0003493760920000072
S2、采用正常工况数据集
Figure GDA0003493760920000073
进行变量相关性分析,通过公式(2)计算过程变量之间的相关性因子RF(vi,vj),其中,vi与vj表示过程数据的任意两个变量,公式(2)表示为:
Figure GDA0003493760920000074
式中,Cor(vi,vj)为过程变量vi与vj的皮尔逊相关系数,PD(vi,vj)为过程变量vi与vj的概率分布差异,定义为:
Figure GDA0003493760920000081
式中,p(·)为变量概率密度函数,H(p(vi),p(vj))为变量概率密度在欧氏空间上的Hellinger距离,cos(p(vi),p(vj))为变量概率密度的余弦相似度。
需要说明的是,若两过程变量vi与vj的相关性因子RF(vi,vj)的值越接近于1,说明过程变量vi与vj之间相关性越强;反之,RF(vi,vj)越接近于0,说明过程变量vi与vj相关性越弱。因为CNN在提取特征时更多关注局部特征,所以应尽可能地将相关性比较强的变量放置在一起进行考虑。
S3、根据相关性因子RF(vi,vj)构建无向有权图G,对无向有权图G进行广度优先遍历,并根据变量之间的相关性进行分组,利用分组构建变量自组织函数X0′=SA(X0),其中,X0为原始过程数据,X0′为变量顺序重新组织后的过程数据。
具体地,构建变量自组织函数的具体步骤为:
S31、构建各变量之间的相关性矩阵RF,表示为:
Figure GDA0003493760920000082
式中,RFij为过程变量vi与vj之间的相关性因子RF(vi,vj),即两变量之间的相关程度,i=1,2,…,m,j=1,2,…,m,m为过程变量个数;
以所有的过程变量索引为顶点,遍历相关性矩阵RF构建无向有权图G,其中,仅RFij≥γ时表示无向有权图G中顶点i和j邻接,即无向有权图G中顶点i和j之间有一条边,权重Gij=RFij,γ为设定阈值;
S32、令k=1,选择无向有权图G中未分组变量中相关性最强的两个过程变量vi与vj的索引构成集合Sk
S33、广度优先遍历过程变量vi与vj的邻接变量,计算每一个邻接变量vadj与集合Sk中变量的平均相关性因子
Figure GDA0003493760920000091
其中nk表示集合Sk中变量索引的个数,
Figure GDA0003493760920000092
表示集合Sk中的第l个变量;
S34、若
Figure GDA0003493760920000093
则邻接变量vadj的索引归入集合Sk;反之,邻接变量vadj等待下一轮遍历;
S35、完成一轮遍历,k=k+1;
S36、重复步骤S32-S35,直到遍历完无向有权图G中所有变量;
S37、将无向有权图G中未分组变量与不在无向有权图G中的变量的索引组合记为S,若通过遍历无向有权图G获得B个集合,则新的变量排列可以表示为O(X0)=[S1,S2,…,SB,S],进一步根据O(X0)构造变量自组织函数X0′=SA(X0),其中,X0′=O(X0)。
S4、采集C类故障工况数据集{X1,X2,…,XC},并与正常工况数据集X0构成训练数据集Xtrain={X0,X1,…,XC},利用训练数据集Xtrain的均值mtrain和标准差strain通过公式(5)对训练数据集Xtrain进行标准化处理,公式(5)表示为:
Figure GDA0003493760920000094
训练数据集Xtrain经上述公式(5)标准化处理后即可获得训练数据集
Figure GDA0003493760920000095
S5、以训练数据集
Figure GDA0003493760920000096
为输入,利用卷积神经网络建模方法构建VSACNN故障诊断模型,VSACNN故障诊断模型表示为:
Figure GDA0003493760920000097
其中,x表示输入样本,
Figure GDA0003493760920000098
表示模型输出,即模型针对输入样本x的故障预测类别,F(·)为一个多层的卷积神经网络函数。
具体地,利用卷积神经网络建模方法构建VSACNN故障诊断模型的步骤为:
S51、构建训练数据集
Figure GDA0003493760920000101
作为模型输入,设置卷积神经网络的层数为L、卷积核个数为n、卷积核大小为p、池化层窗口大小为s、学习率为lr;
S52、使用变量自组织函数X0′=SA(X0)对训练数据集
Figure GDA0003493760920000102
进行变量重排列操作;
S53、卷积神经网络函数F(·)包括卷积层、池化层与输出层,其中,卷积层的具体运算公式表示为:
Figure GDA0003493760920000103
式中,y(q)为第q层网络的卷积激活值,x(q-1)为第q层网络的输入,Wq为第q层网络的卷积核权重,
Figure GDA0003493760920000104
表示卷积运算,j代表在卷积核范围之内的元素索引,bq为第q层网络的偏置值,f(·)为ReLU(·)非线性激活函数;
池化层使用最大池化操作,即对卷积层激活特征进行如下操作:
z(q)=max(y(q),s) (7)
式中,z(q)为第q层网络通过最大池化操作得到的特征矩阵;
输出层首先对提取到的特征向量进行线性变换,然后使用Softmax分类器进行故障类型判别;
S54、采用公式(8)计算模型的预测损失并进行优化求解,公式(8)表示为:
Figure GDA0003493760920000105
式中,J(·)为优化目标函数,yi为样本真实标签,
Figure GDA0003493760920000106
为样本预测标签,θ表示模型的参数,λ为惩罚因子,L(·)为交叉熵损失函数,M为样本的数量;
则构建VSACNN故障诊断模型表示为:
Figure GDA0003493760920000107
S6、采集测试数据集Xtest,利用训练数据集
Figure GDA0003493760920000111
的均值mtrain和标准差strain通过公式(9)对测试数据集Xtest进行标准化处理,公式(9)表达式为:
Figure GDA0003493760920000112
测试数据集Xtest经上述公式(9)标准化处理后即可获得训练数据集
Figure GDA0003493760920000113
S7、利用变量自组织函数X0′=SA(X0)对测试数据集
Figure GDA0003493760920000114
进行过程变量重排列操作,则有:
Figure GDA0003493760920000115
由公式(10)得到测试数据集
Figure GDA0003493760920000116
过程变量重排列后的测试数据集
Figure GDA0003493760920000117
S8、将测试数据集
Figure GDA0003493760920000118
输入至VSACNN故障诊断模型,则有:
Figure GDA0003493760920000119
式中,
Figure GDA00034937609200001110
为VSACNN故障诊断模型的输出;
VSACNN故障诊断模型的输出
Figure GDA00034937609200001111
即为测试数据的故障判别类型。
上述方法中,步骤S1至S5为离线建模阶段,步骤S6至S8为在线测试阶段。
本发明上述故障分类方法,对正常操作工况数据进行标准化,并利用正常工况数据计算过程变量之间的相关性因子;根据各变量之间的相关性因子构建无向有权图G,通过对无向有权图G进行广度优先遍历,将相关性强的过程变量索引划分至一个集合,并根据分组构建变量自组织函数;在训练集上构建基于变量自组织CNN的故障诊断模型;在线测试时,根据重新构建的变量排列顺序对测试样本进行变量自组织,并使用训练好的VSACNN模型进行故障类型判别。本发明将变量关系分析与CNN模型相结合,提高局部变量之间的相关性,从而帮助CNN充分挖掘相关过程变量之间的联系,提高CNN在提取局部特征的信息有效性,能够有效地提高故障分类的准确率。
为了说明本发明上述多变量工业过程故障分类方法的效果,以下结合具体实施例对本发明做出进一步说明。
实施例:以田纳西-伊斯曼(以下简称:TE)为例进行说明。
TE过程是由美国伊斯曼化学公司的Downs和Vogel根据一个实际的化工过程建立的实验平台,现被广泛用于验证控制算法和过程监控方法的优劣。参见图2,TE过程主要由五个单元组成,包括反应器、产品冷凝器、气液分离器、循环压缩机和汽提塔组成。TE过程共53个变量,其中包括22个连续过程变量、19个成分变量和12个操作变量,在本实施中使用了52个变量来进行方法的验证(没有使用搅拌速度变量),详细信息参见表1。
表1
Figure GDA0003493760920000121
Figure GDA0003493760920000131
实验中采用TE过程所有工况的数据(包括正常工况样本与21种故障样本)来验证故障分类方法的有效性,其中21种故障详细信息参见表2。在本实施中,训练数据集与测试数据集的划分比例为4:1。进一步使用6个CNN模型来进行对比实验,前三个CNN模型分别为CNN-R1、CNN-R2和CNN-R3,采用随机变量排列顺序。第5个CNN模型CNN-De基于TE过程仿真实验的默认变量顺序,第4个CNN模型CNN-RE与CNN-DE相反的变量排列顺序。最后,利用本发明方法中建立的VSACNN模型,在构建变量自组织函数时相关性阈值设置为0.7。表2给出了6个模型的过程变量排列顺序。需要注意的是6个模型在训练时使用的基本CNN模型所有超参数是一致的。
表2
Figure GDA0003493760920000141
表3给出了6种模型在TE过程数据上故障诊断准确率,从表3中可以看出CNN-DE与CNN-RE方法故障诊断性能大致相同,但是比CNN-R1、CNN-R2及CNN-R3方法分别高出了8.38%、5.84%、8.15%,说明变量排列顺序对于CNN模型的重要性。进一步本发明提出的基于变量自组织CNN的故障分类方法实现了最高的故障诊断准确率91.23%,比CNN-DE模型高出2.84%,显示出VSACNN方法的有效性。
表3
Figure GDA0003493760920000142
Figure GDA0003493760920000151
上述实施例用来解释本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。

Claims (8)

1.一种多变量工业过程故障分类方法,其特征在于,其具体步骤为:
S1、采集工业过程正常操作工况数据建立正常工况数据集X0,标准化处理后得到正常工况数据集
Figure FDA0003493760910000011
S2、采用正常工况数据集
Figure FDA0003493760910000012
进行变量相关性分析,计算过程变量之间的相关性因子RF(vi,vj),其中,vi与vj表示过程数据的任意两个变量;
S3、根据相关性因子RF(vi,vj)构建无向有权图G,对无向有权图G进行广度优先遍历,并根据变量之间的相关性进行分组,利用分组构建变量自组织函数X0′=SA(X0),其中,X0为原始过程数据,X0′为变量顺序重新组织后的过程数据;构建变量自组织函数的具体步骤为:
S31、构建各变量之间的相关性矩阵RF,表示为:
Figure FDA0003493760910000013
式中,RFij为过程变量vi与vj之间的相关性因子RF(vi,vj),即两变量之间的相关程度,i=1,2,...,m,j=1,2,...,m,m为过程变量个数;以所有的过程变量索引为顶点,遍历相关性矩阵RF构建无向有权图G,其中,仅RFij≥γ时表示无向有权图G中顶点i和j邻接,即无向有权图G中顶点i和j之间有一条边,权重Gij=RFij,γ为设定阈值;
S32、令k=1,选择无向有权图G中未分组变量中相关性最强的两个过程变量vi与vj的索引构成集合Sk
S33、广度优先遍历过程变量vi与vj的邻接变量,计算每一个邻接变量vadj与集合Sk中变量的平均相关性因子
Figure FDA0003493760910000014
其中nk表示集合Sk中变量索引的个数,
Figure FDA0003493760910000015
表示集合Sk中的第l个变量;
S34、若
Figure FDA0003493760910000021
则邻接变量vadj的索引归入集合Sk;反之,邻接变量vadj等待下一轮遍历;
S35、完成一轮遍历,k=k+1;
S36、重复步骤S32-S35,直到遍历完无向有权图G中所有变量;
S37、将无向有权图G中未分组变量与不在无向有权图G中的变量的索引组合记为S,若通过遍历无向有权图G获得B个集合,则新的变量排列可以表示为O(X0)=[S1,S2,…,SB,S],进一步根据O(X0)构造变量自组织函数X0′=SA(X0),其中,X0′=O(X0);
S4、采集C类故障工况数据集{X1,X2,…,XC},并与正常工况数据集X0构成训练数据集Xtrain={X0,X1,…,XC},标准化处理后得到训练数据集
Figure FDA0003493760910000022
S5、以训练数据集
Figure FDA0003493760910000023
为输入,利用卷积神经网络建模方法构建VSACNN故障诊断模型,VSACNN故障诊断模型表示为:
Figure FDA0003493760910000024
其中,x表示输入样本,
Figure FDA0003493760910000025
表示模型输出,即模型针对输入样本x的故障预测类别,F(·)为一个多层的卷积神经网络函数;
S6、采集测试数据集Xtest,标准化后得到测试数据集
Figure FDA0003493760910000026
S7、利用变量自组织函数X0′=SA(X0)对测试数据集
Figure FDA0003493760910000027
进行过程变量重排列操作得到测试数据集
Figure FDA0003493760910000028
S8、将测试数据集
Figure FDA0003493760910000029
输入至VSACNN故障诊断模型,根据VSACNN故障诊断模型输出确定故障类型。
2.如权利要求1所述的多变量工业过程故障分类方法,其特征在于,步骤S1中,利用正常操作工况数据集X0的均值m0与标准差s0通过公式(1)对正常操作工况数据集X0进行标准化处理,公式(1)的表达式为:
Figure FDA00034937609100000210
正常操作工况数据集X0经上述公式(1)标准化处理后即可获得正常工况数据集
Figure FDA0003493760910000031
3.如权利要求2所述的多变量工业过程故障分类方法,其特征在于,步骤S2中,通过公式(2)计算过程变量之间的相关性因子RF(vi,vj),公式(2)表示为:
Figure FDA0003493760910000032
式中,Cor(vi,vj)为过程变量vi与vj的皮尔逊相关系数,PD(vi,vj)为过程变量vi与vj的概率分布差异,定义为:
Figure FDA0003493760910000033
式中,p(·)为变量概率密度函数,H(p(vi),p(vj))为变量概率密度在欧氏空间上的Hellinger距离,cos(p(vi),p(vj))为变量概率密度的余弦相似度。
4.如权利要求3所述的多变量工业过程故障分类方法,其特征在于,步骤S4中,利用训练数据集Xtrain的均值mtrain和标准差strain通过公式(5)对训练数据集Xtrain进行标准化处理,公式(5)表示为:
Figure FDA0003493760910000034
训练数据集Xtrain经上述公式(5)标准化处理后即可获得训练数据集
Figure FDA0003493760910000035
5.如权利要求4所述的多变量工业过程故障分类方法,其特征在于,步骤S5中,利用卷积神经网络建模方法构建VSACNN故障诊断模型的步骤为:
S51、构建训练数据集
Figure FDA0003493760910000036
作为模型输入,设置卷积神经网络的层数为L、卷积核个数为n、卷积核大小为p、池化层窗口大小为s、学习率为lr;
S52、使用变量自组织函数X0′=SA(X0)对训练数据集
Figure FDA0003493760910000041
进行变量重排列操作;
S53、卷积神经网络函数F(·)包括卷积层、池化层与输出层,其中,卷积层的具体运算公式表示为:
Figure FDA0003493760910000042
式中,y(q)为第q层网络的卷积激活值,x(q-1)为第q层网络的输入,Wq为第q层网络的卷积核权重,
Figure FDA0003493760910000043
表示卷积运算,j代表在卷积核范围之内的元素索引,bq为第q层网络的偏置值,f(·)为ReLU(·)非线性激活函数;
池化层使用最大池化操作,即对卷积层激活特征进行如下操作:
z(q)=max(y(q),s) (7)
式中,z(q)为第q层网络通过最大池化操作得到的特征矩阵;
输出层首先对提取到的特征向量进行线性变换,然后使用Softmax分类器进行故障类型判别;
S54、采用公式(8)计算模型的预测损失并进行优化求解,公式(8)表示为:
Figure FDA0003493760910000044
式中J(·)为优化目标函数,yi为样本真实标签,
Figure FDA0003493760910000045
为样本预测标签,θ表示模型的参数,λ为惩罚因子,L(·)为交叉熵损失函数,M为样本的数量;
则构建VSACNN故障诊断模型表示为:
Figure FDA0003493760910000046
6.如权利要求5所述的多变量工业过程故障分类方法,其特征在于,步骤S6中,利用训练数据集
Figure FDA0003493760910000047
的均值mtrain和标准差strain通过公式(9)对测试数据集Xtest进行标准化处理,公式(9)表达式为:
Figure FDA0003493760910000051
测试数据集Xtest经上述公式(9)标准化处理后即可获得训练数据集
Figure FDA0003493760910000052
7.如权利要求6所述的多变量工业过程故障分类方法,其特征在于,步骤S7中,利用变量自组织函数X0′=SA(X0)对测试数据集
Figure FDA0003493760910000053
进行过程变量重排列操作,则有:
Figure FDA0003493760910000054
由公式(10)得到测试数据集
Figure FDA0003493760910000055
过程变量重排列后的测试数据集
Figure FDA0003493760910000056
8.如权利要求7所述的多变量工业过程故障分类方法,其特征在于,步骤S8中,测试数据集
Figure FDA0003493760910000057
的测试数据输入至VSACNN故障诊断模型中,则有:
Figure FDA0003493760910000058
式中,
Figure FDA0003493760910000059
为VSACNN故障诊断模型的输出;
VSACNN故障诊断模型的输出
Figure FDA00034937609100000510
即为测试数据的故障判别类型。
CN202110534721.0A 2021-05-17 2021-05-17 多变量工业过程故障分类方法 Active CN113159225B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110534721.0A CN113159225B (zh) 2021-05-17 2021-05-17 多变量工业过程故障分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110534721.0A CN113159225B (zh) 2021-05-17 2021-05-17 多变量工业过程故障分类方法

Publications (2)

Publication Number Publication Date
CN113159225A CN113159225A (zh) 2021-07-23
CN113159225B true CN113159225B (zh) 2022-04-19

Family

ID=76876144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110534721.0A Active CN113159225B (zh) 2021-05-17 2021-05-17 多变量工业过程故障分类方法

Country Status (1)

Country Link
CN (1) CN113159225B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113687610B (zh) * 2021-07-28 2023-03-24 国网江苏省电力有限公司南京供电分公司 一种gan-cnn电力监测系统终端信息防护法方法
CN114637263B (zh) * 2022-03-15 2024-01-12 中国石油大学(北京) 一种异常工况实时监测方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020713A (zh) * 2012-11-19 2013-04-03 山东大学 一种结合拓扑与继电保护逻辑的智能变电站故障诊断方法
CN109164794A (zh) * 2018-11-22 2019-01-08 中国石油大学(华东) 基于偏f值selm的多变量工业过程故障分类方法
EP3620983A1 (en) * 2018-09-05 2020-03-11 Sartorius Stedim Data Analytics AB Computer-implemented method, computer program product and system for data analysis
CN111964908A (zh) * 2020-08-17 2020-11-20 天津大学 一种基于mwdcnn的变工况下轴承故障诊断方法
CN112747921A (zh) * 2020-12-24 2021-05-04 武汉科技大学 一种基于na-memd的多传感器机械故障诊断的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020713A (zh) * 2012-11-19 2013-04-03 山东大学 一种结合拓扑与继电保护逻辑的智能变电站故障诊断方法
EP3620983A1 (en) * 2018-09-05 2020-03-11 Sartorius Stedim Data Analytics AB Computer-implemented method, computer program product and system for data analysis
CN109164794A (zh) * 2018-11-22 2019-01-08 中国石油大学(华东) 基于偏f值selm的多变量工业过程故障分类方法
CN111964908A (zh) * 2020-08-17 2020-11-20 天津大学 一种基于mwdcnn的变工况下轴承故障诊断方法
CN112747921A (zh) * 2020-12-24 2021-05-04 武汉科技大学 一种基于na-memd的多传感器机械故障诊断的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《Combining FAP, MAP and correlation analysis for multivariate alarm thresholds optimization in industrial process》;Liu Han等;《Journal of Loss Prevention in the Process Industries(2016)》;20161231;全文 *
《Multivariate process monitoring and fault diagnosis by multi-scale PCA》;Manish Misra等;《Computers and Chemical Engineering 26 (2002)》;20021231;全文 *
《多变量状态估计故障预警在工业过程中的应用》;王世林等;《Proceedings of the 33rd Chinese Control Conference》;20140730;全文 *

Also Published As

Publication number Publication date
CN113159225A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
Wu et al. A transformer-based approach for novel fault detection and fault classification/diagnosis in manufacturing: A rotary system application
CN108445752B (zh) 一种自适应选择深度特征的随机权神经网络集成建模方法
CN113642754B (zh) 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法
CN110197205A (zh) 一种多特征来源残差网络的图像识别方法
CN113159225B (zh) 多变量工业过程故障分类方法
CN103914064A (zh) 基于多分类器和d-s证据融合的工业过程故障诊断方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN114429152A (zh) 基于动态指数对抗性自适应的滚动轴承故障诊断方法
CN112147432A (zh) 基于注意力机制的BiLSTM模块、变压器状态诊断方法和系统
CN116628597B (zh) 一种基于关系路径注意力的异质图节点分类方法
CN111338950A (zh) 一种基于谱聚类的软件缺陷特征选择方法
CN116562114A (zh) 一种基于图卷积神经网络的电力变压器故障诊断方法
CN108830006B (zh) 基于线性评价因子的线性-非线性工业过程故障检测方法
CN117494037A (zh) 一种基于变权vae与双通道特征融合的变压器故障诊断方法
CN109164794B (zh) 基于偏f值selm的多变量工业过程故障分类方法
CN113551904B (zh) 基于层次机器学习的齿轮箱多类型并发故障诊断方法
CN114297921A (zh) 基于am-tcn的故障诊断方法
CN116127398B (zh) 一种基于机理模型与多源数据融合的液压泵故障诊断方法
CN113177578A (zh) 一种基于lstm的农产品品质分类方法
CN117078960A (zh) 一种基于图像特征提取的近红外光谱分析方法及系统
CN116881640A (zh) 岩心采出程度的预测方法、系统及计算机可读存储介质
CN105046092A (zh) 基于主元核相似度免疫机制的航空发动机故障诊断方法
Song et al. Hydraulic Systems Fault Diagnosis Based on Random Forests Recursive Feature Elimination and XGBoost
CN108898157A (zh) 基于卷积神经网络的数值型数据的雷达图表示的分类方法
CN113837269A (zh) 基于双线性卷积神经网络的金相组织识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant