CN103616889B - 一种重构样本中心的化工过程故障分类方法 - Google Patents

一种重构样本中心的化工过程故障分类方法 Download PDF

Info

Publication number
CN103616889B
CN103616889B CN201310639613.5A CN201310639613A CN103616889B CN 103616889 B CN103616889 B CN 103616889B CN 201310639613 A CN201310639613 A CN 201310639613A CN 103616889 B CN103616889 B CN 103616889B
Authority
CN
China
Prior art keywords
signal
class
matrix
signaling point
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310639613.5A
Other languages
English (en)
Other versions
CN103616889A (zh
Inventor
王健
韩志艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bohai University
Original Assignee
Bohai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bohai University filed Critical Bohai University
Priority to CN201310639613.5A priority Critical patent/CN103616889B/zh
Publication of CN103616889A publication Critical patent/CN103616889A/zh
Application granted granted Critical
Publication of CN103616889B publication Critical patent/CN103616889B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明一种重构样本中心的化工过程故障分类方法,属于故障诊断领域,通过该方法可以在干扰、非高斯和非线性数据结构的条件下,寻找到样本数据真实的几何中心点,以此为基础设计的新的类间散度和类内散度,可以实现不同种类数据在映射空间中实现最大分离,提高工业过程中故障类型检测的准确性。

Description

一种重构样本中心的化工过程故障分类方法
技术领域
本发明属于故障诊断领域,具体涉及一种重构样本中心的化工过程故障分类方法。
背景技术
近年来,由于分布式控制系统的发展,大量的工业过程数据被有效地收集和储存起来,这些数据中包含了大量有价值的工业过程信息,使得基于数据驱动的工业过程监控方法获得了广泛的关注。fisher判别分析是一种在故障诊断领域中经常使用的数据驱动监控方法;fisher判别分析算法能够同时利用了正常工况和故障工况下的数据来建立模型,使得观测空间中的不同类别之间的数据在低维空间中得到最大的分离。fisher判别分析依赖于数据的中心点来计算散度矩阵以获取最优的投影方向,但是现代工业环境中,存在大量由于干扰引起的离群点,非高斯和非线性结构数据,使得传统的fisher判别分析计算所得的中心点和真实数据的中心点形成较大的误差。这就使得fisher判别分析在构建的类内散度和类间散度的时候无法真实反映样本数据的几何结构特征,导致性能大幅衰退。
发明内容
针对现有技术存在的不足,本发明提出一种重构样本中心的化工过程故障分类方法,以达到实现不同种类数据在映射空间中实现最大分离,提高故障检测的准确性的目的。
一种重构样本中心的化工过程故障分类方法,包括以下步骤:
步骤1、采集TEP工业过程历史信号,每个信号的数据包括:物料A流量、物料D流量、物料E流量、物料C流量、压缩机返回物料流量、反应器给料流量、反应器压力、反应器液位、反应器温度、排空物料流量、汽/液分类器温度、汽/液分类器液位、汽/液分类器压力、汽/液分类器出口流量、解析塔液位、解析塔压力、解析塔出口流量、解析塔温度、解析塔蒸汽流量、压缩机功率、反应器冷凝液出口温度、冷凝器冷凝液出口温度、反应器流量色谱对物料A的测量结果、反应器流量色谱对物料B的测量结果、反应器流量色谱对物料C的测量结果、反应器流量色谱对物料D的测量结果、反应器流量色谱对物料E的测量结果、放空气体色谱对物料A的测量结果、放空气体色谱对物料B的测量结果、放空气体色谱对物料C的测量结果、放空气体色谱对物料D的测量结果、放空气体色谱对物料E的测量结果、放空气体色谱对物料G的测量结果、放空气体色谱对物料H的测量结果、产品流量色谱对物料D的测量结果、产品流量色谱对物料E的测量结果、产品流量色谱对物料G的测量结果、产品流量色谱对物料H的测量结果、物料D进料量、物料E进料量、物料A进料量、物料A、C混合进料量、压缩机再循环阀开度、排放阀开度、分离器罐液流量、汽提器液体产品流量、汽提器水流阀开度、反应器冷却水流量、冷凝器冷却水流量和搅拌速度;从上述历史信号中选择出正常信号和故障信号,并确定每个故障信号所属故障类型;
步骤2、在历史信号中随机采集期望数量的各类信号;
步骤3、将采集获得的信号进行归一化处理;
步骤4、根据采集信号内数据值的大小,将一类信号在多维空间内进行分布,形成信号点,采用欧几里德距离计算上述信号点之间的距离,选出每一个信号点与其他信号点之间的距离最短的2~5个点,作为该点的最近邻同类信号点;
步骤5、根据该类信号个数和两个信号点之间距离情况,建立该类信号的邻接矩阵;
步骤6、建立能量密度矩阵,以该类信号个数作为该矩阵的行数,该矩阵的列数为1,矩阵中每行元素的取值为该类信号的邻接矩阵中对应行元素的总和,表示该类每个信号的能量密度值,若能量密度值小于设定的能量密度阈值,则删除对应信号;
步骤7、反复执行步骤4至步骤6,获得每种类型信号中剩余的信号点并储存;
步骤8、采用欧几里德距离获得剩余的所有类型信号点之间的距离,并根据剩余信号点之间的距离、剩余的所有类型信号点总数和每类信号点剩余个数,建立类内散度矩阵和类间散度矩阵,进而获得最优判别投影矩阵;
步骤8-1、采用欧几里德距离计算剩余的所有类型信号点之间的距离,选出每一个信号点与其他信号点之间的距离最短的2~5个点,并确定所选信号点所属类型,进一步选择出与该信号点同类型信号点和不同类型信号点;
步骤8-2、根据剩余的所有类型信号点总数、每类信号点剩余个数、剩余所有信号和所选同类型信号点,建立全局类内散度矩阵;
步骤8-3、根据剩余的所有类型信号点总数、剩余所有信号和所选同类型信号点,建立局部类内散度矩阵;
步骤8-4、根据建立的全局类内散度矩阵和局部类内散度矩阵获得类内散度矩阵;
步骤8-5、根据剩余的所有类型信号点总数、每类信号点剩余个数、剩余所有信号和所选不同类型信号点,建立全局类间散度矩阵;
步骤8-6、根据剩余的所有类型信号点总数、剩余所有信号和所选不同类型信号点,建立局部类间散度矩阵;
步骤8-7、根据建立的全局类间散度矩阵和局部类间散度矩阵获得类间散度矩阵;
步骤8-8、根据获得的类内散度矩阵和类间散度矩阵,获得使投影后的信号点类间散度最大而类内散度最小的最优判别投影矩阵;
步骤9、根据获得的最优判别投影矩阵,将剩余的所有信号投影至另一个子空间中,获得该子空间内每个信号的像,即获得样本的像,完成历史信号样本的提取;
步骤10、实时采集被测TEP工业过程信号,并对所采集的信号进行归一化处理;
步骤11、根据获得的最优判别投影矩阵将实时被测信号投影至子空间中,获得该检测信号在子空间内的像,在子空间中寻找距离该被测信号像最近的样本的像,则该被测信号的类型则为该样本的类型;
步骤12、若判别出的被测TEP工业过程信号所属类型为故障类型,则计算机显示,并提示操作人员根据具体故障类型采取检修措施。
步骤1所述的物料A为氢气,物料B为氨气,物料C为一氧化碳,物料D为甲醇,物料E为乙醇,物料G为乙二醇,物料H为丙二醇。
步骤1所述的故障类型包括物料A/C进料比率产生阶跃变化并物料B成分不变、物料B成分产生阶跃变化并物料A/C进料比率不变、物料D的进料温度产生阶跃变化、反应器冷却水的入口温度产生阶跃变化、冷凝器冷却水的入口温度产生阶跃变化、物料A进料损失产生阶跃变化、物料C压力损失产生阶跃变化、物料A、B、C进料成分产生随机干扰、物料D的进料温度产生随机干扰、物料C的进料温度产生随机干扰、反应器冷却水的入口温度产生随机干扰、冷凝器冷却水的入口温度产生随机干扰、反应动态缓慢偏移、反应器冷却水阀门粘住、冷凝器冷却水阀门粘住和阀门固定在稳态位置不变化。
步骤4所述的多维相空间,该空间的维数等于采集的一个信号中数据的数目。
步骤5所述的建立该类信号的邻接矩阵,以该类信号个数作为邻接矩阵的行数和列数,矩阵中的每一个元素表示两个信号点之间距离情况,公式如下:
其中,wi,j表示邻接矩阵Wi,j中第i行第j列元素,即表示第i个信号点与第j个信号点之间的距离属性,若第i个信号点或第j个信号点为所选出的信号点,则wi,j取值为1,否则为0;表示第j个信号的最近邻同类信号点集合;表示第i个信号的最近邻同类信号点集合。
(1)、步骤8-2所述的建立全局类内散度矩阵Sgw,公式如下:
S gw = 1 2 Σ i , j = 1 p W gw , ij ( x i - x j ) ( x i - x j ) T - - - ( 2 )
其中,gw表示全局类内散度,T表示转置符号,p表示剩余的所有类型信号点总数,xi表示剩余的第i个信号点;xj表示剩余的第j个信号点;Mw(xj)表示剩余的第j个信号xj的最近邻同类信号点集合;li表示剩余的第i个信号xi的类型号;lj表示剩余的第j个信号xj的类型号;q表示信号的类型;pq表示第q类信号的剩余个数;
(2)、步骤8-3所述的建立局部类内散度矩阵Slw,公式如下:
S lw = 1 2 Σ i , j = 1 p W lw , ij ( x i - x j ) ( x i - x j ) T - - - ( 3 )
其中,lw表示局部类内散度,Mw(xi)表示剩余的第i个信号xi的最近邻同类信号点集合;
(3)、步骤8-4所述的获得类内散度矩阵Sw,公式如下:
Sw=αSlw+(1-α)Sgw(4)
其中,α为平衡系数,取值为0~1;
(4)、步骤8-5所述的建立全局类间散度矩阵Sgb,公式如下:
S gb = 1 2 Σ i , j = 1 p W gb , ij ( x i - x j ) ( x i - x j ) T - - - ( 5 )
其中,gb表示全局类间散度,Mb(xj)表示剩余的第j个信号xj的最近邻不同类信号点集合;
(5)、步骤8-6所述的建立局部类间散度矩阵Slb,公式如下:
S lb = 1 2 Σ i , j = 1 p W lb , ij ( x i - x j ) ( x i - x j ) T - - - ( 6 )
其中,lb表示局部类间散度,Mb(xi)表示剩余的第i个信号xi的最近邻不同类信号点集合;
(6)、步骤8-7所述的类间散度矩阵Sb,公式如下:
Sb=Slb+(1-β)Sgb(7)
其中,β为平衡系数,取值为0~1;
(7)、步骤8-8所述的获得使投影后的信号点类间散度最大而类内散度最小的最优判别投影矩阵,目标函数J公式如下:
J = arg max V V T S b V V T S w V - - - ( 8 )
其中,V表示最优判别投影矩阵;
通过求解|Sb-λSw|=0的特征值λ和对应的特征向量v,通过比较选取特征值大的d个特征值λ12>…>λd及其对应的特征向量v1,v1,…,vd,进而获得最优判别投影V=[v1,v1,…,vd]。
步骤9所述的获得该子空间内每个信号的像,公式如下:
yi=VTxi(9)
其中,yi表示信号xi的子空间的像。
本发明优点:
本发明一种重构样本中心的化工过程故障分类方法,通过该方法可以在干扰、非高斯和非线性数据结构的条件下,寻找到样本数据真实的几何中心点,以此为基础设计的新的类间散度和类内散度,可以实现不同种类数据在映射空间中实现最大分离,提高工业过程中故障类型检测的准确性。
附图说明
图1为本发明一种实施例的TEP工业过程示意图;
图2为本发明一种实施例的重构样本中心的化工过程故障分类方法流程图;
图3为本发明一种实施例的离群点对计算数据中心点的影响示意图;
图4为本发明一种实施例的非高斯数据结构对计算数据中心点的影响示意图;
图5为本发明一种实施例的非线性数据结构对计算数据中心点的影响示意图;
图6为本发明一种实施例的原始样本数据的变量1和变量2示意图;
图7为本发明一种实施例的FDA提取特征的变量1和变量2示意图;
图8为本发明一种实施例的RMDA提取特征的变量1和变量2示意图。
具体实施方式
下面结合附图对本发明一种实施例做进一步说明。
本发明实施例中,如图1所示,本方法应用于TennesseeEastmanProcess(TEP)过程中;TEP工业过程由美国伊斯曼化学品公司创建,此工业过程有四种反应物(A、C、D、E),生产两种产物(G和H),其中,物料A是H2氢气,物料B是N2氨气,物料C是CO一氧化碳,物料D是CH3OH甲醇,物料E是C2H5OH乙醇,生成物G是C2H6O2乙二醇,生成物H是C3H8O2丙二醇;整个过程包括五个主要的反应装置:反应器、冷凝器、循环压缩机、解析塔和气液分离器,共有50个变量和16种故障类型。
一种重构样本中心的化工过程故障分类方法,方法流程图如图2所示,包括以下步骤:
步骤1、采集TEP工业过程历史信号,每个信号的数据包括:物料A流量、物料D流量、物料E流量、物料C流量、压缩机返回物料流量、反应器给料流量、反应器压力、反应器液位、反应器温度、排空物料流量、汽/液分类器温度、汽/液分类器液位、汽/液分类器压力、汽/液分类器出口流量、解析塔液位、解析塔压力、解析塔出口流量、解析塔温度、解析塔蒸汽流量、压缩机功率、反应器冷凝液出口温度、冷凝器冷凝液出口温度、反应器流量色谱对物料A的测量结果、反应器流量色谱对物料B的测量结果、反应器流量色谱对物料C的测量结果、反应器流量色谱对物料D的测量结果、反应器流量色谱对物料E的测量结果、放空气体色谱对物料A的测量结果、放空气体色谱对物料B的测量结果、放空气体色谱对物料C的测量结果、放空气体色谱对物料D的测量结果、放空气体色谱对物料E的测量结果、放空气体色谱对物料G的测量结果、放空气体色谱对物料H的测量结果、产品流量色谱对物料D的测量结果、产品流量色谱对物料E的测量结果、产品流量色谱对物料G的测量结果、产品流量色谱对物料H的测量结果、物料D进料量、物料E进料量、物料A进料量、物料A、C混合进料量、压缩机再循环阀开度、排放阀开度、分离器罐液流量、汽提器液体产品流量、汽提器水流阀开度、反应器冷却水流量、冷凝器冷却水流量和搅拌速度;
从上述历史信号中选择出正常信号和故障信号,并确定每个故障信号所属故障类型:物料A/C进料比率产生阶跃变化并物料B成分不变、物料B成分产生阶跃变化并物料A/C进料比率不变、物料D的进料温度产生阶跃变化、反应器冷却水的入口温度产生阶跃变化、冷凝器冷却水的入口温度产生阶跃变化、物料A进料损失产生阶跃变化、物料C压力损失产生阶跃变化、物料A、B、C进料成分产生随机干扰、物料D的进料温度产生随机干扰、物料C的进料温度产生随机干扰、反应器冷却水的入口温度产生随机干扰、冷凝器冷却水的入口温度产生随机干扰、反应动态缓慢偏移、反应器冷却水阀门粘住、冷凝器冷却水阀门粘住和阀门固定在稳态位置不变化。
步骤2、在历史信号中随机采集期望数量的各类信号;
在历史数据库中提取正常状况和各类故障状态下的信号及每个信号对应的故障类标识作为训练信号集;首先设置需要提取的数据变量、起始和终止时间、采样间隔和每个信号类的样本数,提取得到的信号Rm表示m维的实数空间(m为信号内数据的个数),对应的类标识l1,l2,…,li,…,ln∈{0,1,2,…,c},可用0标记正常状态的数据类型,1,2,…,c标记不同的故障下的数据类型;表示从数据库中提取的各信号,i为信号的索引号,n表示提取样本信号的个数。
本发明实施例中,从历史数据库中,随机选取正常模式、故障4、故障9、故障11四种工况(四种故障类型)下的历史信号,每种工况下选取40小时的信号作为训练数据,每种情况随机选取800个信号,每个信号包含50个数据,连续采样时采样间隔是3分钟,得到共2400个样本,50个变量的训练数据集及其对应的类标识和共800个样本,50个变量的检测数据集。
表1
由表1的故障实例可知:故障4、故障9和故障11都是与温度变化相关的故障。其中故障4和故障11是由反应器冷却水的入口温度异常引起,具有相同的故障变量却有不同的故障类型:故障4是阶跃型,故障11是随机波动型。故障9是由D进料温度的随机变化引起的,故障信号与正常模式下信号在中心点和方差方面差异不大。因此这四种模式下的过程信号彼此重叠,再加上TEP过程数据本身具非线性和非高斯结构的特征及噪声干扰造成的离群点,使传统的fisher判别分析由于中心点计算而难以产生好的分离效果。
步骤3、将采集获得的信号进行归一化处理;
本发明实施例中,对提取的训练信号作归一化处理,使各变量均值为0,方差为1,具体过程如下:
步骤3-1、计算所提取信号的均值
x ‾ = 1 n Σ i = 1 n x ~ i - - - ( 10 )
即对提取的信号中每一个数据分别求平均值,其中n为2400;
步骤3-2、计算所提取信号的方差向量σ2
σ 2 = 1 n - 1 Σ i = 1 n ( x ~ i - x ‾ ) 2 - - - ( 11 )
即对提取的信号中每一个数据分别求标准差;
步骤3-3、计算所提取信号的平移伸缩
即对提取的信号中每一个数据分别平移伸缩;
即获得得到归一化后的训练信号
步骤4、根据历史信号中信号内数据值的大小,将一类信号在50维空间内进行分布,形成信号点,采用欧几里德距离计算上述信号点之间的距离,选出每一个信号点与其他信号点之间的距离最短的5个点,作为该点的最近邻同类信号点;
本发明实施例中,采用欧几里德距离计算每个信号的5个最近邻同类数据点集合其中拥有相同的类标识;
步骤5、根据该类信号个数和两个信号点之间距离情况,建立该类信号的邻接矩阵;
建立该类信号的邻接矩阵Wi,j,以该类信号个数作为邻接矩阵的行数和列数,矩阵中的每一个元素表示两个信号点之间距离情况,公式如下:
步骤6、建立能量密度矩阵,以该类信号个数作为该矩阵的行数,该矩阵的列数为1,矩阵中每行元素的取值为该类信号的邻接矩阵中对应行元素的总和,表示每个信号的能量密度值,若能量密度值小于设定的能量密度阈值128,则删除对应信号;
本发明实施例中,的能量密度矩阵Di的计算公式为:
Di=∑jwi,j(13)
的能量密度Di<128,则在训练数据集中删除最后得到去除离群点后得到的训练信号集为x1,x2,…,xi,…,xp,p为去除离群点后训练信号的个数;
离群点对计算数据中心点的影响如图3所示,两类信号的真实几何中心位置(大圆点)和受离群点影响计算所得的中心位置(矩形点)形成较大的偏差。本发明实施例中,共删除作为离群点的信号192个,得到去除干扰的建模信号集共为2208个信号;
非高斯数据结构对计算信号中心点的影响如图4所示,图中非高斯分布的信号有两个中心点(大实心圆),而计算的到数据中心点只有一个(空心圆)。非线性数据结构对计算数据中心点的影响如图5所示,通过欧几里德距离得到的中心点(空心圆)并非数据中心点的真实位置(大实心圆)。
步骤7、反复执行步骤4至步骤6,获得每种类型信号中剩余的信号点并储存;
步骤8、采用欧几里德距离获得剩余的所有类型信号点之间的距离,并根据剩余信号点之间的距离、剩余的所有类型信号点总数和每类信号点剩余个数,建立类内散度矩阵和类间散度矩阵,进而获得最优判别投影矩阵;
步骤8-1、采用欧几里德距离计算剩余的所有类型信号点之间的距离,选出每一个信号点与其他信号点之间的距离最短的5个点,并确定所选信号点所属类型,进一步选择出与该信号点同类型信号点和不同类型信号点;
本发明实施例中,利用得到去除离群点后得到的训练信号集x1,x2,…,xi,…,xp,及对应的类标识l1,l2,…,li,…,lp∈{0,1,2,…,l,…,c},计算欧几里德距离定义下的每个数据点xi的5个最近邻数据点集合其中拥有不同的类标识,将M(xi)分为两部分Mw(xi)和Mb(xi),Mw(xi)为与xi属于同一类信号集合,Mb(xi)为与xi属于不同类信号集合;统计c+1个类中各信号个数p0,p1,p2,…,pq,…,pp,q为类标识的索引号;本发明实施例中,统计4种工况中每种工况包含信号个数p0,p4,p9,p11。四种工况信号的总个数n为2208。
步骤8-2、根据剩余的所有类型信号点总数、每类信号点剩余个数、剩余所有信号和所选同类型信号点,建立全局类内散度矩阵;
建立全局类内散度矩阵Sgw,公式如下:
S gw = 1 2 &Sigma; i , j = 1 p W gw , ij ( x i - x j ) ( x i - x j ) T - - - ( 2 )
其中,
步骤8-3、根据剩余的所有类型信号点总数、剩余所有信号和所选同类型信号点,建立局部类内散度矩阵;
建立局部类内散度矩阵Slw,公式如下:
S lw = 1 2 &Sigma; i , j = 1 p W lw , ij ( x i - x j ) ( x i - x j ) T - - - ( 3 )
其中,
步骤8-4、根据建立的全局类内散度矩阵和局部类内散度矩阵获得类内散度矩阵;
获得类内散度矩阵Sw,公式如下:
Sw=αSlw+(1-α)Sgw(4)
其中,α为平衡系数,取值为0.1;
步骤8-5、根据剩余的所有类型信号点总数、每类信号点剩余个数、剩余所有信号和所选不同类型信号点,建立全局类间散度矩阵;
建立全局类间散度矩阵Sgb,公式如下:
S gb = 1 2 &Sigma; i , j = 1 p W gb , ij ( x i - x j ) ( x i - x j ) T - - - ( 5 )
其中,
步骤8-6、根据剩余的所有类型信号点总数、剩余所有信号和所选不同类型信号点,建立局部类间散度矩阵;
建立局部类间散度矩阵Slb,公式如下:
S lb = 1 2 &Sigma; i , j = 1 p W lb , ij ( x i - x j ) ( x i - x j ) T - - - ( 6 )
其中,
步骤8-7、根据建立的全局类间散度矩阵和局部类间散度矩阵获得类间散度矩阵;
类间散度矩阵Sb,公式如下:
Sb=Slb+(1-β)Sgb(7)
其中,β为平衡系数,取值为0.1;
步骤8-8、根据获得的类内散度矩阵和类间散度矩阵,获得使投影后的信号点类间散度(各类之间信号点距离最大)最大而类内散度最小(同类信号点之间距离最小)的最优判别投影矩阵;
目标函数J公式如下:
J = arg max V V T S b V V T S w V - - - ( 8 )
目标函数求解步骤为:
1)求解|Sb-λSw|=0的广义特征值λ和对应的特征向量v;
2)选取特征值最大的d个特征值λ12>…>λd所对应的特征向量v1,v1,…,vd;
3)最优判别投影V=[v1,v1,…,vd];
步骤9、根据获得的最优判别投影矩阵,将剩余的所有信号投影至另一个子空间中,获得该子空间内每个信号的像,即获得样本的像,完成历史信号样本的提取;
获得该子空间内每个信号的像,公式如下:
yi=VTxi(9)
步骤10、实时采集被测TEP工业过程信号,并对所采集的信号进行归一化处理;
步骤11、根据获得的最优判别投影矩阵将实时被测信号投影至子空间中,获得该检测信号在子空间内的像,在子空间中寻找距离该被测信号像最近的样本的像,则该被测信号的类型则为该样本的类型;
本发明实施例中,采用最优判别投影V将平移伸缩后的实时信号xnew投影到子空间中,得到实时信号在子空间中的像ynew,ynew=VTxnew,使用基于欧几里德距离定义的最近邻搜索寻找去除离群点后的训练信号在子空间中的像yi(i=1,…,p)中距离像ynew最近的点,根据这个点的状态类别判别实时数据的xnew状态类别。
步骤12、若判别出的被测TEP工业过程信号所属类型为故障类型,则计算机显示,并提示操作人员根据具体故障类型采取检修措施。
本发明实施例中,为证明本发明的检测效果,将fisher判别分析(FisherDiscriminantAnalysis,FDA)和RMDA(Re-weightingSamplingMeanFisherDiscriminantAnalysis,RMDA)方法(本发明)的检测性能进行对比;四种模式检测样本的变量1和变量2如图6所示,可以看出原始数据混杂在一起,各类数据的中心点难以区分。经FDA算法提取特征后,所得特征向量的变量1和变量2如图7所示,可以看出由于四种模式的样本数据重叠率高,TEP过程数据本身的非线性和非结构影响,FDA算法获得各类数据特征的可分性较差。经RMDA算法提取特征后,所得特征向量的变量1和变量2如图8所示,可以看出,引入流形学习的思想后,RMDA算法构造的散度矩阵增强了Fisher准则的可分性,但是,由于故障9的样本数据中心与正常模式的数据中心差异性较小,导致分离效果不够理想。从表2的识别率表明,RMDA算法的识别率在四种模式下比传统的FDA算法均有提高,特别是故障9和故障11,故障9的识别率提高27%,故障11识别率提高达到41%。
表2
由表2可知,本发明能够克服干扰因素形成的离群点,非高斯和非线性数据结构对样本中心计算的影响,增强了算法的鲁棒性,提高了识别的准确率。
本发明不仅适用于化工工业,在食品,制药等工业工程中也可使用。

Claims (7)

1.一种重构样本中心的化工过程故障分类方法,其特征在于,包括以下步骤:
步骤1、采集TEP工业过程历史信号,每个信号的数据包括:物料A流量、物料D流量、物料E流量、物料C流量、压缩机返回物料流量、反应器给料流量、反应器压力、反应器液位、反应器温度、排空物料流量、汽/液分类器温度、汽/液分类器液位、汽/液分类器压力、汽/液分类器出口流量、解析塔液位、解析塔压力、解析塔出口流量、解析塔温度、解析塔蒸汽流量、压缩机功率、反应器冷凝液出口温度、冷凝器冷凝液出口温度、反应器流量色谱对物料A的测量结果、反应器流量色谱对物料B的测量结果、反应器流量色谱对物料C的测量结果、反应器流量色谱对物料D的测量结果、反应器流量色谱对物料E的测量结果、放空气体色谱对物料A的测量结果、放空气体色谱对物料B的测量结果、放空气体色谱对物料C的测量结果、放空气体色谱对物料D的测量结果、放空气体色谱对物料E的测量结果、放空气体色谱对物料G的测量结果、放空气体色谱对物料H的测量结果、产品流量色谱对物料D的测量结果、产品流量色谱对物料E的测量结果、产品流量色谱对物料G的测量结果、产品流量色谱对物料H的测量结果、物料D进料量、物料E进料量、物料A进料量、物料A、C混合进料量、压缩机再循环阀开度、排放阀开度、分离器罐液流量、汽提器液体产品流量、汽提器水流阀开度、反应器冷却水流量、冷凝器冷却水流量和搅拌速度;从上述历史信号中选择出正常信号和故障信号,并确定每个故障信号所属故障类型;
步骤2、在历史信号中随机采集期望数量的各类信号;
步骤3、将采集获得的信号进行归一化处理;
步骤4、根据采集信号内数据值的大小,将一类信号在多维空间内进行分布,形成信号点,采用欧几里德距离计算上述信号点之间的距离,选出每一个信号点与其他信号点之间的距离最短的2~5个点,作为该点的最近邻同类信号点;
步骤5、根据该类信号个数和两个信号点之间距离情况,建立该类信号的邻接矩阵;
步骤6、建立能量密度矩阵,以该类信号个数作为该矩阵的行数,该矩阵的列数为1,矩阵中每行元素的取值为该类信号的邻接矩阵中对应行元素的总和,表示该类每个信号的能量密度值,若能量密度值小于设定的能量密度阈值,则删除对应信号;
步骤7、反复执行步骤4至步骤6,获得每种类型信号中剩余的信号点并储存;
步骤8、采用欧几里德距离获得剩余的所有类型信号点之间的距离,并根据剩余信号点之间的距离、剩余的所有类型信号点总数和每类信号点剩余个数,建立类内散度矩阵和类间散度矩阵,进而获得最优判别投影矩阵;
步骤8-1、采用欧几里德距离计算剩余的所有类型信号点之间的距离,选出每一个信号点与其他信号点之间的距离最短的2~5个点,并确定所选信号点所属类型,进一步选择出与该信号点同类型信号点和不同类型信号点;
步骤8-2、根据剩余的所有类型信号点总数、每类信号点剩余个数、剩余所有信号和所选同类型信号点,建立全局类内散度矩阵;
步骤8-3、根据剩余的所有类型信号点总数、剩余所有信号和所选同类型信号点,建立局部类内散度矩阵;
步骤8-4、根据建立的全局类内散度矩阵和局部类内散度矩阵获得类内散度矩阵;
步骤8-5、根据剩余的所有类型信号点总数、每类信号点剩余个数、剩余所有信号和所选不同类型信号点,建立全局类间散度矩阵;
步骤8-6、根据剩余的所有类型信号点总数、剩余所有信号和所选不同类型信号点,建立局部类间散度矩阵;
步骤8-7、根据建立的全局类间散度矩阵和局部类间散度矩阵获得类间散度矩阵;
步骤8-8、根据获得的类内散度矩阵和类间散度矩阵,获得使投影后的信号点类间散度最大而类内散度最小的最优判别投影矩阵;
步骤9、根据获得的最优判别投影矩阵,将剩余的所有信号投影至另一个子空间中,获得该子空间内每个信号的像,即获得样本的像,完成历史信号样本的提取;
步骤10、实时采集被测TEP工业过程信号,并对所采集的信号进行归一化处理;
步骤11、根据获得的最优判别投影矩阵将实时被测信号投影至子空间中,获得检测信号在子空间内的像,在子空间中寻找距离该被测信号像最近的样本的像,则该被测信号的类型则为该样本的类型;
步骤12、若判别出的被测TEP工业过程信号所属类型为故障类型,则计算机显示,并提示操作人员根据具体故障类型采取检修措施。
2.根据权利要求1所述的重构样本中心的化工过程故障分类方法,其特征在于,步骤1所述的物料A为氢气,物料B为氨气,物料C为一氧化碳,物料D为甲醇,物料E为乙醇,物料G为乙二醇,物料H为丙二醇。
3.根据权利要求1所述的重构样本中心的化工过程故障分类方法,其特征在于,步骤1所述的故障类型包括物料A/C进料比率产生阶跃变化并物料B成分不变、物料B成分产生阶跃变化并物料A/C进料比率不变、物料D的进料温度产生阶跃变化、反应器冷却水的入口温度产生阶跃变化、冷凝器冷却水的入口温度产生阶跃变化、物料A进料损失产生阶跃变化、物料C压力损失产生阶跃变化、物料A、B、C进料成分产生随机干扰、物料D的进料温度产生随机干扰、物料C的进料温度产生随机干扰、反应器冷却水的入口温度产生随机干扰、冷凝器冷却水的入口温度产生随机干扰、反应动态缓慢偏移、反应器冷却水阀门粘住、冷凝器冷却水阀门粘住和阀门固定在稳态位置不变化。
4.根据权利要求1所述的重构样本中心的化工过程故障分类方法,其特征在于,步骤4所述的多维相空间,该空间的维数等于采集的一个信号中数据的数目。
5.根据权利要求1所述的重构样本中心的化工过程故障分类方法,其特征在于,步骤5所述的建立该类信号的邻接矩阵,以该类信号个数作为邻接矩阵的行数和列数,矩阵中的每一个元素表示两个信号点之间距离情况,公式如下:
其中,wi,j表示邻接矩阵Wi,j中第i行第j列元素,即表示第i个信号点与第j个信号点之间的距离属性,若第i个信号点或第j个信号点为所选出的信号点,则wi,j取值为1,否则为0;表示第j个信号的最近邻同类信号点集合;表示第i个信号的最近邻同类信号点集合。
6.根据权利要求1所述的重构样本中心的化工过程故障分类方法,其特征在于:
(1)、步骤8-2所述的建立全局类内散度矩阵Sgw,公式如下:
S g w = 1 2 &Sigma; i , j = 1 p W g w , i j ( x i - x j ) ( x i - x j ) T - - - ( 2 )
其中,gw表示全局类内散度,T表示转置符号,p表示剩余的所有类型信号点总数,xi表示剩余的第i个信号点;xj表示剩余的第j个信号点;Mw(xj)表示剩余的第j个信号xj的最近邻同类信号点集合;li表示剩余的第i个信号xi的类型号;lj表示剩余的第j个信号xj的类型号;q表示信号的类型;pq表示第q类信号的剩余个数;
(2)、步骤8-3所述的建立局部类内散度矩阵Slw,公式如下:
S l w = 1 2 &Sigma; i , j = 1 p W l w , i j ( x i - x j ) ( x i - x j ) T - - - ( 3 )
其中,lw表示局部类内散度,Mw(xi)表示剩余的第i个信号xi的最近邻同类信号点集合;
(3)、步骤8-4所述的获得类内散度矩阵Sw,公式如下:
Sw=αSlw+(1-α)Sgw(4)
其中,α为平衡系数,取值为0~1;
(4)、步骤8-5所述的建立全局类间散度矩阵Sgb,公式如下:
S g b = 1 2 &Sigma; i , j = 1 p W g b , i j ( x i - x j ) ( x i - x j ) T - - - ( 5 )
其中,gb表示全局类间散度,Mb(xj)表示剩余的第j个信号xj的最近邻不同类信号点集合;
(5)、步骤8-6所述的建立局部类间散度矩阵Slb,公式如下:
S l b = 1 2 &Sigma; i , j = 1 p W l b , i j ( x i - x j ) ( x i - x j ) T - - - ( 6 )
其中,lb表示局部类间散度,Mb(xi)表示剩余的第i个信号xi的最近邻不同类信号点集合;
(6)、步骤8-7所述的类间散度矩阵Sb,公式如下:
Sb=Slb+(1-β)Sgb(7)
其中,β为平衡系数,取值为0~1;
(7)、步骤8-8所述的获得使投影后的信号点类间散度最大而类内散度最小的最优判别投影矩阵,目标函数J公式如下:
J = arg m a x V V T S b V V T S w V - - - ( 8 )
其中,V表示最优判别投影矩阵;
通过求解|Sb-λSw|=0的特征值λ和对应的特征向量v,通过比较选取特征值大的d个特征值λ1>λ2>...>λd及其对应的特征向量v1,v1,...,vd,进而获得最优判别投影V=[v1,v1,...,vd]。
7.根据权利要求1所述的重构样本中心的化工过程故障分类方法,其特征在于,步骤9所述的获得该子空间内每个信号的像,公式如下:
yi=VTxi(9)
其中,yi表示信号xi的子空间的像。
CN201310639613.5A 2013-11-29 2013-11-29 一种重构样本中心的化工过程故障分类方法 Expired - Fee Related CN103616889B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310639613.5A CN103616889B (zh) 2013-11-29 2013-11-29 一种重构样本中心的化工过程故障分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310639613.5A CN103616889B (zh) 2013-11-29 2013-11-29 一种重构样本中心的化工过程故障分类方法

Publications (2)

Publication Number Publication Date
CN103616889A CN103616889A (zh) 2014-03-05
CN103616889B true CN103616889B (zh) 2015-12-09

Family

ID=50167592

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310639613.5A Expired - Fee Related CN103616889B (zh) 2013-11-29 2013-11-29 一种重构样本中心的化工过程故障分类方法

Country Status (1)

Country Link
CN (1) CN103616889B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105162413A (zh) * 2015-09-08 2015-12-16 河海大学常州校区 一种基于工况辨识的光伏系统性能实时评估方法
CN105425777B (zh) * 2015-12-11 2017-12-15 渤海大学 一种基于主动学习的化工过程故障监控方法
CN110221590B (zh) * 2019-05-17 2021-06-11 华中科技大学 一种基于判别分析的工业过程多故障诊断方法
CN110427019B (zh) * 2019-08-31 2024-03-19 仲恺农业工程学院 一种基于多变量判别分析的工业过程故障分类方法及控制装置
CN115268417B (zh) * 2022-09-29 2022-12-16 南通艾美瑞智能制造有限公司 一种自适应ecu故障诊断控制方法
CN115979509A (zh) * 2022-12-13 2023-04-18 国家石油天然气管网集团有限公司 一种压力变送器故障检测方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477372A (zh) * 2009-01-07 2009-07-08 沈阳化工学院 化工生产非正常子域故障分离的技术方法
WO2010149935A1 (fr) * 2009-06-25 2010-12-29 Electricite De France Détection de défaut dans un dispositif électrochimique
CN102254253A (zh) * 2011-07-19 2011-11-23 北京化工大学 一种石油化工装置事故防范辅助决策方法及系统
CN102541050A (zh) * 2012-01-05 2012-07-04 浙江大学 一种基于改进支持向量机的化工过程故障诊断方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477372A (zh) * 2009-01-07 2009-07-08 沈阳化工学院 化工生产非正常子域故障分离的技术方法
WO2010149935A1 (fr) * 2009-06-25 2010-12-29 Electricite De France Détection de défaut dans un dispositif électrochimique
CN102254253A (zh) * 2011-07-19 2011-11-23 北京化工大学 一种石油化工装置事故防范辅助决策方法及系统
CN102541050A (zh) * 2012-01-05 2012-07-04 浙江大学 一种基于改进支持向量机的化工过程故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于流行学习的局部保持PCA算法在故障检测中的应用;王健,马健,韩志艳;《控制与决策》;20130531;第28卷(第5期);全文 *
鲁棒主元分析及在故障诊断中的应用;王健,韩志艳;《计算机技术与发展》;20130620;第23卷(第6期);全文 *

Also Published As

Publication number Publication date
CN103616889A (zh) 2014-03-05

Similar Documents

Publication Publication Date Title
CN103616889B (zh) 一种重构样本中心的化工过程故障分类方法
CN106371427B (zh) 基于层次分析法和模糊融合的工业过程故障分类方法
CN105955219A (zh) 基于互信息的分布式动态过程故障检测方法
CN107844799B (zh) 一种集成svm机制的冷水机组故障诊断方法
CN107153409B (zh) 一种基于缺失变量建模思路的非高斯过程监测方法
CN107505133A (zh) 基于自适应mrvm的滚动轴承故障概率性智能诊断方法
CN103488091A (zh) 一种数据驱动的基于动态成分分析的控制过程监控方法
CN104807589B (zh) 一种集输-立管系统内气液两相流流型的在线识别方法
CN101738998B (zh) 一种基于局部判别分析的工业过程监测系统及方法
CN103914064A (zh) 基于多分类器和d-s证据融合的工业过程故障诊断方法
CN108153267B (zh) 一种基于误差主元分析模型的工业过程监测方法
CN109144028B (zh) 一种精馏塔能效退化检测方法
CN104156568A (zh) 一种基于加权灰色关联和模糊聚类的变压器故障诊断方法
CN108345284A (zh) 一种基于两变量块的质量相关故障检测方法
CN103103570B (zh) 基于主元相似性测度的铝电解槽况诊断方法
CN105404280A (zh) 基于自回归动态隐变量模型的工业过程故障检测方法
CN105425777B (zh) 一种基于主动学习的化工过程故障监控方法
CN104536439B (zh) 一种基于嵌套迭代费舍尔判别分析的故障诊断方法
CN109669415A (zh) 一种基于结构化典型变量分析的动态过程监测方法
CN107657274A (zh) 一种基于k‑means的二叉SVM‑tree不平衡数据工业故障分类方法
CN105334823A (zh) 基于有监督的线性动态系统模型的工业过程故障检测方法
CN105868164A (zh) 一种基于有监督的线性动态系统模型的软测量建模方法
CN108764305A (zh) 一种改进的群智能机器学习故障诊断系统
CN108830006B (zh) 基于线性评价因子的线性-非线性工业过程故障检测方法
CN116992385B (zh) 一种物联网水表用量异常检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151209

Termination date: 20161129