CN110427019B - 一种基于多变量判别分析的工业过程故障分类方法及控制装置 - Google Patents

一种基于多变量判别分析的工业过程故障分类方法及控制装置 Download PDF

Info

Publication number
CN110427019B
CN110427019B CN201910819518.0A CN201910819518A CN110427019B CN 110427019 B CN110427019 B CN 110427019B CN 201910819518 A CN201910819518 A CN 201910819518A CN 110427019 B CN110427019 B CN 110427019B
Authority
CN
China
Prior art keywords
data
fault
new
classification
industrial process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910819518.0A
Other languages
English (en)
Other versions
CN110427019A (zh
Inventor
苗爱敏
程至尚
唐宇
候超钧
郭琪伟
庄家俊
孙胜
张恒涛
陈亚勇
刘泽锋
朱耀宗
高升杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongkai University of Agriculture and Engineering
Original Assignee
Zhongkai University of Agriculture and Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongkai University of Agriculture and Engineering filed Critical Zhongkai University of Agriculture and Engineering
Priority to CN201910819518.0A priority Critical patent/CN110427019B/zh
Publication of CN110427019A publication Critical patent/CN110427019A/zh
Application granted granted Critical
Publication of CN110427019B publication Critical patent/CN110427019B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24065Real time diagnostics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Complex Calculations (AREA)
  • General Factory Administration (AREA)

Abstract

一种基于多变量判别分析的工业过程故障分类方法及装置,首先基于邻域保持嵌入算法局部特征提取的策略,建立以训练数据集、降维维度、领近点、欧氏距离为输入量,以降维转换矩阵为输出量的最优分类函数,使得输入数据和输出数据在局部特征保留的同时同类内邻近点数据降维后更加邻近,而不同类数据比原来更加分散;再基于数据的低维潜隐变量获取构建数据回归的输入和输出特征,建立基于NPDA的故障分类模型;本发明解决了FDA降维后改变同类内样本相对距离和位置的问题,提高了FDA对训练数据分类的准确性和局部保留性。

Description

一种基于多变量判别分析的工业过程故障分类方法及控制 装置
技术领域
本发明属于化工工业生产过程的安全监测和质量控制领域,特别涉及一种基于多变量判别分析的工业过程故障分类方法。
背景技术
现代流程工业向大型化,智能化和复杂化飞速发展,大规模系统生产单元的高关联性,运用先进的过程监控技术实时对过程中的异常状况进行识别定位的关键技术和有效手段。Fisher判别分析(Fisher discriminant analysis,FDA)是一种被广泛应用的故障分类方法,该方法通过寻找数据的全局判别信息方法,在数据降维的同时获取类间最大化散射和类内最小化散射。但是,该方法主要关注数据的全局信息,而忽略了过程数据中重要的局部特征,而该局部特征信息反映了数据间重要的细节区分信息,进而影响到整个故障分类的性能。因此,在传统的基于FDA的故障分类的基础上,融合数据的局部关系特征,建立一个融合数据局部全局信息的分类模型,提高故障分类精度。
发明内容
本专利发明针对FDA分类器的不足,基于邻域保护嵌入算法(neighborhoodPreserving embedding,NPE)局部结构特征提取方法的思想,提出一种局部全局特征的数据分类器:邻域保持嵌入判别分析(neighborhood preserving based discriminantanalysis,NPDA)并用于工业过程故障分类。在NPDA中,对同类数据和不同类数据分别进行不同处理,在最大限度地保障不同类样本数据分散性的同时,保留同类数据的局部关系特征。
一种基于多变量判别分析的工业过程故障分类方法,其特征在于,该方法基于NPDA邻域保持嵌入判别分析算法的特征提取和数据分类方法,建立以工业过程在线采集的实时数据为输入量,以故障类别为输出量的分类方法,其具体步骤如下:
(1)利用集散控制系统,采集工业生产过程中的各种不同类别样本故障数据,组成建模用训练样本集R1:X∈R1 Dxn 。其中,n为训练数据集的个数,D为样本数据集的变量个数;
(2)去除数据野值点和误差较大的点,并将训练样本数据集归一化为均值为0,方差为1;针对相同类别数据,基于NPE(邻域保持嵌入)分析模型,构建数据降维目标;
(3)针对不同类别的数据,采用FDA算法构建数据类间信息模型,并融合步骤(2)NPE算法的降维目标,建立双目标函数得到NPDA分类模型,以实现数据降维过程中分类特征信息提取;通过特征值分解求解NPDA模型参数,得到投影矩阵A以及降维后的得分向量Y,完成工业过程故障的整体建模和分类;
(4)采集工业过程产生的新故障数据,并对其进行预处理和归一化;
(5)将预处理后的故障数据输入到步骤(3)的NPDA分类模型,基于数据投影矩阵A得到新故障数据得分向量Znew,即新采集故障数据的降维特征信息;
(6)利用欧氏距离的距离度量方法,计算新采集数据的得分向量Znew与训练样本中各个故障样本得分向量均值的距离信息,并根据最近距离的样本所对应的类别信息,判定为新样本数据的故障类型。
所述步骤(2)、(3)具体为:针对训练样本集,首先对其进行归一化处理,即去掉每个数据变量的均值和方差,建立NPE算法的同类数据特征提取模型,通过对协方差矩阵进行特征值分解,提取样本数据的主要数据信息方向,得到数据投影矩阵A和得分向量矩阵Y。
步骤(4)和(5)具体为:基于建模过程中样本故障数据的均值和方差,对新故障数据进行归一化处理,并利用建模过程中获取的投影矩阵A,得到新故障数据的得分向量矩阵Znew
步骤(6)具体为:针对未鉴定类别的新故障数据,计算各个故障类别数据的得分向量Y的均值Y1,Y2,…,Yc,以及新故障数据样本的低维得分向量Znew与各个均值的欧氏距离,即分别计算Znew与Y1,Y2,…,Yc的距离:并按照距离大小进行排序,找出与新故障数据欧氏距离最近的Yi,Yi对应的故障类别被判定为新故障数据的故障类型。
一种基于多变量判别分析的工业过程故障分类的控制装置,其采用上述工业过程故障分类方法,该控制装置利用集散控制系统采集生产过程中故障数据,并对故障数据的类型进行判断,基于判断结果进一步实现工业控制。
本发明采用的分类方法的主要步骤如下:
第一步:采集工业过程中多类故障样本并组成数据矩阵X∈RD×n ,其中D为数据的维度,n为故障数据的样本总数,ni 为第i类故障的样本数量(i=1,2,…,c),将故障数据及其对应的类别标签,作为分类模型的输入样本集,存入历史数据库;
第二步:对历史数据库中的数据进行去噪和归一化处理,得到新的数据矩阵x(x1,x2,…,xn);
第三步:针对同类故障样本,使用K-近邻法(K-nearest neighbors,K-NN)为第i个样本点xi选取欧氏距离最近的k个同类样本点作为其近邻点,定义为
基于NPE算法,通过最小化邻近数据点之间的重构误差获取同类数据的局部结构关系,构建目标函数如下:
为了求解公式(1)中最优化权重矩阵W∈Rn×n,需要建立如下协方差矩阵如下所示:
其中,xij (j=1,2,…,k)为xi的k个近邻点,Wij 为xi和xij之间的权重值,且满足
第四步:保留公式(3)中的权重系数,建立如下目标函数:
通过最小化目标函数J(a)lw,实现在数据维度约简的同时确保在降维时保持数据局部关系,使同类故障数据集不会被扭曲。
第五步:对于不同类别的故障数据,基于FDA算法的分类思想,构造类间数据分散最大化的目标函数J(a)db
mi表示第i类数据样本且m1+m2+…+mc=n。 J(a)db 描述了不同故障类的辨别信息。
第六步,结合公式(4)和(5),定义如下NPDA的目标函数:
其中,a为算法的投影向量。求解下式(7)的广义特征值:
Da=λBa (7)
最小的d个特征值λ1≤λ2 ,…,≤λd所对应的特征向量即组成目标函数(6)投影矩阵A=[a,a2,…,ad]和低维映射y=ATX,存入历史数据库。
第七步:对于在线新采集的测试数据xnew,首先对其进行归一化处理,然后通过投影矩阵A,获得xnew的低维投影为:
znew=ATxi (8);
第八步:计算这c类故障的低维投影向量yi的均值集计算znew 到每个故障类均值投影向量的欧氏距离:
与znew最小欧氏距离的所对应的故障类别即判定为新数据的故障类别。定义分类率:
其中Nc(x)为本算法分类出新故障的样本数,N为对应故障数据总数。
本发明的有益效果是:本发明提出的基于邻域保持嵌入算法,利用数据的局部特征,与传统的Fisher判别分析算法进行结合,构建一个基于数据局部关系的数据分类模型,使到降维后同类故障数据能够保持相关关系而不同类数据更加分散。本发明解决了FDA算法在分类时同类样本数据结构遭到破坏的问题,提高了FDA对训练数据分类的准确性。
附图说明
图1为连续搅拌槽加热器(CSTH)流程图。
图2为故障数据的三维空间分布以及NPDA、LFDA和FDA三种模型分类效果。
图3为基于NPDA、LFDA和FDA三种算法的分类模型测试效果。
图4为FDA、LFDA和NPDA三种分类模型的分类率比较。
具体实施方式
下面结合一个连续搅拌槽加热器(CSTH)作为具体的工业实例来说明本发明的有效性。该过程的流程图如图1所示,其中1为热水接口,2为冷水接口。过程的监测变量如下表所示:
该过程的建模数据一共来自6个受控变量,选择了水平、温度、冷水流和相应的比例积分导数值,不同故障数据集是分别在不同水平、温度和热水阀三个操作条件下采集得到。每种模式生成两类故障数据用于分类建模和在线测试。针对每个故障类型采集300个观测值构造分类模型。下面结合该具体过程对本发明的实施步骤进行阐述:
1.针对连续搅拌槽加热器(CSTH)过程,采集三种模态下的6类故障,共计1800个过程数据样本。对数据样本进行预处理,滤除数据噪声。对每个模态下的故障数据分别进行归一化处理,得到新的数据矩阵。
2.针对训练数据中每种操作工况数据,分别建立NPDA、FDA和LFDA三种分类模型,设置各个模型的优化参数,并将所有模型和参数存入数据库中备用。
3.图2给出了六类故障数据的三维分布以及利用NPDA,FDA和LFDA三种算法降维后数据的三维分布效果;图2a为故障数据三维分布;由三种算法的低维分布效果可以看出,NPDA算法针对原始数据表现出了良好的分类性能,故障能够较好地分开,同时保持了同类数据的局部结构关系;对于FDA和LFDA,不同模式下的故障数据被很好地分开,但是同类数据结构在降维后发生了改变。
4.采集各个故障类的在线样本数据,并利用训练过程中得到的归一化参数对测试数据进行归一化处理。
5.针对测试数据,图3比较了三种方法的分类结果,其中图3a为NPDA的结果;图3b为LFDA的结果;图3c为FDA的结果;并在图4中总结了每类的分类率。由图4看出,本发明所提出的NPDA算法针对六种类型的故障样本,均能给出较高的分类结果,分类误差较小,分类准确度远高于FDA和LFDA模型。

Claims (5)

1.一种基于多变量判别分析的工业过程故障分类方法,其特征在于,该方法基于NPDA邻域保持嵌入判别分析算法的特征提取和数据分类方法,建立以工业过程在线采集的实时数据为输入量,以故障类别为输出量的分类方法,其具体步骤如下:
(1)利用集散控制系统,采集工业生产过程中的各种不同类别样本故障数据,组成建模用训练样本集R1:X∈R1Dxn;其中,n为训练样本集的个数,D为训练样本集的变量个数;
(2)去除数据野值点和误差较大的点,并将训练样本集归一化为均值为0,方差为1;针对相同类别数据,基于NPE邻域保持嵌入分析模型,构建数据降维目标;
(3)针对不同类别的数据,采用FDA算法构建数据类间信息模型,并融合步骤(2)NPE算法的降维目标,建立双目标函数得到NPDA分类模型,以实现数据降维过程中分类特征信息提取;通过特征值分解求解NPDA模型参数,得到投影矩阵A以及降维后的得分向量Y,完成工业过程故障的整体建模和分类;
(4)采集工业过程产生的新故障数据,并对其进行预处理和归一化;
(5)将预处理后的故障数据输入到步骤(3)的NPDA分类模型,基于投影矩阵A得到新故障数据得分向量Znew,即新故障数据的降维特征信息;
(6)利用欧氏距离的距离度量方法,计算新故障数据的得分向量Znew与训练样本中各个
故障样本得分向量均值的距离信息,并根据最近距离的样本所对应的类别信息,判定为新故障数据的故障类型。
2.根据权利要求1所述的基于多变量判别分析的工业过程故障分类方法,其特征在于,所述步骤(2)、(3)具体为:针对训练样本集,首先对其进行归一化处理,建立NPE算法的同类数据特征提取模型,通过对协方差矩阵进行特征值分解,提取样本数据的主要数据信息方向,得到投影矩阵A和得分向量Y。
3.根据权利要求1所述的基于多变量判别分析的工业过程故障分类方法,其特征在于,
步骤(4)和(5)具体为:基于建模过程中样本故障数据的均值和方差,对新故障数据进行归
一化处理,并利用建模过程中获取的投影矩阵A,得到新故障数据的得分向量Znew。
4.根据权利要求1所述的基于多变量判别分析的工业过程故障分类方法,其特征在于,所述步骤(6)具体为:针对未鉴定类别的新故障数据,计算各个故障类别数据的得分向量Y的均值Y1 ,Y2,… ,Yc,以及新故障数据样本的低维得分向量Znew与各个均值的欧氏距离,即分别计算Znew与Y1 ,Y2,… ,Yc的距离,并按照距离大小进行排序,找出与新故障数据欧氏距离最近的Yi,Yi对应的故障类别被判定为新故障数据的故障类型。
5.一种基于多变量判别分析的工业过程故障分类的控制装置,其采用如权利要求1-4
任一权利要求请求保护的工业过程故障分类方法,该控制装置利用集散控制系统采集生产过程中故障数据,并对故障数据的类型进行判断,基于判断结果进一步实现工业控制。
CN201910819518.0A 2019-08-31 2019-08-31 一种基于多变量判别分析的工业过程故障分类方法及控制装置 Active CN110427019B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910819518.0A CN110427019B (zh) 2019-08-31 2019-08-31 一种基于多变量判别分析的工业过程故障分类方法及控制装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910819518.0A CN110427019B (zh) 2019-08-31 2019-08-31 一种基于多变量判别分析的工业过程故障分类方法及控制装置

Publications (2)

Publication Number Publication Date
CN110427019A CN110427019A (zh) 2019-11-08
CN110427019B true CN110427019B (zh) 2024-03-19

Family

ID=68418374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910819518.0A Active CN110427019B (zh) 2019-08-31 2019-08-31 一种基于多变量判别分析的工业过程故障分类方法及控制装置

Country Status (1)

Country Link
CN (1) CN110427019B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112270363A (zh) * 2020-11-02 2021-01-26 杭州电子科技大学 一种局部近邻在线自适应建模的性能绩效指标确定方法
CN114118292B (zh) * 2021-12-06 2024-04-16 东北大学 一种基于线性判别邻域保持嵌入的故障分类方法
CN114139639B (zh) * 2021-12-06 2024-05-14 东北大学 一种基于自步邻域保持嵌入的故障分类方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577839A (zh) * 2013-11-28 2014-02-12 苏州大学 一种邻域保持判别嵌入人脸识别方法及系统
CN103616889A (zh) * 2013-11-29 2014-03-05 渤海大学 一种重构样本中心的化工过程故障分类方法
CN103793704A (zh) * 2014-03-11 2014-05-14 苏州大学 一种监督邻域保持嵌入人脸识别方法和系统及人脸识别器
CN103926919A (zh) * 2014-04-29 2014-07-16 华东理工大学 基于小波变换和Lasso函数的工业过程故障检测方法
CN106644162A (zh) * 2016-10-12 2017-05-10 云南大学 基于邻域保持嵌入回归算法的环网柜线芯温度软测量方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720291B2 (en) * 2004-02-17 2010-05-18 Corel Corporation Iterative fisher linear discriminant analysis
US8572006B2 (en) * 2010-01-25 2013-10-29 Amcad Biomed Corporation Method for multi-layer classifier

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577839A (zh) * 2013-11-28 2014-02-12 苏州大学 一种邻域保持判别嵌入人脸识别方法及系统
CN103616889A (zh) * 2013-11-29 2014-03-05 渤海大学 一种重构样本中心的化工过程故障分类方法
CN103793704A (zh) * 2014-03-11 2014-05-14 苏州大学 一种监督邻域保持嵌入人脸识别方法和系统及人脸识别器
CN103926919A (zh) * 2014-04-29 2014-07-16 华东理工大学 基于小波变换和Lasso函数的工业过程故障检测方法
CN106644162A (zh) * 2016-10-12 2017-05-10 云南大学 基于邻域保持嵌入回归算法的环网柜线芯温度软测量方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Neighborhood preserving regression embedding based data regression and its applications on soft sensor modeling;Miao Aimin等;Elsevier Science;第86-94页 *
基于时序扩展的邻域保持嵌入算法及其在故障检测中的应用;苗爱敏等;华东理工大学学报(自然科学版);第40卷(第2期);第218-224页 *

Also Published As

Publication number Publication date
CN110427019A (zh) 2019-11-08

Similar Documents

Publication Publication Date Title
CN112070109B (zh) 一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法
CN110427019B (zh) 一种基于多变量判别分析的工业过程故障分类方法及控制装置
CN112699913A (zh) 一种台区户变关系异常诊断方法及装置
CN106649789B (zh) 一种基于集成半监督费舍尔判别的工业过程故障分类方法
CN106843195B (zh) 基于自适应集成半监督费舍尔判别的故障分类方法
CN109086793A (zh) 一种风力发电机的异常识别方法
CN109085805B (zh) 一种基于多采样率因子分析模型的工业过程故障检测方法
CN110033141B (zh) 一种脱硫系统运行工况数据库的建立方法
CN110795690A (zh) 风电场运行异常数据检测方法
CN110674120A (zh) 一种风电场数据清洗方法及装置
CN111783845A (zh) 一种基于局部线性嵌入和极限学习机的隐匿虚假数据注入攻击检测方法
CN114757269A (zh) 一种基于局部子空间-邻域保持嵌入的复杂过程精细化故障检测方法
CN110687895A (zh) 一种基于自适应核主成分分析的化工过程故障检测方法
CN110175682A (zh) 一种基于混沌粒子群的优化核主元分析故障监测方法
CN111582406A (zh) 一种电力设备状态监测数据聚类方法和系统
CN110084301B (zh) 一种基于隐马尔可夫模型的多工况过程工况辨识方法
Dong et al. Quality monitoring and root cause diagnosis for industrial processes based on Lasso-SAE-CCA
CN114077876A (zh) 一种带钢热连轧多模态过程监测方法及装置
CN115189942A (zh) 一种伪标签引导下的多视角共识图半监督网络入侵检测系统
CN111242204A (zh) 一种运维管控平台故障特征提取方法
CN108537249B (zh) 一种密度峰值聚类的工业过程数据聚类方法
CN112434728A (zh) 基于局部均值距离约束表示的数据分类方法
CN110673577B (zh) 一种复杂化工生产过程的分布式监控与故障诊断方法
CN113156908B (zh) 一种机理与数据联融合的多工况工业过程监测方法和系统
CN116862284A (zh) 基于som网络与规则融合的船用柴油机健康状态评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant