CN112947649B - 一种基于互信息矩阵投影的多变量过程监控方法 - Google Patents
一种基于互信息矩阵投影的多变量过程监控方法 Download PDFInfo
- Publication number
- CN112947649B CN112947649B CN202110297592.8A CN202110297592A CN112947649B CN 112947649 B CN112947649 B CN 112947649B CN 202110297592 A CN202110297592 A CN 202110297592A CN 112947649 B CN112947649 B CN 112947649B
- Authority
- CN
- China
- Prior art keywords
- matrix
- mutual information
- monitoring
- information matrix
- projection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 157
- 238000000034 method Methods 0.000 title claims abstract description 92
- 238000012544 monitoring process Methods 0.000 title claims abstract description 57
- 230000008569 process Effects 0.000 title claims abstract description 56
- 238000004519 manufacturing process Methods 0.000 claims abstract description 30
- 238000001228 spectrum Methods 0.000 claims abstract description 15
- 238000001514 detection method Methods 0.000 claims description 37
- 238000012549 training Methods 0.000 claims description 27
- 238000012360 testing method Methods 0.000 claims description 22
- 239000013598 vector Substances 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 6
- 230000007704 transition Effects 0.000 claims description 3
- 230000007257 malfunction Effects 0.000 claims description 2
- 238000009423 ventilation Methods 0.000 claims description 2
- 102000002274 Matrix Metalloproteinases Human genes 0.000 claims 2
- 108010000684 Matrix Metalloproteinases Proteins 0.000 claims 2
- 238000005516 engineering process Methods 0.000 abstract description 15
- 230000007547 defect Effects 0.000 abstract description 4
- 238000003745 diagnosis Methods 0.000 abstract description 3
- 238000007619 statistical method Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 23
- 230000008859 change Effects 0.000 description 7
- 238000009826 distribution Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000001311 chemical methods and process Methods 0.000 description 2
- 238000010924 continuous production Methods 0.000 description 2
- 230000003121 nonmonotonic effect Effects 0.000 description 2
- 238000004886 process control Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010978 in-process monitoring Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D27/00—Simultaneous control of variables covered by two or more of main groups G05D1/00 - G05D25/00
- G05D27/02—Simultaneous control of variables covered by two or more of main groups G05D1/00 - G05D25/00 characterised by the use of electric means
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明提供了一种基于互信息矩阵投影的多变量过程监控方法,属于工业过程监控领域。本发明所提出的技术利用基于矩阵Rényi的α‑熵函数估计变量之间的互信息值,这一互信息算子是在(正则化的)对称正定矩阵的特征谱上进行估计,弥补了流程工业中难以实时计算概率密度函数的不足;其次基于互信息矩阵的投影进行统计分析,不仅可以刻画过程数据中隐含的非线性特征,而且能够解析故障发生的诱因变量。此外,基于信息论的故障诊断技术不受工业过程中样本标签不足、数据不均衡等因素的影响。因此,本发明对于解决实际工业过程监控问题具有重要的现实意义。
Description
技术领域
本发明属于工业过程控制领域,利用基于矩阵Rényi的α-熵函数估计传感器采集变量之间的互信息值,弥补了流程工业中难以实时计算概率密度函数的不足。基于互信息矩阵投影的多变量过程监控方法不仅可以刻画过程数据中隐含的非线性特征,而且能够解析故障发生的根变量,同时不受工业过程中样本标签不足、数据不均衡等因素的影响,对于解决实际工业过程监控问题具有重要的现实意义。
背景技术
数据驱动技术是计量学中用于识别异常过程的有效工具,多变量统计过程监控是过程控制领域过去几十年研究中最活跃的领域之一,并在化工过程、微电子制造和制药工艺等工业领域中取得了巨大成功。
考虑到工业过程的动态特性,在线监测数据不仅包含了生产运行过程的累积关联性,而且更能反映系统当前状态的最新变化,基于滑动窗的方法通过添加时滞变量构建时间拓扑矩阵,捕获连续过程的(局部)相关性特征。为了进一步提高基于滑动窗方法的性能,如何利用过程变量的高阶统计量变得至关重要。基于主元分析的故障检测方法均采用协方差矩阵的转换元提取量测(检测)数据中的线性相关性,如何利用工业过程数据中隐含的非线性特性成为故障检测中的关键问题。
近年来,信息论由于其数理统计方面的优势,已成功应用于各种机器学习,计算机视觉和信号处理任务中,在过程监控的应用中也引发了新的研究兴趣。尽管已有一些研究将信息论应用于故障检测,但多数是利用互信息计算选取变量之间的主要驱动量,基于变量选择进行监测数据降维。关于如何将信息论技术应用于流程工业过程控制,仍然是一个有待解决的技术问题。特别地,连续过程的实时概率密度估计是数据驱动领域一个难点,对于可能同时包含离散变量和连续变量的复杂流程工业,有待进一步研究基于信息论的故障检测的技术,以提高诊断系统的实时性和精确性。本发明正是针对上述问题提出的更适用于流程工业过程的过程监控技术。
发明内容
本发明的目的在于克服现有流程工业中基于信息论的故障诊断技术的不足,提出了一种基于互信息矩阵投影的多变量过程监控技术:构造互信息矩阵并对其投影进行统计分析以监控工业过程的动态和非平稳性(可能是非线性的);基于矩阵Rényi的α-熵函数的互信息估计在(正则化的)对称正定矩阵的特征谱上计算,弥补了流程工业中难以实时计算概率密度函数的不足。
为了达到上述目的,本发明的技术方案为:
一种基于互信息矩阵投影的多变量过程监控方法,包括离线建模环节和在线监控环节,
所述的离线建模环节包括:
其中,w为时间窗口的长度;xj(1≤j≤m)表示在一个时间窗口内由w个流程样本数据所构建的拓扑矩阵Xtrain的第j列变量;
1.4)根据检测指标的均值Θμ和标准差Θσ计算样本的相似性指标Di;
1.5)基于工业过程中的置信度η对相似性指标Di进行统计,计算监控阈值Dcl;
所述在线监控环节包括:
进一步的,所述的步骤1.2)具体为:
其中,I(xi;xj)为变量xi和xj之间的互信息,H(xi)为变量xi的熵,且I(xi;xj)=H(xi)+H(xj)-H(xi;xj),而H(xi;xj)为变量xi和xj之间的联合熵;
转换元矩阵Ti的各阶统计量μi,νi,ζi,γi的计算如下:
其中,ti-k(k={0,1,…,w-1})表示转换元矩阵Ti的第w-k行的行向量,μi表示Ti的一阶统计量,νi表示Ti的二阶统计量,ζi表示Ti的三阶统计量,γi表示Ti的四阶统计量。
其中,||·||p表示p-范数,可选L1范数||·||1、L2范数||·||2和∞范数||·||∞。
进一步的,所述的步骤2.2)中,
进一步的,所述的步骤2.3)为,
附图说明
图1为本发明基于滑动窗所构建的时间拓扑结构;
图2为互信息与相关性的对比;
图3为正常及故障状态下Gram矩阵及其特征谱的表示;
图4为正常及故障状态下的互信息矩阵对比;
图5TE过程中及故障状态下的互信息矩阵可视化;
图6TE过程中不同故障状态下互信息矩阵的均值变化;
图7TE过程中不同窗口长度下故障5及19的检测性能变化。
具体实施方式
本发明所提出的方法适用于复杂的流程工业过程,解决的问题主要是流程工业多变量过程中变量相关性的实时概率估计及故障检测的准确性与可解释性。
为了达到上述目的,本发明的技术方案为:
其中xl(1≤l≤m)表示在一个时间窗口内由w个流程样本构建的拓扑矩阵Xk的第l列变量,见图1所示。则第k时刻的互信息矩阵M由下式给出:
其中,I(xi;xj)为传感器变量xi和xj之间的互信息,H(xi)为变量xi的熵,且I(xi;xj)=H(xi)+H(xj)-H(xi;xj),而H(xi;xj)为变量xi和xj之间的联合熵,特别地,I(xi;xi)=H(xi)。互信息矩阵M为非负对称矩阵,从信息论的角度,需要根据概率密度函数计算互信息,但是实时的概率密度估计在目前仍是一个技术难题,而且工业过程中的监测量可能同时包含离散变量和连续变量。本技术采用基于矩阵Rényi的α-熵函数进行概率密度的近似计算。
根据定义的核函数κ可求出任意两个随机变量的Gram矩阵K=κ(xi,xj),则基于矩阵Rényi的α-熵函数为:
其中,A是Gram矩阵K的归一化正定矩阵,即A=K/tr(K),而λi(A)表示A的第i个特征值。
其中,Aij=κ1(xi,xj),Bij=κ2(yi,yj),表示矩阵A和B之间的Hadamard乘积。则基于矩阵Rényi的α-熵函数的互信息为Iα(A;B)=Hα(A)+Hα(B)-Hα(A,B)。
现有过程监控技术表明,可以从样本协方差矩阵的特征向量所形成的正交空间中提取统计特征,从而构成对原始数据空间特性的理解。类比协方差矩阵,互信息矩阵M同样是变量之间相关性的度量。在过程监控中,互信息矩阵M包含了k时刻的时间拓扑矩阵中任意两个变量之间的非线性相关性,在正常状态下,互信息矩阵M的统计量应当保持不变或稳定。但是某一传感器发生故障,至少会影响互信息矩阵中一个或多个互信息值,从而造成所提取的各阶统计量的改变。因此,可对互信息矩阵进行特征谱分解M=PΛP-1,P为特征向量矩阵,对角矩阵Λ=diag(λ1,λ2,…,λm)是特征值矩阵。对检测样本在由特征向量矩阵P的列向量所构建的正交空间投影,得到转换元矩阵T:
由于投影空间统计特征向量彼此正交,则消除了变量间的关联性,简化了原始过程特性分析的复杂程度。为了刻画工业过程原始数据空间的特性,从多变量分析角度提取转换元矩阵的统计特征一阶统计量μk,二阶统计量νk,三阶统计量ζk和四阶统计量γk:
不同于协方差矩阵仅能够捕获任意两个变量之间的线性相关性,互信息矩阵M同时包含了任意两个变量之间的非线性相关性,而变量之间的非线性和非单调性关系在多变量工业过程中是普遍存在的。此外,互信息I根据实值概率密度函数进行估计,对数据特征(如连续,离散或混合)没有要求,同时,互信息矩阵M的计算对变量的联合分布或变量之间的关系不作任何先验假设,这使该技术在工业过程控制应用中具有很大潜力。
本发明所提出的技术包含离线建模和在线监控两部分,其流程图如图2所示。其中方法的离线部分步骤为:
步骤一:数据预处理
步骤二:互信息矩阵投影
步骤三:计算转换元矩阵的各阶统计量μi,νi,ζi,γi:
方法的在线部分是指对测试样本是否为故障样本的检测与辨识,步骤为:
步骤一:数据预处理
步骤二:互信息矩阵投影
步骤三:计算测试集转换元矩阵的各阶统计量μk,νk,ζk,γk:
实验验证与分析:
1.互信息与相关性的比较
不同于协方差矩阵仅能够捕获任意两个变量之间的线性相关性,互信息矩阵M同时包含了任意两个变量之间的非线性相关性,而传感器变量之间的非线性和非单调性关系在多变量工业过程中是普遍存在的。
不同数据分布下,两个变量的相关性值(棕色数值)与互信息值(红色数值)的对比如图2所示,由图可见,上面一行两变量之间呈线性关系,相关性与互信息均不为0;下面一行两变量之间呈非线性关系,对于相关性为0的数据分布,其互信息值不为0,且大于相关性的值。这正是工业过程中非线性特性所期望的。
2.基于互信息矩阵投影的故障检测可行性验证
考虑一个由下式生成的多变量非线性过程:
其中υ表示三个均值为[0.3,2.0,3.1]T、标准差为[1.0,2.0,0.8]T的独立高斯分布数据源,权重矩阵e表示标准差为[0.061,0.063,0.198,0.176,0.170]T的高斯白噪声。
对于传感器故障x*=x+f,当f发生在变量x1上时,正常过程和故障过程计算的Gram矩阵及其特征谱如图3所示,可见故障的发生会导致Gram矩阵及特征谱的变化,进而影响变量的熵函数计算。进一步,互信息矩阵如图4所示,互信息矩阵中第一行和第一列的互信息值发生变化,说明故障的诱因是变量1,也说明对互信息矩阵进行投影对故障检测是具有可行性的。
3.性能验证—TE过程实验验证
本发明所提出的方法在化工过程的基准测试集TE(Tennessee Eastman)过程数据上进行了验证。实验数据参见网站:http://web.mit.edu/braatzgroup/links.html。
首先,正常状态,故障1(阶跃故障)和故障14(粘滞故障)的互信息矩阵如图5所示,右侧为对角线上向量的箱线图。显然,正常状态下不同时刻的互信息矩阵几乎不变;但是故障的发生将导致在互信息矩阵出现不同的联合或边缘分布。通过比较正常状态、故障状态的对角线上的箱线图,即熵的变化,可以发现不同类型的故障产生的变化不同,故障14比故障1的箱线图中有更多的离群值(“+”符号绘制)。
其次,监测变量和其余变量之间的互信息平均值见图6,如图6(a)所示,箱线图的晶体变宽,75分位数变大,这表明故障1可能是一个阶跃变化。实际上,故障1确实引起了流4的阶跃变化,反应物A,B和C的进料变化对过程监控造成了总体影响。相比之下,故障14是由反应堆冷却阀的粘滞变化引起,相关变量为变量9、21和32。根据图6(b),确实存在三个离群值(“+”符号绘制)分别对应于第9、21和32维变量。换句话说,变量9、21和32的变化恰好是导致互信息矩阵发生变化的驱动力。从这个意义上讲,本技术对故障诱因的辨识有一定的指导意义,是可解释的。
在不失一般性的前提下,选择滑动窗长度100,不同方法的平均故障检测率和故障误警率见表1和表2。从表1可以看出,本技术(简记PMIM)的故障检测率整体较为满意,可以检测大多数故障,并且在不同类型的故障中保持稳定。此外,由于互信息矩阵包含了时间拓扑矩阵中任意两个变量之间的非线性相关性,这是优于协方差矩阵的,从检测率上看,本技术的性能也在多数情况下优于基于协方差矩阵的转换元方法(RTCSA,RDTCSA)。尽管本技术的检测率在阶跃故障5和未知故障19上相对较低,但随着滑动窗尺寸的增大,这两种故障中的检测性能会得到显着提高,如图7所示。从表2可以看出,本技术及参考方法的故障误警率均接近于显著性水平,甚至相对于基于协方差矩阵的转换元方法(RTCSA,RDTCSA),本技术的误警率更低,证明互信息在捕获变量相关性方面的优越性。
表1 TE过程中不同方法的故障检测率汇总
表2 TE过程中不同方法的故障误检率汇总
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种基于互信息矩阵投影的多变量过程监控方法,包括离线建模环节和在线监控环节,其特征在于,
所述的离线建模环节包括:
1.5)基于工业过程中的置信度η对相似性指标Di进行统计,计算监控阈值Dcl;
所述在线监控环节包括:
3.如权利要求2所述的基于互信息矩阵投影的多变量过程监控方法,其特征在于所述的步骤1.2)具体为:
其中,I(xi;xj)为变量xi和xj之间的互信息,H(xi)为变量xi的熵,且I(xi;xj)=H(xi)+H(xj)-H(xi;xj),而H(xi;xj)为变量xi和xj之间的联合熵;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110297592.8A CN112947649B (zh) | 2021-03-19 | 2021-03-19 | 一种基于互信息矩阵投影的多变量过程监控方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110297592.8A CN112947649B (zh) | 2021-03-19 | 2021-03-19 | 一种基于互信息矩阵投影的多变量过程监控方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112947649A CN112947649A (zh) | 2021-06-11 |
CN112947649B true CN112947649B (zh) | 2021-11-23 |
Family
ID=76227189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110297592.8A Active CN112947649B (zh) | 2021-03-19 | 2021-03-19 | 一种基于互信息矩阵投影的多变量过程监控方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112947649B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114999581B (zh) * | 2022-06-13 | 2023-11-10 | 华东交通大学 | 一种稀土萃取分离过程的时滞辨识方法和系统 |
CN115758284B (zh) * | 2022-11-14 | 2023-05-16 | 南京工业大学 | 基于融合核熵与信息增益的光伏热斑故障检测方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002196783A (ja) * | 2000-12-27 | 2002-07-12 | Sumitomo Metal Ind Ltd | 時系列信号の識別方法及び装置 |
EP2208981B1 (en) * | 2009-01-14 | 2016-03-23 | Alcatel Lucent | Monitoring of rotating machines |
CN105955219B (zh) * | 2016-05-30 | 2018-08-17 | 宁波大学 | 基于互信息的分布式动态过程故障检测方法 |
CN108537288A (zh) * | 2018-04-19 | 2018-09-14 | 辽宁大学 | 一种基于互信息的实时特征提取方法 |
CN109240274B (zh) * | 2018-11-05 | 2020-04-17 | 浙江大学 | 一种基于高阶相关性的工业过程故障诊断方法 |
CN109407652B (zh) * | 2018-12-10 | 2020-03-06 | 中国石油大学(华东) | 基于主辅pca模型的多变量工业过程故障检测方法 |
CN110794797A (zh) * | 2019-11-27 | 2020-02-14 | 江南大学 | 一种基于互信息和多块信息提取的pca故障监测方法 |
-
2021
- 2021-03-19 CN CN202110297592.8A patent/CN112947649B/zh active Active
Non-Patent Citations (1)
Title |
---|
A MIIPCR Fault Detection Strategy for TEP;CHENGCONG LV etal;《SPECIAL SECTION ON ADVANCED CONTROL AND HEALTH MANAGEMENT FOR AIRCRAFT AND ITS PROPULSION SYSTEM》;20190220;第18749-18754页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112947649A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108062565B (zh) | 基于化工te过程的双主元-动态核主元分析故障诊断方法 | |
Chiang et al. | Fault detection and diagnosis in industrial systems | |
CN100489870C (zh) | 用于过程统计控制的方法和多维系统 | |
CN109146246B (zh) | 一种基于自动编码器和贝叶斯网络的故障检测方法 | |
US7539597B2 (en) | Diagnostic systems and methods for predictive condition monitoring | |
Zhang et al. | Fault detection and diagnosis of chemical process using enhanced KECA | |
Samuel et al. | Kernel canonical variate analysis for nonlinear dynamic process monitoring | |
CN110738274A (zh) | 一种基于数据驱动的核动力装置故障诊断方法 | |
Yu et al. | A novel hybrid of auto-associative kernel regression and dynamic independent component analysis for fault detection in nonlinear multimode processes | |
CN104699077B (zh) | 一种基于嵌套迭代费舍尔判别分析的故障变量隔离方法 | |
CN112947649B (zh) | 一种基于互信息矩阵投影的多变量过程监控方法 | |
CN111580506A (zh) | 基于信息融合的工业过程故障诊断方法 | |
CN109085805B (zh) | 一种基于多采样率因子分析模型的工业过程故障检测方法 | |
CN112904810B (zh) | 基于有效特征选择的流程工业非线性过程监测方法 | |
CN103926919B (zh) | 基于小波变换和Lasso函数的工业过程故障检测方法 | |
CN112000081B (zh) | 基于多块信息提取和马氏距离的故障监测方法及系统 | |
CN109298633A (zh) | 基于自适应分块非负矩阵分解的化工生产过程故障监测方法 | |
CN112414694A (zh) | 基于多元状态估计技术的设备多级异常状态识别方法及装置 | |
JP3718765B2 (ja) | プラント診断装置 | |
CN111122811A (zh) | 一种oica和rnn融合模型的污水处理过程故障监测方法 | |
CN110308713A (zh) | 一种基于k近邻重构的工业过程故障变量识别方法 | |
Wang et al. | A hybrid approach for identification of concurrent control chart patterns | |
CN116627116B (zh) | 一种流程工业故障定位方法、系统及电子设备 | |
Márquez-Vera et al. | Adaptive threshold PCA for fault detection and isolation | |
CN110244690B (zh) | 一种多变量工业过程故障辨识方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |