CN112947649B

CN112947649B - 一种基于互信息矩阵投影的多变量过程监控方法

Info

Publication number: CN112947649B
Application number: CN202110297592.8A
Authority: CN
Inventors: 吕菲亚; 余书剑; 张秉格
Original assignee: Anyang Normal University
Current assignee: Anyang Normal University
Priority date: 2021-03-19
Filing date: 2021-03-19
Publication date: 2021-11-23
Anticipated expiration: 2041-03-19
Also published as: CN112947649A

Abstract

本发明提供了一种基于互信息矩阵投影的多变量过程监控方法，属于工业过程监控领域。本发明所提出的技术利用基于矩阵Rényi的α‑熵函数估计变量之间的互信息值，这一互信息算子是在(正则化的)对称正定矩阵的特征谱上进行估计，弥补了流程工业中难以实时计算概率密度函数的不足；其次基于互信息矩阵的投影进行统计分析，不仅可以刻画过程数据中隐含的非线性特征，而且能够解析故障发生的诱因变量。此外，基于信息论的故障诊断技术不受工业过程中样本标签不足、数据不均衡等因素的影响。因此，本发明对于解决实际工业过程监控问题具有重要的现实意义。

Description

一种基于互信息矩阵投影的多变量过程监控方法

技术领域

本发明属于工业过程控制领域，利用基于矩阵Rényi的α-熵函数估计传感器采集变量之间的互信息值，弥补了流程工业中难以实时计算概率密度函数的不足。基于互信息矩阵投影的多变量过程监控方法不仅可以刻画过程数据中隐含的非线性特征，而且能够解析故障发生的根变量，同时不受工业过程中样本标签不足、数据不均衡等因素的影响，对于解决实际工业过程监控问题具有重要的现实意义。

背景技术

数据驱动技术是计量学中用于识别异常过程的有效工具，多变量统计过程监控是过程控制领域过去几十年研究中最活跃的领域之一，并在化工过程、微电子制造和制药工艺等工业领域中取得了巨大成功。

考虑到工业过程的动态特性，在线监测数据不仅包含了生产运行过程的累积关联性，而且更能反映系统当前状态的最新变化，基于滑动窗的方法通过添加时滞变量构建时间拓扑矩阵，捕获连续过程的(局部)相关性特征。为了进一步提高基于滑动窗方法的性能，如何利用过程变量的高阶统计量变得至关重要。基于主元分析的故障检测方法均采用协方差矩阵的转换元提取量测(检测)数据中的线性相关性，如何利用工业过程数据中隐含的非线性特性成为故障检测中的关键问题。

近年来，信息论由于其数理统计方面的优势，已成功应用于各种机器学习，计算机视觉和信号处理任务中，在过程监控的应用中也引发了新的研究兴趣。尽管已有一些研究将信息论应用于故障检测，但多数是利用互信息计算选取变量之间的主要驱动量，基于变量选择进行监测数据降维。关于如何将信息论技术应用于流程工业过程控制，仍然是一个有待解决的技术问题。特别地，连续过程的实时概率密度估计是数据驱动领域一个难点，对于可能同时包含离散变量和连续变量的复杂流程工业，有待进一步研究基于信息论的故障检测的技术，以提高诊断系统的实时性和精确性。本发明正是针对上述问题提出的更适用于流程工业过程的过程监控技术。

发明内容

本发明的目的在于克服现有流程工业中基于信息论的故障诊断技术的不足，提出了一种基于互信息矩阵投影的多变量过程监控技术：构造互信息矩阵并对其投影进行统计分析以监控工业过程的动态和非平稳性(可能是非线性的)；基于矩阵Rényi的α-熵函数的互信息估计在(正则化的)对称正定矩阵的特征谱上计算，弥补了流程工业中难以实时计算概率密度函数的不足。

为了达到上述目的，本发明的技术方案为：

一种基于互信息矩阵投影的多变量过程监控方法，包括离线建模环节和在线监控环节，

所述的离线建模环节包括：

1.1)数据预处理：对于在工业过程中已经采集到的原始流程数据构建训练集

进行标准化预处理得到

基于

构建监测时刻i的时间拓扑矩阵

其中，w为时间窗口的长度；x_j(1≤j≤m)表示在一个时间窗口内由w个流程样本数据所构建的拓扑矩阵X_train的第j列变量；

1.2)构建工业监测时刻i的变量互信息矩阵

并进行特征谱分解得到特征向量矩阵

和特征值对角矩阵

1.3)对样本在互信息矩阵

的特征空间进行投影以提取转换元矩阵

并计算其各阶统计量μ_k、ν_k、ζ_k和γ_k以构建检测指标

1.4)根据检测指标的均值Θ_μ和标准差Θ_σ计算样本的相似性指标Dⁱ；

1.5)基于工业过程中的置信度η对相似性指标Dⁱ进行统计，计算监控阈值D_cl；

所述在线监控环节包括：

2.1)数据预处理：对于工业运行过程中的在线监测样本的原始数据构建测试集

利用训练集的均值

和方差

对测试集数据进行预处理得到

构建监测时刻i的时间拓扑矩阵

2.2)构建监测时刻i的变量互信息矩阵

并

对进行特征谱分解得到特征向量矩阵

和特征值对角矩阵

2.3)对测试集样本在互信息矩阵

的特征空间进行投影以提取转换元矩阵

并构建检测指标

2.4)对测试集的检测指标

以训练集检测指标的均值Θ_μ及标准差Θ_σ作为对比，计算在线监测样本的相似性指标

2.5)根据监控阈值进行故障辨识，如果

则进行故障报警。

进一步的，所述的步骤1.2)具体为：

1.2.1)定义核函数κ：

计算任意两个传感器变量x_i和x_j的Gram矩阵K＝κ(x_i,x_j)，归一化为

计算基于矩阵Rényi的α-熵：

表示矩阵A和B之间的Hadamard乘积；

1.2.2)基于矩阵Rényi的α-熵函数构建时刻i的变量互信息矩阵

其中，I(x_i；x_j)为变量x_i和x_j之间的互信息，H(x_i)为变量x_i的熵，且I(x_i；x_j)＝H(x_i)+H(x_j)-H(x_i；x_j)，而H(x_i；x_j)为变量x_i和x_j之间的联合熵；

1.2.3)对互信息矩阵

进行特征谱分解

其中

是为特征向量矩阵，对角矩阵

是特征值矩阵。

进一步的，所述的步骤1.3)中训练集的转换元矩阵

的计算具体为：

转换元矩阵Tⁱ的各阶统计量μ_i，ν_i，ζ_i,γ_i的计算如下：

其中，t^i-k(k＝{0,1,…,w-1})表示转换元矩阵Tⁱ的第w-k行的行向量，μ_i表示Tⁱ的一阶统计量，ν_i表示Tⁱ的二阶统计量，ζ_i表示Tⁱ的三阶统计量，γ_i表示Tⁱ的四阶统计量。

训练集所构建的检测指标集

对该统计指标计算均值Θ_μ和标准差Θ_σ＝diag(σ₁,σ₂,…,σ_4m)，其中σ_i(i＝{1,2,…,4m})为训练集指标

每一列的标准差。

进一步的，所述的步骤1.4)中训练集的相似性指标

计算具体为：

其中，||·||_p表示p-范数，可选L1范数||·||₁、L2范数||·||₂和∞范数||·||_∞。

进一步的，所述的步骤2.2)中，

基于矩阵Rényi的α-熵函数构建时刻i的测试集变量互信息矩阵

对互信息矩阵

进行特征谱分解

其中

为特征向量矩阵，对角矩阵

是特征值矩阵。

进一步的，所述的步骤2.3)为，

提取测试集的转换元矩阵

计算测试集转换元矩阵

的各阶统计量μ_k，ν_k，ζ_k,γ_k：

其中μ^*＝E[μ_i,train]，进而构建测试集的检测指标

所述的步骤2.4)中，测试集的相似性指标

计算具体为：

其中，

附图说明

图1为本发明基于滑动窗所构建的时间拓扑结构；

图2为互信息与相关性的对比；

图3为正常及故障状态下Gram矩阵及其特征谱的表示；

图4为正常及故障状态下的互信息矩阵对比；

图5TE过程中及故障状态下的互信息矩阵可视化；

图6TE过程中不同故障状态下互信息矩阵的均值变化；

图7TE过程中不同窗口长度下故障5及19的检测性能变化。

具体实施方式

本发明所提出的方法适用于复杂的流程工业过程，解决的问题主要是流程工业多变量过程中变量相关性的实时概率估计及故障检测的准确性与可解释性。

为了达到上述目的，本发明的技术方案为：

鉴于流程工业过程运行中，传感器采集数据为时间序列，即离散的时间过程

由于当前监测数据与一定时间内的历史监测样本最相关，可选定适当的时间窗口长度w，在每个监测时刻k，构造样本的拓扑矩阵

如下：

其中x_l(1≤l≤m)表示在一个时间窗口内由w个流程样本构建的拓扑矩阵X^k的第l列变量，见图1所示。则第k时刻的互信息矩阵M由下式给出：

其中，I(x_i；x_j)为传感器变量x_i和x_j之间的互信息，H(x_i)为变量x_i的熵，且I(x_i；x_j)＝H(x_i)+H(x_j)-H(x_i；x_j)，而H(x_i；x_j)为变量x_i和x_j之间的联合熵，特别地，I(x_i；x_i)＝H(x_i)。互信息矩阵M为非负对称矩阵，从信息论的角度，需要根据概率密度函数计算互信息，但是实时的概率密度估计在目前仍是一个技术难题，而且工业过程中的监测量可能同时包含离散变量和连续变量。本技术采用基于矩阵Rényi的α-熵函数进行概率密度的近似计算。

对于工业过程中的采样变量

定义实正定可分核函数κ：

已知x在有限集s上的概率密度函数为p(x)，则基于矩阵Rényi的α-熵函数为：

根据定义的核函数κ可求出任意两个随机变量的Gram矩阵K＝κ(x_i,x_j)，则基于矩阵Rényi的α-熵函数为：

其中，A是Gram矩阵K的归一化正定矩阵，即A＝K/tr(K)，而λ_i(A)表示A的第i个特征值。

对于工业过程中的任意两个传感器变量所组合的变量对

x∈χ，y∈χ，定义实正定可分核函数κ₁:

和κ₂:

则基于矩阵Rényi的α-联合熵函数为：

其中，A_ij＝κ₁(x_i,x_j),B_ij＝κ₂(y_i,y_j),

表示矩阵A和B之间的Hadamard乘积。则基于矩阵Rényi的α-熵函数的互信息为I_α(A；B)＝H_α(A)+H_α(B)-H_α(A,B)。

本技术中使用高斯核函数

现有过程监控技术表明，可以从样本协方差矩阵的特征向量所形成的正交空间中提取统计特征，从而构成对原始数据空间特性的理解。类比协方差矩阵，互信息矩阵M同样是变量之间相关性的度量。在过程监控中，互信息矩阵M包含了k时刻的时间拓扑矩阵中任意两个变量之间的非线性相关性，在正常状态下，互信息矩阵M的统计量应当保持不变或稳定。但是某一传感器发生故障，至少会影响互信息矩阵中一个或多个互信息值，从而造成所提取的各阶统计量的改变。因此，可对互信息矩阵进行特征谱分解M＝PΛP^-1，P为特征向量矩阵，对角矩阵Λ＝diag(λ₁,λ₂,…,λ_m)是特征值矩阵。对检测样本在由特征向量矩阵P的列向量所构建的正交空间投影，得到转换元矩阵T：

由于投影空间统计特征向量彼此正交，则消除了变量间的关联性，简化了原始过程特性分析的复杂程度。为了刻画工业过程原始数据空间的特性，从多变量分析角度提取转换元矩阵的统计特征一阶统计量μ_k，二阶统计量ν_k，三阶统计量ζ_k和四阶统计量γ_k：

进而构建检测指标

并计算转换元统计指标的均值Θ_μ、标准差Θ_σ＝diag(σ₁,σ₂,…,σ_4m)。需要注意的是，在线检测过程是采用训练集的一阶统计量μ_i的均值μ^*＝E[μ_i,train]计算检测指标

多变量过程监控中，根据相似性度量进行故障检测。本技术中k时刻的相似性指标

监控阈值D_cl是根据经验法则取工业过程中监测置信度为η时的相似性指标值，η可以不同流程工业过程的敏感度和容错性进行选择和设定。

不同于协方差矩阵仅能够捕获任意两个变量之间的线性相关性，互信息矩阵M同时包含了任意两个变量之间的非线性相关性，而变量之间的非线性和非单调性关系在多变量工业过程中是普遍存在的。此外，互信息I根据实值概率密度函数进行估计，对数据特征(如连续，离散或混合)没有要求，同时，互信息矩阵M的计算对变量的联合分布或变量之间的关系不作任何先验假设，这使该技术在工业过程控制应用中具有很大潜力。

本发明所提出的技术包含离线建模和在线监控两部分，其流程图如图2所示。其中方法的离线部分步骤为：

步骤一：数据预处理

1)对于在工业过程中已经采集到的原始流程数据构建训练集

进行标准化预处理得到

其中，

为训练集的均值，

为标准偏差。

2)构建训练集监测时刻i的时间拓扑矩阵

步骤二：互信息矩阵投影

1)定义核函数κ：

计算任意两个变量x_i和x_j的Gram矩阵K＝κ(x_i,x_j)，归一化为

计算基于矩阵Rényi的α-熵：

其中，

表示矩阵A和B之间的Hadamard乘积。

2)基于矩阵Rényi的α-熵函数构建时刻i的变量互信息矩阵

3)对训练集的互信息矩阵

进行特征谱分解

其中

是为特征向量矩阵，对角矩阵

是特征值矩阵；

4)对训练集样本在互信息矩阵

的特征空间进行投影以提取训练集的转换元矩阵

步骤三：计算转换元矩阵的各阶统计量μ_i，ν_i，ζ_i,γ_i：

进而构建训练集的检测指标

并计算该指标的均值Θ_μ和标准差Θ_σ＝diag(σ₁,σ₂,…,σ_4m)，其中σ_i为

第i列的标准差。

步骤四：计算训练集的相似性指标

并在选定的置信度η下对相似性指标Dⁱ进行统计，计算监控阈值D_cl。

方法的在线部分是指对测试样本是否为故障样本的检测与辨识，步骤为：

步骤一：数据预处理

1)对于工业过程的在线测试样本

利用训练集的均值

和方差

进行预处理得到

构建时刻i的时间拓扑矩阵

步骤二：互信息矩阵投影

1)基于矩阵Rényi的α-熵函数构建时刻i的互信息矩阵

2)对互信息矩阵

进行特征谱分解

其中

是为特征向量矩阵，对角矩阵

是特征值矩阵；

3)对测试集样本在互信息矩阵的投影空间进行投影以提取转换元矩阵

步骤三：计算测试集转换元矩阵的各阶统计量μ_k，ν_k，ζ_k,γ_k：

其中μ^*＝E[μ_i,train]，进而构建检测指标

步骤四：计算训练集的相似性指标

根据监控阈值进行故障辨识，如果

则进行故障报警，并辨识引起故障的根原因。

实验验证与分析：

1.互信息与相关性的比较

不同于协方差矩阵仅能够捕获任意两个变量之间的线性相关性，互信息矩阵M同时包含了任意两个变量之间的非线性相关性，而传感器变量之间的非线性和非单调性关系在多变量工业过程中是普遍存在的。

不同数据分布下，两个变量的相关性值(棕色数值)与互信息值(红色数值)的对比如图2所示，由图可见，上面一行两变量之间呈线性关系，相关性与互信息均不为0；下面一行两变量之间呈非线性关系，对于相关性为0的数据分布，其互信息值不为0，且大于相关性的值。这正是工业过程中非线性特性所期望的。

2.基于互信息矩阵投影的故障检测可行性验证

考虑一个由下式生成的多变量非线性过程：

其中

υ表示三个均值为[0.3，2.0，3.1]^T、标准差为[1.0，2.0，0.8]^T的独立高斯分布数据源，权重矩阵

e表示标准差为[0.061，0.063，0.198，0.176，0.170]^T的高斯白噪声。

对于传感器故障x^*＝x+f，当f发生在变量x₁上时，正常过程和故障过程计算的Gram矩阵及其特征谱如图3所示，可见故障的发生会导致Gram矩阵及特征谱的变化，进而影响变量的熵函数计算。进一步，互信息矩阵如图4所示，互信息矩阵中第一行和第一列的互信息值发生变化，说明故障的诱因是变量1，也说明对互信息矩阵进行投影对故障检测是具有可行性的。

3.性能验证—TE过程实验验证

本发明所提出的方法在化工过程的基准测试集TE(Tennessee Eastman)过程数据上进行了验证。实验数据参见网站：http：//web.mit.edu/braatzgroup/links.html。

首先，正常状态，故障1(阶跃故障)和故障14(粘滞故障)的互信息矩阵如图5所示，右侧为对角线上向量的箱线图。显然，正常状态下不同时刻的互信息矩阵几乎不变；但是故障的发生将导致在互信息矩阵出现不同的联合或边缘分布。通过比较正常状态、故障状态的对角线上的箱线图，即熵的变化，可以发现不同类型的故障产生的变化不同，故障14比故障1的箱线图中有更多的离群值(“+”符号绘制)。

其次，监测变量和其余变量之间的互信息平均值见图6，如图6(a)所示，箱线图的晶体变宽，75分位数变大，这表明故障1可能是一个阶跃变化。实际上，故障1确实引起了流4的阶跃变化，反应物A，B和C的进料变化对过程监控造成了总体影响。相比之下，故障14是由反应堆冷却阀的粘滞变化引起，相关变量为变量9、21和32。根据图6(b)，确实存在三个离群值(“+”符号绘制)分别对应于第9、21和32维变量。换句话说，变量9、21和32的变化恰好是导致互信息矩阵发生变化的驱动力。从这个意义上讲，本技术对故障诱因的辨识有一定的指导意义，是可解释的。

在不失一般性的前提下，选择滑动窗长度100，不同方法的平均故障检测率和故障误警率见表1和表2。从表1可以看出，本技术(简记PMIM)的故障检测率整体较为满意，可以检测大多数故障，并且在不同类型的故障中保持稳定。此外，由于互信息矩阵包含了时间拓扑矩阵中任意两个变量之间的非线性相关性，这是优于协方差矩阵的，从检测率上看，本技术的性能也在多数情况下优于基于协方差矩阵的转换元方法(RTCSA，RDTCSA)。尽管本技术的检测率在阶跃故障5和未知故障19上相对较低，但随着滑动窗尺寸的增大，这两种故障中的检测性能会得到显着提高，如图7所示。从表2可以看出，本技术及参考方法的故障误警率均接近于显著性水平，甚至相对于基于协方差矩阵的转换元方法(RTCSA，RDTCSA)，本技术的误警率更低，证明互信息在捕获变量相关性方面的优越性。

表1 TE过程中不同方法的故障检测率汇总

表2 TE过程中不同方法的故障误检率汇总

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。