CN111913461B

CN111913461B - 一种基于正则化gcca模型的分布式化工过程监测方法

Info

Publication number: CN111913461B
Application number: CN201910873186.4A
Authority: CN
Inventors: 张赫; 葛英辉; 童楚东
Original assignee: Ningbo University
Current assignee: Shandong Longshenghe Auxiliary Agent Co ltd; Shenzhen Dragon Totem Technology Achievement Transformation Co ltd
Priority date: 2019-09-07
Filing date: 2019-09-07
Publication date: 2022-03-18
Anticipated expiration: 2039-09-07
Also published as: CN111913461A

Abstract

本发明公开一种基于正则化GCCA模型的分布式化工过程监测方法，用于解决分布式化工过程监测问题。本发明方法利用所涉及的正则化广义典型相关分析(GCCA)算法在实施多块建模时同时考虑变量块间的共性与各块内的独特性，并可同时应用于重叠与不重叠的变量分块模式。与传统方法相比，本发明方法所涉及的正则化GCCA算法通过典型相关系数的平方将各变量子块间的共性特征提取给考虑进来，并进一步使用最小二乘回归算法描述块间相关特征之间的关系。此外，本发明方法还将块间相关特征与块内特征分开进行考虑，分别使用两个综合监测指标分开实施监测。因此，本发明方法是一种更优越的分布式化工过程运行状态监测方法。

Description

一种基于正则化GCCA模型的分布式化工过程监测方法

技术领域

本发明涉及一种数据驱动的过程监测方法，尤其涉及一种基于正则化GCCA模型的分布式化工过程监测方法。

背景技术

现代化工工业生产系统的日趋复杂化与大型化的发展模式越来越注重计算机技术、先进仪器仪表技术，人工智能技术在管理生产、监控、调度等等问题上的应用。而今，现代化工过程对象可以离线存储与在线实时测量海量的采样数据，这些数据中蕴含着能体现生产过程运行状态的潜在有用信息，为化工过程运行状态的监测奠定了充实的数据基础。近十几年来，无论是学术界还是工业界，都投入了大量的人力与物力研究数据驱动的故障检测方法与技术。这其中，统计过程监测是被研究得最多的方法技术，其中主元分析(Principal Component Analysis，缩写：PCA)与独立元分析(Independent ComponentAnalysis，缩写：ICA)为最主流的实施技术手段。此外，由于现代化工过程生产流程的多单元性，基于多块建模方法的分布式化工过程监测方法也受到了越来越多的重视。

通常而言，分布式的过程监测方法技术具有其独特的先天优势。首先，通过分块化处理的方式降低了模型分析的复杂度；其次，采用多个模型的监测思路通常能取得优越于单个模型的故障检测效果；最后，分布式的过程监测对于后续的故障的定位能起到一定积极的指导作用。因此，在现有科研文献与专利技术材料中，出现了多种分布式或分散式的过程监测方法。不失一般性而言，分布式的过程监测主要包括两个步骤：先实施对测量变量的分块化处理，后实施多块建模。对测量变量进行分块即可按照过程生产流程来实施，也可以借鉴测量变量之间的统计特性予以实现。而多块建模方法通常有两种思路：其一，标准的多块建模算法，如多块PCA(Multi-block PCA，缩写：MBPCA)算法；其二，直接为每个变量建立单独的PCA或ICA模型，这类方法可称为分布式PCA(Distributed PCA，缩写DPCA)或分布式ICA(Distributed ICA，缩写：DICA)方法。

一般来讲，一个合理的多块建模方法需要同时考虑块间的共性(因为化工过程是作为一个整体进行生产的)以及块内的独特性(分块的意义所在)。此外，在某些情况下，测量变量可能更适宜于被分成多个相互重叠的变量子块。因此，一个合理的多块建模方法还需能同时应对重叠与不重叠的变量分块模式。然而，纵观已有的方法技术中，还未曾这类方法技术被发明出来。因此，这个问题是一个丞待解决的问题。

发明内容

本发明所要解决的主要技术问题是：针对分布式化工过程监测问题，如何在实施多块建模时同时考虑变量块间的共性与各块内的独特性，并可同时应用于重叠与不重叠的变量分块模式。解决该问题的关键在于本发明方法所涉及的正则化广义典型相关分析(Generalized Canonical Correlation Analysis，缩写：GCCA)算法，该算法能够充分挖掘变量块间的相关性特征，从而考虑了变量块间的共性。

本发明解决上述技术问题所采用的技术方案为：一种基于正则化GCCA模型的分布式化工过程监测方法，包括以下所示步骤：

步骤(1)：采集化工过程正常运行状态下的n个样本数据x₁，x₂，…，x_n，组成训练数据矩阵X＝[x₁，x₂，…，x_n]^T∈R^n×m，并对X中各样本数据实施标准化处理得到矩阵

其中m为测量变量数、R为实数集、R^n×m表示n×m维的实数矩阵、x_i∈R^m×1与

分别表示第i个样本数据及其标准化处理后的数据向量、i＝1，2，…，n、上标号T表示矩阵或向量的转置、

中各列向量即表示各测量变量标准化后的n个采样数据。

值得指出的是，化工过程的各个采样数据一般都是由温度、压力、流量、液位等测量仪表测量得到的数据。步骤(1)中测量变量的个数为m，则表示有m个测量仪表对化工过程对象进行实时采样。

此外，由于各个测量变量的变化范围不可能一致，也就导致各个测量变量之间存在量纲的差异影响。因此，需要使用标准化处理的方式，将各个测量变量的采样数据皆变换成均值为0，标准差为1的数据。

步骤(2)：将化工过程m个测量变量分解成B个变量子块，并根据这B个变量子块从矩阵

中取出相应的列向量，分别构造B个子块矩阵X₁，X₂，…，X_B。

值得指出的是，步骤(2)对变量子块是否存在重叠的情况不做任何要求。若用子块矩阵X₁，X₂，…，X_B中测量变量的个数分别为m₁，m₂，…，m_B，则m₁+m₂+…+m_B≥m。

步骤(3)：利用正则化广义典型相关分析算法求解得到B个子块矩阵X₁，X₂，…，X_B对应的变换向量基W₁，W₂，…，W_B，正则化GCCA算法的具体原理及推理过程如下所示。

本发明方法所涉及的正则化GCCA算法是一种全新的多块建模算法，旨在通过分别对应于X₁，X₂，…，X_B的变换向量基W₁，W₂，…，W_B实现变换后潜在特征之间的典型相关性最大化。具体来讲，其目标函数如下所示：

上式中，k＝1，2，…，B、λ＝1，2，…，B、

表示计算矩阵中各个元素的平方和、

与

分别表示m_k×m_k维的单位矩阵与m_λ×m_λ维的单位矩阵、s.t.为单词Subject To的缩写，表示约束条件的意思、正则化参数H_kλ的定义如下所示：

若是令

与

其中C_kλ＝X_k ^TX_λ，上式②中定义的优化问题可转换成如下所示形式：

上式①中优化求解W₁，W₂，…，W_B的问题就变成了上式③中优化求解U₁，U₂，…，U_B的问题。

通过上式①可以发现，目标函数中使用

是将经W₁，W₂，…，W_B变换后得到的潜特征矩阵S_k＝X_kW_k各列向量之间的典型相关系数进行平方处理后，再进行累加和处理。因此，本发明方法所涉及的广义典型相关分析充分地考虑到了变量块之间潜藏的典型相关性。

考虑到

其中A表示任意一个实数矩阵、tr()表示计算矩阵的迹(等价于计算矩阵对角线元素之和或所有特征值之和)，上式③中的目标函数可进行如下所示的等价变换：

上式中，矩阵

很显然，由于矩阵Φ_k是对称的，因此上式④中U_k的最优解即为矩阵Φ_k的所有特征向量。然而，矩阵Φ_k的计算与U_λ的优化求解是相互耦合的，因此，特设计出如下所示的迭代循环求解过程。

步骤(一)：分别初始化U₁，U₂，…，U_B为任意m₁×m₁，m₂×m₂，…，m_B×m_B维的随机实数矩阵，并设置k＝1。

步骤(二)：计算矩阵

后，求解特征值问题Φ_kμ＝ημ中所有特征值所对应的特征向量

并保证各特征向量的长度都为1且要求特征向量μ₁，μ₂，…，μ_m按照特征值大小的降序排列

而进行先后排列，再更新矩阵U_k＝[μ₁，μ₂，…，μ_m]。

步骤(三)：若k＜B，则设置k＝k+1后返步骤(二)；若k≥B，则执行步骤(四)。

步骤(四)：若U₁，U₂，…，U_B都收敛，则执行步骤(五)；若U₁，U₂，…，U_B中存在未收敛的情况，则设置k＝1后，返回步骤(二)。

步骤(五)：根据公式

计算得到变换向量基W₁，W₂，…，W_B。

步骤(4)：根据公式S_k＝X_kW_k计算得到得分矩阵S₁，S₂，…，S_B后，再分别确定各变量子块中块间相关特征的个数为d₁，d₂，…，d_B，从而将变换基W₁，W₂，…，W_B对应分成两部分：

与

其中k＝1，2，…，B、

由变换基W_k中前d_k列的列向量组成，

由W_k中后m_k-d_k列的列向量组成，k＝1，2，…，B。

确定各变量子块中块间相关特征的个数需要考虑到各个得分矩阵S₁，S₂，…，s_B之间各个列向量之间的典型相关性大小。为此，本发明方法使用如下所示步骤依次客观地确定出各变量子块中块间相关特征的个数d₁，d₂，…，d_B。

步骤(一)：设置k＝1，并设S_k(j)表示得分矩阵S_k中的第j列的列向量。

步骤(二)：按照公式J_k(j)＝|S_k(j)^TZ_k|计算得到第k个得分矩阵中第j个列向量的典型相关性绝对值向量J_k(j)，其中j＝1，2，…，m_k，Z_k＝[S₁，…，S_k-1，S_k+1，…，S_D]。

步骤(三)：将J_k(j)中元素的最大值记录为ρ_k(j)后，确定d_k等于ρ_k(1)，ρ_k(2)，…，ρ_k(m_k)中大于0.2的个数。

步骤(四)：若k＜B，则设置k＝k+1后返回步骤(二)；若k＝B，则得到各变量子块中块间相关特征的个数d₁，d₂，…，d_B。

步骤(5)：根据公式

计算块间相关特征矩阵

后，利用最小二乘回归算法建立输入矩阵

与

之间的回归模型：

其中E_k为回归误差矩阵、

表示回归系数矩阵、k＝1，2，…，B。

步骤(6)：根据公式

计算块内特征矩阵

后，再分别计算回归误差矩阵E_k与块内特征矩阵

的协方差矩阵Λ_k＝E_k ^TE_k/(n-1)与

步骤(7)：根据公式ψ_k＝diag{E_kΛ_k ^-1E_k ^T}与

分别计算监测指标向量ψ₁，ψ₂，…，ψ_B和Q₁，Q₂，…，Q_B，其中k＝1，2，…，B，并利用核密度估计(Kernel DensityEstimation，缩写KDE)法分别确定出各监测指标向量在置信限α＝99％条件下的具体数值，分别对应记做δ₁，δ₂，…，δ_B与β₁，β₂，…，β_B，其中diag{}表示将大括号内的矩阵对角线元素转变成向量的操作。

步骤(8)：根据如下所示公式⑤计算综合监测指标向量ψ与Q：

并再次使用核密度估计法确定ψ与Q在置信限α＝99％条件下的具体数值，分别对应记做δ与β；

离线建模阶段至此完成，接下来进入在线动态过程监测阶段，包含以下所示实施步骤。

步骤(9)：收集新采样时刻的样本数据x_new∈R^m×1，并对x_new实施与步骤(1)中相同的标准化处理对应得到向量

步骤(10)：分别根据步骤(2)中的B个变量子块将向量

中相应的元素用于构造B个子块向量y₁，y₂，…，y_B，并根据公式

与

计算块间特征向量

与块内特征向量

步骤(11)：根据公式

计算回归误差向量e_k，其中

再分别根据公式

与

计算监测指标

与θ₁，θ₂，…，θ_B，其中k＝1，2，…，B。

步骤(12)：根据如下所示公式⑥计算综合监测指标ψ_new与Q_new：

步骤(13)：判断是否满足条件：ψ_new≤δ且Q_new≤β，若是，则当前采样时刻化工过程运行正常，返回步骤(9)继续实施对下一个新时刻样本数据的监测；若否，则当前采样时刻化工过程进入异常工作状态，触发故障警报并返回步骤(9)继续实施监测。

与传统方法相比，本发明方法的优势在于：

首先，本发明方法所涉及的正则化GCCA算法通过典型相关系数的平方将各变量子块间的共性特征提取给考虑进来，因此所提取的块间相关特征是满足典型相关系数最大化要求的。其次，本发明方法进一步使用最小二乘回归算法描述块间相关特征之间的关系，并通过监测回归误差的方式来反映块间相关特征的变化。最后，本发明方法将块间相关特征与块内特征分开进行考虑，两个综合监测指标能够清楚地指明故障工况数据是改变了块间的共性还是改变的块内的独特性。因此，本发明方法是一种更优越的分布式化工过程监测方法。

附图说明

图1为本发明方法的实施流程图。

图2 TE化工过程生产流程示意图。

图3为TE过程故障工况下的监测详情对比图。

具体实施方式

下面结合附图与具体的实施案例对本发明方法进行详细的说明。

如图1所示，本发明公开一种基于正则化GCCA模型的分布式化工过程监测方法，下面结合一个具体的化工过程对象来说明本发明方法的具体实施过程。

应用对象是来自于美国田纳西-伊斯曼(TE)化工生产过程，TE过程是伊斯曼化工生产车间的一个实际工艺流程，其流程示意图如图2所示。目前，TE过程因其流程的复杂性，已作为一个标准实验平台被广泛用于过程运行状态监测研究。整个TE过程包括22个测量变量、12个操作变量、和19个成分测量变量。该TE化工过程对象可以模拟仿真多种不同的故障类型，如物料进口温度阶跃变化、冷却水故障变化等等。为了对该过程进行监测，选取如表1所示的33个过程测量变量。由于采样间隔时间较短，TE过程采样数据不可避免的存在序列自相关性，接下来结合该TE过程对本发明具体实施步骤进行详细的阐述。

表1：TE过程监测变量。

序号	变量描述	序号	变量描述	序号	变量描述
						1	物料A流量	12	分离器液位	23	D进料阀门位置
2	物料D流量	13	分离器压力	24	E进料阀门位置
						3	物料E流量	14	分离器塔底流量	25	A进料阀门位置
4	总进料流量	15	汽提塔等级	26	A和C进料阀门位置
						5	循环流量	16	汽提塔压力	27	压缩机循环阀门位置
6	反应器进料	17	汽提塔底部流量	28	排空阀门位置
						7	反应器压力	18	汽提塔温度	29	分离器液相阀门位置
8	反应器等级	19	汽提塔上部蒸汽	30	汽提塔液相阀门位置
						9	反应器温度	20	压缩机功率	31	汽提塔蒸汽阀门位置
10	排空速率	21	反应器冷却水出口温度	32	反应器冷凝水流量
						11	分离器温度	22	分离器冷却水出口温度	33	冷凝器冷却水流量

首先，利用TE过程正常工况下采样的n＝960个样本数据实施本发明方法的离线建模，包括以下步骤：

步骤(1)：采集化工过程正常运行状态下的n＝960个样本数据x₁，x₂，…，x₉₆₀，组成训练数据矩阵X＝[x₁，x₂，…，x₉₆₀]^T∈R^960×33，并对X实施标准化处理得到矩阵

TE化工过程的生产流程示意图如图2所示，通过该流程示意图可将表1中对应的33个测量变量分解成B＝4个变量子块，相应的变量子块详情如表2所示。

表2：

子块编号：	测量变量编号	分块标准
			k＝1	1、2、3、4、8、23、24、25、26	TE过程原料进料测量变量
k＝2	1、2、3、5、6、7、8、9、17、21、32、33	反应器与冷凝器
			k＝3	5、10、11、12、13、14、20、22、27、28、29	分离器与压缩机
k＝4	4、12、14、15、16、17、18、19、30、31	汽提塔

步骤(2)：将化工过程m＝33个测量变量分解成4个变量子块，并根据这4个变量子块从矩阵

中取出相应的列向量，分别构造B个子块矩阵X₁，X₂，X₃，X₄。

步骤(3)：利用正则化广义典型相关分析算法求解得到4个子块矩阵X₁，X₂，X₃，X₄对应的变换向量基W₁，W₂，W₃，W₄。

步骤(4)：根据公式S_k＝X_kW_k计算得到得分矩阵S₁，S₂，S₃，S₄后，再分别确定各变量子块中块间相关特征的个数为d₁＝3，d₂＝9，d₃＝8，d₄＝7，从而将变换基W₁，W₂，W₃，W₄对应分成两部分：

与

步骤(5)：根据公式

计算块间相关特征矩阵

后，利用最小二乘回归算法建立输入矩阵

与

之间的回归模型：

步骤(6)：根据公式

计算块内特征矩阵

后，再分别计算回归误差矩阵E_k与块内特征矩阵

的协方差矩阵Λ_k＝E_k ^TE_k/(n-1)与

步骤(7)：根据公式ψ_k＝diag{E_kΛ_k ^-1E_k ^T}与

分别计算监测指标向量ψ₁，ψ₂，…，ψ_B和Q₁，Q₂，…，Q_B，其中k＝1，2，…，B，并利用KDE法分别确定出各监测指标向量在置信限α＝99％条件下的具体数值，分别对应记做δ₁，δ₂，…，δ_B与β₁，β₂，…，β_B。

步骤(8)：根据上述公式⑤计算综合监测指标向量ψ与Q，并再次使用核密度估计法确定ψ与Q在置信限α＝99％条件下的具体数值，分别对应记做δ与β。

离线建模阶段至此完成，接下来进入在线动态过程监测阶段。利用TE化工过程在故障工况下的960个测试数据对本发明方法的故障监测性能进行测试。其中，这960个数据的前160个数据采集自TE过程的正常运行状态，从第161个样本点开始TE过程才进入故障工况。

步骤(9)：收集新采样时刻的样本数据x_new∈R^33×1，并对x_new实施与步骤(1)中相同的标准化处理对应得到向量

步骤(10)：根据步骤(2)中的4个变量子块从向量

中取出相应的元素构造4个子块向量y₁，y₂，y₃，y₄，并根据公式

与

计算块间特征向量

与块内特征向量

步骤(11)：根据公式

计算回归误差向量e_k，其中

再分别根据公式

与

计算监测指标

与θ₁，θ₂，θ₃，θ₄；

步骤(12)：根据上述公式⑥计算综合监测指标ψ_new与Q_new。

如图3所示，本发明方法与传统MBPCA、DPCA、和DICA方法的在监测故障工况数据的监测图。从图3中对比可以很明显地发现，本发明方法在故障检测成功率明显优越于其他动态过程监测方法。因此，可以说本发明方法具有更可靠的过程监测性能。

Claims

1.一种基于正则化GCCA模型的分布式化工过程监测方法，其特征在于，包括以下步骤：

中各列向量即表示各测量变量标准化后的n个采样数据；

步骤(2)：将化工过程m个测量变量分解成B个变量子块，并根据这B个变量子块将矩阵

中相应的列向量分别用于构造B个子块矩阵X₁，X₂，…，X_B，子块矩阵X₁，X₂，…，X_B中测量变量的个数分别为m₁，m₂，…，m_B；

步骤(3)：利用正则化广义典型相关分析算法求解得到B个子块矩阵X₁，X₂，…，X_B对应的变换向量基W₁，W₂，…，W_B，具体的实施过程如步骤(一)至步骤(五)所述；

步骤(一)：分别初始化U₁，U₂，…，U_B为任意m₁×m₁，m₂×m₂，…，m_B×m_B维的随机实数矩阵，并设置k＝1；

步骤(二)：计算矩阵

并保证各特征向量的长度都为1且要求特征向量μ₁，μ₂，…，μ_m按照特征值大小的降序排列而进行先后排列，再更新矩阵U_k＝[μ₁，μ₂，…，μ_m]，其中C_kλ＝X_k ^TX_λ、C_kk＝X_k ^TX_k、C_λλ＝X_λ ^TX_λ、λ＝1，2，…，B、正则化参数H_kλ的取值为：若k≠λ，则H_kλ＝1；若k＝λ，则H_kλ＝0；

步骤(三)：若k＜B，则设置k＝k+1后返步骤(二)；若k≥B，则执行步骤(四)；

步骤(四)：若U₁，U₂，…，U_B都收敛，则执行步骤(五)；若U₁，U₂，…，U_B中存在未收敛的情况，则设置k＝1后，返回步骤(二)；

步骤(五)：根据公式