CN111142501A

CN111142501A - 基于半监督自回归动态隐变量模型的故障检测方法

Info

Publication number: CN111142501A
Application number: CN201911377117.0A
Authority: CN
Inventors: 周乐; 侯北平; 郑洪波; 武晓莉; 张淼; 刘薇
Original assignee: Zhejiang Lover Health Science and Technology Development Co Ltd
Current assignee: Zhejiang Lover Health Science and Technology Development Co Ltd; Zhejiang University of Science and Technology ZUST
Priority date: 2019-12-27
Filing date: 2019-12-27
Publication date: 2020-05-12
Anticipated expiration: 2039-12-27
Also published as: CN111142501B

Abstract

本发明公开了一种基于半监督自回归动态隐变量模型的故障检测方法，该方法首先收集正常工况下高采样的过程数据和关键质量数据，按时序排列后生成的训练样本集包含过程数据和关键质量数据同时存在的有标签样本，以及只有过程数据而缺少该时刻所对应的关键质量数据的无标签样本；同时求得用于故障检测的T²和SPE统计量的控制限。通过对在线造纸废水处理过程进行采样以及利用化验手段获取关键质量数据，可得到半监督模型测试样本集，然后利用训练生成的模型对测试样本集进行检测，分别计算每个样本所对应的T²和SPE统计量，并与之前所获取的统计量控制限进行比较，从而达到故障检测的效果。

Description

基于半监督自回归动态隐变量模型的故障检测方法

技术领域

本发明设计一种控制方法，具体是涉及一种基于半监督自回归动态隐变量模型的故障检测方法。

背景技术

随着工业复杂度和规模的提升，现代工业对于生产安全和产品质量提出了更高的要求。而由于工业生产的复杂化，基于模型的传统故障检测方法将面临成本和建模难度的挑战。不过随着集散控制系统等过程控制技术的广泛应用，海量的数据得以快速收集，为基于数据的故障检测方法提供了良好的技术基础。基于数据的故障检测方法借助多元统计分析的各种方法，使采集到的高维数据实现降维和特征提取，在制药、废水处理以及石化等行业领域得到了较好的应用。而随着模型研究和实际生产工况的结合，模型改进的热点也从传统的主成分分析(PCA)和偏最小二乘估计(PLS)等静态模型转移到动态PCA(DPCA)等动态模型上。然而，由于受到检测成本和化验难度的限制，与产品质量以及过程安全相关的关键质量数据往往具有低采样的特性，造成了过程样本和关键质量样本在时序无法做到一一对应，可视为特殊的数据缺失问题。基于这一问题，半监督概率隐变量回归(SSPLVR)模型借助半监督的思想和数据时序调整的策略能够有效解决这种采样时序差异问题，但由于数据时序在预处理阶段的调整破坏了原有的动态结构，导致模型在训练时无法对动态特性进行有效监控，而在动态建模研究方面，自回归动态隐变量(ARDLV)模型在期望最大化(EM)算法的概率框架下借助扩展的动态隐变量可以实现对多阶动态特性的监测，同时兼顾了模型的互相关性，在故障检测效果上有不错的表现，但它对数据的完整性有一定的要求，无法直接处理这类特殊的数据缺失问题。因此，需要提出一种既能充分考虑到数据动态特性，又能完整利用这类特殊缺失数据信息的故障检测技术。

发明内容

本发明的目的在于针对现有技术的不足，提供一种基于半监督自回归动态隐变量模型的故障检测方法。

本发明基于正常工况下化工过程中采集到的完整过程数据和少量的关键质量检测数据为建模样本，模型能够利用扩展的隐变量以及卡尔曼滤波算法对数据的多阶动态特性进行提取，同时通过低维的动态隐变量实现对数据互相关性的提取，整个模型实现通过EM算法建立闭环的迭代结构，并设置极大似然函数来决定模型训练的终止。另一方面，为了解决过程数据和关键质量数据在时序结构上的缺失问题，模型引入半监督的思路，将整个数据集视为一个有标签数据和无标签数据的整体，通过监控关键质量检测数据的采样状态变化实现模型训练策略的合理切换，从而能够直接利用这种特殊的缺失数据进行模型训练，并在故障检测的精度上实现提升。

一种基于半监督自回归动态隐变量模型的故障检测方法，包括如下步骤：

(1)收集化工过程正常工况下高采样率的过程变量数据以及正常工况下低采样率的关键质量数据，获取建模所需要的训练样本集；

(2)对步骤(1)获得的数据进行标准化，并将标准化后的数据按时序对齐；

(3)基于获得的数据集，构建半监督自回归动态隐变量模型；构建模型过程中，根据同时刻关键质量数据是否被采集，对步骤(2)得到的数据集进行分类，基于分类后的数据集构建所述的模型；

(4)基于得到的半监督自回归动态隐变量模型，求取该模型对应的T²、SPE_x、SPE_y的控制限

SPE_x,lim、SPE_y,lim，其中SPE_x,lim、SPE_y,lim分别为高采样的过程变量数据、低采样的关键质量数据对应的控制限；

(5)在线收集化工过程的过程变量数据和关键质量数据，进行标准化处理，得到测试样本；

(6)利用得到的半监督动态隐变量模型对测试集进行检测，计算测试样本的

统计量、

统计量，判断测试样本统计量是否超过步骤(4)得到的控制限，输出检测结果。

步骤(1)或者步骤(5)中，利用集散控制系统收集正常工况下高采样的过程变量数据，利用化验手段获取正常工况下低采样的关键质量数据。

步骤(1)中，得到如下数据集：

其中，K为正常过程变量数据的样本数；M为过程样本的变量数，H为正常关键质量数据的样本数；R表示实数集；其中，1,2,3,…,K或者1,2,3,…,H为按照时序得到的样本标记，比如x(K)为按照时序得到的第K个过程变量数据样本；比如y(H)为按照时序得到的第H个关键质量数据样本；X为正常过程变量数据样本组成的数据集，Y为正常关键质量数据组成的数据集。

本发明步骤(2)中，对数据集X和Y分别进行预处理或者标准化，标准化操作为：样本集中的每个元素先减去其所属变量的样本平均值，然后再除以该变量的样本标准差，使得各个过程变量和关键质量变量所对应的数据均值为零，方差为1，并将标准化后的数据按时序对齐后保存以备调用。

本发明步骤(3)中，为便于实现对未被采集到关键质量数据的时刻对应的过程变量数据进行模型训练，根据同时刻关键质量数据是否被采集，将步骤(2)得到的数据集进行分类，得到同时包含关键质量变量和过程变量数据的样本集，以及仅包含过程变量数据的样本集，模型训练时将根据标签自动识别当前数据的样本集归属，进而切换合适的处理方法并建模。

对数据集进行分类可以采用各种方法，作为一种优选的方案，建模时，由于过程变量和关键质量变量的采样率差异，实际采集得到的各变量数据按时序对齐后将得到缺失数据集，即原始得到的数据集由于关键质量采样慢，样本数少，所以和过程变量时序对齐后得到的数据集就会显得关键质量变量有很多缺失。现有的方法都要求过程变量和质量变量的采样率是一致的，无法直接利用这种缺失数据进行处理。本发明中，这里将预处理后数据进行时序对齐后，将空缺位置补0，形成一个“伪完整数据集”，模型的训练算法会自动判别从而采用合适的方法提取当前的实际数据中的潜在公共信息，而这些0在好司机训练过程中其实并不会参与运算，真正参与运算的是那些真实采到的数据，也就是说这里没用到上采样或下采样的预处理方法。

因此针对步骤(2)得到的数据集，首先进行空缺数据的填补(比如值为0)，以得到完整数据集；

针对得到的完整数据集，构建对应的标签矩阵：

对于同时刻有采集到关键质量变量的数据样本，其对应的标签元素为1；

对于同时刻没有采集关键质量变量的数据样本，其对应的标签元素为0；

建模过程中，利用得到的标签矩阵作用于所述的完整数据集，得到同时包含关键质量变量和过程变量数据的样本集，以及仅包含过程变量数据的样本集，基于得到的两个数据集完成模型的构建。

具体讲，为解决过程数据和关键质量数据无法在时序上一一对应的数据缺失问题，模型中引入了标签系数ψ_k，其表现形式如下所示：

其中，ψ_k的整体取值取决于质量数据集Y的相对采样间隔比S，则ψ_k的集合Ψ的结构如下：ψ＝{ψ_k}_k＝1:K＝{ψ_ns+1＝1}_{n＝0:(K/s-1)}

上式对标签集合Ψ和相对采样间隔比s之间的关系进行归纳。其中第一个等式表示标签集合Ψ内是由取值为1或者0的不同时刻对应的标签系数ψ_k组成的，而第二个等式就将时刻数k和关键质量变量的相对采样间隔比s的关系具体化，归纳了标签集合Ψ内元素取值为1的分布情况，即：

利用结构完整的数据集，构建半监督自回归动态隐变量模型，假设所述数据集满足如下关系式：

其中，t(k)∈R^D为k时刻该模型的动态隐变量，D代表动态隐变量的维度，它利用k-1时刻扩展动态隐变量z(k-1)＝[t_k-1 ^T t_k-2 ^T ... t_k-L ^T]^T∈R^DL进行更新，L表示滞后时间。在所提出的半监督自回归动态隐变量模型中，有标签(标签数值为1)的动态隐变量t由X和Y共同决定，无标签(标签值为0)的动态隐变量t仅由X决定，且后续隐变量的卡尔曼估计和模型参数更新环节也会按照这种半监督的思路进行相应的处理。为简化表示，此处将有标签的样本记为{x_a,y_a}，无标签的样本记为{x_b}，下标中的a表示有标签数据，b表示无标签数据；除此之外，A为模型的动态转移矩阵，w为方差为Γ的动态噪声，且存在w服从高斯分布N(0,Γ)；B和C分别为模型的过程观测矩阵和质量观测矩阵，u和v分别为方差为Φ的过程观测噪声和方差为Ω的质量观测噪声，且存在u服从高斯分布N(0,Φ)，v服从高斯分布N(0,Ω)；x(k)和y(k)分别为标准化后的k时刻对应的过程样本和质量样本。

本发明步骤(3)中，利用期望最大化算法构建模型，即利用期望最大化(EM)算法实现模型的闭环迭代以及初始化的模型参数进行首轮训练。在E步，结合当前模型参数以及标签元素ψ_k的取值，利用卡尔曼滤波算法对扩展动态隐变量的后验分布进行合理估计；在M步中，则借助最大化似然函数的方法对模型参数进行更新。

在E步中，首先，对模型参数{A,B，C，Γ,Φ，Ω，μ_L，Σ_L}随机初始化；由于卡尔曼模型和半监督自回归动态隐变量模型的输入数据结构上的差异，需在进行卡尔曼算法估计扩展动态隐变量的后验分布前对模型参数结构作出适当变换，其变换结果如下：

其中，z(k)＝[t(k) t(k-1) ... t(k-L+1)]∈R^DL×1，L为滞后时间，也表示动态隐变量所包含的历史动态信息的数量，其初值为

且z_L服从期望μ_L，方差为V_L的高斯分布N(μ_L,V_L)。其他模型参数的变换如下所示：

其中，

为变换后的动态转移矩阵，

为变换后的动态噪声，且存在

服从高斯分布

γ(k)表示变换后的过程变量样本和质量样本的整体观测矩阵，其相应变换后的观测矩阵为Ξ，变换后的观测噪声为

且存在

服从高斯分布

I为单位阵；0为零矩阵。

在模型变换后，根据当前时刻的模型参数，利用卡尔曼滤波算法对扩展动态隐变量z的后验分布进行精准估计，其主要公式为：

其中，

表示利用k-1时刻的预测信息对k时刻的扩展动态隐变量的期望进行估计，

表示利用k-1时刻的预测信息对k时刻扩展动态隐变量的协方差进行估计，

为k-1时刻的扩展动态隐变量的最优期望预测信息，

为k-1时刻的最优协方差预测信息，K_k表示卡尔曼增益，

为k时刻的扩展动态隐变量期望的预测修正值，

为对应的协方差预测修正值。

在M步，可根据E步的结果进行模型参数{A,B，C，Γ,Φ，Ω，μ_L，Σ_L}的更新：

其中，E()表示求解期望的运算；

表示对k时刻的标签系数ψ_k进行取反运算；y′(k)表示与x时序对齐后的已标准化的关键质量样本集，缺失部分由于并不参与运算而置零处理，故其样本总长度和x一致。因此训练集由少量有标签数据和大量无标签数据混合构成，通过k-1时刻标签系数ψ_k所提供的数据结构变换信号，模型可自动获取相应的有标签和无标签样本的扩展动态隐变量的二阶矩信息

和

而根据之前提到过的k时刻动态隐变量t(k)和扩展动态隐变量z(k)的关系式，可获得无标签和有标签的动态隐变量估计值

和

然后可求得相应的有标签和无标签的动态隐变量的二阶矩信息

和

以及中间变量

其中k-1时刻扩展潜隐变量的估计值

也可通过卡尔曼滤波直接获取。

构建模型过程中，计算新模型参数所求得的极大似然值与其原模型参数对应的极大似然值相比较，如果满足设定阈值，则模型构建完毕，进入步骤(4)，否则，继续构建模型。例如，利用EM算法继续进行迭代更新，而在每次进行E步(或者M步)后，利用新模型参数所求得的极大似然值L_new与其原模型参数对应的极大似然值L_old相比较，如果||L_new-L_old||²＜ε，则模型训练终止并进入到步骤(4)，否则，将继续按照步骤(3)中的EM算法策略继续迭代更新模型参数。其中，ε为模型收敛的阈值，模型完整对数极大似然估计Θ如下：

其中，Θ表示对数极大似然函数值，constant表示任意常数，

表示对当前时刻的标签系数取反，

和

分别表示k时刻有标签和无标签样本对应的动态隐变量的期望；p()表示求解概率密度，通过有标签数据对应的隐变量

可估计质量变量y′，即

而通过有标签数据和无标签数据对应的动态隐变量

和

可估计过程变量x，即

p(t_k|z_k-1)表示求解k时刻动态隐变量t_k关于k-1时刻扩展动态隐变量z_k-1的条件概率密度函数，其他概率密度函数求解的含义以此类推；

表示对扩展动态隐变量初值z_L的协方差求逆。

步骤(4)中，根据所建立的半监督动态隐变量模型估计的训练样本隐变量期望值t，以及模型预测误差

构建相应的T²、SPE_x、SPE_y统计量及其控制限；

模型收敛后，利用第三步中的卡尔曼滤波算法再次估计动态隐变量的期望值

z与t的关系为z(k)＝[t(k) t(k-1) ... t(k-L+1)]。然后基于每个正常的样本，可构建正常工况下k时刻的T²统计量：

其中，

为表示用k时刻信息对k时刻动态隐变量的估计值，下标中前一个k表示时刻数，后一个k表示“k时刻信息”这个条件；同理，

为用k-1时刻信息对k时刻动态隐变量的估计值；

为用k-1时刻信息对k-1时刻扩展动态隐变量的估计值；训练样本的动态隐变量的预测方差

同时，T²统计量的控制限是模型基于训练样本所得到的固有属性，可由卡方分布估计如下：

其中，D为隐变量的维度，χ²()为求卡方分布，α为卡方分布的自由度。

基于模型对x和y的预测误差，还可分别构建SPE_k,x和SPE_k,y统计量以反映模型残差空间的变化：

其中，x_k为k时刻过程数据标准化后的真实值；

为模型对k时刻过程数据的估计值；x_k的预测方差

其中，y_k为k时刻质量数据标准化后的真实值；

为模型对k时刻质量数据的估计值；y_k的预测方差

Σ_k-1|k-1指

同时，SPE统计量的控制限估计如下：

gh＝mean(SPE)

2g²h＝var(SPE)

其中，mean()为求均值，var()为求方差，g和h分别为卡方分布的系数和自由度；通过式(26)可以求得g和h，进而可分别求得两个SPE统计量控制限SPE_x,lim,SPE_y,lim。

步骤(5)中，在线收集造纸废水处理中的过程变量新数据，并获取同一段时间内化验获取的关键质量数据，形成测试样本集并进行标准化，其样本数量分别为K′和H′，且H′＜K′：

X^test∈R^K′×M,X＝{x^test(1)；x^test(2)；...；x^test(K')}

Y^test∈R^H′×N,Y＝{y^test(1)；y^test(2)；...；y^test(H')}

步骤(6)中，采用半监督动态隐变量模型对测试集进行检测，计算测试样本的

和SPE_test统计量。首先，利用卡尔曼滤波算法估计测试样本扩展动态隐变量的后验分布，然后利用测试样本k-1时刻和k时刻信息对k时刻动态隐变量的期望估计残差

可构建测试样本的T²统计量如下：

其中，测试样本动态隐变量的预测方差

其次，基于模型的预测误差，可构建测试样本的SPE统计量如下：

其中，x^test的预测方差

其中，y^test的预测方差

最后，判断测试样本统计量是否超过步骤(4)得到的控制限，从而得出造纸废水处理过程的在线故障检测结果：若超过相应的控制限，则判断为发生故障，否则认为生产过程正常。

作为优选，本发明中所述化工过程为造纸废水处理过程。

本发明的有益效果体现在：

本发明是一种基于半监督自回归动态隐变量模型的故障检测方法。在实际化工过程中，考虑到实际的过程检测成本，关键质量变量往往无法像大多过程变量一样实现高速采样，而是需要借助精确的化验手段进行低采样获取。这就导致过程变量采样速率快但精度不高，而关键质量变量拥有较高的精度但样本数稀少，形成了鲜明的采样差异和时序上的数据缺失问题，而基于数据的过程监控方法往往对采样率的一致性有严格的要求，需要下采样或上采样方法对缺失数据集进行预处理，导致了原有数据集有用信息的损失和动态性的破坏。而本发明基于半监督学习的方法对缺失数据集进行合理标记，可通过过程变量和关键质量变量之间的相对采样间隔比，自动对仅存在过程变量的无标签样本和同时存在过程变量与关键质量变量的有标签样本进行识别，并切换合适的卡尔曼滤波处理方法进行多阶动态潜隐特征提取，以及后续的模型参数更新。这种半监督的方法完整利用了实际采样的数据，而无需上采样和下采样的预处理，保证了数据集特性在模型建立过程中的完整性；模型公式基于贝叶斯公式和对数极大似然法进行推导，同时在EM算法框架下实现闭环迭代，保证了模型参数更新的科学合理；为进一步判别故障检测的精度，模型基于动态潜隐变量的期望估计残差构建

统计量，同时基于过程变量x和关键质量变量y的预测残差分别构建SPE_k,x和SPE_k,y统计量，实现了基于残差的动态监控和不同类别的观测变量监控，对于动态噪声或单纯由某一种观测变量突变引起的故障具有较好的检测效果。

具体实施方式

以造纸废水处理过程为例，对本发明做进一步说明：

一种基于半监督自回归动态隐变量模型的故障检测方法，该方法针对造纸废水处理过程中过程数据和关键质量数据无法在时序上一一对应的数据缺失问题，首先利用集散控制系统收集正常工况下高采样的过程数据，同时正常工作状态下低采样的关键质量数据也由化验手段获取，按时序排列后生成的训练样本集包含过程数据和关键质量数据同时存在的有标签样本，以及只有过程数据而缺少该时刻所对应的关键质量数据的无标签样本，此处的关键质量数据可视为所建立的半监督模型中的数据标签，进而构建半监督自回归动态隐变量模型。该模型的结构参数可通过EM算法迭代训练获取，同时还可求得用于故障检测的T²和SPE统计量的控制限。在此基础上，通过对在线造纸废水处理过程进行采样以及利用化验手段获取关键质量数据，可得到半监督模型测试样本集，然后利用训练生成的模型对测试样本集进行检测，分别计算每个样本所对应的T²和SPE统计量，并与之前所获取的统计量控制限进行比较，从而达到故障检测的效果。

本发明是一种基于半监督自回归动态隐变量模型的故障检测方法，包括以下步骤：

第一步：利用集散控制系统收集正常工况下高采样率的过程数据，同时利用化验手段获取正常工况下低采样率的关键质量数据，由此组成建模所需要的训练样本集。假设在同一段时间内采集到大量正常过程数据的样本数为K，而通过化验手段获取的相对采样间隔比为S(S>1)(质量变量相对于过程变量的相对采样间隔比)的少量正常关键质量数据的样本数为H，且H＝K/S：

其中，R表示实数集；M为过程变量样本的变量数，N为关键质量样本的变量数；

第二步：对数据集X和Y分别进行预处理和标准化，即每个样本集中的元素先减去其所属变量的样本平均值，然后再除以该变量的样本标准差，使得各个过程变量和关键质量变量所对应的数据均值为零，方差为1，并将标准化后的数据按时序对齐后保存以备调用，其中缺失的Y由于不参与后续模型训练，此处均设置为0，则可使X和Y在时序对齐后样本数相同。

构建半监督自回归动态隐变量模型，假设步骤二得到的数据集满足如下关系式：

其中，t(k)∈R^D为k时刻该模型的动态隐变量，D代表动态隐变量的维度，它利用k-1时刻扩展动态隐变量z(k-1)＝[t_k-1 ^T t_k-2 ^T ... t_k-L ^T]^T∈R^DL进行更新，L表示滞后时间。在所提出的半监督自回归动态隐变量模型中，有标签的动态隐变量t由X和Y共同决定，无标签的动态隐变量t仅由X决定，且后续隐变量的卡尔曼估计和模型参数更新环节也会按照这种半监督的思路进行相应的处理。为简化表示，此处将有标签的样本记为{x_a,y_a}，无标签的样本记为{x_b}，下标中的a表示有标签数据，b表示无标签数据；除此之外，A为模型的动态转移矩阵，w为方差为Γ的动态噪声，且存在w服从高斯分布N(0,Γ)；B和C分别为模型的过程观测矩阵和质量观测矩阵，u和v分别为方差为Φ的过程观测噪声和方差为Ω的质量观测噪声，且存在u服从高斯分布N(0,Φ)，v服从高斯分布N(0,Ω)；x(k)和y(k)分别为标准化后的k时刻对应的过程样本和质量样本。

同时，为解决过程数据和关键质量数据无法在时序上一一对应的数据缺失问题，模型中引入了标签系数ψ_k，其表现形式如下所示：

其中，ψ_k的整体取值取决于质量数据集Y的相对采样间隔比S，则ψ_k的集合Ψ的结构如下：

ψ＝{ψ_k}_k＝1:K＝{ψ_ns+1＝1}_{n＝0:(K/s-1)} (4)

上式对标签集合Ψ和相对采样间隔比s之间的关系进行归纳。其中第一个等式表示标签集合Ψ内是由取值为1或者0的不同时刻对应的标签系数ψ_k组成的，而第二个等式就将时刻数k和相对采样间隔比s的关系具体化，归纳了标签集合Ψ内元素取值为1的分布情况。

第三步：利用期望最大化(EM)算法实现模型的闭环迭代以及初始化的模型参数进行首轮训练。在E步，结合当前模型参数以及ψ_k的取值，利用卡尔曼滤波算法对扩展动态隐变量的后验分布进行合理估计；在M步中，则借助最大化似然函数的方法对模型参数进行更新。

其中，

为变换后的动态转移矩阵，

为变换后的动态噪声，且存在

服从高斯分布

γ(k)表示变换后的过程样本和质量样本的整体观测矩阵，其相应变换后的观测矩阵为Ξ，变换后的观测噪声为

且存在

服从高斯分布

I为单位阵；0为零矩阵。

其中，

为k-1时刻扩展动态隐变量的最优期望预测信息，

为k-1时刻的最优协方差预测信息，K_k表示卡尔曼增益，

为k时刻的扩展动态隐变量期望的预测修正值，

为对应的协方差预测修正值。

其中，

分别为A、B、C、Γ、Φ、Ω、μ_L、Σ_L对应的更新值；E()表示求解期望的运算；

表示对k时刻的标签系数ψ_k进行取反运算；y′(k)表示与x时序对齐后的已标准化的k时刻对应的关键质量样本集，缺失部分由于并不参与运算而置零处理，故其样本总长度和x一致。因此训练集由少量有标签数据和大量无标签数据混合构成，通过k-1时刻标签系数ψ_k所提供的数据结构变换信号，模型可自动获取相应的有标签和无标签样本的扩展动态隐变量的二阶矩信息

和

其中，

为k-1时刻扩展潜隐变量的估计值；而根据之前提到过的k时刻动态隐变量t(k)和扩展动态隐变量z(k)的关系式，可获得无标签和有标签的动态隐变量估计值

和

和

以及中间变量

其中k-1时刻扩展潜隐变量的估计值

也可通过卡尔曼滤波直接获取，同时

为k时刻动态隐变量的估计值，可由k时刻扩展潜隐变量的估计值

求得。

为扩展动态隐变量初值，

为扩展动态隐变量初值

所对应的二阶矩信息初值。

第四步：利用EM算法继续进行迭代更新，而在每次进行E步后，利用新模型参数所求得的极大似然函数值L_new与其原模型参数对应的极大似然函数值L_old相比较，如果||L_new-L_old||²＜ε，则模型训练终止并进入到第五步，否则，将继续按照第三步中的EM算法策略继续迭代更新模型参数。其中，ε为模型收敛的阈值，模型完整对数极大似然估计如下：

其中，Θ表示极大似然函数值，constant表示任意常数，

表示对当前时刻的标签系数取反，t_k(即t(k))为k时刻的动态隐变量，z_k-1(即z(k-1))为k-1时刻的扩展动态隐变量，

和

分别表示k时刻有标签和无标签样本对应的动态隐变量；p()表示求解概率密度，p(z_L)为扩展动态隐变量初值的概率密度函数，通过有标签数据对应的动态隐变量

可估计质量变量y′，即

而通过有标签数据和无标签数据对应的动态隐变量

和

可估计过程变量x，即

表示对扩展动态隐变量初值z_L的协方差求逆。

第五步：根据所建立的半监督动态隐变量模型估计的训练样本隐变量期望值

以及模型预测误差

构建相应的T²、SPE_x、SPE_y统计量及其控制限；

其中，

为用k-1时刻信息对k时刻动态隐变量的估计值；

其中，x_k为k时刻过程数据标准化后的真实值；

为模型对k时刻过程数据的估计值；x_k的预测方差

其中，y_k为k时刻质量数据标准化后的真实值；

为模型对k时刻质量数据的估计值；y_k的预测方差

Σ_k-1|k-1为k-1时刻的最优协方差预测信息；

同时，SPE统计量的控制限估计如下：

第六步：在线收集造纸废水处理中的过程变量新数据，并获取同一段时间内化验获取的关键质量数据，形成测试样本集并进行标准化，其样本数量分别为K′和H′，且H′＜K′：

X^test∈R^K′×M,X＝{x^test(1)；x^test(2)；...；x^test(K')}

Y^test∈R^H′×N,Y＝{y^test(1)；y^test(2)；...；y^test(H')}

第七步：采用半监督动态隐变量模型对测试集进行检测，计算测试样本的

可构建测试样本的T²统计量如下：

其中，测试样本动态隐变量的预测方差

其中，x^test的预测方差

其中，y^test的预测方差

上述公式中字母的下标test表示检测样本，与模型训练时的训练样本相区别，其含义可参考模型训练时对应字母的定义。

最后，判断测试样本统计量是否超过步骤五得到的控制限，从而得出造纸废水处理过程的在线故障检测结果：若超过相应的控制限，则判断为发生故障，否则认为生产过程正常。