CN111142501A - 基于半监督自回归动态隐变量模型的故障检测方法 - Google Patents
基于半监督自回归动态隐变量模型的故障检测方法 Download PDFInfo
- Publication number
- CN111142501A CN111142501A CN201911377117.0A CN201911377117A CN111142501A CN 111142501 A CN111142501 A CN 111142501A CN 201911377117 A CN201911377117 A CN 201911377117A CN 111142501 A CN111142501 A CN 111142501A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- variable
- supervised
- semi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0243—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/20—Pc systems
- G05B2219/24—Pc safety
- G05B2219/24065—Real time diagnostics
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于半监督自回归动态隐变量模型的故障检测方法,该方法首先收集正常工况下高采样的过程数据和关键质量数据,按时序排列后生成的训练样本集包含过程数据和关键质量数据同时存在的有标签样本,以及只有过程数据而缺少该时刻所对应的关键质量数据的无标签样本;同时求得用于故障检测的T2和SPE统计量的控制限。通过对在线造纸废水处理过程进行采样以及利用化验手段获取关键质量数据,可得到半监督模型测试样本集,然后利用训练生成的模型对测试样本集进行检测,分别计算每个样本所对应的T2和SPE统计量,并与之前所获取的统计量控制限进行比较,从而达到故障检测的效果。
Description
技术领域
本发明设计一种控制方法,具体是涉及一种基于半监督自回归动态隐变量模型的故障检测方法。
背景技术
随着工业复杂度和规模的提升,现代工业对于生产安全和产品质量提出了更高的要求。而由于工业生产的复杂化,基于模型的传统故障检测方法将面临成本和建模难度的挑战。不过随着集散控制系统等过程控制技术的广泛应用,海量的数据得以快速收集,为基于数据的故障检测方法提供了良好的技术基础。基于数据的故障检测方法借助多元统计分析的各种方法,使采集到的高维数据实现降维和特征提取,在制药、废水处理以及石化等行业领域得到了较好的应用。而随着模型研究和实际生产工况的结合,模型改进的热点也从传统的主成分分析(PCA)和偏最小二乘估计(PLS)等静态模型转移到动态PCA(DPCA)等动态模型上。然而,由于受到检测成本和化验难度的限制,与产品质量以及过程安全相关的关键质量数据往往具有低采样的特性,造成了过程样本和关键质量样本在时序无法做到一一对应,可视为特殊的数据缺失问题。基于这一问题,半监督概率隐变量回归(SSPLVR)模型借助半监督的思想和数据时序调整的策略能够有效解决这种采样时序差异问题,但由于数据时序在预处理阶段的调整破坏了原有的动态结构,导致模型在训练时无法对动态特性进行有效监控,而在动态建模研究方面,自回归动态隐变量(ARDLV)模型在期望最大化(EM)算法的概率框架下借助扩展的动态隐变量可以实现对多阶动态特性的监测,同时兼顾了模型的互相关性,在故障检测效果上有不错的表现,但它对数据的完整性有一定的要求,无法直接处理这类特殊的数据缺失问题。因此,需要提出一种既能充分考虑到数据动态特性,又能完整利用这类特殊缺失数据信息的故障检测技术。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于半监督自回归动态隐变量模型的故障检测方法。
本发明基于正常工况下化工过程中采集到的完整过程数据和少量的关键质量检测数据为建模样本,模型能够利用扩展的隐变量以及卡尔曼滤波算法对数据的多阶动态特性进行提取,同时通过低维的动态隐变量实现对数据互相关性的提取,整个模型实现通过EM算法建立闭环的迭代结构,并设置极大似然函数来决定模型训练的终止。另一方面,为了解决过程数据和关键质量数据在时序结构上的缺失问题,模型引入半监督的思路,将整个数据集视为一个有标签数据和无标签数据的整体,通过监控关键质量检测数据的采样状态变化实现模型训练策略的合理切换,从而能够直接利用这种特殊的缺失数据进行模型训练,并在故障检测的精度上实现提升。
一种基于半监督自回归动态隐变量模型的故障检测方法,包括如下步骤:
(1)收集化工过程正常工况下高采样率的过程变量数据以及正常工况下低采样率的关键质量数据,获取建模所需要的训练样本集;
(2)对步骤(1)获得的数据进行标准化,并将标准化后的数据按时序对齐;
(3)基于获得的数据集,构建半监督自回归动态隐变量模型;构建模型过程中,根据同时刻关键质量数据是否被采集,对步骤(2)得到的数据集进行分类,基于分类后的数据集构建所述的模型;
(4)基于得到的半监督自回归动态隐变量模型,求取该模型对应的T2、SPEx、SPEy的控制限SPEx,lim、SPEy,lim,其中SPEx,lim、SPEy,lim分别为高采样的过程变量数据、低采样的关键质量数据对应的控制限;
(5)在线收集化工过程的过程变量数据和关键质量数据,进行标准化处理,得到测试样本;
步骤(1)或者步骤(5)中,利用集散控制系统收集正常工况下高采样的过程变量数据,利用化验手段获取正常工况下低采样的关键质量数据。
其中,K为正常过程变量数据的样本数;M为过程样本的变量数,H为正常关键质量数据的样本数;R表示实数集;其中,1,2,3,…,K或者1,2,3,…,H为按照时序得到的样本标记,比如x(K)为按照时序得到的第K个过程变量数据样本;比如y(H)为按照时序得到的第H个关键质量数据样本;X为正常过程变量数据样本组成的数据集,Y为正常关键质量数据组成的数据集。
本发明步骤(2)中,对数据集X和Y分别进行预处理或者标准化,标准化操作为:样本集中的每个元素先减去其所属变量的样本平均值,然后再除以该变量的样本标准差,使得各个过程变量和关键质量变量所对应的数据均值为零,方差为1,并将标准化后的数据按时序对齐后保存以备调用。
本发明步骤(3)中,为便于实现对未被采集到关键质量数据的时刻对应的过程变量数据进行模型训练,根据同时刻关键质量数据是否被采集,将步骤(2)得到的数据集进行分类,得到同时包含关键质量变量和过程变量数据的样本集,以及仅包含过程变量数据的样本集,模型训练时将根据标签自动识别当前数据的样本集归属,进而切换合适的处理方法并建模。
对数据集进行分类可以采用各种方法,作为一种优选的方案,建模时,由于过程变量和关键质量变量的采样率差异,实际采集得到的各变量数据按时序对齐后将得到缺失数据集,即原始得到的数据集由于关键质量采样慢,样本数少,所以和过程变量时序对齐后得到的数据集就会显得关键质量变量有很多缺失。现有的方法都要求过程变量和质量变量的采样率是一致的,无法直接利用这种缺失数据进行处理。本发明中,这里将预处理后数据进行时序对齐后,将空缺位置补0,形成一个“伪完整数据集”,模型的训练算法会自动判别从而采用合适的方法提取当前的实际数据中的潜在公共信息,而这些0在好司机训练过程中其实并不会参与运算,真正参与运算的是那些真实采到的数据,也就是说这里没用到上采样或下采样的预处理方法。
因此针对步骤(2)得到的数据集,首先进行空缺数据的填补(比如值为0),以得到完整数据集;
针对得到的完整数据集,构建对应的标签矩阵:
对于同时刻有采集到关键质量变量的数据样本,其对应的标签元素为1;
对于同时刻没有采集关键质量变量的数据样本,其对应的标签元素为0;
建模过程中,利用得到的标签矩阵作用于所述的完整数据集,得到同时包含关键质量变量和过程变量数据的样本集,以及仅包含过程变量数据的样本集,基于得到的两个数据集完成模型的构建。
具体讲,为解决过程数据和关键质量数据无法在时序上一一对应的数据缺失问题,模型中引入了标签系数ψk,其表现形式如下所示:
其中,ψk的整体取值取决于质量数据集Y的相对采样间隔比S,则ψk的集合Ψ的结构如下:ψ={ψk}k=1:K={ψns+1=1}n=0:(K/s-1)
上式对标签集合Ψ和相对采样间隔比s之间的关系进行归纳。其中第一个等式表示标签集合Ψ内是由取值为1或者0的不同时刻对应的标签系数ψk组成的,而第二个等式就将时刻数k和关键质量变量的相对采样间隔比s的关系具体化,归纳了标签集合Ψ内元素取值为1的分布情况,即:
利用结构完整的数据集,构建半监督自回归动态隐变量模型,假设所述数据集满足如下关系式:
其中,t(k)∈RD为k时刻该模型的动态隐变量,D代表动态隐变量的维度,它利用k-1时刻扩展动态隐变量z(k-1)=[tk-1 T tk-2 T ... tk-L T]T∈RDL进行更新,L表示滞后时间。在所提出的半监督自回归动态隐变量模型中,有标签(标签数值为1)的动态隐变量t由X和Y共同决定,无标签(标签值为0)的动态隐变量t仅由X决定,且后续隐变量的卡尔曼估计和模型参数更新环节也会按照这种半监督的思路进行相应的处理。为简化表示,此处将有标签的样本记为{xa,ya},无标签的样本记为{xb},下标中的a表示有标签数据,b表示无标签数据;除此之外,A为模型的动态转移矩阵,w为方差为Γ的动态噪声,且存在w服从高斯分布N(0,Γ);B和C分别为模型的过程观测矩阵和质量观测矩阵,u和v分别为方差为Φ的过程观测噪声和方差为Ω的质量观测噪声,且存在u服从高斯分布N(0,Φ),v服从高斯分布N(0,Ω);x(k)和y(k)分别为标准化后的k时刻对应的过程样本和质量样本。
本发明步骤(3)中,利用期望最大化算法构建模型,即利用期望最大化(EM)算法实现模型的闭环迭代以及初始化的模型参数进行首轮训练。在E步,结合当前模型参数以及标签元素ψk的取值,利用卡尔曼滤波算法对扩展动态隐变量的后验分布进行合理估计;在M步中,则借助最大化似然函数的方法对模型参数进行更新。
在E步中,首先,对模型参数{A,B,C,Γ,Φ,Ω,μL,ΣL}随机初始化;由于卡尔曼模型和半监督自回归动态隐变量模型的输入数据结构上的差异,需在进行卡尔曼算法估计扩展动态隐变量的后验分布前对模型参数结构作出适当变换,其变换结果如下:
其中,z(k)=[t(k) t(k-1) ... t(k-L+1)]∈RDL×1,L为滞后时间,也表示动态隐变量所包含的历史动态信息的数量,其初值为且zL服从期望μL,方差为VL的高斯分布N(μL,VL)。其他模型参数的变换如下所示:
其中,为变换后的动态转移矩阵,为变换后的动态噪声,且存在服从高斯分布γ(k)表示变换后的过程变量样本和质量样本的整体观测矩阵,其相应变换后的观测矩阵为Ξ,变换后的观测噪声为且存在服从高斯分布I为单位阵;0为零矩阵。
在模型变换后,根据当前时刻的模型参数,利用卡尔曼滤波算法对扩展动态隐变量z的后验分布进行精准估计,其主要公式为:
其中,表示利用k-1时刻的预测信息对k时刻的扩展动态隐变量的期望进行估计,表示利用k-1时刻的预测信息对k时刻扩展动态隐变量的协方差进行估计,为k-1时刻的扩展动态隐变量的最优期望预测信息,为k-1时刻的最优协方差预测信息,Kk表示卡尔曼增益,为k时刻的扩展动态隐变量期望的预测修正值,为对应的协方差预测修正值。
在M步,可根据E步的结果进行模型参数{A,B,C,Γ,Φ,Ω,μL,ΣL}的更新:
其中,E()表示求解期望的运算;表示对k时刻的标签系数ψk进行取反运算;y′(k)表示与x时序对齐后的已标准化的关键质量样本集,缺失部分由于并不参与运算而置零处理,故其样本总长度和x一致。因此训练集由少量有标签数据和大量无标签数据混合构成,通过k-1时刻标签系数ψk所提供的数据结构变换信号,模型可自动获取相应的有标签和无标签样本的扩展动态隐变量的二阶矩信息和而根据之前提到过的k时刻动态隐变量t(k)和扩展动态隐变量z(k)的关系式,可获得无标签和有标签的动态隐变量估计值和然后可求得相应的有标签和无标签的动态隐变量的二阶矩信息和以及中间变量其中k-1时刻扩展潜隐变量的估计值也可通过卡尔曼滤波直接获取。
构建模型过程中,计算新模型参数所求得的极大似然值与其原模型参数对应的极大似然值相比较,如果满足设定阈值,则模型构建完毕,进入步骤(4),否则,继续构建模型。例如,利用EM算法继续进行迭代更新,而在每次进行E步(或者M步)后,利用新模型参数所求得的极大似然值Lnew与其原模型参数对应的极大似然值Lold相比较,如果||Lnew-Lold||2<ε,则模型训练终止并进入到步骤(4),否则,将继续按照步骤(3)中的EM算法策略继续迭代更新模型参数。其中,ε为模型收敛的阈值,模型完整对数极大似然估计Θ如下:
其中,Θ表示对数极大似然函数值,constant表示任意常数,表示对当前时刻的标签系数取反,和分别表示k时刻有标签和无标签样本对应的动态隐变量的期望;p()表示求解概率密度,通过有标签数据对应的隐变量可估计质量变量y′,即而通过有标签数据和无标签数据对应的动态隐变量和可估计过程变量x,即p(tk|zk-1)表示求解k时刻动态隐变量tk关于k-1时刻扩展动态隐变量zk-1的条件概率密度函数,其他概率密度函数求解的含义以此类推;表示对扩展动态隐变量初值zL的协方差求逆。
模型收敛后,利用第三步中的卡尔曼滤波算法再次估计动态隐变量的期望值z与t的关系为z(k)=[t(k) t(k-1) ... t(k-L+1)]。然后基于每个正常的样本,可构建正常工况下k时刻的T2统计量:
其中,为表示用k时刻信息对k时刻动态隐变量的估计值,下标中前一个k表示时刻数,后一个k表示“k时刻信息”这个条件;同理,为用k-1时刻信息对k时刻动态隐变量的估计值;为用k-1时刻信息对k-1时刻扩展动态隐变量的估计值;训练样本的动态隐变量的预测方差
同时,T2统计量的控制限是模型基于训练样本所得到的固有属性,可由卡方分布估计如下:
其中,D为隐变量的维度,χ2()为求卡方分布,α为卡方分布的自由度。
基于模型对x和y的预测误差,还可分别构建SPEk,x和SPEk,y统计量以反映模型残差空间的变化:
同时,SPE统计量的控制限估计如下:
gh=mean(SPE)
2g2h=var(SPE)
其中,mean()为求均值,var()为求方差,g和h分别为卡方分布的系数和自由度;通过式(26)可以求得g和h,进而可分别求得两个SPE统计量控制限SPEx,lim,SPEy,lim。
步骤(5)中,在线收集造纸废水处理中的过程变量新数据,并获取同一段时间内化验获取的关键质量数据,形成测试样本集并进行标准化,其样本数量分别为K′和H′,且H′<K′:
Xtest∈RK′×M,X={xtest(1);xtest(2);...;xtest(K')}
Ytest∈RH′×N,Y={ytest(1);ytest(2);...;ytest(H')}
步骤(6)中,采用半监督动态隐变量模型对测试集进行检测,计算测试样本的和SPEtest统计量。首先,利用卡尔曼滤波算法估计测试样本扩展动态隐变量的后验分布,然后利用测试样本k-1时刻和k时刻信息对k时刻动态隐变量的期望估计残差可构建测试样本的T2统计量如下:
其次,基于模型的预测误差,可构建测试样本的SPE统计量如下:
最后,判断测试样本统计量是否超过步骤(4)得到的控制限,从而得出造纸废水处理过程的在线故障检测结果:若超过相应的控制限,则判断为发生故障,否则认为生产过程正常。
作为优选,本发明中所述化工过程为造纸废水处理过程。
本发明的有益效果体现在:
本发明是一种基于半监督自回归动态隐变量模型的故障检测方法。在实际化工过程中,考虑到实际的过程检测成本,关键质量变量往往无法像大多过程变量一样实现高速采样,而是需要借助精确的化验手段进行低采样获取。这就导致过程变量采样速率快但精度不高,而关键质量变量拥有较高的精度但样本数稀少,形成了鲜明的采样差异和时序上的数据缺失问题,而基于数据的过程监控方法往往对采样率的一致性有严格的要求,需要下采样或上采样方法对缺失数据集进行预处理,导致了原有数据集有用信息的损失和动态性的破坏。而本发明基于半监督学习的方法对缺失数据集进行合理标记,可通过过程变量和关键质量变量之间的相对采样间隔比,自动对仅存在过程变量的无标签样本和同时存在过程变量与关键质量变量的有标签样本进行识别,并切换合适的卡尔曼滤波处理方法进行多阶动态潜隐特征提取,以及后续的模型参数更新。这种半监督的方法完整利用了实际采样的数据,而无需上采样和下采样的预处理,保证了数据集特性在模型建立过程中的完整性;模型公式基于贝叶斯公式和对数极大似然法进行推导,同时在EM算法框架下实现闭环迭代,保证了模型参数更新的科学合理;为进一步判别故障检测的精度,模型基于动态潜隐变量的期望估计残差构建统计量,同时基于过程变量x和关键质量变量y的预测残差分别构建SPEk,x和SPEk,y统计量,实现了基于残差的动态监控和不同类别的观测变量监控,对于动态噪声或单纯由某一种观测变量突变引起的故障具有较好的检测效果。
具体实施方式
以造纸废水处理过程为例,对本发明做进一步说明:
一种基于半监督自回归动态隐变量模型的故障检测方法,该方法针对造纸废水处理过程中过程数据和关键质量数据无法在时序上一一对应的数据缺失问题,首先利用集散控制系统收集正常工况下高采样的过程数据,同时正常工作状态下低采样的关键质量数据也由化验手段获取,按时序排列后生成的训练样本集包含过程数据和关键质量数据同时存在的有标签样本,以及只有过程数据而缺少该时刻所对应的关键质量数据的无标签样本,此处的关键质量数据可视为所建立的半监督模型中的数据标签,进而构建半监督自回归动态隐变量模型。该模型的结构参数可通过EM算法迭代训练获取,同时还可求得用于故障检测的T2和SPE统计量的控制限。在此基础上,通过对在线造纸废水处理过程进行采样以及利用化验手段获取关键质量数据,可得到半监督模型测试样本集,然后利用训练生成的模型对测试样本集进行检测,分别计算每个样本所对应的T2和SPE统计量,并与之前所获取的统计量控制限进行比较,从而达到故障检测的效果。
本发明是一种基于半监督自回归动态隐变量模型的故障检测方法,包括以下步骤:
第一步:利用集散控制系统收集正常工况下高采样率的过程数据,同时利用化验手段获取正常工况下低采样率的关键质量数据,由此组成建模所需要的训练样本集。假设在同一段时间内采集到大量正常过程数据的样本数为K,而通过化验手段获取的相对采样间隔比为S(S>1)(质量变量相对于过程变量的相对采样间隔比)的少量正常关键质量数据的样本数为H,且H=K/S:
其中,R表示实数集;M为过程变量样本的变量数,N为关键质量样本的变量数;
第二步:对数据集X和Y分别进行预处理和标准化,即每个样本集中的元素先减去其所属变量的样本平均值,然后再除以该变量的样本标准差,使得各个过程变量和关键质量变量所对应的数据均值为零,方差为1,并将标准化后的数据按时序对齐后保存以备调用,其中缺失的Y由于不参与后续模型训练,此处均设置为0,则可使X和Y在时序对齐后样本数相同。
构建半监督自回归动态隐变量模型,假设步骤二得到的数据集满足如下关系式:
其中,t(k)∈RD为k时刻该模型的动态隐变量,D代表动态隐变量的维度,它利用k-1时刻扩展动态隐变量z(k-1)=[tk-1 T tk-2 T ... tk-L T]T∈RDL进行更新,L表示滞后时间。在所提出的半监督自回归动态隐变量模型中,有标签的动态隐变量t由X和Y共同决定,无标签的动态隐变量t仅由X决定,且后续隐变量的卡尔曼估计和模型参数更新环节也会按照这种半监督的思路进行相应的处理。为简化表示,此处将有标签的样本记为{xa,ya},无标签的样本记为{xb},下标中的a表示有标签数据,b表示无标签数据;除此之外,A为模型的动态转移矩阵,w为方差为Γ的动态噪声,且存在w服从高斯分布N(0,Γ);B和C分别为模型的过程观测矩阵和质量观测矩阵,u和v分别为方差为Φ的过程观测噪声和方差为Ω的质量观测噪声,且存在u服从高斯分布N(0,Φ),v服从高斯分布N(0,Ω);x(k)和y(k)分别为标准化后的k时刻对应的过程样本和质量样本。
同时,为解决过程数据和关键质量数据无法在时序上一一对应的数据缺失问题,模型中引入了标签系数ψk,其表现形式如下所示:
其中,ψk的整体取值取决于质量数据集Y的相对采样间隔比S,则ψk的集合Ψ的结构如下:
ψ={ψk}k=1:K={ψns+1=1}n=0:(K/s-1) (4)
上式对标签集合Ψ和相对采样间隔比s之间的关系进行归纳。其中第一个等式表示标签集合Ψ内是由取值为1或者0的不同时刻对应的标签系数ψk组成的,而第二个等式就将时刻数k和相对采样间隔比s的关系具体化,归纳了标签集合Ψ内元素取值为1的分布情况。
第三步:利用期望最大化(EM)算法实现模型的闭环迭代以及初始化的模型参数进行首轮训练。在E步,结合当前模型参数以及ψk的取值,利用卡尔曼滤波算法对扩展动态隐变量的后验分布进行合理估计;在M步中,则借助最大化似然函数的方法对模型参数进行更新。
在E步中,首先,对模型参数{A,B,C,Γ,Φ,Ω,μL,ΣL}随机初始化;由于卡尔曼模型和半监督自回归动态隐变量模型的输入数据结构上的差异,需在进行卡尔曼算法估计扩展动态隐变量的后验分布前对模型参数结构作出适当变换,其变换结果如下:
其中,z(k)=[t(k) t(k-1) ... t(k-L+1)]∈RDL×1,L为滞后时间,也表示动态隐变量所包含的历史动态信息的数量,其初值为且zL服从期望μL,方差为VL的高斯分布N(μL,VL)。其他模型参数的变换如下所示:
其中,为变换后的动态转移矩阵,为变换后的动态噪声,且存在服从高斯分布γ(k)表示变换后的过程样本和质量样本的整体观测矩阵,其相应变换后的观测矩阵为Ξ,变换后的观测噪声为且存在服从高斯分布I为单位阵;0为零矩阵。
在模型变换后,根据当前时刻的模型参数,利用卡尔曼滤波算法对扩展动态隐变量z的后验分布进行精准估计,其主要公式为:
其中,表示利用k-1时刻的预测信息对k时刻的扩展动态隐变量的期望进行估计,表示利用k-1时刻的预测信息对k时刻扩展动态隐变量的协方差进行估计,为k-1时刻扩展动态隐变量的最优期望预测信息,为k-1时刻的最优协方差预测信息,Kk表示卡尔曼增益,为k时刻的扩展动态隐变量期望的预测修正值,为对应的协方差预测修正值。
在M步,可根据E步的结果进行模型参数{A,B,C,Γ,Φ,Ω,μL,ΣL}的更新:
其中,分别为A、B、C、Γ、Φ、Ω、μL、ΣL对应的更新值;E()表示求解期望的运算;表示对k时刻的标签系数ψk进行取反运算;y′(k)表示与x时序对齐后的已标准化的k时刻对应的关键质量样本集,缺失部分由于并不参与运算而置零处理,故其样本总长度和x一致。因此训练集由少量有标签数据和大量无标签数据混合构成,通过k-1时刻标签系数ψk所提供的数据结构变换信号,模型可自动获取相应的有标签和无标签样本的扩展动态隐变量的二阶矩信息和其中,为k-1时刻扩展潜隐变量的估计值;而根据之前提到过的k时刻动态隐变量t(k)和扩展动态隐变量z(k)的关系式,可获得无标签和有标签的动态隐变量估计值和然后可求得相应的有标签和无标签的动态隐变量的二阶矩信息和以及中间变量其中k-1时刻扩展潜隐变量的估计值也可通过卡尔曼滤波直接获取,同时为k时刻动态隐变量的估计值,可由k时刻扩展潜隐变量的估计值求得。为扩展动态隐变量初值,为扩展动态隐变量初值所对应的二阶矩信息初值。
第四步:利用EM算法继续进行迭代更新,而在每次进行E步后,利用新模型参数所求得的极大似然函数值Lnew与其原模型参数对应的极大似然函数值Lold相比较,如果||Lnew-Lold||2<ε,则模型训练终止并进入到第五步,否则,将继续按照第三步中的EM算法策略继续迭代更新模型参数。其中,ε为模型收敛的阈值,模型完整对数极大似然估计如下:
其中,Θ表示极大似然函数值,constant表示任意常数,表示对当前时刻的标签系数取反,tk(即t(k))为k时刻的动态隐变量,zk-1(即z(k-1))为k-1时刻的扩展动态隐变量,和分别表示k时刻有标签和无标签样本对应的动态隐变量;p()表示求解概率密度,p(zL)为扩展动态隐变量初值的概率密度函数,通过有标签数据对应的动态隐变量可估计质量变量y′,即而通过有标签数据和无标签数据对应的动态隐变量和可估计过程变量x,即p(tk|zk-1)表示求解k时刻动态隐变量tk关于k-1时刻扩展动态隐变量zk-1的条件概率密度函数,其他概率密度函数求解的含义以此类推;表示对扩展动态隐变量初值zL的协方差求逆。
模型收敛后,利用第三步中的卡尔曼滤波算法再次估计动态隐变量的期望值z与t的关系为z(k)=[t(k) t(k-1) ... t(k-L+1)]。然后基于每个正常的样本,可构建正常工况下k时刻的T2统计量:
其中,为表示用k时刻信息对k时刻动态隐变量的估计值,下标中前一个k表示时刻数,后一个k表示“k时刻信息”这个条件;同理,为用k-1时刻信息对k时刻动态隐变量的估计值;为用k-1时刻信息对k-1时刻扩展动态隐变量的估计值;训练样本的动态隐变量的预测方差
同时,T2统计量的控制限是模型基于训练样本所得到的固有属性,可由卡方分布估计如下:
其中,D为隐变量的维度,χ2()为求卡方分布,α为卡方分布的自由度。
基于模型对x和y的预测误差,还可分别构建SPEk,x和SPEk,y统计量以反映模型残差空间的变化:
Σk-1|k-1为k-1时刻的最优协方差预测信息;
同时,SPE统计量的控制限估计如下:
其中,mean()为求均值,var()为求方差,g和h分别为卡方分布的系数和自由度;通过式(26)可以求得g和h,进而可分别求得两个SPE统计量控制限SPEx,lim,SPEy,lim。
第六步:在线收集造纸废水处理中的过程变量新数据,并获取同一段时间内化验获取的关键质量数据,形成测试样本集并进行标准化,其样本数量分别为K′和H′,且H′<K′:
Xtest∈RK′×M,X={xtest(1);xtest(2);...;xtest(K')}
Ytest∈RH′×N,Y={ytest(1);ytest(2);...;ytest(H')}
第七步:采用半监督动态隐变量模型对测试集进行检测,计算测试样本的和SPEtest统计量。首先,利用卡尔曼滤波算法估计测试样本扩展动态隐变量的后验分布,然后利用测试样本k-1时刻和k时刻信息对k时刻动态隐变量的期望估计残差可构建测试样本的T2统计量如下:
其次,基于模型的预测误差,可构建测试样本的SPE统计量如下:
上述公式中字母的下标test表示检测样本,与模型训练时的训练样本相区别,其含义可参考模型训练时对应字母的定义。
最后,判断测试样本统计量是否超过步骤五得到的控制限,从而得出造纸废水处理过程的在线故障检测结果:若超过相应的控制限,则判断为发生故障,否则认为生产过程正常。
Claims (8)
1.一种基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,包括如下步骤:
(1)收集化工过程正常工况下高采样率的过程变量数据以及正常工况下低采样率的关键质量数据,获取建模所需要的训练样本集;
(2)对步骤(1)获得的数据进行标准化,并将标准化后的数据按时序对齐;
(3)基于获得的数据集,构建半监督自回归动态隐变量模型;构建模型过程中,根据同时刻关键质量数据是否被采集,对步骤(2)得到的过程变量数据进行分类,基于分类后的数据集构建所述的模型;
(4)基于得到的半监督自回归动态隐变量模型,求取该模型对应的T2、SPEx、SPEy控制限SPEx,lim、SPEy,lim,其中SPEx,lim、SPEy,lim分别为高采样的过程变量数据、低采样的关键质量数据对应的控制限;
(5)在线收集化工过程的过程变量数据和关键质量数据,进行标准化处理,得到测试样本;
2.根据权利要求1所述的基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,步骤(1)或者步骤(5)中,利用集散控制系统收集正常工况下高采样的过程变量数据,利用化验手段获取正常工况下低采样的关键质量数据。
3.根据权利要求1所述的基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,步骤(2)中,标准化操作为:样本集中的每个元素先减去其所属变量的样本平均值,然后再除以该变量的样本标准差,使得各个过程变量和关键质量变量所对应的数据均值为零,方差为1。
4.根据权利要求1所述的基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,步骤(3)中,根据同时刻关键质量数据是否被采集,将步骤(2)得到的数据集进行分类,得到同时包含关键质量变量和过程变量数据的样本集,以及仅包含过程变量数据的样本集,利用两个样本集进行建模。
5.根据权利要求4所述的基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,建模时,由于过程变量和关键质量变量的采样率差异,实际采集得到的各变量数据按时序对齐后将得到缺失数据集,因此针对步骤(2)得到的数据集,首先进行空缺数据的填补,以得到完整数据集;
针对得到的完整数据集,构建对应的标签矩阵:
对于同时刻有采集到关键质量变量的数据样本,其对应的标签元素为1;
对于同时刻没有采集关键质量变量的数据样本,其对应的标签元素为0;
建模过程中,利用得到的标签矩阵作用于所述的完整数据集,得到同时包含关键质量变量和过程变量数据的样本集,以及仅包含过程变量数据的样本集,基于得到的两个数据集完成模型的构建。
6.根据权利要求5所述的基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,利用期望最大化算法构建模型,在E步,结合当前模型参数以及标签元素的取值,利用卡尔曼滤波算法对扩展动态隐变量的后验分布进行合理估计;在M步中,则借助最大化似然函数的方法,同时结合标签元素的取值,对模型参数进行更新。
7.根据权利要求6述的基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,构建模型过程中,计算新模型参数所求得的极大似然值与其原模型参数对应的极大似然值相比较,如果满足设定阈值,则模型构建完毕,进入步骤(4),否则,继续构建模型。
8.根据权利要求1所述的基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,所述化工过程为造纸废水处理过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911377117.0A CN111142501B (zh) | 2019-12-27 | 2019-12-27 | 基于半监督自回归动态隐变量模型的故障检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911377117.0A CN111142501B (zh) | 2019-12-27 | 2019-12-27 | 基于半监督自回归动态隐变量模型的故障检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111142501A true CN111142501A (zh) | 2020-05-12 |
CN111142501B CN111142501B (zh) | 2021-10-22 |
Family
ID=70521002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911377117.0A Active CN111142501B (zh) | 2019-12-27 | 2019-12-27 | 基于半监督自回归动态隐变量模型的故障检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111142501B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111983994A (zh) * | 2020-08-13 | 2020-11-24 | 杭州电子科技大学 | 一种基于复杂工业化工过程的v-pca故障诊断方法 |
CN112148955A (zh) * | 2020-10-22 | 2020-12-29 | 南京航空航天大学 | 一种物联网时序数据异常检测方法及系统 |
CN112286169A (zh) * | 2020-10-20 | 2021-01-29 | 浙江钱江机器人有限公司 | 一种工业机器人故障检测方法 |
CN112541558A (zh) * | 2020-09-18 | 2021-03-23 | 江苏师范大学 | 一种基于不完整数据的贝叶斯半监督鲁棒ppls软测量方法 |
CN112562797A (zh) * | 2020-11-30 | 2021-03-26 | 中南大学 | 沉铁过程出口离子预测方法及系统 |
CN113222217A (zh) * | 2021-04-15 | 2021-08-06 | 中国科学技术大学先进技术研究院 | 基于离散排放标签的柴油车排放连续值预测方法及系统 |
CN113283315A (zh) * | 2021-05-12 | 2021-08-20 | 中国航空工业集团公司上海航空测控技术研究所 | 一种多飞行状态直升机故障动态监测告警方法 |
CN113485269A (zh) * | 2021-07-20 | 2021-10-08 | 浙江大学 | 一种基于隐变量模型的工业过程监测方法 |
CN113743489A (zh) * | 2021-08-26 | 2021-12-03 | 上海应用技术大学 | 一种基于数据缺失的流程工业过程故障检测方法 |
CN114839586A (zh) * | 2022-05-12 | 2022-08-02 | 烟台东方威思顿电气有限公司 | 基于em算法的低压台区计量装置失准计算方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006107670A2 (en) * | 2005-04-01 | 2006-10-12 | Perlegen Sciences, Inc. | In vitro association studies |
JP2007329415A (ja) * | 2006-06-09 | 2007-12-20 | Fujitsu Ltd | データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置 |
US7987003B2 (en) * | 1991-12-23 | 2011-07-26 | Hoffberg Steven M | Network media appliance system and method |
CN104537260A (zh) * | 2015-01-14 | 2015-04-22 | 清华大学 | 基于缓慢特征回归的动态软测量方法和系统 |
US20160034809A1 (en) * | 2014-06-10 | 2016-02-04 | Sightline Innovation Inc. | System and method for network based application development and implementation |
CN105404280A (zh) * | 2015-12-11 | 2016-03-16 | 浙江科技学院 | 基于自回归动态隐变量模型的工业过程故障检测方法 |
CN206656749U (zh) * | 2017-04-10 | 2017-11-21 | 中国电力工程顾问集团华东电力设计院有限公司 | 火电厂传感器故障诊断系统 |
CN206833239U (zh) * | 2017-05-12 | 2018-01-02 | 中国电力工程顾问集团华东电力设计院有限公司 | 一种基于数据驱动的火电厂控制系统故障检测系统 |
US20180188714A1 (en) * | 2016-05-09 | 2018-07-05 | Strong Force Iot Portfolio 2016, Llc | Methods and systems for the industrial internet of things |
CN108881196A (zh) * | 2018-06-07 | 2018-11-23 | 中国民航大学 | 基于深度生成模型的半监督入侵检测方法 |
CN108960329A (zh) * | 2018-07-06 | 2018-12-07 | 浙江科技学院 | 一种包含缺失数据的化工过程故障检测方法 |
-
2019
- 2019-12-27 CN CN201911377117.0A patent/CN111142501B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7987003B2 (en) * | 1991-12-23 | 2011-07-26 | Hoffberg Steven M | Network media appliance system and method |
WO2006107670A2 (en) * | 2005-04-01 | 2006-10-12 | Perlegen Sciences, Inc. | In vitro association studies |
JP2007329415A (ja) * | 2006-06-09 | 2007-12-20 | Fujitsu Ltd | データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置 |
US20160034809A1 (en) * | 2014-06-10 | 2016-02-04 | Sightline Innovation Inc. | System and method for network based application development and implementation |
CN104537260A (zh) * | 2015-01-14 | 2015-04-22 | 清华大学 | 基于缓慢特征回归的动态软测量方法和系统 |
CN105404280A (zh) * | 2015-12-11 | 2016-03-16 | 浙江科技学院 | 基于自回归动态隐变量模型的工业过程故障检测方法 |
US20180188714A1 (en) * | 2016-05-09 | 2018-07-05 | Strong Force Iot Portfolio 2016, Llc | Methods and systems for the industrial internet of things |
CN206656749U (zh) * | 2017-04-10 | 2017-11-21 | 中国电力工程顾问集团华东电力设计院有限公司 | 火电厂传感器故障诊断系统 |
CN206833239U (zh) * | 2017-05-12 | 2018-01-02 | 中国电力工程顾问集团华东电力设计院有限公司 | 一种基于数据驱动的火电厂控制系统故障检测系统 |
CN108881196A (zh) * | 2018-06-07 | 2018-11-23 | 中国民航大学 | 基于深度生成模型的半监督入侵检测方法 |
CN108960329A (zh) * | 2018-07-06 | 2018-12-07 | 浙江科技学院 | 一种包含缺失数据的化工过程故障检测方法 |
Non-Patent Citations (4)
Title |
---|
AUTOREGRESSIVE DYNAMIC LATENT VARIABLE MODELS FOR PROCESS MONITO: "Le Zhou", 《IEEE TRANSACTIONS ON CONTROL SYSTEMS TECHNOLOGY》 * |
周乐: "一种鲁棒半监督建模方法及其在化工过程故障检测中的应用", 《化工学报》 * |
周乐: "基于概率的工业过程数据建模与故障检测", 《中国博士学位论文全文数据库信息科技辑》 * |
郑俊华: "工业过程数据隐变量回归建模及应用", 《中国博士学位论文全文数据库基础科学辑》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111983994A (zh) * | 2020-08-13 | 2020-11-24 | 杭州电子科技大学 | 一种基于复杂工业化工过程的v-pca故障诊断方法 |
CN112541558A (zh) * | 2020-09-18 | 2021-03-23 | 江苏师范大学 | 一种基于不完整数据的贝叶斯半监督鲁棒ppls软测量方法 |
CN112286169B (zh) * | 2020-10-20 | 2022-02-01 | 浙江钱江机器人有限公司 | 一种工业机器人故障检测方法 |
CN112286169A (zh) * | 2020-10-20 | 2021-01-29 | 浙江钱江机器人有限公司 | 一种工业机器人故障检测方法 |
CN112148955A (zh) * | 2020-10-22 | 2020-12-29 | 南京航空航天大学 | 一种物联网时序数据异常检测方法及系统 |
CN112562797A (zh) * | 2020-11-30 | 2021-03-26 | 中南大学 | 沉铁过程出口离子预测方法及系统 |
CN112562797B (zh) * | 2020-11-30 | 2024-01-26 | 中南大学 | 沉铁过程出口离子预测方法及系统 |
CN113222217A (zh) * | 2021-04-15 | 2021-08-06 | 中国科学技术大学先进技术研究院 | 基于离散排放标签的柴油车排放连续值预测方法及系统 |
CN113222217B (zh) * | 2021-04-15 | 2022-02-25 | 中国科学技术大学先进技术研究院 | 基于离散排放标签的柴油车排放连续值预测方法及系统 |
CN113283315A (zh) * | 2021-05-12 | 2021-08-20 | 中国航空工业集团公司上海航空测控技术研究所 | 一种多飞行状态直升机故障动态监测告警方法 |
CN113283315B (zh) * | 2021-05-12 | 2022-04-05 | 中国航空工业集团公司上海航空测控技术研究所 | 一种多飞行状态直升机故障动态监测告警方法 |
CN113485269A (zh) * | 2021-07-20 | 2021-10-08 | 浙江大学 | 一种基于隐变量模型的工业过程监测方法 |
CN113743489A (zh) * | 2021-08-26 | 2021-12-03 | 上海应用技术大学 | 一种基于数据缺失的流程工业过程故障检测方法 |
CN113743489B (zh) * | 2021-08-26 | 2023-09-29 | 上海应用技术大学 | 一种基于数据缺失的流程工业过程故障检测方法 |
CN114839586A (zh) * | 2022-05-12 | 2022-08-02 | 烟台东方威思顿电气有限公司 | 基于em算法的低压台区计量装置失准计算方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111142501B (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111142501B (zh) | 基于半监督自回归动态隐变量模型的故障检测方法 | |
CN107292023B (zh) | 一种基于损伤指标体系窄域特性的桥梁结构状态诊断方法 | |
Bowden et al. | Input determination for neural network models in water resources applications. Part 1—background and methodology | |
CN109116834B (zh) | 一种基于深度学习的间歇过程故障检测方法 | |
CN109407649B (zh) | 一种基于故障特征变量选择的故障类型匹配方法 | |
CN109409425B (zh) | 一种基于近邻成分分析的故障类型识别方法 | |
CN108549908B (zh) | 基于多采样概率核主成分模型的化工过程故障检测方法 | |
CN111079836A (zh) | 基于伪标签方法和弱监督学习的过程数据故障分类方法 | |
CN109947076B (zh) | 一种基于贝叶斯信息准则的工业过程故障诊断方法 | |
CN111768000A (zh) | 在线自适应微调深度学习的工业过程数据建模方法 | |
CN109460005B (zh) | 基于gru深度神经网络的动态工业过程故障诊断方法 | |
CN107220500B (zh) | 基于逆高斯过程的性能退化试验贝叶斯可靠性评估方法 | |
Shang et al. | Incipient sensor fault diagnosis in multimode processes using conditionally independent Bayesian learning based recursive transformed component statistical analysis | |
CN113805561A (zh) | 基于深度迁移学习的航天器智能故障诊断方法 | |
CN109325065B (zh) | 基于动态隐变量模型的多采样率软测量方法 | |
CN110084301B (zh) | 一种基于隐马尔可夫模型的多工况过程工况辨识方法 | |
CN111062848A (zh) | 一种消防工程异常状态监测的智能监控方法 | |
CN113420815A (zh) | 半监督rsdae的非线性pls间歇过程监测方法 | |
CN111914471A (zh) | 一种基于快速核独立成分分析的精馏塔故障检测方法 | |
CN115129029A (zh) | 基于子领域适配字典学习的工业系统故障诊断方法和系统 | |
CN113688875B (zh) | 工业系统故障识别方法及装置 | |
CN111160464B (zh) | 基于多隐层加权动态模型的工业高阶动态过程软测量方法 | |
CN115840419A (zh) | 基于云边协同字典学习的复杂工业过程监测方法和系统 | |
CN114021465A (zh) | 基于深度学习的电力系统鲁棒状态估计方法及系统 | |
CN110826184B (zh) | 一种在时变时滞下narx模型结构和参数的变分贝叶斯辨识方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder |
Address after: 310023 No. 318 stay Road, Xihu District, Zhejiang, Hangzhou Patentee after: ZHEJIANG University OF SCIENCE AND TECHNOLOGY Address before: 310023 No. 318, Ho Ho Road, Hangzhou, Zhejiang Patentee before: ZHEJIANG University OF SCIENCE AND TECHNOLOGY |
|
CP02 | Change in the address of a patent holder |