CN107423503B - 基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法 - Google Patents

基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法 Download PDF

Info

Publication number
CN107423503B
CN107423503B CN201710599053.3A CN201710599053A CN107423503B CN 107423503 B CN107423503 B CN 107423503B CN 201710599053 A CN201710599053 A CN 201710599053A CN 107423503 B CN107423503 B CN 107423503B
Authority
CN
China
Prior art keywords
input
variable
slow
data
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710599053.3A
Other languages
English (en)
Other versions
CN107423503A (zh
Inventor
熊伟丽
彭慧来
陈树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN201710599053.3A priority Critical patent/CN107423503B/zh
Publication of CN107423503A publication Critical patent/CN107423503A/zh
Application granted granted Critical
Publication of CN107423503B publication Critical patent/CN107423503B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法。用于具有时延和非线性的化工过程。该方法首先通过模糊曲线分析充分挖掘工业数据中的时延信息,求出数据中的最优时滞,并进行建模数据的重构;进一步通过核慢特征分析方法对重构数据进行非线性的特征提取;最后,基于提取后的特征建立高斯过程回归模型,实现对关键变量的精确预测,从而提高产品质量,降低生产成本。

Description

基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷 塔底部的丁烷浓度进行预测的方法
技术领域
本发明涉及核慢特征分析和时滞估计的高斯过程回归建模,属于复杂工业过程建模和软测量领域。
背景技术
在实际工业过程中,一些关键变量的测量对于生产高质量的产品至关重要。但是在现有技术条件和经济代价等问题的约束下,使得直接获取关键变量变得十分困难。
基于这样的背景下,软测量技术应运而生。它通过构建过程易测变量和关键变量的函数关系,来推断和估计难测的关键变量,因此得到了广泛应用。常见的软测量建模方法如偏最小二乘、神经网络、最小二乘支持向量机等都可以得到良好的预测效果。高斯过程回归(Gaussian process regression,GPR)由于其具有预测精度高,超参数容易确定,输出具有概率意义等优点,近几年被广泛应用于软测量建模。因此选取高斯过程回归作为建模方法。
实际工业过程建模中,一般都会对过程数据预先进行特征提取。现有的线性特征提取方法,如主成分分析和独立主元分析,以及非线性特征提取方法核主元分析,都是从变量的角度构造新的成分,并未分析样本之间的变化情况。慢特征分析(slow featureanalysis,SFA)作为一种新的特征提取方法,能够从样本的角度出发,提取出一部分最缓慢的特征代表过程的本质特征,基于本质特征建立精度更高模型。近年来,SFA得到了各个研究领域的关注,并且取得了广泛的应用,例如盲信号分离、软测量建模、行为识别、故障诊断以及遥感。然而现有的慢特征分析方法往往是基于二阶多项式扩展,其处理非线性的能力较弱。当数据的维度较大时,二阶多项式扩展会引起维数灾难,也有可能会造成数据的过拟合。针对工业过程中的强非线性和高维特征,通过引入核函数扩展的核慢特征分析(kernelslow feature analysis,KSFA)代替二阶多项式扩展的慢特征分析,加强了对非线性数据的特征提取能力。
实际的生产过程中输入输出数据会存在显著的时间滞后,如物料流动引起的传输时延、信号传输带来的纯时延等。若对这些时滞置之不理,会导致输入和输出变量之间的因果关系发生变化,从而导致建模精度的下降。因此,如何准确估计输入和输出之间的时延变得尤为重要。因此,如何准确估计输入和输出之间的时延变得尤为重要。由于实际工业过程工艺复杂,通过过程工艺估计时延变得不太可能。Zhang和Komulaine通过构建输入变量和输出变量的相关系数来估计时延,但是由于该方法只考虑了变量之间的线性关系,对于非线性情况可能会得到错误的结论。阮宏镁等通过差分估计(difference estimation,DE)算法优化过程变量间的联合互信息来确定时延,但是智能优化算法容易陷入局部最优,且联合互信息分析相关性时计算复杂度较高,运行时间较长。模糊曲线分析(fuzzy curveanalysis,FCA)方法最早用于确定对输出变量重要的输入变量,这种方法的优点在于计算复杂度较低,能够直观有效的确定出输入变量对输出变量的重要性程度。因此本文将采用该方法确定最优时滞。通过引入不同的时滞信息扩展输入变量,构造输入变量和输出变量之间的模糊逻辑,从而确定对输出变量最重要的输入变量所对应的时滞值,此时的时滞值则为该输入变量的最优时滞。
一种基于核慢特征分析和时滞估计的高斯过程回归建模方法(简称FCA-KSFA-GPR)能够很好的处理时延和非线性,提高软测量模型的性能。通过FCA挖掘出各辅助变量的最优时滞,能够确定输入变量对输出变量的重要性程度,因此使输入变量和输出变量的因果性更强,能够更好的解决时延问题。相对与传统的特征提取方法,SFA从样本的角度出发,更能挖掘出本质特征,建立精度更高模型。通过KSFA对重构数据进行特征提取,更能加强对非线性数据的特征提取能力。
发明内容
针对工业过程中存在的时延和非线性特性,提出了一种考虑过程时滞信息,并基于核慢特征分析的高斯过程回归建模方法。
通过模糊曲线分析充分挖掘工业数据中的时延特征,求出数据中的最优时滞,并进行建模数据的重构;进一步通过核慢特征分析方法对重构数据进行非线性的特征提取;最后,基于提取后的特征建立高斯过程回归模型,实现对化工过程产品质量的在线估计,从而提高产量,降低生产成本。
本发明的目的是通过以下技术方案实现的:
基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法,所述方法包括以下过程:针对于时延和非线性的化工过程,用模糊曲线分析对过程数据进行分析,确定出各输入变量的最优时滞,并进行数据的重构。
通过核慢特征分析对重构数据进行非线性特征提取,通过交叉验证,确定出最优的核慢特征特征向量阵和对应的核慢特征,并通过核慢特征建立高斯过程回归模型。
对于新来的样本,通过训练样本得到的核慢特征特征向量阵求取新来样本的核慢特征,代入已建立好的高斯过程回归模型中,即可实现对关键变量的精确预测,从而提高产品质量,降低生产成本。
附图说明
图1慢特征分析流程图;
图2重构后的数据;
图3基于核慢特征分析和时滞估计的高斯过程回归建模流程图;
图4前6个输入变量不同时延所对应的RC值;
图5训练样本和测试样本提取的四个变化缓慢的核慢特征;
图6是四种建模方法的预测结果图;
图7四种建模方法的散点图;
具体实施方式
下面结合图3所示,对本发明做进一步详述:
以常见的化工过程——脱丁烷塔过程为例。实验数据来自于脱丁烷塔过程,对脱丁烷塔底部的丁烷浓度进行预测。
步骤1:收集输入输出数据组成历史训练数据库。
步骤2:标准化训练样本数据,并将每个输入变量进行Tmax+1维扩展。其中,Tmax为最大时延。
步骤3:通过模糊曲线分析(fuzzy curve analysis,FCA)确定各输入变量的最优时滞,定义为d1,d2,...,dm。其中m为样本的维度。所述的模糊曲线分析算法为:
糢糊曲线分析用于选择重要的输入变量。通过构建输入和输出变量之间的模糊逻辑,从而确定对输出变量重要的输入变量。假设有m个输入变量{xi,i=1,2,...,m}和输出变量y,采集到的样本个数为n,令xik为第k个样本的第i个变量,yk为对应的输出变量。对于每个输入变量xi,i=1,2,...,m在第k个样本处的模糊隶属度函数φik(xi)定义为:
Figure GDA0002487151840000021
式中,φik为变量xi所对应的第k个样本点的输入变量模糊隶属函数。φik这里选取为高斯函数,b选取为输入变量xi范围的20%。因此对于n个训练样本对应的每个输入变量都有n条模糊规则,其中第k个规则描述为:Rk:if xi isφik(xi),then y is yk
通过式(2)对输入变量xi进行重心去模糊化,计算得到其对应的模糊曲线为ci。进一步通过式(3),可以计算出模糊曲线ci的变化范围Rci。若得到的Rci越大,表明此时输入变量对于输入变量越重要。
Figure GDA0002487151840000031
Rci=max(ci)-min(ci) (3)
由于共有m个输入变量,故能得到m个Rci,将Rci大小按降序排列,可以得到各输入变量的重要性。
通过引入时滞信息,原有的输入变量xi转变为Tmax+1维:{xi(t),xi(t-1),…,xi(t-d),…,xi(t-Tmax)},其中t为输出变量的采样时刻,d为待确定的时滞变量,Tmax为最大时延。根据模糊曲线法原理,将{xi(t),xi(t-1),…,xi(t-d),…,xi(t-Tmax)}转化为Tmax+1个待选输入变量,从中选取一个最重要的变量xi(t-d),则d即为该输入变量所对应的最优时滞。求取出各输入变量的最优时滞分别为d1,d2,...,dm后,则进行样本数据的重构。
对重构后的训练样本进行标准化处理,并通过核慢特征分析(kernel slowfeature analysis,KSFA)确定其核慢特征和相应特征向量矩阵。慢特征分析算法为:
给定一个p维的时序输入信号X(t)={x1(t),x2(t),...,xp(t)},慢特征分析算法旨在找到一个q维的变换函数G(x)={g1(X),g2(X),...gq(X)},使得q维的输出信号S(t)={S1(t),S2(t),...,Sq(t)}变化尽可能缓慢。其中Sj(t):=gj(X(t)),j∈[1,2,...,q]。慢特征分析算法最终转化为一个优化问题:
Figure GDA0002487151840000032
且满足约束条件:
<Sj>t=0 (5)
<(Sj)2>t=1, (6)
Figure GDA0002487151840000034
其中
Figure GDA0002487151840000033
为Sj的一阶导数,<·>t为时间平均。
式(4)为优化目标函数,使得输出信号变化最为缓慢;式(5)表示的零均值约束,仅仅是为了简化问题的求解;单位方差约束(6)不但对输出信号的尺度进行了归一化,还避免了常值解的出现,使输出信号必须包含一定的信息;式(7)保证了输出信号的各个分量之间是不相关的,避免了冗余信号的出现。除此之外,慢特征根据其变化快慢进行排序,若按升序排序,即S1(t)是最缓慢的特征,S2(t)是次缓慢的特征,以此类推。
当变换函数gj(·)为线性时,此时每个慢特征Sj都是输入变量的线性组合,即:
Sj=gj(X)=X(t)wj (8)
由于X(t)已经预先进行了均值化处理,因此满足式(5)的约束条件。式(4)优化目标和约束条件(6)可以重写为:
Figure GDA0002487151840000041
式中,
Figure GDA0002487151840000042
B=<X(t)TX(t)>t,进而公式(9)的优化求解问题等价于如下的广义特征值分解问题:
AW=BWΛ (10)
其中,Λ=(λ1,...λq)为广义特征值构成的对角矩阵且λ1<λ2<…<λq,W=(w1,...wp)为对应的广义特征向量矩阵。式(4)的优化目标正是对角矩阵Λ中的主对角元素。
Figure GDA0002487151840000043
当变换函数gj(·)为非线性时,此时的变换函数可以等效为线性变换函数在非线性空间的扩展,多项式扩展为常用的扩展方式,以二阶多项式扩展为例,定义如下:
Figure GDA0002487151840000044
经过二阶扩展后,
Figure GDA0002487151840000045
的维度由p维变成了L维,其中L=p+p(p+1)/2。将
Figure GDA0002487151840000046
进行均值化处理后得V(x),将V(x)替换式(8)中的X(t),就将非线性情况转化成了线性情况。
核慢特征分析就是将核函数扩展方法代替多项式扩展从而加强对非线性数据的处理,从而实现非线性特征提取。核函数的选取有多种选择,这里选择泛化和平滑估计能力强的高斯核函数。
Figure GDA0002487151840000047
将经过核函数扩展后的数据K代替二阶多项式扩展的V(t),优化目标就转换为:
Figure GDA0002487151840000048
其中,
Figure GDA0002487151840000049
式(10)的优化目标求解问题等价于如下的广义特征值分解问题:
AkW=BkWΛ (15)
其中,
Figure GDA00024871518400000410
表示
Figure GDA00024871518400000411
的协方差阵,Bk=<KTK>t表示K的协方差阵。
通过交叉验证确定核慢特征个数,并将此时的核慢特征向量矩阵和对应的核慢特征分别记为W,Str。然后基于(Str,Y)建立高斯过程回归模型,其中Y表示重组训练样本中的输出变量。建立的高斯过程回归模型为:
给定训练样本集X∈RD×N和y∈RN,其中X={xi∈RD}i=1…N,y={yi∈R}i=1…N分别代表D维的输入和输出数据,输入和输出之间的关系由公式(16)产生:
y=f(x)+ε (16)
其中f是未知的函数形式,ε是均值为0,方差为
Figure GDA0002487151840000051
的高斯噪声。对于一个新的输入x*,相应的概率预测输出y*也满足高斯分布,其均值和方差如式(11)和(12)所示:
y*(x*)=cT(x*)C-1y (17)
Figure GDA0002487151840000052
式中c(x*)=[c(x*,x1),…,c(x*,xn)]T是训练数据和测试数据之间的协方差矩阵。
Figure GDA0002487151840000053
是训练数据之间的协方差矩阵,I是N×N维的单位矩阵。c(x*,x*)是测试数据的自协方差。
高斯过程回归可以选择不同的协方差函数c(xi,xj)产生协方差矩阵Σ,只要选择的协方差函数能保证产生的协方差矩阵满足非负正定的关系。这里选择高斯协方差函数:
Figure GDA0002487151840000054
式中,v控制协方差的量度,ωd代表每个成分xd的相对重要性。
对式(4)中的未知参数v,ω1,…,ωD和高斯噪声方差
Figure GDA0002487151840000055
的估计,一般最简单的方法就是通过极大似然估计得到参数
Figure GDA0002487151840000056
Figure GDA0002487151840000057
为了求得参数θ的值,首先将参数θ设置为一个合理范围内的随机值,然后用共轭梯度法得到优化的参数。获得最优参数θ后,对于测试样本x*,可以用式(17)和(18)来估计高斯过程回归模型的输出值。
对计算所得的所有相似系数si进行降序排列,建立局部模型时,只选择前L个相似系数较大的数据。为了选择合适比例的建模数据,针对于TE化工过程,数据比例选择从10%逐渐增大到100%,最后得到最佳的数据比例为70%。JITL进行数据选择时,不同的比例下CPU耗时和预测的精度如图2和图3所示。
根据JITL选择的数据建立的局部高斯过程回归模型为:
给定训练样本集X∈RD×N和y∈RN,其中X={xi∈RD}i=1…N,y={yi∈R}i=1…N分别代表D维的输入和输出数据。输入和输出之间的关系由公式(21)产生:
y=f(x)+ε (21)
其中f是未知的函数形式,ε是均值为0,方差为
Figure GDA0002487151840000061
的高斯噪声。对于一个新的输入x*,相应的概率预测输出y*也满足高斯分布,其均值和方差如式(22)和(23)所示:
y*(x*)=cT(x*)C-1y (22)
Figure GDA0002487151840000062
式中c(x*)=[c(x*,x1),…,c(x*,xn)]T是训练数据和测试数据之间的协方差矩阵。
Figure GDA0002487151840000063
是训练数据之间的协方差矩阵,I是N×N维的单位矩阵。c(x*,x*)是测试数据的自协方差。
高斯过程回归可以选择不同的协方差函数c(xi,xj)产生协方差矩阵Σ,只要选择的协方差函数能保证产生的协方差矩阵满足非负正定的关系。这里选择高斯协方差函数:
Figure GDA0002487151840000064
式中v控制协方差的量度,ωd代表每个成分xd的相对重要性。
对式(24)中的未知参数v,ω1,…,ωD和高斯噪声方差
Figure GDA0002487151840000065
的估计,一般最简单的方法就是通过极大似然估计得到参数
Figure GDA0002487151840000066
Figure GDA0002487151840000067
为了求得参数θ的值,首先将参数θ设置为一个合理范围内的随机值,然后用共轭梯度法得到优化的参数。获得最优参数θ后,对于测试样本x*,可以用式(22)和(23)来估计高斯过程回归模型的输出值。
对于新来的样本,通过训练样本得到的核慢特征特征向量阵求取新来样本的核慢特征,代入已建立好的高斯过程回归模型中,即可实现对关键变量的精确预测,从而提高产品质量,降低生产成本。
图6是脱丁烷塔底部的丁烷浓度预测值和实际值拟合曲线,并且与高斯过程回归、糢糊曲线分析-高斯过程回归、糢糊曲线分析-慢特征分析-高斯过程回归所建立的软测量模型进行了比较。由图可知,基于核慢特征分析和时滞估计的高斯过程回归建模能够有效地预测脱丁烷塔底部的丁烷浓度。

Claims (1)

1.基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法,其特征在于,该方法步骤为:
步骤1:收集输入输出数据组成历史训练数据库,所述数据来自于脱丁烷塔过程;
步骤2:标准化训练样本数据,并将每个输入变量进行Tmax+1维扩展,其中,Tmax为最大时延;
步骤3:通过模糊曲线分析确定各输入变量的最优时滞,定义为d1,d2,...,dm,其中m为样本的维度,所述的模糊曲线分析算法为:
通过构建输入和输出变量之间的模糊逻辑,从而确定对输出变量重要的输入变量;假设有m个输入变量{xi,i=1,2,...,m}和输出变量y,采集到的样本个数为n,令xik为第k个样本的第i个变量,yk为对应的输出变量;对于每个输入变量xi,i=1,2,...,m在第k个样本处的模糊隶属度函数φik(xi)定义为:
Figure FDA0002411217880000011
式中,φik为变量xi所对应的第k个样本点的输入变量模糊隶属函数;φik这里选取为高斯函数,b选取为输入变量xi范围的20%;因此对于n个训练样本对应的每个输入变量都有n条模糊规则,其中第k个规则描述为:Rk:if xi isφik(xi),then y is yk
通过式(2)对输入变量xi进行重心去模糊化,计算得到其对应的模糊曲线为ci;进一步通过式(3),可以计算出模糊曲线ci的变化范围Rci;若得到的Rci越大,表明此时输入变量对于输入变量越重要;
Figure FDA0002411217880000012
Rci=max(ci)-min(ci) (3)
由于共有m个输入变量,故能得到m个Rci,将Rci大小按降序排列,可以得到各输入变量的重要性;
通过引入时滞信息,原有的输入变量xi转变为Tmax+1维:{xi(t),xi(t-1),…,xi(t-d),…,xi(t-Tmax)},其中t为输出变量的采样时刻,d为待确定的时滞变量,Tmax为最大时延;根据模糊曲线法原理,将{xi(t),xi(t-1),…,xi(t-d),…,xi(t-Tmax)}转化为Tmax+1个待选输入变量,从中选取一个最重要的变量xi(t-d),则d即为该输入变量所对应的最优时滞;求取出各输入变量的最优时滞分别为d1,d2,...,dm后,则进行样本数据的重构;
步骤4:对重构后的训练样本进行标准化处理,并通过核慢特征分析确定其核慢特征和相应特征向量矩阵;慢特征分析算法为:
给定一个p维的时序输入信号X(t)={x1(t),x2(t),...,xp(t)},慢特征分析算法旨在找到一个q维的变换函数G(x)={g1(X),g2(X),...gq(X)},使得q维的输出信号S(t)={S1(t),S2(t),...,Sq(t)}变化尽可能缓慢;其中Sj(t):=gj(X(t)),j∈[1,2,...,q];慢特征分析算法最终转化为一个优化问题:
Figure FDA0002411217880000021
且满足约束条件:
<Sj>t=0 (5)
<(Sj)2>t=1, (6)
Figure FDA0002411217880000022
其中
Figure FDA0002411217880000023
为Sj的一阶导数,<·>t为时间平均;
式(4)为优化目标函数,使得输出信号变化最为缓慢;式(5)表示的零均值约束,仅仅是为了简化问题的求解;单位方差约束(6)不但对输出信号的尺度进行了归一化,还避免了常值解的出现,使输出信号必须包含一定的信息;式(7)保证了输出信号的各个分量之间是不相关的,避免了冗余信号的出现;除此之外,慢特征根据其变化快慢进行排序,若按升序排序,即S1(t)是最缓慢的特征,S2(t)是次缓慢的特征,以此类推;
当变换函数gj(·)为线性时,此时每个慢特征Sj都是输入变量的线性组合,即:
Sj=gj(X)=X(t)wj (8)
由于X(t)已经预先进行了均值化处理,因此满足式(5)的约束条件,式(4)优化目标和约束条件(6)可以重写为:
Figure FDA0002411217880000024
式中,
Figure FDA0002411217880000025
B=<X(t)TX(t)>t,进而公式(9)的优化求解问题等价于如下的广义特征值分解问题:
AW=BWΛ (10)
其中,Λ=(λ1,...λq)为广义特征值构成的对角矩阵且λ1<λ2<...<λq,W=(w1,...wp)为对应的广义特征向量矩阵,式(4)的优化目标正是对角矩阵Λ中的主对角元素;
Figure FDA0002411217880000026
当变换函数gj(·)为非线性时,此时的变换函数可以等效为线性变换函数在非线性空间的扩展,多项式扩展为常用的扩展方式,以二阶多项式扩展为例,定义如下:
Figure FDA0002411217880000031
经过二阶扩展后,
Figure FDA0002411217880000032
的维度由p维变成了L维,其中L=p+p(p+1)/2,将
Figure FDA0002411217880000033
进行均值化处理后得V(x),将V(x)替换式(8)中的X(t),就将非线性情况转化成了线性情况;核慢特征分析就是将核函数扩展方法代替多项式扩展从而加强对非线性数据的处理,从而实现非线性特征提取;核函数的选取有多种选择,这里选择泛化和平滑估计能力强的高斯核函数:
Figure FDA0002411217880000034
将经过核函数扩展后的数据K代替二阶多项式扩展的V(t),优化目标就转换为:
Figure FDA0002411217880000035
其中,
Figure FDA0002411217880000036
式(10)的优化目标求解问题等价于如下的广义特征值分解问题:
AkW=BkWΛ (15)
其中,
Figure FDA0002411217880000037
表示
Figure FDA0002411217880000038
的协方差阵,Bk=<KTK>t表示K的协方差阵;
步骤5:通过交叉验证确定核慢特征个数,并将此时的核慢特征向量矩阵和对应的核慢特征分别记为W,Str;然后基于(Str,Y)建立高斯过程回归模型,其中Y表示重组训练样本中的输出变量,建立的高斯过程回归模型为:
给定训练样本集X∈RD×N和y∈RN,其中X={xi∈RD}i=1…N,y={yi∈R}i=1…N分别代表D维的输入和输出数据,输入和输出之间的关系由公式(16)产生:
y=f(x)+ε (16)
其中f是未知的函数形式,ε是均值为0,方差为
Figure FDA0002411217880000039
的高斯噪声,对于一个新的输入x*,相应的概率预测输出y*也满足高斯分布,其均值和方差如式(17)和(18)所示:
y*(x*)=cT(x*)C-1y (17)
Figure FDA00024112178800000310
式中c(x*)=[c(x*,x1),…,c(x*,xn)]T是训练数据和测试数据之间的协方差矩阵,
Figure FDA00024112178800000311
是训练数据之间的协方差矩阵,I是N×N维的单位矩阵,c(x*,x*)是测试数据的自协方差;
高斯过程回归可以选择不同的协方差函数c(xi,xj)产生协方差矩阵Σ,只要选择的协方差函数能保证产生的协方差矩阵满足非负正定的关系,这里选择高斯协方差函数:
Figure FDA0002411217880000041
式中v控制协方差的量度,ωd代表每个成分xd的相对重要性;
对式(19)中的未知参数v,ω1,…,ωD和高斯噪声方差
Figure FDA0002411217880000042
的估计,采用极大似然估计得到参数
Figure FDA0002411217880000043
Figure FDA0002411217880000044
为了求得参数θ的值,首先将参数θ设置为一个合理范围内的随机值,然后用共轭梯度法得到优化的参数,获得最优参数θ后,对于测试样本x*,可以用式(17)和(18)来估计高斯过程回归模型的输出值;
步骤6:脱丁烷塔底部的丁烷浓度预测值和实际值拟合曲线,并且与高斯过程回归、糢糊曲线分析-高斯过程回归、糢糊曲线分析-慢特征分析-高斯过程回归所建立的软测量模型进行了比较,基于核慢特征分析和时滞估计的高斯过程回归建模能够有效地预测脱丁烷塔底部的丁烷浓度。
CN201710599053.3A 2017-07-21 2017-07-21 基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法 Active CN107423503B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710599053.3A CN107423503B (zh) 2017-07-21 2017-07-21 基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710599053.3A CN107423503B (zh) 2017-07-21 2017-07-21 基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法

Publications (2)

Publication Number Publication Date
CN107423503A CN107423503A (zh) 2017-12-01
CN107423503B true CN107423503B (zh) 2020-06-23

Family

ID=60430913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710599053.3A Active CN107423503B (zh) 2017-07-21 2017-07-21 基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法

Country Status (1)

Country Link
CN (1) CN107423503B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108716398B (zh) * 2018-06-21 2019-03-05 中国石油大学(北京) 基于慢特征分析的控压钻井过程故障检测方法及装置
CN108803531B (zh) * 2018-07-17 2019-10-15 浙江大学 基于动静特征协同分析和有序时段划分的闭环系统过程监测方法
CN110070028B (zh) * 2019-04-17 2023-03-07 深圳大学 基于共轭梯度法的人脸图像非负特征表示与识别方法、系统及存储介质
CN110210687A (zh) * 2019-06-13 2019-09-06 中南大学 一种基于局部加权慢特征回归的非线性动态生产过程产品质量预测方法
CN113030156B (zh) * 2021-03-13 2023-02-24 宁波大学科学技术学院 一种基于非线性慢特征模型的聚丙烯熔融指数软测量方法
CN114707424B (zh) * 2022-04-27 2024-04-09 浙江科技学院 基于质量相关慢特征分析算法的化工过程软测量方法
CN117524337B (zh) * 2023-10-30 2024-05-07 江南大学 基于双流慢-非平稳快特征提取的co2含量预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG84531A1 (en) * 1999-05-20 2001-11-20 Univ Singapore Disturbance attenuation in a precision servomechanism by a frequency-separated acceleration soft sensor
CN106056127A (zh) * 2016-04-07 2016-10-26 江南大学 一种带模型更新的gpr在线软测量方法
CN106156434B (zh) * 2016-07-11 2020-03-17 江南大学 基于局部时滞重构的滑动窗时间差-高斯过程回归建模方法
CN106569982A (zh) * 2016-07-11 2017-04-19 江南大学 带奇异点检测补偿的gpr在线软测量方法及系统

Also Published As

Publication number Publication date
CN107423503A (zh) 2017-12-01

Similar Documents

Publication Publication Date Title
CN107423503B (zh) 基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法
Zhao et al. Critical-to-fault-degradation variable analysis and direction extraction for online fault prognostic
Qian et al. A review on autoencoder based representation learning for fault detection and diagnosis in industrial processes
Grbić et al. Adaptive soft sensor for online prediction and process monitoring based on a mixture of Gaussian process models
Song et al. Fault detection and classification using quality-supervised double-layer method
Gregorcic et al. Local model network identification with Gaussian processes
Zhou et al. A study of polynomial fit-based methods for qualitative trend analysis
Zhu et al. Dimensionality reduce-based for remaining useful life prediction of machining tools with multisensor fusion
Hjalmarsson et al. A geometric approach to variance analysis in system identification
Pan et al. Fault detection with improved principal component pursuit method
Mohammadzadeh et al. Monitoring logistic profiles using variable sample interval approach
CN115510975A (zh) 基于并行Transofmer-GRU的多变量时序异常检测方法及系统
Mostafaei et al. A new approach of ensemble learning in fully automated identification of structural modal parameters of concrete gravity dams: A case study of the Koyna dam
Zhang et al. Spectral radius-based interval principal component analysis (SR-IPCA) for fault detection in industrial processes with imprecise data
Li et al. Dynamic Non-Gaussian hybrid serial modeling for industrial process monitoring
Jiang et al. Optimized Gaussian-process-based probabilistic latent variable modeling framework for distributed nonlinear process monitoring
CN108984851B (zh) 一种带时延估计的加权高斯模型软测量建模方法
Zhang et al. Intelligent fault diagnosis of machine under noisy environment using ensemble orthogonal contractive auto-encoder
Lucke et al. From oscillatory to non-oscillatory disturbances: A comparative review of root cause analysis methods
CN108170648B (zh) 一种基于已知数据回归的非高斯过程监测方法
Vankadara et al. Causal forecasting: generalization bounds for autoregressive models
Du et al. Fault diagnosis for dynamic system based on the independent latent space reconstruction of generative adversarial network
CN112001115A (zh) 一种半监督动态软测量网络的软测量建模方法
Li et al. Performance-driven ensemble ICA chemical process monitoring based on fault-relevant models
Liu et al. In-profile monitoring for cluster-correlated data in advanced manufacturing system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant