CN104699894B - 基于实时学习的高斯过程回归多模型融合建模方法 - Google Patents

基于实时学习的高斯过程回归多模型融合建模方法 Download PDF

Info

Publication number
CN104699894B
CN104699894B CN201510038932.XA CN201510038932A CN104699894B CN 104699894 B CN104699894 B CN 104699894B CN 201510038932 A CN201510038932 A CN 201510038932A CN 104699894 B CN104699894 B CN 104699894B
Authority
CN
China
Prior art keywords
data
model
parameter
formula
covariance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510038932.XA
Other languages
English (en)
Other versions
CN104699894A (zh
Inventor
熊伟丽
张伟
薛明晨
姚乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN201510038932.XA priority Critical patent/CN104699894B/zh
Publication of CN104699894A publication Critical patent/CN104699894A/zh
Application granted granted Critical
Publication of CN104699894B publication Critical patent/CN104699894B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于实时学习的高斯过程回归多模型融合建模方法。用于复杂多变的多阶段性的化工过程。该方法是一种在线不断更新的多模型策略。用高斯混合模型对过程的不同阶段进行辨识,并采用一种自适应实时学习方法,不断更新所建立的高斯过程回归模型。当新的数据到来时,在每个不同的阶段,基于欧式距离和角度原则选择部分相似的数据,用于建立局部的高斯过程回归模型。最终根据计算得到的新的数据隶属于每个不同阶段的后验概率,对局部模型进行融合输出。能够对关键变量进行精确预测,从而提高产品质量,降低生产成本。

Description

基于实时学习的高斯过程回归多模型融合建模方法
技术领域
本发明涉及基于实时学习的高斯过程回归多模型融合建模方法,属于复杂工业过程建模和软测量领域。
背景技术
目前,化工过程的复杂性正在日益增加,对产品质量的要求也在不断提高,现代工业往往需要装备一些先进的监控系统。然而由于某些关键质量变量的传感器价格昂贵、可靠性差或者具有很大的测量滞后性等缺点,导致一些重要的过程变量不能实时有效地测量。
为了解决这些问题,软测量技术在工业过程领域受到了越来越广泛的关注。在过去的十几年,基于数据驱动的软测量建模技术得到了广泛研究,用于提高产品的质量,降低对环境的影响。一些常用的线性回归的方法如偏最小二乘(partial least squares,PLS)、主成分分析(principal component analysis,PCA)等能够很好地处理输入变量和输出变量之间的线性关系。然而,输入和输出之间常常呈现非线性的关系,线性建模方法不再适用,非线性建模方法如人工神经网络(artificial neural networks,ANN)、支持向量机(support vector machine,SVM)、最小二乘支持向量机(least squares support vectormachine,LS-SVM)可以得到良好的预测精度。
虽然这些方法能够获得很好的全局泛化性能,但是工业过程常常呈现多阶段、时变的动态特性,预测效果往往不能得到保证。高斯过程回归(Gaussian processregression,GPR)能够基于相似准则建立局部模型,作为一种非参数概率模型,GPR模型不仅可以给出预测值,还可以得到预测值对模型的信任值。因此,选择GPR建立软测量模型。
化工过程呈现严重的非线性、时变性和多阶段性。针对于多阶性,可以通过对各个操作模式的划分,建立不同的局部模型,描述在不同操作阶段的动态特性。虽然可以对化工过程的不同阶段进行有效地划分,但是在每个操作阶段,过程的时变性和设备特性可能会发生变化,这些会使软测量模型的预测性能恶化。为了避免预测精度的降低,需要不断更新在线预测模型。
一种基于实时学习(just-in-time learning,JITL)的方法能够很好地处理过程的时变性和非线性,提高软测量模型的性能。与传统方法所建立的全局模型不同,JITL方法所建立的模型具有局部动态结构。传统的全局模型是离线建立的,而基于JITL方法的局部模型是在线建立的,该模型能够更好地跟踪过程当前的状态。同时,由于JITL建立的是局部模型,因此它能更好地处理过程的非线性。
发明内容
针对于化工过程呈现的非线性、时变性和多阶段行性,产品质量往往得不到保证,为了提高产品的质量,本发明提供一种可实时测量多阶段化工过程产品质量的多模型融合软测量建模方法。
通过GMM对化工过程不同的阶段性进行辨识,然后在特定的阶段用JITL选择部分相似数据建立局部PCA-GPR模型。最后,对于不同的操作阶段,根据辨识得到的后验概率对不同局部模型的输出进行融合,实现对化工过程产品质量的在线估计,从而提高产量,降低生产成本。
本发明的目的是通过以下技术方案实现的:
基于实习学习的高斯过程回归多模型融合建模方法,所述方法包括以下过程:针对于复杂多变的多阶段性的化工过程,用高斯混合模型对过程的不同阶段进行辨识,并采用一种自适应实时学习方法,不断更新所建立的高斯过程回归模型。
当新的数据到来时,在每个不同的阶段,基于欧式距离和角度原则选择部分相似的数据,用于建立局部的高斯过程回归模型。
最终根据计算得到的新的数据隶属于每个不同阶段的后验概率,对局部模型进行融合输出,能够对关键变量进行精确预测,从而提高产品质量,降低生产成本。
附图说明
图1是基于GMM和JITL-GPR的在线软测量多模型融合建模流程图;
图2不同比例CPU耗时;
图3不同比例预测的RMSE;
图4测试数据隶属于每个不同操作阶段的隶属度值;
图5是数据比例为70%时在线预测结果图;
具体实施方式
下面结合图1所示,对本发明做进一步详述:
以常见的化工过程——TE过程为例。实验数据来自于TE过程,对预测产品流中成分A的含量进行预测。
步骤1:收集输入输出数据组成历史训练数据库。
步骤2:利用这些训练数据估计得到高斯混合模型(Gaussian mixture model,GMM)的参数。然后把完整的输入和输出训练数据分配到不同的操作阶段。所述的GMM算法为:
GMM是由多个高斯成分混合而成,关于数据X∈Rn×m的概率密度函数可以表示为:
其中,m是过程变量的数目,n是样本数据的大小。是高斯混合模型的参数,其中μk和πk分别代表第k个高斯成分的均值、协方差和权值。同时,参数πk满足和0≤πk≤1。
式(1)中表示多元高斯概率密度函数:
通过期望最大化算法(expectation-maximization,EM)估计模型的参数,求解过程分为不断迭代的两步:
E-步:根据已有观测数据和由第k个成分产生的概率γk(xi),得到Q函数:
M-步:求解Q函数对每个参数的偏导数,可以获得新的参数估计值:
根据估计得到的GMM的参数,对于新的输入x*,其关于每个高斯成分的后验概率可以通过式(5)求得:
步骤3:根据步骤2辨识得到的不同操作阶段,对应建立不同的子数据库。当一个新数据到来,根据这个新的数据隶属于每个子数据库的后验概率,对应的后验概率最大的子数据库发生更新。
针对不同的操作阶段,为了对过程变量进行降维,解决不同变量之间很强的相关性,利用传统的PCA方法对过程变量进行分析得到PCA模型的得分变量。PCA算法为:
给定训练数据X∈Rn×m,m是过程变量的维数,n是训练数据的数目。PCA是在X的协方差矩阵基础上实现的。一般情况下,可以通过奇异值分解(singular valuedecomposition,SVD)的方法建模PCA模型。假设PCA模型有q个主成分,X可以被分解为如下形式:
式中,T∈Rn×q分别是主成分子空间和残差子空间的得分矩阵,P∈Rm ×q是主成分子空间和残差子空间相应的载荷矩阵,E是残差矩阵。
当需要对输入进行预测输出时,不需要知道这个新的数据具体隶属于哪个操作阶段,用JITL在每个操作阶段选择最相似的数据建立各个操作阶段的局部PCA-GPR模型。JITL算法如下:
Step1:计算xq和xi之间的欧氏距离和角度:
d(xq,xi)=||xq,xi||2,i=1,...,N (7)
如果cos(θi)≥0,计算相似系数si
式中γ是介于0和1之间的权重系数,如果cos(θi)<0,丢弃数据(xi,yi)。计算得到的si也在0和1之间,si越接近1,xi与xq的相似度越高。
对计算所得的所有相似系数si进行降序排列,建立局部模型时,只选择前L个相似系数较大的数据。为了选择合适比例的建模数据,针对于TE化工过程,数据比例选择从10%逐渐增大到100%,最后得到最佳的数据比例为70%。JITL进行数据选择时,不同的比例下CPU耗时和预测的精度如图2和图3所示。
根据JITL选择的数据建立的局部GPR模型为:
给定训练样本集X∈RD×N和y∈RN,其中X={xi∈RD}i=1...N,y={yi∈R}i=1...N分别代表D维的输入和输出数据。输入和输出之间的关系由公式(10)产生:
y=f(x)+ε (10)
其中f是未知的函数形式,ε是均值为0,方差为的高斯噪声。对于一个新的输入x*,相应的概率预测输出y*也满足高斯分布,其均值和方差如式(11)和(12)所示:
y*(x*)=cT(x*)C-1y (11)
式中c(x*)=[c(x*,x1),…,c(x*,xn)]T是训练数据和测试数据之间的协方差矩阵。是训练数据之间的协方差矩阵,I是N×N维的单位矩阵。c(x*,x*)是测试数据的自协方差。
GPR可以选择不同的协方差函数c(xi,xj)产生协方差矩阵Σ,只要选择的协方差函数能保证产生的协方差矩阵满足非负正定的关系。本文选择高斯协方差函数:
式中v控制协方差的量度,ωd代表每个成分xd的相对重要性。
对式(4)中的未知参数v,ω1,…,ωD和高斯噪声方差的估计,一般最简单的方法就是通过极大似然估计得到参数
为了求得参数θ的值,首先将参数θ设置为一个合理范围内的随机值,然后用共轭梯度法得到优化的参数。获得最优参数θ后,对于测试样本x*,可以用式(11)和(12)来估计GPR模型的输出值。
步骤6:对步骤5建立的各个操作阶段的局部模型利用式(5)所求的测试数据隶属于每个不同操作阶段的隶属度值(如图4所示)进行融合得到全局预测模型:
全局预测模型的输出即为产品流中成分A的含量的预测结果。
图5是数据比例为70%时在线预测产品流中成分A的含量和实际值拟合曲线,并且与LSSVM所建立的软测量模型进行了比较。由图可知,基于实习学习的高斯过程回归多模型融合建模能够有效地预测产品流中成分A的含量。

Claims (2)

1.基于实时学习的高斯过程回归多模型融合建模方法,其特征在于,该方法步骤为:
步骤1:收集输入输出数据组成历史训练数据库
步骤2:利用这些训练数据估计得到高斯混合模型(Gaussian mixture model,GMM)的参数,然后把完整的输入和输出训练数据分配到不同的操作阶段,所述的高斯混合模型算法为:
GMM是由多个高斯成分混合而成,关于输入数据集X∈Rn×m的概率密度函数可以表示为:
其中,m是过程变量的维数,n是训练样本的个数,xi∈Rm为输入数据集X中第i个样本的值,i=1,2,…,n, 是高斯混合模型的参数,其中μk和πk分别代表第k个高斯成分的均值、协方差和权值;同时,参数πk满足和0≤πk≤1,式(1)中表示多元高斯概率密度函数:
通过期望最大化算法(expectation-maximization,EM)估计模型的参数,求解过程分为不断迭代的两步:E-步:根据已有观测数据和由第k个高斯成分产生的概率模型来共同估计缺失数据γk(xi),得到Q函数:
M-步:求解Q函数对每个参数的偏导数,可以获得新的参数估计值:
根据估计得到的GMM的参数,对于新的输入x*,其关于每个高斯成分的后验概率可以通过式(5)求得:
步骤3:根据步骤2辨识得到的不同操作阶段,对应建立不同的子数据库,当一个新数据到来,根据这个新的数据隶属于每个子数据库的后验概率,对应的后验概率最大的子数据库发生更新;
步骤4:针对不同的操作阶段,为了对过程变量进行降维,解决不同变量之间的相关性,利用传统的PCA方法对过程变量进行分析得到PCA模型的得分变量,PCA算法为:
给定训练数据X∈Rn×m,m是过程变量的维数,n是训练数据的个数,PCA是在X的协方差矩阵基础上实现的,可以通过奇异值分解(singular value decomposition,SVD)的方法建立PCA模型;假设PCA模型有q个主成分,X可以被分解为如下形式:
式中,T∈Rn×q分别是主成分子空间和残差子空间的得分矩阵,P∈Rm×q是主成分子空间和残差子空间相应的载荷矩阵,E是残差矩阵;
步骤5:当需要对输入进行预测输出时,不需要知道这个新的数据具体隶属于哪个操作阶段,用JITL在每个操作阶段选择最相似的数据建立各个操作阶段的局部PCA-GPR模型;
JITL算法如下:Step1:计算新查询样本xq和训练样本xi之间的欧氏距离和角度:
d(xq,xi)=||xq,xi||2,i=1,...,N (7)
Δxq=xq-xq-1,Δxi=xi-xi-1
如果cos(θi)≥0,计算相似系数si
式中γ是介于0和1之间的权重系数,如果cos(θi)<0,丢弃数据(xi,yi),计算得到的si也在0和1之间,si越接近1,xi与xq的相似度越高;
Step2:对计算所得的所有相似系数si进行降序排列,建立局部模型时,只选择前L个相似系数较大的数据,为了选择合适比例的建模数据,针对于TE化工过程,数据比例选择从10%逐渐增大到100%,最后得到最佳的数据比例为70%;
根据JITL选择的数据建立的局部GPR模型为:
给定训练样本集X∈RD×N和y∈RN,其中X={xi∈RD}i=1…N,y={yi∈R}i=1…N分别代表D维的输入和输出数据,输入和输出之间的关系由公式(10)产生:
y=f(x)+ε (10)
其中f是未知的函数形式,ε是均值为0,方差为的高斯噪声,对于一个新的输入x*,相应的概率预测输出y*也满足高斯分布,其均值和方差如式(11)和(12)所示:
y*(x*)=cT(x*)C-1y (11)
式中c(x*)=[c(x*,x1),…,c(x*,xn)]T是训练数据和测试数据之间的协方差矩阵,是训练数据之间的协方差矩阵,I是N×N维的单位矩阵,c(x*,x*)是测试数据的自协方差;
GPR可以选择不同的协方差函数c(xi,xj)产生协方差矩阵Σ,只要选择的协方差函数能保证产生的协方差矩阵满足非负正定的关系,选择高斯协方差函数:
式中v控制协方差的量度,ωd代表每个成分xd的相对重要性;
对式(13)中的未知参数v,ω1,…,ωD和高斯噪声方差的估计,采用极大似然估计得到参数
为了求得参数θ的值,首先将参数θ设置为一个合理范围内的随机值,然后用共轭梯度法得到优化的参数,获得最优参数θ后,对于测试样本x*,可以用式(11)和(12)来估计GPR模型的输出值;
步骤6:对步骤5建立的各个操作阶段的局部模型利用式(5)进行融合得到全局预测模型:
2.根据权利要求1所述的基于实时学习的高斯过程回归多模型融合建模方法,其特征在于,当需要对新的数据用软测量模型进行预测时,实时对模型进行更新,而且不需要知道当前过程具体的操作模型。
CN201510038932.XA 2015-01-26 2015-01-26 基于实时学习的高斯过程回归多模型融合建模方法 Active CN104699894B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510038932.XA CN104699894B (zh) 2015-01-26 2015-01-26 基于实时学习的高斯过程回归多模型融合建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510038932.XA CN104699894B (zh) 2015-01-26 2015-01-26 基于实时学习的高斯过程回归多模型融合建模方法

Publications (2)

Publication Number Publication Date
CN104699894A CN104699894A (zh) 2015-06-10
CN104699894B true CN104699894B (zh) 2017-07-28

Family

ID=53347010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510038932.XA Active CN104699894B (zh) 2015-01-26 2015-01-26 基于实时学习的高斯过程回归多模型融合建模方法

Country Status (1)

Country Link
CN (1) CN104699894B (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160342731A1 (en) * 2014-02-07 2016-11-24 Mitsubishi Electric Corporation System identification device
CN105224784A (zh) * 2015-06-29 2016-01-06 南京大学 针对传感器采集数据的局部增量式的概率密度估计方法
CN105205224B (zh) * 2015-08-28 2018-10-30 江南大学 基于模糊曲线分析的时间差高斯过程回归软测量建模方法
WO2017084016A1 (zh) * 2015-11-16 2017-05-26 华为技术有限公司 模型参数融合方法及装置
CN106156434B (zh) * 2016-07-11 2020-03-17 江南大学 基于局部时滞重构的滑动窗时间差-高斯过程回归建模方法
CN108009558B (zh) * 2016-10-31 2021-11-26 北京君正集成电路股份有限公司 基于多模型的目标检测方法及装置
CN107272655B (zh) * 2017-07-21 2019-08-06 江南大学 基于多阶段ica-svdd的间歇过程故障监测方法
CN107451101B (zh) * 2017-07-21 2020-06-09 江南大学 一种分层集成的高斯过程回归软测量建模对脱丁烷塔底丁烷浓度进行预测的方法
CN108181894B (zh) * 2017-12-15 2020-11-24 宁波大学 一种基于修剪独立元回归策略的非高斯过程监测方法
CN108153267B (zh) * 2017-12-15 2020-06-30 宁波大学 一种基于误差主元分析模型的工业过程监测方法
CN108549757B (zh) * 2018-04-03 2021-10-26 浙江工业大学 一种模型自选择的往复式混输泵排出流率预测方法
CN108764295B (zh) * 2018-04-28 2021-05-28 江南大学 一种基于半监督集成学习的软测量建模对脱丁烷塔底丁烷浓度进行预测的方法
CN108732931B (zh) * 2018-05-17 2021-03-26 北京化工大学 一种基于jit-rvm的多模态间歇过程建模方法
CN108959182B (zh) * 2018-05-21 2021-09-17 北京理工大学 基于高斯过程回归的小天体引力场建模方法
CN108804784A (zh) * 2018-05-25 2018-11-13 江南大学 一种基于贝叶斯高斯混合模型的即时学习软测量建模方法
CN109031153B (zh) * 2018-10-16 2020-01-24 北京交通大学 一种锂离子电池的健康状态在线估计方法
CN109656202B (zh) * 2018-12-06 2021-07-30 南通大学 基于局部和结构一致性流形gmm的多模态过程监测方法
CN110046378B (zh) * 2019-02-28 2022-09-13 昆明理工大学 一种基于进化多目标优化的选择性分层集成高斯过程回归软测量建模方法
CN110795841B (zh) * 2019-10-24 2021-10-22 北京交通大学 一种间歇性能源出力不确定性的数学建模方法
CN110910980A (zh) * 2019-11-27 2020-03-24 医惠科技有限公司 一种脓毒血症的预警装置、设备及存储介质
CN111650641B (zh) * 2020-06-05 2023-04-25 河南工业大学 一种地壳三维结构模型融合方法及装置
CN111781467B (zh) * 2020-07-13 2022-12-09 贵州电网有限责任公司 一种基于多维全景数据的电网故障智能判别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102798823A (zh) * 2012-06-15 2012-11-28 哈尔滨工业大学 基于高斯过程回归的锂电池健康状况预测方法
CN103927412A (zh) * 2014-04-01 2014-07-16 浙江大学 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN104021525A (zh) * 2014-05-30 2014-09-03 西安交通大学 一种道路场景视频图像序列的背景修复方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102798823A (zh) * 2012-06-15 2012-11-28 哈尔滨工业大学 基于高斯过程回归的锂电池健康状况预测方法
CN103927412A (zh) * 2014-04-01 2014-07-16 浙江大学 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN104021525A (zh) * 2014-05-30 2014-09-03 西安交通大学 一种道路场景视频图像序列的背景修复方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
NonlinearprocessmonitoringusingJITL-PCA;ChengCheng;《ChemometricsandIntelligentLaboratorySystems》;20051231;1-13 *
On-line estimation of concentration parameters in fermentation processes;熊志化 等;《Journal of Zhejiang University SCIENCE》;20061231;1-5 *
一种改进高斯过程的回归建模方法;张乐 等;《华中科技大学学报 (自然科学版)》;20131031;1-4 *

Also Published As

Publication number Publication date
CN104699894A (zh) 2015-06-10

Similar Documents

Publication Publication Date Title
CN104699894B (zh) 基于实时学习的高斯过程回归多模型融合建模方法
CN107451101B (zh) 一种分层集成的高斯过程回归软测量建模对脱丁烷塔底丁烷浓度进行预测的方法
CN109060001B (zh) 一种基于特征迁移学习的多工况过程软测量建模方法
CN107451102A (zh) 一种改进自训练算法的半监督高斯过程回归软测量建模方法
CN103927412B (zh) 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN104778298B (zh) 基于egmm的高斯过程回归软测量建模方法
CN108804784A (zh) 一种基于贝叶斯高斯混合模型的即时学习软测量建模方法
WO2021036546A1 (zh) 基于有偏估计的近红外定量分析模型构建方法
CN112101684B (zh) 一种插电式混合动力车辆实时能量管理方法和系统
CN111768000A (zh) 在线自适应微调深度学习的工业过程数据建模方法
CN105425583B (zh) 基于协同训练lwpls的青霉素生产过程的控制方法
CN110046378A (zh) 一种基于进化多目标优化的选择性分层集成高斯过程回归软测量建模方法
CN109635245A (zh) 一种鲁棒宽度学习系统
CN104504475A (zh) 基于ar*-svm混合建模的雾霾时间序列预测方法
CN110691319B (zh) 一种使用领域自适应实现异构设备高精度室内定位的方法
CN104865827B (zh) 一种基于多工况模型的抽油机采油优化方法
CN111079856B (zh) 一种基于csjitl-rvm的多时段间歇过程软测量建模方法
CN107798383A (zh) 改进的核极限学习机定位方法
CN107403196A (zh) 基于谱聚类分析的即时学习建模方法
CN104778506A (zh) 基于局部集成学习的短期风速预报方法
CN105844334B (zh) 一种基于径向基神经网络的温度插值方法
CN104634265A (zh) 一种基于多元图像特征融合的矿物浮选泡沫层厚度软测量方法
CN116454870A (zh) 一种区域分布式光伏短期功率预测方法
CN109493921B (zh) 一种基于多代理模型的常压精馏过程建模方法
CN115472233A (zh) 基于热扩散标签传播的半监督集成工业过程软测量建模方法、系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant