CN108197380B - 基于偏最小二乘的高斯过程回归废水出水指标预测方法 - Google Patents

基于偏最小二乘的高斯过程回归废水出水指标预测方法 Download PDF

Info

Publication number
CN108197380B
CN108197380B CN201711476291.1A CN201711476291A CN108197380B CN 108197380 B CN108197380 B CN 108197380B CN 201711476291 A CN201711476291 A CN 201711476291A CN 108197380 B CN108197380 B CN 108197380B
Authority
CN
China
Prior art keywords
gaussian process
model
prediction
process regression
covariance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711476291.1A
Other languages
English (en)
Other versions
CN108197380A (zh
Inventor
刘鸿斌
杨冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Forestry University
Original Assignee
Nanjing Forestry University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Forestry University filed Critical Nanjing Forestry University
Priority to CN201711476291.1A priority Critical patent/CN108197380B/zh
Publication of CN108197380A publication Critical patent/CN108197380A/zh
Application granted granted Critical
Publication of CN108197380B publication Critical patent/CN108197380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本发明公开了一种基于偏最小二乘的高斯过程回归废水出水指标预测方法,该方法可用于存在较强的时变性、耦合性、非线性、滞后性以及其他复杂特性的工业过程。首先,基于偏最小二乘的方法对多元输入数据进行降维,并选取合适的得分向量作为高斯过程回归模型的输入;之后,通过对协方差函数的选取与组合,构建不同种类的高斯过程回归软测量模型对输出数据进行预测;最后,使用测试集数据对模型的预测能力进行评价。造纸废水处理过程数据的建模结果表明,基于偏最小二乘对被测变量的降维技术可以提高高斯过程回归模型的预测能力;由不同协方差函数构建的高斯过程回归模型为出水指标的预测提供了多种选择,更加适合复杂多变的造纸废水处理环境。

Description

基于偏最小二乘的高斯过程回归废水出水指标预测方法
技术领域
本发明涉及造纸废水处理过程中出水指标的软测量方法,具体涉及一种基于偏最小二乘的高斯过程回归废水出水指标预测方法。
背景技术
在造纸废水处理过程中,存在着大量难以测量或无法在线测量的参数,同时这类参数密切影响着出水指标的控制,例如化学需氧量(Chemical Oxygen Demand,COD)和悬浮固形物(Suspended Solids,SS),这类参数被称作主导变量。及时、准确地对主导变量做出检测并控制显得尤为重要,然而,过高的硬件成本成为参数在线测量的主要限制。软测量方法可根据被测变量的选取与测量完成对主导变量的预测,因此使用软测量方法对出水指标进行预测与控制是当前研究的热点问题之一。
被测变量的选取没有通用性的指导准则。一般被测变量的选取与主导变量有密切的关系,通常构造某种数学模型来完成对主导变量的在线预测。若被测变量选取过多会使模型过于复杂,选取过少会丢失部分信息而降低模型精度,因此被测变量的选取十分关键。可考虑引入数据降维方法对被测变量进行选取,数据降维可确保在数据信息损失最少的原则下,对高维变量空间进行综合和简化,以此提高预测模型对数据信息的分析能力。常用的数据降维方法有主成分分析(Principal Component Analysis,PCA)和偏最小二乘(Partial Least Squares,PLS)。相比于PCA,PLS在概括自变量系统信息的同时,注重要求所提取的得分向量对因变量的解释能力,因此更具备质量相关特性。
在造纸废水处理领域,软测量模型的种类可以划分为:机理模型、回归分析模型与人工智能模型。机理模型的构建是根据有关工艺机理列出平衡方程,建立被测变量与主导变量间的数学关系。回归分析模型中常用的方法为多元线性回归,适用于多种因素关联的变化结果,其分析的技术核心是最小二乘法,属于线性方法。人工智能模型中人工神经网络(Artificial Neural Network,ANN)和支持向量机(Support Vector Machine,SVM)应用较为广泛,属于非线性处理方法。
高斯过程回归(Gaussian Process Regression,GPR)用来描述函数的分布问题,该方法的理论提出可以追溯到20世纪40年代,在1996年被Williams和Rasmussen应用于机器学习。相比于ANN与SVM而言,GPR具有容易实现、协方差函数可调、灵活的非参数推广以及超参数自适应调节等优点,可以对预测输出做出概率解释。
现在,在造纸废水处理领域通过对测量仪表的升级可获取影响出水指标的主导变量,但是此类硬件仪表要么成本过高不宜推广,要么精度有限影响测量结果;一般来说,被测变量的选取往往先根据工艺知识,初选出与主导变量关系最为密切的变量,然后通过相关分析与工艺专家知识相结合,最后筛选出数量上比较合适的被测变量,但是该方法没有从数据的内在角度对被测变量与主导变量间的相关性进行分析,较难获取合适的被测变量与精确的预测效果。
发明内容
本发明针对上述现有技术中存在的问题,提供一种基于偏最小二乘的高斯回归软测量建模方法,对于造纸废水处理过程中的复杂特性,提供了方法冗余,降低了硬件成本,提高了对出水指标的预测精度。
本发明是通过以下技术方案实现的:
基于偏最小二乘的高斯过程回归废水出水指标预测方法,采用偏最小二乘PLS完成对被测变量个数的小范围选取,使变量降低维度的同时与主导变量具备更高的相关性,再结合不同协方差函数的构建高斯过程回归模型GPR,以此提供不同模型的对比,实现最优预测。
具体的说,该过程包括以下步骤:
S1.数据预处理:首先选择训练样本输入数据X∈Rn×m(n代表样本个数,m代表样本维数),其次选择训练样本输出数据Y∈Rn×p(p代表样本维数),最后完成对输入数据和输出数据的标准化处理,使其均值为0,标准差为1;
S2.PLS模型的构建:对输入数据X和输出数据Y进行PLS分解,选取合适的潜变量以完成得分矩阵T∈Rn×d(d为潜变量个数的筛选),筛选后的得分矩阵作为软测量模型的输入进行数据预测;
S3.建立所述得分矩阵T与输出数据Y之间的GPR模型:通过不同协方差函数的选取与组合构建不同的高斯过程回归模型;
S4.完成对不同软测量模型预测能力的评估:将测试集输入数据带入模型进行预测,根据输出数据的预测值与真实值计算出不同模型对应的均方根误差(RMSE)与决定系数(R2),并做出对比选择最佳预测模型。
步骤S2中,PLS模型对输入数据X和输出数据Y分解如下:
Figure GDA0003066131490000031
式中T∈Rn×d为得分矩阵;P∈Rm×d和Q∈Rp×d分别为X和Y的负载矩阵;E和F分别为X和Y的残差矩阵,d为PLS潜变量的个数;求解PLS模型的典型算法为非线性迭代最小二乘法。
步骤S3包括:
S31:高斯过程表示为:
f(x)~GP(m(x),k(x,x')) (2)
式中m(x)为均值函数,k(x,x')为协方差函数,分别表示为:
Figure GDA0003066131490000032
式中x和x'为随机变量。数据经标准化处理后均值为0,因此高斯过程可简化表示为:
f(x)~GP(0,k(x,x')) (4)
将噪声考虑到观测目标值y中,考虑如下回归模型:
y=f(xi)+ε (5)
式子中xi为样本输入数据,f(xi)为函数值,y为目标观测值,
Figure GDA0003066131490000033
为高斯白噪声。则y的先验分布可表示为:
Figure GDA0003066131490000034
观测值y与预测值f*的联合联合先验分布为:
Figure GDA0003066131490000041
X为训练集的输入,X*为测试集的输入;K(X,X*)=K(X*,X)T代表着训练集X与测试集X*样本点间的协方差矩阵,K(X*,X*)为测试集X*样本自身的协方差;In为n维单位矩阵。由此,高斯过程回归的预测值可表示为:
Figure GDA0003066131490000042
其中
Figure GDA0003066131490000043
Figure GDA0003066131490000044
S32:协方差函数的选择:
高斯过程回归可以选择不同的协方差函数进行预测,本文采用的三种协方差函数为:
(1)平方指数协方差函数(Squared Exponential Covariance Function,SE)
Figure GDA0003066131490000045
式中,M=diag(l2),l为方差尺度,
Figure GDA0003066131490000046
为信号方差。参数的集合θ={l,σf}为超参数;
(2)线性协方差函数(Linear Covariance Function,L)
kL(x,x')=xTM-1x' (12)
同平方指数协方差函数,M=diag(l2),l为线性协方差函数的超参数;
(3)周期性协方差函数(Periodic Covariance Function,P)
kP(x,x')=k0(u(x),u(x')) (13)
式中k0为任意随机核函数,周期性协方差函数将一维输入变量映射到二维u(x)空间,从而得到关于x的周期性随机函数:
Figure GDA0003066131490000051
若k0=kSE(x,x'),则kP(x,x')可以转化为:
Figure GDA0003066131490000052
这里kP(x,x')的超参数集合可表示为θ={p,l,σf};
S33:协方差函数的组合:
高斯过程允许组合不同的协方差函数产生新的协方差函数,本文采用累加的方式进行协方差函数的组合,本文对协方差函数的选择如表1所示;
表1 GPR协方差函数的7种组合类型
Figure GDA0003066131490000053
S34:超参数的获取:
超参数的集合一般通过最大似然法求得:
Figure GDA0003066131490000054
其中
Figure GDA0003066131490000055
令式(16)对超参数θ求偏导,然后可以采用共轭梯度法得到超参数的最优解;获得超参数后,利用式(9)和(10)对测试点X*对应的预测值f*和方差
Figure GDA0003066131490000056
进行计算。
步骤S4包括:
S41:根据输出数据的预测值与真实值计算出不同模型对应的均方根误差(RootMean Square Error,RMSE):
Figure GDA0003066131490000061
式中,
Figure GDA0003066131490000062
是估计值,yi是测量值,n为样本数;
S42:根据输出数据的预测值与真实值计算出不同模型对应的决定系数R2(Coefficient of Determination):
Figure GDA0003066131490000063
式中:
Figure GDA0003066131490000064
Figure GDA0003066131490000065
SSres代表残差平方和,SStot代表总变异平方和,
Figure GDA0003066131490000066
是平均值。
S43:RMSE越接近于0,代表该模型预测实验数据具有更好的精确度;R2的结果一般在0到1之间,R2越接近1,拟合程度越高。
该方法优势在于利用PLS对输入数据和输出数据同时进行特征提取,使得对输入数据进行筛选的同时保持与输出端的质量相关特性;通过对协方差函数的选取与组合分别建立高斯过程模型,使该方法为复杂的造纸废水处理系统提供多个选择模型,可降低硬件成本,达到较好的预测效果。
附图说明
图1是基于偏最小二乘的高斯过程回归软测量建模方法流程图;
图2是活性污泥污水处理流程图;
图3是造纸废水处理过程数据折线图;
图4是GPR模型在协方差函数选择case 3时对测试集数据的出水COD预测结果图;
图5是GPR模型在协方差函数选择case 7时对测试集数据的出水SS预测结果图;
图6是PLS-GPR模型在PLS选取4个潜变量和协方差函数选择case 3时对测试集数据的出水COD预测结果图;
图7是PLS-GPR模型在PLS选取4个潜变量和协方差函数选择case 4时对测试集数据的出水SS预测结果图。
具体实施方式
该方法对造纸废水处理过程的出水指标进行预测所采取的技术方案是:
S1.数据预处理:首先选择训练样本输入数据X∈Rn×m(n代表样本个数,m代表样本维数),其次选择训练样本输出数据Y∈Rn×p(p代表样本维数),最后完成对输入数据和输出数据的标准化处理,使其均值为0,标准差为1;
S2.PLS模型的构建:对输入数据X和输出数据Y进行PLS分解,选取合适的潜变量以完成得分矩阵T∈Rn×d(d为潜变量个数的筛选),筛选后的得分矩阵作为软测量模型的输入进行数据预测;
S3.建立得分矩阵与输出数据之间的GPR模型:通过不同协方差函数的选取与组合构建不同的高斯过程回归模型;
S4.完成对不同软测量模型预测能力的评估:将测试集输入数据带入模型进行预测,根据输出数据的预测值与真实值计算出不同模型对应的均方根误差RMSE与决定系数R2,并做出对比选择最佳预测模型。
步骤S2中,PLS模型对输入数据X和输出数据Y分解如下:
Figure GDA0003066131490000071
式中T∈Rn×d为得分矩阵;P∈Rm×d和Q∈Rp×d分别为X和Y的负载矩阵;E和F分别为X和Y的残差矩阵,d为PLS潜变量的个数;求解PLS模型的典型算法为非线性迭代最小二乘法。
步骤S3包括:
S31:高斯过程表示为:
f(x)~GP(m(x),k(x,x')) (2)
式中m(x)为均值函数,k(x,x')为协方差函数,分别表示为:
Figure GDA0003066131490000081
式中x和x'为随机变量。数据经标准化处理后均值为0,因此高斯过程可简化表示为:
f(x)~GP(0,k(x,x')) (4)
将噪声考虑到观测目标值y中,考虑如下回归模型:
y=f(xi)+ε (5)
式中xi为样本输入数据,f(xi)为函数值,y为目标观测值,
Figure GDA0003066131490000082
为高斯白噪声。则y的先验分布可表示为:
Figure GDA0003066131490000083
观测值y与预测值f*的联合先验分布为:
Figure GDA0003066131490000084
X为训练集的输入,X*为测试集的输入;K(X,X*)=K(X*,X)T代表着训练集X与测试集X*样本点间的协方差矩阵,K(X*,X*)为测试集X*样本自身的协方差;In为n维单位矩阵。由此,高斯过程回归的预测值可表示为:
Figure GDA0003066131490000085
其中
Figure GDA0003066131490000086
Figure GDA0003066131490000091
S32:协方差函数的选择:
高斯过程回归可以选择不同的协方差函数进行预测,本文采用的三种协方差函数为:
(1)平方指数协方差函数(Squared Exponential Covariance Function,SE)
Figure GDA0003066131490000092
式中,M=diag(l2),l为方差尺度,
Figure GDA0003066131490000093
为信号方差。参数的集合θ={l,σf}为超参数;
(2)线性协方差函数(Linear Covariance Function,L)
kL(x,x')=xTM-1x' (12)
同平方指数协方差函数,M=diag(l2),l为线性协方差函数的超参数;
(3)周期性协方差函数(Periodic Covariance Function,P)
kP(x,x')=k0(u(x),u(x')) (13)
式中k0为任意随机核函数,周期性协方差函数将一维输入变量映射到二维u(x)空间,从而得到关于x的周期性随机函数:
Figure GDA0003066131490000094
若k0=kSE(x,x'),则kP(x,x')可以转化为:
Figure GDA0003066131490000095
这里kP(x,x')的超参数集合可表示为θ={p,l,σf};
S33:协方差函数的组合:
高斯过程允许组合不同的协方差函数产生新的协方差函数,本文采用累加的方式进行协方差函数的组合,本文对协方差函数的选择如表1所示;
S34:超参数的获取:
超参数的集合一般通过最大似然法求得:
Figure GDA0003066131490000101
其中
Figure GDA0003066131490000102
令式(16)对超参数θ求偏导,然后可以采用共轭梯度法得到超参数的最优解;获得超参数后,利用式(9)和(10)对测试点X*对应的预测值f*和方差
Figure GDA0003066131490000103
进行计算。
步骤S4包括:
S41:根据输出数据的预测值与真实值计算出不同模型对应的均方根误差(RootMean Square Error,RMSE):
Figure GDA0003066131490000104
式中,
Figure GDA0003066131490000105
是估计值,yi是测量值,n为样本数;
S42:根据输出数据的预测值与真实值计算出不同模型对应的决定系数R2(Coefficient of Determination):
Figure GDA0003066131490000106
式中:
Figure GDA0003066131490000107
Figure GDA0003066131490000108
SSres代表残差平方和,SStot代表总变异平方和,
Figure GDA0003066131490000109
是平均值。
S43:RMSE越接近于0,代表该模型预测实验数据具有更好的精确度;R2的结果一般在0到1之间,R2越接近1,拟合程度越高。
实施例1:
以实际废水处理过程为例,活性污泥法主要包括了预处理、初沉、曝气、二沉和污泥回流5个部分,如图2所示,利用在曝气池内的微生物群体的凝聚、吸附、氧化分解等作用去除污水中的有机物。
废水数据采取广东东莞某造纸厂的好氧段废水监测数据,数据包括8个废水变量,每个变量包括170个测量值。如图3所示,左侧纵坐标分别对应进水化学需氧量(COD)、出水化学需氧量、进水悬浮固形物(SS)、出水悬浮固形物;右侧纵坐标分别对应溶解氧DO、流量Q、温度T、pH值。
通过MATLAB对上述算法进行仿真并结合图1所示,对本发明做进一步详述:
第一步:对现场采集到的170组测量数据进行标准化处理。将前100个样本作为训练集用于模型的建立,后70个样本作为测试集,用于检测模型的预测能力。预测模型的输入端是由进水化学需氧量、进水悬浮固形物、溶解氧DO、流量Q、温度T、pH值6个输入变量构成,也可结合实际情况选取不同的废水处理指标量;输出端为出水化学需氧量、出水悬浮固形物2个变量构成。
第二步:完成PLS模型的构建,并对输入数据X和输出数据Y进行模型分解。根据表2可得出输出数据的累计方差贡献率在潜变量超过3后变化平缓,故选3个潜变量较为合适。为了对比不同潜变量的选取所对应的预测结果,在选取3个潜变量的同时分别选取4和5个潜变量进行数据降维与得分矩阵的筛选,筛选后的得分矩阵作为软测量模型的输入结合相应的预测模型进行数据预测,通过比较RMSE与R2的大小,选取最佳预测模型。
表2 PLS模型潜变量数量对贡献率及累计贡献率的影响
Figure GDA0003066131490000111
第三步:建立得分矩阵与输出数据之间的GPR模型,通过比较不同协方差函数的选取所对应的预测结果,选择最优预测模型。
第四步:完成传统的GPR模型与PLS-GPR模型预测能力的评估。表3显示,基于PLS-GPR的软测量模型优于传统GPR软测量模型,对于出水COD,最优PLS-GPR模型(PLS选取4个潜变量和协方差函数选择case 3)较传统最优GPR模型(协方差函数选择case 3)预测能力提高了0.36%;对于出水SS,最优PLS-GPR模型(PLS选取4个潜变量和协方差函数选择case 4)较传统最优GPR模型(协方差函数选择case 7)预测能力提高了5.58%。传统最优GPR模型对出水COD和出水SS的预测分别如图4与图5所示。最优PLS-GPR模型对出水COD和出水SS的预测分别如图6和图7所示。
表3出水COD和出水SS的测试集预测结果
Figure GDA0003066131490000121
Figure GDA0003066131490000131
考虑到造纸废水处理过程中的生化反应与过程工艺参数的复杂性,传统的单一建模方法很难确定最优的被测变量与预测模型。本发明方法采用具备质量相关特性的PLS方法对预测模型的输入数据进行筛选,得到合适的得分向量进行数据预测;由不同协方差函数构建的高斯过程回归模型更加适合复杂多变的造纸废水处理环境,为出水指标的预测提供了多个选择模型,降低了硬件成本,提高了预测精度。
本专利具体应用途径很多,以上所述仅为本专利的优选实施方案,并非因此限制本专利的实施方式及保护范围,对于本领域技术人员而言,在本专利原理的前提下作出等同替换和显而易见变化所得到的方案,均应当包含在专利的保护范围内。

Claims (4)

1.基于偏最小二乘的高斯过程回归废水出水指标预测方法,其特征在于,所述方法采用偏最小二乘完成对被测变量个数的小范围选取,所述被测变量为废水的进水化学需氧量COD、出水化学需氧量、进水悬浮固形物SS、出水悬浮固形物;溶解氧DO、流量Q、温度T、pH值;使变量降低维度的同时与主导变量具备更高的相关性,再结合不同协方差函数构建高斯过程回归模型,以此提供不同模型的对比实现最优预测;实现对出水化学需氧量、出水悬浮固形物的在线预测;
该方法包括以下步骤:
S1.数据预处理:首先选择训练样本输入数据X∈Rn×m,n代表样本个数,m代表样本维数,其次选择训练样本输出数据Y∈Rn×p,p代表样本维数,最后完成对输入数据和输出数据的标准化处理;所述输入数据为所述被测变量的实测数值,所述输出数据为出水化学需氧量、出水悬浮固形物;
S2.PLS模型的构建:对输入数据X和输出数据Y进行PLS分解,选取合适的潜变量以完成得分矩阵T∈Rn×d,d为潜变量个数的筛选,筛选后的得分矩阵作为软测量模型的输入进行数据预测;
S3.建立所述得分矩阵T与输出数据Y之间的高斯过程回归模型:通过不同协方差函数的选取与组合构建不同的高斯过程回归模型;步骤S3包括:
S31:求取高斯过程回归的预测值为:
Figure FDA0003314351040000011
其中
Figure FDA0003314351040000012
Figure FDA0003314351040000013
X为训练集的输入,X*为测试集的输入;K(X,X*)=K(X*,X)T代表着训练集X与测试集X*样本点间的协方差矩阵,K(X*,X*)为测试集X*样本自身的协方差;In为n维单位矩阵;y为观测目标值;σ为高斯白噪声;
S32:通过不同协方差函数构建高斯过程回归模型;
S33:采用累加的方式进行协方差函数的组合;所述协方差函数包括平方指数协方差函数SE、线性协方差函数L、周期性协方差函数P;
采用平方指数协方差函数SE构建的高斯过程回归模型为:
Figure FDA0003314351040000021
式中,M=diag(l2),l为线性协方差函数的超参数,
Figure FDA0003314351040000022
为信号方差,参数的集合θ={l,σf}为超参数;
采用线性协方差函数L构建的高斯过程回归模型为:
kL(x,x')=xTM-1x' (12)
同平方指数协方差函数,M=diag(l2),l为线性协方差函数的超参数;
采用周期性协方差函数P构建的高斯过程回归模型为:
kP(x,x')=k0(u(x),u(x')) (13)
式中k0为任意随机核函数,周期性协方差函数将一维输入变量映射到二维u(x)空间,从而得到关于x的周期性随机函数:
Figure FDA0003314351040000023
若k0=kSE(x,x'),则kP(x,x')转化为:
Figure FDA0003314351040000024
这里kP(x,x')的超参数集合表示为θ={p,l,σf};
S34:超参数的获取:
超参数的集合通过最大似然法求得:
Figure FDA0003314351040000025
其中
Figure FDA0003314351040000026
令式(16)对超参数θ求偏导,采用共轭梯度法得到超参数的最优解;获得超参数后,利用式(9)和(10)对测试集X*对应的预测值f*和预测方差
Figure FDA0003314351040000027
进行计算;S4.完成对不同软测量模型预测能力的评估:将测试集输入数据带入模型进行预测,根据输出数据的预测值与真实值计算出不同模型对应的均方根误差RMSE与决定系数R2,并做出对比选择最佳预测模型。
2.根据权利要求1所述的基于偏最小二乘的高斯过程回归废水出水指标预测方法,其特征在于,步骤S2中,偏最小二乘模型对输入数据X和输出数据Y分解如下:
Figure FDA0003314351040000031
式中T∈Rn×d为得分矩阵;P∈Rm×d和Q∈Rp×d分别为X和Y的负载矩阵;E和F分别为X和Y的残差矩阵,d为PLS潜变量的个数;求解PLS模型的典型算法为非线性迭代最小二乘法。
3.根据权利要求1所述的基于偏最小二乘的高斯过程回归废水出水指标预测方法,其特征在于,步骤S4包括:
S41:根据输出数据的预测值与真实值计算出不同模型对应的均方根误差RMSE:
Figure FDA0003314351040000032
式中,
Figure FDA0003314351040000033
是估计值,yi是测量值,n为样本数;
S42:根据输出数据的预测值与真实值计算出不同模型对应的决定系数R2
Figure FDA0003314351040000034
式中:
Figure FDA0003314351040000035
Figure FDA0003314351040000036
SSres代表残差平方和,SStot代表总变异平方和,
Figure FDA0003314351040000037
是平均值。
4.根据权利要求3所述的基于偏最小二乘的高斯过程回归废水出水指标预测方法,其特征在于,所述RMSE值越接近于0,代表该模型预测实验数据具有越高的精确度;R2的结果在0到1之间,R2越接近1,拟合程度越高。
CN201711476291.1A 2017-12-29 2017-12-29 基于偏最小二乘的高斯过程回归废水出水指标预测方法 Active CN108197380B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711476291.1A CN108197380B (zh) 2017-12-29 2017-12-29 基于偏最小二乘的高斯过程回归废水出水指标预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711476291.1A CN108197380B (zh) 2017-12-29 2017-12-29 基于偏最小二乘的高斯过程回归废水出水指标预测方法

Publications (2)

Publication Number Publication Date
CN108197380A CN108197380A (zh) 2018-06-22
CN108197380B true CN108197380B (zh) 2021-11-30

Family

ID=62586299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711476291.1A Active CN108197380B (zh) 2017-12-29 2017-12-29 基于偏最小二乘的高斯过程回归废水出水指标预测方法

Country Status (1)

Country Link
CN (1) CN108197380B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109035345A (zh) * 2018-07-20 2018-12-18 齐鲁工业大学 基于高斯过程回归的tof相机距离校正方法
CN109256142B (zh) * 2018-09-27 2022-12-02 河海大学常州校区 语音转换基于扩展内核类网格法处理零散数据建模方法及设备
CN109409590A (zh) * 2018-10-15 2019-03-01 中国环境科学研究院 一种用于淡水水生生物水质基准预测的系统
CN109492265B (zh) * 2018-10-18 2022-04-22 南京林业大学 基于动态非线性pls软测量方法的废水出水指标预测方法
CN109472070A (zh) * 2018-10-27 2019-03-15 北京化工大学 一种基于pls的esn加热炉操作变量的软测量方法
CN109242224A (zh) * 2018-11-29 2019-01-18 杭州电子科技大学 一种新型化工过程质量预测方法
CN110444298A (zh) * 2019-07-02 2019-11-12 北京大学 基于高斯过程模型的流感预测建模方法及装置
CN110609476B (zh) * 2019-09-19 2022-04-12 太原理工大学 一种基于高斯过程模型的多变量非线性动态系统模型预测控制方法
CN110619190A (zh) * 2019-10-07 2019-12-27 桂林理工大学 一种基于gpr的危岩落石运移距离预测方法及装置
CN111027611A (zh) * 2019-12-04 2020-04-17 南京林业大学 基于动态贝叶斯网络的模糊pls建模方法
CN111144644B (zh) * 2019-12-24 2022-01-28 淮阴工学院 基于变分异方差高斯过程回归的短期风速预测方法
CN111258222B (zh) * 2020-02-27 2021-06-25 西南大学 自回归滑动平均系统自适应状态估计方法及闭环控制系统
CN111368376B (zh) * 2020-03-05 2020-12-29 力度工业智能科技(苏州)有限公司 基于高斯过程模型的圆形轮廓误差监控方法
CN111553048B (zh) * 2020-03-23 2023-09-22 中国地质大学(武汉) 一种基于高斯过程回归的烧结过程运行性能预测的方法
CN111679643B (zh) * 2020-06-28 2021-10-15 中国矿业大学 基于过程迁移模型的间歇过程二阶修正自适应优化方法
CN113222324B (zh) * 2021-03-13 2023-04-07 宁波大学科学技术学院 一种基于pls-pso-rbf神经网络模型的污水质量监测方法
CN113190956B (zh) * 2021-03-19 2022-11-22 广东工业大学 一种面向制造业大数据的回归建模方法
CN113113150A (zh) * 2021-04-15 2021-07-13 上海交通大学医学院附属第九人民医院 淋巴结转移预测模型构建与训练方法、装置、设备和介质
CN114527657A (zh) * 2022-02-06 2022-05-24 西北工业大学 一种基于高斯过程的水下滑翔机系统辨识方法
CN115096359A (zh) * 2022-06-17 2022-09-23 北京航空航天大学 一种金属屋面健康监测系统及方法
CN116028757B (zh) * 2023-03-29 2023-07-21 中国测试技术研究院 一种基于多源信息融合的最优软测量模型生成方法及系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8140147B2 (en) * 2002-04-04 2012-03-20 Veralight, Inc. Determination of a measure of a glycation end-product or disease state using a flexible probe to determine tissue fluorescence of various sites
JP2011242923A (ja) * 2010-05-17 2011-12-01 Fuji Electric Co Ltd モデルの入力変数調整装置
TWI413006B (zh) * 2010-06-01 2013-10-21 Nat Univ Tsing Hua 建立自適應性軟體量測之方法
CN103455635A (zh) * 2013-09-24 2013-12-18 华北电力大学 基于最小二乘支持向量机集成的热工过程软测量建模方法
CN103632032A (zh) * 2013-10-23 2014-03-12 华南理工大学 一种城市污水处理过程出水指标在线软测量预测方法
CN103778483A (zh) * 2014-02-17 2014-05-07 山东大学 一种通过定量构效关系模型预测有机磷农药对水生生物急性毒性的方法
SG10201406850VA (en) * 2014-10-23 2016-05-30 Sembcorp Ind Ltd System and method for predicting a parameter of wastewater treatment process
CN104504288A (zh) * 2015-01-12 2015-04-08 江南大学 基于多向支持向量聚类的非线性多阶段间歇过程软测量方法
CN104949936B (zh) * 2015-07-13 2017-10-24 东北大学 基于优化偏最小二乘回归模型的样品成份测定方法
CN105205224B (zh) * 2015-08-28 2018-10-30 江南大学 基于模糊曲线分析的时间差高斯过程回归软测量建模方法
WO2017184073A1 (en) * 2016-04-18 2017-10-26 Sembcorp Industries Ltd System and method for wastewater treatment process control
CN107064054B (zh) * 2017-02-28 2019-08-02 浙江大学 一种基于cc-pls-rbfnn优化模型的近红外光谱分析方法

Also Published As

Publication number Publication date
CN108197380A (zh) 2018-06-22

Similar Documents

Publication Publication Date Title
CN108197380B (zh) 基于偏最小二乘的高斯过程回归废水出水指标预测方法
Niaki et al. Fault diagnosis in multivariate control charts using artificial neural networks
CN111291937A (zh) 基于支持向量分类与gru神经网络联合的处理污水水质预测方法
CN109492265B (zh) 基于动态非线性pls软测量方法的废水出水指标预测方法
CN106845796B (zh) 一种加氢裂化流程产品质量在线预测方法
Cheng et al. Monitoring influent conditions of wastewater treatment plants by nonlinear data-based techniques
CN109884892A (zh) 基于交叉相关时滞灰色关联分析的流程工业系统预测模型
CN108334943A (zh) 基于主动学习神经网络模型的工业过程半监督软测量建模方法
CN117312816B (zh) 一种特种钢材的冶炼效果评估方法及系统
CN109389314A (zh) 一种基于最优近邻成分分析的质量软测量与监测方法
CN113723007A (zh) 基于DRSN和麻雀搜索优化BiLSTM的机械设备剩余寿命预测方法
CN113012766B (zh) 一种基于在线选择性集成的自适应软测量建模方法
Graziani et al. Design of a soft sensor for an industrial plant with unknown delay by using deep learning
Sun et al. Design of an adaptive nonnegative garrote algorithm for multi-layer perceptron-based soft sensor
Kyritsakas et al. Forecasting bacteriological presence in treated drinking water using machine learning
CN117634990A (zh) 一种用于评估淡水生态系统稳定性的方法
CN112949836A (zh) 对时变分布数据进行回归预测在线迁移学习的方法
CN113126489A (zh) 一种基于cnn-gru-binn的重型燃气轮机控制系统智能bit设计方法
Kern et al. COD and NH 4-N estimation in the inflow of Wastewater Treatment Plants using Machine Learning Techniques
CN115983534A (zh) 污水处理过程的状态评价方法以及评价系统
CN116339275A (zh) 基于全结构动态自回归隐变量模型的多尺度过程故障检测方法
CN114861543A (zh) 一种数据驱动的石化污水可生化性智能评价方法
CN115438309A (zh) 基于lstm-svr的无人机发动机健康评估方法
CN113065242A (zh) 一种基于kplsr模型的污水处理出水总氮浓度软测量方法
Bahrami Samani et al. A latent variable model for mixed continuous and ordinal responses with nonignorable missing responses: Assessing the local influence via covariance structure

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant