CN102542126B - 基于半监督学习的软测量方法 - Google Patents

基于半监督学习的软测量方法 Download PDF

Info

Publication number
CN102542126B
CN102542126B CN201110303711.2A CN201110303711A CN102542126B CN 102542126 B CN102542126 B CN 102542126B CN 201110303711 A CN201110303711 A CN 201110303711A CN 102542126 B CN102542126 B CN 102542126B
Authority
CN
China
Prior art keywords
semi
supervised
gaussian process
soft
kernel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110303711.2A
Other languages
English (en)
Other versions
CN102542126A (zh
Inventor
阎威武
张丹丹
田宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201110303711.2A priority Critical patent/CN102542126B/zh
Publication of CN102542126A publication Critical patent/CN102542126A/zh
Application granted granted Critical
Publication of CN102542126B publication Critical patent/CN102542126B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于半监督学习的软测量方法,首先,在工业过程数据和半监督学习基础上,利用图拉普拉斯对样本空间几何结构的信息进行估计构造高斯过程回归中的协方差矩阵;然后,引入未标记样本构建一个半监督核,并将其整合到高斯过程回归中,构造基于半监督的软仪表,软仪表中的关键参数可以由交叉验证方式确定;最后,基于滚动时间窗的方式,实现软仪表的在线更新。本发明所公开的软测量方法,解决常规的软仪表和软测量方法中存在的不足和缺陷,通过将半监督学习引入到在线过程回归中,建立一种基于半监督核的在线高斯过程回归方法,利用标记样本和未标记样本来建立软仪表,来达到更好的预测效果。

Description

基于半监督学习的软测量方法
技术领域
本发明涉及的是一种软测量仪表技术领域的方法,具体是一种基于半监督学习的软测量方法。
背景技术
软仪表是指在工业过程测量中某些变量测量十分困难,而利用其他由直接物理传感器实体得到的信息通过数学模型计算手段得到所需检测信息的一种功能仪表。软仪表技术对过程工业具有重要意义,在现代过程控制领域具有重要的地位。软测量技术已经是现代流程工业和过程控制领域非常关键和前沿的技术。目前存在的软仪表和软测量方法都是基于监督学习方法为基础和框架建立的。但是,这种技术只能利用有标记的工业数据和样本来构造软仪表,大量反映实际过程状况的无标记数据和样本无法得到利用,造成软仪表的性能上存在稳定性和抗干扰等等方面的问题。
半监督学习是研究如何利用未标记样本获得较好性能和推广能力的一种学习机器。近些年来,随着机器学习的不断发展以及未标记数据的日渐增加,半监督学习正逐渐成为一个研究热点。在许多实际问题中,由于获取人工标记样本的费用高、效率低,往往得到的是大量的未标记样本和少量的标记样本,如果只利用少量的标记样本,将不免造成大量未标记样本的浪费和学习机器的性能不好等问题。半监督学习方法就是解决这类问题的有效方法,它可以有效地利用未标记数据进行学习和建模,提高学习机器的性能。目前传统的软测量方法也存在无法利用未标记样本的问题,只能用少量的标记进行建模,这使得模型的准确性和可靠性受到较大的影响。因此半监督学习为工业过程的建模和提高模型的性能提供了新的思路。
经对现有技术的文献检索发现,Vikas Sindhwani等人在《In Proceedings of the International Joint Conference on                                                 Intelligence, 2007》上发表的“Semi-supervised gaussian process ”(“半监督高斯过程分类器”,《关于人工智能的国际联合会议论文集》,2007: 1059-1064)一文中,详细介绍了一种基于图的半监督高斯过程分类器,通过结合非参数的半监督核向分类器提供未标记数据信息。然而,大量工业过程的建模问题并非分类问题,属于回归范畴,故用半监督高斯过程分类器作为工业过程中的软测量模型并不合适。
发明内容
本发明针对现有技术存在的上述不足,提供一种基于半监督学习的软测量方法,解决常规的软仪表和软测量方法中存在的不足和缺陷,通过将半监督学习引入到在线过程回归中,建立一种基于半监督核的在线高斯过程回归方法,利用标记样本和未标记样本来建立软仪表,来达到更好的预测效果。
为达到上述目的,本发明所采用的技术方案如下:
一种基于半监督学习的软测量方法,首先,在工业过程数据和半监督学习基础上,利用图拉普拉斯对样本空间几何结构的信息进行估计,构造高斯过程回归中的协方差矩阵;然后引入未标记样本构建一个半监督核函数,并将其整合到高斯过程回归中,构造基于半监督回归的软仪表,软仪表中的关键参数可以由交叉验证方式确定;最后,基于滚动时间窗的方式,实现软仪表的在线更新。
因此,在选定高斯过程回归协方差方程和噪声之后就可以计算出训练集和测试集间的协方差矩阵。
所述的构建一个半监督核是指:在半监督学习中,基于大量的未标记数据能够表征样本空间的几何特征,可用半监督核的方法来解决半监督学习问题,即用未标记数据重构一个更能符合数据几何特征的再生核希尔伯特空间,该空间所对应的核函数为:
              
  
所述的构造基于半监督的软仪表是指:对称半正定函数既可以作为高斯过程的协方差函数,也可以作为再生核希尔伯特空间的核函数,高斯过程和希尔伯特核空间通过函数紧密联系在一起;基于半监督核的高斯过程回归建模方法即使用上述的半监督核函数作为高斯过程学习的协方差函数;
根据贝叶斯公式可推导基于半监督核的高斯过程回归预测方程为,
最后,重复进行上述过程。
与现有技术相比,本发明具有如下有益效果:
1. 将半监督学习方法引入到高斯过程回归中,充分利用工业过程中大量廉价的未标记样本来提高模型的精度。
2. 基于半监督核的高斯过程软测量方法不仅可以给出预测值的估算值,还可以由方差计算该预测值的可信度。这是相比较于一般的软测量方法的一个显著优点。
3. 根据实际过程中新的数据不断产生的特点,用基于滚动时间窗的方法在历史数据的基础上利用新的实时数据来更新软仪表,使得模型能实时跟踪实际的工况。
本发明在工业软测量建模方法领域有着广泛的应用前景。
附图说明
图1 是本发明原理和方法结构框图;
图2 是基于半监督核的在线高斯过程软仪表仿真结果图;
图3 在线软仪表更新仿真结果图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
输出:对实时数据点的高斯分布的均值和协方差进行在线预测和计算。
对某电厂的烟气含氧量软测量建模过程进行研究。在评价建模方法的性能时使用了三个技术指标:选用相对均方根误差(RMSE)、相对协方差跟踪指标(RVTP)和平均对数密度误差(LD)。
RMSE主要是评价软测量模型的精度,RMSE越小,表示精度越高;RVTP反映的是软测量模型输出的变化趋势是否能很好的跟踪实际值变化趋势,其计算公式中,为模型预测值与实际测量值之间误差的方差,为实际测量值的方差当RVTP越接近1时,说明趋势跟踪效果越好;LD是用来衡量模型精度与不确定度,值越小,表示在给定的置信概率下,模型的不确定度越小。
步骤一,确定模型的输入和输出变量。该模型的输出为烟气含氧量的预测值;输入选定与烟气含氧量相关的主蒸汽压力、主蒸汽温度等16个变量。
步骤二,模型相关参数选择;
本实施例选用高斯核函数,即并采用十阶交叉验证方式来选择核
十折交叉验证准则中,由表2可得,当软测量模型的参数选定最佳值时的性能指标
表2表示的是两种软测量建模方法的性能指标比较结果,基于半监督核的高斯过程回归软测量模型的预测误差要小于高斯过程回归软测量模型的预测误差,相对协方差跟踪指标RVTP也显示基于半监督核的高斯过程回归软测量模型的结果更接近于1,表明基于半监督核的高斯过程回归软测量模型的协方差跟踪能力优于高斯过程回归软测量模型的协方差跟踪能力,相对平均密度LD表示基于半监督核的高斯过程回归软测量模型的不确定度要比高斯过程回归软测量模型的不确定度小得多。
同时,图2和图3中,也显示出基于半监督核的高斯过程回归软测量模型预测的拟合程度要优于高斯过程回归软测量模型的拟合程度,尤其在参数变化较大的时候,趋势跟踪方面表现出良好的性能。因此,基于半监督核的高斯过程回归软测量模型为烟气含氧量测量提供了一种有效可行的方法。

Claims (4)

1.一种基于半监督学习的软测量方法,其特征在于,首先在工业过程数据和半监督学习基础上,利用图拉普拉斯对样本空间几何结构的信息进行估计构造高斯过程回归中的协方差矩阵;然后引入未标记样本构建一个半监督核,并将其整合到高斯过程回归中,在此基础上设计半监督高斯回归方法和在线滚动算法,结合软测量模型,构造基于半监督的软仪表,软仪表中的关键参数可以由交叉验证方式确定;最后,基于滚动时间窗的方式,实现软仪表的在线更新,所述在线更新是指:设系统在任意时刻时状态由数据集Xl,Xu,xt来描述,其中标记样本集Xl={(x1,y1),...,(xl,yl)},未标记样本集Xu={xl+1,...,xl+u},xt是实时数据集的一个样本点,设置建模的数据区间长度L为L=l+u+1,L保持不变,首先,用Xl,Xu计算高斯过程的协方差矩阵K(x,x'),并计算信息矩阵M;然后加入测试样本点xt,更新数据集的核矩阵,用半监督核函数来计算不同数据集间的核矩阵;接着,判断xt的类型,若xt为标记样本则无需预测,直接更新Xl;若xt为未标记,则进行半监督的高斯过程回归,对测试点xt的函数值进行预测,然后更新XU;重复进行上述在线更新过程。
2.根据权利要求1所述的基于半监督学习的软测量方法,其特征在于,所述的协方差矩阵通过以下方式得到:一个高斯过程由均值方程m(x)和协方差矩阵K(x,x')来唯一确定,高斯过程就表示为f(x)~GP(m(x),K(x,x')),其中:高斯过程模型的训练集为i表示第i个样本点,XL={(xi,yi),i=1,…,l}为标记样本集,f(xi)表示自变量xi到因变量yi的潜在函数值;实际中,观测值y与潜在函数值f存在噪声误差ε,即y=f(x)+ε;
噪声ε是服从ε~N(0,σ2)并独立于f(x)的随机变量;在此基础上,推导出带噪声的观测值也服从高斯过程:其中:XT={x1,…,xt}为测试样本集,测试样本的预测估计值为fT,推导测试样本集与标记样本集的联合概率分布仍然是一个高斯分布,
y f T ~ N ( 0 , K ( x , x ) + σ 2 I K ( x , x T ) K ( x T , x ) K ( x T , x T ) )
因此,在选定高斯过程回归协方差方程和噪声之后就能够计算出训练集和测试集间的协方差矩阵。
3.根据权利要求2所述的基于半监督学习的软测量方法,其特征在于,所述的构建一个半监督核是指:在半监督学习中,基于大量的未标记数据能够表征样本空间的几何特征,用半监督核的方法来解决半监督学习问题,即用未标记数据XU={xl+1,…,xl+u}和标记数据XL={(xi,yi),i=1,…,l}重构一个更能符合数据几何特征的再生核希尔伯特空间,该空间所对应的核函数为:
K ( x ~ , x ) = K ( x , x ) - K Dx T ( I + MK DD ) - 1 MK Dx - - - ( 1 )
其中KDx=[K(x1,x),...,K(xl+u,x)]T,KDD是全部样本数据XD={XL,XU}的核矩阵;M通常选择M=L或者M=γLp,L为图拉普拉斯矩阵,计算公式为L=D-W,其中D为对角权重矩阵,W为权重矩阵,D和W的各个元素如下式,其中近邻的计算方法选用k近邻方法;
D i , j = Σ k w kj ifi = j 0 otherwise - - - ( 3 ) .
4.根据权利要求3所述的基于半监督学习的软测量方法,其特征在于,所述的构造基于半监督的软仪表是指:对称半正定函数K(·,·)既可以作为高斯过程的协方差函数,也可以作为再生核希尔伯特空间的核函数,高斯过程和希尔伯特核空间通过函数K(·,·)紧密联系在一起;基于半监督核的高斯过程回归建模方法即使用上述的半监督核函数作为高斯过程学习的协方差函数;
由高斯过程的定义可得,基于XD和XT的随机变量yD和fT服从联合高斯分布,并且表示成如下矩阵形式:
f * = y f T ~ N ( 0 , K ( x , x ) + σ 2 I K ( x , x T ) K ( x T , x ) K ( x T , x T ) )
设定G为由XL和XU确定的近邻图,能够证明,在条件G下f*仍然服从高斯分布,表示成如下矩阵形式:
f * | G ~ N ( 0 , K ~ ( x , x ) + σ 2 I K ~ ( x , x T ) K ~ ( x T , x ) K ~ ( x T , x T ) )
根据贝叶斯公式可推导基于半监督核的高斯过程回归预测方程为,
f T | X , y , x T , G ~ N ( f ‾ T , cov ( f T ) ) - - - ( 4 )
式中,均值和协方差cov(fT)由下列公式计算;
f ‾ T = K ~ ( x T , x ) [ K ~ ( x , x ) + σ 2 I ] - 1 y - - - ( 5 )
cov ( f T ) = K ~ ( x T , x T ) - K ~ ( x T , x ) [ K ~ ( x , x ) + σ 2 I ] - 1 K ~ ( x , x T ) - - - ( 6 ) .
CN201110303711.2A 2011-10-10 2011-10-10 基于半监督学习的软测量方法 Active CN102542126B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110303711.2A CN102542126B (zh) 2011-10-10 2011-10-10 基于半监督学习的软测量方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110303711.2A CN102542126B (zh) 2011-10-10 2011-10-10 基于半监督学习的软测量方法

Publications (2)

Publication Number Publication Date
CN102542126A CN102542126A (zh) 2012-07-04
CN102542126B true CN102542126B (zh) 2015-04-22

Family

ID=46349001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110303711.2A Active CN102542126B (zh) 2011-10-10 2011-10-10 基于半监督学习的软测量方法

Country Status (1)

Country Link
CN (1) CN102542126B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107451102B (zh) * 2017-07-28 2020-06-30 江南大学 一种基于改进自训练算法的半监督高斯过程回归软测量建模对脱丁烷塔底丁烷浓度进行预测的方法
CN108053120B (zh) * 2017-12-15 2020-09-01 阿里巴巴集团控股有限公司 一种模型整合方法及装置
WO2019213860A1 (en) 2018-05-09 2019-11-14 Jiangnan University Advanced ensemble learning strategy based semi-supervised soft sensing method
CN108989092B (zh) * 2018-06-26 2023-01-17 广东南方通信建设有限公司 一种无线网络预测方法、电子设备及存储介质
CN112541558B (zh) * 2020-09-18 2024-07-19 江苏师范大学 一种基于不完整数据的贝叶斯半监督鲁棒ppls软测量方法
CN112381221A (zh) * 2020-10-28 2021-02-19 华南理工大学 一种基于半监督学习的污水监测的多输出软测量方法
CN112580682B (zh) * 2020-11-16 2022-07-19 河海大学 基于多任务高斯过程的大坝监测系统缺失数据重构方法
CN112650063B (zh) * 2020-12-30 2022-04-29 浙江大学 一种基于半监督增量高斯混合回归的自适应软测量方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101748186A (zh) * 2009-12-29 2010-06-23 江苏大学 基于模糊支持向量机的赖氨酸发酵过程关键状态变量软测量方法及系统
CN101819269A (zh) * 2010-03-19 2010-09-01 清华大学 非均匀杂波环境下空时自适应处理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101748186A (zh) * 2009-12-29 2010-06-23 江苏大学 基于模糊支持向量机的赖氨酸发酵过程关键状态变量软测量方法及系统
CN101819269A (zh) * 2010-03-19 2010-09-01 清华大学 非均匀杂波环境下空时自适应处理方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于滚动时间窗的最小二乘支持向量机回归估计方法及仿真;阎威武等;《上海交通大学学报》;20040430;第38卷(第4期);第524-532页 *
基于高斯过程的高光谱图像分类研究;姚伏天;《中国优秀博士学位论文全文数据库(电子期刊)信息科技辑》;20110731;第2011(年)卷(第7期);第I140-64页 *
高斯过程及其在软测量建模中的应用;王华忠;《化工学报》;20071130;第58卷(第11期);第2840-2845页 *

Also Published As

Publication number Publication date
CN102542126A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN102542126B (zh) 基于半监督学习的软测量方法
Pan et al. Data-driven estimation of building energy consumption with multi-source heterogeneous data
Boehlert et al. Climate change impacts and greenhouse gas mitigation effects on US hydropower generation
CN109255490B (zh) 一种基于kpca-bas-grnn的埋地管道外腐蚀速率预测方法
Liu Development of a general sustainability indicator for renewable energy systems: A review
Xu et al. Integrating the system dynamic and cellular automata models to predict land use and land cover change
Yang et al. Interpolation of missing wind data based on ANFIS
Soltani et al. Developing operating rules for reservoirs considering the water quality issues: Application of ANFIS-based surrogate models
Liu et al. Prediction of water temperature in a subtropical subalpine lake using an artificial neural network and three-dimensional circulation models
CN102222313B (zh) 基于核主成分分析的城市演化模拟元胞模型处理方法
CN104239489A (zh) 利用相似性搜索和改进bp神经网络预测水位的方法
CN102708294B (zh) 基于半监督局部线性回归的自适应参数软测量方法
Hong et al. Mid-and long-term runoff predictions by an improved phase-space reconstruction model
Sogabe et al. Optimization of decentralized renewable energy system by weather forecasting and deep machine learning techniques
CN103577895A (zh) 一种资料短缺情形下的二次耦合月径流预报方法
Zhao et al. Evaluating influences of the Manwan Dam and climate variability on the hydrology of the Lancang-Mekong River, Yunnan Province, southwest China
Wu et al. Use of a multi-objective correlation index to analyze the power generation, water supply and ecological flow mutual feedback relationship of a reservoir
Chen et al. Urban inundation rapid prediction method based on multi-machine learning algorithm and rain pattern analysis
Wang et al. Review of evaluation on ecological carrying capacity: The progress and trend of methodology
Ali et al. A new weighting scheme in weighted markov model for predicting the probability of drought episodes
Liu et al. Evaluating climate changes and land use changes on water resources using hybrid Soil and Water Assessment Tool‐DEEP optimized by metaheuristics
CN111859783B (zh) 水压预测方法、系统、存储介质、设备、城市供水系统
Intan et al. Weather forecasting analysis using bayesian regularization algorithms
Liu et al. Crack prediction based on wavelet correlation analysis least squares support vector machine for stone cultural relics
Toyoda et al. Optimization of empirical typhoon model considering the difference of radius between pressure gradient and wind speed distributions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant