CN103389360B - 基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法 - Google Patents

基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法 Download PDF

Info

Publication number
CN103389360B
CN103389360B CN201310299248.8A CN201310299248A CN103389360B CN 103389360 B CN103389360 B CN 103389360B CN 201310299248 A CN201310299248 A CN 201310299248A CN 103389360 B CN103389360 B CN 103389360B
Authority
CN
China
Prior art keywords
soft
data
model
butane content
pivot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310299248.8A
Other languages
English (en)
Other versions
CN103389360A (zh
Inventor
葛志强
宋执环
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201310299248.8A priority Critical patent/CN103389360B/zh
Publication of CN103389360A publication Critical patent/CN103389360A/zh
Application granted granted Critical
Publication of CN103389360B publication Critical patent/CN103389360B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于概率主元回归模型的软测量方法,用于脱丁烷塔中丁烷含量的在线检测。主元回归模型是一种常用的软测量建模方法,但是,由于没有很好地考虑到过程数据的噪声信息,导致了主元回归模型在很多实际过程中失效。本发明引入概率建模方法,将传统的主元回归模型转化为概率的形式,即提出一种基于概率主元回归的软测量模型。相比传统的主元回归模型,概率主元回归模型能同时对过程数据和噪声信息进行建模,给出更为完备的数据信息,从而使得软测量的结果更为可靠和可信。

Description

基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法
技术领域
本发明属于化工生产过程软测量建模和应用领域,特别涉及一种基于概率主元回归模型的脱丁烷塔丁烷含量软测量建模和在线检测方法。
背景技术
在脱丁烷塔中,如何在线地得到丁烷的含量值,对于脱丁烷塔的控制至关重要,直接影响到整个过程的运行性能和产品的质量指标。但是,针对丁烷含量的测量,目前缺乏直接的测量手段,往往需要借助间接的软测量手段。即利用过程中其它容易测量的变量来实时地估计丁烷的含量。主元回归分析是一种应用非常广泛的软测量建模方法,但是,由于在建模过程中没有很好地考虑过程数据的噪声信息,导致了该模型在一些实际的软测量过程中失效或者性能下降。本发明基于概率建模框架,将传统的主元回归分析模型扩展为概率的形式,即概率主元回归模型,并将其用于脱丁烷塔中丁烷含量的在线软测量。相比传统的主元回归软测量模型,本发明方法能同时对过程的数据和噪声信息进行建模,给出更为完备的软测量模型结构,从而使得软测量的结果更为可靠。
发明内容
本发明的目的在于针对脱丁烷塔中丁烷含量实时检测的难点,提供一种基于概率主元回归建模和在线检测方法。
本发明的目的是通过以下技术方案来实现的:
一种基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法,其特征包括以下步骤:
(1)利用集散控制系统收集脱丁烷塔的运行数据组成建模用的训练数据样本集:X∈Rn×m。其中,n为样本数据集的个数,m为过程变量个数,将数据集存入数据库中备用。
(2)通过现场抽取样本和离线实验室分析获取历史数据库中用于建模的样本所对应的丁烷含量值,作为软测量模型输出训练样本集y∈Rn,其中,n为样本数据集的个数,将数据集存入数据库中备用。
(3)分别对过程变量和丁烷含量样本进行预处理和归一化,使得各个过程变量和丁烷含量的均值为零,方差为1,得到新的数据矩阵集为
(4)针对归一化之后的软测量模型输入和输出数据集,建立基于概率主元回归的软测量模型,并将该模型的参数存入模型数据库中备用。
(5)收集新的脱丁烷塔运行过程在线测量数据,并对其进行预处理和归一化。
(6)将归一化之后的新数据直接输入到概率主元回归软测量模型中,计算该实时数据对应的丁烷含量值。
本发明的有益效果:本发明通过对脱丁烷塔中的过程变量和丁烷含量之间的相关关系进行主元回归建模,在概率建模框架下,通过该过程中容易测量的变量对难以测量的丁烷含量值进行在线软测量,从而实现脱丁烷塔中硫丁烷含量的在线估计。
附图说明
图1是基于概率主元分析模型的脱丁烷塔丁烷含量在线软测量结果;
具体实施方式
本发明针对脱丁烷塔中的丁烷含量检测问题,通过过程中容易测量的变量,利用概率主元回归分析模型,对该过程中丁烷含量进行在线软测量。
本发明采用的技术方案的主要步骤分别如下:
第一步:通过集散控制系统和实时数据库系统收集脱丁烷塔中各个过程变量的数据:X={xi∈Rm}i=1,2,…,n。其中,n为样本个数,m为过程变量个数。分别将这些数据存入历史数据库,并选取部分数据作为建模用样本;
第二步:通过现场抽取和离线实验室分析获取历史数据库中用于建模的样本所对应的丁烷含量值,作为软测量模型的输出y∈Rn
该步骤是为了获取软测量建模中的输出变量,即脱丁烷塔中的丁烷含量。一般情况下,通过离线实验室分析丁烷含量值往往需要话费数个小时时间,这就会导致脱丁烷塔的控制滞后。
第三步:分别对过程变量和丁烷含量数据进行预处理和归一化,使得各个过程变量和丁烷含量的均值为零,方差为1,得到新的数据矩阵集为
在历史数据库中对采集到的过程数据进行预处理,剔除野值点和明显的粗糙误差数据,为了使得过程数据的尺度不会影响到软测量的结果,对不同变量的数据分别进行归一化处理,即使得各个变量的均值为零,方差为1。这样,不同过程变量的数据就处在相同的尺度之下,既而不会影响到后续的建模和软测量效果。
第四步:得到归一化之后的过程变量和丁烷含量数据后,建立基于概率主元回归软测量模型,将该软测量模型参数存入数据库中备用。
将归一化之后的过程变量矩阵作为软测量模型的输入,丁烷含量数据矩阵作为软测量模型的输出,建立如下的概率主元回归软测量模型:
x=Pt+e
y=Ct+f
其中,P∈Rm×k和C∈R1×k为过程变量和丁烷含量的负载矩阵,t∈Rk×1为提取出来的主元个数,服从均值为0,方差为1的正态分布,即p(t)=N(0,I),k为主元的个数。e∈Rm×1和f∈R分别为过程变量和丁烷含量所对应的噪声,均服从零均值的正态分布,即 其中,为对应的方差值。为了得到主元回归模型中的最优参数集需要对以下的似然函数做极大化,即
max { L ( P , C , σ x 2 , σ y 2 ) } = max { ln Π i = 1 n p ( x i , y i | P , C , σ x 2 , σ y 2 ) }
基于上述优化函数,为了得到最优的模型参数值,采用期望-极大算法,该算法分为两个步骤进行,分别为期望步骤和极大步骤,具体如下:
在该算法的期望步骤中,对主元回归模型中主元变量的后验分布密度函数进行估计,即
p ( t | x , y , P , C , σ x 2 , σ y 2 ) = p ( x | t , P , σ x 2 ) p ( y | t , C , σ y 2 ) p ( t ) p ( x , y , t , P , C , σ x 2 , σ y 2 )
因为上式中右边的所有选项均为正态分布,因此,主元变量的后验分布密度函数也为正态分布的形式。从而得到其一阶和二阶统计量的估计值如下:
E ( t ^ i | x i , y i ) = ( σ x - 2 P T P + σ y - 2 C T C + I ) - 1 ( σ x - 2 P T x i + σ y - 2 C T y i )
E ( t ^ i t ^ i T | x i , y i ) = ( σ x - 2 P T P + σ y - 2 C T C + I ) - 1 + E ( t ^ i | x i , y i ) E T ( t ^ i | x i , y i )
在算法的极大步骤中,基于各个不同的模型参数,分别对优化函数求偏导数,并令其等于零,可以求得最优的参数值。即
∂ [ L ( P , C , σ x 2 , σ y 2 ) ] ∂ P = 0 ⇒ P new = [ Σ i = 1 n x i E T ( t ^ i | x i , y i ) ] [ Σ i = 1 n E ( t ^ i t ^ i T | x i , y i ) ] - 1
∂ [ L ( P , C , σ x 2 , σ y 2 ) ] ∂ C = 0 ⇒ C new = [ Σ i = 1 n y i E T ( t ^ i | x i , y i ) ] [ Σ i = 1 n E ( t ^ i t ^ i T | x i , y i ) ] - 1
∂ [ L ( P , C , σ x 2 , σ y 2 ) ∂ σ x 2 = 0 ⇒ σ x 2 new = Σ i = 1 n x i T x i + trace { P newT P new [ Σ i = 1 n E ( t ^ i t ^ i T | x i , y i ) ] - 2 X P new T ^ T } mn
∂ [ L ( P , C , σ x 2 , σ y 2 ) ∂ σ y 2 = 0 ⇒ σ y 2 new = Σ i = 1 n y i T y i + trace { C newT C new [ Σ i = 1 n E ( t ^ i t ^ i T | x i , y i ) ] - 2 Y C new T ^ T } rn
其中, T ^ = [ E ( t ^ 1 | x 1 , y 1 ) , E T ( t ^ 2 | x 2 , y 2 ) , · · · , E T ( t ^ n | x n , y n ) ] T , Trace(·)为矩阵的迹算子。通过反复对期望步骤和极大步骤进行迭代,当模型的参数收敛后,就可以得到最优的参数值。
第五步:收集新的过程数据,并对其进行预处理和归一化。
对于过程中新收集到的数据样本,除了对其进行预处理之外,还有采用建模时的模型参数对该数据点进行归一化,即减去建模均值和除以建模标准差。
第六步:将归一化之后的新数据直接输入到软测量模型中,计算该实时数据对应的关键指标值。
对于归一化之后的新数据将其输入到概率主元回归软测量模型中,在线计算该实时数据对应的丁烷含量值,计算如下:首先,计算新数据所对应的主元变量的值如下:
t ‾ new = ( σ x - 2 P T P ) - 1 P T x ‾ new )
在此基础上,计算新数据所对应的关键变量值如下:
y ‾ new = C t ‾ new = C ( σ x - 2 P T P ) - 1 P T x ‾ new
如果过程通过实验室化验方式得到的测量值为ynew,可以得到软测量模型的实时测量误差为 er new = y new - y ‾ new ·
以下结合一个具体的脱丁烷塔例子来说明本发明的有效性。针对该过程,一共采集了2000个数据,其中1000个数据用来建模,并对其对应的丁烷含量值进行离线分析和标记。另外采集的1000个数据样本用来验证软测量模型的有效性。在该过程中,一共选取了7个过程变量对该过程的丁烷含量进行软测量建模,这7个过程变量分别为塔顶温度、塔顶压力、回流流量、下一级流量、灵敏板温度、塔底温度和塔底压力。接下来结合该具体过程对本发明的实施步骤进行详细地阐述:
1.分别对1000个建模样本中的过程变量和丁烷含量进行预处理和归一化,使得各个过程变量和关键变量的均值为零,方差为1,得到新的建模数据矩阵。
2.基于概率主元回归的软测量建模
将选取的7个过程过程变量组成的数据矩阵作为软测量模型的输入,丁烷含量数据矩阵作为软测量模型的输出,按照实施步骤中给出的详细方法,建立基于概率主元回归分析的软测量模型。
3.获取过程中实时测量数据信息,并对其进行预处理和归一化
为了测试新方法的有效性,我们对1000个验证样本进行测试,并利用建模时的归一化参数对其进行处理。
4.丁烷含量的在线软测量
对1000个验证样本进行在线软测量,获得相应的在线估计值。图1给出了本发明方法针对1000个验证样本的在线软测量结果和误差。其中”*”为软测量模型的在线估计值,“o”代表各个样本的离线分析值。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (2)

1.一种基于概率主元回归软测量模型的脱丁烷塔丁烷含量软测量方法,其特征在于,包括以下步骤:
(1)利用集散控制系统收集脱丁烷塔的运行数据组成建模用的训练数据样本集:X∈Rn×m;其中,n为样本数据集的个数,m为过程变量个数,将数据集存入数据库中备用;
(2)通过现场抽取样本和离线实验室分析获取历史数据库中用于建模的样本所对应的丁烷含量值,作为软测量模型输出训练样本集y∈Rn,其中,n为样本数据集的个数,将数据集存入数据库中备用;
(3)分别对过程变量和丁烷含量样本进行预处理和归一化,使得各个过程变量和丁烷含量的均值为零,方差为1,得到新的数据矩阵集为
(4)针对归一化之后的软测量模型输入和输出数据集,建立基于概率主元回归软测量模型,并将该模型的参数存入模型数据库中备用;
(5)收集新的脱丁烷塔运行过程在线测量数据,并对其进行预处理和归一化;
(6)将归一化之后的新数据直接输入到概率主元回归软测量模型中,计算该实时数据对应的丁烷含量值;
所述步骤(4)具体为:将归一化之后的过程变量矩阵作为软测量模型的输入,丁烷含量数据矩阵作为软测量模型的输出,建立如下的概率主元回归软测量模型:
x=Pt+e
y=Ct+f
其中,P∈Rm×k和C∈R1×k为过程变量和丁烷含量的负载矩阵,t∈Rk×1为提取出来的主元,服从均值为0,方差为1的正态分布,即p(t)=N(0,I),k为主元的个数;e∈Rm×1和f∈R分别为过程变量和丁烷含量所对应的噪声,均服从零均值的正态分布,即其中,为对应的方差值;为了得到主元回归模型中的最优参数集需要对以下的似然函数做极大化,即
为了得到最优的模型参数值,采用期望-极大算法,该算法分为两个步骤进行,分别为期望步骤和极大步骤,具体如下:
在该算法的期望步骤中,对主元回归模型中主元变量的后验分布密度函数进行估计,即
因为上式中右边的所有选项均为正态分布,因此,主元变量的后验分布密度函数也为正态分布的形式,从而得到其一阶和二阶统计量的估计值如下:
在算法的极大步骤中,基于各个不同的模型参数,分别对优化函数求偏导数,并令其等于零,可以求得最优的参数值;即
其中,Trace(·)为矩阵的迹算子;通过反复对期望步骤和极大步骤进行迭代,当模型的参数收敛后,就可以得到最优的参数值。
2.根据权利要求1所述基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法,其特征在于,所述步骤(6)具体为:对于归一化之后的新数据将其输入到概率主元回归软测量模型中,在线计算该实时数据对应的丁烷含量值,计算如下:首先,计算新数据所对应的主元变量的值如下:
在此基础上,计算新数据所对应的丁烷含量值如下:
如果过程通过实验室化验方式得到的测量值为ynew,可以得到软测量模型的实时测量误差为
CN201310299248.8A 2013-07-15 2013-07-15 基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法 Expired - Fee Related CN103389360B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310299248.8A CN103389360B (zh) 2013-07-15 2013-07-15 基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310299248.8A CN103389360B (zh) 2013-07-15 2013-07-15 基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法

Publications (2)

Publication Number Publication Date
CN103389360A CN103389360A (zh) 2013-11-13
CN103389360B true CN103389360B (zh) 2016-06-08

Family

ID=49533694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310299248.8A Expired - Fee Related CN103389360B (zh) 2013-07-15 2013-07-15 基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法

Country Status (1)

Country Link
CN (1) CN103389360B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927412B (zh) * 2014-04-01 2016-10-12 浙江大学 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN104914723B (zh) * 2015-05-22 2018-10-16 浙江大学 基于协同训练偏最小二乘模型的工业过程软测量建模方法
CN105868164B (zh) * 2016-03-19 2019-01-01 浙江大学 一种基于有监督的线性动态系统模型的软测量建模方法
CN108628164A (zh) * 2018-03-30 2018-10-09 浙江大学 一种基于循环神经网络模型的工业过程半监督软测量方法
CN110197022B (zh) * 2019-05-21 2020-10-23 浙江大学 面向流式大数据的并行概率变分软测量建模方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102601951A (zh) * 2012-03-12 2012-07-25 浙江大学 基于超声信号的塑料注射过程模腔压力检测方法
CN102880809A (zh) * 2012-10-11 2013-01-16 浙江大学 基于关联向量回归模型的聚丙烯熔融指数在线检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW584591B (en) * 2000-06-08 2004-04-21 Mirle Automation Corp Method of setting parameters for injection molding machine

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102601951A (zh) * 2012-03-12 2012-07-25 浙江大学 基于超声信号的塑料注射过程模腔压力检测方法
CN102880809A (zh) * 2012-10-11 2013-01-16 浙江大学 基于关联向量回归模型的聚丙烯熔融指数在线检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
概率PCA多元统计方法在过程监控中的应用研究;杨沛武;《中国优秀硕士学位论文全文数据库》;20090315(第3期);第10页 *

Also Published As

Publication number Publication date
CN103389360A (zh) 2013-11-13

Similar Documents

Publication Publication Date Title
CN103389360B (zh) 基于概率主元回归模型的脱丁烷塔丁烷含量软测量方法
Barua et al. Artificial neural network–based drought forecasting using a nonlinear aggregated drought index
CN111123188A (zh) 基于改进最小二乘法的电能表综合检定方法及系统
Kaloop et al. Multi input–single output models identification of tower bridge movements using GPS monitoring system
CN104764868B (zh) 一种基于地理加权回归的土壤有机碳预测方法
KR101908865B1 (ko) 기온 측정 자료의 품질 분석방법
CN105334185B (zh) 基于光谱投影判别的近红外模型维护方法
CN102880809A (zh) 基于关联向量回归模型的聚丙烯熔融指数在线检测方法
KR102181966B1 (ko) 유압실린더 종합 테스트 스테이션에 대한 소프트 측량방법 및 시스템
CN110716512A (zh) 一种基于燃煤电站运行数据的环保装备性能预测方法
CN107436983A (zh) 一种基于多元样本差异的o型橡胶密封圈寿命预测方法
CN105239608A (zh) 一种基于wt-rs-svr相结合的滑坡位移预测方法
CN104035431A (zh) 用于非线性过程监控的核函数参数的获取方法和系统
CN103389701A (zh) 基于分布式数据模型的厂级过程故障检测与诊断方法
CN104142680B (zh) 一种基于鲁棒输入训练神经网络的多传感器故障诊断系统及方法
CN105975797A (zh) 一种基于模糊数据处理的产品早期故障根原因识别方法
CN106560699A (zh) 用于武夷岩茶产地鉴别的联合检测方法
CN114583767B (zh) 一种数据驱动的风电场调频响应特性建模方法及系统
Guo et al. Automatic data quality control of observations in wireless sensor network
CN103279030B (zh) 基于贝叶斯框架的动态软测量建模方法及装置
CN117556366B (zh) 基于数据筛选的数据异常检测系统及方法
CN103344740B (zh) 基于多输入维纳模型的谷氨酸产物浓度在线软测量方法
CN101446828A (zh) 一种非线性过程质量预报方法
CN103134433A (zh) 一种利用位移监测鉴别边坡失稳致滑因子的方法
CN105243608A (zh) 基于输变电工程造价设计要素的线路工程造价估算方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160608

Termination date: 20190715