CN107403196B - 基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法 - Google Patents
基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法 Download PDFInfo
- Publication number
- CN107403196B CN107403196B CN201710632210.6A CN201710632210A CN107403196B CN 107403196 B CN107403196 B CN 107403196B CN 201710632210 A CN201710632210 A CN 201710632210A CN 107403196 B CN107403196 B CN 107403196B
- Authority
- CN
- China
- Prior art keywords
- class
- sample
- samples
- spectral clustering
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000003595 spectral effect Effects 0.000 title claims abstract description 16
- 238000004458 analytical method Methods 0.000 title claims abstract description 9
- 239000001273 butane Substances 0.000 title claims abstract description 8
- IJDNQMDRQITEOD-UHFFFAOYSA-N n-butane Chemical compound CCCC IJDNQMDRQITEOD-UHFFFAOYSA-N 0.000 title claims abstract description 8
- OFBQJSOFQDEBGM-UHFFFAOYSA-N n-pentane Natural products CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 title claims abstract description 8
- 238000005259 measurement Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 15
- 238000011524 similarity measure Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 5
- 230000032683 aging Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010238 partial least squares regression Methods 0.000 description 2
- 238000012628 principal component regression Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明提供基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法,为使软测量模型在即时学习时能够进行更有效的相似样本选择,借助聚类分析构建新的相似度测度,提出了基于谱聚类分析的即时学习软测量建模方法。为获得可靠的过程阶段划分,采用了聚类稳定性和鲁棒性都较强的谱聚类,并在基于传统欧式距离相似度测度的基础上,结合聚类分析得出查询样本属于各类的后验概率,定义出一个更合适描述过程复杂特性的相似度测度,从而根据查询样本选择相似样本构建局部模型进行在线质量预报。
Description
本发明涉及基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法,属于复杂工业过程建模和软测量领域。
背景技术
目前,化工过程的复杂性正在日益增加,对产品质量的要求也在不断提高,现代工业往往需要装备一些先进的监控系统。然而由于某些关键质量变量的传感器价格昂贵、可靠性差或者具有很大的测量滞后性等缺点,导致一些重要的过程变量不能实时有效地测量。
软测量技术根据某种最优准则构造数学模型,建立易测辅助变量与难测主导变量之间的映射关系,可以有效解决此类问题。软测量模型大体可以分为基于机理、基于数据驱动和两者相结合的三大类。由于现代工业的日益复杂,基于机理的精确模型往往难以获得,发展了大量基于数据驱动的软测量模型,例如:主元回归(Principle ComponentRegression,PCR)、偏最小二乘回归(Partial Least Square Regression,PLSR)和支持向量回归(Support Vector Regression,SVR)等。
一般为了保证软测量模型的性能,要求建模数据必须能够覆盖工业过程中所有工况以适应工况变化。然而对于某一特定的查询样本,其工况特性虽未知却是唯一的,如果采用全部样本建模会将与查询样本特性无关甚至相差较大的样本也用于建模,会导致参数求解不够精确、模型精度低。同时软测量模型在实际应用中,受到外界环境和反应器内部变动的影响,如催化剂活性降低、原料属性变化、设备老化等,其特性难免漂移出之前建立模型的工作点,出现“模型老化”的现象。在这种情况下如果继续采用旧模型进行在线预测,输出预测值与真实值会产生较大的偏差,得不到理想的预测效果,因此模型在线校正能力对实际工业具有重要意义。
即时学习(Just In Time Learning,JITL)是一种常见的模型自适应校正策略。该方法对于查询样本,在历史数据中找出与其最相似的若干样本建立局部模型进行在线质量预报。当新的查询样本到来后,丢弃旧的模型并再次以上述程序为其建立局部模型。相似度测度的构造是JITL建模的核心,对建立局部模型起关键作用。
发明内容
本专利定义了一种基于聚类结果的相似度测度用于即时学习相似样本选择。离线建模时,采用聚类效果较可靠的谱聚类对过程阶段进行划分。在线更新时,将查询样本属于各类的后验概率结合欧氏距离,得到更合理的相似度从而建立更精确的局部模型。该方法不仅能够使模型具备自适应能力以处理时变过程,而且考虑到过程的多阶段特性,充分提取查询样本的特性,更为合理地选择样本建立局部模型,以提升模型在线预测性能。
本发明的目的是通过以下技术方案实现的:
离线建模时,采用聚类效果较可靠的谱聚类对过程阶段进行划分。
在线更新时,将查询样本属于各类的后验概率结合欧氏距离,得到更合理的相似度从而建立更精确的局部模型。
根据相似度选择样本建立软测量模型,在下个查询样本来时,在对其重新计算相似度,选择样本构建局部模型。
附图说明
图1是基于谱聚类分析的即时学习建模流程图;
图2不同相似样本下的RMSE;
具体实施方式
下面结合图1所示,对本发明做进一步详述:
以常见的化工过程——脱丁烷塔过程为例。实验数据来自于脱丁烷塔过程,对塔底丁烷浓度进行预测。
步骤1:收集输入输出数据组成历史训练数据库
步骤2:实施谱聚类把训练数据划分到不同的操作阶段,所述的谱聚类算法为:
输入数据集X∈RN×J,其中,J是过程变量的维数,N是训练样本的个数,xi∈RJ为输入数据集X中第i个样本的值,i=1,2,…,N,
定义相似度矩阵W,本文采用式(1)定义的相似度测度
其中,|xi-xj|表示xi与xj之间欧式距离,τ为此相似度测度的参数。
计算拉普拉斯矩阵
L=D-W (2)
步骤3:k-means的详细步骤:
随机选取个k聚类质心点初始值,μg(g=1,2,...,k),
重复下面过程直到聚类质心点收敛{
对于每一个样本xi,计算其应该属于的类
其中,g(xi)表示xi属于的类
}
对于每一个类g,重新计算该类的质心
其中,N(Xg)表示第g阶段的全部样本的个数。
当新的查询样本到来时,先计算其隶属于各类的后验概率,计算方式为式(6)-式(8)
其中,p(g)为第g类的先验概率,n(Xg)和n(X)分别表示第g类和整个训练集中的样本个数;p(x|g)是似然函数,μg表示第g类样本的聚类质心。
步骤5:计算训练样本中的样本xi与查询样本xq之间相似度
步骤6:最终,对于某个查询样本,将训练样本按照与其的相似度从大到小的顺序排列,选择L个样本构建局部软测量模型。当下一个的查询样本到来时丢弃旧的模型,再按照上述程序再次建立局部模型。
图2是数据在不同相似样本个数下丁烷浓度预测值和实际值拟合曲线,并且与传统即时学习所建立的软测量模型进行了比较。由图可知,本专利的预测效果更好。
Claims (1)
1.基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法,其特征在于,该方法步骤为:
步骤1:收集输入输出数据组成历史训练数据库,所述数据来自于脱丁烷塔过程;
步骤2:实施谱聚类把训练数据划分到不同的操作阶段,所述的谱聚类算法为:
输入数据集X∈RN×J,其中,J是过程变量的维数,N是训练样本的个数,xi∈RJ为输入数据集X中第i个样本的值,i=1,2,…,N,
定义相似度矩阵W,本文采用式(1)定义的相似度测度
其中,|xi-xj|表示xi与xj之间欧式距离,τ为此相似度测度的参数;
计算拉普拉斯矩阵
L=D-W (2)
步骤3:k-means的详细步骤
随机选取个k聚类质心点初始值,μg(g=1,2,...,k),
重复下面过程直到聚类质心点收敛{
对于每一个样本xi,计算其应该属于的类
其中,g(xi)表示xi属于的类
}
对于每一个类g,重新计算该类的质心
其中,N(Xg)表示第g阶段的全部样本的个数;
步骤4:
当新的查询样本到来时,先计算其隶属于各类的后验概率,计算方式为式(6)-式(8)
其中,p(g)为第g类的先验概率,n(Xg)和n(X)分别表示第g类和整个训练集中的样本个数;p(x|g)是似然函数,μg表示第g类样本的聚类质心;
步骤5:计算训练样本中的样本xi与查询样本xq之间相似度
步骤6:最终,对于某个查询样本,将训练样本按照与其的相似度从大到小的顺序排列,选择L个样本构建局部软测量模型,当下一个的查询样本到来时丢弃旧的模型,再按照上述程序再次建立局部模型;
步骤7:所得数据在不同相似样本个数下丁烷浓度预测值和实际值拟合,并且与传统即时学习所建立的软测量模型进行了比较。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710632210.6A CN107403196B (zh) | 2017-07-28 | 2017-07-28 | 基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710632210.6A CN107403196B (zh) | 2017-07-28 | 2017-07-28 | 基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107403196A CN107403196A (zh) | 2017-11-28 |
CN107403196B true CN107403196B (zh) | 2020-05-12 |
Family
ID=60401652
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710632210.6A Active CN107403196B (zh) | 2017-07-28 | 2017-07-28 | 基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107403196B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108732931B (zh) * | 2018-05-17 | 2021-03-26 | 北京化工大学 | 一种基于jit-rvm的多模态间歇过程建模方法 |
CN109703606B (zh) * | 2019-01-16 | 2020-12-15 | 北京交通大学 | 基于历史运行数据的高速列车智能驾驶控制方法 |
CN110619348A (zh) * | 2019-08-07 | 2019-12-27 | 合肥工业大学 | 一种基于个性化判别的特征学习算法 |
CN110597876B (zh) * | 2019-08-30 | 2023-03-24 | 南开大学 | 一种基于离线学习历史查询预测未来查询的近似查询方法 |
CN111650891B (zh) * | 2020-06-23 | 2022-05-06 | 广东普拉迪科技股份有限公司 | 具有恒力自适应控制方法的五轴精密小龙门数控加工中心 |
CN112633601B (zh) * | 2020-12-31 | 2022-12-09 | 天津开心生活科技有限公司 | 疾病事件发生概率的预测方法、装置、设备及计算机介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102981408A (zh) * | 2012-12-10 | 2013-03-20 | 华东交通大学 | 一种动车组运行过程建模与自适应控制方法 |
CN103927412A (zh) * | 2014-04-01 | 2014-07-16 | 浙江大学 | 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法 |
CN104239964A (zh) * | 2014-08-18 | 2014-12-24 | 华北电力大学 | 基于谱聚类和遗传优化极端学习机的超短期风速预测方法 |
CN104318241A (zh) * | 2014-09-25 | 2015-01-28 | 东莞电子科技大学电子信息工程研究院 | 基于Self-tuning的局部密度谱聚类相似度量算法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009058915A1 (en) * | 2007-10-29 | 2009-05-07 | The Trustees Of The University Of Pennsylvania | Computer assisted diagnosis (cad) of cancer using multi-functional, multi-modal in-vivo magnetic resonance spectroscopy (mrs) and imaging (mri) |
US8660968B2 (en) * | 2011-05-25 | 2014-02-25 | Azure Vault Ltd. | Remote chemical assay classification |
-
2017
- 2017-07-28 CN CN201710632210.6A patent/CN107403196B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102981408A (zh) * | 2012-12-10 | 2013-03-20 | 华东交通大学 | 一种动车组运行过程建模与自适应控制方法 |
CN103927412A (zh) * | 2014-04-01 | 2014-07-16 | 浙江大学 | 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法 |
CN104239964A (zh) * | 2014-08-18 | 2014-12-24 | 华北电力大学 | 基于谱聚类和遗传优化极端学习机的超短期风速预测方法 |
CN104318241A (zh) * | 2014-09-25 | 2015-01-28 | 东莞电子科技大学电子信息工程研究院 | 基于Self-tuning的局部密度谱聚类相似度量算法 |
Also Published As
Publication number | Publication date |
---|---|
CN107403196A (zh) | 2017-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107403196B (zh) | 基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法 | |
CN107451101B (zh) | 一种分层集成的高斯过程回归软测量建模对脱丁烷塔底丁烷浓度进行预测的方法 | |
CN103927412B (zh) | 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法 | |
CN111222549B (zh) | 一种基于深度神经网络的无人机故障预测方法 | |
CN108897286B (zh) | 一种基于分散式非线性动态关系模型的故障检测方法 | |
CN108803520B (zh) | 一种基于变量非线性自相关性剔除的动态过程监测方法 | |
Ge et al. | A comparative study of just-in-time-learning based methods for online soft sensor modeling | |
CN109297689B (zh) | 一种引入权重因子的大型水力机械智能诊断方法 | |
CN108920863B (zh) | 一种机器人伺服系统能耗估计模型的建立方法 | |
CN111638707B (zh) | 基于som聚类和mpca的间歇过程故障监测方法 | |
CN108520111B (zh) | 一种基于正交成分最优选择与最优回归的软测量方法 | |
CN108508865B (zh) | 一种基于分散式osc-pls回归模型的故障检测方法 | |
CN108776831A (zh) | 一种基于动态卷积神经网络的复杂工业过程数据建模方法 | |
CN109389314B (zh) | 一种基于最优近邻成分分析的质量软测量与监测方法 | |
CN105425583B (zh) | 基于协同训练lwpls的青霉素生产过程的控制方法 | |
CN108345284B (zh) | 一种基于两变量块的质量相关故障检测方法 | |
CN113012766B (zh) | 一种基于在线选择性集成的自适应软测量建模方法 | |
CN108919755B (zh) | 一种基于多块非线性交叉关系模型的分布式故障检测方法 | |
CN108445867B (zh) | 一种基于分散式icr模型的非高斯过程监测方法 | |
CN111639304B (zh) | 基于Xgboost回归模型的CSTR故障定位方法 | |
CN108469805A (zh) | 一种基于动态性最优选择的分散式动态过程监测方法 | |
CN110782546A (zh) | 基于组合树模型的半导体pvd制程的电阻率虚拟量测方法 | |
WO2024139313A1 (zh) | 多工况工业系统自适应稀疏辨识和控制方法、系统和设备 | |
CN108492026B (zh) | 一种基于集成正交成分最优化回归分析的软测量方法 | |
CN110033175B (zh) | 一种基于集成多核偏最小二乘回归模型的软测量方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |