CN114117919B - 基于样本协同表示的即时学习的软测量建模方法 - Google Patents
基于样本协同表示的即时学习的软测量建模方法 Download PDFInfo
- Publication number
- CN114117919B CN114117919B CN202111432914.1A CN202111432914A CN114117919B CN 114117919 B CN114117919 B CN 114117919B CN 202111432914 A CN202111432914 A CN 202111432914A CN 114117919 B CN114117919 B CN 114117919B
- Authority
- CN
- China
- Prior art keywords
- ridge regression
- sample
- formula
- weighted
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Pure & Applied Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Analysis (AREA)
- Geometry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Hardware Design (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于样本协同表示的即时学习的软测量建模方法,该方法通过协同表示算法获得历史样本的权重矩阵,并通过加权岭回归算法建立加权岭回归模型,将两种算法进行融合,形成统一的优化目标。对于采集的查询数据,首先计算查询数据与训练样本的加权欧式距离,并将加权欧式距离融合到协同表示的正则项中,计算协同表示系数及各历史样本的权重矩阵,然后根据各样本的权重矩阵建立加权岭回归模型计算查询数据对应的输出值。本发明不仅能够很好地处理工业过程的非线性、时变性及多重共线性问题,还将相似样本选择和局部模型的构建融合到一个优化函数中,实现利用局部模型的信息指导相似样本的选择,提高相似样本的可靠性及局部模型的预测精度。
Description
技术领域
本发明属于工业过程检测技术领域,涉及工业过程软测量技术,具体地说,涉及了一种基于样本协同表示的即时学习的软测量建模方法。
背景技术
在现代工业生产过程中,许多重要质量变量(例如:油品黏度、组分等)难以实时测量,给化工过程控制与优化带来很大影响。因为化工生产过程存在样品现场取样困难、分析仪器成本高以及分析时间滞后等问题,在实际生产过程中,往往难以使用在线分析仪表和离线化验等方式对质量变量进行实时测量,无法对质量变量形成闭环控制。因此,质量变量如何实时获取成为过程控制首先要解决的问题。由此,软测量进入了过程工业控制领域的研究视线。
常用的数据驱动软测量建模方法包括主元回归(Principal ComponentRegression,简称:PCR)、偏最小二乘回归(Partial Least Square Regression,简称:PLSR)以及人工神经网络(简称:ANN)。上述软测量算法建立的模型属于离线模型,模型建立后不会随着生成过程的改变而自适应调整,无法跟踪生产状态的变化,从而导致预测精度逐渐下降。因此,软测量模型的自动维护成为了算法研究与改进的重点。因此,为了适应现代化工生产过程表现出的多模态特性和时变特性,各种在线建模算法已经被广泛应用于生产过程的监控与质量变量预测。
目前,主流的在线软测量建模算法包括:滑动窗算法、递归算法、时间差分算法以及即时学习算法。其中,前三种都是根据时间相关性更新模型,属于时间自适应算法;即时学习算法是基于空间相关性对模型进行更新和维护,属于空间自适应算法。相比其他算法,即时学习算法的优势在于可以更好的适应生产过程中的突变现象,并且由于该算法对每个样本都建立局部模型,因此,也可以很好的描述过程变量之间的非线性关系。
相似样本的选择或者样本权重的计算是即时学习算法的核心步骤,会在很大程度上影响算法的预测精度。对于传统即时学习算法,一方面,相似样本的选择仅仅考虑了查询样本与历史样本输入变量的相似度,并没有考虑输出变量之间的相关性;另一方面,算法中一些可调参数的选择往往是一件非常困难的事,例如LWPLS算法中的核宽度参数以及LWLS算法中的相似样本的数目,这些参数的选择并没有明确的理论经验指导,并且会对模型的性能产生较大影响。由上可知,采用传统即时学习算法建立的模型存在预测精度差的问题。
发明内容
本发明针对现有技术存在的预测精度差等上述问题,提供一种基于样本协同表示的即时学习的软测量建模方法,能够提高样本权重的合理性与可靠性,无需选择相似样本个数以及高斯核函数的宽度等参数,提高了模型优化效率与预测精度。
为了达到上述目的,本发明提供了一种基于样本协同表示的即时学习的软测量建模方法,其具体步骤为:
S2、将已采集到的数据作为初始训练数据集对初始训练数据集按照公式(1)进行标准化处理,使其均值为0、方差为1,得到训练数据集XL为数据X标准化处理后得到的数据,为经标准化处理后得到的变量值,公式(1)表示为:
式中,函数mean(·)表示计算矩阵各行的均值,函数std(·)表示计算矩阵各行的标准差;
S5、根据权重矩阵Wvar计算查询数据xq与数据XL中所有样本的加权欧式距离;将加权欧式距离融合到协同表示的正则项中;计算数据XL与查询数据xq的协同表示系数,利用该协同表示系数得出训练数据集中各历史样本的权重矩阵
求解优化目标,得出离线岭回归模型的岭回归系数W0的解析表达式为:
W0=(XLXL T+λ0×I)-1XLYL (3)
式中,XL T为数据XL的转置,I为单位矩阵;
根据离线岭回归模型的岭回归系数W0通过公式(4)计算出各输入变量的权重矩阵,公式(4)表示为:
式中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
根据权重矩阵Wvar通过公式(5)和公式(6)计算查询数据xq与数据XL中所有样本的加权欧式距离d;公式(5)和公式(6)的表达式为:
Dxq=Wvar(xq×1-XL) (5)
通过公式(8)计算数据XL与查询数据xq的协同表示系数,公式(8)表示为:
b=(XL TWvarXL+λ1D)-1XL TWvarxq (8)
式中,b1为向量b的第一个元素,bn为向量b的第n个元素。
通过公式(11)计算出加权岭回归模型系数w,公式(11)表示为:
与现有技术相比,本发明的优点和积极效果在于:
本发明提供的基于样本协同表示的即时学习的软测量建模方法,将数据自表示算法引入即时学习中,并且针对即时学习的应用背景,对自表示算法进行改进,具体地,一方面,通过自表示算法计算样本权重的同时考虑到了输入变量的权重;另一方面,通过计算查询样本与历史样本之间的加权欧式距离,并且将其作为算法的正则项,从而融合了数据的局部空间距离信息。相比现有其他算法,本发明将相似样本的选择或者样本权重的计算转化为优化问题,提高了样本权重的合理性与可靠性。另外,相比传统算法中通过欧式距离计算样本权重的方式,本发明中无需选择相似样本个数以及高斯核函数的宽度等参数,提高了模型优化效率与预测精度。
附图说明
图1为本发明实施例所述脱丁烷塔(简称:DCP)的过程原理图;
图2为本发明实施例所述脱丁烷塔过程数据的真实输出曲线图;
图3为本发明所述基于样本协同表示的即时学习的软测量建模方法对脱丁烷塔数据的预测偏差示意图;
图4为现有局部加权偏最小二乘算法对脱丁烷塔数据的预测偏差示意图。
具体实施方式
下面,通过示例性的实施方式对本发明进行具体描述。然而应当理解,在没有进一步叙述的情况下,一个实施方式中的元件、结构和特征也可以有益地结合到其他实施方式中。
本发明针对工业过程中的时变、多模态特性,以及工业数据中普遍存在多重共线性问题,提供了一种基于样本协同表示的即时学习的软测量建模方法,通过即时学习算法建立软测量模型,克服了时变以及多模态问题;通过岭回归算法建立局部模型(即离线岭回归模型和加权岭回归模型),解决过程数据的多重共线性问题,并且具有较高的计算效率。另外,本发明中提出的基于表示的样本选择算法减少了算法中的可调参数,优化了建模过程,提高了样本权重的可靠性以及软测量模型的预测精度。以下对本发明所述基于样本协同表示的即时学习的软测量建模方法进行详细说明。
本发明实施例提供了一种基于样本协同表示的即时学习的软测量建模方法,其具体步骤为:
具体地,通过现场传感器以及存储设备实时采集与存储工业过程中与质量相关的辅助变量的数据。
S2、将已采集到的数据作为初始训练数据集对初始训练数据集按照公式(1)进行标准化处理,使其均值为0、方差为1,得到训练数据集XL为数据X标准化处理后得到的数据,为经标准化处理后得到的变量值,公式(1)表示为:
式中,函数mean(·)表示计算矩阵各行的均值,函数std(·)表示计算矩阵各行的标准差。
求解优化目标,得出离线岭回归模型的岭回归系数W0的解析表达式为:
W0=(XLXL T+λ0×I)-1XLYL (3)
式中,XL T为数据XL的转置,I为单位矩阵;
根据离线岭回归模型的岭回归系数W0通过公式(4)计算出各输入变量的权重矩阵,公式(4)表示为:
式中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
S5、根据权重矩阵Wvar计算查询数据xq与数据XL中所有样本的加权欧式距离;将加权欧式距离融合到协同表示的正则项中;计算数据XL与查询数据xq的协同表示系数,利用该协同表示系数得出训练数据集中各历史样本的权重矩阵
根据权重矩阵Wvar通过公式(5)和公式(6)计算查询数据xq与数据XL中所有样本的加权欧式距离d;公式(5)和公式(6)的表达式为:
Dxq=Wvar(xq×1-XL) (5)
通过公式(8)计算数据XL与查询数据xq的协同表示系数,公式(8)表示为:
b=(XL TWvarXL+λ1D)-1XL TWvarxq (8)
式中,b1为向量b的第一个元素,bn为向量b的第n个元素。
通过公式(11)计算出加权岭回归模型系数w,公式(11)表示为:
本发明实施例上述方法,通过协同表示算法获得历史样本的权重矩阵,并通过加权岭回归算法建立加权岭回归模型,将两种算法进行融合,形成统一的优化目标。对于新采集的查询数据,首先计算查询数据与训练样本的加权欧式距离,并将加权欧式距离融合到协同表示的正则项中,计算协同表示系数及各历史样本的权重矩阵,根据各样本的权重矩阵建立加权岭回归模型计算查询数据对应的输出值。本发明实施例所述方法,不仅能够很好地处理工业过程的非线性、时变性及多重共线性问题,还将相似样本选择和局部模型的构建融合到一个优化函数中,实现利用局部模型的信息指导相似样本的选择,提高相似样本的可靠性及局部模型的预测精度。
为了说明本发明上述基于样本协同表示的即时学习的软测量建模方法的效果,以下结合具体实施例对本发明做出进一步说明。
实施例:以脱丁烷塔的过程数据为例进行说明。
脱丁烷塔(以下简称:DCP)是脱硫和石脑油分裂工厂的一部分,其任务是尽可能地减少塔底丁烷的浓度。某DCP的原理如图1所示。通常塔底丁烷浓度是由安装在塔顶的一块气相色谱分析仪在线测量的,由于塔底丁烷蒸汽到达塔顶需要一定的时间,气相色谱仪的分析过程亦需要一定的时间,因此,对塔底丁烷浓度的在线测量存在较大的滞后,从而需要建立软测量模型,以在线实时估计塔底丁烷浓度。在建立塔底丁烷浓度的软测量模型时,选择安装在脱丁烷塔上的七个传感器采集的过程变量(参见图1)作为辅助变量,表1给出了这七个辅助变量的解释。数据集来自实际工业生产过程,样本数量为2382,按采样时间排列,实际的输出曲线如图2所示。
表1
辅助变量 | 变量描述 |
X<sub>1</sub> | 塔顶温度 |
X<sub>2</sub> | 塔底压力 |
X<sub>3</sub> | 回流量 |
X<sub>4</sub> | 流向下一过程流量 |
X<sub>5</sub> | 第6层塔板温度 |
X<sub>6</sub> | 塔底温度1 |
X<sub>7</sub> | 塔底温度2 |
接下来结合脱丁烷塔生产过程对本发明的具体步骤进行阐述:
1、将已采集到的数据作为训练数据集,并且进行预处理。
进而得到:
2、利用训练数据集建立离线岭回归模型,并且计算出各输入变量的权重矩阵。
3、采集新数据进行标准化处理。
5、根据样本权重矩阵建立在线加权岭回归模型,并且预测查询数据的输出值。
本发明所述方法(简称:RSS-JITL)与传统局部加权偏最小二乘(简称:LWPLS)算法对脱丁烷塔数据输出变量的预测偏差值如图3、图4所示。由图3、图4可以看出,本发明所述方法与传统方法相比,具有更高的预测精度。
上述实施例用来解释本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。
Claims (4)
1.一种基于样本协同表示的即时学习的软测量建模方法,其特征在于,其具体步骤为:
S2、将已采集到的数据作为初始训练数据集对初始训练数据集按照公式(1)进行标准化处理,使其均值为0、方差为1,得到训练数据集XL为数据X标准化处理后得到的数据,为经过标准化处理后得到的变量值,公式(1)表示为:
式中,函数mean(·)表示计算矩阵各行的均值,函数std(·)表示计算矩阵各行的标准差;
S5、根据权重矩阵Wvar计算查询数据xq与数据XL中所有样本的加权欧式距离;将加权欧式距离融合到协同表示的正则项中;计算数据XL与查询数据xq的协同表示系数,利用该协同表示系数得出训练数据集中各历史样本的权重矩阵
求解优化目标,得出离线岭回归模型的岭回归系数W0的解析表达式为:
W0=(XLXL T+λ0×I)-1XLYL (3)
式中,XL T为数据XL的转置,I为单位矩阵;
根据离线岭回归模型的岭回归系数W0通过公式(4)计算出各输入变量的权重矩阵,公式(4)表示为:
式中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
根据权重矩阵Wvar通过公式(5)和公式(6)计算查询数据xq与数据XL中所有样本的加权欧式距离d;公式(5)和公式(6)的表达式为:
Dxq=Wvar(xq×1-XL) (5)
式中,为对角矩阵Di,i=di,i=1,2,…,n,且元素全为1,符号表示两个矩阵的对应元素相乘,函数sum(·)表示将矩阵各行相加;建立查询数据xq与训练数据集的协同表示模型,并融合权重矩阵和加权欧式距离,优化目标为:
通过公式(8)计算数据XL与查询数据xq的协同表示系数,公式(8)
表示为:
b=(XL TWvarXL+λ1D)-1XL TWvarxq (8)
式中,b1为向量b的第一个元素,bn为向量b的第n个元素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111432914.1A CN114117919B (zh) | 2021-11-29 | 2021-11-29 | 基于样本协同表示的即时学习的软测量建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111432914.1A CN114117919B (zh) | 2021-11-29 | 2021-11-29 | 基于样本协同表示的即时学习的软测量建模方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114117919A CN114117919A (zh) | 2022-03-01 |
CN114117919B true CN114117919B (zh) | 2022-08-23 |
Family
ID=80371579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111432914.1A Active CN114117919B (zh) | 2021-11-29 | 2021-11-29 | 基于样本协同表示的即时学习的软测量建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114117919B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116738866B (zh) * | 2023-08-11 | 2023-10-27 | 中国石油大学(华东) | 一种基于时间序列特征提取的即时学习的软测量建模方法 |
CN116821695B (zh) * | 2023-08-30 | 2023-11-03 | 中国石油大学(华东) | 一种半监督神经网络软测量建模方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109840362A (zh) * | 2019-01-16 | 2019-06-04 | 昆明理工大学 | 一种基于多目标优化的集成即时学习工业过程软测量建模方法 |
CN113158473A (zh) * | 2021-04-27 | 2021-07-23 | 昆明理工大学 | 一种半监督集成即时学习工业混炼胶门尼粘度软测量方法 |
CN113221019A (zh) * | 2021-04-02 | 2021-08-06 | 合肥工业大学 | 基于即时学习的个性化推荐方法和系统 |
-
2021
- 2021-11-29 CN CN202111432914.1A patent/CN114117919B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109840362A (zh) * | 2019-01-16 | 2019-06-04 | 昆明理工大学 | 一种基于多目标优化的集成即时学习工业过程软测量建模方法 |
CN113221019A (zh) * | 2021-04-02 | 2021-08-06 | 合肥工业大学 | 基于即时学习的个性化推荐方法和系统 |
CN113158473A (zh) * | 2021-04-27 | 2021-07-23 | 昆明理工大学 | 一种半监督集成即时学习工业混炼胶门尼粘度软测量方法 |
Non-Patent Citations (2)
Title |
---|
ELM岭回归软测量建模方法;王改堂等;《合肥工业大学学报(自然科学版)》;20110828(第08期);全文 * |
基于多样性加权相似度的集成局部加权偏最小二乘软测量建模;潘贝等;《信息与控制》;20190415(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114117919A (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11164095B2 (en) | Fuzzy curve analysis based soft sensor modeling method using time difference Gaussian process regression | |
CN114117919B (zh) | 基于样本协同表示的即时学习的软测量建模方法 | |
CN108764517B (zh) | 一种高炉铁水硅含量变化趋势预测方法、设备和存储介质 | |
CN109992921B (zh) | 一种燃煤电厂锅炉热效率的在线软测量方法及系统 | |
CN112101480A (zh) | 一种多变量聚类与融合的时间序列组合预测方法 | |
CN110309608B (zh) | 一种针对时滞不确定信息的高炉铁水硅含量预报方法 | |
CN114841073A (zh) | 基于局部标签传播的即时学习半监督软测量建模方法 | |
CN114528764A (zh) | 基于整体优化的即时学习的软测量建模方法及装置 | |
CN109324014B (zh) | 一种自适应的原油性质近红外快速预测方法 | |
CN113012766B (zh) | 一种基于在线选择性集成的自适应软测量建模方法 | |
CN102004444A (zh) | 稀土萃取过程组分含量多模型预测控制方法 | |
CN112113146B (zh) | 供水管网管道粗糙系数和节点需水量同步自适应校核方法 | |
CN105868164A (zh) | 一种基于有监督的线性动态系统模型的软测量建模方法 | |
CN115860211A (zh) | 一种基于局部在线建模的铸坯质量预测方法 | |
CN101446828A (zh) | 一种非线性过程质量预报方法 | |
CN116821695B (zh) | 一种半监督神经网络软测量建模方法 | |
CN106599391B (zh) | 基于三角形角度值动态加权的关联向量机软测量建模方法 | |
CN113420500A (zh) | 智能常减压系统 | |
CN111142488B (zh) | 基于工况比对驱动的流程工业优化方法 | |
CN117312816A (zh) | 一种特种钢材的冶炼效果评估方法及系统 | |
CN116842841A (zh) | 基于人工智能的沉管隧道服役状态预测方法 | |
CN115631804A (zh) | 基于数据协调的蒸发过程铝酸钠溶液出口浓度预测方法 | |
CN114970341B (zh) | 基于机器学习的低轨卫星轨道预报精度提升模型建立方法 | |
CN115985411A (zh) | 基于高斯过程回归模型的高分子熔融指数软测量方法 | |
CN114580151A (zh) | 一种基于灰色线性回归-马尔科夫链模型的需水预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |