CN108416463A - 一种加氢裂化过程的产品质量预测方法和系统 - Google Patents
一种加氢裂化过程的产品质量预测方法和系统 Download PDFInfo
- Publication number
- CN108416463A CN108416463A CN201810082741.7A CN201810082741A CN108416463A CN 108416463 A CN108416463 A CN 108416463A CN 201810082741 A CN201810082741 A CN 201810082741A CN 108416463 A CN108416463 A CN 108416463A
- Authority
- CN
- China
- Prior art keywords
- sample
- similarity
- query
- historical
- product quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种加氢裂化过程的产品质量预测方法,包括:采集一个或多个查询样本,对于每一个查询样本,根据不同的相似度准则,从历史样本库中选择与该查询样本在对应相似度准则下相似度最高的多个历史样本组成局部建模样本组,根据局部建模样本组建立对应的局部加权偏最小二乘模型;将查询样本分别输入到每一个局部加权偏最小二乘模型中,获取每一个局部加权偏最小二乘模型下查询样本的产品质量的预测值;基于预测值,获取产品质量的集成预测值。本发明基于不同的相似度准则对同一查询样本建立不同的局部加权偏最小二乘模型,获取查询样本在所有相似度准则下的集成预测值,解决了单一相似度驱动即时学习方法的预测精度不足和泛化能力弱的问题。
Description
技术领域
本发明涉及集成学习技术领域,更具体地,涉及一种加氢裂化过程的产品质量预测方法和系统。
背景技术
加氢裂化过程是石化企业非常重要的一个二次加工工艺过程,它由入料系统、加氢精制反应器、加氢裂化反应器、高低压分离系统、分馏系统(包括脱硫化氢汽提塔、主分馏塔、脱丁烷塔、石脑油分馏塔)等多个关键工序级联而成。在该加氢裂化过程中,原料由入口进入到产品的生成,中间需要经过几个小时甚至更长时间的物料传输和反应过程。
为了保证最终产品质量,需要对质量指标进行实时监测和控制。但是,产品质量指标的检测往往都是在产品输出端进行采样进行离线化验,该过程需要花费大量时间,离线化验将引入较大的时间滞后性。同时,由于采样和化验的过程繁琐,产品质量的检测时刻较少,在一天生产过程中往往只检测某几个固定时刻点。因此,现有生产过程无法对产品质量进行实时检测。在生产过程中,若产品质量发生波动,生产人员和质检人员也无法及时获取相应信息,造成生产过程的控制、优化的滞后性。另一方面,生产装置中往往装有大量的过程变量传感器,用于对整个生产过程的监测,而这些可测的过程变量与质量指标之间具有较大的相关关系。
为此,可利用过程生产中容易检测的温度、压力、流量等过程变量信息,建立产品质量指标与过程变量之间的软测量预测模型,对产品质量进行在线实时估计与预测。而现有的即时学习建模,往往都是采用某单一的相似度准则选择局部建模样本组,如欧氏距离,角度距离等。这些单一相似度度量准则的使用,往往只考虑样本相似度的某一方面特性,而忽略了其他特性,因而会限制即时学习建模方法在加氢裂化过程中预测效果的提升。同时,在加氢裂化过程中,由于无法获取准确的数据样本之间的相似度特征,单一的相似度度量准则无法正确描述过程数据样本之间的真实相似度。因此,如何基于该过程的历史数据快速、准确地预测出产品的质量指标,对过程的控制和优化都具有重要意义,也是目前加氢裂化过程在实际生产中亟需解决的问题。
发明内容
本发明提供一种克服上述问题或者至少部分地解决上述问题的加氢裂化过程的产品质量预测方法和系统。
一方面,本发明提供一种加氢裂化过程的产品质量预测方法,包括:
S1,采集一个或多个查询样本,对于每一个查询样本,根据不同的相似度准则,从历史样本库中选择与该查询样本在对应相似度准则下相似度最高的多个历史样本组成局部建模样本组,根据所述局部建模样本组建立对应的局部加权偏最小二乘模型;
S2,将所述查询样本分别输入到每一个所述局部加权偏最小二乘模型中,获取每一个所述局部加权偏最小二乘模型下查询样本的产品质量的预测值;
S3,基于所述预测值,获取产品质量的集成预测值;
其中,所述查询样本为与加氢裂化过程具有关联性的过程变量,所述相似度准则表示计算不同样本间相似程度的方法,所述历史样本库由加氢裂化过程中采集的一定数量的历史样本组成。
优选地,步骤S1中所述根据不同的相似度准则,从历史样本库中选择与该查询样本在对应相似度准则下相似度最高的多个历史样本组成局部建模样本组具体包括:
从历史样本库中连续抽取第一预设数量的历史样本作为训练集;
对于每一个查询样本,根据欧氏距离、欧氏距离与角度相结合和输出相关性这三种相似度准则,分别计算所述查询样本与所述训练集中每一个历史样本间的相似度指标;
对于每一个相似度准则,将对应求得的所有相似度指标从大到小排列,取排列靠前的第二预设数量的历史样本作为局部建模样本组。
优选地,所述欧氏距离的相似度指标的计算公式如下:
disi=||xq-xi||2
其中,所述par1为距离参数,s1,i表示查询样本与第i个历史样本间的第一相似度指标,disi表示查询样本与第i个历史样本间的欧氏距离,xq表示查询样本,xi表示第i个历史样本。
优选地,所述欧氏距离与角度相结合的相似度指标的计算公式如下:
disi=||xq-xi||2
Δxq=xq-xq-1
Δxi=xi-xi-1
其中,所述par2为距离参数,s2,i表示查询样本与第i个历史样本间的第二相似度指标,disi表示查询样本与第i个历史样本间的欧氏距离,xq表示查询样本,xi表示第i个历史样本,γ为权值参数。
优选地,所述输出相关性的相似度指标的计算公式如下:
dis′i=||tq-ti||2
其中,所述par3为距离参数,s3,i表示查询样本与第i个历史样本间的第三相似度指标,dis′i表示隐变量空间中查询样本与第i个历史样本间的欧氏距离,tq表示查询样本xq映射到输出相关的隐变量空间的投影,ti表示第i个历史样本xi映射到输出相关的隐变量空间的投影。
优选地,步骤S1中所述根据所述局部建模样本组建立对应的局部加权偏最小二乘模型的具体步骤包括:
对于每一种相似度准则,将所述查询样本与局部建模样本组中所有历史样本间的相似性指标作为权值列向量,根据所述局部建模样本组与所述权值列向量分别计算所述局部建模样本组的输入变量和输出变量的加权均值;
根据所述加权均值对所述查询样本与所述局部建模样本组的输入变量及输出变量进行去均值处理,根据处理后的查询样本、输入变量和输出变量建立局部加权偏最小二乘模型。
优选地,步骤S3具体包括:
根据每一种相似度准则对应的局部加权偏最小二乘模型,获取所述相似度准则的集成权值;
对每一种相似度准则对应的预测值与集成权值进行加权求和,获取产品质量的集成预测值。
优选地,所述获取相似度准则的集成权值的步骤具体包括:
从历史样本库中连续抽取第三预设数量的历史样本作为验证集,所述验证集中不存在与所述训练集中重合的历史样本;
对于每一种相似度准则对应的局部加权偏最小二乘模型,输入验证集中所有的历史样本,每一个历史样本对应输出一个预测值;
根据所述预测值与每一个历史样本对应的真实值,计算该相似度准则下所述预测值与对应的真实值间的均方根误差,获取该相似度准则的集成权值。
优选地,所述获取该相似度准则的集成权值的计算公式如下:
其中,所述RMSEk为第k种相似度准则下预测值与对应的真实值间的均方根误差,par表示权值调节参数,γk表示第k种相似度准则的权值,表示所有相似度准则对应的权值的和,γ′k表示第k种相似度准则的集成权值。
另一方面,本发明提供一种加氢裂化过程的产品质量预测系统,包括:
局部建模模块,用于采集一个或多个查询样本,对于每一个查询样本,根据不同的相似度准则,从历史样本库中选择与该查询样本在对应相似度准则下相似度最高的多个历史样本组成局部建模样本组,根据所述局部建模样本组建立对应的局部加权偏最小二乘模型;
第一预测值获取模块,用于将所述查询样本分别输入到每一个所述局部加权偏最小二乘模型中,获取每一个所述局部加权偏最小二乘模型下查询样本的产品质量的预测值;
第二预测值获取模块,用于基于所述预测值,获取产品质量的集成预测值;
其中,所述查询样本为与加氢裂化过程具有关联性的过程变量,所述相似度准则表示计算不同样本间相似程度的方法,所述历史样本库由加氢裂化过程中采集的一定数量的历史样本组成。
本发明提供的一种加氢裂化过程的产品质量预测方法和系统,对于每一个查询样本,都基于不同的相似度准则建立不同的局部加权偏最小二乘模型,获取查询样本在不同相似度准则下的预测值,对不同相似度准则下的预测值进行加权求和,获取该查询样本最终的集成预测值,通过集成查询样本在不同相似度准则下求得的产品质量的预测值,较好地解决了传统单一相似度驱动即时学习方法的预测精度不足和泛化能力弱的问题。
附图说明
图1为本发明一个实施例的加氢裂化过程的产品质量预测方法的流程图;
图2为本发明一个实施例的加氢裂化过程的产品质量预测系统的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
参见图1,为本发明一个实施例的加氢裂化过程的产品质量预测方法的流程图,包括:S1,采集一个或多个查询样本,对于每一个查询样本,根据不同的相似度准则,从历史样本库中选择与该查询样本在对应相似度准则下相似度最高的多个历史样本组成局部建模样本组,根据所述局部建模样本组建立对应的局部加权偏最小二乘模型;S2,将所述查询样本分别输入到每一个所述局部加权偏最小二乘模型中,获取每一个所述局部加权偏最小二乘模型下查询样本的产品质量的预测值;S3,基于所述预测值,获取产品质量的集成预测值;其中,所述查询样本为与加氢裂化过程具有关联性的过程变量,所述相似度准则表示计算不同样本间相似程度的方法,所述历史样本库由加氢裂化过程中采集的一定数量的历史样本组成。
具体地,本发明基于加氢裂化过程的机理特性选取与该过程具有较强关联性的过程变量作为模型的输入量,将加氢裂化过程中关键产品质量作为模型的输出量,通过数据采集和分析获得一定数量的生产时间内过程变量和产品质量的历史样本数据,建立历史样本库。采集一个或多个查询样本,每个查询样本都包括与加氢裂化过程具有关联性的过程变量,对于每一个查询样本,都根据每一种相似度准则从历史样本库中选择多个相似度最高的历史样本作为局部建模样本组,并根据每一组的局部建模样本组建立一个局部加权偏最小二乘模型,使得在每一种相似度准则下,都基于历史样本建立了一个局部加权偏最小二乘模型。其中,相似度准则有多种,每种相似度准则都表示一种计算不同样本间相似程度的方法,用于描述查询样本与历史样本间的真实相似度。
将查询样本分别输入到与各相似度准则对应的局部加权偏最小二乘模型中,从每一个局部加权偏最小二乘模型中都获取在该相似度准则下查询样本的产品质量的预测值,基于查询样本在每一种相似度准则下产品质量的预测值,将所有预测值集成在一起的获取查询样本的产品质量的集成预测值,以弥补各种相似度准则在选择局部建模样本的缺陷,有效提升最终获得的集成预测值的准确度。
本发明通过对于每一个查询样本,都基于不同的相似度准则建立不同的局部加权偏最小二乘模型,获取查询样本在不同相似度准则下的预测值,对不同相似度准则下的预测值进行集成处理,获取该查询样本最终的集成预测值,通过集成查询样本在不同相似度准则下求得的产品质量的预测值,弥补了单一相似度准则在选择局部建模样本时的缺陷,较好地解决了传统单一相似度驱动即时学习方法的预测精度不足和泛化能力弱的问题。
基于上述实施例,作为一种可选的实施例,步骤S1中根据不同的相似度准则,获得对应的局部加权偏最小二乘模型具体包括:根据不同的相似度准则,从历史样本库中选择与该查询样本在对应相似度准则下相似度最高的多个历史样本组成局部建模样本组具体包括:从历史样本库中连续抽取第一预设数量的历史样本作为训练集;对于每一个查询样本,根据欧氏距离、欧氏距离与角度相结合和输出相关性这三种相似度准则,分别计算所述查询样本与所述训练集中每一个历史样本间的相似度指标;对于每一个相似度准则,将对应求得的所有相似度指标从大到小排列,取排列靠前的第二预设数量的历史样本作为局部建模样本组。
具体地,从加氢裂化过程中采集第一预设数量的历史样本作为训练集,根据该训练集训练与各相似度准则对应的局部加权偏最小二乘模型。根据相似度准则的不同,每一个查询样本与训练集中每一个历史样本的相似度指标也不同。本发明实施例中选取了欧氏距离、欧氏距离与角度相结合和输出相关性这三种相似度准则,需要说明的是,相似度准则可以选取任意计算不同样本间相似程度的方法,并不局限于上述三种相似度准则。
对应每一种相似度准则,都计算查询样本与训练集中每一个历史样本在该相似度准则下的相似度指标,并将上述所有相似度指标从大到小依次排列,并取排列靠前的第二预设数量的历史样本作为局部建模样本组建立与上述相似度准则对应的局部加权偏最小二乘模型,则对应每一种相似度准则都建立一个局部加权偏最小二乘模型。需要说明的是,相似度指标越大,说明查询样本与该历史样本间的相似性越高,因此从训练集中选取与查询样本相似度指标最高的若干个历史样本作为局部建模样本组,可使得用该局部建模样本组建立的模型具有更好的性能。
基于上述实施例,作为一种可选的实施例,所述欧氏距离的相似度指标的计算公式如下:
disi=||xq-xi||2
其中,所述par1为距离参数,s1,i表示查询样本与第i个历史样本间的第一相似度指标,disi表示查询样本与第i个历史样本间的欧氏距离,xq表示查询样本,xi表示第i个历史样本。
具体地,当相似度准则选用欧氏距离时,从欧氏距离的角度计算查询样本与训练集中每一个历史样本间的第一相似度指标,此时,查询样本xq与训练集中第i个历史样本xi间的欧氏距离disi如下:
disi=||xq-xi||2
基于欧氏距离,可计算查询样本xq与训练集中第i个历史样本xi间的第一相似度指标s1,i如下:
其中,par1表示距离参数,可根据大量实验数据选出误差最小的距离参数作为par1。
基于上述实施例,作为一种可选的实施例,所述欧氏距离与角度相结合的相似度指标的计算公式如下:
disi=||xq-xi||2
Δxq=xq-xq-1
Δxi=xi-xi-1
其中,所述par2为距离参数,s2,i表示查询样本与第i个历史样本间的第二相似度指标,disi表示查询样本与第i个历史样本间的欧氏距离,xq表示查询样本,xi表示第i个历史样本,γ为权值参数。
具体地,当相似度准则选用欧氏距离与角度相结合时,从欧氏距离与角度相结合的角度计算查询样本与训练集中每一个历史样本间的第二相似度指标,此时,查询样本xq与训练集中第i个历史样本xi间的欧氏距离disi如下:
disi=||xq-xi||2
再计算采样时间相邻的两个查询样本间的距离Δxq与采样时间相邻的两个历史样本间的距离Δxi如下:
Δxq=xq-xq-1
Δxi=xi-xi-1
则有欧氏距离disi对应的角度余弦值cos(θi)为:
则基于欧氏距离与角度相结合,可计算查询样本xq与训练集中第i个历史样本xi间的第二相似度指标s2,i如下:
其中,par2表示距离参数,γ表示权值参数,可根据大量实验数据选出误差最小的距离参数和权值参数分别作为par2与γ。
基于上述实施例,作为一种可选的实施例,所述输出相关性的相似度指标的计算公式如下:
dis′i=||tq-ti||2
其中,所述par3为距离参数,s3,i表示查询样本与第i个历史样本间的第三相似度指标,disi′表示隐变量空间中查询样本与第i个历史样本间的欧氏距离,tq表示查询样本xq映射到输出相关的隐变量空间的投影,ti表示第i个历史样本xi映射到输出相关的隐变量空间的投影。
具体地,当相似度准则选用输出相关性时,先对训练集中每一历史样本数据进行PLS降维处理,使历史样本中的输入数据Xh与输出数据Yh分别有:
Xh=TP+E
Yh=TQ+F
其中,T为输出相关的隐变量,其由所有历史样本数据的隐变量ti构成,P与Q分别为输入和输出空间的投影方向,E和F为输入和输出的残差矩阵。需要说明的是,隐变量是不可观测的随机变量,可通过可观测变量的样本来对隐变量作出推断。
将查询样本xq映射到隐变量空间,可获取查询样本xq关于隐变量的表达式为:
xq=tqP+eq
需要说明的是,上述tq为查询样本xq映射到隐变量空间的投影,eq为残差值。
此时,映射到隐变量空间中的查询样本tq与训练集中第i个历史样本ti间的欧氏距离dis′i如下:
dis′i=||tq-ti||2
基于欧氏距离,可计算映射到隐变量空间中的查询样本tq与训练集中映射到隐变量空间中的第i个历史样本ti间的第三相似度指标s3,i如下:
其中,par3表示距离参数,可根据大量实验数据选出误差最小的距离参数作为par3。
基于上述实施例,作为一种可选的实施例,步骤S1中所述根据所述局部建模样本组建立对应的局部加权偏最小二乘模型的具体步骤包括:对于每一种相似度准则,将所述查询样本与局部建模样本组中所有历史样本间的相似性指标作为权值列向量,根据所述局部建模样本组与所述权值列向量分别计算所述局部建模样本组的输入变量和输出变量的加权均值;根据所述加权均值对所述查询样本与所述局部建模样本组的输入变量及输出变量进行去均值处理,根据处理后的查询样本、输入变量和输出变量建立局部加权偏最小二乘模型。
具体地,对于每一种可选的实施例,在每一种相似度准则下,将每一个查询样本与局部建模样本组中所有历史样本间的相似性指标作为权值列向量ω,X为局部建模样本组的输入变量,Y为局部建模样本组的输出变量,则可计算局部建模样本组的输入变量的加权均值xmean和输出变量的加权均值ymean如下:
其中,num表示局部建模样本组中所有历史样本的数量。
对局部建模样本组以及查询样本进行去均值处理,则有:
x′i=xi-xmean
y′i=yi-ymean
x′q=xq-xmean
其中,xi表示局部建模样本组中第i个历史样本的输入变量,x′i表示去均值处理后的输入变量,yi表示局部建模样本组中第i个历史样本的输出变量,y′i表示去均值处理后的输出变量,xq表示查询样本,x′q表示去均值处理后的查询样本。根据去均值处理后的查询样本、局部建模样本组的输入变量和输出变量建立局部加权偏最小二乘模型。
基于上述实施例,作为一种可选的实施例,步骤S3具体包括:根据每一种相似度准则对应的局部加权偏最小二乘模型,获取所述相似度准则的集成权值;对每一种相似度准则对应的预测值与集成权值进行加权求和,获取产品质量的集成预测值。
具体地,对于每一个查询样本,根据每一种相似度准则,都建立一个局部加权偏最小二乘模型,且对于每一种相似度准则,都有一个集成权值,则可对每一种相似度准则对应的预测值与集成权值进行加权求和,获取产品质量的集成预测值如下:
其中,上述n表示相似度准则的种数,γk表示第k种相似度准则的集成权值,yq,k表示第k种相似度准则对应的局部加权偏最小二乘模型输出的预测值。
通过加权求和的方式获取多种相似度准则下查询样本的集成预测值,可弥补单一相似度准则在选择局部局部建模样本组时的缺陷,较好地解决了传统单一相似度驱动即时学习方法的预测精度不足和泛化能力弱的问题。
基于上述实施例,作为一种可选的实施例,所述获取所述相似度准则的集成权值的步骤具体包括:从历史样本库中连续抽取第三预设数量的历史样本作为验证集,所述验证集中不存在与所述训练集中重合的历史样本;对于每一种相似度准则对应的局部加权偏最小二乘模型,输入验证集中所有的历史样本,每一个历史样本对应一个预测值;根据所述预测值与每一个历史样本对应的真实值,计算该相似度准则下所述预测值与对应的真实值间的均方根误差,获取该相似度准则的集成权值。
具体地,对每一相似度准则而言,该相似度准则的集成权值通过与该相似度准则相对应的局部加权偏最小二乘模型求得。从加氢裂化过程中采集了第一预设数量的历史样本作为训练集训练局部加权偏最小二乘模型,则从排除了训练集中所有历史样本外的历史样本库中再抽取第三预设数量的历史样本作为验证集,使得验证集中不存在与所述训练集中重合的历史样本,上述验证集用于验证相似度准则在对应局部加权偏最小二乘模型中的集成权值。
向局部加权偏最小二乘模型中输入验证集中所有的历史样本,局部加权偏最小二乘模型对应每一个样本都有一个预测值,且每一个历史样本中还包括该历史样本输出的真实值,则可根据验证集中每一个历史样本的预测值与真实值间的均方根误差,求得该局部加权偏最小二乘模型对应的相似度准则的集成权值。
基于上述实施例,作为一种可选的实施例,所述获取该相似度准则的集成权值的计算公式如下:
其中,所述RMSEk为第k种相似度准则下预测值与对应的真实值间的均方根误差,par表示权值调节参数,γk表示第k种相似度准则的权值,表示所有相似度准则对应的权值的和,γ′k表示第k种相似度准则的集成权值。
具体地,根据验证集中每一个历史样本的预测值与真实之值间的均方根误差,求得该局部加权偏最小二乘模型对应的相似度准则的权值γk的公式如下:
其中,RMSEk为第k种相似度准则下的预测值与对应的真实值之间的均方根误差,par表示权值调节参数,γk表示第k种相似度准则的权值。
对上述所有相似度准则的权值作归一化处理,得到相似度准则的集成权值,使得所有相似度准则的集成权值相加后的和值为1,以便集成每一种相似度准则下查询样本的产品质量的预测值的集成结果,则有归一化处理后的集成权值γ′k如下:
本发明通过对于每一个查询样本,都基于不同的相似度准则建立不同的局部加权偏最小二乘模型,获取查询样本在不同相似度准则下的预测值,对不同相似度准则下的预测值进行加权求和,获取该查询样本最终的集成预测值,通过集成查询样本在不同相似度准则下求得的产品质量的预测值,弥补了单一相似度准则在选择局部局部建模样本组时的缺陷,较好地解决了传统单一相似度驱动即时学习方法的预测精度不足和泛化能力弱的问题。
基于上述实施例,作为一种优选的实施例,本发明一个实施例的加氢裂化过程的产品质量预测的具体方法步骤如下:
基于生产过程要求,选择柴油产品的初馏点作为输出变量即产品质量的变量,如表1所示,为对柴油初馏点有影响的关键变量,通过机理分析从过程中选取对柴油初馏点质量有较大影响的46个过程变量作为加氢裂化过程产品质量预测模型的输入变量,分别记为x1、x2、...、x46。
表1对柴油初馏点有影响的关键变量
提取柴油初馏点y的162天生产时段里每天早上8时离线化验测得的数据值,同时提取对应时刻的46个过程变量采样数据,共162个数据样本。将所得数据分三部分,取第一预设数量为98,第三预设数量为32,则将历史样本库中的98个历史样本作训练集,32个作验证集,32个作为查询样本集。则此时训练集中的输入矩阵Xh与输出矩阵Yh如下:
Xh=[x1,x2,...,x98]T
Yh=[y1,y2,...,y98]T
且对于输入矩阵中第i个历史样本的输入xi而言,有:
xi=[xi,1,xi,2,...,xi,46]
分别表示第i个历史样本的输入xi中的46个关键变量。
对于查询样本集中的任意一个查询样本xq,计算每一种相似度指标下该查询样本与训练集中每一个历史样本的相似度指标,本实施例从欧氏距离、欧氏距离与角度相结合和输出相关性这三种角度分别定义了三个不同的相似度准则,则有:
从欧氏距离的角度定义相似度指标时,距离参数par1取值为23,取第二预设数量为30,将计算得到的查询样本xq与训练集中所有历史样本的相似度指标降序排列后,取最大的前30个样本作为局部建模样本组,将局部建模样本组的输入矩阵记为X1,输出矩阵记为Y1,对应的权值列向量记为ω1。
从欧氏距离与角度相结合的角度定义相似度指标时,距离参数par2取值为19,权值参数取值为0.835。取第二预设数量为30,将计算得到的查询样本xq与训练集中所有历史样本的相似度指标降序排列后,取最大的前30个样本作为局部建模样本组,将局部建模样本组的输入矩阵记为X2,输出矩阵记为Y2,对应的权值列向量记为ω2。
从输出相关性的角度定义相似度指标时,对训练集中历史样本的输入矩阵进行PLS降维,将训练集中历史样本的输入矩阵和查询样本xq映射到降维后的空间中,此时降维后的特征共18个,距离参数par3取值为19。取第二预设数量为30,将计算得到的映射到降维后的空间中的查询样本tq与训练集中所有历史样本的相似度指标降序排列后,取最大的前30个样本作为局部建模样本组,将局部建模样本组的输入矩阵记为X3,输出矩阵记为Y3,对应的权值列向量记为ω3。
利用局部加权偏最小二乘法分别对{X1,Y1,ω1}、{X2,Y2,ω2}和{X3,Y3,ω3}这三组数据进行建模,建立三个局部加权偏最小二乘模型。
将验证集中的历史样本分别输入到上述三个局部加权偏最小二乘模型中,分别计算三种相似度准则的均方根误差,并根据每一种相似度准则的均方根误差计算该相似度误差的集成权值;
将查询样本分别输入上述三个局部加权偏最小二乘模型中,获取每一相似度准则下的预测值,并使用下述公式求得查询样本的产品质量的集成预测值
其中,γk表示第k种相似度准则的集成权值,表示查询样本xq在第k种相似度准则下的产品质量的预测值。
参见图2,为本发明一个实施例的加氢裂化过程的产品质量预测系统的结构示意图,包括:局部建模模块,用于采集一个或多个查询样本,对于每一个查询样本,根据不同的相似度准则,从历史样本库中选择与该查询样本在对应相似度准则下相似度最高的多个历史样本组成局部建模样本组,根据所述局部建模样本组建立对应的局部加权偏最小二乘模型;第一预测值获取模块,用于将所述查询样本分别输入到每一个所述局部加权偏最小二乘模型中,获取每一个所述局部加权偏最小二乘模型下查询样本的产品质量的预测值;第二预测值获取模块,用于基于所述预测值,获取产品质量的集成预测值;其中,所述查询样本为与加氢裂化过程具有关联性的过程变量,所述相似度准则表示计算不同样本间相似程度的方法,所述历史样本库由加氢裂化过程中采集的一定数量的历史样本组成。
具体地,局部建模模块用于根据采集到的查询样本对应不同的相似度准则建立多个局部加权偏最小二乘模型;第一预测值获取模块用于将查询样本输入到每个与相似度准则相对应的局部加权偏最小二乘模型中,使得每个局部加权偏最小二乘模型都输出一个查询样本的产品质量的预测值;第二预测值获取模块用于集成第一预测值获取模块获得的各个预测值,获取所有相似度准则下查询样本的产品质量的集成预测值。需要说明的是,加氢裂化过程中的产品质量的集成预测值获取的具体步骤已经在上述对应的方法实施例中说明,此处不再多做赘述。
本发明通过对于每一个查询样本,都基于不同的相似度准则建立不同的局部加权偏最小二乘模型,获取查询样本在不同相似度准则下的预测值,对不同相似度准则下的预测值进行集成,获取该查询样本最终的集成预测值,通过集成查询样本在不同相似度准则下求得的产品质量的预测值,弥补了单一相似度准则在选择局部局部建模样本组时的缺陷,较好地解决了传统单一相似度驱动即时学习方法的预测精度不足和泛化能力弱的问题。
最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种加氢裂化过程的产品质量预测方法,其特征在于,包括:
S1,采集一个或多个查询样本,对于每一个查询样本,根据不同的相似度准则,从历史样本库中选择与该查询样本在对应相似度准则下相似度最高的多个历史样本组成局部建模样本组,根据所述局部建模样本组建立对应的局部加权偏最小二乘模型;
S2,将所述查询样本分别输入到每一个所述局部加权偏最小二乘模型中,获取每一个所述局部加权偏最小二乘模型下查询样本的产品质量的预测值;
S3,基于所述预测值,获取产品质量的集成预测值;
其中,所述查询样本为与加氢裂化过程具有关联性的过程变量,所述相似度准则表示计算不同样本间相似程度的方法,所述历史样本库由加氢裂化过程中采集的一定数量的历史样本组成。
2.根据权利要求1所述的加氢裂化过程的产品质量预测方法,其特征在于,步骤S1中所述根据不同的相似度准则,从历史样本库中选择与该查询样本在对应相似度准则下相似度最高的多个历史样本组成局部建模样本组具体包括:
从历史样本库中连续抽取第一预设数量的历史样本作为训练集;
对于每一个查询样本,根据欧氏距离、欧氏距离与角度相结合和输出相关性这三种相似度准则,分别计算所述查询样本与所述训练集中每一个历史样本间的相似度指标;
对于每一个相似度准则,将对应求得的所有相似度指标从大到小排列,取排列靠前的第二预设数量的历史样本作为局部建模样本组。
3.根据权利要求2所述的加氢裂化过程的产品质量预测方法,其特征在于,所述欧氏距离的相似度指标的计算公式如下:
disi=||xq-xi||2
其中,所述par1为距离参数,s1,i表示查询样本与第i个历史样本间的第一相似度指标,disi表示查询样本与第i个历史样本间的欧氏距离,xq表示查询样本,xi表示第i个历史样本。
4.根据权利要求2所述的加氢裂化过程的产品质量预测方法,其特征在于,所述欧氏距离与角度相结合的相似度指标的计算公式如下:
disi=||xq-xi||2
Δxq=xq-xq-1
Δxi=xi-xi-1
其中,所述par2为距离参数,s2,i表示查询样本与第i个历史样本间的第二相似度指标,disi表示查询样本与第i个历史样本间的欧氏距离,xq表示查询样本,xi表示第i个历史样本,γ为权值参数。
5.根据权利要求2所述的加氢裂化过程的产品质量预测方法,其特征在于,所述输出相关性的相似度指标的计算公式如下:
dis′i=||tq-ti||2
其中,所述par3为距离参数,s3,i表示查询样本与第i个历史样本间的第三相似度指标,dis′i表示隐变量空间中查询样本与第i个历史样本间的欧氏距离,tq表示查询样本xq映射到输出相关的隐变量空间的投影,ti表示第i个历史样本xi映射到输出相关的隐变量空间的投影。
6.根据权利要求2所述的加氢裂化过程的产品质量预测方法,其特征在于,步骤S1中所述根据所述局部建模样本组建立对应的局部加权偏最小二乘模型的具体步骤包括:
对于每一种相似度准则,将所述查询样本与局部建模样本组中所有历史样本间的相似性指标作为权值列向量,根据所述局部建模样本组与所述权值列向量分别计算所述局部建模样本组的输入变量和输出变量的加权均值;
根据所述加权均值对所述查询样本与所述局部建模样本组的输入变量及输出变量进行去均值处理,根据处理后的查询样本、输入变量和输出变量建立局部加权偏最小二乘模型。
7.根据权利要求2所述的加氢裂化过程的产品质量预测方法,其特征在于,步骤S3具体包括:
根据每一种相似度准则对应的局部加权偏最小二乘模型,获取所述相似度准则的集成权值;
对每一种相似度准则对应的预测值与集成权值进行加权求和,获取产品质量的集成预测值。
8.根据权利要求7所述的加氢裂化过程的产品质量预测方法,其特征在于,所述获取所述相似度准则的集成权值的步骤具体包括:
从历史样本库中连续抽取第三预设数量的历史样本作为验证集,所述验证集中不存在与所述训练集中重合的历史样本;
对于每一种相似度准则对应的局部加权偏最小二乘模型,输入验证集中所有的历史样本,每一个历史样本对应输出一个预测值;
根据所述预测值与每一个历史样本对应的真实值,计算该相似度准则下所述预测值与对应的真实值间的均方根误差,获取该相似度准则的集成权值。
9.根据权利要求8所述的加氢裂化过程的产品质量预测方法,其特征在于,所述获取该相似度准则的集成权值的计算公式如下:
其中,所述RMSEk为第k种相似度准则下预测值与对应的真实值间的均方根误差,par表示权值调节参数,γk表示第k种相似度准则的权值,表示所有相似度准则对应的权值的和,γ′k表示第k种相似度准则的集成权值。
10.一种加氢裂化过程的产品质量预测系统,其特征在于,包括:
局部建模模块,用于采集一个或多个查询样本,对于每一个查询样本,根据不同的相似度准则,从历史样本库中选择与该查询样本在对应相似度准则下相似度最高的多个历史样本组成局部建模样本组,根据所述局部建模样本组建立对应的局部加权偏最小二乘模型;
第一预测值获取模块,用于将所述查询样本分别输入到每一个所述局部加权偏最小二乘模型中,获取每一个所述局部加权偏最小二乘模型下查询样本的产品质量的预测值;
第二预测值获取模块,用于基于所述预测值,获取产品质量的集成预测值;
其中,所述查询样本为与加氢裂化过程具有关联性的过程变量,所述相似度准则表示计算不同样本间相似程度的方法,所述历史样本库由加氢裂化过程中采集的一定数量的历史样本组成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810082741.7A CN108416463B (zh) | 2018-01-29 | 2018-01-29 | 一种加氢裂化过程的产品质量预测方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810082741.7A CN108416463B (zh) | 2018-01-29 | 2018-01-29 | 一种加氢裂化过程的产品质量预测方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108416463A true CN108416463A (zh) | 2018-08-17 |
CN108416463B CN108416463B (zh) | 2019-09-10 |
Family
ID=63126536
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810082741.7A Active CN108416463B (zh) | 2018-01-29 | 2018-01-29 | 一种加氢裂化过程的产品质量预测方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108416463B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111768000A (zh) * | 2020-06-23 | 2020-10-13 | 中南大学 | 在线自适应微调深度学习的工业过程数据建模方法 |
CN116798534A (zh) * | 2023-08-28 | 2023-09-22 | 山东鲁扬新材料科技有限公司 | 一种醋酸丙酸精馏过程数据采集处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104949936A (zh) * | 2015-07-13 | 2015-09-30 | 东北大学 | 基于优化偏最小二乘回归模型的样品成份测定方法 |
CN106529008A (zh) * | 2016-11-01 | 2017-03-22 | 天津工业大学 | 一种基于蒙特卡罗及lasso的双集成偏最小二乘建模方法 |
CN106897775A (zh) * | 2017-01-25 | 2017-06-27 | 浙江大学 | 基于贝叶斯集成学习的软测量建模方法 |
CN107290965A (zh) * | 2017-08-01 | 2017-10-24 | 浙江大学 | 基于局部加权贝叶斯网络的自适应软测量预测方法 |
-
2018
- 2018-01-29 CN CN201810082741.7A patent/CN108416463B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104949936A (zh) * | 2015-07-13 | 2015-09-30 | 东北大学 | 基于优化偏最小二乘回归模型的样品成份测定方法 |
CN106529008A (zh) * | 2016-11-01 | 2017-03-22 | 天津工业大学 | 一种基于蒙特卡罗及lasso的双集成偏最小二乘建模方法 |
CN106897775A (zh) * | 2017-01-25 | 2017-06-27 | 浙江大学 | 基于贝叶斯集成学习的软测量建模方法 |
CN107290965A (zh) * | 2017-08-01 | 2017-10-24 | 浙江大学 | 基于局部加权贝叶斯网络的自适应软测量预测方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111768000A (zh) * | 2020-06-23 | 2020-10-13 | 中南大学 | 在线自适应微调深度学习的工业过程数据建模方法 |
CN116798534A (zh) * | 2023-08-28 | 2023-09-22 | 山东鲁扬新材料科技有限公司 | 一种醋酸丙酸精馏过程数据采集处理方法 |
CN116798534B (zh) * | 2023-08-28 | 2023-11-07 | 山东鲁扬新材料科技有限公司 | 一种醋酸丙酸精馏过程数据采集处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108416463B (zh) | 2019-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107505837A (zh) | 一种半监督神经网络模型及基于该模型的软测量建模方法 | |
CN107274020B (zh) | 一种基于协同过滤思想的学习者学科总测成绩预测系统及方法 | |
CN106845796B (zh) | 一种加氢裂化流程产品质量在线预测方法 | |
CN108399248A (zh) | 一种时序数据预测方法、装置及设备 | |
CN110110466B (zh) | 一种机器学习和工艺仿真的污水处理目标参数预测方法 | |
JP6362808B1 (ja) | 情報処理装置および情報処理方法 | |
CN108803520A (zh) | 一种基于变量非线性自相关性剔除的动态过程监测方法 | |
CN108334943A (zh) | 基于主动学习神经网络模型的工业过程半监督软测量建模方法 | |
WO2018018038A1 (en) | System and method for small molecule accurate recognition technology ("smart") | |
CN111122162B (zh) | 基于欧氏距离多尺度模糊样本熵的工业系统故障检测方法 | |
Aziz et al. | A FRAMEWORK FOR STUDENTS’ ACADEMIC PERFORMANCE ANALYSIS USING NAà VE BAYES CLASSIFIER | |
CN108416463B (zh) | 一种加氢裂化过程的产品质量预测方法和系统 | |
CN109389314A (zh) | 一种基于最优近邻成分分析的质量软测量与监测方法 | |
CN105868164A (zh) | 一种基于有监督的线性动态系统模型的软测量建模方法 | |
CN110011416A (zh) | 一种变电设备在线监测装置可靠性评估方法及装置 | |
van Pelt et al. | The need for integrating neuronal morphology databases and computational environments in exploring neuronal structure and function | |
CN114548494B (zh) | 一种可视化造价数据预测智能分析系统 | |
Kaya et al. | An expert classification system of pollen of Onopordum using a rough set approach | |
CN115114968A (zh) | 基于随机森林的铸坯裂纹智能预测方法 | |
CN108345574A (zh) | 相关双数据流异常检测与修正的方法 | |
CN110619176A (zh) | 一种基于dbn-rlssvm的航煤闪点预测方法 | |
CN114935548A (zh) | 一种检测油样多类型指标的一次性操作检测方法 | |
CN113033845B (zh) | 一种电力传输资源共建共享的建设方法及装置 | |
CN109033125A (zh) | 时序数据支配集信息提取方法 | |
CN113706516A (zh) | 一种金相组织识别方法、系统、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |