CN110673470B - 基于局部加权因子模型的工业非平稳过程软测量建模方法 - Google Patents

基于局部加权因子模型的工业非平稳过程软测量建模方法 Download PDF

Info

Publication number
CN110673470B
CN110673470B CN201910828593.3A CN201910828593A CN110673470B CN 110673470 B CN110673470 B CN 110673470B CN 201910828593 A CN201910828593 A CN 201910828593A CN 110673470 B CN110673470 B CN 110673470B
Authority
CN
China
Prior art keywords
training
query
factor
representing
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910828593.3A
Other languages
English (en)
Other versions
CN110673470A (zh
Inventor
何雨辰
张丽芳
方靖云
王云
宋执环
严天宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Jiliang University
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN201910828593.3A priority Critical patent/CN110673470B/zh
Publication of CN110673470A publication Critical patent/CN110673470A/zh
Application granted granted Critical
Publication of CN110673470B publication Critical patent/CN110673470B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于局部加权因子模型的工业非平稳过程软测量建模方法。本发明引入滑动窗口,在每个滑动窗口中建立因子分析模型,将在线查询样本输入到各个滑动窗口中得到查询样本与训练样本的局部相似度以及查询样本在滑动窗口中的局部置信度,再综合所有滑动窗口的结果得到每个训练本的全局权重,根据全局权重计算训练样本集的加权平均值,在加权平均值的基础上对查询样本进行预测得到查询样本的丁烷含量预测值。本发明通过建立在线测量样本与训练样本之间的权重关系,提高了预测结果的准确性。

Description

基于局部加权因子模型的工业非平稳过程软测量建模方法
技术领域
本发明属于工业非平稳过程软测量建模和应用领域,特别涉及一种基于局部加权因子模型的工业非平稳过程软测量建模和在线检测方法。
背景技术
虽然概率模型在软测量建模领域得到了迅速的发展并取得了丰厚的成果,但是现有工作大都是基于过程是基于平稳这一假设的,在实际中,随着市场需求的变化、生产计划调整、外部扰动等原因,工业过程大都呈现非平稳特性,即一部分过程变量的统计指标如,均值、方差、协方差随着时间改变,工业非平稳过程广泛地存在于工业生产活动中,非平稳过程状态时刻改变,在非平稳过程的前部,数据特性与非平稳过程起始状态较为相似,而随着时间轴的推移,其数据特性与起始状态的相似度逐渐减弱,慢慢趋向于非平稳过程结束后的目标状态。因此,对于非平稳过程中系统状态时刻变化的情况,仅仅通过单一模型对非平稳过程加以描述显然比较困难。在非平稳过程中,数据特性较为复杂且难以测量。而软测量技术可以有效解决工业过程中遇到的重要变量的实时测量难题,它通过构造可靠的软测量模型,利用过程中容易测量的辅助变量实现对于难以测量的主导变量的在线估。传统的概率潜变量模型,如概率主成分分析,大多是静态线性方法,过程动力学和非线性尚未得到充分考虑。而非平稳过程有非线性、非动态特性、非高斯特性等特点,考虑到加权概率模型能够很好的解决工业非平稳过程出现的问题,将加权概率模型与软测量建模结合应用于工业生产领域具有重大意义,以解决工业生产过程中关键变量的预测问题。
发明内容
本发明的目的在于针对脱丁烷塔中丁烷含量实时检测的难点,提供一种基于局部加权因子分析模型的工业非平稳过程软测量方法。
一种基于局部加权因子分析模型的工业非平稳过程软测量方法,其特征包括以下步骤:
步骤1:收集脱丁烷塔的离线运行数据作为训练样本集Xtrain∈RN×n,离线运行数据包括已知的多组测量数据,每组测量数据包括同一时刻下与丁烷含量值相关的多个过程变量值,过程变量包括温度、压力和流量,将每组测量数据作为一个训练样本,由此将所有的训练样本组成训练样本集Xtrain∈RN×n,将各组测量数据对应的已知的丁烷含量值组成丁烷含量样本集Ytrian∈RN×1
训练样本集Xtrain∈RN×n通过现场采集获取,其中N为训练样本的个数,n为一组训练样本包含的过程变量总个数。
步骤2:采用固定长度的滑动窗以固定步长滑动扫描训练样本集,依次获得多个滑动窗口,在每一个滑动窗口中分别建立因子分析模型,每个滑动窗口将各自窗口内的训练子集输入到因子分析模型中进行训练,得到因子分析模型的最优参数集{Zττ},从而得到训练后的因子分析模型;
若滑动窗口的固定长度取值为W,步长为T,则一共产生
Figure BDA0002189902230000021
个滑动窗口,每个滑动窗口处于训练样本集中的不同位置,每一个滑动窗口内所包含的训练样本的个数相同,但是各个滑动窗口内的训练样本的组成不完全相同,存在单个训练样本被包含于多个滑动窗口的情况。
步骤3:实时采集脱丁烷塔在线运行过程中新的一组测量数据作为查询样本,查询样本对应的丁烷含量值未知,将查询样本xnew输入到各个滑动窗口中计算查询样本与训练子集的局部相似度以及计算查询样本在滑动窗口中的局部置信度;
步骤4:由于训练样本集中的一个训练样本可能被包含在不同滑动窗口中的训练子集内,因此一个训练样本上存在多个对应不同窗口的局部相似度和局部置信度,即单个训练样本可能具有多个局部相似度和多个局部置信度,通过将单个训练样本具有的所有局部相似度和局部置信度进行计算得到该训练样本唯一确定的全局权重。根据步骤3得出的查询样本在各个滑动窗口中的局部相似度和局部置信度,计算得到训练样本集中的每个训练样本相对于该查询样本所唯一确定的全局权重;
步骤5:建立局部加权因子分析模型,将训练样本集、丁烷含量样本集以及当前查询样本的全局权重的值输入到局部加权因子分析模型中,利用期望最大算法并根据全局权重对训练样本集和丁烷含量样本集分别进行加权得到加权训练样本集和加权丁烷含量样本集,根据加权训练样本集和加权丁烷含量样本集对局部加权因子分析模型进行训练求解得到局部加权因子分析模型的最优参数集{P,C,Σxy},从而得到训练后的局部加权因子模型,完成软测量的建模;
步骤6:将查询样本直接输入到步骤5训练后的局部加权因子模型中得到查询样本的丁烷含量值,从而得到每组实时数据对应的丁烷含量值。实际测量过程中,重复步骤3-步骤6从而得到各个查询样本各自对应的丁烷含量值。
所述步骤2中的每个滑动窗口的处理方法相同,单个滑动窗口的处理方法具体是:
2.1)将该滑动窗口内所包含的所有训练样本作为该滑动窗口的训练子集,将训练子集进行归一化处理,归一化处理是指该滑动窗口内的训练子集满足均值为0方差为1。将归一化处理后的训练子集输入到因子分析模型中确定最优参数:
所述的因子分析模型表示如下:
Xτ=Zτατ+eτ
其中,Xτ表示第τ个窗口内的训练子集,Zτ表示第τ个窗口内公共因子的因子载荷矩阵,ατ表示第τ个窗口内训练子集的公共因子,ατ∈RG×1,G为公共因子个数;eτ表示第τ个窗口内训练子集的特殊因子;
训练子集的公共因子ατ和特殊因子eτ都服从高斯分布,具体是:
p(ατ)=N(0,I),p(eτ)=N(0,Στ)
式中,p(ατ)和p(eτ)分别表示ατ服从均值为0,方差为1的高斯分布,eτ服从均值为0,方差为Στ的高斯分布,I表示公共因子ατ的协方差矩阵,Στ为特殊因子eτ的协方差矩阵;
选取因子载荷矩阵Zτ和协方差矩阵Στ作为第τ个窗口的因子分析模型的最优参数;
2.2)根据因子分析模型对训练子集进行训练,采用极大似然估计的方法建立该窗口下因子分析模型的最优参数集的似然函数,利用期望最大算法(EM算法)求解似然函数,从而得到该窗口下训练后的因子分析模型的最优参数集{Zττ}。
按上述方法求出所有滑动窗口对应的因子分析模型的最优参数集,并存入数据库中备用。
所述步骤3中的查询样本输入到每个滑动窗口中的处理方法相同,查询样本集输入到第τ个滑动窗口的处理方法具体是:
3.1)将查询样本输入到训练后的因子分析模型计算得到查询样本的窗口公共因子αnew
Figure BDA0002189902230000041
其中,αnew表示查询样本的窗口公共因子,αnew∈RG×1;xnew表示查询样本,
Figure BDA0002189902230000042
和σ分别表示归一化前的训练子集的均值和标准差,Zτ T表示因子载荷矩阵Zτ的转置矩阵;
3.2)第τ个窗口内训练子集的公共因子包括多组公共因子,每组公共因子对应一个训练样本且个数为G,每个训练样本具有的公共因子总个数均相同,总个数自行设定,采用KL散度计算查询样本与训练子集中的每一个训练样本之间的局部相似度:
Figure BDA0002189902230000043
其中,KLj表示第τ个窗口中训练子集的第j个训练样本和查询样本之间的局部相似度,j=1,2…W,W表示训练子集中的训练样本总个数,W与滑动窗口长度相同;g表示第j个训练样本的公共因子的序数,g=1,2...G,G表示第j个训练样本的公共因子的总个数,στ,g表示第τ个窗口中第g个公共因子标准差;αj,g表示第j个训练样本的公共因子中第g个公共因子的值;αnew,g表示查询样本的窗口公共因子αnew中的第g个值;
公共因子标准差στ是指第τ个窗口内训练子集的公共因子中的标准差且στ∈RG×1
训练样本集中的第i=1个训练样本、第i=1+T个训练样本、第i=1+2T个训练样本…第i=(N-W+1)个训练样本分别作为各个滑动窗口内训练子集的第一个训练样本。按照步骤3.1)-3.2)的方法计算查询样本和该滑动窗中每一个训练样本的局部相似度。
3.3)采用支持向量数据描述方法(SVDD)计算该查询样本与该滑动窗口的局部置信度,SVDD被用于计算查询样本和滑动窗之间的置信度。SVDD被应用于确定查询样本和每个移动窗口之间的局部置信度。以该种方式计算查询样本在每一个滑动窗口中的局部置信度。WSτ越接近0,相似度越高。每个滑动窗口的局部置信度计算方法相同。具体如下:
Figure BDA0002189902230000051
其中,WSτ表示查询样本在第τ个滑动窗口的局部置信度,ζi表示查询样本投射在高维空间的向量,aτ和Rτ分别表示第τ个窗口中的训练子集经SVDD求解得到的超球体的中心和半径,||ζi-aτ||2表示查询样本在高维空间内与中心aτ的距离。
步骤4中每个训练样本相对于该查询样本的全局权重计算公式相同,具体是:
Figure BDA0002189902230000052
Figure BDA0002189902230000053
其中,wi,z为训练样本集的第i个训练样本的第z个局部权重,i=1.2…N,N表示训练样本集中训练样本的总个数;KLi,z表示第i个训练样本的第z个局部相似度;WSi,z为第i个训练样本的第z个局部置信度,z=1,2...Γ,z为包含第i个训练样本的窗口序数;
Figure BDA0002189902230000054
为权重控制参数,φz为包含第i个训练样本的第z个滑动窗口中训练子集的局部相似度的标准差,Simi为训练样本集的第i个训练样本的全局权重;Γ表示包含第i个训练样本的所有滑动窗口总个数。
第i个训练样本的第z个局部置信度具体是指,在包含该训练样本的Γ个滑动窗口中,第z个滑动窗口通过步骤3.3)计算得到的查询样本与该滑动窗口的局部置信度WSτ
第i个训练样本的第z个局部相似度同理,是指在包含该训练样本的Γ个滑动窗口中,第z个滑动窗口通过步骤3.2)计算得到的查询样本和该训练样本之间的局部相似度。
本发明通过步骤2建立了多个总数量确定的滑动窗口,步骤2建立的滑动窗口的序数用字母τ表示,字母z表示的是在包含第i个训练样本的Γ个滑动窗中第z个窗口的序数。
步骤5所述的局部加权因分析模型包括过程变量加权模型和丁烷含量预测模型,分别表示为:
X=Pα+u
Y=Cα+f
其中,X表示加权训练样本集,Y表示加权丁烷含量样本集,P和C分别表示加权训练样本集X和加权丁烷含量样本集Y的加权公共因子α的因子载荷矩阵,α表示加权公共因子(X和Y的加权公共因子α相同),u和f分别表示加权训练样本集和加权丁烷含量样本集的测量噪声;
X的测量噪声的概率密度函数p(u)和Y的测量噪声的概率密度函数p(f)均服从均值为0的高斯分布,表示为:
p(u)=N(0,Σx),p(f)=N(0,Σy)
其中,Σx表示加权训练样本集的测量噪声的协方差,Σy表示加权丁烷含量样本集的测量噪声的协方差。
所述步骤6具体为:
6.1)首先根据过程变量加权模型以及训练样本集的加权平均值计算查询样本的查询公共因子
Figure BDA0002189902230000061
Figure BDA0002189902230000062
Figure BDA0002189902230000063
其中,
Figure BDA0002189902230000064
表示训练样本集的加权平均值,N表示训练样本集中训练样本的总个数;xi表示第i个训练样本;
6.2)再根据丁烷含量预测模型以及丁烷含量样本集的加权平均值计算得到丁烷含量值
Figure BDA0002189902230000065
Figure BDA0002189902230000066
Figure BDA0002189902230000067
式中,
Figure BDA0002189902230000068
表示丁烷含量样本集的加权平均值,实际在线预测中,默认丁烷含量预测模型的测量噪声f为零,yi表示第i个丁烷含量值。
本发明引入滑动窗口,在每个滑动窗口中建立因子分析模型,将在线查询样本输入到各个滑动窗口中得到查询样本与训练子集的局部相似度以及查询样本在滑动窗口中的局部置信度,再综合所有滑动窗口的结果得到每个训练样本的全局权重,根据全局权重计算训练样本集的加权平均值对查询样本进行预测得到查询样本的丁烷含量预测值。本发明通过建立查询样本与训练样本之间的权重关系,提高了预测结果的准确性。
本发明与现有技术相比具有的有益效果有:
一般情况下,通过离线实验室分析丁烷含量值往往需要花费数小时时间,这就会导致脱丁烷塔的控制滞后,本发明通过对脱丁烷塔中的过程变量和丁烷含量之间的关系建立局部加权概率模型,能够很好的解决非平稳过程中的高斯特性,在局部加权概率模型框架下,通过该过程中容易测量的变量对难以测量的丁烷含量值进行在线软测量,预测时间花费较短,预测结果较为准确,实现了脱丁烷塔中硫丁烷含量的在线估计。
附图说明
图1为本发明涉及的因子分析的流程图;
图2为本发明方法流程图;
图3为本发明涉及的脱丁烷塔流程图;
图4为基于是基于局部加权概率模型的工业非平稳过程软测量结果。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
本发明针对脱丁烷塔中的丁烷含量检测问题,通过过程中容易测量的变量,利用局部加权因子分析模型,对该过程中丁烷含量进行在线软测量。
本发明实施例及其实施过程如下:
第一步:通过集散控制系统和实时数据库系统收集脱丁烷塔中各个过程变量的数据:训练样本集Xtrian∈RN×n,将这些数据存入历史数据库,并选取部分数据作为建模用样本。
第二步:通过现场抽取和离线实验室分析获取历史数据库中用于建模的样本所对应的丁烷含量值作为软测量模型的输出Ytrian∈RN×1,将这些数据存入历史数据库。
该步骤是为了获取软测量建模中的输出变量,即脱丁烷塔中的丁烷含量。一般情况下,通过离线实验室分析丁烷含量值往往需要花费数小时,这就会导致脱丁烷塔的控制滞后。
第三步:引入覆盖在训练样本集上的滑动窗,滑动窗口,在窗口中建立因子分析模型,得出所有窗口中模型的参数,并存入历史数据库。
为了得到因子分析中最优参数集{Zττ},需要对似然函数做极大化处理。并通过支持向量数据描述计算出每个窗口中训练子集的中心和半径。一并存入数据库中备用。
第四步:收集新的在线测量数据作为查询样本,并按每个滑动窗中训练子集均值和标准差分别归一化。
第五步:计算归一化后的查询样本在每个窗口中的潜在因子,并计算其与窗口中训练子集之间的局部相似度。以该种方式计算查询样本与所有滑动窗中每一个训练样本之间的局部相似度。
第六步:计算归一化后的查询样本与每一个窗口中训练子集之间的局部置信度。引入支持向量数据描述方法(SVDD),SVDD被用于计算查询样本和滑动窗之间的窗口置信度。以该种方式计算查询样本在每一个滑动窗中的局部置信度。
第七步:结所有窗口中局部置信度与局部相似度得到该查询样本在训练样本集当中的全局权重。
第八步:建立局部加权因子模型,将加权后的训练样本集和查询样本作为局部加权因子模型的输入优化求解模型参数。具体是:将Xtrian和全局权重作为模型的输入,Ytrian作为模型的输出建立加权因子分析模型:
X=Pα+u
Y=Cα+f
其中P∈Rn×G,C∈R1×G为载荷矩阵,α∈RG×1为公共因子,p(α)~N(0,I)服从均值为0,协方差为1高斯分布。n为训练样本集的过程变量个数,G为公共因子个数。u∈Rn×1,f∈R1 ×1为过程变量和丁烷含量对应的噪声,服从均值为0的高斯分布,即p(u)=N(0,Σx),p(f)=N(0,Σy),其中,∑x和∑y为噪声对应的协方差。为了得到局部加权因子分析模型最优参数集Θ={P,C,Σxy},需要对以下似然函数做极大化处理,即
Figure BDA0002189902230000081
基于上述优化函数,为了得到最优的模型参数值,采用期望最大算法,该算法分为两个步骤,分别为E步和M步,具体如下:
在该算法的E步中,对潜在因子变量的后验分布密度函数进行估计,即
Figure BDA0002189902230000091
因为上式右边都为高斯分布,所以后验概率也为高斯分布的形式。从而得到一介和二介的统计量估计值如下:
E(αi|xi,yi,Θ)=(I+PTxi)-1P+CT(∑yi)-1C)-1.(PTxi)-1xi+CT(∑yi)-1yi)
E(αiαi T|xi,yi,Θ)=(I+PTxi)-1P+CT(∑yi)-1C)-1.E(αi|xi,yi,Θ)ETi|xi,yi,Θ)
Figure BDA0002189902230000092
在算法的M步中,基于模型的不同参数,分别对优化函数求偏导数,令偏导数为零,可求得最优参数值。即
Figure BDA0002189902230000093
Figure BDA0002189902230000094
Figure BDA0002189902230000095
Figure BDA0002189902230000096
通过E步和M步的反复迭代,当模型的似然函数不再变化后,即可得到最优的模型参数。
第九步:将查询样本直接输入到训练后的局部加权因子分析模型中,计算查询样本的关键指标—丁烷含量值。
计算如下:
Figure BDA0002189902230000097
在此基础上,计算关键变量值如下:
Figure BDA0002189902230000101
以下结合一个具体的脱丁烷塔例子来说明本发明的有效性。针对该过程,一共采集了2394个数据,其中780个数据用来建模,并对其对应的丁烷含量值进行离线分析和标记。另外采集的100个数据样本用来验证软测量模型的有效性。在该过程中,一共选取了7个过程变量对该过程的丁烷含量进行软测量建模,这7个过程变量分别为塔顶温度、塔顶压力、回流流量、下一级流量、灵敏板温度、塔底温度和塔底压力。
接下来结合该具体过程对本发明的实施步骤进行详细地阐述:
1.局部加权因子分析的软测量建模将选取的7个过程变量组成的数据矩阵作为软测量模型的输入,丁烷含量数据矩阵作为软测量模型的输出,按照实施步骤中给出的详细方法,建立基于局部加权因子分析的软测量模型。
2.获取过程中实时测量数据信息,为了测试新方法的有效性,我们对100个验证样本进行测试,并利用建模时存储的参数对其进行处理。
3.丁烷含量的在线软测量对100个查询样本进行在线软测量建模,获得相应的在线估计值。图4给出了本发明方法针对100个验证样本的在线软测量结果和拟合优度。曲线颜色相对较浅的曲线表示软测量模型的在线估计值,相对较深的曲线表示各个查询样本的离线分析值。
如图4所示,采用本发明的方法使得在线估计值与离线分析值之间的拟合系数达到0.947,相比于传统离线测量丁烷含量的方法,本发明的通过该过程中容易测量的变量对难以测量的丁烷含量值进行在线软测量建模,而且测量结果的拟合程度高,结果准确,实现了脱丁烷塔中丁烷含量的在线估计。本发明引入了局部加权概率软测量建模方法,能够很好的解决工业非平稳过程复杂的数据特性,通过工业非平稳过程中的过程变量对关键变量进行在线估计,从而使得软测量的结果更为可靠和可信。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (3)

1.基于局部加权因子模型的工业非平稳过程软测量建模方法,其特征在于,包括以下步骤:
步骤1:收集脱丁烷塔的离线运行数据作为训练样本集,离线运行数据包括已知的多组测量数据,每组测量数据包括同一时刻下与丁烷含量值相关的多个过程变量值,过程变量值包括温度、压力和流量值,将每组测量数据作为一个训练样本,由此将所有的训练样本组成训练样本集,将各组测量数据对应的已知的丁烷含量值组成丁烷含量样本集;
步骤2:采用固定长度的滑动窗以固定步长滑动扫描训练样本集,依次获得多个滑动窗口,将每个滑动窗口各自包含的所有训练样本作为各自的训练子集,在每一个滑动窗口中分别建立因子分析模型,每个滑动窗口将训练子集输入到因子分析模型中进行训练,得到因子分析模型的最优参数集,从而得到训练后的因子分析模型;
步骤3:实时采集脱丁烷塔在线运行过程中新的一组测量数据作为查询样本,将查询样本输入到各个滑动窗口中计算查询样本与训练子集中每个训练样本的局部相似度以及计算查询样本在滑动窗口中的局部置信度;
步骤4:根据步骤3计算得到查询样本在各个滑动窗口中的局部相似度和局部置信度,得到训练样本集中的每个训练样本相对于该查询样本所唯一确定的全局权重;
步骤5:建立局部加权因子模型,将训练样本集、丁烷含量样本集以及全局权重的值输入到局部加权因子模型中,利用期望最大算法并根据全局权重对训练样本集和丁烷含量样本集分别进行加权得到加权训练样本集和加权丁烷含量样本集,根据加权训练样本集和加权丁烷含量样本集对局部加权因子模型进行训练得到最优参数集,从而得到训练后的局部加权因子模型,完成软测量的建模;
步骤6:将查询样本直接输入到步骤5得到的局部加权因子模型中得到查询样本的丁烷含量值,从而实时测量得到丁烷含量值;
所述步骤3中的查询样本输入到每个滑动窗口中的处理方法相同,查询样本集输入到第τ个滑动窗口的处理方法具体是:
3.1)将查询样本输入到训练后的因子分析模型计算得到查询样本的窗口公共因子αnew
Figure FDA0003500648290000021
其中,αnew表示查询样本的窗口公共因子,窗口公共因子服从高斯分布αnew~N(0,I),xnew表示查询样本,
Figure FDA0003500648290000022
和σ分别表示归一化前训练子集的均值和标准差,Zτ T表示因子载荷矩阵Zτ的转置矩阵,∑τ为特殊因子eτ的协方差矩阵;
3.2)采用KL散度计算查询样本与训练子集中的每一个训练样本之间的局部相似度:
Figure FDA0003500648290000023
其中,KLj表示第τ个窗口中训练子集的第j个训练样本和查询样本之间的局部相似度,g表示第j个训练样本的公共因子的序数,g=1,2...G,G表示第j个训练样本的公共因子的总个数,στ,g表示第τ个窗口中第g个公共因子标准差;αj,g表示第j个训练样本对应的公共因子中第g个公共因子的值;αnew,g表示查询样本的窗口公共因子αnew中的第g个值;
3.3)采用支持向量数据描述方法(SVDD)计算该查询样本与该滑动窗口的局部置信度,具体如下:
Figure FDA0003500648290000024
其中,WSτ表示查询样本在第τ个滑动窗口的局部置信度,ζi表示查询样本投射到高维特征空间的向量,aτ和Rs,τ分别表示第τ个窗口中的训练子集经SVDD求解得到的超球体的中心和半径,||ζi-aτ||2表示查询样本在高维空间内与中心aτ的距离;
所述步骤4中每个训练样本相对于该查询样本的全局权重计算公式相同,具体是:
Figure FDA0003500648290000025
Figure FDA0003500648290000026
其中,wi,z为训练样本集的第i个训练样本的第z个局部权重,i=1.2…N,N表示训练样本集中训练样本的总个数;KLi,z表示第i个训练样本的第z个局部相似度;WSi,z为第i个训练样本的第z个局部置信度,z=1,2...G,z为包含第i个训练样本的窗口序数;
Figure FDA0003500648290000031
为权重控制参数,φz为包含第i个训练样本的第z个滑动窗口中训练子集的局部相似度的标准差,Simi为训练样本集的第i个训练样本的全局权重;G表示包含第i个训练样本的所有滑动窗口总个数;
所述步骤6具体为:
6.1)首先根据过程变量加权模型以及训练样本集的加权平均值计算查询样本的查询公共因子
Figure FDA0003500648290000032
Figure FDA0003500648290000033
Figure FDA0003500648290000034
其中,
Figure FDA0003500648290000035
表示训练样本集的加权平均值,N表示训练样本集中训练样本的总个数,i表示训练样本的序数,xi表示第i个训练样本;
6.2)再根据丁烷含量预测模型以及丁烷含量样本集的加权平均值计算得到丁烷含量值
Figure FDA0003500648290000036
Figure FDA0003500648290000037
Figure FDA0003500648290000038
式中,
Figure FDA0003500648290000039
表示丁烷含量样本集的加权平均值,yi表示第i个丁烷含量值,P表示加权训练样本集X的加权公共因子的因子载荷矩阵,C表示加权丁烷含量样本集Y的的加权公共因子的因子载荷矩阵。
2.根据权利要求1所述的基于局部加权因子模型的工业非平稳过程软测量建模方法,其特征在于:所述步骤2中的每个滑动窗口的处理方法相同,第τ个滑动窗口的处理方法具体是:
2.1)将该滑动窗口内的训练子集进行归一化处理,根据归一化处理后的训练子集建立因子分析模型:
所述的因子分析模型表示如下:
Xτ=Zτατ+eτ
其中,Xτ表示第τ个窗口内归一化后的训练子集,ατ表示第τ个窗口内训练子集的公共因子,Zτ表示第τ个窗口内公共因子的因子载荷矩阵,eτ表示第τ个窗口内训练子集的特殊因子;
训练子集的公共因子ατ和特殊因子eτ的概率密度函数都为高斯分布,具体是:
p(ατ)~N(0,I),p(eτ)~N(0,∑τ)
式中,p(ατ)表示ατ服从均值为0,方差为I的高斯分布,p(eτ)表示eτ服从均值为0,协方差为∑τ的高斯分布,I为单位矩阵,表示公共因子ατ的协方差矩阵;
2.2)根据因子分析模型对训练子集进行训练,采用极大似然估计的方法建立该窗口下因子分析模型的最优参数的似然函数,利用期望最大算法(EM算法)求解似然函数得到最优参数,从而得到该窗口下训练后因子分析模型的最优参数集{Zτ,∑τ}。
3.根据权利要求1所述的基于局部加权因子模型的工业非平稳过程软测量建模方法,其特征在于:步骤5所述的局部加权因子模型包括过程变量加权模型和丁烷含量预测模型,分别表示为:
X=Pα+u
Y=Cα+f
其中,X表示加权训练样本集,Y表示加权丁烷含量样本集,α表示加权公共因子,u和f分别表示加权训练样本集和加权丁烷含量样本集的测量噪声;
X的测量噪声的概率密度函数p(u)和Y的测量噪声的概率密度函数p(f)均服从均值为0的高斯分布,表示为:
p(u)=N(0,∑x),p(f)=N(0,∑y)
其中,∑x表示加权训练样本集的测量噪声的协方差,∑y表示加权丁烷含量样本集的测量噪声的协方差;
步骤5所述的最优参数集为{P,C,∑xy}。
CN201910828593.3A 2019-09-03 2019-09-03 基于局部加权因子模型的工业非平稳过程软测量建模方法 Active CN110673470B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910828593.3A CN110673470B (zh) 2019-09-03 2019-09-03 基于局部加权因子模型的工业非平稳过程软测量建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910828593.3A CN110673470B (zh) 2019-09-03 2019-09-03 基于局部加权因子模型的工业非平稳过程软测量建模方法

Publications (2)

Publication Number Publication Date
CN110673470A CN110673470A (zh) 2020-01-10
CN110673470B true CN110673470B (zh) 2022-04-08

Family

ID=69076248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910828593.3A Active CN110673470B (zh) 2019-09-03 2019-09-03 基于局部加权因子模型的工业非平稳过程软测量建模方法

Country Status (1)

Country Link
CN (1) CN110673470B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111650894A (zh) * 2020-04-02 2020-09-11 中国计量大学 一种基于隐变量的贝叶斯网络复杂工业过程软测量方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927412A (zh) * 2014-04-01 2014-07-16 浙江大学 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN107290965A (zh) * 2017-08-01 2017-10-24 浙江大学 基于局部加权贝叶斯网络的自适应软测量预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927412A (zh) * 2014-04-01 2014-07-16 浙江大学 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN107290965A (zh) * 2017-08-01 2017-10-24 浙江大学 基于局部加权贝叶斯网络的自适应软测量预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Novel Soft Sensing Method for Transient Processes Regression Utilizing Locally Weighted PLS;Yuchen He等;《2018 IEEE 7th Data Driven Control and Learning Systems Conference》;20180527;全文 *
Dynamic Mutual Information Similarity Based Transient Process Identification and Fault Detection;Yuchen He等;《The Canadian Journal of Chemical Engineering》;20180731;全文 *
Soft Sensing of a Nonlinear Multimode Process Using a Self Organizing Model and Conditional Probability Density Analysis;Lulu Wang等;《Industrial & Engineering Chemistry Research》;20190709;全文 *
基于时间差分和局部加权偏最小二乘算法的过程自适应软测量建模;袁小锋等;《化工学报》;20160331;第67卷(第3期);全文 *

Also Published As

Publication number Publication date
CN110673470A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
TWI521360B (zh) 量測抽樣方法與其電腦程式產品
CN108241901B (zh) 一种基于预测数据的变压器预警评估方法及装置
CN108538050B (zh) 一种短时交通流量预测方法及装置
CN109360604B (zh) 一种卵巢癌分子分型预测系统
CN111079836A (zh) 基于伪标签方法和弱监督学习的过程数据故障分类方法
White et al. Methodological tools
CN110837921A (zh) 基于梯度提升决策树混合模型的房地产价格预测研究方法
CN110794093A (zh) 一种蒸发过程出料苛性碱浓度测量装置精度补偿方法
CN105334185A (zh) 基于光谱投影判别的近红外模型维护方法
US20230140696A1 (en) Method and system for optimizing parameter intervals of manufacturing processes based on prediction intervals
CN112668822A (zh) 科技成果转化平台共享系统、方法、存储介质、手机app
CN115601182A (zh) 一种基于改进型XGBoost类方法的数据分析方法、定价方法以及相关设备
CN113012766A (zh) 一种基于在线选择性集成的自适应软测量建模方法
CN115115416A (zh) 一种商品销量预测方法
CN113393057A (zh) 一种基于深度融合机器学习模型的小麦产量集成预测方法
CN110673470B (zh) 基于局部加权因子模型的工业非平稳过程软测量建模方法
CN111931307A (zh) 一种零件质量预测和评估优化方法及系统
CN112241832B (zh) 一种产品质量分级评价标准设计方法及系统
CN106599391B (zh) 基于三角形角度值动态加权的关联向量机软测量建模方法
CN111103420B (zh) 一种原料不确定下的酚醛树脂产品质量预测方法
Loddo et al. Selection of multivariate stochastic volatility models via Bayesian stochastic search
CN111160464B (zh) 基于多隐层加权动态模型的工业高阶动态过程软测量方法
CN115985411A (zh) 基于高斯过程回归模型的高分子熔融指数软测量方法
CN114580151A (zh) 一种基于灰色线性回归-马尔科夫链模型的需水预测方法
CN108415372B (zh) 精密机床热误差补偿方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant