基于多重动态PLSR模型的产品质量软测量方法
技术领域
本发明涉及一种工业过程软测量方法,尤其涉及一种基于多重动态PLSR模型的产品质量软测量方法。
背景技术
日趋激烈的市场竞争对企业产品的质量提出了越来越高的要求,实时监控产品质量指标或其他某些关键变量是保证生产质量稳定性的根本途径。这些直接或间接能反应产品质量的关键变量通常使用在线分析手段或者离线化验分析方法来获取。然而,在线分析仪器价格高昂、维护成本较高;而离线化验分析需要较长时间测得相应数据,造成严重的滞后,无法及时反映当前质量状况。为了能以低成本实时获取产品质量信息,软测量技术应运而生。其基本思想在于:针对无法测量或难以测量的关键过程变量,利用与之相关的其他容易测量的过程变量,估计出该关键变量的测量值以便实时监控产品的质量信息。从软测量方法的基本思想可以看出,软测量技术的实施关键在于如何选择易测量的变量,以及如何确定回归模型。
在当前已有的文献与专利资料中,建立回归模型常采用的方法有:统计回归法、神经网络、支持向量机等。在数据量充分以及非线性特性很强的条件下,利用神经网络与支持向量机所建立的回归模型精度高,通常能取得较好的软测量效果。相比之下,统计回归法所需的数据量较小,而且训练时间很短,已越来越多地被应用在软测量建模领域。在众多的统计回归方法中,偏最小二乘回归(Partial Least Square Regression,PLSR)是最基本也是最常用的算法。近年来,对PLSR的改进举措也层出不穷,衍生出了诸如核PLSR、动态PLSR等回归模型。其中,动态PLSR模型将采样数据的自相关性考虑进来,能较好地应对工业过程数据的动态特性。相比于原始的PLSR模型,动态PLSR较大地改善了回归模型的软测量精度。
然而,动态PLSR模型通常是利用系统中所有易测量的变量及其延时测量值作为输入建立模型。可以想象的是,利用所有测量变量及其延时测量值作为输入容易给回归模型引入干扰。也就是说,某些与质量指标不相关的变量有可能会降低模型拟合精度。因此,动态PLSR模型在实际应用中还存在一定的局限性。此外,考虑到现代工业过程的复杂特性,采样数据间的动态性(主要体现在不同采样时刻上的自相关性与交叉相关性)也会因不同变量而存在差异。直接为每个测量变量引入相同延时测量值不仅会引入干扰,而且各个变量的动态特性未能得到很好的区分。为此,需要设计出一个更加实用的动态PLSR回归模型以改进传统动态PLSR模型回归拟合的精度。
发明内容
本发明所要解决的主要技术问题是:为每个测量变量区分出其各自的动态特性,从而改进传统基于动态PLSR模型的产品质量软测量方法的性能。为此,本发明提供一种基于多重动态PLSR模型的产品质量软测量方法。该发明方法首先为生产过程中容易测量的变量引入多个延时测量值。其次,针对每个测量变量,计算其与其它变量及不同延时测量值之间的相关性,并根据相关性数值的大小剔除与该变量不相关的测量值。紧接着,利用剔除后的数据作为模型输入,建立其与质量指标间的PLSR模型。然后,再次利用PLSR算法以这多重PLSR模型的预测数据作为输入建立其与质量指标间的回归模型。最后,利用多重模型的回归系数向量来实施在线产品质量软测量。
本发明解决上述技术问题所采用的技术方案为:一种基于多重动态PLSR模型的产品质量软测量方法,包括以下步骤:
(1)从生产过程的历史数据库中找出容易测量变量所对应的采样数据组成矩阵X∈Rn×m,能直接或间接反映产品质量的指标所对应的数据组成向量y∈Rn×1。其中,n为训练样本数,m为过程测量变量数,R为实数集,Rn×m表示n×m维的实数矩阵。
(2)按照如下方式为每个测量变量引入d个延时测量值组成矩阵Xa∈R(n-d)×m(d+1):
上式中,xk∈R1×m为矩阵X中第k行采样时刻的样本数据,下标号k=1,2,…,n。
(3)从列向量y中选取第d+1行至第n行元素组成输出向量yo,并将向量yo与矩阵Xa中的每一列进行标准化处理,得到均值为0,标准差为1的新输出向量与新数据矩阵记录向量yo的均值μ与标准差δ。其中,将矩阵表示成如下形式:
上式中,zj∈R(n-d)×1表示矩阵中的第j列,下标号j=1,2,…,m(d+1)。然后,初始化i=1。
(4)按照下式计算第i个易测量变量与中不同列之间的相关系数Ci,j:
其中,上标号T表示矩阵或向量的转置,符号|| ||表示计算向量的长度,并将得到的m(d+1)个相关系数组成向量Ci=[Ci,1,Ci,2,…,Ci,m(d+1)]。
(5)计算向量Ci的平均值γi=(Ci,1+Ci,2+…+Ci,m(d+1))/[m(d+1)],并记录满足条件Ci,j≥γi的列标号以组成集合Si。
(6)根据记录的列标号集合Si从矩阵中选取相应的列组成输入矩阵Xi后,利用PLSR算法建立输入矩阵Xi与向量之间的回归模型,即:
上式中,bi为回归系数向量,ei为模型误差,并利用bi与Xi求得该PLSR模型的输出估计值yi=Xibi。
(7)置i=i+1后,判断是否满足条件i≤m。若是,重复步骤(4)~(7);若否,执行步骤(8).
(8)将m个PLSR模型的输出估计值组成新的输入矩阵Y=[y1,y2,…,ym]∈R(n-d)×m后,再次利用PLSR算法建立输入矩阵Y与输出向量之间的回归模型,即:
上式中,q为回归系数向量,f为模型误差,并保留所有的回归系数向量b1,b2,…,bm,q以备调用。
(9)进行在线产品质量软测量,具体的实施过程如下所示:
①采集新时刻易测量变量的样本数据xt∈R1×m,并引入其前d个采样时刻的样本得到新向量xa=[xt,xt-1,…,xt-d],并对其实施与矩阵Xa相同的标准化处理得到其中,t表示采样时刻;
②根据m个列标号集合S1,S2,…,Sm分别从行向量xa中选取相应的列,对应得到m个向量
③调用回归系数向量b1,b2,…,bm按照下式分别求得对应的模型输出估计值
其中,下标号i=1,2,…,m;
④将所得到的输出估计值组成向量并调用回归系数向量q计算那么,最终的产品质量估计值为
与现有方法相比,本发明方法的优势在于:
首先,通过对每个容易测量的过程变量实施动态性选择,不仅能区分各个测量变量间的动态性差异,而且还能剔除不同采样时刻上不相关测量值的干扰影响,这有可能使相应的PLSR模型具备更好地回归拟合能力。其次,本发明方法利用了多重PLSR模型来提高软测量的估计精度。在现有的科研资料中,理论和实践都曾证明过通过构建多重模型来建立软测量模型可以较好的提高模型预测精度。本发明方法所采用的多重PLSR模型因而能大幅度地改善传统动态PLSR模型的软测量精度。最后,本发明方法通过在各个模型估计值的基础上再次使用PLSR方法,能更进一步的优化软测量模型输出估计值。因此,本发明方法更适合于动态过程的产品质量软测量。
附图说明
图1为本发明方法的实施流程图。
图2为PLSR算法的实施流程图。
图3为在各个模型估计值基础上再此使用PLSR方法优化模型输出的示意图。
具体实施方式
下面结合附图对本发明方法进行详细的说明。
如图1所示,本发明提供了一种基于多重动态PLSR模型的产品质量软测量方法,该方法的具体实施步骤如下所示:
步骤1:从生产过程的历史数据库中找出容易测量变量所对应的采样数据组成矩阵X∈Rn×m,能直接或间接反映产品质量的指标所对应的数据组成向量y∈Rn×1。其中,n为训练样本数,m为过程测量变量数,R为实数集,Rn×m表示n×m维的实数矩阵。
步骤2:按照如下方式为每个测量变量引入d个延时测量值组成矩阵Xa∈R(n -d)×m(d+1):
上式中,xk∈R1×m为矩阵X中第k行采样时刻的样本数据,下标号k=1,2,…,n。
步骤3:从列向量y中选取第d+1行至第n行元素组成输出向量yo,并将向量yo与矩阵Xa中的每一列进行标准化处理,得到均值为0,标准差为1的新输出向量与新数据矩阵记录向量yo的均值μ与标准差δ。其中,将矩阵表示成如下形式:
上式中,zj∈R(n-d)×1表示矩阵中的第j列,下标号j=1,2,…,m(d+1)。然后,初始化i=1。
步骤4:按照下式计算第i个易测量变量与中不同列之间的相关系数Ci,j:
其中,上标号T表示矩阵或向量的转置,符号|| ||表示计算向量的长度,并将得到的m(d+1)个相关系数组成向量Ci=[Ci,1,Ci,2,…,Ci,m(d+1)]。
步骤5:计算向量Ci的平均值γi=(Ci,1+Ci,2+…+Ci,m(d+1))/[m(d+1)],并记录满足条件Ci,j≥γi的列标号组成集合Si。
步骤6:根据记录的列标号集合Si从矩阵中选取相应的列组成输入矩阵后,利用PLSR算法建立输入矩阵Xi与向量之间的回归模型,即:
其中,ki为集合Si中列标号的个数,bi为回归系数向量,ei为模型误差,并利用bi与Xi求得该PLSR模型的输出估计值yi=Xibi。
如图2所示,利用PLSR算法建立回归模型的详细实施过程如下所示:
①初始化h=1,并设置向量与向量
②依据公式wh=Xi Tu/(uTu)计算输入权值向量wh,并用公式wh=wh/||wh||单位化向量wh;
③依据公式sh=Xiwh/(wh Twh)计算得分向量sh;
④依据公式计算输出权值gh;
⑤依据公式更新向量u;
⑥重复②~⑤直至sh收敛(即向量sh中各元素不再变化);
⑦保留输入权值向量wh与输出权值gh,并依据公式ph=Xi Tsh/(sh Tsh)计算投影向量ph;
⑧依据如下两式更新输入矩阵Xi与输出向量
Xi=Xi-shph T (11)
⑨令h=h+1后,若h≤3ki/4,重复②~⑧求解下一个wh、gh、和ph;若h>3ki/4,则执行⑩;
⑩将得到的所有输入权值向量组成矩阵W=[w1,w2,…,wh]、所有输出权值向量组成行向量G=[g1,g2,…,gh]、以及所有投影向量组成矩阵P=[p1,p2,…,ph],那么PLSR模型的回归系数向量bi=W(PTW)-1GT
步骤7:置i=i+1后,判断是否满足条件i≤m。若是,重复步骤4~7;若否,执行步骤(8)。
图3展示了在各个PLSR模型估计值的基础上再次调用PLSR算法优化最终模型输出值的意义所在,具体实施过程如步骤8所示。
步骤8:将m个PLSR模型的输出估计值组成新的输入矩阵Y=[y1,y2,…,ym]∈R(n -d)×m后,再次利用PLSR算法建立输入矩阵Y与输出向量之间的回归模型,即:
上式中,q为回归系数向量,f为模型误差,并保留所有的回归系数向量b1,b2,…,bm,q以备调用。
步骤9:进行在线产品质量软测量,具体的实施过程如下所示:
①采集新时刻易测量变量的样本数据xt∈R1×m,并引入其前d个采样时刻的样本得到新向量xa=[xt,xt-1,…,xt-d],并对其实施与矩阵Xa相同的标准化处理得到其中,t表示采样时刻;
②根据m个列标号集合S1,S2,…,Sm分别从行向量xa中选取相应的列,对应得到m个向量
③调用回归系数向量b1,b2,…,bm按照下式分别求得对应的模型输出估计值
其中,下标号i=1,2,…,m;
④将所得到的输出估计值组成向量并调用回归系数向量q计算那么,最终的产品质量估计值为