CN107357269A - 基于混合mpls的多阶段过程质量预报方法 - Google Patents
基于混合mpls的多阶段过程质量预报方法 Download PDFInfo
- Publication number
- CN107357269A CN107357269A CN201710506099.6A CN201710506099A CN107357269A CN 107357269 A CN107357269 A CN 107357269A CN 201710506099 A CN201710506099 A CN 201710506099A CN 107357269 A CN107357269 A CN 107357269A
- Authority
- CN
- China
- Prior art keywords
- stage
- data
- sub
- mpls
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 147
- 230000008569 process Effects 0.000 title claims abstract description 72
- 238000002156 mixing Methods 0.000 title abstract description 3
- 238000009826 distribution Methods 0.000 claims abstract description 43
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 230000001360 synchronised effect Effects 0.000 claims abstract description 6
- 238000012544 monitoring process Methods 0.000 claims description 35
- 238000000926 separation method Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 17
- 238000005259 measurement Methods 0.000 claims description 17
- 239000000203 mixture Substances 0.000 claims description 11
- 238000013442 quality metrics Methods 0.000 claims description 6
- 230000008901 benefit Effects 0.000 claims description 5
- 238000013277 forecasting method Methods 0.000 claims description 5
- 230000035484 reaction time Effects 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 238000011160 research Methods 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 abstract description 9
- 238000006243 chemical reaction Methods 0.000 abstract description 6
- 238000007596 consolidation process Methods 0.000 abstract 1
- 229930182555 Penicillin Natural products 0.000 description 24
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 24
- 229940049954 penicillin Drugs 0.000 description 24
- 238000004519 manufacturing process Methods 0.000 description 20
- 238000012549 training Methods 0.000 description 13
- 238000012360 testing method Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 8
- 230000001580 bacterial effect Effects 0.000 description 7
- 238000000855 fermentation Methods 0.000 description 7
- 230000004151 fermentation Effects 0.000 description 7
- 239000006185 dispersion Substances 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000007500 overflow downdraw method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- TYAQXZHDAGZOEO-KXQOOQHDSA-N 1-myristoyl-2-stearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)O[C@@H](COP([O-])(=O)OCC[N+](C)(C)C)COC(=O)CCCCCCCCCCCCC TYAQXZHDAGZOEO-KXQOOQHDSA-N 0.000 description 1
- 206010024769 Local reaction Diseases 0.000 description 1
- 238000003070 Statistical process control Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 208000014446 corneal intraepithelial dyskeratosis-palmoplantar hyperkeratosis-laryngeal dyskeratosis syndrome Diseases 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 230000001808 coupling effect Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000003541 multi-stage reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
- G05B19/41885—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by modeling, simulation of the manufacturing system
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Manufacturing & Machinery (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于混合MPLS的多阶段过程质量预报方法。首先,利用GMM模型对每批次采集数据进行阶段识别。针对多批次同一子阶段长度不等问题,应用动态时间归整(Dynamic time warping,DTW)算法依据相似度最小和最长反应持续时间同步为等长轨迹。并在同步后的数据集中按变量展开方式建立单MPLS模型。其次,根据Fisher判据分析(Fisher DiscriminantAnalysis,FDA)方法寻找各数据集之间最佳的投影向量,最小化子阶段数据样本间的相关性,并引入核密度方法估计各子阶段数据在最佳投影向量上的概率密度分布,来在线监测阶段切换。最后,利用贝叶斯原则融合各子阶段MPLS模型进行质量预报。
Description
技术领域
本发明属于自动化控制技术领域,具有涉及一种基于混合MPLS的多阶段 过程质量预报方法。
背景技术
在工业过程中,由于工艺和检测技术的限制,产品的质量指标难以在线直接测量,需要离线分析得到, 导致产品质量信息具有一定的时间滞后性,使得产品质量很难得到在线反馈和控制。但是工业过程中许多 易于测量的过程变量蕴含着最终的质量信息,可以通过分析过程变量和产品质量测量值之间的关系,进而 对产品生产过程建模,实现对产品质量的在线预测。
传统的基于解析模型的生产过程质量预测需要准确的数学和生产经验,从而限制了其实际应用。多向 主元分析(Multi-way Principle Component Analysis,MPCA)和多向偏最小二乘(Multi-way partial Least Squares,MPLS)是经常采用的统计过程控制方法(Multiple Statistical Process Control,MSPC)。MPLS是采 用多元统计分析方法,将过程数据和质量数据从高维数据空间投影到低维特征子空间,所得到的特征变量 保留了原始数据的特征信息,是一种高维数据处理的有效工具。但是传统的MPLS使用整个处理过程数据 作为输入,提取和质量变量最相关的特征过程变量,所建立的预报模型需要全局的处理数据之间高度的相 关性,忽略了局部的反应过程对最终质量的影响。事实上,工业生产过程存在多阶段、局部性等固有特征。 因此更多潜在的局部信息可以通过将数据分为更有意义的数据块进行分析,多阶段方法广泛地应用在在线 和离线的质量预报。Duchesne等提出轨迹Multi-block PLS方法,利用中间过程质量信息提取多阶段和质 量变量相关的特征,但是工业过程中中间质量信息很少,限制了该方法的应用。于涛等应用MPCA方法对 按批次展开的时间块进行PCA计算,通过第一主元的变化和阶段内负载矩阵的变化作为依据进行阶段划 分,再在相关阶段建立PLS模型,取得一定质量预报效果。但是对测量变量的PCA分析未能有效地解释 质量相关的变化,而且各阶段模型相互独立,未能反应局部过程对最终质量的影响。
发明内容
为了克服现有技术的不足,提出了一种基于混合MPLS的多阶段过程质量预报方法。首先, 利用GMM模型对每批次采集数据进行阶段识别。针对多批次同一子阶段长度不等问题,应 用动态时间归整(Dynamic time warping,DTW)算法依据相似度最小和最长反应持续时间同 步为等长轨迹。并在同步后的数据集中按变量展开方式建立单MPLS模型。其次,根据Fisher 判据分析(Fisher Discriminant Analysis,FDA)方法寻找各数据集之间最佳的投影向量,最小化 子阶段数据样本间的相关性,并引入核密度方法估计各子阶段数据在最佳投影向量上的概率 密度分布,来在线监测阶段切换。最后,利用贝叶斯原则融合各子阶段MPLS模型进行质量 预报。
发明的技术方案为:一种基于混合MPLS的多阶段过程质量预报方法,本方法基于在偏 最小二乘,记作PLS,PLS是多元统计分析中一个重要的方法,研究多维矩阵X和Y之间的 关系,寻找最优的低维特征解释方向,多向偏最小二乘方法,记作MPLS,是PLS的一种推广形式,其通过将多批次的历史过程数据矩阵X(I×J×K)和质量数据矩阵Y(I×M×K)以变量方 式展开为二维矩阵X(IK×J)和Y(IK×M),并提取低维的潜在特征;
MPLS形式如下:
X(IK×J)=TPT+E
Y(IK×M)=QUT+F
式中,T(IK×A),P(J×A)为矩阵X的得分和负载矩阵,同一子阶段内数据分布相似,不同阶段间的分布差 异很大,为了保证子阶段内相似数据分布的预报性能,分别建立各子阶段MPLS模型,并结合Fisher判据 分析和核密度估计方法优点提出一种FDA_Kernel状态监测方法,显著子阶段内以及阶段间的状态切换, 实现多阶段状态监测,根据贝叶斯原则在FDA_Kernel状态监测中融合质量变量信息得到混合MPLS模型,
具体步骤为:
第一步,进行离线建模
1)对I批历史过程数据xi(K×J)和质量数据yi(K×M)进行标准化。并根据GMM模型对过程和质量数据组 成的高维分布进行阶段识别,得到每批次p个子阶段数据子集,其中i为对应历史过程批次,J为测量变 量个数,M为质量变量个数,K为批次反应时间;
2)根据相似度最小和同一子阶段最大持续时间原则,应用动态时间规整技术(DTW)同步多批次同一子阶 段为等长轨迹;
3)同步后的子阶段数据按变量展开方式得到子阶段过程数据Xi(Ki×J)和质量数据Yi(Ki×M),其中, Ki,n为第n批历史批次第i个阶段的数据样本数,i=1,2,..,p,并在各子阶段中建立MPLS模 型;
第二步,在线质量预报
1)当新的测量数据xnew∈R1×J到来时,对新数据标准化,计算xnew∈R1×J在最佳分离向量的投影值x∈R, 计算x属于各子阶段的先验概率,
2)计算xnew∈R1×J在各子阶段MPLS模型的质量预报输出,方法为:
假定经阶段划分得到的n个子阶段过程变量数据集质量变量数据集其中,J,M 为过程数据和质量变量维数,Ki为第i个子阶段数据集样本数,i=1,2,..,n,
具体包含以下步骤:
1)利用FDA方法得到最佳投影变换后的n个数据集和最佳分离向量w,并利用核密度方法估计数据集 中数据样本概率密度分布模型fi(x),i=1,2,..,n,
2)在第i个阶段中利用过程变量集和质量变量数据集建立子阶段MPLSi模型,
3)利用质量变量数据集修正第i个阶段的概率密度分布模型fi(x),得到后验概率模型pi(x|y),
4)对新的采集数据xnew∈R1×J,利用计算xnew在最佳分离向量w的投影值根据贝叶斯原则对在线 过程变量数据xnew按照下式进行质量预报,
yi=xnewRi
其中,为混合的质量预报值,yi为第i个阶段的MPLSi模型的质量预报值,Ri为对应子阶段MPLS模型 的回归系数,i=1,2,..,p。
本发明有益效果
本发明引入统计分布较好的高斯混合模型,识别和聚类出工业过程多子阶段数据集,分别在各子阶 段数据集中建立MPLS模型,根据贝叶斯原则融合各子阶段模型进行质量预报,该方法能够有效地实现过 程监测,实现较精确的质量预测。
说明书附图
图1部分训练批次数据集各阶段划分示意图;
图2(a)、(b)、(c)示出阶段1、2、3训练数据在最佳分离向量上概率密度分布图
图3MPLS方法对测试批次5菌体浓度预报值和实际浓度值。
图4MPLS方法对测试批次5青霉素浓度预报值和实际浓度值
图5混合MPLS方法对测试批次5菌体浓度预报值和实际浓度值
图6混合MPLS方法对测试批次5青霉素浓度预报值和实际浓度值
具体实施方式
在本发明中,引入统计分布较好的高斯混合模型,识别和聚类出工业过程多子阶段数据 集,分别在各子阶段数据集中建立MPLS模型,根据贝叶斯原则融合各子阶段模型进行质量 预报,该方法在多向偏最小二乘基础上实现较精确的质量预测。偏最小二乘(PLS)是多元统计 分析中一个重要的方法,PLS侧重多维矩阵X和Y之间的关系,寻找最优的低维特征解释方向,这种最 优是建立在从输入空间到输出空间的预测能力意义上的。多向偏最小二乘方法(MPLS)是PLS的一种推广, 其通过将多批次的历史过程数据矩阵X(I×J×K)和质量数据矩阵Y(I×M×K)以变量方式展开为二维矩阵 X(IK×J)和Y(IK×M),并提取低维的潜在特征。MPLS形式如下:
X(IK×J)=TpT+E
Y(IK×M)=QUT+F (1)
式中,T(IK×A),P(J×A)为矩阵X的得分和负载矩阵。U(IK×A)和Q(M×A)为矩阵Y得分和负载矩阵,A 为保留的潜变量个数,E,F分别为X,Y残差。对于多阶段间歇过程而言,正常生产数据的均值和方差都 会发生较大改变,实际数据分布较难由先验可知。高斯混合模型(GMM)假设数据可以从多个高斯分布 中生成。通过增加单高斯模型的个数,可以任意地逼近任何连续的概率密分布。高斯混合模型(GMM) 形式如下式:
其中,x为输入样本,p(x|qi)是样本x属于第i个高斯成分的概率,qi是第i个高斯模型,αi是第i 个高斯成分在整个GMM中的先验概率,n是组成GMM模型的高斯成分个数。在GMM模型中第i个高 斯分量的多元分布函数表达式为:
则x属于第i个高斯分量的后验概率为:
每个高斯分量都有参数αi、ui和σi,建立GMM模型本质是通过样本数据学习对应参数值。参数求 解方法使用EM算法,其在给定样本数据和初始值的前提下,不断通过E步提高核函数下界和M步使似 然函数最大化收敛。高斯混合模型中包含的单高斯模型数可以通过F-J算法自适应确定。该算法在EM算 法的基础上,首先随意设定一个很大的高斯分量数目,通过定义最短信息长度规则,逐步迭代去掉权重为 零的项,自适应地调节高斯分量的数目,以此确定最优模型数目。
对于间歇工业过程,建立的GMM模型中,模型所含的高斯分量个数就是间歇过程的阶段数。样本x 所属的阶段定义为x(1×J)∈max(p(θi|x)),其中,i=1,2,..,n。即样本x使得后验概率p(θi|x)最大的那个高 斯分量所属的类就是产生样本x所处的阶段。因此,历史过程数据X(IK×J)和Y(IK×M)可以划分为n个操 作阶段。其中,Pi为划分出的阶段,i=1,2,..,n。
混合MPLS模型融合方法
历史的过程数据经过阶段识别后得到n个稳定划分的操作阶段,各阶段内数据具有稳定的分布特点, 阶段之间的过渡时期因为复杂、快速的阶段特征变化对在线阶段识别和监测模型切换有较大的影响,这种 特性容易导致监测过程的波动和不稳定,监测结果缺少可信度。同时,各子阶段的数据集之间存在相关性 的耦合以及分布空间的重叠等,进一步增加了过程监测的难度。另外,工业过程在线进行当中缺少阶段持 续和阶段切换的显示性指标,降低了对过程所处状态的对工业生产的指导意义。如何有效的利用现有的数 据,对多阶段特性进行建模是多阶段过程监测的关键。因此,提出一种基于数据集相关性分离和阶段状态 指示的多阶段特性的FDA_Kernel状态监测方法。最后,根据贝叶斯原则在FDA_Kernel状态监测中融合 质量变量信息得到混合MPLS模型,增强对相邻过渡阶段的建模能力。
基于FDA_Kernel的多阶段状态监测,为了克服各阶段数据集间的耦合影响,首先,对n个多阶段数据集 进行相关性分离,FDA方法是一种能降低特征空间维数的模式方法,其通过计算最佳的分离向量最大程度 的降低数据集间分布相关性。应用FDA方法处理多阶段数据集,能较好的保证同一子阶段内数据分析相 似的特点,又极大的分离阶段间的差异程度,提高了工业过程的在线监测阶段状态切换的能力。
利用FDA方法解决数据集间分离问题就是寻找最佳的投影向量以满足数据集间离散度最大和数据集 内离散度最小化。即通过优化求解目标函数(Fisher准则函数)得到最佳分离向量。其目标函数为:
w即为所求的最佳分离向量。因此,对n个数据集Xi进行最佳分离向量投影,即得到n个分离 后的数据集较Xi有更大的集间离散度和更小的集内离散度,其中i=1,2,..,n。
但是FDA方法只提供了数据集的去相关性的表示,对阶段监测缺少阶段意义上的指示性,结合核密 度估计方法对各阶段数据分布进行建模,完善了各阶段状态去相关后的解释性,对阶段监测提供了数值上 的指示,这种指示提供了过程处于稳定阶段和过渡状态时阶段内即阶段间成分的比重。核密度估计的形式 如下式。
其中,核函数k是一个权函数,核密度估计的准确与否依赖于核函数和带宽k的选取。核函数为关于原点 对称且其积分为1的函数,高斯核形式如下:
其中,xi为核函数中心,h为函数的宽度参数。
因此,基于FDA_Kernel方法进行状态监测形式如下:
其中,w为保证多阶段数据集最大的集间离散度和最小的集内离散度的最佳分离向量,fi(x)为各子阶段的 分布模型,i=1,2,..,n。
n个阶段的数据分布模型fi(x),这些分布模型包含了阶段内的数据特征分布特点,随着工业过程中阶 段状态的迁移,在数值上变现出不同的特性。当过程的阶段状态发生切换时,分布模型fi(x)能提供相邻阶 段成分的比重,增强了过渡阶段的表示能力。
基于贝叶斯原则的FDA_Kernel的多阶段状态监测,工业过程中存在多阶段等特性,可以从历史过程 数据信息中挖掘更多潜在的局部信息,将数据分为更有意义的数据块进行分析,通过在过程中各子阶段中 建立模型对系统进行监测。相比于直接应用过程持续时间作为阶段状态切换指标,增加了对过程的监测的 泛化能力和稳定性。上述3.1节提供较稳定的状态监测方案,其优势表现在分析数据在各个阶段状态成分 的比重和数据间最大非相关的变换。但是,应用于预测模型时,基于过程测量数据的多模型状态监测方法 缺少对质量变量数据信息的利用,因此,在上述过程状态监控中通过贝叶斯原则添加质量变量的信息有利 于提高阶段监测准确度和可靠性,可以有效的根据所处阶段状态的后验概率将多个子阶段模型进行融合。
贝叶斯原则是概率统计中应用所观察到的现象对有关概率分布的先验概率进行修正的方法,其给出了 最小化误差的最优解决方法,可用于分类和预测。根据大数定理,后验概率常通过极大后验假设来修正的 对象先验知识。贝叶斯原则推理如下:
其中,x为观测点数据,y是观测值,pi(x|y)为观测值y对输入x修正的后验概率,pi(y|x)为输入x在模 型i条件下观测值y的条件概率,这个条件概率是观测值y在模型i作用下的先验假设,pi(x),p(y)分别 为输入x和观测值y的概率分布函数,n为模型数。
当更多的观测数据进行贝叶斯推理时,模型的预测能力将靠近这些训练观测点,后验概率修正先验假 定减少了模型的不确定性,而且基于贝叶斯原则的融合方法是无参的推理方式,避免了参数选择与模型过 拟合之间的问题。同时,随着正常观测样本的加入和不符合推理原则的观测点的剔除,增加了基于贝叶斯 原则模型的灵活性和稳定性。
基于阶段状态监测的混合MPLS融合方法,同一子阶段内数据分布相似,不同阶段间的分布差异很大。但 是相邻的过渡阶段包含前后阶段的部分潜在信息,较难获得具体模型。因此,为了保证子阶段内相似数据 分布的预报性能,首先,分别建立各子阶段MPLS模型,并结合Fisher判据分析和核密度估计方法优点提 出一种FDA_Kernel状态监测方法,显著子阶段内以及阶段间的状态切换,实现多阶段状态监测。最后, 根据贝叶斯原则在FDA_Kernel状态监测中融合质量变量信息得到混合MPLS模型。
假定经阶段划分得到的n个子阶段过程变量数据集质量变量数据集其中,J,M 为过程数据和质量变量维数,Ki为第i个子阶段数据集样本数,i=1,2,..,n。
1)根据3.1节建立状态监测模型,首先,利用FDA方法得到最佳投影变换后的n个数据集和最佳分离 向量w,并利用核密度方法估计数据集中数据样本概率密度分布模型fi(x),i=1,2,..,n。
2)在第i个阶段中利用过程变量集和质量变量数据集建立子阶段MPLSi模型。
3)利用质量变量数据集修正第i个阶段的概率密度分布模型fi(x),得到后验概率模型pi(x|y)。
4)对新的采集数据xnew∈R1×J,利用计算xnew在最佳分离向量w的投影值根据贝叶斯原则对在线 过程变量数据xnew进行质量预报。
yi=xnewRi (12)
其中,为混合的质量预报值,yi为第i个阶段的MPLSi模型的质量预报值,Ri为对应子阶段MPLS模型 的回归系数,i=1,2,..,p。
基于混合MPLS方法的多阶段过程质量预报建模,基于混合MPLS方法进行多阶段过程的质量预报。首先, 利用GMM模型对每批次采集数据进行阶段识别,得到每批次的多个子阶段数据子集,针对多批次同一子 阶段长度不等问题,采用动态时间规整(DTW)算法依据最长持续时间同步为等长轨迹,在各子阶段中按变 量展开方式建立MPLS模型。并根据第3节多模型融合方法建立混合MPLS模型。
离线建模
1)对I批历史过程数据xi(K×J)和质量数据yi(K×M)进行标准化。并根据GMM模型对过程和质量数据组 成的高维分布进行阶段识别,得到每批次p个子阶段数据子集。其中i为对应历史过程批次,J为测量变 量个数,M为质量变量个数,K为批次反应时间。
2)根据相似度最小和同一子阶段最大持续时间原则,应用动态时间规整技术(DTW)同步多批次同一子阶 段为等长轨迹。
3)同步后的子阶段数据按变量展开方式得到子阶段过程数据Xi(Ki×J)和质量数据Yi(Ki×M),其中, Ki,n为第n批历史批次第i个阶段的数据样本数,i=1,2,..,p,并在各子阶段中建立MPLS模 型。
4)根据第3节方法建立基于混合MPLS方法的质量预报模型进行质量预报。
在线质量预报
1)当新的测量数据xnew∈R1×J到来时,对新数据标准化。计算xnew∈R1×J在最佳分离向量的投影值x∈R, 计算x属于各子阶段的先验概率。
2)计算xnew∈R1×J在各子阶段MPLS模型的质量预报输出。并根据式(11)、(12)混合各子模型进行质量 预报。
青霉素发酵过程是补料分批发酵的过程,具有动态非线性和多阶段的特点。本发明选用美国Illinois 州立理工学院过程与技术小组开发的青霉素仿真平台PenSim2.0,此平台为国内外间歇过程监测的研究人 员提供的一个标准平台。实际的青霉素发酵过程大致为以下3个阶段:菌体生长期,发酵初始期和发酵平 稳期。青霉素发酵每个批次的反应时间为400小时,采样时间为1小时,选取10个过程变量和2个质量 变量进行监测,如表1所示。为了使训练数据可靠同时令训练样本数据足够多,本发明共生产了50批正 常批次数据作为模型的参考数据库,其中40批为模型训练数据,10批为测试数据。
表1青霉素监测的过程变量和质量变量
以预测均方根误差RMSE、最大相对误差MAXE和平均相对误差MRE作为模型性能评价标准。其中 RMSE反映整体预测值相对真实值的平均拟合程度,MAXE指示偏移误差相对真实值的最大偏移程度, MRE反映偏移误差相对真实值的平均偏移程度。
式中,为模型预测值,yi为实际测量值。RMSE值小,表示预测值相对实际值整体的拟合度高,预测效 果好。MAXE值小,表示预测值偏离实际值程度小,预测平稳连续,跟随实际系统能力强。MRE值小, 表示模型的平均偏离程度好,预测不确定度小,精度高。
每个批次10个过程变量和2个质量变量组成的高维分布作为高斯混合模型的输入,高斯混合模型采用 F-J自适应聚类算法,进行阶段识别。如图1所示,结果和青霉素实际生产过程基本吻合,验证了阶段划 分的有效性。由图1可知,各批次因为反应条件的差异,各阶段持续的反应时间不同。为了满足三维矩阵 X(I×J×K)按变量展开方式进行模型训练,本发明引入动态时间规整算法(DTW)依据相似性最小和各阶 段最长持续时间原则同步各批次同一子阶段数据为等长轨迹。
各子阶段同步后的数据样本被分为3类特征分布差异较明显的训练数据集,根据第3节的建模步骤, 针对菌体浓度和青霉素浓度两个输出变量,分别建立各子阶段的MPLS模型,同时根据Fisher判别准则计 算最佳分离向量来最小化各子阶段训练数据间的相关性,并由核密度方法估计各子阶段数据在最佳分离向 量上概率分布密度。图2示出了各子阶段训练数据在最佳分离向量上概率密度分布。由图2可知,阶段2 和阶段3的投影值分布相近,符合相邻阶段之间过渡过程的反应性质。最后通过第3节建模方法进行多模 型融合质量预报。
图3和图4分别示出了MPLS方法对测试批次5的菌体浓度和青霉素浓度质量预报。菌体浓度预报值 (*),实际菌体浓度测量值(-),青霉素浓度预报值(*)和青霉素浓度实际测量(-)值。如图3所示,MPLS模型 较好的反应出青霉素生产过程中菌体浓度的实际变化过程,有较好的实际拟合能力。但采样时刻50至150 之间菌体浓度预报值偏离严重,且偏离正常实际值的持续时间长,限制了其在质量预报中的可信度。图4 示出了对青霉素浓度的质量预报结果。但是MPLS模型预报青霉素浓度变化趋势能力弱,与实际拟合的效 果差。尤其在第40至50个采样点,预报值出现突变,其对实际的青霉素生产指导性较差,容易造成错误操作。
图5和图6分别示出了混合MPLS方法对测试批次5的菌体浓度和青霉素浓度预报。菌体浓度预报值 (*),实际菌体浓度测量值(-),青霉素浓度预报值(*)和青霉素浓度实际测量(-)值。混合MPLS方法建立的 模型预报结果均能比较客观地反应出实际青霉素发酵过程中的菌体浓度和青霉素浓度的变化趋势,具有较 好的实际测量值拟合度。两质量浓度预报效果较MPLS方法有较大改善,其表现在与实际值的预报偏离程 度降低以及预报连续平缓,跟随实际过程变化的能力增强。传统MPLS等建模方法在全局上采取较大的尺 度进行特征提取,忽视了过程细节和特点,较难在局部预报中获得较好的预报效果。混合MPLS模型可以 避免全局整体建模的缺点,凸出局部对整个反应过程的积累作用,提高了预报精度,进一步验证了本发明 方法的有效性。
为验本发明方法的有效性,将混合MPLS模型和MPLS模型、MKPLS模型进行预报实验对比。MPLS 模型通过对训练数据进行全局的特征提取,用于引导过程和质量数据分布的子空间分解。MKPLS模型利 用核函数对训练样本数据进行高维映射,较好的克服了工业过程中采集数据中的非线性问题,并在高维空 间利用PLS方法建立过程和质量变量的潜在关系。实验对比采用相同的训练数据和测试数据。表2示出了 各模型在相同的测试数据集下进行青霉素浓度预报的性能指标。可见,混合MPLS方法的均方根误差 (RMSE)较前两者都要小,模型整体与实际的青霉素测量值拟合度更好。混合方法的MAXE局部指标因 为多模型的分解使得较全局模型上有更大的优势,而且测试批次的RMSE、MRE指标值更小,拟合误差偏离稳定,相较前两种方法,该模型在泛化精度上进一步提升。通过表2可以看到相比于MPLS和MKPLS 的建模方法,采用混合MPLS模型的建模方法其性能更好,验证了本发明改进方法的有效性。
表2部分测试批次青霉素浓度性能指标
本发明可得出以下结论,传统的MPLS方法针对复杂的工业过程监控采取单一的模型,其在全局上采 用较大尺度进行特征提取,忽略了过程细节和特点,导致整体预报能力较差。本发明引入统计分布较好的 高斯混合模型,识别和聚类出工业过程多子阶段数据集,并利用Fisher判别准则寻找出多子阶段数据集最 佳的分离向量,并利用核密度估计方法区分多阶段的反应特性分布。最后,分别在各子阶段数据集中建立 MPLS模型,根据贝叶斯原则融合各子阶段模型进行质量预报。从实验结果可以看出,该方法能够有效地 实现过程监测,实现较精确的质量预测。
Claims (2)
1.一种基于混合MPLS的多阶段过程质量预报方法,其特征是:本方法基于在偏最小二乘,记作PLS,PLS是多元统计分析中一个重要的方法,研究多维矩阵X和Y之间的关系,寻找最优的低维特征解释方向,多向偏最小二乘方法,记作MPLS,是PLS的一种推广形式,其通过将多批次的历史过程数据矩阵X(I×J×K)和质量数据矩阵Y(I×M×K)以变量方式展开为二维矩阵X(IK×J)和Y(IK×M),并提取低维的潜在特征;MPLS形式如下:
X(IK×J)=TPT+E
Y(IK×M)=QUT+F
式中,T(IK×A),P(J×A)为矩阵X的得分和负载矩阵,同一子阶段内数据分布相似,不同阶段间的分布差异很大,为了保证子阶段内相似数据分布的预报性能,分别建立各子阶段MPLS模型,并结合Fisher判据分析和核密度估计方法优点提出一种FDA_Kernel状态监测方法,显著子阶段内以及阶段间的状态切换,实现多阶段状态监测,根据贝叶斯原则在FDA_Kernel状态监测中融合质量变量信息得到混合MPLS模型,具体步骤为:
第一步,进行离线建模
1)对I批历史过程数据xi(K×J)和质量数据yi(K×M)进行标准化。并根据GMM模型对过程和质量数据组成的高维分布进行阶段识别,得到每批次p个子阶段数据子集,其中i为对应历史过程批次,J为测量变量个数,M为质量变量个数,K为批次反应时间;
2)根据相似度最小和同一子阶段最大持续时间原则,应用动态时间规整技术(DTW)同步多批次同一子阶段为等长轨迹;
3)同步后的子阶段数据按变量展开方式得到子阶段过程数据Xi(Ki×J)和质量数据Yi(Ki×M),其中,Ki,n为第n批历史批次第i个阶段的数据样本数,i=1,2,..,p,并在各子阶段中建立MPLS模型;
第二步,在线质量预报
1)当新的测量数据xnew∈R1×J到来时,对新数据标准化,计算xnew∈R1×J在最佳分离向量的投影值x∈R,计算x属于各子阶段的先验概率,
2)计算xnew∈R1×J在各子阶段MPLS模型的质量预报输出。
2.根据权利要求1所述的基于混合MPLS的多阶段过程质量预报方法,其特征是:计算xnew∈R1×J在各子阶段MPLS模型的质量预报输出的方法为:
假定经阶段划分得到的n个子阶段过程变量数据集质量变量数据集其中,J,M为过程数据和质量变量维数,Ki为第i个子阶段数据集样本数,i=1,2,..,n,
具体包含以下步骤:
1)利用FDA方法得到最佳投影变换后的n个数据集和最佳分离向量w,并利用核密度方法估计数据集中数据样本概率密度分布模型fi(x),i=1,2,..,n,
2)在第i个阶段中利用过程变量集和质量变量数据集建立子阶段MPLSi模型,
3)利用质量变量数据集修正第i个阶段的概率密度分布模型fi(x),得到后验概率模型pi(x|y),
4)对新的采集数据xnew∈R1×J,利用计算xnew在最佳分离向量w的投影值根据贝叶斯原则对在线过程变量数据xnew按照下式进行质量预报,
yi=xnewRi
其中,为混合的质量预报值,yi为第i个阶段的MPLSi模型的质量预报值,Ri为对应子阶段MPLS模型的回归系数,i=1,2,..,p。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710506099.6A CN107357269A (zh) | 2017-06-17 | 2017-06-17 | 基于混合mpls的多阶段过程质量预报方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710506099.6A CN107357269A (zh) | 2017-06-17 | 2017-06-17 | 基于混合mpls的多阶段过程质量预报方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107357269A true CN107357269A (zh) | 2017-11-17 |
Family
ID=60273295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710506099.6A Pending CN107357269A (zh) | 2017-06-17 | 2017-06-17 | 基于混合mpls的多阶段过程质量预报方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107357269A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108388218A (zh) * | 2018-02-08 | 2018-08-10 | 中国矿业大学 | 基于潜变量过程迁移模型的修正自适应批次过程优化方法 |
CN109308063A (zh) * | 2018-12-03 | 2019-02-05 | 北京工业大学 | 基于得分矩阵的发酵过程阶段划分方法 |
CN109491349A (zh) * | 2018-12-18 | 2019-03-19 | 江南大学 | 基于pls模型的批次运行轨迹和空间的调整方法 |
CN109901476A (zh) * | 2019-03-29 | 2019-06-18 | 华能国际电力股份有限公司德州电厂 | 一种基于多变量数据段相似性的异常工况监控方法及系统 |
CN110794782A (zh) * | 2019-11-08 | 2020-02-14 | 中国矿业大学 | 基于jy-mkpls的间歇工业过程在线质量预测方法 |
CN111679643A (zh) * | 2020-06-28 | 2020-09-18 | 中国矿业大学 | 一种二阶修正自适应间歇过程优化方法 |
CN111898903A (zh) * | 2020-07-28 | 2020-11-06 | 北京科技大学 | 一种钢铁产品均匀性和综合质量评估方法及系统 |
CN112365022A (zh) * | 2020-09-22 | 2021-02-12 | 南京航空航天大学 | 一种基于多阶段的发动机轴承故障预测方法 |
WO2021036546A1 (zh) * | 2019-08-29 | 2021-03-04 | 山东科技大学 | 基于有偏估计的近红外定量分析模型构建方法 |
CN113646715A (zh) * | 2019-04-17 | 2021-11-12 | Abb瑞士股份有限公司 | 使用参数化批运行监测通过质量指示符控制技术设备 |
CN116495888A (zh) * | 2023-04-13 | 2023-07-28 | 河海大学 | 生态调蓄池及其体积分配方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1403822A (zh) * | 2002-09-26 | 2003-03-19 | 浙江大学 | 中药生产工艺中产品质量指标在线检测 |
CN101446828A (zh) * | 2008-12-30 | 2009-06-03 | 东北大学 | 一种非线性过程质量预报方法 |
CN101971169A (zh) * | 2007-12-21 | 2011-02-09 | Mks仪器股份有限公司 | 使用偏最小二乘分析(pls-树)分级地组织数据 |
CN102033523A (zh) * | 2009-09-25 | 2011-04-27 | 上海宝钢工业检测公司 | 基于偏最小二乘的带钢质量预测、炉况预警与故障诊断方法 |
CN102906650A (zh) * | 2010-05-21 | 2013-01-30 | 费希尔-罗斯蒙特系统公司 | 多阶段过程建模方法 |
CN103092078A (zh) * | 2013-01-07 | 2013-05-08 | 北京中医药大学 | 多阶段间歇生产过程的全程优化方法 |
-
2017
- 2017-06-17 CN CN201710506099.6A patent/CN107357269A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1403822A (zh) * | 2002-09-26 | 2003-03-19 | 浙江大学 | 中药生产工艺中产品质量指标在线检测 |
CN101971169A (zh) * | 2007-12-21 | 2011-02-09 | Mks仪器股份有限公司 | 使用偏最小二乘分析(pls-树)分级地组织数据 |
CN101446828A (zh) * | 2008-12-30 | 2009-06-03 | 东北大学 | 一种非线性过程质量预报方法 |
CN102033523A (zh) * | 2009-09-25 | 2011-04-27 | 上海宝钢工业检测公司 | 基于偏最小二乘的带钢质量预测、炉况预警与故障诊断方法 |
CN102906650A (zh) * | 2010-05-21 | 2013-01-30 | 费希尔-罗斯蒙特系统公司 | 多阶段过程建模方法 |
CN103092078A (zh) * | 2013-01-07 | 2013-05-08 | 北京中医药大学 | 多阶段间歇生产过程的全程优化方法 |
Non-Patent Citations (3)
Title |
---|
张曦: "《基于统计理论的工业过程综合性能监控、诊断及质量预测方法研究》", 《中国博士学位论文全文数据库 信息科技辑》 * |
薛明晨: "《基于局部加权PLS算法的多模型在线建模研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
齐咏生等: "《GMM-DPLS间歇过程故障监测与质量预报》", 《计算机与应用化学》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108388218A (zh) * | 2018-02-08 | 2018-08-10 | 中国矿业大学 | 基于潜变量过程迁移模型的修正自适应批次过程优化方法 |
CN108388218B (zh) * | 2018-02-08 | 2020-06-19 | 中国矿业大学 | 基于潜变量过程迁移模型的修正自适应批次过程优化方法 |
CN109308063A (zh) * | 2018-12-03 | 2019-02-05 | 北京工业大学 | 基于得分矩阵的发酵过程阶段划分方法 |
CN109308063B (zh) * | 2018-12-03 | 2020-08-28 | 北京工业大学 | 基于得分矩阵的发酵过程阶段划分方法 |
CN109491349A (zh) * | 2018-12-18 | 2019-03-19 | 江南大学 | 基于pls模型的批次运行轨迹和空间的调整方法 |
CN109901476A (zh) * | 2019-03-29 | 2019-06-18 | 华能国际电力股份有限公司德州电厂 | 一种基于多变量数据段相似性的异常工况监控方法及系统 |
CN113646715A (zh) * | 2019-04-17 | 2021-11-12 | Abb瑞士股份有限公司 | 使用参数化批运行监测通过质量指示符控制技术设备 |
WO2021036546A1 (zh) * | 2019-08-29 | 2021-03-04 | 山东科技大学 | 基于有偏估计的近红外定量分析模型构建方法 |
CN110794782A (zh) * | 2019-11-08 | 2020-02-14 | 中国矿业大学 | 基于jy-mkpls的间歇工业过程在线质量预测方法 |
CN111679643B (zh) * | 2020-06-28 | 2021-10-15 | 中国矿业大学 | 基于过程迁移模型的间歇过程二阶修正自适应优化方法 |
CN111679643A (zh) * | 2020-06-28 | 2020-09-18 | 中国矿业大学 | 一种二阶修正自适应间歇过程优化方法 |
CN111898903A (zh) * | 2020-07-28 | 2020-11-06 | 北京科技大学 | 一种钢铁产品均匀性和综合质量评估方法及系统 |
CN112365022A (zh) * | 2020-09-22 | 2021-02-12 | 南京航空航天大学 | 一种基于多阶段的发动机轴承故障预测方法 |
CN112365022B (zh) * | 2020-09-22 | 2024-07-23 | 南京航空航天大学 | 一种基于多阶段的发动机轴承故障预测方法 |
CN116495888A (zh) * | 2023-04-13 | 2023-07-28 | 河海大学 | 生态调蓄池及其体积分配方法 |
CN116495888B (zh) * | 2023-04-13 | 2024-01-26 | 河海大学 | 生态调蓄池及其体积分配方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107357269A (zh) | 基于混合mpls的多阶段过程质量预报方法 | |
Zhao et al. | Step-wise sequential phase partition (SSPP) algorithm based statistical modeling and online process monitoring | |
Zhang et al. | Two-directional concurrent strategy of mode identification and sequential phase division for multimode and multiphase batch process monitoring with uneven lengths | |
CN107066555B (zh) | 面向专业领域的在线主题检测方法 | |
Fujiwara et al. | Development of correlation-based pattern recognition algorithm and adaptive soft-sensor design | |
JP5733530B2 (ja) | データ類似度算出方法およびデータ類似度算出装置 | |
Oh et al. | STING: Self-attention based Time-series Imputation Networks using GAN | |
CN111079836A (zh) | 基于伪标签方法和弱监督学习的过程数据故障分类方法 | |
CN109727446A (zh) | 一种用电数据异常值的识别与处理方法 | |
Peres et al. | Fault detection in batch processes through variable selection integrated to multiway principal component analysis | |
CN109308063A (zh) | 基于得分矩阵的发酵过程阶段划分方法 | |
Chen et al. | Applying Machine Learning Algorithm to Optimize Personalized Education Recommendation System | |
Iturbide et al. | A comparison between LARS and LASSO for initialising the time-series forecasting auto-regressive equations | |
Bayrak et al. | Product attribute forecast: adaptive model selection using real-time machine learning | |
Luo et al. | Learning differential operators for interpretable time series modeling | |
CN108537249B (zh) | 一种密度峰值聚类的工业过程数据聚类方法 | |
Budka et al. | From sensor readings to predictions: On the process of developing practical soft sensors | |
Zhao et al. | Regression modeling and quality prediction for multiphase batch processes with inner-phase analysis | |
Goletto et al. | Bringing online egocentric action recognition into the wild | |
CN110045691A (zh) | 一种多源异构大数据的多任务处理故障监测方法 | |
Lv et al. | A spatial–temporal variational graph attention autoencoder using interactive information for fault detection in complex industrial processes | |
CN105160336A (zh) | 基于Sigmoid函数的人脸识别方法 | |
Tanatavikorn et al. | Batch process monitoring based on fuzzy segmentation of multivariate time-series | |
Shan et al. | Probabilistic tensor factorization for tensor completion | |
Wang et al. | Multimode process fault detection method based on variable local outlier factor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171117 |
|
RJ01 | Rejection of invention patent application after publication |