CN110794782A - 基于jy-mkpls的间歇工业过程在线质量预测方法 - Google Patents
基于jy-mkpls的间歇工业过程在线质量预测方法 Download PDFInfo
- Publication number
- CN110794782A CN110794782A CN201911088664.7A CN201911088664A CN110794782A CN 110794782 A CN110794782 A CN 110794782A CN 201911088664 A CN201911088664 A CN 201911088664A CN 110794782 A CN110794782 A CN 110794782A
- Authority
- CN
- China
- Prior art keywords
- matrix
- new
- data
- batch
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 212
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 89
- 230000008569 process Effects 0.000 claims abstract description 147
- 239000011159 matrix material Substances 0.000 claims abstract description 114
- 238000010923 batch production Methods 0.000 claims abstract description 18
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000000611 regression analysis Methods 0.000 claims description 7
- 239000000126 substance Substances 0.000 claims description 6
- 230000003416 augmentation Effects 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000011049 filling Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 abstract description 3
- 229930182555 Penicillin Natural products 0.000 description 23
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 23
- 229940049954 penicillin Drugs 0.000 description 23
- 230000006870 function Effects 0.000 description 12
- 238000009826 distribution Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 238000013508 migration Methods 0.000 description 6
- 230000005012 migration Effects 0.000 description 6
- 238000004088 simulation Methods 0.000 description 6
- 238000000855 fermentation Methods 0.000 description 5
- 230000004151 fermentation Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000009776 industrial production Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229930000044 secondary metabolite Natural products 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM]
- G05B19/41885—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM] characterised by modeling, simulation of the manufacturing system
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/32—Operator till task planning
- G05B2219/32339—Object oriented modeling, design, analysis, implementation, simulation language
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Manufacturing & Machinery (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于JY‑MKPLS的间歇工业过程在线质量预测方法,通过a过程、b过程的三维输入数据得到二维输入矩阵Xa、Xb,二维输出矩阵Ya、Yb;进行标准化处理;从低维原始空间投影到高维特征空间F,并在高维特征空间中计算核矩阵Ka、Kb;标准化核矩阵Ka、Kb;运行JY‑MKPLS算法;计算Kai、Kbi的负载矩阵;重复上述步骤直至提取出A个主元;计算输入数据矩阵K的得分矩阵T、负载矩阵P、输出数据矩阵Y的得分矩阵U、负载矩阵Q;进行批次过程质量预测;在线获得最新的输出数据ynew,并计算该批次的预测误差βn;模型预测误差的检验;用新产生的a过程数据对其进行替换;进行模型更新。该方法能快速建立精度较高的新过程预测模型,可提高建模的效率和预测精度,有效控制企业的操作成本。
Description
技术领域
本发明属于工业生产间歇过程的质量预测领域,具体涉及一种基于JY-MKPLS的间歇工业过程在线质量预测方法。
背景技术
间歇过程一般用来生产小批量、多种类、高附加值的产品,以应对当前市场品种多、规格高的产品需求,因而在现代工业生产中具有十分重要的地位。在一个工业过程中,产品质量一直是人们关注的重点,因为产品质量不仅影响着一个企业的经济效益,也影响着其口碑信誉。然而,在实际的间歇工业过程生产中,往往只有在一个批次生产结束后才可以通过离线测量得到产品质量,并且离线测量方式的采样周期一般较长,即滞后时间长,导致对产品的质量把控不及时,也不利于生产的优化控制。如今,随着工业自动化不断发展,在线实时预测产品质量的技术应运而生。目前质量预测方法主要有两大类,一类是基于机理建模的方法;另一类是基于数据驱动的方法。机理建模法是指根据生产对象、生产过程的内部机制或者相关生产过程的物理化学原理等建立起来的精确数学模型。但是对于实际情况中某些比较复杂的生产过程,人们通常难以直接写出它的数学表达式,或者根本无法确定表达式中的某些系数,使得机理建模的方法不能被广泛使用,几乎无法适应现代各种复杂的工业过程的建模要求。而基于数据建模的方法,一般只需要采集过程中的数据,运用数据分析处理的方法,对其进行回归分析,建立与实际相符的模型。基于数据建模的方法不需要精确写出整个生产过程的数学表达式,仅依靠工业生产过程的数据就可以建立起较为准确的模型,建模速度快,精度高。
对于数据进行回归分析的方法有很多,其中偏最小二乘法PLS(Partial leastsquares),具有对训练数据量要求较少,运算复杂度较低,解释效果较好等优点,具有较好的鲁棒性和预测稳定性,被广泛地用于过程建模和过程监控领域。此外,还有不少利用数据建模进行批次过程质量预测的等研究。利用上述建模方法结合足够的过程数据即可建立一个很好的反映过程特性的模型,并且这些方法已经被理论验证且经过了广泛的应用。但如果这个批次过程是一个还未投入使用或者使用不久的新过程,其过程数据稀缺,按照常规的基于数据建模的方法仅仅用少量的新过程数据建模不能保证预测的精度需要,此时就需要设计生产实验来获取足够多的新过程数据。但是这样不仅会加大投入成本,带来较长的滞后时间,而且建模效率低下,使得质量预测失去其意义,不利于企业实时调整生产策略与扩大生产规模,严重拖慢了生产运行优化的速度。此外,实际工业生产过程往往是非线性的,而且由于扰动以及其他因素的存在,使得数据分布会呈现出不均匀、不平坦的现象。如何快速建立精度较高的新过程预测模型以及处理非线性、数据分布不均匀、不平坦的问题具有十分重要的意义。在实际的生产过程中,由于新旧过程的内在机理的是一致的,它们之间必然存在一定的相似性。如果能够采用某种策略,利用相似过程中有用的旧过程数据来辅助新过程建模,就能够提高建模效率,有效控制企业的操作成本;利用多尺度核的方法在解决非线性问题的同时,能够改善数据分布不均匀、不平坦的问题,从而提高模型预测效率。
发明内容
针对上述现有技术存在的问题,本发明提供一种基于JY-MKPLS的间歇工业过程在线质量预测方法,该方法能快速建立精度较高的新过程预测模型,可提高建模的效率,有效控制企业的操作成本,同时,能有效处理非线性、数据分布不均匀、不平坦的问题,可有效解决非线性建模的问题,能够显著提高模型在实际工业中的预测精度。
为了实现上述目的,本发明提供一种基于JY-MKPLS的间歇工业过程在线质量预测方法,包括两套完全一样的的生产设备,两套生产设备的内部参数设置各不相同;一套为新投入生产的生产设备,其具有a过程,另一套为已经投入生产的生产设备,其具有b过程;a过程为新投入生产的间歇过程,其投产时间短,数据较少,b过程为已经投入生产一段时间的相似的旧间歇过程,数据充足;a过程和b过程均具有J个过程变量,且每一个批次内有K个采样时间点;对于a过程和b过程均收集I个批次数得到典型的间歇过程三维输入数据X∈RI ×J×K和输出数据矩阵为Y∈RI×K;
具体包括以下步骤:
步骤1:将a过程、b过程的三维输入数据按照批次方向展开成二维矩阵,得到二维输入矩阵Xa、Xb;将a过程、b过程的三维输出数据按照批次方向展开成二维矩阵,得到二维输出矩阵Ya、Yb;
步骤2:对a过程、b过程的输入矩阵Xa、Xb和a过程、b过程的输出数据矩阵Ya、Yb进行标准化处理,即对各列进行零均值和单位方差处理;
步骤3:将输入数据矩阵Xa、Xb利用非线性映射Φ:xi∈Rn→Φ(xi)∈F从低维原始空间投影到高维特征空间F,并在高维特征空间中计算核矩阵Ka、Kb:其中核矩阵的计算公式采用不同尺度的高斯核函数组合
步骤5:对a过程和b过程的核矩阵Ka、Kb和输出数据矩阵Ya、Yb运行JY-MKPLS算法,此时,输入数据矩阵变为Ka、Kb,输出矩阵依旧是Ya、Yb,对于从输出矩阵Y中提取收敛的ui,令i=1,,Kai,=,Ka Kbi=Kb Yai=Ya Ybi=Yb,i代表提取的潜变量的序号,联合输出矩阵为YJ=[Yai;Ybi];具体步骤如下:
S1:从联合输出矩阵YJi中提取任一列作为Yai、Ybi的得分向量uai、ubi的初始值,记:
S2:分别计算Kai、Kbi的得分向量tai、tbi;
S3:通过回归分析得到联合输出变量的负载矩阵qJi:
计算Yai、Ybi的得分向量uai=YT aiqJi,uai←uai/||uai||;ubi=YT biqJi,ubi←ubi/||ubi||,若两个得分向量均收敛,则进行步骤6的计算,否则转至步骤1;
步骤7:bi=[uai;ubi]T[tai;tbi];
步骤9:令i=i+1;重复步骤5到步骤9直至提取出A个主元;
步骤10:提取出全部主成分,计算输入数据矩阵K的得分矩阵T、负载矩阵P、输出数据矩阵Y的得分矩阵U、负载矩阵Q,具体如下:
Ta=[t1,K,tA],Tb=[t1,K,tA],Pb=[p1,K,pA],Ub=[u1,K,uA],QJ=[q1,K,qA];
若输出数据矩阵Y为单输出变量,则JY-MKPLS模型的表达式如下:
引入新的样本knew,knew是新样本xnew的核函数,可由下式计算得到:
knew=Φ(X)Φ(xnew)=[k(x1,xnew),K k(xn,xnew)]T;
其中,knew也需要进行标准化处理,对knew进行均值化可得:
其中,1t=1/n·[11K 1]T∈Rn。
在步骤9中,主元个数A通过交叉验证得到;
其中,1t=1/n·[11K 1]T∈Rn;
步骤11:进行批次过程质量预测;开始一个新的生产批次,在线获得新的输入数据数据xnew,进行数据标准化和均值补齐,利用输入数据xnew依据模型进行在线质量预测获得预测值并依据预测结果改变生产操作参数以便优化生产;
步骤13:模型预测误差的检验;当过程的批次数大于2J次时,获取除最新批次外所有的预测误差βn-1,当最新的批次预测误差δn连续m次落在稳定区间内时,则进入步骤14,否则,进入步骤15;
步骤14:观察数据替换是否完成,如果完成,则进入步骤15,直接填充新数据进行更新,否则,进行相似度的计算,剔除b过程中与a过程相似程度最小的b过程数据,用新产生的a过程数据对其进行替换,旧过程与新过程的相似程度用相似性θ(xi)表示,利用欧式距离可求得θ(xi),公式如下:
步骤15:进行模型更新,将该预测批次获得数据添加到a过程原始数据中组成新的增广矩阵Xa、Ya,并返回步骤1,进行新批次的预测,具体公式如下:
直至所有批次预测结束。
通过引入核函数方法,将非线性变换后的高维特征空间中的内积运算转换为原始输入空间中的简单核函数的计算。回归矩阵Φ为从原始低维输入空间到高维特征空间F的非线性映射,核矩阵K表示所有映射的输入数据的交叉点积,而且通过引入多尺度的核方法来解决数据分布不均匀、不平坦的问题。在每一个过程批次结束后,将获得的新数据补充到原始建模数据中构成增广矩阵重新建立预测模型,能够不断地使预测模型更符合新过程,实现模型更新。当生产过程进行了一段时间后,已经获得了足够的新过程数据,由于新旧过程之间的偏差,一些旧过程数据会影响预测模型精度的提升,需要对旧过程数据进行有选择地剔除才能进一步提高模型预测精度。旧数据剔除的原则是通过计算新旧过程数据之间的相似度,优先剔除与新过程相似性较低的旧过程数据。
与现有技术相比,本发明采用的JY-MKPLS方法,通过将相似生产过程的隐变量迁移至新生产过程的建模过程中,利用已知的历史数据和迁移的隐变量相结合,对新生产过程进行质量预测,解决了新投入生产过程数据稀缺而无法建立准确模型的问题。核函数的应用使得该方法可以用于非线性的批次过程建模。在利用联合Y的核偏最小二乘法技术基础上引入多尺度核的方法,将核函数多尺度化可以解决数据分布不均匀、不平坦的问题,能够显著增加模型的预测精度以及其在实际复杂工业应用中的可靠性,还能够充分反映学习样本的分布特性,提高模型的泛化能力。最终,通过模型预测得到的终点处的产品质量的预测值可以为操作人员实时调整生产策略提供决策依据,从而优化生产过程,能够提高企业的生产效率和经济效益。
附图说明
图1是本发明中实施例中青霉素生产过程的示意图;
图2是本发明中MKPLS与KPLS方法下青霉素终点浓度预测值的均方根误差对比示意图,主要突出显示在基本的PLS方法上使用多尺度核相比单尺度核的预测效果;
图3是本发明中JY-KPLS与KPLS方法下青霉素终点浓度预测值的均方根误差对比,主要突出显示在单尺度核的PLS情况下引入迁移相比不引入不迁移的预测效果;
图4是本发明中JY-MKPLS与JY-KPLS方法下青霉素终点浓度预测值的均方根误差对比,主要突出显示在引入迁移的基础上多尺度核相比单尺度核的预测效果;
图5是本发明基于JY-MKPLS间歇工业过程在线质量预测方法的流程图。
具体实施方式
如图5所示,本发明提供了一种基于JY-MKPLS的间歇工业过程在线质量预测方法,包括两套完全一样的的生产设备,两套生产设备的内部参数设置各不相同;一套为新投入生产的生产设备,其具有a过程,另一套为已经投入生产的生产设备,其具有b过程;a过程为新投入生产的间歇过程,其投产时间短,数据较少,b过程为已经投入生产一段时间的相似的旧间歇过程,数据充足;a过程和b过程均具有J个过程变量,且每一个批次内有K个采样时间点;对于a过程和b过程均收集I个批次数得到典型的间歇过程三维输入数据X∈RI×J×K和输出数据矩阵为Y∈RI×K;
具体包括以下步骤:
步骤1:将a过程、b过程的三维输入数据按照批次方向展开成二维矩阵,得到二维输入矩阵Xa、Xb;将a过程、b过程的三维输出数据按照批次方向展开成二维矩阵,得到二维输出矩阵Ya、Yb;
步骤2:对a过程、b过程的输入矩阵Xa、Xb和a过程、b过程的输出数据矩阵Ya、Yb进行标准化处理,即对各列进行零均值和单位方差处理;
步骤3:将输入数据矩阵Xa、Xb利用非线性映射Φ:xi∈Rn→Φ(xi)∈F从低维原始空间投影到高维特征空间F,并在高维特征空间中计算核矩阵Ka、Kb:其中核矩阵的计算公式采用不同尺度的高斯核函数组合
步骤5:对a过程和b过程的核矩阵Ka、Kb和输出数据矩阵Ya、Yb运行JY-MKPLS算法,此时,输入数据矩阵变为Ka、Kb,输出矩阵依旧是Ya、Yb,对于从输出矩阵Y中提取收敛的ui,令i=1,,Kai,=,Ka Kbi=Kb Yai=Ya Ybi=Yb,i代表提取的潜变量的序号,联合输出矩阵为YJ=[Yai;Ybi];具体步骤如下:
S2:分别计算Kai、Kbi的得分向量tai、tbi;
S3:通过回归分析得到联合输出变量的负载矩阵qJi:
计算Yai、Ybi的得分向量uai=YT aiqJi,uai←uai/||uai||;ubi=YT biqJi,ubi←ubi/||ubi||,若两个得分向量均收敛,则进行步骤6的计算,否则转至步骤1;
步骤7:bi=[uai;ubi]T[tai;tbi];
步骤9:令i=i+1;重复步骤5到步骤9直至提取出A个主元;
步骤10:提取出全部主成分,计算输入数据矩阵K的得分矩阵T、负载矩阵P、输出数据矩阵Y的得分矩阵U、负载矩阵Q,具体如下:
Ta=[t1,K,tA],Tb=[t1,K,tA],Pb=[p1,K,pA],Ub=[u1,K,uA],QJ=[q1,K,qA];
若输出数据矩阵Y为单输出变量,则JY-MKPLS模型的表达式如下:
引入新的样本knew,knew是新样本xnew的核函数,可由下式计算得到:
knew=Φ(X)Φ(xnew)=[k(x1,xnew),K k(xn,xnew)]T;
其中,knew也需要进行标准化处理,对knew进行均值化可得:
其中,1t=1/n·[11K 1]T∈Rn;
步骤11:进行批次过程质量预测;开始一个新的生产批次,在线获得新的输入数据数据xnew,进行数据标准化和均值补齐,利用输入数据xnew依据模型进行在线质量预测获得预测值并依据预测结果改变生产操作参数以便优化生产;
步骤13:模型预测误差的检验;当过程的批次数大于2J次时,获取除最新批次外所有的预测误差βn-1,当最新的批次预测误差δn连续m次落在稳定区间内时,则进入步骤14,否则,进入步骤15;
步骤14:观察数据替换是否完成,如果完成,则进入步骤15,直接填充新数据进行更新,否则,进行相似度的计算,剔除b过程中与a过程相似程度最小的b过程数据,用新产生的a过程数据对其进行替换,旧过程与新过程的相似程度用相似性θ(xi)表示,利用欧式距离可求得θ(xi),公式如下:
步骤15:进行模型更新,将该预测批次获得数据添加到a过程原始数据中组成新的增广矩阵Xa、Ya,并返回步骤1,进行新批次的预测,具体公式如下:
直至所有批次预测结束。
在步骤9中,主元个数A通过交叉验证得到;交叉验证法主要是通过验证集的预测残差平方和来判断引入新成分后模型的预测能力是否有统计意义上的改进,从而给出最佳的主成分个数A。
本发明中的方法通过构建相似过程联合质量指标得分空间,利用性质相似的旧生产过程信息辅助新生产过程的建模,在确保一定预测精度的前提下加快新过程预测模型的建立,解决了新生产过程数据稀缺导致的难以精准建模的问题。同时,引入核函数将原始低维空间自变量映射到高维特征空间,在高维空间进行基于线性运算的特征提取,利用核函数代替高维空间的内积运算,解决了非线性建模的问题。此外,将核函数进行多尺度化,解决了过程数据分布不均匀、不平坦的情况,引入多尺度核方法使本方法能够适用于处理具有高度非线性的复杂的实际工业生产过程,且能够显著提高模型在实际工业中的预测精度。
下面将通过青霉素生产的仿真实例,对本发明的技术方案做更加细致具体的说明介绍。
青霉素是一种非常重要的抗生素,在目前的制药工业中占有举足轻重的地位,生产规模非常大。青霉素是微生物的次级代谢产物,其生产过程具有高成本、高耗能的特点。从经济角度来说,研究和优化其生产过程可以提高产量,减少原料及生产所用的能量消耗,提高经济效益;从社会角度来说,优化其生产过程有益于医药事业的发展和人类的健康。为了能够及时观测青霉素的终点浓度,实现青霉素发酵过程的实时优化,减少生产成本,进行基于数据建模的质量预测十分重要。青霉素的生产过程是一个典型的非线性、动态、多阶段间歇生产过程,其发酵过程的流程示意图如图1所示。PH值和温度采用闭环控制,而补料采用开环控制,通过控制反应过程中PH值和发酵反应器内的温度,可以使反应在最佳条件下运行。该发酵过程通常的做法是首先在一定条件下进行微生物的培养,也就是初始培养阶段,然后通过不断地补充葡萄糖促进青霉素的合成,也就是青霉素发酵阶段。其整个生产周期包含了4个生理期:反应滞后期、菌体迅速生长期、青霉素合成期、菌体死亡。
在对于青霉素的生产过程有一定了解的基础上,结合其实际生产过程,选取了6个输入变量和1个输出变量进行质量预测模型的建立。6个输入变量分别为:通风率、二氧化碳的浓度、培养基体积、底物喂料温度、搅拌功率和培养基的ph值;1个输出变量选择了青霉素的终点浓度。
模拟旧间歇过程b的工作条件如表1所示:
表1旧间歇过程工作条件
Table 4-1 Old batch process working conditions
新间歇过程a的工作条件如表2所示:
表2新间歇过程工作条件
Table 4-2 New batch process working conditions
1)浓度预测模型的数据获取
在仿真中利用Pensim软件产生若干组数据,该软件能够对不同操作条件下青霉素生产过程的微生物浓度、浓度、CO2值、PH值、青霉素浓度、碳浓度、氧浓度以及产生的热量等进行仿真。利用此软件获得了a生产过程的50个批次的数据,其中5个批次的数据用于建模,45个批次的数据用于测试检验。b生产过程获取60个批次的数据,用于青霉素浓度预测模型的建立。利用a生产过程的5个批次和b过程的60个批次数据按照上述的方法进行建模,然后利用a过程剩余的45个批次数据进行检测。
2)基于JY-MKPLS的青霉素质量在线预测
为了对基于JY-MKPLS的质量预测方法效果进行检验,这里使用相同的批次数据与基于KPLS、MKPLS、JY-KPLS的质量预测方法进行比较,结果如图2、图3、图4所示。从图2可以看出,多尺度核相比单尺度核在不进行数据迁移时能够更好地解决数据分布不均匀的问题;从图3可以看出,加入迁移能够更好地提高初期模型的预测精度;从图4可以看出,引入迁移的基础上多尺度核相比单尺度核的预测效果更理想。综合以上三张图,可以看到基于JY-MKPLS的质量预测方法效果更好,不仅可以更好地提高初期模型的预测精度,而且还能在此基础上更好地解决数据分布不平坦、不均匀的问题。三种预测方法的均方根误差如表3所示。
表3几种预测方法的均方根误差
预测方法 | 均方根误差 |
KPLS | 0.0071 |
MKPLS | 0.0053 |
JY-KPLS | 0.0047 |
JY-MKPLS | 0.0038 |
通过以上几种建模方法的仿真结果对比,可以明显发现JY-MKPLS模型建立速度更快,预测精度更高。
3)模型更新和旧过程数据的剔除与替换
随着生产过程不断进行,新过程数据不断累积。由于新旧过程的差异,使用的旧过程的建模数据可能影响预测效果。为了保证JY-MKPLS方法的预测精度,需要从某一时间开始剔除与新过程差异较大的旧过程数据。
根据说明书中的方法,即从过程输入变量的2倍批次数开始进行剔除策略(6个过程输入变量),因此从第12个批次开始对旧数据进行剔除的判断,从仿真图可以看到,随着相似度最低的旧数据的不断剔除与替换以及预测批次数的增加,质量预测模型得到了更新。在舍弃掉一些旧过程数据中对于回归分析有害的信息后,剩下的都是对回归分析有益的数据信息,质量预测的模型更快地达到更高的精度,并且预测精度也在一定程度内不断提高,实现更好的预测效果,更符合人们的期望。
通过仿真结果可以看出,本发明利用相似旧过程的信息辅助新过程的建模,能够快速准确地建立新过程的预测模型,很好地解决了青霉素生产初期过程数据较少、难以建立模型的问题。引入多尺度核函数,在解决了非线性、时变性的非线性建模问题的同时,也有效解决了数据分布不均匀的情况,利用该方法进行青霉素终点处浓度预测,加快了离线建模的速度。而随着预测批次数目的不断增加,又会利用新过程数据进行模型更新,同时剔除掉旧过程数据中相似度最小的干扰数据,从而不断提高预测模型的精度,实现更好地预测效果。依据模型的预测值,操作人员可以及时调整生产策略,优化生产过程,因此该方法具有重要的实际意义。
Claims (2)
1.一种基于JY-MKPLS的间歇工业过程在线质量预测方法,其特征在于,包括两套完全一样的的生产设备,两套生产设备的内部参数设置各不相同;一套为新投入生产的生产设备,其具有a过程,另一套为已经投入生产的生产设备,其具有b过程;a过程为新投入生产的间歇过程,其投产时间短,数据较少,b过程为已经投入生产一段时间的相似的旧间歇过程,数据充足;a过程和b过程均具有J个过程变量,且每一个批次内有K个采样时间点;对于a过程和b过程均收集I个批次数得到典型的间歇过程三维输入数据X∈RI×J×K和输出数据矩阵为Y∈RI×K;
具体包括以下步骤:
步骤1:将a过程、b过程的三维输入数据按照批次方向展开成二维矩阵,得到二维输入矩阵Xa、Xb;将a过程、b过程的三维输出数据按照批次方向展开成二维矩阵,得到二维输出矩阵Ya、Yb;
步骤2:对a过程、b过程的输入矩阵Xa、Xb和a过程、b过程的输出数据矩阵Ya、Yb进行标准化处理,即对各列进行零均值和单位方差处理;
步骤3:将输入数据矩阵Xa、Xb利用非线性映射Φ:xi∈Rn→Φ(xi)∈F从低维原始空间投影到高维特征空间F,并在高维特征空间中计算核矩阵Ka、Kb:其中核矩阵的计算公式采用不同尺度的高斯核函数组合
其中,I是I×I单位矩阵,1I是矩阵元素都为1的I×I矩阵;
步骤5:对a过程和b过程的核矩阵Ka、Kb和输出数据矩阵Ya、Yb运行JY-MKPLS算法,此时,输入数据矩阵变为Ka、Kb,输出矩阵依旧是Ya、Yb,对于从输出矩阵Y中提取收敛的ui,令i=1,,Kai,=,Ka Kbi=Kb Yai=Ya Ybi=Yb,i代表提取的潜变量的序号,联合输出矩阵为YJ=[Yai;Ybi];具体步骤如下:
S2:分别计算Kai、Kbi的得分向量tai、tbi;
S3:通过回归分析得到联合输出变量的负载矩阵qJi:
计算Yai、Ybi的得分向量uai=YT aiqJi,uai←uai/||uai||;ubi=YT biqJi,ubi←ubi/||ubi||,若两个得分向量均收敛,则进行步骤6的计算,否则转至步骤1;
步骤7:bi=[uai;ubi]T[tai;tbi];
步骤9:令i=i+1;重复步骤5到步骤9直至提取出A个主元;
步骤10:提取出全部主成分,计算输入数据矩阵K的得分矩阵T、负载矩阵P、输出数据矩阵Y的得分矩阵U、负载矩阵Q,具体如下:
Ta=[t1,K,tA],Tb=[t1,K,tA],Pb=[p1,K,pA],Ub=[u1,K,uA],QJ=[q1,K,qA];
若输出数据矩阵Y为单输出变量,则JY-MKPLS模型的表达式如下:
引入新的样本knew,knew是新样本xnew的核函数,可由下式计算得到:
knew=Φ(X)Φ(xnew)=[k(x1,xnew),K k(xn,xnew)]T;
其中,knew也需要进行标准化处理,对knew进行均值化可得:
其中,1t=1/n·[11K 1]T∈Rn;
步骤11:进行批次过程质量预测;开始一个新的生产批次,在线获得新的输入数据数据xnew,进行数据标准化和均值补齐,利用输入数据xnew依据模型进行在线质量预测获得预测值并依据预测结果改变生产操作参数以便优化生产;
步骤13:模型预测误差的检验;当过程的批次数大于2J次时,获取除最新批次外所有的预测误差βn-1,当最新的批次预测误差δn连续m次落在稳定区间内时,则进入步骤14,否则,进入步骤15;
步骤14:观察数据替换是否完成,如果完成,则进入步骤15,直接填充新数据进行更新,否则,进行相似度的计算,剔除b过程中与a过程相似程度最小的b过程数据,用新产生的a过程数据对其进行替换,旧过程与新过程的相似程度用相似性θ(xi)表示,利用欧式距离可求得θ(xi),公式如下:
步骤15:进行模型更新,将该预测批次获得数据添加到a过程原始数据中组成新的增广矩阵Xa、Ya,并返回步骤1,进行新批次的预测,具体公式如下:
直至所有批次预测结束。
2.根据权利要求1所述的一种基于JY-MKPLS的间歇工业过程在线质量预测方法,其特征在于,在步骤9中,主元个数A通过交叉验证得到。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911088664.7A CN110794782A (zh) | 2019-11-08 | 2019-11-08 | 基于jy-mkpls的间歇工业过程在线质量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911088664.7A CN110794782A (zh) | 2019-11-08 | 2019-11-08 | 基于jy-mkpls的间歇工业过程在线质量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110794782A true CN110794782A (zh) | 2020-02-14 |
Family
ID=69443557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911088664.7A Pending CN110794782A (zh) | 2019-11-08 | 2019-11-08 | 基于jy-mkpls的间歇工业过程在线质量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110794782A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111610768A (zh) * | 2020-06-10 | 2020-09-01 | 中国矿业大学 | 基于相似度多源域迁移学习策略的间歇过程质量预测方法 |
CN111612212A (zh) * | 2020-04-10 | 2020-09-01 | 杭州电子科技大学 | 一种磨煤机煤粉细度的在线优化模型更新方法 |
CN111679643A (zh) * | 2020-06-28 | 2020-09-18 | 中国矿业大学 | 一种二阶修正自适应间歇过程优化方法 |
CN112506050A (zh) * | 2020-11-04 | 2021-03-16 | 中国矿业大学 | 一种基于潜变量过程迁移模型的间歇过程集成优化方法 |
CN114384870A (zh) * | 2021-11-10 | 2022-04-22 | 中国矿业大学 | 基于核局部线性嵌入pls的复杂工业过程运行状态评价方法 |
CN117598391A (zh) * | 2024-01-18 | 2024-02-27 | 华农恒青科技股份有限公司 | 发酵工艺条件的确定方法以及饲料发酵过程监测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104504288A (zh) * | 2015-01-12 | 2015-04-08 | 江南大学 | 基于多向支持向量聚类的非线性多阶段间歇过程软测量方法 |
US20160018378A1 (en) * | 2013-03-07 | 2016-01-21 | Siemens Aktiengesellschaft | Systems and methods for boosting coal quality measurement statement of related cases |
CN106843172A (zh) * | 2016-12-29 | 2017-06-13 | 中国矿业大学 | 基于jy‑kpls的复杂工业过程在线质量预测方法 |
CN107357269A (zh) * | 2017-06-17 | 2017-11-17 | 湖州师范学院 | 基于混合mpls的多阶段过程质量预报方法 |
-
2019
- 2019-11-08 CN CN201911088664.7A patent/CN110794782A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160018378A1 (en) * | 2013-03-07 | 2016-01-21 | Siemens Aktiengesellschaft | Systems and methods for boosting coal quality measurement statement of related cases |
CN104504288A (zh) * | 2015-01-12 | 2015-04-08 | 江南大学 | 基于多向支持向量聚类的非线性多阶段间歇过程软测量方法 |
CN106843172A (zh) * | 2016-12-29 | 2017-06-13 | 中国矿业大学 | 基于jy‑kpls的复杂工业过程在线质量预测方法 |
CN107357269A (zh) * | 2017-06-17 | 2017-11-17 | 湖州师范学院 | 基于混合mpls的多阶段过程质量预报方法 |
Non-Patent Citations (5)
Title |
---|
FEI CHU, ECT.: "Final quality prediction method for new batch processes based on improved JYKPLS process transfer model", 《CHEMOMETRICS AND INTELLIGENT LABORATORY SYSTEMS》 * |
ZHANG X.H.: "Batch process online monitoring based on multi-way kernel partial least squares", 《COMPUTERS AND APPLIED CHEMISTRY》 * |
刘吉臻,等: "基于自适应多尺度核偏最小二乘的SCR烟气脱硝系统建模", 《中国电机工程学报》 * |
崔久莉: "基于偏最小二乘算法的间歇过程在线监控与质量预测", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
程相: "基于过程迁移模型的间歇过程质量预测与运行优化方法研究", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111612212A (zh) * | 2020-04-10 | 2020-09-01 | 杭州电子科技大学 | 一种磨煤机煤粉细度的在线优化模型更新方法 |
CN111610768A (zh) * | 2020-06-10 | 2020-09-01 | 中国矿业大学 | 基于相似度多源域迁移学习策略的间歇过程质量预测方法 |
CN111610768B (zh) * | 2020-06-10 | 2021-03-19 | 中国矿业大学 | 基于相似度多源域迁移学习策略的间歇过程质量预测方法 |
CN111679643A (zh) * | 2020-06-28 | 2020-09-18 | 中国矿业大学 | 一种二阶修正自适应间歇过程优化方法 |
CN111679643B (zh) * | 2020-06-28 | 2021-10-15 | 中国矿业大学 | 基于过程迁移模型的间歇过程二阶修正自适应优化方法 |
CN112506050A (zh) * | 2020-11-04 | 2021-03-16 | 中国矿业大学 | 一种基于潜变量过程迁移模型的间歇过程集成优化方法 |
CN114384870A (zh) * | 2021-11-10 | 2022-04-22 | 中国矿业大学 | 基于核局部线性嵌入pls的复杂工业过程运行状态评价方法 |
CN117598391A (zh) * | 2024-01-18 | 2024-02-27 | 华农恒青科技股份有限公司 | 发酵工艺条件的确定方法以及饲料发酵过程监测方法 |
CN117598391B (zh) * | 2024-01-18 | 2024-04-16 | 华农恒青科技股份有限公司 | 发酵工艺条件的确定方法以及饲料发酵过程监测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110794782A (zh) | 基于jy-mkpls的间歇工业过程在线质量预测方法 | |
CN101158693B (zh) | 基于多核独立元分析的批量生产过程故障检测方法 | |
Gnoth et al. | Process Analytical Technology (PAT): Batch-to-batch reproducibility of fermentation processes by robust process operational design and control | |
CN110426956B (zh) | 一种基于过程迁移模型的间歇过程最优补偿控制策略 | |
CN108090500B (zh) | 食用菌发酵生产过程关键参量的软测量方法 | |
CN110046377B (zh) | 一种基于异构相似度的选择性集成即时学习软测量建模方法 | |
CN110263488B (zh) | 一种基于集成即时学习的工业混炼胶门尼粘度软测量方法 | |
WO2023077683A1 (zh) | 一种细胞培养状态在线估计及优化补料调控方法 | |
Yüzgeç et al. | On-line evolutionary optimization of an industrial fed-batch yeast fermentation process | |
Rodman et al. | Parameter estimation and sensitivity analysis for dynamic modelling and simulation of beer fermentation | |
CN103792845A (zh) | 一种金霉素发酵过程补糖速率优化控制的方法和系统 | |
Saarela et al. | Modelling of a fed-batch fermentation process | |
CN109243528A (zh) | 基于知识图谱有向图的生物过程控制方法 | |
CN110908361A (zh) | 一种基于在线孪生支持向量回归机的发酵过程软测量方法 | |
Hausmann et al. | Present Status of automation for industrial bioprocesses | |
CN116540533A (zh) | 一种基于数字孪生技术发酵溶解氧浓度优化控制方法 | |
CN114707424B (zh) | 基于质量相关慢特征分析算法的化工过程软测量方法 | |
Survyla et al. | Viable cell estimation of mammalian cells using off-gas-based oxygen uptake rate and aging-specific functional | |
CN103617316B (zh) | 一种基于多核支持向量机的发酵过程动态预测方法 | |
Li et al. | Soft sensor modeling method based on SPA-GWO-SVR for marine protease fermentation process | |
Liu et al. | Soft sensor modeling for key parameters of marine alkaline protease MP fermentation process | |
CN116861224B (zh) | 基于间歇过程软测量建模方法的间歇过程软测量建模系统 | |
Wang et al. | Online prediction of total sugar content and optimal control of glucose feed rate during chlortetracycline fermentation based on soft sensor modeling | |
Haoguang et al. | Study on soft sensing technology of penicillin fermentation based on PLS and SVR | |
CN110866643A (zh) | 基于最大二次互信息准则回归的发酵过程质量变量预测 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200214 |