CN103903065A - 基于核学习技术的青霉素生产过程产品质量预测方法 - Google Patents

基于核学习技术的青霉素生产过程产品质量预测方法 Download PDF

Info

Publication number
CN103903065A
CN103903065A CN201410129944.9A CN201410129944A CN103903065A CN 103903065 A CN103903065 A CN 103903065A CN 201410129944 A CN201410129944 A CN 201410129944A CN 103903065 A CN103903065 A CN 103903065A
Authority
CN
China
Prior art keywords
data
penicillin
new
production process
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410129944.9A
Other languages
English (en)
Inventor
葛志强
宋执环
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201410129944.9A priority Critical patent/CN103903065A/zh
Publication of CN103903065A publication Critical patent/CN103903065A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于核学习技术的青霉素生产过程产品质量在线预测方法。青霉素生产过程具有典型的非线性特性,因此过程变量和青霉素产品浓度具有非线性的相关性。本发明采用基于关联向量机的核学习方法,建立青霉素过程变量与产品浓度之间的非线性关系。在每一批青霉素生产过程中,通过容易测量的变量对难以测量的产品浓度进行在线预测,从而实现青霉素生产过程产品质量的闭环控制。

Description

基于核学习技术的青霉素生产过程产品质量预测方法
技术领域
本发明属于间歇生产过程产品质量预测和控制领域,特别涉及一种基于核学习技术的青霉素生产过程产品质量预测方法。
背景技术
青霉素生产过程是一种重要的生化过程,该过程作为二次微生物代谢过程,利用特定的生产菌在一定条件下生长繁殖,当生产菌的浓度达到一定程度之后,青霉素作为代谢产物开始生产。为了保证最终青霉素的质量,生产菌的浓度必须保持在一定水平之上,因此需要不断地补充糖、氮等营养物质。总的来说,青霉素过程可以分为两个操作阶段,分别为菌种培养阶段(开始补料阶段)和补料阶段。由于青霉素生产过程本身对产品质量的要求极高,如何有效地防止过程产生劣质或者不合格的产品是迫切需要解决的问题。因此,产品浓度的在线预测极其重要,因为这是实现青霉素过程产品质量闭环控制的关键。
传统的青霉素过程产品质量预测一般采用线性的回归模型,由于青霉素过程变量和产品的浓度之间一般是非线性关系,因此采用非线性的回归方法更合适。基于核学习的建模方法是近年来热门的非线性建模方法,该方法不仅能有效建立非线性回归模型,而且对模型的结构要求不高,具有非常广泛的适用性。
发明内容
本发明的目的在于针对青霉素生产过程产品浓度指标值预测的难点,提供一种基于核学习技术的产品质量预测方法。
本发明的目的是通过以下技术方案来实现的:一种基于核学习技术的青霉素生产过程产品质量预测方法,包括以下步骤:
(1)利用集散控制系统收集青霉素生产过程数据组成建模用的三维训练样本集:X∈RI×J×K,其中,R为实数集,表示X服从I×J×K的三维数据分布,I为该工况下的批次数目,J为变量个数,K为每个批次的采样数据点数。分别将这些数据存入历史数据库。
(2)将三维数据矩阵沿着批次方向展开为I×JK二维数据矩阵,对其进行预处理和归一化,即使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为 X ‾ ∈ R I × JK .
(3)基于矩阵集再重新沿着时间点方向对每一个数据矩阵进行排列,得到最终的数据样本集为
Figure BDA0000485794790000023
(4)通过离线实验室分析获取数据库中用于建模的样本所对应的青霉素产品浓度指标,记为y∈RKI,并对其进行归一化处理,得到归一化之后的青霉素浓度指标数据矩阵
Figure BDA0000485794790000024
(5)针对归一化之后的过程变量和青霉素产品浓度数据,建立关联向量回归模型,将该模型参数存入数据库中备用。
(6)收集新的青霉素生产过程批次数据,并对其进行预处理和归一化。
(7)将归一化之后的新数据直接输入到关联向量回归模型中,在线预测该批次青霉素产品的浓度值。
本发明的有益效果:本发明通过对青霉素生产过程变量和产品浓度指标值之间的非线性关系进行建模,利用该过程中容易测量的变量对难以测量的产品浓度值进行在线预测,从而实现青霉素生产过程产品质量的闭环控制。
附图说明
图1是青霉素生产过程的示意图;
图2是本发明方法对青霉素生产过程新批次的产品浓度预测结果;
图3是传统的线性回归方法对青霉素生产过程新批次的产品浓度预测结果。
具体实施方式
本发明一种基于核学习技术的青霉素生产过程产品质量预测方法,包括以下步骤:
第一步:利用集散控制系统收集青霉素生产过程数据组成建模用的三维训练样本集:X∈RI×J×K,其中,I为该工况下的批次数目,J为变量个数,K为每个批次的采样数据点数,R为实数集,表示X服从I×J×K的三维数据分布。分别将这些数据存入历史数据库。
第二步:将三维数据矩阵沿着批次方向展开为I×JK二维数据矩阵,对其进行预处理和归一化,即使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为 X ‾ ∈ R I × JK .
第三步:重新沿着时间点方向对每一个数据矩阵进行排列,最终的数据样本集为 X = ∈ R KL × J .
第四步:通过离线实验室分析获取数据库中用于建模的样本所对应的青霉素产品浓度指标,记为y∈RKI,并对其进行归一化处理,得到归一化之后的青霉素浓度指标数据矩阵
Figure BDA0000485794790000033
第五步:针对归一化之后的过程变量和青霉素产品浓度数据,建立关联向量回归模型,将该模型参数存入数据库中备用。
在历史数据库中对采集到的过程数据进行预处理,剔除野值点和明显的粗糙误差数据,为了使得过程数据的尺度不会影响到产品质量预测的结果,对不同变量的数据分别进行归一化处理,即各个变量的均值为零,方差为1。这样,不同过程变量的数据就处在相同的尺度之下,既而不会影响到后续的建模效果。
基于过程的高斯噪声假设,可以得到过程输出变量(即青霉素产品浓度)的条件概率分布为p(y|x)=N(f(x,w),σ2),进而得到完备数据的概率分布如下:
p ( y | w , σ 2 ) = 1 ( 2 π σ 2 ) n / 2 exp { - 1 2 σ 2 | | y - ψ ( x ) w | | }
其中p(·)为概率密度函数,p(y|w,σ2)表示后验概率,σ2为x数据分布的方差,||·||表示向量2-范数,y=(y1,y2,…,yKI)为输出数据向量,ψ(x)=[ψ1(x),ψ2(x),…,ψKI(x)]为输入数据核函数向量。为了得到最优的参数w和σ2,可以采用极大似然概率估计方法。首先,参数w先验概率定义如下:
p ( w | α ) = Π i = 0 KI N ( w i | 0 , α i - 1 ) = 1 ( 2 π ) ( KI + 1 ) / 2 Π i = 0 n α i 1 / 2 exp ( - α i w i 2 2 )
( α ) = Π i = 0 KI Gamma ( α i | a , b )
p(β)=Gamma(β|c,d)
其中β=σ-2,α为参数向量,Gamma(α|a,b)为gamma分布函数,即:
Gamma(β|c,d)=Γ(a)-1baαa-1e-bα
Γ ( α ) = ∫ 0 ∞ t α e - t dt
然后,可以进一步得到参数的后验概率如下:
p ( w | y , α , σ 2 ) = p ( y | w , σ 2 ) p ( w | α ) p ( y | α , σ 2 ) = 1 ( 2 π ) ( KI + 1 ) / 2 | Σ | - 1 / 2 exp { - 1 2 ( w - μ ) T Σ - 1 ( w - μ ) }
这也是一个高斯分布,其中均值和方差为:
μ=σ-2ΣψT(x)y
Σ=(σ-2ψT(x)ψ(x)+A)-1
其中,A=diag(α01,L,αn)为对角矩阵。通过对参数进行再一步优化,可以得到最优参数wop,表示为:
w op = σ op 2 Σ op ψ T ( x ) y
其中,op为优化optimal的缩写,即表示最优的w,
Figure BDA0000485794790000049
表示最优的方差,Σop表示最优的协方差。
第六步:收集新的青霉素生产过程批次数据,并对其进行预处理和归一化;
对于过程中新收集到的数据样本,除了对其进行预处理之外,还有采用建模时的模型参数对该数据点进行归一化,即减去建模均值和除以建模标准差。
第七步:将归一化之后的新数据直接输入到关联向量回归模型中,在线预测该批次青霉素产品的浓度值。
对于归一化之后的新数据
Figure BDA0000485794790000056
利用关联向量回归模型得到输出变量
Figure BDA0000485794790000055
的概率估计为:
p ( y ^ dwnew | x new , y , α op , σ op 2 ) = ∫ p ( p ^ new | x new , w , σ op 2 ) p ( w | x new , y , α op , σ op 2 )
其中,p(·)为概率密度函数,y为历史的输出变量,αop为最优的参数向量,Σop表示最优的协方差。
上述概率函数亦为高斯分布,均值和方差如下所示:
μ y , new = μ op T ψ ( x new )
σ y , new 2 = σ op 2 + ψ T ( x new ) Σ op ψ ( x new )
其中,ψ(xnew)=[1,K(xnew,x1),K(xnew,x2),…,K(xnew,xKI)]T为新数据对应的核函数矩阵。
以下结合一个具体的青霉素生产过程例子来说明本发明的有效性。该过程的流程示意图如图1所示,过程的主要测量变量如表1所示。一共采集了9批次过程数据进行建模,每一批数据均包含400个建模样本,这样,我们可以利用的建模样本一共为3600个。接下来结合该具体过程对本发明的实施步骤进行详细地阐述:
1.采集过程正常工况数据,数据预处理,归一化和重新排列
对收集到的9个批次有效过程建模数据样本进行预处理,剔除过程的野值点和粗糙误差点。将数据矩阵按照批次方向展开成二维数据矩阵并对其进行归一化,得到然后,重新沿着采样时刻方向对二维数据矩阵进行排列,得到新的数据矩阵为
Figure BDA0000485794790000062
2.基于关联向量回归模型的非线性建模
将选取的9个过程主要变量组成的数据矩阵作为模型的输入,青霉素浓度数据组成的矩阵作为模型的输出,建立关联向量回归非线性软测量模型。
3.获取青霉素生产过程的当前数据信息,并对其进行预处理和归一化
为了测试新方法的有效性,我们对青霉素生产过程的一个新批次数据进行测试,并利用建模时的归一化参数对其进行处理。
4.青霉素产品浓度的在线预测
对新批次数据进行在线质量预测,获得相应的产品浓度预测值。图1和图2分别给出了本发明方法和传统线性回归方法对该批次400个样本的在线预测结果,其中直线代表该批次产品浓度的离线分析值。由图中可以看出,本发明方法在青霉素产品浓度的预测能力上有很大的优势,相比之下,传统的线性PLS方法对青霉素产品浓度的预测效果要差的多。
表1:监测变量说明
序号 变量 序号 变量
1 通风速率(l/h) 6 二氧化碳浓度(mmol/l)
2 搅拌功率(W) 7 pH值
3 补料温度(K) 8 反应温度(K)
4 溶解氧浓度(g/l) 9 冷却水流量(l/h)
5 发酵体积(l)
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (3)

1.一种基于核学习技术的青霉素生产过程产品质量预测方法,其特征在于,包括以下步骤:
(1)利用集散控制系统收集青霉素生产过程数据组成建模用的三维训练样本集:X∈RI×J×K,其中,R为实数集,表示X服从I×J×K的三维数据分布,I为该工况下的批次数目,J为变量个数,K为每个批次的采样数据点数;分别将这些数据存入历史数据库;
(2)将步骤1中的三维数据矩阵X沿着批次方向展开为I×JK二维数据矩阵,对其进行预处理和归一化,即使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为
Figure FDA0000485794780000011
(3)基于矩阵集
Figure FDA0000485794780000017
再重新沿着时间点方向对每一个数据矩阵进行排列,得到最终的数据样本集为
(4)通过离线实验室分析获取数据库中用于建模的样本所对应的青霉素产品浓度指标,记为y∈RKI,并对其进行归一化处理,得到归一化之后的青霉素浓度指标数据矩阵
Figure FDA0000485794780000014
(5)针对归一化之后的过程变量和青霉素产品浓度数据,建立关联向量回归模型,将该模型参数存入数据库中备用;
(6)收集新的青霉素生产过程批次数据,并对其进行预处理和归一化;
(7)将归一化之后的新数据直接输入到关联向量回归模型中,在线预测该批次青霉素产品的浓度值。
2.根据权利要求1所述基于核学习技术的青霉素生产过程产品质量预测方法,其特征在于,所述步骤5具体为:将归一化之后的过程变量矩阵
Figure FDA0000485794780000015
作为模型的输入,归一化之后的青霉素浓度指标数据矩阵
Figure FDA0000485794780000016
作为模型的输出,建立如下的关联向量回归非线性模型:
y=f(x,w)+e
其中,f(·)为非线性函数,e为独立同分布的高斯噪声,即e~N(0,σ2),x为批次中的样本,w为权重向量;结合核函数的概念,上述关联向量回归模型可以表示为核函数的形式,如下所示:
f ( x , w ) = Σ i = 1 KI w i K ( x , x i ) + w 0 = Σ i = 0 KI w i ψ ( x )
其中,x为选定的批次中的单个样本,xi为其他的单个样本。w=[w0,w1,w2,…,wKI]为核函数矩阵ψ(x)=[1,K(x,x1),K(x,x2),…,K(x,xKI)]T的权重向量;K(g)为核函数,代表高维空间的内积;I为该工况下的批次数目,J为变量个数,K为每个批次的采样数据点数,为了得到最优的参数向量w=[w0,w1,w2,…,wKI],需要对如下的参数后验概率进行最优化:
p ( w | y , α , σ 2 ) = p ( y | w , σ 2 ) p ( w | α ) p ( y | α , σ 2 ) = 1 ( 2 π ) ( KI + 1 ) / 2 | Σ | - 1 / 2 exp { - 1 2 ( w - μ ) T Σ - 1 ( w - μ ) }
其中,p(·)为概率密度函数,p(w|α)表示后验概率,代表在a存在的情况下w发生的概率;y为模型的输出变量,α为参数向量,Σ为协方差,μ为均值,σ2为方差,T为矩阵的转置。
3.根据权利要求1所述基于核学习技术的青霉素生产过程产品质量预测方法,其特征在于,所述步骤7具体为:对于一个新的批次数据xnew,将其归一化之后得到直接输入到关联向量回归模型中,在线计算该实时数据对应的模型输出值,即青霉素生产过程当前批次的浓度预测值计算如下:
y ‾ new = w T ψ ( x ‾ new )
其中, ψ ( x ‾ new ) = [ 1 , K ( x ‾ new , x 1 ) K ( x ‾ new , x 2 ) , · · · , K ( x ‾ new , x n ) ] T 为该实时数据对应的核函数矩阵;xn表示第n个批次样本,w=[w0,w1,w2,…,wKI]为核函数矩阵ψ(x)=[1,K(x,x1),K(x,x2),…,K(x,xKI)]T的权重向量,T为矩阵的转置。
CN201410129944.9A 2014-04-01 2014-04-01 基于核学习技术的青霉素生产过程产品质量预测方法 Pending CN103903065A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410129944.9A CN103903065A (zh) 2014-04-01 2014-04-01 基于核学习技术的青霉素生产过程产品质量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410129944.9A CN103903065A (zh) 2014-04-01 2014-04-01 基于核学习技术的青霉素生产过程产品质量预测方法

Publications (1)

Publication Number Publication Date
CN103903065A true CN103903065A (zh) 2014-07-02

Family

ID=50994375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410129944.9A Pending CN103903065A (zh) 2014-04-01 2014-04-01 基于核学习技术的青霉素生产过程产品质量预测方法

Country Status (1)

Country Link
CN (1) CN103903065A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105425583A (zh) * 2015-11-05 2016-03-23 浙江大学 基于协同训练lwpls的青霉素生产过程的控制方法
CN107544447A (zh) * 2017-09-05 2018-01-05 浙江大学 一种基于核学习的化工过程故障分类方法
CN110209145A (zh) * 2019-05-16 2019-09-06 浙江大学 一种基于核矩阵近似的二氧化碳吸收塔故障诊断方法
CN116703245A (zh) * 2023-08-02 2023-09-05 宜兴市旭航电子有限公司 流程化生产过程监测预警系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880809A (zh) * 2012-10-11 2013-01-16 浙江大学 基于关联向量回归模型的聚丙烯熔融指数在线检测方法
CN103377316A (zh) * 2013-07-15 2013-10-30 浙江大学 基于统计分析和贝叶斯集成的青霉素生产过程监测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880809A (zh) * 2012-10-11 2013-01-16 浙江大学 基于关联向量回归模型的聚丙烯熔融指数在线检测方法
CN103377316A (zh) * 2013-07-15 2013-10-30 浙江大学 基于统计分析和贝叶斯集成的青霉素生产过程监测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MICHAEL E. TIPPING: "Sparse Bayesian learning and the relevance vector machine", 《JOURNAL OF MACHINE LEARNING RESEARCH》 *
ZHIQIANG GE ET AL.: "Nonlinear Quality Prediction for Multiphase Batch Processes", 《AICHE JOURNAL》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105425583A (zh) * 2015-11-05 2016-03-23 浙江大学 基于协同训练lwpls的青霉素生产过程的控制方法
CN107544447A (zh) * 2017-09-05 2018-01-05 浙江大学 一种基于核学习的化工过程故障分类方法
CN110209145A (zh) * 2019-05-16 2019-09-06 浙江大学 一种基于核矩阵近似的二氧化碳吸收塔故障诊断方法
CN110209145B (zh) * 2019-05-16 2020-09-11 浙江大学 一种基于核矩阵近似的二氧化碳吸收塔故障诊断方法
CN116703245A (zh) * 2023-08-02 2023-09-05 宜兴市旭航电子有限公司 流程化生产过程监测预警系统及方法
CN116703245B (zh) * 2023-08-02 2023-10-27 宜兴市旭航电子有限公司 流程化生产过程监测预警系统及方法

Similar Documents

Publication Publication Date Title
CN104914723A (zh) 基于协同训练偏最小二乘模型的工业过程软测量建模方法
CN104134003B (zh) 基于知识与数据共同驱动的作物单产量预测方法
CN104462850A (zh) 基于模糊高斯混合模型的多阶段间歇过程软测量方法
CN103903065A (zh) 基于核学习技术的青霉素生产过程产品质量预测方法
CN102626557B (zh) 基于ga-bp算法的分子蒸馏工艺参数优化方法
CN106897775A (zh) 基于贝叶斯集成学习的软测量建模方法
CN108647373A (zh) 一种基于xgboost模型的工业过程软测量方法
CN106251027B (zh) 基于模糊支持向量分位数回归的电力负荷概率密度预测方法
CN106843172A (zh) 基于jy‑kpls的复杂工业过程在线质量预测方法
CN110046377B (zh) 一种基于异构相似度的选择性集成即时学习软测量建模方法
CN106548270A (zh) 一种光伏电站功率异常数据辨识方法及装置
CN102880809A (zh) 基于关联向量回归模型的聚丙烯熔融指数在线检测方法
CN101639902B (zh) 生物发酵过程中基于支持向量机的软测量仪表的建模方法
CN103927460A (zh) 一种基于rbf的风电场短期风速预测方法
CN105425583A (zh) 基于协同训练lwpls的青霉素生产过程的控制方法
CN104050547A (zh) 一种油田开发规划方案非线性优选决策方法
CN105184400A (zh) 一种烟田土壤水分预测方法
CN112906987A (zh) 基于卷积神经网络和二维气象矩阵的光伏功率预测方法
CN108710964A (zh) 一种模糊时间序列水产养殖水质环境数据的预测方法
CN107729988B (zh) 基于动态深度置信网络的蓝藻水华预测方法
CN103377316A (zh) 基于统计分析和贝叶斯集成的青霉素生产过程监测方法
CN106405683B (zh) 基于g-l混合噪声特性核岭回归技术的风速预报方法及装置
CN105159247B (zh) 基于信息传递的间歇过程实时采样点阶段归属判断方法
CN103901855A (zh) 一种不等长批次条件下青霉素生产过程核学习监测方法
CN116881665A (zh) 一种基于CMOA优化的TimesNet-BiLSTM光伏出力预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140702