CN110866643B - 基于最大二次互信息准则回归的发酵过程质量变量预测方法 - Google Patents

基于最大二次互信息准则回归的发酵过程质量变量预测方法 Download PDF

Info

Publication number
CN110866643B
CN110866643B CN201911117647.1A CN201911117647A CN110866643B CN 110866643 B CN110866643 B CN 110866643B CN 201911117647 A CN201911117647 A CN 201911117647A CN 110866643 B CN110866643 B CN 110866643B
Authority
CN
China
Prior art keywords
regression
new
std
mutual information
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911117647.1A
Other languages
English (en)
Other versions
CN110866643A (zh
Inventor
王普
李征
高学金
高慧慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201911117647.1A priority Critical patent/CN110866643B/zh
Publication of CN110866643A publication Critical patent/CN110866643A/zh
Application granted granted Critical
Publication of CN110866643B publication Critical patent/CN110866643B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于最大二次互信息准则回归的发酵过程质量变量预测方法。实际生产中,反映最终产品质量的关键质量变量通常难以在线测量。目前常采用的离线测量法会导致滞后和精度不足等问题,影响产量及质量的一致性。本发明针对发酵生产数据强非线性、非高斯性的特点,提出一种基于最大二次互信息准则的回归方法,实现对发酵过程关键质量变量的预测。与MPLS等基于二阶统计量的回归方法相比,本发明使用高阶统计量进行过程变量与关键质量变量之间的回归,挖掘过程变量与关键质量变量之间的非线性依赖关系,且本发明无需假设数据服从高斯分布。相关实验表明,与MPLS方法相比,本发明预测效果更优。

Description

基于最大二次互信息准则回归的发酵过程质量变量预测方法
技术领域
本发明涉及基于数据驱动的回归预测方法领域,特别是涉及一种基于针对发酵生产数据的最大二次互信息准则回归方法。
背景技术
间歇过程是现代工业生产的重要生产方式。间歇过程广泛存在于生物制药、食品加工、化工、半导体生产等领域,最大的特征是小批量、高附加值、多规格和高品质。发酵过程是典型的间歇生产过程。我国生物发酵行业产业规模不断扩大,已成为我国战略性新兴产业中的重要组成部分。近年来增强生物发酵产业的自主创新能力,推动高新技术改造传统制造技术,已经成为生物发酵产业的研究热点。
在实际发酵生产过程中,一些可以反映最终产品质量的关键质量变量通常难以在线测量,如菌体浓度、产物浓度、葡萄糖浓度等。目前,这些变量大都只能离线测量,即在生产现场取样后拿到实验室进行分析测量。这样会导致滞后和精度不足等问题,影响发酵过程的产量及质量的一致性。随着传感器技术、智能仪表及计算机技术的迅速发展,生产中积累了大量的过程数据,如温度、压力及通风速率等。通过使用多元统计分析等数据驱动的方法,挖掘可测量的过程数据所包含的有用信息,实现对难以测量的变量的预测,已成为经济可靠、响应迅速的解决方式。目前,以偏最小二乘回归(Multiway Partial least squares,MPLS)及主成分回归(Principal component regression,PCR)为代表的多元统计回归模型在间歇过程的关键质量变量预测中得到广泛应用。
发酵过程的动力学模型呈现高度的非线性,因此难以建立精确的数学模型。发酵过程呈现出较强的时变性,过程的动力学特征随着发酵时间或批次不同而不断变化。此外,发酵生产数据多为高斯和非高斯的混合分布。然而,MPLS及PCR都是基于二阶统计量的方法,通过最大化方差、最大化相关性来提取特征,同时需要假设数据服从高斯分布。互信息(Mutual information)可以衡量数据分布之前的非线性相互依赖性,通过数据的概率分布提取高阶统计量。互信息在特征选择和特征提取领域得到广泛应用。为了便于计算,一些学者提出二次互信息(Quadratic mutual information,QMI)的概念。QMI将二次Renyi熵与Parzen窗密度估计方法巧妙结合,提供了有效的、便捷的计算数据集之间非线性依赖关系的方法。
发明内容
本发明针对发酵过程数据强非线性、非高斯性的特点,提出一种基于最大二次互信息准则的回归方法,实现对发酵过程关键质量变量的预测。本发明无需假设数据服从高斯分布,通过二次互信息提取过程变量与关键质量变量之间的非线性关系,提高预测精度。
本发明的总体设计方案为:
首先,将高维的原始过程数据(输入空间)进行线性映射到低维的特征空间。如图1所示,通过定义目标函数,使得特征与关键质量变量(输出)之间的二次互信息最大,同时使输入空间的Renyi熵也尽量保持最大。然后,使用梯度下降法求取最优线性变换。最后,建立原始过程数据与关键质量变量之间的线性回归模型,对新样本时刻的关键质量变量进行预测。
本发明采用如下的技术方案及实现步骤:
1、基于最大二次互信息准则回归的发酵过程质量变量预测,其特征在于:包括以下步骤:
A.离线建模阶段:
1)三维数据展开;正常发酵生产中采集到的三维过程数据可表示为Xo(I×M×K),其中I为批次数,M为过程变量个数,K为采样时刻数,首先对其进行变量展开,经过变量展开后得到二维矩阵Xv(N×M),其中N=KI;对于采集到的三维关键质量变量矩阵进行相同的处理,得到Yv(N×L),其中L为关键质量变量的个数;最后对Xv和Yv进行转置运算,得到X=Xv T=[x1,…,xN]及Y=Yv T=[y1,…,yN];
2)数据标准化;对X和Y进行标准化处理,求取每一行的均值和标准差;X的均值为:
Figure GDA0004188171070000031
其中
Figure GDA0004188171070000032
X的标准差为:
Xstd=[xs1,...,xsi,xsM]T (2)
其中
Figure GDA0004188171070000033
对Y进行标准化处理,得到Y的均值为:
Figure GDA0004188171070000034
其中
Figure GDA0004188171070000041
Y的标准差为:
Ystd=[ys1,...,ysi,ysL]T(4)
其中
Figure GDA0004188171070000042
3)依据Silverman’s rule计算使用Parzen窗进行密度估计时所需的核函数,包括σxt与σy;首先计算标准化后X的协方差矩阵Σ,令
Figure GDA0004188171070000043
其中σii为协方差矩阵Σ对角线上元素;依据Silverman’srule:
Figure GDA0004188171070000044
/>
Figure GDA0004188171070000045
Figure GDA0004188171070000046
其中r为对X进行线性变化后特征空间的维数;
4)目标函数J(W)的定义及计算;对X进行线性变换T=WTX,其中W是M×r(r<M)维变换矩阵,W的每一列为一个投影轴;T为变换后的特征空间,ti(i=1,…,N)为xi在特征空间的特征向量;即
Figure GDA0004188171070000051
目标函数定义为:
J(W)=-HR2(T)-α·QMIED(T,Y) (9)
其中HR2(T)是T的二次Renyi熵,QMIED(T,Y)是X与Y之间的基于欧式距离的二次互信息,α是权重系数,J(W)取得最小值,即W=W*时,T与Y之间的二次互信息最大,同时使T的二次Renyi熵也尽量保持最大;
使用Parzen窗对HR2(T)和QMIED(T,Y)进行计算;首先令高斯核函数记为:
Figure GDA0004188171070000052
然后使用Parzen窗对HR2(T)和QMIED(T,Y)分别进行估计,计算方法如下:
Figure GDA0004188171070000053
QMIED(T,Y)=VE=VJ+VM-2VC
Figure GDA0004188171070000061
Figure GDA0004188171070000066
/>
Figure GDA0004188171070000062
5)使用梯度下降法求取W*;随机初始化W,使用3)4)中相关公式计算此时J(W);使用
Figure GDA0004188171070000063
对W值进行更新,再计算J(W),其中,
Figure GDA0004188171070000064
以此反复进行迭代计算,直到达到终止条件为止,其中λ为学习速率;终止条件可以设置为达到最大迭代次数或J(W)收敛至某精度;
6)建立回归模型;由5)求得W*,此时T=W*TX;则T与Y之间的回归系数为:θ=(TTT)-1TYT
B.在线预测阶段:
1)样本预处理;对于采集到的新样本xnew,对其进行正则化处理:
Figure GDA0004188171070000065
其中xnew,i表示xnew的第i个分量;同理Xaver,i表示Xaver的第i个分量,Xstd,i表示Xstd的第i个分量;
2)使用回归模型进行预测
ynew=θTW*Txnew (14)
3)将ynew映射回原始输出空间,求取最终预测结果
yp,i=ynew,i·Ystd,i+Yaver,i (i=1,…,L) (15)
yp,i表示yp的第i个分量,Yaver,i表示Yaver的第i个分量,Ystd,i表示Ystd的第i个分量。
有益效果
本发明针对发酵过程数据强非线性、非高斯性的特点,提出一种基于最大二次互信息准则的回归方法,实现对发酵过程中难以控制的关键质量变量的预测,提高预测精度。与现有的技术PLS或PCR相比,本发明无需假设数据服从高斯分布。而且,本发明依据高阶统计量,即二次互信息,提取过程变量与关键质量变量之间的非线性依赖关系,与仅考虑二阶统计量、提取线性相关性的MPLS或PCR方法相比,具有明显优势。
附图说明
图1求取最优线性变换示意图;
图2三维数据变量展开示意图;
图3本发明与MPLS方法对某批次OD值的预测结果对比图;
具体实施方式
现代生物制药领域中,通常将目的基因导入菌体内,形成基因工程菌,经过培养与发酵使其表达,以生成所需的药用蛋白。大肠杆菌是常用的基因工程菌之一。实际药物制备过程中,大肠杆菌常被基因改良并进行发酵生产,以制备重组人白介素-2(IL-2)。IL-2是一种重要的药用蛋白,广泛应用于恶性肿瘤的治疗。大肠杆菌的发酵过程是典型的间歇生产过程,包含一系列复杂的生物化学反应,数据具有高度的非线性及高斯性。实际生产数据验证更突显本发明的研究意义和效果,因此本发明以实际制备IL-2的生产数据为验证对象。实际生产中,常通过离线测量光密度(optical density,OD)间接反映菌体浓度,判断菌体生长状态,OD是关键质量变量。
实验中,共计选择8个可测量的生产过程变量(浓度罐压、温度、酸碱度、搅拌速率、补碳、补氮、通风速率、溶解氧、)与关键质量变量OD。发酵时长约为6.5小时,采样间隔为10分钟,共计39个采样时刻。本发明共收集到28批次正常生产数据。随机选取其中的20批次进行离线回归建模,剩余8批次用于测试实验。
将本发明方法应用的上述大肠杆菌发酵制备IL-2的实际生产数据集中。开发语言为Matlab,开发平台为Matlab R2014a。整个实施过程包括离线建模与在线预测两部分。
A.离线建模阶段:
1)生产数据预处理。正常发酵生产中采集到的三维数据可表示为Xo(I×M×K),其中批次总数I=20,过程变量个数M=8,采样点总数K=39,首先对其进行变量展开,如图2所示,得到二维矩阵Xv(780×8),其中样本总数N=KI=780。对质量变量OD矩阵进行相同的处理,得到Yv(780×1),其中L=1。最后Xv和Yv进行转置运算,得到X8×780=Xv T=[x1,…,xi,…,x780]及Y1×780=Yv T=[y1,…,yi,…,y780]。
2)数据标准化及相关统计量计算。对X和Y进行标准化处理,求取每一行的均值和标准差。使用Matlab中“mean”函数求取X的均值Xaver(1×8),使用“std”函数求取X的标准差Xstd(1×8),同理,对Y进行标准化处理,得到Y的均值Yaver及标准差Ystd。计算σxt与σy。首先使用Matlab中“cov”函数计算标准化后X的协方差矩阵Σ,求取Σ对角线上元素的均值
Figure GDA0004188171070000091
依据Silverman’s rule分别计算得到:
Figure GDA0004188171070000092
令r=1,计算得到
Figure GDA0004188171070000093
3)使用梯度下降法求取最优线性变换。对X进行线性变换T=WTX,r=1时,对应的W是8×1维变换矩阵。随机初始化W。计算此时特征向量ti=WTxi,即
T=WTX
[t1 ti … t780]=WT[x1 xi… x780]
计算目标函数J(W)。首先使用Parzen窗对HR2(T)和QMIED(T,Y)分别进行估计,计算方法如下:
Figure GDA0004188171070000094
/>
QMIED(T,Y)=VE=VJ+VM-2VC
Figure GDA0004188171070000101
Figure GDA0004188171070000102
Figure GDA0004188171070000103
计算目标函数J(W),权重系数α=80。使用
Figure GDA0004188171070000104
对W值进行更新,再计算J(W)。以此反复进行迭代计算,直到达到终止条件为止。其中学习速率λ=0.5。终止条件设置为J(W)收敛至精度0.001。
4)建立回归模型。由5)求得W*,此时T=W*TX。则T与Y之间的回归系数为:θ=(TTT)-1TYT
B.在线预测阶段:
1)新样本预处理。8批次的测试数据集中的每个批次数据分别进行单独处理。针对某一个测试批次的数据,可表示为Xtest(M×K)。其中,过程变量个数M=8,采样点总数K=39。Xtest的每一列表示测试批次在某采样点所有变量的取值,即Xtest的每一列为一个新样本。对于采集到的每个新样本xnew(8×1),对其进行正则化处理,使用Matlab中的点除函数,计算如下:
xnew=(xnew-Xaver)./Xstd
2)使用回归模型进行预测。ynew=θTW*Txnew
3)将ynew映射回原始输出空间,求取最终预测结果。使用Matlab中的点乘函数。得到最终预测结果:yp=ynew.*Ystd+Yaver
使用以上方法对测试批次的所有采样时刻的样本进行预测。进一步对总计8批次的测试数据逐个进行预测,得到最终预测结果。
表1为本发明与传统MPLS方法对8个测试批次预测结果的预测均方根误差指标RMSE(Root mean square error,RMSE)值。从表中数据看出,本发明的预测精度要优于传统的MPLS方法。图3为某个测试批次下两种方法对OD值的预测结果。可以看出,在采样时刻21附近及批次结束时,本发明预测误差明显小于MPLS,具有更好的预测效果。
表1
测试批次 1 2 3 4 5 6 7 8
MPLS 10.5515 10.3351 10.305 11.8488 11.0787 10.0776 9.3867 8.3963
本发明 8.9149 7.8731 9.5526 6.6075 9.9596 8.8506 6.7318 7.3542

Claims (1)

1.基于最大二次互信息准则回归的发酵过程质量变量预测方法,其特征在于:包括以下步骤:
A.离线建模阶段:
1)三维数据展开;正常发酵生产中采集到的三维过程数据可表示为Xo(I×M×K),其中I为批次数,M为过程变量个数,K为采样时刻数,首先对其进行变量展开,经过变量展开后得到二维矩阵Xv(N×M),其中N=KI;对于采集到的三维关键质量变量矩阵进行相同的处理,得到Yv(N×L),其中L为关键质量变量的个数;最后对Xv和Yv进行转置运算,得到X=Xv T=[x1,…,xN]及Y=Yv T=[y1,…,yN];
2)数据标准化;对X和Y进行标准化处理,求取每一行的均值和标准差;X的均值为:
Figure FDA0004163997300000011
其中
Figure FDA0004163997300000012
X的标准差为:
Xstd=[xs1,...,xsi,xsM]T (2)
其中
Figure FDA0004163997300000013
对Y进行标准化处理,得到Y的均值为:
Figure FDA0004163997300000014
其中
Figure FDA0004163997300000015
Y的标准差为:
Ystd=[ys1,...,ysi,ysL]T (4)
其中
Figure FDA0004163997300000016
3)依据Silverman’s rule计算使用Parzen窗进行密度估计时所需的核函数,包括σxt与σy;首先计算标准化后X的协方差矩阵Σ,令
Figure FDA0004163997300000021
其中σii为协方差矩阵Σ对角线上元素;依据Silverman’s rule:
Figure FDA0004163997300000022
Figure FDA0004163997300000023
Figure FDA0004163997300000024
其中r为对X进行线性变化后特征空间的维数;
4)目标函数J(W)的定义及计算;对X进行线性变换T=WTX,其中W是M×r r<M维变换矩阵,W的每一列为一个投影轴;T为变换后的特征空间,ti i=1,…,N为xi在特征空间的特征向量;即
Figure FDA0004163997300000025
目标函数定义为:
J(W)=-HR2(T)-α·QMIED(T,Y) (9)
其中HR2(T)是T的二次Renyi熵,QMIED(T,Y)是X与Y之间的基于欧式距离的二次互信息,α是权重系数,J(W)取得最小值,即W=W*时,T与Y之间的二次互信息最大,同时使T的二次Renyi熵也尽量保持最大;
使用Parzen窗对HR2(T)和QMIED(T,Y)进行计算;首先令高斯核函数记为:
Figure FDA0004163997300000031
然后使用Parzen窗对HR2(T)和QMIED(T,Y)分别进行估计,计算方法如下:
Figure FDA0004163997300000032
QMIED(T,Y)=VE=VJ+VM-2VC
Figure FDA0004163997300000033
Figure FDA0004163997300000034
Figure FDA0004163997300000035
5)使用梯度下降法求取W*;随机初始化W,使用3)4)中相关公式计算此时J(W);使用
Figure FDA0004163997300000036
对W值进行更新,再计算J(W),其中,
Figure FDA0004163997300000037
以此反复进行迭代计算,直到达到终止条件为止,其中λ为学习速率;终止条件设置为达到最大迭代次数或J(W)收敛至某精度;
6)建立回归模型;由5)求得W*,此时T=W*TX;则T与Y之间的回归系数为:θ=(TTT)-1TYT
B.在线预测阶段:
1)样本预处理;对于采集到的新样本xnew,对其进行正则化处理:
Figure FDA0004163997300000041
其中xnew,i表示xnew的第i个分量;同理Xaver,i表示Xaver的第i个分量,Xstd,i表示Xstd的第i个分量;
2)使用回归模型进行预测
ynew=θTW*Txnew (14)
3)将ynew映射回原始输出空间,求取最终预测结果
yp,i=ynew,i·Ystd,i+Yaver,i i=1,…,L(15)
yp,i表示yp的第i个分量,Yaver,i表示Yaver的第i个分量,Ystd,i表示Ystd的第i个分量。
CN201911117647.1A 2019-11-15 2019-11-15 基于最大二次互信息准则回归的发酵过程质量变量预测方法 Active CN110866643B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911117647.1A CN110866643B (zh) 2019-11-15 2019-11-15 基于最大二次互信息准则回归的发酵过程质量变量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911117647.1A CN110866643B (zh) 2019-11-15 2019-11-15 基于最大二次互信息准则回归的发酵过程质量变量预测方法

Publications (2)

Publication Number Publication Date
CN110866643A CN110866643A (zh) 2020-03-06
CN110866643B true CN110866643B (zh) 2023-06-06

Family

ID=69653686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911117647.1A Active CN110866643B (zh) 2019-11-15 2019-11-15 基于最大二次互信息准则回归的发酵过程质量变量预测方法

Country Status (1)

Country Link
CN (1) CN110866643B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114358450B (zh) * 2022-03-22 2022-08-23 广东佳焙食品股份有限公司 一种基于数据处理的麻薯面包加工用发酵质量预测系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504288A (zh) * 2015-01-12 2015-04-08 江南大学 基于多向支持向量聚类的非线性多阶段间歇过程软测量方法
CN109308063A (zh) * 2018-12-03 2019-02-05 北京工业大学 基于得分矩阵的发酵过程阶段划分方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5573443B2 (ja) * 2010-07-14 2014-08-20 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504288A (zh) * 2015-01-12 2015-04-08 江南大学 基于多向支持向量聚类的非线性多阶段间歇过程软测量方法
CN109308063A (zh) * 2018-12-03 2019-02-05 北京工业大学 基于得分矩阵的发酵过程阶段划分方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
BenBen Jiang等.Maximized Mutual Information Analysis Based on Stochastic Representation for Process Monitoring.《IEEE Trasactions on Industrial Informatics》.2018,第15卷(第3期),1579-1587. *
Tangkaratt Voot等.Direct Estimation of the Derivative of Quardratic Mutual Information with Application in Supervised Dimension Reduction.《Neural Computation》.2017,第29卷(第8期),2076-2122. *
张凤珊等.发酵过程控制的回归模型和过程预测.《天津轻工业学院学报》.2002,(第4期),55-57. *
梅从立等.基于多模型的发酵过程高斯过程回归软测量建模研究.《计算机与应用化学》.2016,第33卷(第12期),1279-1285. *
王锡昌.基于局部偏最小二乘的间歇过程质量预测研究.《中国博士学位论文全文数据库 基础科学辑》.2019,(第5期),A002-51. *

Also Published As

Publication number Publication date
CN110866643A (zh) 2020-03-06

Similar Documents

Publication Publication Date Title
CN108647272B (zh) 一种基于数据分布的小样本扩充对脱丁烷塔底丁烷浓度进行预测的方法
CN110046377B (zh) 一种基于异构相似度的选择性集成即时学习软测量建模方法
Almeida et al. Neural-network-based parameter estimation in S-system models of biological networks
Lee et al. EMMIXcskew: an R package for the fitting of a mixture of canonical fundamental skew t-distributions
CN110263488B (zh) 一种基于集成即时学习的工业混炼胶门尼粘度软测量方法
CN104504288A (zh) 基于多向支持向量聚类的非线性多阶段间歇过程软测量方法
CN110866643B (zh) 基于最大二次互信息准则回归的发酵过程质量变量预测方法
CN113031553A (zh) 一种基于自动聚类结合偏最小二乘的间歇过程质量预测方法
Jiang et al. Rapid identification of fermentation stages of bioethanol solid-state fermentation (SSF) using FT-NIR spectroscopy: comparisons of linear and non-linear algorithms for multiple classification issues
CN109325065A (zh) 基于动态隐变量模型的多采样率软测量方法
CN106599391B (zh) 基于三角形角度值动态加权的关联向量机软测量建模方法
Liu et al. Characteristic gene selection via weighting principal components by singular values
CN112965971A (zh) 一种对特征丰度数据和样本表型数据进行关联分析的方法
CN109686399B (zh) 一种基因数据集整合分析方法
Arnese-Feffin et al. Digital design of new products: accounting for output correlation via a novel algebraic formulation of the latent-variable model inversion problem
Sun et al. Multi-fidelity Gaussian process for biomanufacturing process modeling with small data
CN116776252A (zh) 一种改进Mallow&#39;s Cp变量选择的工业过程软测量方法和系统
CN115620808A (zh) 基于改进Cox模型的癌症基因预后筛选方法及系统
CN110879873B (zh) 一种基于哈密顿蒙特卡洛采样的vine copula相关性描述的软测量方法及系统
Schmidt et al. Efficient simulation of semilinear populations models for age-structured bio reactors
CN111145838B (zh) 基于多向数据模型的青霉素发酵过程迭代学习卡尔曼滤波方法
CN110728024B (zh) 一种基于vine copula的软测量方法及系统
Zhang et al. Active learning strategy for online prediction of particle size distribution in cobalt oxalate synthesis process
CN111914206B (zh) 一种基于动态近邻保持嵌入算法的过程监测方法
Weng Fourier transform sparse inverse regression estimators for sufficient variable selection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant