CN113838530B - 利用细胞代谢网络监测生物制造过程的方法 - Google Patents
利用细胞代谢网络监测生物制造过程的方法 Download PDFInfo
- Publication number
- CN113838530B CN113838530B CN202110950873.9A CN202110950873A CN113838530B CN 113838530 B CN113838530 B CN 113838530B CN 202110950873 A CN202110950873 A CN 202110950873A CN 113838530 B CN113838530 B CN 113838530B
- Authority
- CN
- China
- Prior art keywords
- metabolic
- monitoring
- flux
- data set
- metabolic flux
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 70
- 238000012544 monitoring process Methods 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000019522 cellular metabolic process Effects 0.000 title abstract description 9
- 230000002503 metabolic effect Effects 0.000 claims abstract description 97
- 230000004907 flux Effects 0.000 claims abstract description 96
- 230000003834 intracellular effect Effects 0.000 claims abstract description 24
- 238000000855 fermentation Methods 0.000 claims abstract description 19
- 230000004151 fermentation Effects 0.000 claims abstract description 19
- 230000008569 process Effects 0.000 claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims abstract description 9
- 230000012010 growth Effects 0.000 claims abstract description 4
- 230000004060 metabolic process Effects 0.000 claims abstract description 3
- 239000002207 metabolite Substances 0.000 claims description 34
- 238000012360 testing method Methods 0.000 claims description 26
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000005070 sampling Methods 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 12
- 230000001413 cellular effect Effects 0.000 claims description 10
- 238000013406 biomanufacturing process Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 5
- 238000000513 principal component analysis Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 238000012886 linear function Methods 0.000 claims description 4
- 238000012887 quadratic function Methods 0.000 claims description 3
- 230000001052 transient effect Effects 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 2
- 238000009826 distribution Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000000813 microbial effect Effects 0.000 abstract description 4
- 230000010261 cell growth Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 10
- 229930182555 Penicillin Natural products 0.000 description 7
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 229940049954 penicillin Drugs 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000003756 stirring Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000009423 ventilation Methods 0.000 description 3
- 238000002813 epsilometer test Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000002028 Biomass Substances 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- UBAZGMLMVVQSCD-UHFFFAOYSA-N carbon dioxide;molecular oxygen Chemical compound O=O.O=C=O UBAZGMLMVVQSCD-UHFFFAOYSA-N 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000000498 cooling water Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/30—Dynamic-time models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本发明涉及一种利用细胞代谢网络监测生物制造过程的方法,包括如下步骤:基于代谢网络进行通量均衡分析,得到反映细胞生长与繁殖过程的代谢通量;将细胞内代谢通量与生产过程变量一起构成训练数据集,建立生物发酵过程监测模型及统计量控制限;基于监测模型,利用实时采集的生产过程变量和代谢通量计算值进行运行状况在线监测。本发明的利用细胞代谢网络监测生物制造过程的方法,该方法既利用微生物制造过程可检测或可观测信息,又充分挖掘细胞生长繁殖过程中不可检测的胞内代谢信息,能够更加有效的实施对生产制造过程运行状况评估及故障监测。
Description
技术领域
本发明涉及工业生物过程控制技术领域,尤其是指一种利用细胞代谢网络监测生物制造过程的方法。
背景技术
随着全球经济发展和社会进步,为了满足人们日益增长的生活需求,以工业微生物技术为代表的小批量、高利润、多品种生产方式受到重视。生物制造过程一般在生物反应器中进行,其可以通过批次生产的方式在一定周期时间内获得经济效益高的产物,比如常用抗生素青霉素的生产,其外源分泌蛋白等一般由生物发酵反应而得。然而在发酵生产过程中经常会出现各类生产状况的失控或运行故障,如果不能及早监测、预警并及时调控,最终会影响生产质量和目标产物的产量。因此,生物制造过程运行状况评估与故障监测,具有重要的实际工程价值。
生物发酵过程中同时存在物化和生化反应,细胞内部机理复杂,而实际生产过程中一般只能检测到温度、pH、通风率、搅拌功率等基本生产工艺变量及一些可观测的细胞外物质浓度,对于细胞内的微观的代谢活动则无法观测,导致现有的发酵生产运行状况评估技术主要依据生产过程中各工艺变量和物质浓度进行综合分析,其监测的实效性和及时性有待提高。
发明内容
为此,本发明所要解决的技术问题在于克服现有技术中于细胞内微观的代谢活动无法观测,导致现有的发酵生产运行状况评估不足的问题,提供一种利用细胞代谢网络监测生物制造过程的方法,该方法既利用微生物制造过程可检测或可观测信息,又充分挖掘细胞生长繁殖过程中不可检测的胞内代谢信息,能够更加有效的实施对生产制造过程运行状况评估及故障监测。
为解决上述技术问题,本发明提供了一种利用细胞代谢网络监测生物制造过程的方法,包括如下步骤:基于代谢网络进行通量均衡分析,得到反映细胞生长与繁殖过程的代谢通量;将细胞内代谢通量与生产过程变量一起构成训练数据集,建立生物发酵过程监测模型及统计量控制限;基于监测模型,利用实时采集的生产过程变量和代谢通量计算值进行运行状况在线监测。
在本发明的一个实施例中,所述通量均衡分析过程包括:建立通量均衡方程;建立胞外代谢物浓度与代谢通量的动态关系;根据多批次胞外代谢物浓度采样值估计代谢通量。
在本发明的一个实施例中,所述代谢通量的随时间变化,采集相邻两个时间点之间的代谢通量变化规律对代谢通量进行瞬态特征描述,包括常数、线性函数、二次函数。
在本发明的一个实施例中,多批次胞外代谢物浓度采样值根据生产实际来选取,在计算时间间隔内采样一次或多次采样,再进行曲线拟合。
在本发明的一个实施例中,在估计代谢通量时,通过求导数、线性规划、二次规划的优化算法求得最优代谢通量。
在本发明的一个实施例中,建立生物发酵过程监测模型包括:将生产过程变量和细胞内代谢通量合并构成扩展样品数据集;对样品数据集进行标准化处理生成标准样品数据集;利用主元分析建立监测模型;确定监测统计指标的控制限。
在本发明的一个实施例中,在扩展样品数据集时,所述细胞内代谢通量选取全部代谢通量或胞内外交换代谢通量或内部代谢通量。
在本发明的一个实施例中,所述运行状况在线监测包括:采集当前批次当前时刻的胞外代谢物浓度和生产过程变量;由胞外代谢物浓度估计获得的代谢通量;将生产过程变量与代谢通量合并构成测试数据集;对测试数据集进行标准化处理生成测试标准数据集;预估填充未来时刻的测试数据;计算统计标准,并与统计量控制限比较。
在本发明的一个实施例中,预估填充未来时刻的测试数据的方法包括直接用前若干批次对应时刻的均值数据、或考虑本批次当前及过去时刻实际数据与对应均值数据之差,预估填充未来数据。
本发明的上述技术方案相比现有技术具有以下优点:
本发明所述的利用细胞代谢网络监测生物制造过程的方法,在多批次生产过程数据基础上,利用细胞代谢网络和胞外可观测代谢物浓度,通过估计细胞代谢通量,将代谢通量与生产过程变量结合,构建扩展样本数据集,给出一种在线监测过程运行状况的方法,该方法既利用微生物制造过程可检测或可观测信息,又充分挖掘细胞生长繁殖过程中不可检测的胞内代谢信息,能够更加有效的实施对生产制造过程运行状况评估及故障监测,能够及时发现过程运行中的异常,以便做出相应的控制措施,对于减少安全隐患、提高企业综合效益具有明显的作用。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
图1是本发明利用细胞代谢网络监测生物制造过程的方法步骤图;
图2是本发明利用细胞代谢网络监测生物制造过程的方法流程示意图;
图3青霉素发酵过程部分可观测代谢物浓度计算结果。
图4青霉素发酵过程部分代谢通量动态估计。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
参照图1所示,本发明的利用细胞代谢网络监测生物制造过程的方法,包括如下步骤:基于代谢网络进行通量均衡分析,得到反映细胞生长与繁殖过程的代谢通量;将细胞内代谢通量与生产过程变量一起构成训练数据集,建立生物发酵过程监测模型及统计量控制限;基于监测模型,利用实时采集的生产过程变量和代谢通量计算值进行运行状况在线监测;在多批次生产过程数据基础上,利用细胞代谢网络和胞外可观测代谢物浓度,通过估计细胞代谢通量,将代谢通量与生产过程变量结合,构建扩展样本数据集,给出一种在线监测过程运行状况的方法,该方法既利用微生物制造过程可检测或可观测信息,又充分挖掘细胞生长繁殖过程中不可检测的胞内代谢信息,能够更加有效的实施对生产制造过程运行状况评估及故障监测,能够及时发现过程运行中的异常,以便做出相应的控制措施,对于减少安全隐患、提高企业综合效益具有明显的作用。
参照图2所示,所述通量均衡分析过程包括:建立通量均衡方程;建立胞外代谢物浓度与代谢通量的动态关系;根据多批次胞外代谢物浓度采样值估计代谢通量;建立生物发酵过程监测模型包括:将生产过程变量和细胞内代谢通量合并构成扩展样品数据集;对样品数据集进行标准化处理生成标准样品数据集;利用主元分析建立监测模型;确定监测统计指标的控制限;所述运行状况在线监测包括:采集当前批次当前时刻的胞外代谢物浓度和生产过程变量;由胞外代谢物浓度估计获得的代谢通量;将生产过程变量与代谢通量合并构成测试数据集;对测试数据集进行标准化处理生成测试标准数据集;预估填充未来时刻的测试数据;计算统计标准,并与统计量控制限比较。
建立通量均衡方程:
微生物发酵过程中胞内代谢物的净积累或消耗速率远小于胞内外代谢物之间的交换反应速率,对于一个总化学反应个数为F并且包含了m个胞内代谢物和R个胞外可测代谢物的代谢网络,其通量均衡方程如下:
其中,CR,t∈RR表示R个可测的胞外代谢物在t时刻浓度向量,SR∈RR×F表示胞外可测代谢物的化学计量矩阵,Vt∈RF表示代谢网络内代谢通量向量,包括胞内代谢通量及胞内外交换通量,Sm∈Rm×F表示m个胞内代谢物的化学计量矩阵。
微生物代谢网络中化学反应个数F多于细胞内代谢物数量m,其自由度d=F-rank(Sm),采用一组独立通量ut∈Rd的线性组合表示代谢通量,即Vt=K·ut,其中K∈RF×d表示Sm零空间的一组标准正交基,ut称为自由通量。
代谢通量的瞬态特征描述:
考虑代谢通量Vt随时间变化,引入计算时间序列点tD,D=1,...,Z,用以描述分析Vt的动态变化,即将整个生产过程划分为Z-1个时间间隔,在每个时间间隔内,即在相邻两个时间点tD和tD+1之间,假设代谢通量按一定函数规律变化,可以是常数、线性函数、二次型函数。选用线性函数后的代谢通量Vt表示如下:
其中,uD表示第D个计算时刻的自由通量,k(t,tD)是各时间间隔内代谢通量线性变化的系数函数,按表1选取。
表1
基于代谢通量的胞外代谢物浓度计算:
将式(2)代入式(1),得:
对式(3)两边积分得:
生产过程中实际采样观测时间点为t′n,n=1,...,N,根据式(4),第r个胞外代谢物,r=1,...,R,在实际采样时刻t′n的浓度计算值为:
其中,Cr,0表示第r个胞外代谢物初始浓度值。
采样点可以根据生产实际来选取,简单操作是在代谢通量Vt的每个计算时间间隔内进行一次采样观测,即Z=N-1,也可以在计算时间间隔内进行多次采样;一般情形下代谢通量Vt的第一个和最后一个计算时间点应分别对应于实际采样观测的初始和最终时刻。
各采样时刻的代谢通量估计:
在采样观测时间点t′n,各胞外代谢物的实际采样值为C′r,n,则浓度计算值与采样值的偏差为:
建立运行状况监测模型及指标:
扩展样本数据集
生产中已有的I个正常批次数据,其中第i批次生产变量(包括温度、pH通风率、搅拌功率、底物流加速率等)数据矩阵为Xi∈RN×O,i=1,...,I,N为采样观测点数,O为生产变量数。根据估计所得的代谢通量Vt,选取其中全部或部分代谢通量,若选取L个胞内外交换代谢通量在第i批次的数据构成集合Yi∈RN×L,则该批次的生产变量数据与胞内外交换代谢通量合并构成扩展样本数据集Gi=[Xi,Yi]T∈RN×H,其中H=O+L。全部I个批次的发酵过程扩展样本数据集则为按批次方向展开得G∈RI×N·H。
数据集的标准化处理
将扩展样本数据集标准化变换为均值为0、方差为1的标准训练数据集,近似服从多维正态分布:
其中,mean(G)为G中同一时刻各个批次同一变量的均值,即多批次正常操作下的平均运行轨迹,std(G)是G中同一时刻各个批次同一变量的标准差。
监测模型及控制限的求取
构造标准数据集Gtrain的协方差矩阵利用主元分析建立监测模型,先求取其特征值及其特征向量,按累计方差贡献率从大到小,选取A个主元特征值所对应的特征向量q1,…,qA,构成载荷矩阵进而计算Gtrain的各批次得分向量和残差向量,全部I批次得分向量和残差向量分别构成得分矩阵和残差矩阵,据此求取常用的T2控制限和SPE控制限。
在线实时运行状况监测:
当前时刻数据处理
采集生产过程当前时刻n的生产变量数据Xtest,n∈Rn×O,通过估计获得的代谢通量Ytestn∈Rn×L,将生产变量和代谢通量合并得到测试数据集Gtest,n∈Rn×H;以训练数据集中相应时刻的平均值和标准差对Gtest,n∈Rn×H进行标准化处理。
未来时刻数据估计
当前时刻之后的n+1至批次结束N时刻的数据,采用预估的方法进行填充,用标准化的Gtest,n中第n时刻数据值进行填充,得到G′test,n∈RN×H,再按时间方向展开为G″test,n∈R1 ×N·H。也可以直接用前若干批次对应时刻的均值数据,或考虑当前及过去时刻实际数据与对应均值数据之差,预估填充未来数据。
计算当前时刻T2统计量和SPE统计量
根据标准训练数据集Gtrain的载荷矩阵Q计算当前n时刻得分向量ttest,n和残差向量etest,n:
ttest,n=Gtest,n·Q
Gnew,n=ttest,n·QT (8)
etest,n=G″test,n-Gnew,n
按下式计算n时刻T2统计量和SPE统计量:
其中,Ψ∈RA×A是由Gtrain的第i批次得分向量中各个元素构成的对角矩阵。
过程运行状况监测
若T2和SPEn低于统计量控制限,则过程运行正常;否则预警过程有异常或故障。
为了验证本实施例的利用细胞代谢网络监测生物制造过程的方法的效果,将方法应用于青霉素生产过程运行监测:
青霉素发酵代谢网络共包含66个代谢通量(其中胞内外交换通量5个)和49种胞内代谢物,葡萄糖、青霉素、菌体生物质、氧气及二氧化碳等5种胞外代谢物可检测,考虑反应温度、pH值、通风率、搅拌功率、底物流加速率和冷却水流加速率等生产工艺变量和胞内外交换代谢通量共11个,选取30批次、每批次800采样点,形成扩展样本数据集。
按本发明方法完成代谢通量的胞外代谢物浓度计算和各采样时刻的代谢通量估计,图3给出胞内外交换代谢通量的估计值,由此扩展样本数据集不仅包含了生物发酵过程可检测的生产工艺变量信息,也包含了细胞内部不可测的代谢信息,更全面地反映生产过程特征。
针对青霉素发酵过程由通风、搅拌及底物流加引起的典型故障,图4给出了本发明在线监测结果:
其中(a)表示的过程监测只采用了生产工艺变量,而(b)则同时结合代谢网络信息。从T2监测图中可以发现,当故障发生时,本发明所提出的方法能够及时准确地监测故障,而基于生产变量监测有一定时间滞后。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (7)
1.一种利用细胞代谢网络监测生物制造过程的方法,其特征在于:包括如下步骤:
基于代谢网络进行通量均衡分析,得到反映细胞生长与繁殖过程的代谢通量;
将细胞内代谢通量与生产过程变量一起构成训练数据集,建立生物发酵过程监测模型及统计量控制限:将生产过程变量和细胞内代谢通量合并构成扩展样品数据集;对样品数据集进行标准化处理生成标准样品数据集;利用主元分析建立监测模型;确定监测统计指标的控制限;
其中,扩展样本数据集包括生产已有的i个正常批次数据,其中第i批次生产变量数据矩阵为,,N为采样观测点数,O为生产变量数;根据估计所得的代谢通量,选取其中全部或部分代谢通量,若选取L个胞内外交换代谢通量在第批次的数据构成集合,则该批次的生产变量数据与胞内外交换代谢通量合并构成扩展样本数据集,其中;全部i个批次的发酵过程扩展样本数据集则为,按批次方向展开得;
数据集的标准化处理包括将扩展样本数据集标准化变换为均值为0、方差为1的标准训练数据集,近似服从多维正态分布:
其中,mean(G)为G中同一时刻各个批次同一变量的均值,即多批次正常操作下的平均运行轨迹,std(G)是G中同一时刻各个批次同一变量的标准差;
监测模型及控制限的求取包括构造标准数据集的协方差矩阵,利用主元分析建立监测模型,先求取其特征值及其特征向量,按累计方差贡献率从大到小,选取个主元特征值所对应的特征向量,构成载荷矩阵,进而计算的各批次得分向量和残差向量,全部i批次得分向量和残差向量分别构成得分矩阵和残差矩阵,据此求取控制限和SPE控制限;
基于监测模型,利用实时采集的生产过程变量和代谢通量计算值进行运行状况在线监测。
2.根据权利要求1所述的利用细胞代谢网络监测生物制造过程的方法,其特征在于:所述通量均衡分析过程包括:建立通量均衡方程;建立胞外代谢物浓度与代谢通量的动态关系;根据多批次胞外代谢物浓度采样值估计代谢通量。
3.根据权利要求2所述的利用细胞代谢网络监测生物制造过程的方法,其特征在于:所述代谢通量随时间变化,采集相邻两个时间点之间的代谢通量根据代谢通量的变化规律对代谢通量进行瞬态特征描述,包括常数、线性函数、二次函数。
4.根据权利要求2所述的利用细胞代谢网络监测生物制造过程的方法,其特征在于:多批次胞外代谢物浓度采样值根据生产实际来选取,在计算时间间隔内采样一次或多次采样,再进行曲线拟合。
5.根据权利要求2所述的利用细胞代谢网络监测生物制造过程的方法,其特征在于:在估计代谢通量时,通过求导数、线性规划、二次规划的优化算法求得最优代谢通量。
6.根据权利要求1所述的利用细胞代谢网络监测生物制造过程的方法,其特征在于:所述运行状况在线监测包括:采集当前批次当前时刻的胞外代谢物浓度和生产过程变量;由胞外代谢物浓度估计获得的代谢通量;将生产过程变量与代谢通量合并构成测试数据集;对测试数据集进行标准化处理生成测试标准数据集;预估填充未来时刻的测试数据;计算统计标准,并与统计量控制限比较。
7.根据权利要求6所述的利用细胞代谢网络监测生物制造过程的方法,其特征在于:预估填充未来时刻的测试数据的方法包括直接用前若干批次对应时刻的均值数据、或考虑本批次当前及过去时刻实际数据与对应均值数据之差,预估填充未来数据。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110950873.9A CN113838530B (zh) | 2021-08-18 | 2021-08-18 | 利用细胞代谢网络监测生物制造过程的方法 |
PCT/CN2022/073490 WO2023019883A1 (zh) | 2021-08-18 | 2022-01-24 | 利用细胞代谢网络监测生物制造过程的方法 |
US18/396,157 US20240273262A1 (en) | 2021-08-18 | 2023-12-26 | Method for monitoring biomanufacturing process using metabolic network of cells |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110950873.9A CN113838530B (zh) | 2021-08-18 | 2021-08-18 | 利用细胞代谢网络监测生物制造过程的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113838530A CN113838530A (zh) | 2021-12-24 |
CN113838530B true CN113838530B (zh) | 2022-07-15 |
Family
ID=78960867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110950873.9A Active CN113838530B (zh) | 2021-08-18 | 2021-08-18 | 利用细胞代谢网络监测生物制造过程的方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240273262A1 (zh) |
CN (1) | CN113838530B (zh) |
WO (1) | WO2023019883A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113838530B (zh) * | 2021-08-18 | 2022-07-15 | 江南大学 | 利用细胞代谢网络监测生物制造过程的方法 |
CN116798521B (zh) * | 2023-07-19 | 2024-02-23 | 广东美赛尔细胞生物科技有限公司 | 免疫细胞培养控制系统的异常监测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111210867A (zh) * | 2020-02-10 | 2020-05-29 | 江南大学 | 基于代谢分析及酶调控的微生物生长状态估计方法 |
CN111341382A (zh) * | 2020-02-20 | 2020-06-26 | 江南大学 | 赖氨酸生物制造中宏观动力学与细胞代谢通量耦合建模方法 |
CN112119306A (zh) * | 2017-12-29 | 2020-12-22 | 豪夫迈·罗氏有限公司 | 细胞培养物的代谢状态的预测 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3514797B1 (en) * | 2018-01-18 | 2024-04-17 | Tata Consultancy Services Limited | Method and system for analyzing metabolic state of a cell by measuring concentrations of metabolites |
CN113838530B (zh) * | 2021-08-18 | 2022-07-15 | 江南大学 | 利用细胞代谢网络监测生物制造过程的方法 |
-
2021
- 2021-08-18 CN CN202110950873.9A patent/CN113838530B/zh active Active
-
2022
- 2022-01-24 WO PCT/CN2022/073490 patent/WO2023019883A1/zh active Application Filing
-
2023
- 2023-12-26 US US18/396,157 patent/US20240273262A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112119306A (zh) * | 2017-12-29 | 2020-12-22 | 豪夫迈·罗氏有限公司 | 细胞培养物的代谢状态的预测 |
CN111210867A (zh) * | 2020-02-10 | 2020-05-29 | 江南大学 | 基于代谢分析及酶调控的微生物生长状态估计方法 |
CN111341382A (zh) * | 2020-02-20 | 2020-06-26 | 江南大学 | 赖氨酸生物制造中宏观动力学与细胞代谢通量耦合建模方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113838530A (zh) | 2021-12-24 |
US20240273262A1 (en) | 2024-08-15 |
WO2023019883A1 (zh) | 2023-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11795516B2 (en) | Computer-implemented method, computer program product and hybrid system for cell metabolism state observer | |
CN112119306B (zh) | 细胞培养物的代谢状态的预测 | |
CN113838530B (zh) | 利用细胞代谢网络监测生物制造过程的方法 | |
US20200202051A1 (en) | Method for Predicting Outcome of an Modelling of a Process in a Bioreactor | |
Said et al. | Machine learning technique for data-driven fault detection of nonlinear processes | |
González-Martínez et al. | Real-time synchronization of batch trajectories for on-line multivariate statistical process control using dynamic time warping | |
CN101964021B (zh) | 基于递归核主元分析的青霉素发酵过程故障监测方法 | |
US20230323275A1 (en) | Monitoring and control of bioprocesses | |
EP4116403A1 (en) | Monitoring, simulation and control of bioprocesses | |
KR20220032599A (ko) | 세포 배양 프로세스에서 프로세스 변수를 결정하기 위한 방법 | |
CN109144039A (zh) | 一种基于时序扩展和邻域保持极限学习机的间歇过程故障检测方法 | |
CN110046377A (zh) | 一种基于异构相似度的选择性集成即时学习软测量建模方法 | |
CN115407753A (zh) | 一种多变量加权集成学习的工业故障诊断方法 | |
CN115472233A (zh) | 基于热扩散标签传播的半监督集成工业过程软测量建模方法、系统 | |
CN113707240A (zh) | 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法 | |
CN116738866B (zh) | 一种基于时间序列特征提取的即时学习的软测量建模方法 | |
CN116776252A (zh) | 一种改进Mallow's Cp变量选择的工业过程软测量方法和系统 | |
Hebing et al. | Efficient generation of models of fed-batch fermentations for process design and control | |
Li et al. | Online Monitoring of Penicillin Manufacture Based on Production Variables and Metabolic Fluxes | |
CN111145838B (zh) | 基于多向数据模型的青霉素发酵过程迭代学习卡尔曼滤波方法 | |
Žáčeková et al. | Dual control approach for zone model predictive control | |
Gao et al. | DMFA-based operation model for fermentation processes | |
CN116030904A (zh) | 微生物发酵过程生物酶浓度的预报方法和系统 | |
Pratik | Degradation Predictions of Proton Exchange Membrane Fuel Cells in Automotive Industries | |
CN118350600A (zh) | 基于混合模型和多变量分析的供热负荷预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |