CN110348090B - 基于人工神经网络实现多柱连续流层析设计及分析的方法 - Google Patents

基于人工神经网络实现多柱连续流层析设计及分析的方法 Download PDF

Info

Publication number
CN110348090B
CN110348090B CN201910573256.4A CN201910573256A CN110348090B CN 110348090 B CN110348090 B CN 110348090B CN 201910573256 A CN201910573256 A CN 201910573256A CN 110348090 B CN110348090 B CN 110348090B
Authority
CN
China
Prior art keywords
continuous flow
neural network
artificial neural
flow chromatography
penetration curve
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910573256.4A
Other languages
English (en)
Other versions
CN110348090A (zh
Inventor
林东强
史策
姚善泾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910573256.4A priority Critical patent/CN110348090B/zh
Priority to US17/623,403 priority patent/US20220381751A1/en
Priority to PCT/CN2019/104488 priority patent/WO2020258515A1/zh
Publication of CN110348090A publication Critical patent/CN110348090A/zh
Application granted granted Critical
Publication of CN110348090B publication Critical patent/CN110348090B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Treatment Of Liquids With Adsorbents In General (AREA)

Abstract

本发明公开了一种基于人工神经网络实现多柱连续流层析设计及分析的方法,包括:步骤1,第一人工神经网络训练,以穿透曲线数据集为输入,机理模型参数集为输出,训练得到第一人工神经网络;步骤2,第二人工神经网络训练,以机理模型参数集为输入,穿透曲线数据集为输出,训练得到第二人工神经网络;步骤3,采用第一人工神经网络进行穿透曲线拟合;步骤4,采用第二人工神经网络进行穿透曲线预测;步骤5,连续流层析的过程分析,将穿透曲线和连续流操作参数代入连续流层析模型,得到过程产率和介质利用度;步骤6,连续流层析的操作空间优化,基于特定分离目标,确定合适的过程产率和介质利用度,得到优化的连续流层析设计参数的操作空间。

Description

基于人工神经网络实现多柱连续流层析设计及分析的方法
技术领域
本发明涉及生物化工和生物工程领域的蛋白层析分离技术,具体涉及一种基于人工神经网络实现多柱连续流层析设计及分析的方法。
背景技术
连续制造工艺在石油化工、食品及化学工业中已得到广泛的应用,但是在生物技术领域,连续生产技术起步较晚,技术上不够成熟。近年来,一种新型的连续层析分离技术-多柱周期性逆流层析(multi-column periodic counter-current chromatography),又称连续流层析,被成功应用于蛋白分离,特别是抗体药物生产的蛋白A亲和捕获过程。传统的抗体下游分离过程为基于蛋白A亲和捕获的三步批次层析工艺,其过程效率有限,难以匹配快速增长的上游细胞培养过程产率。另一方面,蛋白A亲和介质价格昂贵,传统批次层析的介质利用度仅60%左右,有必要提高蛋白A亲和介质的利用度,降低介质成本。
连续流层析基本原理是通过双柱串联上样,使用第二根层析柱承接第一根层析柱穿透的蛋白,第一根层析柱在合适的穿透点终止上样,切换至第二根层析柱上样,第一根层析柱则进行洗脱和再生,多柱交替实现连续操作,从而提高过程产率和介质利用度,减少缓冲液消耗和设备规模。专利(US Patent 10099156 B2)描述了一种双柱串联上样的蛋白捕获方式。专利(US Patent 2012/0091063 A1)提出了一种三柱连续流设备,并将其应用于含有单克隆抗体和牛血清白蛋白的混合物分离。专利(US Patent 2017/0016864 A1)提出了多柱连续流蛋白捕获方式,其包括双柱和三柱的串联上样,并对过程进行了实验优化。整体而言,多柱连续流层析过程复杂,可选择操作参数多,实验优化的工作量极大,若借助数学模型进行合理的过程表征和辅助设计,可以显著提高过程设计和优化的效率,减少实验摸索。虽然已有成熟的数学方法可以针对层析实验的穿透曲线进行拟合和预测,如BaurDaniel等(Biotechnol.J,2016,11:920-931)结合一般性速率模型(General rate model)和缩核模型(Shrinking core model),对实验穿透曲线进行拟合得到机理参数,然后预测多流速和多浓度下的穿透曲线,从而辅助进行层析过程优化设计,但是求解偏微分方程组需要花费较长的时间,精度要求越高,所需计算时间就越长。不利于大范围的多参数优化和过程的快速设计和分析。
人工神经网络系统出现于20世纪40年代,由众多可调连接权值的神经元连接而成,具有大规模并行处理、分布式信息存储和自组织自学习等能力。。目前,人工神经网络用于层析分离过程分析,已从简单的模式识别发展为基于机理模型的网络预测,如专利(USPatent 5,121,443;EP0395481A2)报道了使用神经网络去除噪声干扰,识别和拆分叠加色谱峰,并对色谱峰各项性质(如保留时间、峰宽等)进行表征。Du等(J.Chromatogr.A,2007,1145:165-174)提出可以使用人工神经网络预测蛋白吸附的穿透曲线。Wang等(J.Chromatogr.A,2017,1487:211-217)提出可以将机理模型参数代入机理模型产生训练集,训练神经网络,以代替计算过程繁琐复杂的机理模型,并对离子交换层析峰型进行拟合。上述专利及论文中使用的神经网络结构简单,功能相对单一,在实际应用中仍然存在许多限制,且难以满足复杂的过程设计和大范围的参数优化要求。鉴于连续流层析过程的复杂性,需要对训练数据集选取进行重新规划,以满足过程设计和分析的需求。
发明内容
鉴于以上存在的技术问题,本发明用于提供一种基于人工神经网络实现多柱连续流层析设计及分析的方法,旨在快速对实验产生的穿透曲线进行拟合和预测,并基于连续流层析中多个控制参数分析其对过程产率和介质利用度的影响,结合机理模型和人工神经网络各自的优点,形成高效综合的系统模型,辅助进行多柱连续流层析的过程分析和优化设计。
为解决上述技术问题,本发明采用如下的技术方案:
一种基于人工神经网络实现多柱连续流层析设计及分析的方法,包括以下步骤:
步骤1,第一人工神经网络训练,采用机理模型和实验方法建立层析穿透曲线数据集和机理模型参数集,以穿透曲线数据集为输入,机理模型参数集为输出,训练得到第一人工神经网络;
步骤2,第二人工神经网络训练,采用机理模型和实验方法建立层析穿透曲线数据集和机理模型参数集,以机理模型参数集为输入,穿透曲线数据集为输出,训练得到第二人工神经网络;
步骤3,穿透曲线拟合,将实验所得穿透曲线进行线性插值,得到穿透曲线的特征点,将特征点和实验操作参数作为输入代入第一人工神经网络,拟合计算得到机理模型参数;
步骤4,穿透曲线预测,将步骤3得到的机理模型参数代入第二人工神经网络,依据层析参数预测范围,得到不同流速与不同蛋白浓度的穿透曲线,并和穿透曲线实验数据进行比较,若误差大于5%,则重新进行第一人工神经网络训练和第二人工神经网络训练,并重新进行步骤3和步骤4;
步骤5,连续流层析的过程分析,将步骤4预测的穿透曲线和连续流基本操作参数代入连续流层析模型,得到连续流层析过程的设计参数和评估参数,分析连续流层析操作参数变化对多柱连续流层析的过程产率和介质利用度等性能指标的影响;
步骤6,连续流层析的操作空间优化,基于特定的分离目标和要求,确定合适的过程产率和介质利用度,通过步骤5的分析,得到优化的连续流层析操作空间。
优选地,步骤1的第一人工神经网络训练训练和步骤3的穿透曲线拟合进一步包括如下步骤:
产生一定范围内随机分布的若干层析机理模型参数集,代入机理模型方程,利用正交配置法产生穿透曲线数据集,或通过实验得到机理模型参数对应的穿透曲线数据集;
对穿透曲线上的特征点进行提取和归一化处理,确定神经元节点数和网络层数,使用穿透曲线特征点和机理模型参数分别作为输入集和输出集,训练人工神经网络,记为第一人工神经网络;
将实验所得穿透曲线数据进行线性插值,得到穿透曲线特征点,代入已训练好的第一人工神经网络进行计算,得到机理模型中的特征模型参数。
优选地,步骤2的第二人工神经网络训练训练和步骤4的穿透曲线预测进一步包括如下步骤:
产生一定范围内随机分布的若干层析机理模型参数集,代入机理模型方程,利用正交配置法产生穿透曲线数据集,或通过实验得到机理模型参数对应的穿透曲线数据集;
对穿透曲线上的特征点进行提取和归一化处理,确定神经元节点数和网络层数,使用机理模型参数和穿透曲线特征点分别作为输入集与输出集,训练神经网络,记为第二人工神经网络;
在一定的保留时间和蛋白浓度范围之内产生层析操作参数矩阵,与机理模型参数合并,代入已训练好的第二人工神经网络进行计算,预测得到不同层析操作条件下的穿透曲线。
优选地,步骤4中重新进行第一人工神经网络训练和第二人工神经网络训练过程为:使用机理模型对实验穿透曲线进行拟合,得到该实验条件下的机理模型参数,在该机理模型参数±30%区间内随机生成新的机理模型参数集,代入机理模型中得到新的穿透曲线集,将新的穿透曲线集合并入原先的穿透曲线数据库中,分别对重新进行第一人工神经网络训练和第二人工神经网络训练。
优选地,所述的连续流层析的过程分析包括如下步骤:
将预测的穿透曲线特征点和连续流层析基本操作参数,代入连续流层析模型中,得到连续流层析过程的设计参数与流程安排方案;
评估参数计算步骤,将所得的连续流层析的过程设计参数与流程安排方案代入所述连续流层析的评估模型,计算得到多柱连续流层析的过程产率和介质利用度。
优选地,连续流层析的操作空间优化包括如下步骤:
基于连续流层析的设计参数范围,生成参数矩阵,对矩阵内的所有参数点计算过程产率,得到过程产率矩阵,对矩阵进行线性插值,绘制在不同操作条件的过程产率分布图,用于连续流层析过程分析和优化;
基于连续流层析的设计参数范围,生成参数矩阵,对矩阵内的所有参数点计算介质利用度,得到介质利用度矩阵,对矩阵进行线性插值后,绘制在不同操作条件的介质利用度分布图,用于连续流层析过程分析和优化;
基于特定的分离目标,在过程产率分布图和介质利用度分布图中分别计算满足分离目标的连续流层析设计参数范围,将两个图的设计参数区域进行叠加,得到同时满足过程产率和介质利用度要求的连续流层析设计参数,并计算连续流层析过程的操作参数与流程安排方案。
优选地,所述的层析机理模型为考虑平行扩散的一般性速率模型。
优选地,所述的连续流层析模型为根据不同操作模式建立的连续流设计模型,连续流层析的评估参数主要包括过程产率和介质利用度,其中不同操作模式包括二柱、三柱、四柱、N柱,N>4。
采用本发明具有如下的有益效果:
(1)采用通用的层析机理模型生成人工神经网络的训练集和测试集,大量减少实验工作量,增加人工神经网络的可靠性;
(2)采用人工神经网络代替机理模型进行穿透曲线的拟合和预测,在保持计算精度的情况下,加快了运算速度,有利于大范围的参数分析和优化;
(3)使用机理模型和神经网络相互嵌套的方式进行拟合和预测,降低了神经网络的训练难度,增加了计算结果的可信度;
(4)使用过程中可自行检测拟合效果,发现误差较大则利用机理模型生成新的训练集,重新训练神经网络,形成智能化自学习系统;
(5)针对不同模式的连续流层析过程,包括二柱、三柱、四柱和N柱(N>4),提出各自的过程操作参数和设计参数,可实现不同多柱连续流层析模式的综合分析;
(6)基于神经网络的计算能力,可系统分析多个操作参数和设计参数变化对连续流层析分离性能的影响,得到过程产率分布图和介质利用度分布图,从而合理设计连续流层析操作的优化空间。
附图说明
图1为本发明实施例的基于人工神经网络实现多柱连续流层析设计及分析的方法的步骤示意图;
图2为本发明的实例1中第一人工神经网络训练的穿透曲线示意图;
图3为本发明的实例1中穿透曲线特征点和第一人工神经网络拟合结果比较;
图4为本发明的实例2中两条穿透曲线示意图;
图5为本发明的实例2中第二人工神经网络预测的穿透曲线特征点和实验穿透曲线对比;
图6为本发明的实例3中双柱连续流层析的过程产率分布图;
图7为本发明的实例3中双柱连续流层析的介质利用度分布图;
图8为本发明的实例3中根据分离目标得到的连续流层析操作空间示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
参照图1,本发明实施例公开了一种基于人工神经网络实现多柱连续流层析设计及分析的方法,具体包括以下步骤:
步骤1,第一人工神经网络训练,用于采用机理模型和实验方法建立层析穿透曲线数据集和机理模型参数集,以穿透曲线数据集为输入,机理模型参数集为输出,训练得到第一人工神经网络;
步骤2,第二人工神经网络训练,用于采用机理模型和实验方法建立层析穿透曲线数据集和机理模型参数集,以机理模型参数集为输入,穿透曲线数据集为输出,训练得到第二人工神经网络;
步骤3,穿透曲线拟合,用于将实验所得穿透曲线进行线性插值,得到穿透曲线的特征点,将特征点和实验操作参数作为输入代入第一人工神经网络,拟合计算得到机理模型参数;
步骤4,穿透曲线预测,用于将步骤3得到的机理模型参数代入第二人工神经网络,依据层析参数预测范围,得到不同流速与不同蛋白浓度的穿透曲线,并和穿透曲线实验数据进行比较,若误差大于5%,则重新进行第一人工神经网络训练和第二人工神经网络训练,并重新进行步骤3和步骤4;
步骤5,连续流层析的过程分析,用于将步骤4预测的穿透曲线和连续流基本操作参数代入连续流层析模型,得到连续流层析过程的设计参数和评估参数,分析连续流层析操作参数变化对多柱连续流层析的过程产率和介质利用度等性能指标的影响;
步骤6,连续流层析的操作空间优化,用于基于特定的分离目标和要求,确定合适的过程产率和介质利用度,通过步骤5的分析,得到优化的连续流层析设计参数的操作空间。
为了使本发明实施例的具体实施过程能得到更好的理解,以下将对以上步骤实施的具体过程进行进一步的具体描述。
具体应用实例中,层析机理模型为考虑平行扩散的一般性速率模型,其方程如下:
Figure GDA0002956701720000081
Figure GDA0002956701720000082
其中:c为层析柱内蛋白浓度,单位为mg/mL;cp为介质颗粒内蛋白浓度,单位为mg/mL;c0为上样蛋白浓度,单位为mg/mL;t为时间,单位为s;Dax为柱内轴向扩散系数,单位为m2/s;x为柱内轴向距离,单位为m;u为空塔流速,单位为mL/min;ε为柱内的空隙率;εp为颗粒内的孔隙率;kf为液膜传质系数,单位为m/s;r为颗粒内的径向距离,单位为m;rp为颗粒半径,单位为m;q为固相蛋白浓度,单位为mg/mL;Dp为颗粒内液相扩散系数,单位为m2/s;Ds为颗粒内固相扩散系数,单位为m2/s;L为柱长,单位为m。
上述方程的边界条件为:
在t=0时,c=0,cp=0;
在x=0处,
Figure GDA0002956701720000083
在x=L处,
Figure GDA0002956701720000084
在r=0处,
Figure GDA0002956701720000085
在r=rp处,
Figure GDA0002956701720000086
所用的蛋白吸附模型为Langmuir吸附等温线模型,其方程如下:
Figure GDA0002956701720000087
其中:Qmax为饱和吸附量,单位为mg/mL;kd为解离平衡常数,单位为mg/mL。
具体应用实例中,在连续流层析设计模型的选取上,根据不同的连续流层析操作模式,例如二柱、三柱、四柱、N柱(N>4)柱,建立不同的连续流设计模型,求取过程操作参数与流程安排方案。
(1)当为二柱连续流层析操作模式时,其关键操作参数有连接模式的上样时间和断模式的上样流速,计算方法如下:
Figure GDA0002956701720000091
Figure GDA0002956701720000092
其中:TC为连接模式的上样时间,单位为min;UDC代表断开模式的上样流速,单位为mL/min;c0为蛋白上样浓度,单位为mg/L;TDC为断开模式的上样时间,单位为min;UC为连接模式的上样流速,单位为mL/min;T1_1%为一柱1%穿透点时间,单位为min;T1_s%为一柱s%穿透点时间,单位为min;T2_1%为二柱1%穿透点时间,单位为min;SF为安全因子。
(2)当为三柱连续流层析操作模式时,其关键操作参数有连接模式的上样时间和等待时间,计算方法如下:
Figure GDA0002956701720000093
Twait=TC-TRR,若TC>TRR
Twait=2(TRR-TC),若TRR>TC
其中:TCW代表连接模式的清洗时间,单位为min;Twait为等待时间,单位为min;TRR为洗脱清洗再生的总时间,单位为min;T1_1%′为双柱串联上样时前柱1%穿透点时间,单位为min;T1_s%′为双柱串联上样时前柱s%穿透点时间,单位为min;T2_1%′为双柱串联上样时后柱1%穿透点时间,单位为min。
(3)当为四柱连续流层析操作模式时,其关键操作参照有连接模式的上样时间和等待时间,其中连接模式的上样时间与三柱计算方法相同,等待时间计算方法如下:
Twait=2TC-TRR+TCW,若TC>(TRR-TCW)/2
Twait=2(TRR-2TC-TCW),若(TRR-TCW)/2>TC
(4)当为N(N>4)柱连续流层析操作模式时,关键操作参数包括柱数、连接模式的上样时间和等待时间,其中连接模式的上样时间与三柱计算方法相同,柱数与等待时间计算方法如下:
Figure GDA0002956701720000101
Twait=(N-2)TC+(N-3)TCW-TRR
其中符号
Figure GDA0002956701720000102
为向上取整。
具体应用实例中,对于连续流层析评估模型,评估参数主要包括过程产率和介质利用度,过程产率的计算公式如下:
Figure GDA0002956701720000103
其中PC为连续流层析的过程产率,单位为g/L/min;UC为连接模式的上样流速,单位为mL/min;TDC为断开模式的上样时间,单位为min;CV为柱体积,单位为mL;Tcycle为运行一个循环回到初始状态所需要的总时间,单位为min。
介质利用度计算公式如下:
Figure GDA0002956701720000104
其中CUC为连续流层析的介质利用度,单位为%;T1_95%为一柱95%穿透时间点,单位为min。
通过以上设置的模型和参数,步骤1中,第一人工神经网络的训练和应用主要包括以下:
(1)机理模型参数集和穿透曲线数据集:
一种实施方式中,依据层析机理模型,模型参数包括传质相关参数(包括轴向扩散系数、液膜传质系数、颗粒内固相传质系数和颗粒内液相传质系数等)、吸附相关参数(包括饱和吸附量和解离平衡常数等)和操作相关参数(包括空塔流速与上样浓度等),将上述每一个参数均在80%范围内生产一个随机数,将这些随机数按照一定顺序排列产生机理模型参数矩阵,从而形成100-10000组机理模型参数矩阵;将每组参数代入机理模型中,利用正交配置法得到对应的穿透曲线;重复上述步骤,即可得到机理模型参数集和对应的穿透曲线数据集。
另一种实施方式中,利用实验的方法,选择不同的介质和操作参数进行单柱的蛋白穿透实验,实验参数包括空塔流速、上样浓度、饱和吸附量、解离平衡常数,其中饱和吸附量和解离平衡常数通过静态吸附实验得到,进行100-10000实验,得到机理模型参数集和对应的穿透曲线数据集。
(2)第一人工神经网络训练:选取穿透曲线数据集中穿透曲线上的特征点,即达到10%-90%穿透点的上样时间,对特征点进行归一化处理,以穿透曲线的特征点为输入集,对应的机理模型参数作为输出集,训练人工神经网络,记为第一人工神经网络。
(3)第一人工神经网络应用:将实验所得穿透曲线数据进行线性插值,得到穿透曲线的特征点,代入已训练好的第一人工神经网络进行计算,可得到机理模型中对应的模型参数。
具体应用实例中,通过设定的参数和模型,步骤2中,对于第二人工神经网络的训练和应用主要包括以下:
(1)机理模型参数集和穿透曲线数据集:
一种实施方式中,依据层析机理模型,模型参数包括传质相关参数(包括轴向扩散系数、液膜传质系数、颗粒内固相传质系数和颗粒内液相传质系数等)、吸附相关参数(包括饱和吸附量和解离平衡常数等)和操作相关参数(包括空塔流速与上样浓度等)。将上述每一个参数均在80%范围内产生一个随机数,将这些随机数按照一定顺序排列产生机理模型参数矩阵,从而形成100-10000组机理模型参数矩阵;将每组参数代入机理模型中,利用正交配置法得到对应的单柱穿透曲线以及双柱串联上样的二柱的穿透曲线;重复上述步骤,即得到机理模型参数集和对应的穿透曲线数据集。
另一种实施方式中,利用实验的方法,选择不同的介质和操作参数进行双柱串联的蛋白穿透实验,此时实验参数包括空塔流速、上样浓度、饱和吸附量、解离平衡常数,其中饱和吸附量和解离平衡常数通过静态吸附实验得到,进行100-10000组上述实验,得到机理模型参数集和对应的穿透曲线数据集。
(2)第二人工神经网络训练:选取穿透曲线数据集中穿透曲线上的特征点,即达到10%-90%穿透点的上样时间和上样量,双柱串联上样二柱的穿透曲线上1%穿透点。对穿透曲线上的特征点进行提取和归一化处理,以机理模型参数为输入集,对应的穿透曲线的特征点作为输出集,训练神经网络,记为第二人工神经网络。
(3)第二人工神经网络应用:将选择的保留时间和上样蛋白浓度和上述拟合得到的机理模型参数合并,代入已训练好的第二人工神经网络进行计算,可预测得到不同层析操作参数下的穿透曲线的特征点。
具体应用实例中,步骤4中重新进行第一人工神经网络训练和第二人工神经网络训练步骤为:使用机理模型对实验穿透曲线进行拟合,得到该实验条件下的机理模型参数,在该机理模型参数±30%区间内随机生成新的机理模型参数集,代入机理模型中得到新的穿透曲线集,将新的穿透曲线集合并入原先的穿透曲线数据库中,分别使用上述方法重新进行第一人工神经网络训练和第二人工神经网络训练。
具体应用实例中,步骤5中连续流层析的过程分析包括如下步骤:
(1)将预测的穿透曲线特征点、连续流层析基本操作参数(包括洗脱清洗再生时间、连接模式清洗的柱体积、安全因子等)和连续流设计参数(切换点选取、保留时间、上样蛋白浓度等),代入上述连续流层析模型中,得到连续流层析过程的流程安排方案。
(2)评估参数计算步骤:将上一步骤中所得的连续流层析的设计参数与流程安排方案代入上述连续流层析的评估模型,计算得到多柱连续流层析的过程产率和介质利用度。
具体应用实例中,步骤6中,连续流层析的操作空间优化包括如下步骤:
(1)过程产率分布图:基于连续流层析的设计参数范围,生成参数矩阵,对矩阵内的所有参数点根据上述方法计算过程产率,得到过程产率矩阵,对矩阵进行线性插值,绘制在不同操作条件(包括保留时间、切换点、上样蛋白浓度)的过程产率分布图,用于连续流层析过程分析和优化。
(2)介质利用度分布图:基于连续流层析的设计参数范围,生成参数矩阵,对矩阵内的所有参数点根据上述方法计算介质利用度,得到介质利用度矩阵,对矩阵进行线性插值后,绘制在不同操作条件(包括保留时间、切换点、上样蛋白浓度)的介质利用度分布图,用于连续流层析过程分析和优化。
(3)连续流层析的参数优化:基于特定的分离目标(过程产率和介质利用度),在过程产率分布图和介质利用度分布图中分别计算满足分离目标的连续流设计参数范围,将两个图的设计参数区域进行叠加,得到同时满足过程产率和介质利用度要求的连续流层析设计参数,并计算连续流层析过程的操作参数与流程安排方案。
进一步的,为了使本发明实施例的技术效果更为明显,以下结合数字和图例对发明实施过程列举说明。
实例1第一人工神经网络训练和穿透曲线拟合
(1)第一人工神经网络训练
在80%范围内随机生成一组机理模型参数:轴向扩散系数5*10-7m2/s,液膜传质系数12*10-6m/s,颗粒内固相传质系数3*10-13m2/s,颗粒内液相传质系数9*10-12m2/s,饱和吸附量110mg/mL,解离平衡常数0.12mg/mL,空塔流速0.5mL/min,上样蛋白浓度2mg/mL。将上述参数代入机理模型进行计算,得到穿透曲线如图2所示。
机理模型参数矩阵为[5e-7,12e-6,3e-13,9e-12,110,0.12,0.5,2]。
由2000组机理模型参数矩阵构成机理模型参数集,对应于2000条穿透曲线,构成穿透曲线数据集。
选取穿透曲线上的特征点,分别达到10%、20%、30%、40%、50%、60%、70%、80%、90%穿透的时间,由特征点组成的矩阵为[63.7,71.6,78.4,84.2,90.9,98.3,105.9,114.7,127.34];将该矩阵进行归一化,得到矩阵[0.137,0.135,0.136,0.136,0.139,0.142,0.145,0.145,0.143];将所有的穿透曲线数据转化为上述归一化矩阵,作为输入集;将机理模型参数集归一化,作为输出集;采用Levenberg-Marquardt为训练函数,以均方根误差为目标函数进行人工神经训练,经过116次迭代后误差为2.84*10-5,小于1*10-3,达到训练要求,得到第一人工神经网络。
(2)穿透曲线拟合
采用GE Healthcare公司的Mabselect SuRE介质进行IgG蛋白的穿透实验,流速为0.5mL/min,上样蛋白浓度为1mg/mL;将穿透曲线进行线性插值,得到达到10%-90%穿透的时间点矩阵为[57.4,64.9,71.8,79.3,86.3,93.8,101.2,111.4,125.3];将该矩阵代入网络1,即可计算得到机理模型参数矩阵为[2e-7,2e-6,4e-13,1.3e-11,90.1,0.3,0.5,1],图3为实验穿透曲线和拟合穿透曲线的比较。
实例2第二人工神经网络训练和穿透曲线预测
(1)第二人工神经网络训练
在80%范围内随机生成一组机理参数:轴向扩散系数3*10-7m2/s,液膜传质系数18*10-6m/s,颗粒内固相传质系数4*10-13m2/s,颗粒内液相传质系数6*10-12m2/s,饱和吸附量80mg/mL,解离平衡常数0.2mg/mL,空塔流速1mL/min,上样蛋白浓度1mg/mL。将上述参数代入机理模型中,得到两个解,一个解为一柱穿透曲线,另一个解为双柱串联上样时二柱的穿透曲线,如图4所示。
机理模型参数矩阵为[3e-7,18e-6,4e-13,6e-12,80,0.2,1,1]。
由3000多组机理模型参数构成机理模型参数集,对应于3000组穿透曲线,构成穿透曲线数据集。
选取穿透曲线上的特征点,包括达到10%-90%穿透的时间点和上样量,以及二柱1%穿透的时间点,特征点组成的矩阵为[13.0,17.4,21.9,27.4,34.2,43.2,55.3,72.1,93.7,0.31,1.0,2.1,4.1,7.3,12.3,20.2,32.8,51.2,28.1];将所有的穿透曲线数据转化为上述矩阵,再进行归一化处理,作为输出集。将机理模型参数集归一化作为输入集。采用Levenberg-Marquardt为训练函数,以均方根误差为目标函数进行人工神经训练,经过68次迭代后误差为8.9*10-4,小于1*10-3,达到训练要求,得到第二人工神经网络。
(2)穿透曲线预测
使用实例1介质Mabselect SuRE穿透实验拟合计算得到机理模型参数矩阵[2e-7,2e-5,4e-13,1.3e-11,90.1,0.3,0.5,1],将矩阵代入第二人工神经网络,在不同蛋白浓度和流速下计算得到穿透曲线特征点,例如浓度为1mg/mL、流速分别为0.33mL/min和0.5mL/min的预测结果如图5所示。
实例3连续流层析过程分析和操作空间优化
(1)连续流层析的过程分析
根据Mabselect SuRE介质、蛋白浓度C0为1mg/mL、流速为1mL/min的穿透曲线进行连续流层析的过程设计,设计过程如下:
双柱连续流层析设计:连接模式的上样流速UC与蛋白穿透实验相同(1mL/min),断开模式的上样时间TDC和层析柱进行洗脱、清洗和再生的总时间TRR相同(26min),连接模式清洗的柱体积为4CV,连接模式清洗的流速为1mL/min,可求得连接模式的清洗时间TCW为4min。设安全因子SF为0.9,切换点s为80%,一柱达到1%穿透时间T1_1%为6.6min,一柱达到s穿透时间T1_s%为38.1min,二柱达到1%穿透时间T2_1%为72.1min。通过下面两个公式对断开模式的上样流速UDC和连接模式的上样时间TC进行求解:
Figure GDA0002956701720000161
Figure GDA0002956701720000162
三柱连续流层析设计:T1_1%,T1_s%,T2_1%,TCW,TRR的值和前文相同。
Figure GDA0002956701720000163
由于TC>TRR,故Twait=TC-TRR=9.3(min)
四柱连续流层析设计:TC,TCW,TRR的值和前文相同。
TC与三柱连续流层析过程相同。由于TC>(TRR-TCW)/2,故Twait=2TC-TRR+TCW=14.5(min)
N柱连续流层析设计:TC,TCW,TRR的值和前文相同。
由公式
Figure GDA0002956701720000164
可得适用于三柱连续流层析系统。
(2)连续流层析的过程评估和操作空间优化
以双柱连续流层析为例,将上述求得的操作参数代入过程产率和介质利用度的计算公式,其中双柱运行一个周期的时间Tcycle为134.5min,一柱达到95%穿透的时间T1_95%为107.8min,柱体积CV为1mL。可以得到:
Figure GDA0002956701720000165
Figure GDA0002956701720000166
将不同切换点参数(0.1、0.2、...、0.9)和不同保留时间参数(0.5、1、1.5、2、2.5、3、3.5、4min)代入上述双柱连续流层析设计和评估方程,得到双柱连续流层析过程的过程产率矩阵和介质利用度矩阵。将矩阵进行线性插值,得到过程产率分布图和介质利用度图,见图6和图7所示。
当输入分离目标,如过程产率大于17g/L/h和介质利用度大于70%后,则可以根据分离目标,在上述两个等高线图中得到满足过程产率大于17g/L/h和介质利用度大于70%的交集,即合适的操作空间,如图8所示。
应当理解,本文所述的示例性实施例是说明性的而非限制性的。尽管结合附图描述了本发明的一个或多个实施例,本领域普通技术人员应当理解,在不脱离通过所附权利要求所限定的本发明的精神和范围的情况下,可以做出各种形式和细节的改变。

Claims (6)

1.一种基于人工神经网络实现多柱连续流层析设计及分析的方法,其特征在于,包括以下步骤:
步骤1,第一人工神经网络训练,采用机理模型和实验方法建立层析穿透曲线数据集和机理模型参数集,以穿透曲线数据集为输入,机理模型参数集为输出,训练得到第一人工神经网络;
步骤2,第二人工神经网络训练,采用机理模型和实验方法建立层析穿透曲线数据集和机理模型参数集,以机理模型参数集为输入,穿透曲线数据集为输出,训练得到第二人工神经网络;
步骤3,穿透曲线拟合,将实验所得穿透曲线进行线性插值,得到穿透曲线的特征点,将特征点和实验操作参数作为输入代入第一人工神经网络,拟合计算得到机理模型参数;
步骤4,穿透曲线预测,将步骤3得到的机理模型参数代入第二人工神经网络,依据层析参数预测范围,得到不同流速与不同蛋白浓度的穿透曲线特征点,并和穿透曲线实验数据进行比较,若误差大于5%,则重新进行第一人工神经网络训练和第二人工神经网络训练,并重新进行步骤3和步骤4;
步骤5,连续流层析的过程分析,将步骤4预测的穿透曲线特征点和连续流层析操作参数代入连续流层析模型,得到连续流层析过程的设计参数和评估参数,分析连续流层析操作参数变化对多柱连续流层析的过程产率和介质利用度性能指标的影响,所述的连续流层析模型为根据不同操作模式建立的连续流设计模型,连续流层析的评估参数包括过程产率和介质利用度,其中不同操作模式包括二柱、三柱、四柱、N柱,N>4;所述的连续流层析操作参数,对于二柱连续流层析是连接模式的上样时间和断开模式的上样流速,对于三柱以上连续流层析是柱数和连接模式的上样时间,
当为二柱连续流层析操作模式时,连接模式的上样时间和断开模式的上样流速计算方法如下:
Figure FDA0002960486220000021
Figure FDA0002960486220000022
其中:TC为连接模式的上样时间,单位为min;UDC代表断开模式的上样流速,单位为mL/min;c(t)为时间t时对应的蛋白上样浓度,单位为mg/mL;c0为蛋白上样浓度,单位为mg/mL;UC为连接模式的上样流速,单位为mL/min;TDC为断开模式的上样时间,单位为min;T1_1%为一柱1%穿透点时间,单位为min;T1_s%为一柱s%穿透点时间,单位为min;T2_1%为二柱1%穿透点时间,单位为min;SF为安全因子;
当为三柱以上连续流层析操作模式时,柱数和连接模式的上样时间计算方法如下:
Figure FDA0002960486220000023
Figure FDA0002960486220000024
其中:N为连续流层析的柱数;TCW代表连接模式的清洗时间,单位为min;TRR为洗脱清洗再生的总时间,单位为min;T1_1%′为双柱串联上样时前柱1%穿透点时间,单位为min;T1_s%′为双柱串联上样时前柱s%穿透点时间,单位为min;T2_1%′为双柱串联上样时后柱1%穿透点时间,单位为min;
步骤6,连续流层析的操作空间优化,基于分离目标和要求,确定过程产率和介质利用度,通过步骤5的分析,得到优化的连续流层析设计参数的操作空间,具体包括:
基于连续流层析的设计参数范围,生成参数矩阵,对矩阵内的所有参数点计算过程产率,得到过程产率矩阵,对矩阵进行线性插值,绘制在不同操作条件的过程产率分布图,用于连续流层析过程分析和优化;
基于连续流层析的设计参数范围,生成参数矩阵,对矩阵内的所有参数点计算介质利用度,得到介质利用度矩阵,对矩阵进行线性插值后,绘制在不同操作条件的介质利用度分布图,用于连续流层析过程分析和优化;
基于分离目标,在过程产率分布图和介质利用度分布图中分别计算满足分离目标的连续流层析设计参数范围,将两个图的设计参数区域进行叠加,得到同时满足过程产率和介质利用度要求的连续流层析设计参数,并计算连续流层析过程的操作参数与流程安排方案。
2.如权利要求1所述的基于人工神经网络实现多柱连续流层析设计及分析的方法,其特征在于,步骤1的第一人工神经网络训练和步骤3的穿透曲线拟合进一步包括如下步骤:
产生随机分布的若干机理模型参数集,代入机理模型方程,利用正交配置法产生穿透曲线数据集,或通过实验得到机理模型参数对应的穿透曲线数据集;
对穿透曲线上的特征点进行提取和归一化处理,确定神经元节点数和网络层数,使用穿透曲线特征点和机理模型参数分别作为输入集和输出集,训练人工神经网络,记为第一人工神经网络;
将实验所得穿透曲线数据进行线性插值,得到穿透曲线特征点,代入已训练好的第一人工神经网络进行计算,得到机理模型中的特征模型参数。
3.如权利要求1所述的基于人工神经网络实现多柱连续流层析设计及分析的方法,其特征在于,步骤2的第二人工神经网络训练和步骤4的穿透曲线预测进一步包括如下步骤:
产生随机分布的若干机理模型参数集,代入机理模型方程,利用正交配置法产生穿透曲线数据集,或通过实验得到机理模型参数对应的穿透曲线数据集;
对穿透曲线上的特征点进行提取和归一化处理,确定神经元节点数和网络层数,使用机理模型参数和穿透曲线特征点分别作为输入集与输出集,训练神经网络,记为第二人工神经网络;
在随机分布的保留时间和蛋白浓度范围之内产生层析操作参数矩阵,与机理模型参数合并,代入已训练好的第二人工神经网络进行计算,预测得到不同层析操作条件下的穿透曲线。
4.如权利要求1所述的基于人工神经网络实现多柱连续流层析设计及分析的方法,其特征在于,步骤4中重新进行第一人工神经网络训练和第二人工神经网络训练过程为:使用机理模型对实验穿透曲线进行拟合,得到实验条件下的机理模型参数,在该机理模型参数±30%区间内随机生成新的机理模型参数集,代入机理模型中得到新的穿透曲线集,将新的穿透曲线集合并入原先的穿透曲线数据库中,分别重新进行第一人工神经网络训练和第二人工神经网络训练。
5.如权利要求1所述的基于人工神经网络实现多柱连续流层析设计及分析的方法,其特征在于,所述的连续流层析的过程分析包括如下步骤:
将预测的穿透曲线特征点和连续流层析操作参数,代入连续流层析模型中,得到连续流层析的过程设计参数与流程安排方案;
将所得的连续流层析的过程设计参数与流程安排方案代入连续流层析的评估模型,计算得到多柱连续流层析的过程产率和介质利用度。
6.如权利要求1至5任一所述的基于人工神经网络实现多柱连续流层析设计及分析的方法,其特征在于,所述的机理模型为考虑平行扩散的一般性速率模型。
CN201910573256.4A 2019-06-28 2019-06-28 基于人工神经网络实现多柱连续流层析设计及分析的方法 Active CN110348090B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910573256.4A CN110348090B (zh) 2019-06-28 2019-06-28 基于人工神经网络实现多柱连续流层析设计及分析的方法
US17/623,403 US20220381751A1 (en) 2019-06-28 2019-09-05 Method for realizing multi-column continuous flow chromatography design and analysis
PCT/CN2019/104488 WO2020258515A1 (zh) 2019-06-28 2019-09-05 多柱连续流层析设计及分析的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910573256.4A CN110348090B (zh) 2019-06-28 2019-06-28 基于人工神经网络实现多柱连续流层析设计及分析的方法

Publications (2)

Publication Number Publication Date
CN110348090A CN110348090A (zh) 2019-10-18
CN110348090B true CN110348090B (zh) 2021-05-04

Family

ID=68176923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910573256.4A Active CN110348090B (zh) 2019-06-28 2019-06-28 基于人工神经网络实现多柱连续流层析设计及分析的方法

Country Status (1)

Country Link
CN (1) CN110348090B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597430B (zh) * 2020-12-22 2024-04-05 浙江中控技术股份有限公司 一种用于复杂精馏塔的操作参数优化方法
CN115798618A (zh) * 2022-10-28 2023-03-14 武汉城市职业学院 一种变压吸附高效提纯氢气的优化方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2005233309A1 (en) * 2004-04-19 2005-10-27 Centelion Method for purifying plasmid DNA
US9650412B2 (en) * 2013-03-08 2017-05-16 Genzyme Corporation Integrated continuous manufacturing of therapeutic protein drug substances
CN107485891A (zh) * 2017-07-20 2017-12-19 上海药明生物技术有限公司 改良的层析装置及其用于连续流层析的方法
CN109473143A (zh) * 2018-12-13 2019-03-15 杭州奕安济世生物药业有限公司 一种连续流层析上样量的确定方法及其应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6859032B2 (en) * 2001-12-18 2005-02-22 Schlumberger Technology Corporation Method for determining molecular properties of hydrocarbon mixtures from NMR data
US7790025B2 (en) * 2003-05-16 2010-09-07 Cryobiophysica, Inc. External gradient chromatofocusing
NZ562949A (en) * 2005-04-11 2009-05-31 Medarex Inc Protein purification using HCIC and ion exchange chromatography
CN105771316B8 (zh) * 2016-05-03 2020-08-04 哈尔滨珍宝制药有限公司 三七总皂苷柱层析过程自动控制系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2005233309A1 (en) * 2004-04-19 2005-10-27 Centelion Method for purifying plasmid DNA
US9650412B2 (en) * 2013-03-08 2017-05-16 Genzyme Corporation Integrated continuous manufacturing of therapeutic protein drug substances
CN107485891A (zh) * 2017-07-20 2017-12-19 上海药明生物技术有限公司 改良的层析装置及其用于连续流层析的方法
CN109473143A (zh) * 2018-12-13 2019-03-15 杭州奕安济世生物药业有限公司 一种连续流层析上样量的确定方法及其应用

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Adsorption Characteristics of Human Immunoglobulin G on Five New Tetrapeptide Biomimetic Affinity Resins;Zhu Hong-Yun et al;《JOURNAL OF CHEMICAL AND ENGINEERING DATA》;20190430;第1671-1679页 *
Comparison of general rate model with a new model—artificial neural network model in describing chromatographic kinetics of solanesol adsorption in packed column by macroporous resins;Xueling Du et al;《Journal of Chromatography A》;20070126;第165–174页 *
Estimation of adsorption isotherm and mass transfer parameters inprote in chromatography using artificial neural networks;Gang Wang et al;《Journal of Chromatography A》;20170127;第211–217页 *
Review on biomimetic affinity chromatography with short peptide ligands and its application to protein purification;Yu-Ming Fang et al;《Journal of Chromatography A》;20181012;第1-15页 *
双柱连续流层析亲和分离抗体的过程设计与应用;高宗晔 等;《高校化学工程学报》;20190228;第33卷(第1期);第117-127页 *

Also Published As

Publication number Publication date
CN110348090A (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
CN110348090B (zh) 基于人工神经网络实现多柱连续流层析设计及分析的方法
Zhang et al. Multiobjective optimization of SMB and varicol process for chiral separation
CN109910909B (zh) 一种多车运动状态的汽车轨迹网联交互式预测方法
CN110443805B (zh) 一种基于像素密切度的语义分割方法
CN110348089B (zh) 基于层析模型实现多柱连续流层析设计及分析的方法
CN112949142A (zh) 一种基于深度神经网络的ect图像重建方法
CN107819453A (zh) 用于并行化和流水线化可调谐盲源分离滤波器的系统和方法
CN112451996B (zh) 一种多柱连续流层析捕获蛋白的优化方法
Paulen et al. Process optimization of diafiltration with time-dependent water adding for albumin production
CN103157295B (zh) 一种双柱循环色谱系统
Hu et al. Predictive modeling and computational machine learning simulation of adsorption separation using advanced nanocomposite materials
Smith et al. Hydrophobic interaction ligand selection and scale-up of an expanded bed separation of an intracellular enzyme from Saccharomyces cerevisiae
WO2020258515A1 (zh) 多柱连续流层析设计及分析的方法
Kaczmarski et al. Use of simulated annealing for optimization of chromatographic separations
CN115295070A (zh) 基于人工智能的生物大分子量子力学特性计算方法及系统
CN111561929B (zh) 一种用于车载mems惯性传感器的时延降噪方法
YAMAMOTO et al. Preparative separation of proteins by gradient-and stepwise-elution chromatography: Zone-sharpening effect
Sun et al. A Lightweight Neural Network for Vehicle Object Detection
CN216484802U (zh) 一种双柱层析在线检测系统
CN116130011A (zh) 一种基于机器学习预测有害气体的共吸附性能的方法及系统
CN115410656A (zh) 一种预测有机缓蚀剂在金属有机框架表面吸附性能的方法
Sharma et al. Adsorption equilibrium and kinetics of egg-white proteins on immobilized metal ion affinity gels for designing fractionation
CN114842914B (zh) 一种基于深度学习的染色质环预测方法及系统
CN114722609B (zh) 基于二进制矩阵模型的检测分析方法
CN116072234B (zh) 基于深度学习的分子动力学轨迹分析方法、存储介质和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant