CN112912716A - 用于实时预测的拉曼光谱模型的自动校准和自动维护 - Google Patents

用于实时预测的拉曼光谱模型的自动校准和自动维护 Download PDF

Info

Publication number
CN112912716A
CN112912716A CN201980068986.7A CN201980068986A CN112912716A CN 112912716 A CN112912716 A CN 112912716A CN 201980068986 A CN201980068986 A CN 201980068986A CN 112912716 A CN112912716 A CN 112912716A
Authority
CN
China
Prior art keywords
biopharmaceutical
observation
biopharmaceutical process
analytical
query point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980068986.7A
Other languages
English (en)
Inventor
A·塔尔斯延
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
American Amgen
Amgen Inc
Original Assignee
American Amgen
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by American Amgen filed Critical American Amgen
Publication of CN112912716A publication Critical patent/CN112912716A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M41/00Means for regulation, monitoring, measurement or control, e.g. flow regulation
    • C12M41/48Automatic or computerized control
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/44Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • G01N2021/8411Application to online plant, process monitoring
    • G01N2021/8416Application to online plant, process monitoring and process controlling, not otherwise provided for
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/127Calibration; base line adjustment; drift compensation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Software Systems (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Computational Linguistics (AREA)
  • Urology & Nephrology (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Computer Hardware Design (AREA)
  • Sustainable Development (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

一种用于监测和/或控制生物制药过程的方法包括:确定与由光谱系统(例如拉曼光谱系统)对该过程进行的扫描相关联的查询点,以及查询观察结果数据库,该观察结果数据库包含与生物制药过程的过去观察结果相关联的观察结果数据集。这些观察结果数据集中的每一个包括光谱数据和相应的实际分析测量结果。查询该观察结果数据库包括从这些观察结果数据集中选择满足关于该查询点的一个或多个相关性标准的那些数据集作为训练数据。该方法还包括使用所选训练数据来校准特定于该生物制药过程的本地模型。训练该本地模型(例如高斯过程模型)以基于光谱数据输入来预测分析测量结果。该方法还包括使用该本地模型来预测该生物制药过程的分析测量结果。

Description

用于实时预测的拉曼光谱模型的自动校准和自动维护
相关申请的交叉引用
要求2018年10月23日提交的美国临时专利申请号62/749,359、2019年4月12日提交的美国临时专利申请号62/833,044和2019年6月21日提交的美国临时专利申请号62/864,565的优先权,这些申请中的每一个特此通过引用以其全文并入本文。
技术领域
本申请总体上涉及使用诸如拉曼(Raman)光谱法等光谱技术来监测和/或控制生物制药过程,并且更具体地涉及对预测模型的在线校准和维护。
背景技术
通过生物制药过程稳定的生产生物治疗蛋白质通常需要生物反应器保持平衡且一致的参数(例如,细胞代谢浓度),这进而需要严格的过程监测和控制。为了满足这些需求,越来越多地采用过程分析技术(PAT)工具。在线监测pH、溶解氧和细胞培养温度是已经在反馈控制系统中使用的传统PAT工具的一些示例。近年来,已经研究并部署了其他的过程中探针以连续监测更复杂的种类,诸如活细胞密度(VCD)、葡萄糖、乳酸盐、以及其他关键的细胞代谢物、氨基酸、滴度和关键质量属性。
拉曼光谱法是一种流行的PAT工具,其广泛用于生物制造中的在线监测。拉曼光谱法是一种能够对化学成分和分子结构进行非破坏性分析的光学方法。在拉曼光谱法中,入射激光由于分子振动模式而非弹性地散射。入射光子与散射光子之间的频率差被称为“拉曼位移”,并且可以对拉曼位移与强度水平的向量(在本文中称为“拉曼光谱”、“拉曼扫描”或“拉曼扫描向量”)进行分析以确定样品的化学成分和分子结构。随着激光采样和检测器技术的改进,拉曼光谱法在聚合物、药物、生物制造和生物医学分析中的应用在过去的三十年中激增。由于这些技术的进步,拉曼光谱法现在已经成为在实验室内外使用的实用分析技术。自从首次报道原位拉曼测量在生物制造中的应用以来,其已被用来提供对诸如葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨、VCD等几个关键过程状态的在线实时预测。这些预测通常是基于依据来自分析仪器的分析测量结果在离线环境中构建的校准模型或软传感器模型。通常使用偏最小二乘(PLS)和多重线性回归建模方法来将拉曼光谱与分析测量结果进行关联。这些模型通常需要在对分析测量结果进行校准之前对拉曼扫描进行滤波预处理。一旦训练了校准模型,就可以在实时环境中实施该模型,以提供用于过程监测和/或控制的原位测量结果。
由于生物制药过程通常在严格的约束和规定下操作,因此用于生物制药应用的拉曼模型校准是很必要的。生物制药行业中用于拉曼模型校准的当前最新方法是首先进行多次活动试验,以生成用于将拉曼光谱与(多个)分析测量结果进行关联的相关数据。这些试验既昂贵又费时,因为例如每种活动在实验室环境中都可能持续二至四周。此外,仅有限的样品可以用于分析仪器(例如,以确保实验室规模的生物反应器保持健康的活细胞量)。实际上,在线分析仪器或离线分析仪器中每天仅能进行一次或两次测量并不罕见。使情况进一步恶化的是,当前的最佳实践产生与生物反应器培养基的特定过程、特定配方或配置以及特定操作条件相关的校准模型。因此,如果要改变上述变量中的任何一个变量,则可能需要基于新数据对模型进行重新校准。实际上,拉曼模型校准和模型维护都需要大量的资源分配,并且通常是在离线环境中执行的。虽然已经提出了使模型适应新操作条件的方法(例如,递归方法、移动窗口方法和时差方法),但是这些方法可能不足以处理突然的过程变化。
许多出版物描述了基于传统化学计量学方法(例如PLS建模)的用于多个分子的通用拉曼模型。然而,这些通用模型假设这些过程使用相似的(如果不是相同的话)培养基配方和/或运行过程条件。培养基和过程通常是被平台化(platformed)的,具有很小的差异或几乎没有差异。这种类型的通用模型的缺点是:一旦过程偏离规范,或者如果训练数据集包含的过程范围过大以试图考虑不同分子之间的差异(例如,培养基添加剂、过程持续时间和/或其他过程变化),通用模型就失去准确性和精度。因此,这些“通用”模型仅在所描述的严格界限内是通用的。参见Mehdizaheh等人的Biotechnolo.Prog.31(4):1004-1013,2015和Webster等人的Biotechnol.Prog.34(3):730-737,2018。
发明内容
术语“生物制药过程(biopharmaceutical process)”是指在生物制药制造中使用的过程,诸如用于生产期望的重组蛋白质的细胞培养过程。细胞培养在诸如生物反应器等细胞培养容器中、在支持经工程改造以表达蛋白质的生物体的生长和维持的条件下进行。在重组蛋白质生产过程中,对过程参数(诸如培养基成分浓度(包括营养素和代谢物(例如,葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨、氨基酸,Na+、K+以及其他营养素或代谢物))、培养基状态(pH、pCO2、pO2、温度、渗透压等))、以及细胞和/或蛋白质参数(例如,活细胞密度(VCD)、滴度、细胞状态、关键质量属性等)进行监测以控制和/或维持细胞培养过程。
为了解决当前最佳工业实践的上述限制中的一些限制,本文描述的实施例涉及对用于生物制药过程的光谱分析(诸如拉曼光谱法)的传统技术进行改进的系统和方法。具体地,使用“即时学习(Just-In-Time Learning)”(JITL)平台来为生物制药应用实时构建和维护校准模型(例如,拉曼校准模型)。JITL是基于本地建模和数据库采样技术的非线性建模平台。与其他机器学习方法不同,JITL通常假设所有可用的观察结果都存储在中央数据库中,并且模型是使用来自数据库的最相关数据基于查询而动态地实时构建的。这允许使用相对简单的本地模型来很好地近似复杂的过程动力学。在JITL框架下,库可以包含不止用于在特定操作条件下操作的单个过程的光谱数据,还可以包含用于不同过程、不同培养基配置和/或不同操作条件的数据。这可以显著减少校准和维护模型所需的时间,尤其是对于可以具有很少过去生产历史或没有过去生产历史的研发中的药品而言。
JITL平台维护着可以在每次新的分析测量结果可用时进行更新的动态库。此外,为了确保本地模型适应新的过程条件,最后一个可用的分析测量结果(例如,对于当前正在监测的产品)可以始终包括在用于本地建模的训练集中。这允许本地模型更快地适应新条件或适应无历史的新产品线。使用这种方法,模型校准和模型维护都可以是自动的,并且可以大大减少与常规系统中的常规校准相关联的时间和费用(例如,材料和人工成本)。此外,提供围绕模型预测的可信度边界(或其他置信度指标,诸如置信度评分)的能力可以允许稳健的监测和控制策略。
在一些实施例中,将高斯过程模型用于JITL框架内的本地建模。高斯过程模型是功能强大的统计机器学习模型,其可以高效地捕获复杂的非线性过程动力学,并且可以轻松地适应几乎任何过程变化。与PLS、主成分回归(PCR)和其他类型的回归模型相比,高斯(Gaussian)过程模型是非参数化的方法,并且远更能从有限的数据集中捕获拉曼光谱与分析测量结果之间的复杂相关性。此外,高斯过程模型通常不需要对拉曼扫描进行滤波预处理。因此,在一些实施例中,高斯过程模型反而是在原始拉曼扫描(以对数尺度)上校准的,这可以省去模型校准/维护过程中的许多步骤。此外,高斯过程模型提供了围绕预测的可信度边界,这些可信度边界可能是使用PLS模型或PCR模型极难获得的。可信度边界对于设计分析仪器的最佳采样策略和/或实施闭环控制(例如模型预测控制或MPC)例如以便避免基于不可靠的预测进行改变可能特别有用。
尽管JITL是非线性建模框架,并且尽管上述方法通过利用最新的分析测量结果更新动态库提供了一定的适应性,但仅JITL可能不能充分自适应以考虑时变过程条件(例如,设定点或其他过程条件的突变)。具体地,使用JITL校准的本地模型可能无法利用最新样品。例如,并且特别是如果存在过程条件的最新且突然的变化,则最新的样品可能无法满足完全基于“空间”相似性(例如,拉曼扫描的相似性)的相似性准则。本文还描述了改良的JITL技术,其可以更好地利用由最新样品提供的信息(与空间相似性无关),并且因此可以更好地适应时变过程变化。具体地,本文描述了用于模型校准和维护的“自适应”JITL(A-JITL)技术和“时空”JITL(ST-JITL)技术。
实时模型维护对JITL技术的成功可能是很重要的,在实时模型维护中,本地模型可以从最近的分析测量结果中学习、并由此快速适应时变条件。但是,频繁访问分析仪器/测量结果(例如,分析离线样品)往往占用大量资源。为了在不过度降低模型性能的情况下最小化这种资源使用,可以实施基于性能的模型维护协议,在该基于性能的模型维护协议中,系统响应于确定当前模型性能不可接受/不可靠而调度/触发分析测量。
附图说明
本领域的技术人员将理解,本文描述的附图是出于说明的目的而包括的,而非限制本披露。附图不一定是按比例绘制,而是将重点放在说明本披露的原理上。应理解,在一些情况下,所描述的实施方式的不同方面可以被扩大或放大,以有助于理解所描述的实施方式。在附图中,贯穿各附图,相似的附图标记通常指代功能相似和/或结构相似的部件。
图1是可以用于预测生物制药过程的分析测量结果的示例拉曼光谱系统的简化框图。
图2是可以用于预测生物制药过程的分析测量结果以用于葡萄糖浓度的闭环控制的示例拉曼光谱系统的简化框图。
图3描绘了使用本文所描述的拉曼光谱系统的示例实施方式对葡萄糖浓度的闭环控制的实验结果。
图4描绘了当使用即时学习(JITL)技术来分析生物制药过程时可能发生的示例数据流。
图5描绘了当使用自适应JITL(A-JITL)技术来分析生物制药过程时可能发生的示例数据流。
图6描绘了当使用时空JITL(ST-JITL)技术来分析生物制药过程时可能发生的示例数据流。
图7是用于分析生物制药过程的示例方法的流程图。
具体实施方式
以上介绍的以及在下文更详细地讨论的不同构思可以以多种方式中的任一种实施,并且所描述的构思不限于任何特定的实施方式。出于说明的目的,提供了实施方式的示例。
图1是可以用于预测生物制药过程的分析测量结果的示例拉曼光谱系统100的简化框图。虽然图1描绘了实施拉曼光谱技术的系统100,但是应当理解,在其他实施例中,系统100可以实施适合于分析生物制药过程的其他光谱技术,例如诸如近红外(NIR)光谱法。
系统100包括生物反应器102、一个或多个分析仪器104、具有拉曼探针108的拉曼分析仪106、计算机110以及经由网络114耦合到计算机110的数据库服务器112。生物反应器102可以是支持生物活性环境的任何合适的容器、设备或系统,该生物活性环境可以包括培养基内的活生物体和/或从这些活生物体衍生的物质(例如,细胞培养物)。生物反应器102可以包含通过细胞培养表达的重组蛋白质,例如,诸如用于研究目的、临床用途、商业销售或其他分配。取决于所监测的生物制药过程,培养基可以包括特定流体(例如,“液体培养基”)和特定营养素,并且可以具有目标培养基状态参数,诸如目标pH水平或范围、目标温度或温度范围等。培养基还可以包括生物体和从这些生物体衍生的物质(诸如代谢物和重组蛋白质)。培养基的内容物和参数/特性在本文中统称为“培养基配置(media profile)”。
(多个)分析仪器104可以是任何在线的、线上的和/或离线的一个或多个仪器,其被配置成基于从生物反应器102内的生物活性内容获取的样品来测量这些生物活性内容的一个或多个特性或参数。例如,(多个)分析仪器104可以测量一种或多种培养基成分浓度,诸如营养素水平和/或代谢物水平(例如,葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨,氨基酸、Na+、K+等)以及培养基状态参数(pH、pCO2、pO2、温度、渗透压等)。另外地或可替代地,(多个)分析仪器104可以测量渗透压、活细胞密度(VCD)、滴度、关键质量属性、细胞状态(例如,细胞周期)和/或与生物反应器102的内容物相关联的其他特性或参数。作为更具体的示例,样品可以被采集、旋转沉降、通过多个柱被纯化,并且可以穿过第一个分析仪器104(例如,高效液相色谱(HPLC)或超高效液相色谱(UPLC)仪器)、然后穿过第二个分析仪器104(例如,质谱仪),其中第一个和第二个分析仪器104均提供分析测量结果。(多个)分析仪器104中的一个、一些或全部可以使用破坏性分析技术。
拉曼分析仪106可以包括耦合到拉曼探针108(或者在一些实施方式中为多个拉曼探针)的光谱仪设备。拉曼分析仪106可以包括经由光纤电缆将激光递送到拉曼探针108的激光源,并且还可以包括电荷耦合器件(CCD)或其他合适的相机/记录设备以记录例如经由光纤电缆的另一通道从拉曼探针108接收到的信号。可替代地,激光源可以集成在拉曼探针108本身内。拉曼探针108可以是浸入式探针或任何其他合适类型的探针(例如,反射探针和透射探针)。
拉曼分析仪106和拉曼探针108被共同配置成在生物反应器102内的生物制药过程期间通过激发、观察和记录生物制药过程的分子“指纹”来非破坏性地扫描生物活性内容。当生物反应器的内容物被由拉曼探针108递送的激光激发时,分子指纹对应于生物制药过程内生物活性内容内的分子的振动、旋转和/或其他低频模式。作为这个扫描过程的结果,拉曼分析仪106生成一个或多个拉曼扫描向量,这些向量各自将强度表示为拉曼位移(频率)的函数。
计算机110耦合到拉曼分析仪106和(多个)分析仪器104,并且通常被配置成分析由拉曼分析仪106生成的拉曼扫描向量以便预测生物制药过程的一个或多个分析测量结果。例如,计算机110可以分析拉曼扫描向量以便预测由(多个)分析仪器104进行的(多种)相同类型的(多个)分析测量结果。作为更具体的示例,计算机110可以预测葡萄糖浓度,而(多个)分析仪器104实际上测量葡萄糖浓度。然而,尽管(多个)分析仪器104可以对从生物反应器102提取的样品进行相对不频繁的“离线”分析测量(例如,由于来自生物制药过程的培养基的数量有限和/或由于进行此类测量的较高成本等),但计算机110可以实时地对分析测量结果进行相对频繁的“在线”预测。计算机110还可以被配置成经由网络114将由(多个)分析仪器104进行的分析测量结果传输至数据库服务器112,如将在下面进一步详细讨论的。
在图1所示的示例实施例中,计算机110包括处理单元120、网络接口122、显示器124、用户输入设备126和存储器128。处理单元120包括一个或多个处理器,每个处理器可以是可编程微处理器,该可编程微处理器执行存储在存储器128中的软件指令以执行如本文所描述的计算机110的一些或全部功能。可替代地,处理单元120中的一个、一些或全部处理器可以是其他类型的处理器(例如,专用集成电路(ASIC)、现场可编程门阵列(FPGA)等),并且如本文所描述的计算机110的功能可以替代地部分或全部地以硬件实施。存储器128可以包括包含易失性和/或非易失性存储器的一个或多个物理存储器设备或单元。可以使用任何合适的一种或多种存储器类型,诸如只读存储器(ROM)、固态驱动器(SSD)、硬盘驱动器(HDD)等。
网络接口122可以包括被配置成使用一种或多种通信协议经由网络114进行通信的任何合适的硬件(例如,前端发射器和接收器硬件)、固件和/或软件。例如,网络接口122可以是或者包括以太网接口。网络114可以是单个通信网络,或者可以包括一种或多种类型的多个通信网络(例如,一个或多个有线和/或无线局域网(LAN)、和/或一个或多个有线和/或无线广域网(WAN)(例如,诸如因特网或内联网))。
显示器124可以使用任何合适的显示技术(例如,LED、OLED、LCD等)来向用户呈现信息,并且用户输入设备126可以是键盘或其他合适的输入设备。在一些实施例中,显示器124和用户输入设备126集成在单个设备(例如,触摸屏显示器)内。通常,显示器124和用户输入设备126可以组合以使得用户能够与由计算机110提供的图形用户界面(GUI)进行交互,例如用于诸如手动监测正在系统100内执行的各种过程的目的。但是,在一些实施例中,计算机110不包括显示器124和/或用户输入设备126,或者显示器124和用户输入设备126中的一者或两者都被包括在与计算机110通信地耦合的另一计算机或系统中(例如,在将预测直接发送到实施闭环控制的控制系统的一些实施例中)。
存储器128存储一个或多个软件应用程序(包括即时学习(JITL)预测器应用程序130)的指令。JITL预测器应用程序130当被处理单元120执行时通常被配置成通过校准本地模型132并通过使用本地模型132分析由拉曼分析仪106生成的拉曼扫描向量来预测生物反应器102中生物制药过程的分析测量结果。取决于拉曼分析仪106生成此类扫描向量的频率,JITL预测器应用程序130可以基于周期性时间或其他合适的时间来预测分析测量结果。拉曼分析仪106本身可以控制何时生成扫描向量,或者计算机110可以通过向拉曼分析仪106发送命令来触发扫描向量的生成。JITL预测器应用程序130可以基于每个扫描向量仅预测单一类型的分析测量结果(例如,仅葡萄糖浓度),或者可以基于每个扫描向量预测多种类型的分析测量结果(例如,葡萄糖浓度和活细胞密度)。在其他实施例中,多个不同的JITL预测器应用程序(例如,每个都类似于JITL预测器应用程序130)各自生成不同的本地模型,以全部基于同一扫描向量来预测不同类型的分析测量结果。JITL预测器应用程序130和本地模型132将在下面进一步详细讨论。
数据库服务器112可以远离计算机110(例如,使得本地设置可以仅包括生物反应器102、(多个)分析仪器104、具有拉曼探针108的拉曼分析仪106以及计算机110),并且如图1中看出的,可以包含或通信地耦合到存储与过去观察结果相关联的观察结果数据集的观察结果数据库136。观察结果数据库136中的每个观察结果数据集可以包括光谱数据(例如,由拉曼分析仪106产生的此类一个或多个拉曼扫描向量)以及一个或多个相应的分析测量结果(例如,由(多个)分析仪器104产生的这样的一个或多个测量结果)。取决于实施例和/或场景,可能已经针对多种不同的生物制药过程、在多种不同的操作条件(例如,不同的代谢物浓度设定点)下、和/或在多种不同的培养基配置(例如,不同的流体、营养素、pH水平、温度等)的情况下收集了过去观察结果。通常,可能期望使观察结果数据库136表示各种各样的过程、操作条件和培养基配置。然而,取决于实施例(如下面进一步讨论的),观察结果数据库136可以存储或可以不存储指示那些过程、细胞系、蛋白质、代谢物、操作条件和/或培养基配置的信息。在一些实施例中,数据库服务器112经由网络114和/或其他网络远程地耦合到类似于计算机110的多个其他计算机。为了收集更多的观察结果数据集以存储在观察结果数据库136中,这可能是期望的。然而,在其他实施例中,系统100不包括数据库服务器112,并且计算机110直接访问本地观察结果数据库136。
应当理解,可以使用其他配置和/或部件来代替图1中所示的那些。例如,不同的计算机(图1中未示出)可以将由(多个)分析仪器104提供的测量结果传输到数据库服务器112,一个或多个附加计算设备或系统可以充当计算机110与数据库服务器112之间的中介,可以替代地由数据库服务器112和/或另一远程服务器远程地执行如本文所描述的计算机110的一些或全部功能,等等。
在系统100的运行时间操作期间,使用拉曼分析仪106和拉曼探针108来扫描生物反应器102中的生物制药过程(即,生成该生物制药过程的拉曼扫描向量),并且然后将该(多个)拉曼扫描向量从拉曼分析仪106传输到计算机110。拉曼分析仪106和拉曼探针108可以根据预定的监测周期时间表(诸如每分钟一次或每小时一次等)来提供扫描向量以支持(由JITL预测器应用程序130进行的)预测。可替代地,可以以不规则的区间进行预测(例如,响应于基于某个过程的触发,诸如所测量的pH水平和/或温度的变化),使得每个监测周期具有可变的或不确定的持续时间。取决于实施例,拉曼分析仪106可以取决于本地模型132接受多少个扫描向量作为单次预测的输入而在每个监测周期仅向计算机110发送一个扫描向量,或者在每个监测周期向计算机110发送多个扫描向量。例如,多个扫描向量可以提高本地模型132的预测准确性。
JITL预测器应用程序130的查询单元140使用在单个监测周期内接收到的(多个)扫描向量来生成查询点,该查询点将被用于查询观察结果数据库136。在一些实施例中,查询点(即,定义查询点的数据)仅包括表示从拉曼分析仪106接收到的(多个)拉曼扫描向量的数据(例如,包括每个扫描向量的强度/频率元组)。在其他实施例中,查询点还包括一个或多个其他类型信息。例如,查询点还可以包括表示与过程相关联的操作条件的数据(例如,控制系统中的代谢物浓度设定点,或者与拉曼分析仪106或拉曼探针108相关联的激光波长和/或强度等)、表示生物制药过程培养基的培养基配置的数据(例如,流体类型、营养素类型或浓度、pH水平等)、和/或其他数据(例如,与生物制药过程相关联的细胞系、蛋白质或代谢物的指标)。
通常,查询点可以包括表示被本地模型132用作输入(即,作为本地模型132的特征集)的相同向量、参数和/或分类的数据。将多种不同数据类型用于特征集可以提高由本地模型132进行的分析测量结果预测的准确性。然而,由于观察结果数据库136中的每个观察结果数据集通常将需要包括相同的向量、参数和/或分类作为特征集,因此可能优选的是将查询点、以及本地模型132的特征集/输入限制为仅包括一个或多个拉曼扫描向量。这可以提供各种益处,诸如允许收集更多信息以存储在观察结果数据库136中、和/或简化此信息的收集。例如,如果仅使用拉曼扫描向量,则即使关于在收集观察结果数据集时存在的过程、细胞系、蛋白质、代谢物、操作条件和/或培养基配置知之甚少或一无所知,这些观察结果数据集也可以包括在观察结果数据库136中。
然后,查询单元140使用所生成的查询点来查询观察结果数据库136。在图1的示例实施例中,查询单元140通过使网络接口122经由网络114向数据库服务器112传输查询点(例如,在查询消息内)(这进而使数据库服务器112从观察结果数据库136中检索适当的数据)来实现这一点。然而,在观察结果数据库136替代地包括在计算机110中(或包括在通信地耦合到该计算机的存储器中)的实施例中,查询单元140可以替代地更直接地查询观察结果数据库136。为了便于解释,图1的剩余描述将假设观察结果数据库136耦合到数据库服务器112,如图1中所描绘的。然而,本领域的普通技术人员将容易地理解,在观察结果数据库136替代地对于计算机110而言是本地的、或位于系统架构内的另一合适位置的情况下,通信路径可以如何不同。
在接收到查询点之后,数据库服务器112使用查询点从观察结果数据库136中选择将被用作本地模型132的训练数据的相关观察结果数据集。取决于实施例,数据库服务器112可以应用任何合适的相关性标准来识别哪些观察结果数据集是“相关的”。在一个实施例中,例如,查询点包括单个拉曼扫描向量,并且数据库服务器112通过计算给定的观察结果数据集的拉曼扫描向量与该查询点的拉曼扫描向量之间的欧几里得距离来确定此观察结果数据集是否相关。如果欧几里德距离低于某个预定阈值(或者低于可变阈值,诸如基于查询点扫描向量与所有观察结果数据集扫描向量之间的平均欧几里德距离所计算出的阈值等),则观察结果数据集被识别为相关的观察结果数据集。本领域普通技术人员将理解可以如何将这种方法容易地扩展到查询点(以及每个观察结果数据集)包括多个拉曼扫描向量的实施例。在一些情况下,使用欧几里得距离来选择相关的观察结果数据集可能是次优技术。然而,如果本地模型132是高斯过程模型(如下面所讨论的),则使用欧几里得距离作为相关性准则可能是特别有利的。这是因为具有径向基函数或平方指数核的高斯过程模型本身基于欧几里得距离。然而,在其他实施例中,可以应用其他相关性标准(例如,基于角度的标准或基于相关性的标准等)。应当理解,在本地模型132还接受其他信息(例如,操作条件、培养基配置、过程数据、细胞系信息、蛋白质信息和/或代谢物信息等)作为输入/特征集的实施例中,可以使用更复杂的技术来识别“相关的”观察结果数据集。在一些实施例中,数据库服务器112响应于单次查询而仅选择预定数量的相关观察结果数据集,或者选择不多于某个最大允许数量的相关观察结果数据集,以确保仅检索到观察结果数据库136内所有数据集的相对较小子集。然而,在其他实施例中,只要每个这样的数据集都满足相关性标准,数据库服务器112就可以选择任何数量的相关观察结果数据集。
在一些实施例中,如下面将更详细描述的(例如,参考图5和图6),不仅基于在“空间”意义上与查询点的相关性(例如,拉曼扫描向量的相似性)、而且还基于在时间意义上的相关性(例如,哪些数据集是最新的,而与空间相似性无关)来选择相关观察结果数据集。这些技术可以更好地利用以下事实:即使最新的分析测量结果对应于不同的设定点等,这些最新的测量结果也可以提供有用的信息。
在识别出相关观察结果数据集(其中每个观察结果数据集可能对应于或可能不对应于与生物反应器102中的当前正在监测的生物制药过程相同的过程条件)之后,数据库服务器112检索这些数据集(例如拉曼扫描向量和(多个)相应的分析测量结果),并经由网络114将检索到的数据集传输到计算机110。查询单元140然后可以将这些相关数据集传递给本地模型生成器142,并且本地模型生成器142将这些相关数据集用作训练数据以校准本地模型132。即,本地模型生成器142使用与每个观察结果数据集相关联的(多个)拉曼扫描向量(以及可能的其他数据)作为特征集,并使用与同一观察结果数据集相关联的(多个)分析测量结果作为此特征集的标签。
在一些实施例中,如以上所指出的,本地模型生成器142构建高斯过程模型,以便高效地捕获复杂的、非线性的过程动力学,并且容易地适应几乎任何过程变化。与PLS模型和PCR模型不同,高斯过程模型使用非参数化的方法,并且即使在使用数量非常有限的训练样品的情况下,也能够捕获拉曼扫描向量与分析测量结果之间的复杂非线性相关性。这在新产品或新过程仅对应于观察结果数据库136中的有限数量的数据集的情况下可能尤其重要。在这种情况下,高斯过程模型通常能够结合数据库服务器112从观察结果数据库136选择的其他相关数据集来从那些有限的数据集中提取最多的信息。然而,在其他实施例中,只要训练时间不超过监测周期的最小期望持续时间,本地模型生成器142就可以替代地构建任何其他合适类型的机器学习模型(例如,递归神经网络、卷积神经网络等)。本地模型生成器142还可以构建本地模型132,使得本地模型132可以输出可信度边界、或某种其他合适的预测置信度指标(例如,置信度评分)。至少与PLS模型和PCR模型相比,高斯过程模型特别适合提供围绕分析测量结果预测的可信度边界。尽管已经描述了高斯过程模型相对于PLS模型和PCR模型的各种优点,但是应当理解,在一些实施例中,本地模型生成器142可以使用PLS或PCR建模方法来构建本地模型132。
本地模型生成器142可以以在线实时的方式构建本地模型132,使得预测单元144然后可以使用经训练的本地模型132通过处理已被查询单元140用来生成查询点的(多个)相同拉曼扫描向量来预测生物制药过程的一个或多个分析测量结果。实际上,在一些实施例中,每一次拉曼分析仪106向计算机110提供新的拉曼扫描向量(或一组新的拉曼扫描向量)时,查询单元140就可以执行新查询,并且本地模型生成器142就可以生成本地模型132的新版本。然而,在其他实施例中,查询单元140较不频繁地执行新查询(并且本地模型生成器142较不频繁地生成本地模型132的新版本),诸如每10个预测/监测周期一次、或每100个预测/监测周期一次等。
数据库维护单元146还可以使(多个)分析仪器104以比拉曼分析仪106的监测周期显著更低的频率(例如,每天仅一次或两次等)周期性地收集一个或多个实际分析测量结果。在一些实施例中,(多个)分析仪器104的(多个)测量结果可能是破坏性的,并且需要从生物反应器102中的过程中永久去除样品。在数据库维护单元146使(多个)分析仪器104收集并提供(多个)实际分析测量结果的时间或附近,数据库维护单元146还可以使拉曼分析仪106提供一个或多个拉曼扫描向量。数据库维护单元146然后可以使网络接口122经由网络114将(多个)拉曼扫描向量和(多个)相应的实际分析测量结果发送到数据库服务器112,以作为新的观察结果数据集存储在观察结果数据库136中。观察结果数据库132可以根据任何合适的定时来更新,该定时可以根据实施例而变化。例如,如果(多个)分析仪器104在测量样品的几秒内输出实际分析测量结果,则观察结果数据库132可以在采样时几乎立即被新的测量结果更新。然而,在某些其他实施例中,实际分析测量结果可以是由(多个)分析仪器104中的一个或多个分析仪器进行的几分钟、几小时或甚至几天的处理的结果,在这种情况下,观察结果数据库132直到这种处理已经完成之后才被更新。在仍其他实施例中,随着分析仪器104中的不同分析仪器完成其各自的测量结果,可以以增量方式将新的观察结果数据集添加到观察结果数据库132。
因此,观察结果数据库136提供了可以由本地模型生成器142用来进行模型训练的过去观察结果的“动态库”。在一些实施例中,总是将(多个)最近的分析测量结果添加到观察结果数据库136,并且本地模型生成器142在校准本地模型132时可以总是使用观察结果数据库136中的(多个)最新的观察结果数据集。这可以允许本地模型132对来自最新过去的过程信息进行编码,并快速适应新条件,或者快速适应没有历史的新过程条件。此外,对本地模型132的校准和维护可以是自动的。在一些实施例中,例如如下面结合A-JITL技术和ST-JITL技术所讨论的,进一步增强了本地模型132的适应性。
在一些实施例中,数据库维护单元146可以使(多个)分析仪器104基于某个其他时间或者在诸如当前模型性能等条件下收集并提供(多个)实际分析测量结果。例如,如果本地模型132将可信度区间(例如,在预测值附近的值范围,在该范围内存在95%的概率或置信度表明实际值/测量值将下降)、或某个其他置信度指标与预测一起输出(例如,如果本地模型132是高斯过程模型),并且如果置信度指标显示出特别不可靠的预测(例如,如果区间/范围超过阈值宽度/范围等),则数据库维护单元146可以触发对一个或多个实际分析测量结果的收集。作为更具体的示例,数据库维护单元146可以响应于确定95%的可信度区间超过预定义阈值而触发对(多个)分析测量结果的收集。对分析测量结果的最佳调度将在下面进一步详细讨论。在进行了(多次)测量之后,数据库维护单元146可以使拉曼分析仪106生成一个或多个拉曼扫描向量,并且使网络接口122向数据库服务器112提供(多个)实际分析测量结果和(多个)相应的拉曼扫描向量,以作为新的观察结果数据集存储在观察结果数据库132中(例如,以上面讨论的方式)。然后,在校准本地模型132时,本地模型生成器142可以在适当的情况下(例如,取决于与当前查询的相关性,或者该实施例是否始终利用最新的观察结果数据集)利用这个最近的观察结果数据集。
在生物反应器中的生物制药过程的整个生命周期中,上述一些或全部过程可以重复多次,以便使用校准和维护均是完全自动且实时的本地模型来连续监测该过程。取决于实施例和/或场景,可以出于各种目的来预测(多个)分析测量结果。例如,作为质量控制过程的一部分,可以监测(即,预测)某些参数以确保该过程仍然符合相关规范。作为另一示例,可以监测/预测一个或多个参数以在闭环控制系统中提供反馈。例如,图2描绘了系统150,该系统类似于系统100,但是试图控制生物制药过程中的葡萄糖浓度(即,试图使预测的葡萄糖浓度在某个可接受的容差内与期望的设定点相匹配)。应当理解,在其他实施例中,系统150可以替代地(或者也可以)用于控制除葡萄糖水平以外的过程参数,或者基于对一个或多个其他过程参数(例如,乳酸盐水平)的预测来控制葡萄糖水平。在图2中,使用相同的附图标记来指示图1的相应部件。例如,图2的JITL预测器应用程序130可以与图1的JITL预测器应用程序130相同(其中,为了清楚起见,JITL预测器应用程序130的各个单元未在图2中示出)。
如图2中看出的,在系统150内,存储器128还存储控制单元152。控制单元152被配置成控制葡萄糖泵154,即,使葡萄糖泵154选择性地将附加的葡萄糖引入生物反应器102内的生物制药过程中。控制单元152可以包括例如由处理单元120执行的软件指令、和/或适当的固件和/或硬件。在一些实施例中,控制单元152使用葡萄糖浓度作为闭环架构中的输入来实施模型预测控制(MPC)技术。在本地模型132为每个预测提供可信度边界或其他置信度指标的实施例中(例如,在本地模型132为高斯过程模型的某些实施例中),控制单元152还可以接受置信度指标作为输入。例如,控制单元152可以基于葡萄糖浓度预测具有足够高的置信度指标(例如,仅基于与不超过某个百分比或绝对测量结果范围的可信度边界相关联的预测,或者仅基于与超过某个最小阈值评分的置信度评分相关联的预测等)而仅生成针对葡萄糖泵154的控制指令,或者可以基于该葡萄糖浓度预测的置信度指标等而增加和/或减少给定预测的权重。
图3描绘了针对使用JITL技术来校准和维护本地高斯过程模型一个示例实施方式的实验结果200。在图3的绘图中,水平虚线202表示葡萄糖浓度设定点,圆圈204表示葡萄糖浓度的实际测量结果(例如,由类似于图1的(多个)分析仪器104之一的分析仪器进行的),实线206表示葡萄糖浓度的预测测量结果(例如,如由类似于本地模型132的模型所预测的),并且阴影区域208表示与预测测量结果相关联的可信度边界(95%的可信度)。如图3中看出的,对于葡萄糖浓度设定点为3克每升(g/L)的情况,使用JITL技术进行的预测通常与分析测量结果很好地吻合。
现在将参考一个具体的JITL实施例在数学上更详细地描述执行查询和构建/校准本地模型132的过程,在该实施例中,本地模型132是使用单个拉曼扫描向量作为输入并预测单个分析测量结果的高斯过程模型:
Figure BDA0003027077540000181
(或者简写为
Figure BDA0003027077540000182
)表示一组有序的输入和输出数据对,使得
Figure BDA0003027077540000183
是输入并且
Figure BDA0003027077540000184
是输出。此外,假设
Figure BDA0003027077540000185
是na维输入向量,并且
Figure BDA0003027077540000186
是标量输出。实际上,
Figure BDA0003027077540000187
可以被认为是光谱测量结果(例如NIR或拉曼),并且
Figure BDA0003027077540000188
被认为是感兴趣状态(例如葡萄糖浓度或乳酸盐浓度)的分析测量结果。给定训练数据集
Figure BDA0003027077540000189
光谱模型校准问题的目的是识别以下形式的模型的输入与输出之间的关系:
bj=f(aj)+∈j 等式(1)
其中,
Figure BDA0003027077540000191
是光谱模型,并且
Figure BDA0003027077540000192
是零均值正态分布的测量结果噪声,其中方差σ2未知。模型校准的标准惯例是假设f(·)是线性的,并且然后使用诸如PLS等方法来训练模型。不是将任何限制或固定形式归因于f(·),而是在此假设f(·)是被建模为高斯过程的隐性函数,使得
Figure BDA0003027077540000193
表示来自高斯过程的随机样品,其中,均值
Figure BDA0003027077540000194
并且协方差函数
Figure BDA0003027077540000195
其通常定义如下:
Figure BDA0003027077540000196
Figure BDA0003027077540000197
而且,
Figure BDA0003027077540000198
表示高斯过程模型的超参数。高斯过程是随机变量的集合,其中任何有限数量的随机变量都具有联合高斯分布,使得对于一组有限输入
Figure BDA0003027077540000199
可以写出:
Figure BDA00030270775400001910
然后,光谱模型校准问题简化为使用
Figure BDA00030270775400001911
来学习隐性高斯过程函数
Figure BDA00030270775400001912
为了数学上的方便和简洁起见,此处假设
Figure BDA00030270775400001913
但是一般情况下不必如此,并且此处的结果可以容易地扩展到
Figure BDA00030270775400001914
的模型。高斯过程中协方差函数的作用类似于支持向量机(SVM)中使用的核的作用。协方差函数的常见选择是高斯核,并且由下式给出:
Figure BDA00030270775400001915
其中,
Figure BDA00030270775400001916
是输入对{ai,aj}之间的协方差。如果集合{ai,aj}中的输入如等式(4)中的欧几里德距离所定义的彼此“接近”,则高斯核kθ(ai,aj)指派较高的相关性。
对于选择高斯核,等式(4)是正定对称矩阵,使得
Figure BDA0003027077540000201
在等式(4)中,集合
Figure BDA0003027077540000202
是一组超参数。实际上,
Figure BDA0003027077540000203
是长度尺度参数,并且
Figure BDA0003027077540000204
是信号方差参数。等式(4)中高斯协方差函数的选择对应于f是平滑且连续的先前假设。因此,通过改变协方差函数的超参数,可以改变f的“平滑性”。在此,假设具有高斯协方差函数的高斯过程。但是,一般情况下不必如此。
给定
Figure BDA0003027077540000205
目的是学习高斯过程的超参数,包括任何其他未知模型参数。对于等式(1)中的高斯过程,一组未知参数为
Figure BDA0003027077540000206
可以通过在未知参数的空间上最大化边缘似然(或证据)函数来执行参数学习步骤。例如,对于等式(1)中的高斯过程,边缘似然函数给出如下:
Figure BDA0003027077540000207
其中,
Figure BDA0003027077540000208
是边缘似然函数,
Figure BDA0003027077540000209
是由下式给出的似然函数:
Figure BDA00030270775400002010
并且,
Figure BDA00030270775400002011
是等式(3)中给出的先验密度函数。对于分别在等式(6)和(3)中的高斯似然和先验密度,等式(5)中的积分具有封闭解,使得边缘似然函数由下式给出:
Figure BDA00030270775400002012
现在给定等式(7),可以通过求解以下优化问题来估计
Figure BDA00030270775400002013
Figure BDA00030270775400002014
其中,γ*∈Γ是最优估计。根据等式(7),我们有:
Figure BDA00030270775400002015
其中,
Figure BDA00030270775400002016
为了求解等式(8)中的优化问题,关于γ确定等式(9)的偏导数,使得对于所有r=1,2,...,nγ
Figure BDA0003027077540000211
其中,
Figure BDA0003027077540000212
给定等式(7)中的边缘似然函数及其在等式(10b)中的导数,可以使用梯度下降法来求解等式(8)。由于等式(8)通常是具有多个局部最优值的非凸优化问题,因此在求解优化问题时必须谨慎。此处假设γ*是已知的或者可以通过求解等式(8)来计算。此外,除非另有说明,否则为了减轻表示法负担,将在此假设γ是最优估计γ*
一旦训练了等式(1)中的高斯过程光谱校准模型,就可以将其部署用于实时预测应用。如前所述,令
Figure BDA0003027077540000213
为用于训练高斯过程模型的训练数据集,并令
Figure BDA0003027077540000214
为新的测试光谱信号。然后,目的是预测与测试输入a*相对应的输出
Figure BDA0003027077540000215
计算b*的第一步是以训练输入集
Figure BDA0003027077540000216
和测试输入a*为条件来构造所有训练输出集
Figure BDA0003027077540000217
和测试高斯过程输出f(a*)的联合密度。此联合密度给出如下:
Figure BDA0003027077540000218
其中,
Figure BDA0003027077540000219
给定等式(11),在贝叶斯框架下,通过构造所有高斯过程输出上的分布来计算高斯过程输出f(a*)。换言之,我们寻求高斯过程输出f(a*)的后验分布。当然,f(a*)上的后验分布只需要包括与训练集
Figure BDA00030270775400002110
一致的那些函数。在概率设置下,可以通过使等式(11)中的联合分布以训练集
Figure BDA00030270775400002111
为条件来计算f(a*)上的后验分布,从而给出下式:
Figure BDA00030270775400002112
其中,
Figure BDA00030270775400002113
是高斯过程输出的后验分布,并且
Figure BDA00030270775400002114
由下式给出:
Figure BDA00030270775400002115
并且
Figure BDA00030270775400002116
由下式给出:
Figure BDA0003027077540000221
给定等式(12),输出b*的预测后验分布可以计算如下:
Figure BDA0003027077540000222
其中,
Figure BDA0003027077540000223
Figure BDA0003027077540000224
分别在等式(13)和(14)中给出。对于单个测试输入
Figure BDA0003027077540000225
等式(15)中的高斯过程预测给出了实现非零概率的输出的分布。在诸如控制和监测等实时应用中,人们可能会对点估计感兴趣,而不是对整个分布感兴趣。可以使用决策理论方法来计算点估计。可以表明,对于等式(15)中的高斯后验分布,均值函数使预期的绝对风险函数和平方风险函数两者最小化,其中,
Figure BDA0003027077540000226
是输入a*的最可能输出。此外,对于选择
Figure BDA0003027077540000227
作为预测,由下式给出大约95%的可信度区间:
Figure BDA0003027077540000228
等式(16)中的区间可以用于评估高斯过程预测的质量,和/或用于设计基于高斯过程的模型预测控制或其他稳健的监测策略。
现在转到响应于查询来选择相关样品(此处为观察结果数据集),问题是对于给定的查询点
Figure BDA0003027077540000229
以及包含
Figure BDA00030270775400002210
个输入输出对(观察结果数据集)的中央数据库/库
Figure BDA00030270775400002211
在时间
Figure BDA00030270775400002212
选择包含
Figure BDA00030270775400002213
个样品的本地训练集
Figure BDA00030270775400002214
其中,D<<L。假设
Figure BDA00030270775400002215
是动态的,并且在活动期间可能包括不同的条目。存在许多方法用于从
Figure BDA00030270775400002216
构造
Figure BDA00030270775400002217
出于此分析的目的,基于集合
Figure BDA00030270775400002218
中的光谱(例如,拉曼扫描向量)之间的欧几里得距离来选择
Figure BDA00030270775400002219
尽管据报道,在某些情况下,JITL框架中的基于欧几里得的相似性度量是次优的,但当使用高斯过程模型时,它们可能是有益的选择。这是因为高斯过程模型本身基于欧几里得距离。高斯核仅在集合{ai,aj}中的输入彼此“接近”时才指派较高的相关性。因此,通过创建其中所有输入都“接近”查询点的本地训练集
Figure BDA00030270775400002220
可以确保本地高斯过程模型捕获最大的“相关性”以预测查询点处的输出。
在下面的算法1中提供了示例算法,其正式概述了用于从
Figure BDA0003027077540000231
创建本地训练集
Figure BDA0003027077540000232
使用此训练集来训练高斯过程模型并使用已训练的模型进行预测的方法:
Figure BDA0003027077540000233
算法1
现在转到图4,示出了当使用如本文所描述的JITL技术来分析生物制药过程时可能发生的示例数据流250。例如,数据流250可能在图1的系统100、或图2的系统150内发生。在数据流250中,由光谱仪/探针提供光谱数据252。例如,光谱数据252可以包括由拉曼分析仪106生成的拉曼扫描向量、或者NIR扫描向量等。查询点254是(例如,由查询单元140)基于光谱数据252生成的,并且被用于查询全局数据集256,该全局数据集可以包括例如观察结果数据库136中的所有观察结果数据集。基于该查询,在全局数据集256内识别局部数据集258。如上所述,例如可以基于相关性标准(例如,欧几里得距离)来选择局部数据集258。
然后将局部数据集258(例如,由本地模型生成器142)用作训练数据以校准本地模型260(例如,本地模型132)。然后(例如,由预测单元144)使用本地模型132来预测输出(分析测量结果)262,该输出诸如培养基成分浓度、培养基状态(例如,葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨、氨基酸、Na+、K+和其他营养素或代谢物、pH、pCO2、pO2、温度、渗透压等)、活细胞密度、滴度、关键质量属性、细胞状态等,并且还可能输出可信度边界或另一合适的置信度指标。
虽然(例如,如算法1和数据流250中的)基于JITL的本地模型提供了稳健的非线性建模框架,但这种方法不具有用于适应时变过程变化的固有机制。为了解决这个缺点,一些实施例可以使用“自适应”JITL(A-JITL)策略。如以上所指出的,当新样品变得可用时,这些样品可以包括在
Figure BDA0003027077540000241
中。在此类实施例中(即,
Figure BDA0003027077540000242
是动态的实施例中),
Figure BDA0003027077540000243
可以表示为
Figure BDA0003027077540000244
在一个这样的实施例中,实施了移动时间窗口方法,在该方法中,将新获得的样品添加到
Figure BDA0003027077540000245
中并且从
Figure BDA0003027077540000246
中移除最旧的样品。丢弃最旧的样品可能是有益的,因为在自适应策略中,保持
Figure BDA0003027077540000247
的大小对于确保整个JITL框架的计算易处理性可能至关重要。但是,这种方法的一个主要问题是,简单地丢弃旧样品可能会导致信息丢失,因为旧样品可能包含相关信息。
为了避免这种信息丢失,在一个实施例中,将新样品添加到
Figure BDA0003027077540000248
中而不移除任何旧的/现有的样品。因此,在新的分析测量结果变得可用时,中央数据库
Figure BDA0003027077540000249
随着样品数的增加而扩展。在细胞培养过程应用中,扩展数据库可能不会引起任何重大的计算问题,因为这样的过程通常作为持续两到三周的分批时间的分批过程来操作。这自然限制了要包括在
Figure BDA00030270775400002410
中的新样品的数量。此外,在细胞培养过程分批的过程中通常仅采样有限数量的分析测量结果(例如,不同于频繁采样分析测量结果的化学工业)。因此,通常仅适度增加数据库
Figure BDA00030270775400002411
的大小,而不会对整个JITL框架的计算稳定性造成任何重大影响。
虽然将新样品包括在
Figure BDA00030270775400002412
中对于(上面的)算法1的不断自适应非常重要,但此方法的成功依赖于选择本地数据库
Figure BDA00030270775400002413
中的那些新样品用于本地模型校准。算法1(该算法基于欧几里德距离从
Figure BDA00030270775400002414
中选择用于
Figure BDA00030270775400002415
的样品(例如,算法1的第6行))可以被称为“空间相关”方法,因为其仅对空间中相关(接近)的样品进行优先级排序。如果新样品不接近查询样品,这可能是发生突然设定点变化(或其他突然过程条件变化)的情况,则算法1可能无法将这些样品包括在
Figure BDA0003027077540000251
中。另一方面,递归方法(例如,正则化的偏最小二乘(RPLS)、递归最小二乘(RLS)和递归N向偏最小二乘(RNPLS))是“时间相关的”,因为它们对最近的测量结果进行优先级排序而不考虑空间相关性。使用最近的样品更新本地模型可以使递归方法成功地适应当前过程条件。
一个这样的实施例(在本文中被称为“自适应”JITL(A-JITL))对在空间和时间上都相关的样品进行优先级排序。令
Figure BDA0003027077540000252
表示从当前实验(即发生查询a*的实验/过程)开始之前可用的一组L个历史测量结果,并且令
Figure BDA0003027077540000253
表示从当前实验中可用的一组n个测量结果,可以按以下方式重新分配样品:
Figure BDA0003027077540000254
Figure BDA0003027077540000255
其中,
Figure BDA0003027077540000256
表示中央数据库,并且
Figure BDA0003027077540000257
表示一组最近的(最新的)k个测量结果。在一些实施例中,
Figure BDA0003027077540000258
包含来自当前实验/过程的最近的k个样品,并且
Figure BDA0003027077540000259
包含来自先前实验/过程的样品、以及(潜在地)来自当前实验/过程的早于该最近k个样品的样品。以上等式(17a)和(17b)是针对给定查询a*定义的。对于在另一个时刻进行的查询,数据集
Figure BDA00030270775400002510
Figure BDA00030270775400002511
可能包含不同的样品,这取决于在这个时刻可用的测量结果的数量。例如,一旦样品
Figure BDA00030270775400002512
可用,就从
Figure BDA00030270775400002513
中移除
Figure BDA00030270775400002514
并且将
Figure BDA00030270775400002515
包括在
Figure BDA00030270775400002516
中。然后将丢弃的样品
Figure BDA00030270775400002517
包括在
Figure BDA00030270775400002518
中以防止任何信息丢失。用最近的测量结果来更新
Figure BDA00030270775400002519
确保了
Figure BDA00030270775400002520
至少反映一些当前条件。
给定
Figure BDA00030270775400002521
Figure BDA00030270775400002522
目的是选择
Figure BDA00030270775400002523
如以上所指出的,对于A-JITL,空间相关样品和时间相关样品都包括在
Figure BDA00030270775400002524
中。如果假设
Figure BDA00030270775400002525
可以分解为:
Figure BDA0003027077540000261
其中,
Figure BDA0003027077540000262
Figure BDA0003027077540000263
分别是空间相关集合和时间相关集合,则目标是选择
Figure BDA0003027077540000264
Figure BDA0003027077540000265
首先,假设
Figure BDA0003027077540000266
使得
Figure BDA0003027077540000267
仅包含唯一的样品。为了设计
Figure BDA0003027077540000268
根据基于距离的(空间)度量(诸如“相似性指数”或“s值”)从
Figure BDA0003027077540000269
中选择D-k个样品:
sixsim(ai,a*)=exp(-||ai-a*||)。 等式(19)
例如,等式(19)可以用作上述(非自适应)JITL技术中的相似性度量。因此,例如,可以从
Figure BDA00030270775400002610
中选择具有最大s值的D-k个样品以包括在
Figure BDA00030270775400002611
中。为了设计
Figure BDA00030270775400002612
如果假设来自当前实验/过程的最近k个样品是时间相关的,则在一些实施例中
Figure BDA00030270775400002613
可以被定义为等于
Figure BDA00030270775400002614
应当注意,与确定
Figure BDA00030270775400002615
中的样品成员资格的s值不同,基于采样时间来确定
Figure BDA00030270775400002616
中的成员资格。当然,取决于场景,
Figure BDA00030270775400002617
中的样品可能会表现出较大的s值。不论s值如何,
Figure BDA00030270775400002618
仅被假设为是时间相关的。类似地,
Figure BDA00030270775400002619
仅是空间相关的,因为通过构造,
Figure BDA00030270775400002620
不具有时间相关性。应当注意的是,
Figure BDA00030270775400002621
Figure BDA00030270775400002622
是针对给定查询a*定义的,
Figure BDA00030270775400002623
中的样品是基于它们关于a*计算的s值来选择的,并且
Figure BDA00030270775400002624
中的样品是基于它们关于a*的采样时间计算的采样时间来选择的。为了方便,
Figure BDA00030270775400002625
Figure BDA00030270775400002626
一般定义如下:
Figure BDA00030270775400002627
Figure BDA00030270775400002628
其中,
Figure BDA00030270775400002629
Figure BDA00030270775400002630
分别是来自拉曼光谱仪的空间相关样品和时间相关样品,并且
Figure BDA00030270775400002631
Figure BDA00030270775400002632
分别是来自分析仪器的空间相关样品和时间相关样品,使得
Figure BDA00030270775400002633
Figure BDA00030270775400002634
将等式(20a)和(20b)代入等式(18)中得到集合
Figure BDA00030270775400002635
一般表示为
Figure BDA00030270775400002636
其中
Figure BDA00030270775400002637
并且
Figure BDA00030270775400002638
与上面讨论的(非自适应)JITL技术相比,本地库/数据集
Figure BDA0003027077540000271
对空间相关且时间相关的样品进行优先级排序。给定
Figure BDA0003027077540000272
和查询a*,可以校准等式(1)中的高斯过程模型(例如,本地模型132)。a*处的点估计和可信度区间可以分别使用等式(13)和(16)来计算,其中
Figure BDA0003027077540000273
Figure BDA0003027077540000274
由下式给出:
Figure BDA0003027077540000275
Figure BDA0003027077540000276
其中,
Figure BDA0003027077540000277
Figure BDA0003027077540000278
是分别与
Figure BDA0003027077540000279
Figure BDA00030270775400002710
相关联的协方差函数,并且其中
Figure BDA00030270775400002711
Figure BDA00030270775400002712
Figure BDA00030270775400002713
之间的协方差。
在下面的算法2中提供了正式概述A-JITL技术的示例算法:
Figure BDA0003027077540000281
算法2
因此,算法2将JITL(空间相关)与递归学习(时间相关)相结合。例如,对于
Figure BDA0003027077540000282
使用算法2对本地模型132的校准类似于空间相关的JITL,而对于
Figure BDA0003027077540000283
使用算法2对本地模型132的校准类似于递归学习。因此,通过调整
Figure BDA0003027077540000284
Figure BDA0003027077540000285
可以对(非递归)JITL和递归学习进行适当的平衡。
现在转到图5,示出了当使用如本文所描述的A-JITL技术来分析生物制药过程时可能发生的示例数据流300。例如,数据流300可能在图1的系统100、或图2的系统150内发生。在数据流300中,由光谱仪/探针提供光谱数据302。例如,光谱数据302可以包括由拉曼分析仪106生成的拉曼扫描向量、或者NIR扫描向量等。查询点304是(例如,由查询单元140)基于光谱数据302生成的,并且被用于查询全局数据集306,该全局数据集可以包括例如观察结果数据库136中的所有观察结果数据集。全局数据集306在逻辑上被分为最近的k个条目307A(例如,全部来自当前实验/过程)和在该最近k个条目307A之前的所有条目307B(例如,来自先前的实验/过程、以及还可能来自当前实验/过程)。可以基于查询点304的样品数来确定k的值。如本文所使用的,术语“样品数”可以广义地指代与给定样品/观察结果相关联的时间或相对时间的任何指标。基于与查询点304的空间相似性(例如,欧几里得距离)将条目307B中的某些条目添加到局部数据集308中,同时可以将所有条目307A添加到局部数据集308中而不考虑空间相似性。例如,可以根据算法2从条目307A和条目307B生成局部数据集308。
然后将局部数据集308(例如,由本地模型生成器142)用作训练数据以校准本地模型310(例如,本地模型132)。然后使用本地模型310(例如,由预测单元144)来预测输出(分析测量结果)312,该输出诸如培养基成分浓度、培养基状态(例如,葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨、氨基酸、Na+、K+和其他营养素或代谢物、pH、pCO2、pO2、温度、渗透压等)、活细胞密度、滴度、关键质量属性、细胞状态等,并且还可能输出可信度边界或另一合适的置信度指标。
如果实际分析测量结果(例如,由诸如(多个)分析仪器104之一等分析仪器进行的测量结果)可用,则创建新条目314并将其添加到全局数据集306中。例如,此类测量结果可以是基于周期性采样(例如,每天一次或两次)可用的,和/或可以是响应于具有可变定时的触发而变得可用的(例如,如果连续一定数量的预测具有不可接受的宽可信度边界等),如下面进一步讨论的。
虽然将空间相关样品和时间相关样品包括在
Figure BDA0003027077540000301
中对于上面讨论的A-JITL方法的不断自适应是必要的,但是由A-JITL实现的总体适应程度取决于
Figure BDA0003027077540000302
用于本地模型校准的有效程度。对于查询样品/查询点a*,空间相关样品
Figure BDA0003027077540000303
提供了函数(f(a*),f(ai))之间的高度相关性。这是因为,对于查询a*,(ai,bi)的空间相关性以及(f(a*),f(ai))之间的相关性都是基于(ai,a*)之间的欧几里得距离来计算的。因此,对于等式(19)中基于欧几里得的相似性度量和等式(4)中基于欧几里得的核的选择,
Figure BDA0003027077540000304
中的样品预期提供较高的函数相关性。相反,时间相关样品
Figure BDA0003027077540000305
可能无法提供函数
Figure BDA0003027077540000306
之间的强烈相关性。这是因为,如以上所指出的,
Figure BDA0003027077540000307
中的样品不一定是空间相关的。结果,如果(aj,bj)的空间相关性很小,则(f(a*),f(aj))之间的归因于等式(4)中高斯核的相关性将很小。从建模的角度来看,用带有较小相关性的样品来训练等式(1)中的高斯过程模型是不希望的,因为这会导致较差的模型性能。从数学上讲,这可以证明如下。
对于查询a*以及算法2的经校准高斯过程模型,可以使用等式(13)来计算模型预测
Figure BDA0003027077540000308
不失一般性,如果σ2=0(在无噪声的情况下),则可以如下写出等式(13):
Figure BDA0003027077540000309
如果
Figure BDA00030270775400003010
具有可忽略的空间相关性(即,
Figure BDA00030270775400003011
与a*之间的s值无限大),则等式4得出
Figure BDA00030270775400003012
此外,通过构造,由于
Figure BDA00030270775400003013
与a*的距离近于与
Figure BDA00030270775400003014
的距离,因此结果是
Figure BDA00030270775400003015
并且
Figure BDA00030270775400003016
将它们代入等式(23)中,得出
Figure BDA00030270775400003017
从等式(24c)可以清楚地看出,点估计与
Figure BDA0003027077540000311
无关。类似地,可以表明等式(16)也与
Figure BDA0003027077540000312
无关。例如,等式(16)中的
Figure BDA0003027077540000313
可以计算如下:
Figure BDA0003027077540000314
Figure BDA0003027077540000315
从等式(25b)和(25c)可以看出,使用了几种近似,包括
Figure BDA0003027077540000316
Figure BDA0003027077540000317
从等式(20a)和(20b)明显可以看出,如果
Figure BDA0003027077540000318
具有有限的空间相关性,则算法2无法很好地利用该集合。
在一些实施例中,为了确保
Figure BDA0003027077540000319
中的空间相关样品和时间相关样品能够做出贡献,使用“时空”JITL(ST-JITL)方法,并使用以下时空拉曼模型(例如,作为本地模型132):
bi=g(ai,ti)+∈i, 等式(26)
其中,g:
Figure BDA00030270775400003110
是时空拉曼模型并且ti是ai的样品数,并且
Figure BDA00030270775400003111
是具有零均值和未知方差
Figure BDA00030270775400003112
的独立高斯随机变量序列。与等式(1)相比,等式(26)的时空模型取决于光谱信号及其采样时间。如上所述,假设g是被建模为高斯过程的隐性函数,使得对于任何输入(a,t),
Figure BDA00030270775400003113
是随机函数。为了方便起见,假设等式(27)中的均值函数为零,但是一般情况下不必如此。此外,对于任意输入(ai,ti)和(aj,tj),协方差函数rθ(aiajtitj)可以定义如下:
rθ(aiajtitj)=k空间(ai,aj)+k时间(ti,tj), 等式(28)
其中,
Figure BDA0003027077540000321
Figure BDA0003027077540000322
分别是(g(ai,ti),g(aj,tj))之间的空间协方差和时间协方差。应当注意,对于查询(a*,t*),如果样品
Figure BDA0003027077540000323
具有可忽略的空间相关性,则k空间(aj,a*)≈0但k时间(tj,t*)>0,使得等式(28)定义(g(a*,t*),g(aj,tj))之间的非零相关性。最后,应当注意,等式(28)是有效的协方差函数,因为两个独立核的总和也是核。假设k空间和k时间是高斯核,使得对于任何输入对(ai,ti)和(aj,tj),
Figure BDA0003027077540000324
Figure BDA0003027077540000325
其中,
Figure BDA0003027077540000326
是核参数。给定等式(29a)和(29b),如果(ai,ti),(aj,tj)彼此接近,则等式(28)归因于(g(ai,ti),g(aj,tj))之间的高度相关性。如果
Figure BDA0003027077540000327
Figure BDA0003027077540000328
分别表示
Figure BDA0003027077540000329
中的状态相关样品和时间相关样品的样品数,使得
Figure BDA00030270775400003210
则对于查询(a*,t*),等式(28)中的协方差函数rθ可以写成:
Figure BDA00030270775400003211
Figure BDA00030270775400003212
应当注意,与变量a和b不同,等式(30a)和(30b)中t的作用仅仅是为了提高
Figure BDA00030270775400003213
的贡献。实际上,给定a,变量t不会对b造成影响。因此,如果
Figure BDA00030270775400003214
被定义为与
Figure BDA00030270775400003215
中的样品相对应的样品数,则
Figure BDA00030270775400003216
可以被定义为使得其满足以下等式:
|ti-tj|>>M, 等式(31a)
|ti-t*|>>N, 等式(31b)
|ti-tk|>>P,等式(31c)
对于所有i,j∈{1,...,D-k}和k∈{D-k+1,...,D},其中,
Figure BDA0003027077540000331
是任意的大正常数。此外,如果假设
Figure BDA0003027077540000332
和t*为使得
Figure BDA0003027077540000333
Figure BDA0003027077540000334
则对于上述
Figure BDA0003027077540000335
Figure BDA0003027077540000336
Figure BDA0003027077540000337
可以写成如下:
Figure BDA0003027077540000338
其中,等式(32b)来自等式(31a),其使
Figure BDA0003027077540000339
中的非对角项趋于零。类似地,协方差
Figure BDA00030270775400003310
Figure BDA00030270775400003311
可以计算如下:
Figure BDA00030270775400003312
Figure BDA00030270775400003313
其中,等式(33b)基于等式(31b),并且等式(33d)基于等式(31c)。将等式(32b)、(33b)和(33d)代入等式(30a)和(30b)中得出:
Figure BDA00030270775400003314
Figure BDA00030270775400003315
从等式(30a)和(30b)可以很容易地确认协方差rθ包括k空间和k空间两者的贡献。给定等式(30a)和(30b)中的时空拉曼模型的协方差函数,可以通过最大化下式来估计核参数θ和噪声方差σ2
Figure BDA00030270775400003316
其中
Figure BDA00030270775400003317
是对数边缘似然函数,并且rγ=rθ+IDxD。在Γ上最大化等式(35)得出最优估计γ*。对于基于梯度的优化器,可以以类似于等式(10b)的方式来计算等式(35)相对于γ的梯度。给定γ*,针对查询(a*,t*)的点估计和后验方差可以计算为:
Figure BDA0003027077540000341
Figure BDA0003027077540000342
其中,协方差函数在等式(34a)和(34b)中给出。类似地,等式(36a)中的点估计上的可信度边界
Figure BDA0003027077540000343
可以计算如下:
Figure BDA0003027077540000344
Figure BDA0003027077540000345
其中,
Figure BDA0003027077540000346
从等式(36a)、(37a)和(37b)可以很容易地看出,空间相关样品和时间相关样品都对模型预测和可信度边界计算有贡献。最后,将等式(34a)和(34b)代入等式(36a)和(36b)中分别得出后验均值和方差。应当注意,与算法2的情况不同,即使在
Figure BDA0003027077540000347
不具有空间相关性的情况下,等式(36a)中的模型预测以及等式(37a)和(37b)中的可信度区间也取决于
Figure BDA0003027077540000348
例如,当
Figure BDA0003027077540000349
不具有空间相关性(即,
Figure BDA00030270775400003410
Figure BDA00030270775400003411
时,则等式(36a)和(36b)可以写为:
Figure BDA00030270775400003412
Figure BDA00030270775400003413
从上面可以看出,等式(38a)和(38b)仍然包括来自k空间和k时间两者的贡献。在下面的算法3中提供了正式概述ST-JITL技术的示例算法:
Figure BDA0003027077540000351
算法3
应当注意,对于β1=0的情况,A-JITL和ST-JITL(分别在算法2和算法3中)可以是相同的。这是因为,对于β1=0,k时间=0,使得rθ=k空间=kθ(如从等式(28)和(29b)看出)。
现在转到图6,示出了当使用如本文所描述的ST-JITL技术来分析生物制药过程时可能发生的示例数据流350。例如,数据流350可能在图1的系统100、或图2的系统150内发生。在数据流350中,由光谱仪/探针提供光谱数据352。例如,光谱数据352可以包括由拉曼分析仪106生成的拉曼扫描向量、或者NIR扫描向量等。查询点354是(例如,由查询单元140)基于光谱数据352生成的,并且被用于查询全局数据集356,该全局数据集可以包括例如观察结果数据库136中的所有观察结果数据集。全局数据集356在逻辑上被分为最近的k个条目357A(例如,全部来自当前实验/过程)和在该最近k个条目357A之前的所有条目357B(例如,来自先前的实验/过程、以及还可能来自当前实验/过程)。可以基于查询点354的样品数来确定k的值。例如,可以根据算法3从条目357A和条目357B生成局部数据集358。
然后将局部数据集358(例如,由本地模型生成器142)用作训练数据以校准本地模型360(例如,本地模型132)。然后(例如,由预测单元144)使用本地模型360来预测输出(分析测量结果)362,该输出诸如培养基成分浓度、培养基状态(例如,葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨、氨基酸、Na+、K+和其他营养素或代谢物、pH、pCO2、pO2、温度、渗透压等)、活细胞密度、滴度、关键质量属性、细胞状态等,并且还可能输出可信度边界或另一合适的置信度指标。
如果实际分析测量结果(例如,由诸如(多个)分析仪器104之一等分析仪器进行的测量结果)可用,则创建新条目364(包括其样品数)并将其添加到全局数据集356中。例如,此类测量结果可以是基于周期性采样(例如,每天一次或两次)可用的,和/或可以是响应于具有可变定时的触发而变得可用的(例如,如果连续一定数量的预测具有不可接受的宽可信度边界等)。
如以上所指出的,可以基于一个或多个本地模型(例如,本地模型132、260、310或360)的当前和/或最新的性能来调度/触发分析测量,以便维持或提高预测准确性,同时减少资源使用(例如分析仪器的使用)。例如,这种技术可以与A-JITL、ST-JITL或单纯的JITL一起使用。
在一个实施例中,可信度区间被用来触发模型维护。具体地,如果围绕给定模型预测(例如,围绕由本地模型132、260、310或360进行的最新预测)的可信度区间的宽度(例如,如使用等式(16)或等式(37a)、(37b)计算的可信度边界之间的距离)大于预定义阈值,则数据库维护单元146可以生成请求消息,并使计算机110将该消息发送到(多个)分析仪器104以请求测量结果。在图3的示例结果中,例如,数据库维护单元146可能会在日期12/08/17、12/09/17和12/14/17结束附近触发新的分析测量结果,其中阴影区域208指示较宽可信度区间(即,bU-bL中的较大值)。
响应于该请求消息,(多个)分析测量104执行(多次)测量,并将(多个)测量结果提供给计算机110。然后,数据库维护单元146可以将该(多个)测量结果以及从拉曼分析仪106接收到的(多个)相应拉曼扫描向量发送到数据库服务器112,以存储在观察结果数据库136中。例如,可以将该(多个)测量结果和(多个)扫描向量添加到上面讨论的库
Figure BDA0003027077540000371
(对于单纯的JITL)或库
Figure BDA0003027077540000372
(对于A-JITL或ST-JITL)中。
相反,如果围绕给定模型预测的可信度区间的宽度不大于预定义阈值,则数据库维护单元146可以不请求新的分析测量结果,在这种情况下,观察结果数据库136中的库保持不变。在(多个)分析仪器104包括测量不同的特性(诸如培养基成分浓度、培养基状态(例如,葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨、氨基酸、Na+、K+和其他营养素或代谢物、pH、pCO2、pO2、温度、渗透压等)、活细胞密度、滴度、关键质量属性、细胞状态等)的多个仪器、并且单独的本地模型被用来预测各种不同特性值的实施例中,可以针对每个预测的属性以及测量此属性的分析仪器分别实施调度过程,其中可能每个属性具有不同的可信度区间宽度阈值。
在数学上,数据库维护单元146可以在以下条件下在查询点a*处调度/触发(多次)新的分析测量:
bU-bL>THR, 等式(39)
其中,THR是用户定义的阈值。在一些实施例中,THR可以由用户调整以适合特定的应用或用例。例如,用户可以为模型可靠性至关重要的应用设置相对较小的THR值(由数据库维护单元146使用),从而使得更频繁地发生模型/库维护操作。通常,可以基于过程关键性、基于正在预测的参数(诸如培养基成分浓度、培养基状态(例如,葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨、氨基酸、Na+、K+和其他营养素或代谢物、pH、pCO2、pO2、温度、渗透压等)、活细胞密度、滴度、关键质量属性、细胞状态等)、和/或基于当前时间段(例如,在培养后期使用与初期相比较低的THR)将THR设置为不同的值。THR的选择表示模型准确性与资源(分析仪器)使用之间的折衷,其中较低的阈值往往以增加资源使用为代价来提高模型准确性。
这个调度协议的变型也是可能的。例如,在一个实施例中,数据库维护单元146可以将一个或多个模型性能标准不仅应用于当前(最新)预测,而且还应用于一个或多个其他最新预测(例如,最新的N个预测,其中,N>1)。作为这样的实施例的示例,数据库维护单元146可以为最新的N个预测(N≥1)计算可信度区间的平均宽度,并且然后将此平均宽度与阈值THR进行比较。作为另一示例,数据库维护单元146可以在最近的Y个预测中识别出X个最大的可信度区间宽度(X<Y),并且仅当这X个宽度中的每一个都大于阈值THR时才调度/触发新的分析测量。
图7是用于分析生物制药过程(例如,用于监测和/或控制目的)的示例方法400的流程图。例如,方法400可以由诸如图1或图2的计算机110等计算机(例如,通过处理单元120执行JITL预测器应用程序130的指令)来设施,和/或由诸如图1或图2的数据库服务器112等服务器来实施。
在框402处,确定与由光谱系统(例如,由系统100或系统150的拉曼分析仪104和拉曼探针106)对生物制药过程进行的扫描相关联的查询点。例如,可以至少部分地基于由光谱系统在扫描生物制药过程时所生成的光谱扫描向量(例如,拉曼扫描向量或NIR扫描向量)来确定查询点。取决于实施例,可以基于原始光谱扫描向量或在对原始光谱扫描向量进行合适的滤波预处理之后确定查询点。在一些实施例中,例如,还基于其他信息来确定查询点,这些其他信息诸如与生物制药过程相关联的培养基配置(例如,流体类型、特定营养素、pH水平等)和/或分析生物制药过程时的一个或多个操作条件(例如,代谢物浓度设定点等)。
在框404处,查询观察结果数据库(例如,观察结果数据库136)。观察结果数据库可以包含与许多生物制药过程的过去观察结果相关联的观察结果数据集。每个观察结果数据集可以包括光谱数据(例如,拉曼扫描向量或NIR扫描向量)和相应的分析测量结果(或者在一些实施例中,两个或更多个分析测量结果)。例如,分析测量结果可以是培养基成分浓度、培养基状态(例如,葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨、氨基酸、Na+、K+和其他营养素或代谢物、pH、pCO2、pO2、温度、渗透压等)、活细胞密度、滴度、关键质量属性和/或细胞状态。
框404可以包括从这些观察结果数据集中选择满足关于该查询点的一个或多个相关性标准的那些观察结果数据集作为训练数据。例如,如果查询点包括光谱扫描向量,则框404可以包括将该光谱扫描向量与同表示在观察结果数据库中的每个过去观察结果相关联的光谱扫描向量进行比较(例如,通过计算(1)确定该查询点所基于的光谱扫描向量与(2)同过去观察结果相关联的每个光谱扫描向量之间的欧几里得距离或其他距离,并且然后选择与这些过去观察结果相关联的光谱扫描向量中的、被确定为在确定该查询点所基于的光谱扫描向量的阈值距离之内的任何光谱扫描向量作为训练数据)。
在框406处,使用所选训练数据来校准特定于正在监测的生物制药过程的本地模型。在框406处,训练本地模型(例如,本地模型132)以基于光谱数据输入(例如,拉曼光谱扫描向量或NIR光谱扫描向量)来预测分析测量结果。在一些实施例中,该本地模型是高斯过程机器学习模型。
在框408处,使用本地模型来预测生物制药过程的分析测量结果。框408可以包括使用本地模型来分析光谱系统在扫描生物制药过程时所生成的光谱数据(例如,拉曼扫描向量或NIR扫描向量)。例如,框408可以包括通过使用本地模型来处理查询点所基于的同一扫描向量或其他光谱数据来预测分析测量结果。取决于实施例,本地模型可以用于分析原始光谱数据(例如,原始拉曼扫描向量),或者用于在对原始光谱数据进行合适的滤波预处理之后分析光谱数据。在一些实施例中,框408还包括确定与生物制药过程的所预测分析测量结果相关联的置信度指标(例如,可信度边界、置信度评分等)。在一些实施例中,在框408处,本地模型还预测一个或多个附加分析测量结果。
在一些实施例中,方法400包括图5中未示出的一个或多个附加框。例如,方法400可以包括附加框,在该附加框中,至少部分地基于在框408处预测的分析测量结果来控制生物制药过程的至少一个参数。取决于实施例,该参数可以是与所预测的分析测量结果相同的类型(例如,基于所预测的葡萄糖浓度来控制葡萄糖浓度),或者可以是不同的类型。例如,可以使用模型预测控制(MPC)技术来控制(一个或多个)参数。
作为另一示例,方法400可以包括第一附加框和第二附加框,在该第一附加框中,获得了生物制药过程的实际分析测量结果(例如,如上面所讨论的,响应于确定预测的分析测量结果、以及可能还有一个或多个较早/最新的测量结果不满足一个或多个模型性能标准而由或从(多个)分析仪器104之一获得);在该第二附加框中,将(1)光谱系统在获得实际分析测量结果时所生成的光谱数据以及(2)生物制药过程的实际分析测量结果添加到观察结果数据库中(例如,通过将光谱数据和分析测量结果发送到数据库服务器(诸如数据库服务器112),或者通过直接将光谱数据和分析测量结果添加到本地观察结果数据库等)。在预测多种类型的分析测量结果的实施例中,可以获得多个实际分析测量结果并将其添加到观察结果数据库。
作为又一个示例,方法400可以包括一个或多个附加的框组,每个框类似于框402至408。在这些附加的框组的每个框组中,可以通过查询观察结果数据库(或另一个观察结果数据库)来校准本地模型,并将该本地模型用于预测不同类型的分析测量结果。
现在将解决与本披露有关的其他考虑。
术语“多肽(polypeptide)”或“蛋白质(protein)”在全文中可互换使用,并且是指包括通过肽键彼此连结的两个或更多个氨基酸残基的分子。多肽和蛋白质还包括具有天然序列的氨基酸残基的一个或多个缺失、插入和/或取代的大分子,即包括由天然存在的非重组细胞产生的多肽或蛋白质;或通过基因工程细胞或重组细胞产生,并且包括具有天然蛋白质的氨基酸序列的氨基酸残基的一个或多个缺失、插入和/或取代的分子。多肽和蛋白质还包括如下氨基酸聚合物,其中一种或多种氨基酸为相应天然存在的氨基酸和聚合物的化学类似物。多肽和蛋白质还包括修饰,所述修饰包括但不限于糖基化、脂质附着、硫酸化、谷氨酸残基的γ-羧化、羟基化和ADP核糖基化。
多肽和蛋白质可能具有科学意义或商业意义,包括基于蛋白质的治疗法。蛋白质尤其包括分泌型蛋白质、非分泌型蛋白质、胞内蛋白质或膜结合蛋白质。多肽和蛋白质可以使用细胞培养方法通过重组动物细胞系产生,并且可以被称为“重组蛋白质”。所表达的(多种)蛋白质可以在细胞内产生或被分泌到培养基中,从培养基中可以回收和/或收集所述蛋白质。蛋白质包括通过结合靶、特别是下面列出的那些中的靶而发挥治疗作用的蛋白质,包括从其衍生的靶、与其相关的靶及其修饰。
蛋白质“抗原结合蛋白”。“抗原结合蛋白”是指包括抗原结合区或抗原结合部分的蛋白质或多肽,该抗原结合区或抗原结合部分对与其结合的另一分子(抗原)具有强亲和力。抗原结合蛋白涵盖抗体、肽体、抗体片段、抗体衍生物、抗体类似物、融合蛋白(包括单链可变片段(scFv)和双链(双价)scFv、突变蛋白、xMAb和嵌合抗原受体(CAR))。
scFv是单链抗体片段,它具有连接在一起的抗体重链和轻链的可变区。参见美国专利号7,741,465、和6,319,494以及Eshhar等人,Cancer Immunol Immunotherapy[癌症免疫学免疫疗法](1997)45:131-136。scFv保留了亲本抗体与靶抗原特异性相互作用的能力。
术语“抗体”包括任何同种型或亚类的糖基化免疫球蛋白和非糖基化免疫球蛋白,或者其与完整抗体竞争特异性结合的抗原结合区。除非另有说明,否则抗体包括人类的、人源化的、嵌合的、多特异性的、单克隆的、多克隆的、heteroIgG、XmAb、双特异性的抗体、及其寡聚物或抗原结合片段。抗体包括lgG1型、lgG2型、lgG3型或lgG4型。还包括具有抗原结合片段或抗原结合区的蛋白质,诸如Fab、Fab'、F(ab')2、Fv、双抗体、Fd、dAb、最大抗体(maxibody)、单链抗体分子、单结构域VHH、互补决定区(CDR)片段、scFv、双抗体、三抗体、四抗体和至少包含足以使特异性抗原与靶多肽结合的免疫球蛋白的一部分的多肽。
还包括人类的、人源化的和其他抗原结合蛋白,诸如人类抗体和人源化抗体,这些抗原结合蛋白当施用于人类时不会产生明显有害的免疫反应。
还包括肽体,这些肽体是包括可选地经由接头与Fc结构域连结在一起的一个或多个生物活性肽的多肽。参见美国专利号6,660,843、美国专利号7,138,370和美国专利号7,511,012。
蛋白质还包括基因工程受体,诸如嵌合抗原受体(CAR或CAR-T)和T细胞受体(TCR)。CAR通常将抗原结合结构域(诸如scFv)与一个或多个共刺激(“信号传导”)结构域和一个或多个激活结构域串联在一起。
还包括双特异性T细胞接合物
Figure BDA0003027077540000421
抗体构建体,其是由两个柔性连接的抗体衍生的结合结构域制成的重组蛋白构建体(参见WO 99/54440和WO 2005/040220)。该构建体的一个结合结构域对靶细胞上的所选肿瘤相关表面抗原具有特异性;第二结合结构域对CD3(T细胞上的T细胞受体复合物的亚基)具有特异性。
Figure BDA0003027077540000431
构建体还可以包括在CD3s链的N末端处结合背景无关表位(context independent epitope)的能力(WO 2008/119567),以更特异性地激活T细胞。半衰期延长
Figure BDA0003027077540000432
构建体包括小双特异性抗体构建体与较大蛋白质的融合物,其优选地不会干扰
Figure BDA0003027077540000433
抗体构建体的治疗效果。双特异性T细胞接合物的这种进一步发展的示例包括双特异性Fc-分子,例如US 2014/0302037、US 2014/0308285、WO 2014/151910和WO 2015/048272中所述。替代性策略是使用与双特异性分子融合的人血清白蛋白(HAS)或者仅人白蛋白结合肽的融合物(参见例如WO 2013/128027、WO2014/140358)。另一种HLE
Figure BDA0003027077540000434
策略包括融合与靶细胞表面抗原结合的第一结构域、与人和/或猕猴CD3e链的胞外表位结合的第二结构域以及作为特异性Fc模式的第三结构域(WO 2017/134140)。
还包括经修饰的蛋白质,诸如经非共价键、共价键或者共价键和非共价键两者化学修饰的蛋白质。还包括进一步包含一种或多种译后修饰的蛋白质,其可以通过细胞修饰系统或由酶和/或化学方法离体引入或以其他方式引入的修饰制得。
蛋白质还可以包括重组融合蛋白,该重组融合蛋白包括例如多聚化结构域,诸如亮氨酸拉链、卷曲螺旋、免疫球蛋白的Fc部分等。还包括包含分化抗原的全部或部分氨基酸序列的蛋白质(称为CD蛋白质)或其配体或与这些中的任一个实质上相似的蛋白质。
在一些实施例中,蛋白质可以包括集落刺激因子,诸如粒细胞集落刺激因子(G-CSF)。此类G-CSF剂包括但不限于
Figure BDA0003027077540000435
(非格司亭)和
Figure BDA0003027077540000436
(培非格司亭)。还包括红细胞生成刺激剂(ESA),诸如
Figure BDA0003027077540000437
(依伯汀α),
Figure BDA0003027077540000438
(达贝泊汀α),
Figure BDA0003027077540000439
(依伯汀δ),
Figure BDA00030270775400004310
(甲氧基聚乙二醇-依伯汀β),
Figure BDA00030270775400004311
MRK-2578,INS-22,
Figure BDA00030270775400004312
(依伯汀ζ),
Figure BDA00030270775400004313
(依伯汀β),
Figure BDA00030270775400004314
(依伯汀ζ),
Figure BDA00030270775400004315
(依伯汀α),epoetin alfa Hexal,
Figure BDA0003027077540000441
(依伯汀α),
Figure BDA0003027077540000442
(依伯汀θ),
Figure BDA0003027077540000443
(依伯汀θ),
Figure BDA0003027077540000444
(依伯汀θ),依伯汀α,依伯汀β,依伯汀ζ,依伯汀θ和依伯汀δ,依伯汀ω,依伯汀ι,组织纤溶酶原激活剂,GLP-1受体激动剂,以及前述任何内容的分子或其变体或类似物和生物仿制药。
在一些实施例中,蛋白质可以包括与一种或多种CD蛋白质、HER受体家族蛋白质、细胞粘附分子、生长因子、神经生长因子、成纤维细胞生长因子、转化生长因子(TGF)、胰岛素样生长因子、骨诱导因子、胰岛素和胰岛素相关蛋白、凝血和凝血相关蛋白、集落刺激因子(CSF)、其他血液和血清蛋白血型抗原特异性结合的蛋白质;受体、受体相关蛋白、生长激素、生长激素受体、T细胞受体;神经营养因子、神经营养蛋白、松弛素(relaxin)、干扰素、白介素、病毒抗原、脂蛋白、整合素、类风湿因子、免疫毒素、表面膜蛋白、转运蛋白、归巢受体、地址素、调节蛋白和免疫粘附素。
在一些实施例中,蛋白质可以包括单独或以任何组合结合以下一种或多种蛋白质的蛋白质:CD蛋白质(包括但不限于CD3、CD4、CD5、CD7、CD8、CD19、CD20、CD22、CD25、CD30、CD33、CD34、CD38、CD40、CD70、CD123、CD133、CD138、CD171和CD174)、HER受体家族蛋白质(包括例如HER2、HER3、HER4和EGF受体)、EGFRvIII、细胞粘附分子(例如LFA-1、Mol、p150,95、VLA-4、ICAM-1、VCAM和αv/β3整合素)、生长因子(包括但不限于例如血管内皮生长因子(“VEGF”));VEGFR2、生长激素、甲状腺刺激素、卵泡刺激素、黄体生成激素、生长激素释放因子、甲状旁腺激素、米勒管抑制物质(mullerian-inhibiting substance)、人类巨噬细胞炎性蛋白(MIP-1-α)、促红细胞生成素(EPO)、神经生长因子(诸如NGF-β)、血小板源性生长因子(PDGF)、成纤维细胞生长因子(包括例如aFGF和bFGF)、表皮生长因子(EGF)、Cripto、转化生长因子(TGF)(其中包括TGF-α和TGF-β(包括TGF-β1、TGF-β2、TGF-β3、TGF-β4或TGF-β5))、胰岛素样生长因子-I和胰岛素样生长因子-II(IGF-I和IGF-II)、des(1-3)-IGF-I(脑IGF-I)和骨诱导因子、胰岛素和胰岛素相关蛋白(包括但不限于胰岛素、胰岛素A链、胰岛素B链、胰岛素原和类胰岛素生长因子结合蛋白);(凝血蛋白和凝血相关蛋白,尤其如,VIII因子、组织因子、维勒布兰德(von Willebrand)因子、蛋白C、α-1-抗胰蛋白酶、纤溶酶原激活剂(如尿激酶和组织纤溶酶原激活剂(“t-PA”))、邦巴辛(bombazine)、凝血酶、血小板生成素和血小板生成素受体、集落刺激因子(CSF)(尤其包括以下物质:M-CSF、GM-CSF和G-CSF)、其他血液和血清蛋白(包括但不限于白蛋白、IgE和血型抗原)、受体和受体相关蛋白(包括例如flk2/flt3受体、肥胖(OB)受体、生长激素受体和T细胞受体);(x)神经营养因子,包括但不限于骨源性神经营养因子(BDNF)和神经营养蛋白-3、神经营养蛋白-4、神经营养蛋白-5或神经营养蛋白-6(NT-3、NT-4、NT-5或NT-6);(xi)松弛素A链、松弛素B链和松弛素原、干扰素(包括例如干扰素α、干扰素β和干扰素γ)、白介素(IL)(例如IL-1至IL-10、IL-12、IL-15、IL-17、IL-23、IL-12/IL-23、IL-2Ra、IL1-R1、IL-6受体、IL-4受体和/或IL-13受体、IL-13RA2或IL-17受体、IL-1RAP;(xiv)病毒抗原,包括但不限于AIDS包膜病毒抗原、脂蛋白、降钙素、胰高血糖素、心钠素、肺表面活性剂、肿瘤坏死因子-α和肿瘤坏死因子-β、脑啡肽酶、BCMA、IgKappa、ROR-1、ERBB2、间皮素、RANTES(受激活调节的正常T细胞表达与分泌因子)、小鼠促性腺激素相关肽、DNA酶、FR-α、抑制素和激活素、整合素、蛋白质A或D、类风湿因子、免疫毒素、骨形态发生蛋白质(BMP)、超氧化物歧化酶、表面膜蛋白、衰变加速因子(DAF)、AIDS包膜、转运蛋白、归巢受体、MIC(MIC-a、MIC-B)、ULBP 1-6、EPCAM、地址素、调节蛋白、免疫粘附素、抗原结合蛋白、生长激素、CTGF、CTLA4、嗜酸性粒细胞趋化因子(eotaxin)-1、MUC1、CEA、c-MET、密蛋白(Claudin)-18、GPC-3、EPHA2、FPA、LMP1、MG7、NY-ESO-1、PSCA、神经节苷脂GD2、神经节苷脂GM2、BAFF、OPGL(RANKL)、肌生成抑制素、Dickkopf-1(DKK-1)、Ang2、NGF、IGF-1受体、肝细胞生长因子(HGF)、TRAIL-R2、c-Kit、B7RP-1、PSMA、NKG2D-1、程序性细胞死亡蛋白1和配体、PD1和PDL1、甘露糖受体/hCGβ、丙型肝炎病毒、间皮素dsFv[PE38缀合物、嗜肺军团菌(lly)、IFNγ、γ干扰素诱导蛋白10(IP10)、IFNAR、TALL-1、胸腺基质淋巴细胞生成素(TSLP)、前蛋白转化酶枯草杆菌蛋白酶/Kexin 9型(PCSK9)、干细胞因子、Flt-3、降钙素基因相关肽(CGRP)、OX40L、α4β7、血小板特异性(血小板糖蛋白Iib/IIIb(PAC-1)、转化生长因子β(TFGβ)、透明带精子结合蛋白3(ZP-3)、TWEAK、血小板衍生的生长因子受体α(PDGFRα)、硬化蛋白(sclerostin)以及任何前述内容的生物活性片段或变体。
在另一个实施例中,蛋白质包括阿昔单抗、阿达木单抗、阿德木单抗、阿柏西普、阿仑单抗、阿利库单抗、阿那白滞素、阿塞西普、巴利昔单抗、贝利木单抗、贝伐单抗、生物素单抗(biosozumab)、博纳吐单抗、本妥昔单抗、布罗达单抗、莫坎妥珠单抗、康纳单抗、西妥昔单抗、塞妥珠单抗、可那木单抗、达利珠单抗、迪诺舒单抗(denosumab)、依库丽单抗、依决洛单抗、依法利珠单抗、依帕珠单抗、依那西普、依伏库单抗、加利昔单抗、盖尼塔单抗、吉妥珠单抗、戈利木单抗、替伊莫单抗、英夫利昔单抗、易普利姆玛、乐地单抗、鲁昔单抗、左旋单抗(lxdkizumab)、马帕木单抗、磷酸莫特沙尼(motesanib diphosphate)、莫罗单抗-CD3、那他珠单抗、奈西立肽、尼妥珠单抗、纳武单抗、奥瑞珠单抗、奥法木单抗、奥马珠单抗、奥普瑞白介素、帕利珠单抗、帕尼单抗、派姆单抗、帕妥珠单抗、培克珠单抗、兰尼单抗、利妥木单抗、利妥昔单抗、罗米司亭、洛莫索珠单抗、沙格司亭、托珠单抗、托西莫单抗、曲妥单抗、优特克单抗、维多珠单抗、维西珠单抗、伏洛昔单抗、扎木单抗、扎鲁木单抗、以及前述任何内容的生物仿制药。
蛋白质涵盖所有前述内容,并且进一步包括包含上述任何抗体的1、2、3、4、5或6个互补决定区(CDR)的抗体。还包括这样的变体,其包括与感兴趣蛋白质的参考氨基酸序列具有70%或更高、特别是80%或更高、更特别是90%或更高、再更特别是95%或更高、具体是97%或更高、更具体是98%或更高、再更具体是99%或更高同一性的氨基酸序列的区。在这方面的同一性可以使用多种众所周知的且容易获得的氨基酸序列分析软件来确定。优选软件包括实施史密斯-沃特曼(Smith-Waterman)算法的那些软件,该软件被认为是搜索和比对序列问题的令人满意的解决方案。还可以采用其他算法,特别是在速度是重要考虑因素的情况下。可以用于此方面的用于DNA、RNA和多肽的比对和同源性匹配的常用程序包括FASTA、TFASTA、BLASTN、BLASTP、BLASTX、TBLASTN、PROSRCH、BLAZE和MPSRCH,后者是用于在MasPar制造的大规模并行处理器上执行的史密斯-沃特曼算法的实施方式。
本文描述的一些图展示了具有一个或多个功能部件的示例框图。应理解的是,这种框图是出于说明的目的,并且所描述和示出的设备可以比所展示的具有额外的、更少的、或替代的部件。此外,在各种实施例中,部件(以及由相应部件提供的功能)可以与任何合适部件相关联或以其他方式集成为其一部分。
本披露的实施例涉及非暂态计算机可读存储介质,在该非暂态计算机可读存储介质上具有用于执行各种计算机实施操作的计算机代码。术语“计算机可读存储介质”在本文中用于包括能够存储或编码用于执行本文描述的操作、方法、和技术的一系列指令或计算机代码的任何介质。介质和计算机代码可以是为了本披露的实施例的目的而特别设计和构造的介质和计算机代码,或者它们可以是计算机软件领域的技术人员公知和可获得的类型。计算机可读存储介质的示例包括、但不限于:磁性介质,诸如硬盘、软盘、和磁带;光学介质,诸如CD-ROM和全息设备;磁光介质,诸如光盘;以及硬件设备,这些硬件设备被特别配置用于存储和执行程序代码,这些硬件设备诸如ASIC、可编程逻辑器件(“PLD”)、以及ROM和RAM设备。
计算机代码的示例包括诸如由编译器产生的机器代码、以及包含由计算机使用解释器或编译器执行的较高级代码的文件。例如,可以使用Java、C++、或其他面向对象的程序设计语言和开发工具实施本披露的实施例。计算机代码的附加示例包括加密代码和压缩代码。此外,本披露的实施例可以作为计算机程序产品被下载,该计算机程序产品可以经由传输通道从远程计算机(例如,服务器计算机)传递至请求计算机(例如,客户端计算机或不同的服务器计算机)。本披露的另一个实施例可以用硬接线电路系统代替机器可执行软件指令或与其组合来实施。
如本文使用的,除非上下文另有明确指明,否则单数术语“一(a、an)”和“该(the)”可以包括复数引用物。
如本文所使用的,术语“连接”、“连接的”和“连接件”指代操作性联接或链接。连接的部件可以直接地或例如通过另一组部件间接地彼此联接。
如本文所使用的,术语“大致”、“实质上”、“实质”和“约”用来描述并且解释小的变化。当与事件或情况相结合使用时,这些术语可以指代事件或情况恰好发生的情形以及事件或情况近似发生的情形。例如,当结合数值使用时,这些术语可以指代那个数值的小于或等于±10%、诸如小于或等于±5%,小于或等于±4%、小于或等于±3%、小于或等于±2%、小于或等于±1%、小于或等于±0.5%、小于或等于±0.1%、或小于或等于±0.05%的变化范围。例如,如果值之间的差小于或等于值的平均值的±10%、诸如小于或等于±5%、小于或等于±4%、小于或等于±3%、小于或等于±2%、小于或等于±1%、小于或等于±0.5%、小于或等于±0.1%、或小于或等于±0.05%,则可以认为两个数值“基本上”相同。
此外,数量、比率、以及其他数值有时以范围格式在本文中呈现。应理解的是这种范围格式是为了方便和简洁性而使用的并且应灵活地理解为包括明确指定为范围极限的数值,但是也包括包含在那个范围内的所有单独数值和子范围,就好像每个数值或子范围明确指定了一样。
虽然已经参考本披露的特定实施例描述和展示了本披露,但是这些描述和图示不限制本披露。本领域技术人员应理解的是:在不脱离由所附权利要求限定的本披露的真实精神和范围的情况下,可以进行各种改变并且可以替换等同物。这些图示可能不一定是按比例绘制的。由于制造工艺、容差和/或其他原因,本披露中的艺术再现与实际设备之间可能存在不同。可以存在没有具体地展示的本披露的其他实施例。说明书(除了权利要求之外)和附图应被视为说明性的而非限制性的。可以进行修改以使特定情况、材料、物质组成、技术、或过程适应本披露的目的、精神和范围。所有的这些变化旨在落入所附权利要求的范围内。虽然已经参考按特定顺序进行的特定操作描述了本文披露的技术,但是应理解的是,这些操作可以组合、细分、或重新排序以在不脱离本披露的教导的情况下形成等同的技术。因此,除非本文具体地指示,否则操作的顺序和分组并不是对本披露的限制。

Claims (52)

1.一种用于监测和/或控制生物制药过程的计算机实施的方法,该方法包括:
由一个或多个处理器确定与由光谱系统对该生物制药过程进行的扫描相关联的查询点;
由该一个或多个处理器查询观察结果数据库,该观察结果数据库包含与生物制药过程的过去观察结果相关联的多个观察结果数据集,其中,这些观察结果数据集中的每一个包括光谱数据和相应的实际分析测量结果,并且其中,查询该观察结果数据库包括从该多个观察结果数据集中选择满足关于该查询点的一个或多个相关性标准的观察结果数据集作为训练数据;
由该一个或多个处理器并使用所选训练数据来校准特定于该生物制药过程的本地模型,训练该本地模型以基于光谱数据输入来预测分析测量结果;以及
由该一个或多个处理器预测该生物制药过程的分析测量结果,其中,预测该生物制药过程的分析测量结果包括使用该本地模型来分析该光谱系统在扫描该生物制药过程时所生成的光谱数据。
2.如权利要求1所述的计算机实施的方法,其中,该光谱系统是拉曼光谱系统。
3.如权利要求1或2所述的计算机实施的方法,其中:
确定查询点包括至少部分地基于光谱扫描向量来确定该查询点,该光谱扫描向量是由该光谱系统在扫描该生物制药过程时生成的;以及
选择满足关于该查询点的一个或多个相关性标准的观察结果数据集作为训练数据包括:将确定该查询点所基于的光谱扫描向量与同这些生物制药过程的过去观察结果相关联的光谱扫描向量进行比较。
4.如权利要求3所述的计算机实施的方法,其中:
确定查询点进一步包括:基于与该光谱扫描向量相关联的样品数来确定该查询点;以及
选择满足关于该查询点的一个或多个相关性标准的观察结果数据集作为训练数据包括:(i)将确定该查询点所基于的光谱扫描向量与同这些生物制药过程的过去观察结果相关联的光谱扫描向量进行比较;以及(ii)将与该查询点相关联的样品数与同这些生物制药过程的过去观察结果相关联的样品数进行比较。
5.如权利要求4所述的计算机实施的方法,其中,选择满足关于该查询点的一个或多个相关性标准的观察结果数据集作为训练数据包括:
选择最新的k个观察结果数据集以包括在该训练数据中。
6.如权利要求3至5中任一项所述的计算机实施的方法,其中,预测该生物制药过程的分析测量结果包括:
使用该本地模型来分析确定该查询点所基于的光谱扫描向量。
7.如权利要求3至6中任一项所述的计算机实施的方法,其中,选择满足关于该查询点的一个或多个相关性标准的观察结果数据集作为训练数据包括:
计算(i)确定该查询点所基于的光谱扫描向量与(ii)同这些生物制药过程的过去观察结果相关联的光谱扫描向量之间的距离;以及
选择与这些过去观察结果相关联的光谱扫描向量中的、在确定该查询点所基于的光谱扫描向量的阈值距离之内的任何光谱扫描向量作为训练数据。
8.如权利要求1至7中任一项所述的计算机实施的方法,其中,确定查询点包括:
至少部分地基于以下中的一项或两项来确定该查询点:(i)与该生物制药过程相关联的培养基配置,以及(ii)分析该生物制药过程时的一个或多个操作条件。
9.如权利要求1至8中任一项所述的计算机实施的方法,其中,校准特定于该生物制药过程的本地模型包括:
校准特定于该生物制药过程的高斯过程机器学习模型。
10.如权利要求1至9中任一项所述的计算机实施的方法,其中,校准特定于该生物制药过程的本地模型包括:
校准作为给定观察结果数据集的光谱数据以及样品数两者的函数的模型。
11.如权利要求1至10中任一项所述的计算机实施的方法,其中,预测该生物制药过程的分析测量结果包括:
使用该本地模型来确定与该生物制药过程的所预测分析测量结果相关联的置信度指标。
12.如权利要求1至11中任一项所述的计算机实施的方法,进一步包括:
由该一个或多个处理器并至少部分地基于该生物制药过程的所预测分析测量结果来控制该生物制药过程的至少一个参数。
13.如权利要求1至12中任一项所述的计算机实施的方法,其中,该生物制药过程的所预测分析测量结果是培养基成分浓度、培养基状态、活细胞密度、滴度、关键质量属性或细胞状态。
14.如权利要求1至13中任一项所述的计算机实施的方法,其中,该生物制药过程的所预测分析测量结果是葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨、氨基酸、Na+或K+的浓度。
15.如权利要求1至13中任一项所述的计算机实施的方法,其中,该生物制药过程的所预测分析测量结果是pH、pCO2、pO2、温度或渗透压。
16.如权利要求1至15中任一项所述的计算机实施的方法,进一步包括:
由分析仪器获得该生物制药过程的实际分析测量结果;以及
由该一个或多个处理器将(i)该光谱系统在获得该实际分析测量结果时所生成的光谱数据和(ii)该生物制药过程的实际分析测量结果添加到该观察结果数据库。
17.如权利要求16所述的计算机实施的方法,进一步包括:
由该一个或多个处理器确定至少所预测分析测量结果不满足一个或多个模型性能标准,
其中,获得该实际分析测量结果是响应于确定至少所预测分析测量结果不满足该一个或多个模型性能标准而执行的。
18.如权利要求17所述的计算机实施的方法,其中,确定至少所预测分析测量结果不满足该一个或多个模型性能标准包括:
生成与所预测分析测量结果相关联的可信度区间;以及
将该可信度区间与预定义阈值进行比较。
19.如权利要求1至18中任一项所述的计算机实施的方法,其中,该生物制药过程是细胞培养过程。
20.一种用于监测和/或控制生物制药过程的光谱系统,该光谱系统包括:
一个或多个光谱探针,该一个或多个光谱探针被共同配置成:(i)将源电磁辐射递送到该生物制药过程,以及(ii)在将该源电磁辐射递送到该生物制药过程的同时收集电磁辐射;
一个或多个存储器,该一个或多个存储器共同存储观察结果数据库,该观察结果数据库包含与生物制药过程的过去观察结果相关联的多个观察结果数据集,其中,这些观察结果数据集中的每一个包括光谱数据和相应的实际分析测量结果;以及
一个或多个处理器,该一个或多个处理器被配置用于:
确定与由该光谱系统对该生物制药过程进行的扫描相关联的查询点;
至少通过从该多个观察结果数据集中选择满足关于该查询点的一个或多个相关性标准的观察结果数据集作为训练数据来查询该观察结果数据库;
使用所选训练数据来校准特定于该生物制药过程的本地模型,训练该本地模型以基于光谱数据输入来预测分析测量结果;以及
至少通过使用该本地模型分析该光谱系统在利用该一个或多个光谱探针扫描该生物制药过程时所生成的光谱数据来预测该生物制药过程的分析测量结果。
21.如权利要求20所述的光谱系统,其中,该光谱系统是拉曼光谱系统。
22.如权利要求20或21所述的光谱系统,其中,该一个或多个处理器被配置成:
至少部分地基于光谱扫描向量来确定该查询点,该光谱扫描向量是由该光谱系统在扫描该生物制药过程时生成的;以及
至少通过将确定该查询点所基于的光谱扫描向量与同这些生物制药过程的过去观察结果相关联的光谱扫描向量进行比较来选择该训练数据。
23.如权利要求22所述的光谱系统,其中,该一个或多个处理器被配置成:
至少部分地基于与该光谱扫描向量相关联的样品数来确定该查询点;以及
部分地通过以下操作来选择满足关于该查询点的一个或多个相关性标准的观察结果数据集作为训练数据:(i)将确定该查询点所基于的光谱扫描向量与同这些生物制药过程的过去观察结果相关联的光谱扫描向量进行比较;以及(ii)将与该查询点相关联的样品数与同这些生物制药过程的过去观察结果相关联的样品数进行比较。
24.如权利要求23所述的光谱系统,其中,该一个或多个处理器被配置成部分地通过以下操作来选择满足关于该查询点的一个或多个相关性标准的观察结果数据集作为训练数据:
选择最新的k个观察结果数据集以包括在该训练数据中。
25.如权利要求20至24中任一项所述的光谱系统,其中,该本地模型是高斯过程机器学习模型。
26.如权利要求20至25中任一项所述的光谱系统,其中,该本地模型是给定观察结果数据集的光谱数据以及样品数两者的函数。
27.如权利要求20至26中任一项所述的光谱系统,其中,该一个或多个处理器进一步被配置成:
使用该本地模型来确定与该生物制药过程的所预测分析测量结果相关联的置信度指标。
28.如权利要求20至27中任一项所述的光谱系统,其中,该一个或多个处理器进一步被配置成:
至少部分地基于该生物制药过程的所预测分析测量结果来控制该生物制药过程的至少一个参数。
29.如权利要求20至28中任一项所述的光谱系统,其中,该生物制药过程的所预测分析测量结果是培养基成分浓度、培养基状态、活细胞密度、滴度、关键质量属性或细胞状态。
30.如权利要求20至29中任一项所述的计算机实施的方法,其中,该生物制药过程的所预测分析测量结果是葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨、氨基酸、Na+或K+的浓度。
31.如权利要求20至29中任一项所述的计算机实施的方法,其中,该生物制药过程的所预测分析测量结果是pH、pCO2、pO2、温度或渗透压。
32.如权利要求20至31中任一项所述的光谱系统,进一步包括:
分析仪器,该分析仪器被配置成获得该生物制药过程的实际分析测量结果,
其中,该一个或多个处理器进一步被配置成将(i)该光谱系统在获得该实际分析测量结果时所生成的光谱数据和(ii)该生物制药过程的实际分析测量结果添加到该观察结果数据库。
33.如权利要求32所述的光谱系统,其中,该一个或多个处理器进一步被配置成:
确定至少所预测分析测量结果不满足一个或多个模型性能标准;以及
响应于确定至少所预测分析测量结果不满足该一个或多个模型性能标准而从该分析仪器获得该实际分析测量结果。
34.如权利要求33所述的光谱系统,其中,该一个或多个处理器被配置成至少通过以下操作来确定至少所预测分析测量结果不满足该一个或多个模型性能标准:
生成与所预测分析测量结果相关联的可信度区间;以及
将该可信度区间与预定义阈值进行比较。
35.如权利要求20至34中任一项所述的光谱系统,其中,该生物制药过程是细胞培养过程。
36.一种非暂态计算机可读介质,存储用于监测和/或控制生物制药过程的指令,其中,这些指令当被一个或多个处理器执行时使所述一个或多个处理器执行如权利要求1至19中任一项所述的方法。
37.一种生物反应器系统,包括:
生物反应器室,该生物反应器室被配置成用于容纳生物制药过程;
一个或多个光谱探针,该一个或多个光谱探针被共同配置成:(i)将源电磁辐射递送到该生物制药过程,以及(ii)在将该源电磁辐射递送到该生物制药过程的同时收集电磁辐射;
一个或多个存储器,该一个或多个存储器共同存储观察结果数据库,该观察结果数据库包含与生物制药过程的过去观察结果相关联的多个观察结果数据集,其中,这些观察结果数据集中的每一个包括光谱数据和相应的实际分析测量结果;以及
一个或多个处理器,该一个或多个处理器被配置用于:
确定与由该光谱系统对该生物制药过程进行的扫描相关联的查询点;
至少通过从该多个观察结果数据集中选择满足关于该查询点的一个或多个相关性标准的观察结果数据集作为训练数据来查询该观察结果数据库;
使用所选训练数据来校准特定于该生物制药过程的本地模型,训练该本地模型以基于光谱数据输入来预测分析测量结果;以及
至少通过使用该本地模型分析该光谱系统在利用该一个或多个光谱探针扫描该生物制药过程时所生成的光谱数据来预测该生物制药过程的分析测量结果。
38.如权利要求37所述的生物反应器系统,其中,该一个或多个处理器被配置成:
至少部分地基于光谱扫描向量来确定该查询点,该光谱扫描向量是在经由该一个或多个光谱探针扫描该生物制药过程时生成的;以及
至少通过将确定该查询点所基于的光谱扫描向量与同这些生物制药过程的过去观察结果相关联的光谱扫描向量进行比较来选择该训练数据。
39.如权利要求38所述的生物反应器系统,其中,该一个或多个处理器被配置成:
至少部分地基于与该光谱扫描向量相关联的样品数来确定该查询点;以及
部分地通过以下操作来选择满足关于该查询点的一个或多个相关性标准的观察结果数据集作为训练数据:(i)将确定该查询点所基于的光谱扫描向量与同这些生物制药过程的过去观察结果相关联的光谱扫描向量进行比较;以及(ii)将与该查询点相关联的样品数与同这些生物制药过程的过去观察结果相关联的样品数进行比较。
40.如权利要求39所述的生物反应器系统,其中,该一个或多个处理器被配置成部分地通过以下操作来选择满足关于该查询点的一个或多个相关性标准的观察结果数据集作为训练数据:
选择最新的k个观察结果数据集以包括在该训练数据中。
41.如权利要求37至40中任一项所述的生物反应器系统,其中,该本地模型是高斯过程机器学习模型。
42.如权利要求37至41中任一项所述的生物反应器系统,其中,该本地模型是给定观察结果数据集的光谱数据以及样品数两者的函数。
43.如权利要求37至42中任一项所述的生物反应器系统,其中,该一个或多个处理器进一步被配置成:
使用该本地模型来确定与该生物制药过程的所预测分析测量结果相关联的置信度指标。
44.如权利要求37至43中任一项所述的生物反应器系统,其中,该一个或多个处理器进一步被配置成:
至少部分地基于该生物制药过程的所预测分析测量结果来控制该生物制药过程的至少一个参数。
45.如权利要求37至44中任一项所述的生物反应器系统,其中,该生物制药过程的所预测分析测量结果是培养基成分浓度、培养基状态、活细胞密度、滴度、关键质量属性或细胞状态。
46.如权利要求37至45中任一项所述的计算机实施的方法,其中,该生物制药过程的所预测分析测量结果是葡萄糖、乳酸盐、谷氨酸盐、谷氨酰胺、氨、氨基酸、Na+或K+的浓度。
47.如权利要求37至45中任一项所述的计算机实施的方法,其中,该生物制药过程的所预测分析测量结果是pH、pCO2、pO2、温度或渗透压。
48.如权利要求37至47中任一项所述的光谱系统,进一步包括:
分析仪器,该分析仪器被配置成获得该生物制药过程的实际分析测量结果,
其中,该一个或多个处理器进一步被配置成将(i)该光谱系统在获得该实际分析测量结果时所生成的光谱数据和(ii)该生物制药过程的实际分析测量结果添加到该观察结果数据库。
49.如权利要求48所述的光谱系统,其中,该一个或多个处理器进一步被配置成:
确定至少所预测分析测量结果不满足一个或多个模型性能标准;以及
响应于确定至少所预测分析测量结果不满足该一个或多个模型性能标准而从该分析仪器获得该实际分析测量结果。
50.如权利要求49所述的光谱系统,其中,该一个或多个处理器被配置成至少通过以下操作来确定至少所预测分析测量结果不满足该一个或多个模型性能标准:
生成与所预测分析测量结果相关联的可信度区间;以及
将该可信度区间与预定义阈值进行比较。
51.如权利要求37至50中任一项所述的光谱系统,其中,该生物制药过程是细胞培养过程。
52.一种重组蛋白质,其是在如权利要求51所述的生物反应器系统中执行的细胞培养过程中产生的。
CN201980068986.7A 2018-10-23 2019-10-23 用于实时预测的拉曼光谱模型的自动校准和自动维护 Pending CN112912716A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862749359P 2018-10-23 2018-10-23
US62/749359 2018-10-23
US201962833044P 2019-04-12 2019-04-12
US62/833044 2019-04-12
US201962864565P 2019-06-21 2019-06-21
US62/864565 2019-06-21
PCT/US2019/057513 WO2020086635A1 (en) 2018-10-23 2019-10-23 Automatic calibration and automatic maintenance of raman spectroscopic models for real-time predictions

Publications (1)

Publication Number Publication Date
CN112912716A true CN112912716A (zh) 2021-06-04

Family

ID=70331744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980068986.7A Pending CN112912716A (zh) 2018-10-23 2019-10-23 用于实时预测的拉曼光谱模型的自动校准和自动维护

Country Status (14)

Country Link
US (1) US20220128474A1 (zh)
EP (1) EP3870957A1 (zh)
JP (1) JP2022512775A (zh)
KR (1) KR20210078531A (zh)
CN (1) CN112912716A (zh)
AU (1) AU2019365102A1 (zh)
BR (1) BR112021007611A2 (zh)
CA (1) CA3115296A1 (zh)
CL (1) CL2021001024A1 (zh)
IL (1) IL281977A (zh)
MX (1) MX2021004510A (zh)
SG (1) SG11202103232WA (zh)
TW (1) TW202033949A (zh)
WO (1) WO2020086635A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2021002279A (es) 2018-08-27 2021-05-27 Regeneron Pharma Uso de espectroscopia raman en la purificacion corriente abajo.
CN114207593A (zh) * 2019-06-10 2022-03-18 沃特世科技爱尔兰有限公司 用于分析仪器性能诊断的技术
WO2022072198A1 (en) * 2020-10-01 2022-04-07 Amgen Inc. Predictive modeling and control of cell culture
US20220138557A1 (en) * 2020-11-04 2022-05-05 Adobe Inc. Deep Hybrid Graph-Based Forecasting Systems
DE102021100531B3 (de) * 2021-01-13 2022-03-31 BioThera Institut GmbH Apparatur zum Steuern eines Prozesses sowie zugehöriges Steuerungsverfahren
EP4352200A1 (en) * 2021-06-09 2024-04-17 Amgen Inc. Assessing packed cell volume for cell cultures
TW202326113A (zh) 2021-10-27 2023-07-01 美商安進公司 使用光譜學進行的基於深度學習的預測
JP2023124433A (ja) * 2022-02-25 2023-09-06 株式会社日立製作所 評価システム及び評価方法
WO2023167802A1 (en) * 2022-03-01 2023-09-07 Amgen Inc. Hybrid predictive modeling for control of cell culture
WO2024049725A1 (en) * 2022-08-29 2024-03-07 Amgen Inc. Predictive model to evaluate processing time impacts
WO2024046603A1 (en) * 2022-08-29 2024-03-07 Büchi Labortechnik AG Methods for providing a predictive model for spectroscopy and calibrating a spectroscopic device
WO2024059092A1 (en) 2022-09-14 2024-03-21 Amgen Inc. Just-in-time learning with variational autoencoder for cell culture process monitoring and/or control

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5862060A (en) * 1996-11-22 1999-01-19 Uop Llc Maintenance of process control by statistical analysis of product optical spectrum
US20040019283A1 (en) * 1998-07-13 2004-01-29 Lambert James L. Assessing blood brain barrier dynamics or identifying or measuring selected substances, including ethanol or toxins, in a subject by analyzing Raman spectrum signals
US20070175278A1 (en) * 2003-05-12 2007-08-02 Erasums University Medical Center Rotterdam (Erasumus Mc ) Automated characterization and classification of microorganisms
US20090079977A1 (en) * 2007-08-13 2009-03-26 C8 Medisensors Inc. Calibrated Analyte Concentration Measurements in Mixtures
CN101825567A (zh) * 2010-04-02 2010-09-08 南开大学 一种近红外光谱和拉曼光谱波长的筛选方法
US20110317158A1 (en) * 2008-12-18 2011-12-29 Lyng Fiona M Cytological method for analyzing a biological sample by raman spectroscopy
CN102449623A (zh) * 2009-03-31 2012-05-09 东京毅力科创株式会社 用于检测工具性能降级和失配的方法和系统
CN104215623A (zh) * 2013-05-31 2014-12-17 欧普图斯(苏州)光学纳米科技有限公司 面向多行业检测的激光拉曼光谱智能化辨识方法及系统
CN104884029A (zh) * 2012-10-23 2015-09-02 赛拉诺斯股份有限公司 药物监测与调控系统和方法
US20170127983A1 (en) * 2015-11-10 2017-05-11 Massachusetts Institute Of Technology Systems and methods for sampling calibration of non-invasive analyte measurements
US20170130186A1 (en) * 2014-07-02 2017-05-11 Biogen Ma Inc. Cross-scale modeling of bioreactor cultures using raman spectroscopy
US20180291329A1 (en) * 2015-05-29 2018-10-11 Biogen Ma Inc. Cell culture methods and systems

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6319494B1 (en) 1990-12-14 2001-11-20 Cell Genesys, Inc. Chimeric chains for receptor-associated signal transduction pathways
IL104570A0 (en) 1992-03-18 1993-05-13 Yeda Res & Dev Chimeric genes and cells transformed therewith
JP4169478B2 (ja) 1998-04-21 2008-10-22 マイクロメット アーゲー Cd19×cd3特異的ポリペプチドおよびその使用
US6660843B1 (en) 1998-10-23 2003-12-09 Amgen Inc. Modified peptides as therapeutic agents
US7138370B2 (en) 2001-10-11 2006-11-21 Amgen Inc. Specific binding agents of human angiopoietin-2
ATE496938T1 (de) 2002-12-20 2011-02-15 Amgen Inc Myostatin hemmende bindungsstoffe
DK1673398T3 (da) 2003-10-16 2011-04-18 Micromet Ag Multispecifikke, deimmuniserede CD3-bindere
JP2010524851A (ja) 2007-04-03 2010-07-22 マイクロメット アーゲー 種間特異的結合ドメイン
CA2864177C (en) 2012-03-01 2019-11-26 Amgen Research (Munich) Gmbh Prolonged half-life albumin-binding protein fused bispecific antibodies
AU2014236769B2 (en) 2013-03-15 2018-09-27 Amgen Inc. Heterodimeric bispecific antibodies
US20140308285A1 (en) 2013-03-15 2014-10-16 Amgen Inc. Heterodimeric bispecific antibodies
ES2753950T3 (es) 2013-03-15 2020-04-15 Amgen Res Munich Gmbh Moléculas de unión monocatenarias que comprenden ABP del extremo N
US20140302037A1 (en) 2013-03-15 2014-10-09 Amgen Inc. BISPECIFIC-Fc MOLECULES
WO2015048272A1 (en) 2013-09-25 2015-04-02 Amgen Inc. V-c-fc-v-c antibody
EA039859B1 (ru) 2016-02-03 2022-03-21 Эмджен Рисерч (Мюник) Гмбх Биспецифические конструкты антител, связывающие egfrviii и cd3

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5862060A (en) * 1996-11-22 1999-01-19 Uop Llc Maintenance of process control by statistical analysis of product optical spectrum
US20040019283A1 (en) * 1998-07-13 2004-01-29 Lambert James L. Assessing blood brain barrier dynamics or identifying or measuring selected substances, including ethanol or toxins, in a subject by analyzing Raman spectrum signals
US20070175278A1 (en) * 2003-05-12 2007-08-02 Erasums University Medical Center Rotterdam (Erasumus Mc ) Automated characterization and classification of microorganisms
US20090079977A1 (en) * 2007-08-13 2009-03-26 C8 Medisensors Inc. Calibrated Analyte Concentration Measurements in Mixtures
US20110317158A1 (en) * 2008-12-18 2011-12-29 Lyng Fiona M Cytological method for analyzing a biological sample by raman spectroscopy
CN102449623A (zh) * 2009-03-31 2012-05-09 东京毅力科创株式会社 用于检测工具性能降级和失配的方法和系统
CN101825567A (zh) * 2010-04-02 2010-09-08 南开大学 一种近红外光谱和拉曼光谱波长的筛选方法
CN104884029A (zh) * 2012-10-23 2015-09-02 赛拉诺斯股份有限公司 药物监测与调控系统和方法
CN104215623A (zh) * 2013-05-31 2014-12-17 欧普图斯(苏州)光学纳米科技有限公司 面向多行业检测的激光拉曼光谱智能化辨识方法及系统
US20170130186A1 (en) * 2014-07-02 2017-05-11 Biogen Ma Inc. Cross-scale modeling of bioreactor cultures using raman spectroscopy
US20180291329A1 (en) * 2015-05-29 2018-10-11 Biogen Ma Inc. Cell culture methods and systems
US20170127983A1 (en) * 2015-11-10 2017-05-11 Massachusetts Institute Of Technology Systems and methods for sampling calibration of non-invasive analyte measurements

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CHEN, LINGYI等: "A Modified Recursive Locally Weighted NIR Modeling for Fermentation Process", IEEE, pages 559 - 562 *
QING-LIN SU等: "Just-in-Time-Learning based Extended Prediction Self-Adaptive Control for batch processes", JOURNAL OF PROCESS CONTROL, vol. 43, pages 1 - 9, XP029553248, DOI: 10.1016/j.jprocont.2016.04.009 *
TULSYAN A等: "A machine-learning approach to calibrate generic Raman models for real-time monitoring of cell culture processes", BIOTECHNOLOGY AND BIOENGINEERING, vol. 116, no. 10, pages 2575 - 2586 *
TULSYAN A等: "Automatic real-time calibration, assessment, and maintenance of generic Raman models for online monitoring of cell culture processes", BIOTECHNOLOGY AND BIOENGINEERING, vol. 117, no. 2, pages 408 *
YI LIU等: "Just-in-Time Kernel Learning with Adaptive Parameter Selection for Soft Sensor Modeling of Batch Processes", INDUSTRIAL&ENGINEERING CHEMISTRY RESEARCH, vol. 51, no. 11, pages 4313 - 4327, XP055673439, DOI: 10.1021/ie201650u *

Also Published As

Publication number Publication date
KR20210078531A (ko) 2021-06-28
SG11202103232WA (en) 2021-05-28
EP3870957A1 (en) 2021-09-01
AU2019365102A1 (en) 2021-04-29
WO2020086635A1 (en) 2020-04-30
TW202033949A (zh) 2020-09-16
CL2021001024A1 (es) 2021-09-24
IL281977A (en) 2021-05-31
MX2021004510A (es) 2021-06-08
US20220128474A1 (en) 2022-04-28
CA3115296A1 (en) 2020-04-30
BR112021007611A2 (pt) 2021-07-27
JP2022512775A (ja) 2022-02-07

Similar Documents

Publication Publication Date Title
CN112912716A (zh) 用于实时预测的拉曼光谱模型的自动校准和自动维护
US20230204421A1 (en) Automated control of cell culture using raman spectroscopy
KR102503356B1 (ko) 마이크로칩 모세관 전기영동 분석 및 시약
JP2009106280A (ja) ヒトに適合したモノクローナル抗体における使用法
US20190233813A1 (en) A method of discovering specific functional antibodies
Kelley et al. Integration of QbD risk assessment tools and overall risk management
WO2020246617A1 (ja) 情報処理システム、情報処理方法、プログラム、及び、抗原結合分子或いはタンパク質を製造する方法
TW202326113A (zh) 使用光譜學進行的基於深度學習的預測
EA043314B1 (ru) Автоматическая калибровка и автоматическое обслуживание рамановских спектроскопических моделей для предсказаний в реальном времени
JP2021176303A (ja) 抗体変異体
KR20230020996A (ko) 항체를 정량화하기 위한 고 처리량 및 질량 분석 기반 방법
JP2023522695A (ja) 治療用タンパク質を製造するためのクロマトグラフィーパラメータの選択
US20190345196A1 (en) Systems and methods for quantifying and modifying protein viscosity
US20230071627A1 (en) Multivariate Bracketing Approach for Sterile Filter Validation
WO2024094097A1 (en) Machine learning for antibody discovery and uses thereof
JPWO2002044727A1 (ja) 化学的安定性に乏しいリガンド結合タンパク質と第一リガンドとの結合活性を測定する方法
TWI833685B (zh) 預測抗體之生物利用度之方法
CA3220848A1 (en) Microchip capillary electrophoresis assays and reagents
KR20230150300A (ko) 단백질 점도를 정량화하고 변경시키기 위한 시스템 및 방법
WO2024097104A1 (en) Methods of antibody characterization
WO2023147595A2 (en) Materials and methods for enhanced bioproduction processes
EA045662B1 (ru) Водный электрофоретический буфер (варианты), способ выявления загрязнений или примесей в образце белкового лекарственного средства, набор для микрочипового капиллярного электрофореза
Angell et al. Kristine Daris,‡ Jason W. O’Neill,† and Kannan Gunasekaran

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination