TW202346567A - 用於控制細胞培養之混合預測建模 - Google Patents

用於控制細胞培養之混合預測建模 Download PDF

Info

Publication number
TW202346567A
TW202346567A TW112107148A TW112107148A TW202346567A TW 202346567 A TW202346567 A TW 202346567A TW 112107148 A TW112107148 A TW 112107148A TW 112107148 A TW112107148 A TW 112107148A TW 202346567 A TW202346567 A TW 202346567A
Authority
TW
Taiwan
Prior art keywords
cell culture
values
control
attributes
model
Prior art date
Application number
TW112107148A
Other languages
English (en)
Inventor
牧和墨德 瑞雪帝
哈米德 科達班得勞
席葉德米納 拉費許夏凡
馬修 N 德莫司
艾迪亞 托斯洋
東尼 Y 王
Original Assignee
美商安進公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商安進公司 filed Critical 美商安進公司
Publication of TW202346567A publication Critical patent/TW202346567A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M41/00Means for regulation, monitoring, measurement or control, e.g. flow regulation
    • C12M41/46Means for regulation, monitoring, measurement or control, e.g. flow regulation of cellular or enzymatic activity or functionality, e.g. cell viability
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M29/00Means for introduction, extraction or recirculation of materials, e.g. pumps
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M41/00Means for regulation, monitoring, measurement or control, e.g. flow regulation
    • C12M41/30Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration
    • C12M41/32Means for regulation, monitoring, measurement or control, e.g. flow regulation of concentration of substances in solution
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12MAPPARATUS FOR ENZYMOLOGY OR MICROBIOLOGY; APPARATUS FOR CULTURING MICROORGANISMS FOR PRODUCING BIOMASS, FOR GROWING CELLS OR FOR OBTAINING FERMENTATION OR METABOLIC PRODUCTS, i.e. BIOREACTORS OR FERMENTERS
    • C12M41/00Means for regulation, monitoring, measurement or control, e.g. flow regulation
    • C12M41/48Automatic or computerized control
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/44Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Sustainable Development (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Cell Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Automation & Control Theory (AREA)

Abstract

一種控制細胞培養過程之方法在模型預測控制器中使用混合預測建模。該方法包括針對多個時間間隔,獲得相關聯的細胞培養物屬性的當前值,並生成該細胞培養過程的物理輸入的控制值。生成該控制值包括基於該等當前值藉由以下操作來預測該等細胞培養物屬性的未來值:使用一個或多個資料驅動模型預測該等細胞培養物屬性中的第一一個或多個屬性的未來值,以及使用一個或多個第一性原理模型預測該等細胞培養物屬性中的第二一個或多個屬性的未來值。生成該控制值還包括藉由優化受制於預測未來值的目標函數來確定該控制值。該方法還包括使用該控制值來控制該細胞培養過程的物理輸入。

Description

用於控制細胞培養之混合預測建模
本申請總體上關於細胞培養(例如,在生物反應器中),並且更具體地關於細胞培養物屬性的預測和控制。
生物製藥行業不斷努力提高生產率,同時確保過程仍然是可靠的和有成本效益的。隨著如新的數位技術、更高的計算能力、更好的集成靈活性和人工智慧等能力的出現,滿足該等目標的新途徑已經出現。其中之一係利用過程資料來改進過程的控制方式。最近,許多智慧工廠已經嘗試在沒有人工干預的情況下使用自我調整模型來管理各種過程場景和過程自動化。參見Catlin等人, A Roadmap for a Digital Transformation [數位化轉型的路線圖], 2017, McKinsey[麥肯錫公司]。為了成功實現這一點,對過程的即時高級控制係必要的。
由於各種各樣的挑戰,如測量結果的缺乏和過程的複雜性,生物製藥過程的控制在實踐中很少發展到超出小變數集的簡單PID(比例-積分-微分)控制。參見Whitby等人, PID Control of Biochemical Reaction Networks [生化反應網路的PID控制], 2019, 2019 IEEE 58 thConference on Decision and Control (CDC) [2019 IEEE第58屆決策與控制會議(CDC)], 8372-8379;Sen等人, A Hybrid MPC-PID Control System Design for the Continuous Purification and Processing of Active Pharmaceutical Ingredients [用於活性藥物成分連續純化和加工的混合MPC-PID控制系統設計], 2014, Processes[過程], 2, 392-418。在該等過程中,傳統控制方法旨在操縱細胞外環境來控制培養物的細胞內反應。參見Boudreau等人, New Directions in Bioprocess Modeling and Control: Maximizing Process Analytical Technology Benefits [生物過程建模和控制的新方向:最大化過程分析技術利益], 2006, ISA, Research Triangle Park, NC [北卡羅來納州三角研究園]。模型預測控制(MPC)係一種先進的多步控制方法,該方法不僅在多變數程序控制中是高效的,還可以解決由操縱變數(輸入)和受控變數(輸出)施加的約束。參見S.J. Qin, A Survey of Industrial Model Predictive Control Technology [工業模型預測控制技術綜述], 2003, Control Engineering Practice[控制工程實踐], 11, 733-764。MPC的主要組成部分係過程的動態模型,其用於確定最優控制動作,從而導致提前實現優化且可行的目標。
在文獻中,有各種用於生物過程的第一性原理模型和資料驅動模型。參見Craven等人, Process Model Comparison and Transferability Across Bioreactor Scales and Modes of Operation for a Mammalian Cell Bioprocess [哺乳動物細胞生物過程的過程模型比較和跨生物反應器規模和操作模式的可轉移性], 2013, AICHE Journal[AICHE期刊], 29, 186-196;Tulsyan等人, Advances in Industrial Biopharmaceutical Batch Process Monitoring: Machine-Learning Methods for Small Data Problems [工業生物製藥批量過程監控的進展:用於小資料問題的機器學習方法], 2018, Biotechnol Bioeng. [生物技術與生物工程], 115, 1915-1924。第一性原理模型大多係基於Monod動力學和酶學方案獲得的,該等方案產生具有許多未知自由參數的非線性狀態模型。參見Craven等人, Glucose Concentration Control of a Fed-Batch Mammalian Cell Bioprocess Using a Nonlinear Model Predictive Controller [使用非線性模型預測控制器對進料分批哺乳動物細胞生物過程的葡萄糖濃度控制], 2014, Journal of Process Control[程序控制期刊], 24, 344-357。另一方面,資料驅動方法在過程監測和控制中的使用已經得到了深入的研究。參見Kiran等人, Control of Continuous Fed-Batch Fermentation Process Using Neural Network Based Model Predictive Controller [使用基於神經網路的模型預測控制器對連續進料分批發酵過程的控制], 2009, Bioprocess Biosyst Eng[生物過程與生物系統工程化], 32, 801-808; Tulsyan等人, Spectroscopic Models for Real-Time Monitoring of Cell Culture Processes Using Spatiotemporal Just-in-Time Gaussian Processes [用於使用時空即時高斯過程即時監測細胞培養過程的光譜模型], 2021, AICHE 期刊, 67, e17210。模型的選擇很重要,因為它影響計算負荷以及控制策略的準確性和可靠性。神經網路模型已經在許多工作中用於進料分批發酵過程中的控制器設計。參見Chtourou等人, Control of a Bioreactor Using a Neural Network [使用神經網路對生物反應器的控制], 1993, Bioprocess Eng. [生物過程工程化], 8, 251-254;Patnaik, An Integrated Hybrid Neural System for Noise Filtering, Simulation and Control of a Fed-Batch Recombinant Fermentation [用於對進料分批重組發酵進行雜訊過濾、模擬和控制的集成混合神經系統], 2003, Biochem Eng J. [生物化學工程化期刊], 15, 165-175。不幸的是,由於進料分批發酵的時變特性和有限的訓練資料量,模型通常不具有高準確度。
如上所述,如Monod動力學等模型可能會產生大量未知參數。然而,進料分批過程中的離散進料流可能導致目標變數對進料策略不敏感。此外,過程中複雜的多級反應、過程中細胞的快速適應性(參見Sinclair等人, Fermentation Kinetics and Modelling [發酵動力學和建模], 1987, Open University Press, Milton Keynes[米爾頓凱恩斯開放大學出版社], 44, xi-113)、以及在分批操作期間發生的隨機可變性也可能降低該等簡化模型的準確性。參見Jose等人, Developmental Studies of an Adaptive On-Line Softsensor for Biological Wastewater Treatments [用於污水生物處理的自我調整線上軟感測器的開發研究], 1999, Can. J. Chem. Eng.[加拿大化學工程化期刊], 77, 707-717。
生物過程通常可以以其非線性、可變性和複雜性為特徵,該等特徵皆為由細胞內的代謝網路途徑引起的。一旦對過程有了可接受的理解,就可以採用複雜的先進控制策略來提高過程的可靠性和效率。模型預測控制(MPC)使用即時過程模型,藉由在保留自訂約束的同時在每個時間間隔優化目標(成本)函數來進行預測。藉由預測即將到來的擾動並保證預測的穩定性,MPC導致了規定的控制動作。在MPC框架中,所考慮的過程的預測基於未來結果計算控制動作,因為該等未來結果與模型目標和約束相關,並且動態模型的未來行為基於預測模型。因此,預測模型在MPC中起著至關重要的作用。
本文描述的系統和方法通常藉由使用第一性原理和資料驅動建模兩者來提供用於在MPC系統中進行預測的混合方法。例如,該系統和方法可以使用在來自真實世界細胞培養過程的歷史資料上訓練的資料驅動模型(例如,線性回歸器和/或神經網路)來預測某些代謝物濃度和/或其他細胞培養物屬性(例如,活細胞密度(VCD)、滲透壓等)的未來值,同時還使用第一性原理(例如,質量平衡)模型來預測葡萄糖濃度的未來值,後者的預測基於進料速率以及資料驅動模型預測(例如,VCD預測)。第一性原理模型的使用減輕了資料驅動模型在預測葡萄糖濃度時的缺點(例如,模型對進料的敏感性差),而資料驅動模型的使用減輕了第一性原理模型(例如,當前質量平衡模型)不能準確和一致地對葡萄糖與其他代謝物之間的關係進行建模的缺點。
作為一個整體,該混合模型可以更準確和一致地預測在期望預測範圍內MPC預測階段的未來細胞培養物屬性。MPC的優化階段然後可以藉由求解受制於某些約束(例如,最小和最大進料速率)的目標函數的優化問題來計算控制範圍內的控制值(例如,葡萄糖進料速率值)。在任何給定的時間間隔,由MPC確定的第一控制值(即,控制範圍的最早時間間隔的值)用於控制細胞培養過程的物理輸入(例如,由葡萄糖泵提供的葡萄糖進料速率),並且預測和優化階段針對每個時間間隔(例如,每天或每小時等)重複/更新。
本文揭露的技術可以避免手動調整控制設定值的需要。此外,藉由減輕資料驅動和第一性原理模型的缺點,該等技術可以提供相對於其他建模技術的改進的預測準確性,由此允許導致細胞培養過程的更好性能(例如,優越的產物品質屬性)的控制動作。
以上介紹的以及在下文更詳細地討論的各種構思可以以多種方式中的任一種實施,並且所描述的構思不限於任何特定的實施方式。出於說明目的,提供了實施方式的示例。
圖1係可以用於手動監測和控制細胞培養過程的示例系統100之簡化框圖。系統100包括生物反應器102、一個或多個分析儀器104、輸入設備106和計算系統108。
生物反應器102可以是支持細胞培養的任何合適的容器、設備或系統,該細胞培養可以包括培養基內的活生物體和/或從該等活生物體衍生的物質。生物反應器102可以包含藉由細胞培養表現的重組蛋白質,例如,如用於研究目的、臨床用途、商業銷售或其他分配。取決於所監測的生物製藥過程,培養基可以包括特定流體(例如,「液體培養基」)和特定營養素,並且可以具有目標pH水平或範圍、目標溫度或溫度範圍等。
(多個)分析儀器104通信地聯接到計算系統108,並且可以包括被配置為測量生物反應器102內的細胞培養物的一個或多個屬性的任何連線、線上和/或離線的一個或多個儀器。例如,(多個)分析儀器104可以測量一種或多種培養基成分濃度,如代謝物濃度(例如,葡萄糖、乳酸鹽、鈉、鉀、麩醯胺酸、銨等)。另外地或可替代地,(多個)分析儀器104可以測量滲透壓、細胞壓積(PCV)、活細胞密度(VCD)、總細胞密度(TCD)、活力和/或與生物反應器102的內容物相關的一個或多個其他細胞培養物屬性(例如,生物量)。
雖然在一些實施方式中,(多個)分析儀器104可以使用破壞性測量/分析技術,但是在其他實施方式中,(多個)分析儀器104中的一個、一些或所有分析儀器使用基於光學或成像技術的非破壞性測量/分析技術。例如,(多個)分析儀器104可以包括具有光譜儀和一個或多個探針的拉曼分析儀或近紅外(NIR)光譜法。拉曼分析儀可以包括經由相應的光纖電纜將雷射遞送到(多個)探針的雷射源,並且還可以包括電荷耦合器件(CCD)或其他合適的相機/記錄設備以記錄經由相應光纖電纜的其他通道從(多個)探針接收的信號。可替代地,(多個)雷射源可以集成在(多個)探針內。每個探針可以是浸入式探針或任何其他合適類型的探針(例如,反射探針或透射探針)。分析儀和(多個)探針可以藉由激發、觀察和記錄細胞培養過程的分子「指紋」來非破壞性地掃描生物反應器102內的相關細胞培養物屬性。當該等內容物被由(多個)探針遞送的雷射激發時,分子指紋對應於生物活性內容物內分子的振動、旋轉和/或其他低頻模式。作為這個掃描過程的結果,拉曼分析儀生成一個或多個拉曼掃描向量,該等向量各自將強度表示為拉曼位移(頻率)的函數。拉曼分析儀然後可以分析(多個)拉曼掃描向量以確定(例如,推斷)對應細胞培養物屬性(例如,葡萄糖和/或其他代謝物濃度)的值。
上文所討論的拉曼光譜方法可以被認為係一種「軟」感測。在其他軟感測實施方式中,(多個)分析儀器104中的一個、一些或所有分析儀器可以包括利用一個或多個模型的計算/處理設備,其中(多個)模型組合不同類型的分析資料以基於該等類型的分析資料之間的相關性來預測一個或多個結果。這種結果可以直接或間接地與模型輸入(即,分析資料)相關。可替代地,計算系統108本身或另一個計算系統或設備可以針對(多個)分析儀器104中的一個或多個分析儀器執行該處理中的一些或全部。
輸入設備106通信地聯接到計算系統108,並且可以是(或包括)向生物反應器102的內容物提供物理輸入的任何(多個)電子可控致動器或(多個)部件。例如,輸入設備106可以是分散式控制系統(DCS),該分散式控制系統包括或聯接到向生物反應器102提供直接物理輸入的致動器。作為更具體的示例,輸入設備106可以包括向生物反應器添加受控量或速率的葡萄糖進料的葡萄糖泵或者向生物反應器102及其內容物提供熱量和/或冷卻的設備等。通常,輸入設備106可以包括泵、閥致動器和/或任何其他合適類型的控制元件或控制元件的組合。例如,輸入設備106可以包括比例積分微分(PID)控制器,並且從計算系統108接收設定值作為PID控制器的輸入。在一些實施方式中,系統100包括由計算系統108控制的兩個或更多個電子可控輸入設備。
計算系統108可以是伺服器、臺式電腦、膝上型電腦、平板設備或任何其他合適類型的一個或多個計算設備。在圖1所示的示例實施方式中,計算系統108包括處理硬體120、顯示設備124、使用者輸入設備126和記憶體128。然而,在一些實施方式中,計算系統108包括共同定位或彼此遠離的兩個或更多個電腦或其一些組合。在該等分散式實施方式中,本文描述的與處理硬體120和/或記憶體128有關的操作可以分別在多個處理單元和/或記憶體之間劃分。
處理硬體120包括一個或多個處理器,該一個或多個處理器中的每一個可以是可程式設計微處理器,該可程式設計微處理器執行存儲在記憶體128中的軟體指令以執行如本文描述的計算系統108的一些或全部功能。可替代地,處理硬體120中的一些處理器可以是其他類型的處理器(例如,專用積體電路(ASIC)、現場可程式設計閘陣列(FPGA)等),並且如本文所描述的計算系統108的一些功能可以替代地部分或全部地由這種硬體實施。記憶體128可以包括含有易失性和/或非易失性記憶體的一個或多個物理記憶體設備或單元。可以使用任何合適的一種或多種記憶體類型,如唯讀記憶體(ROM)、固態驅動器(SSD)、硬碟驅動器(HDD)等。
顯示設備124可以使用任何合適的顯示技術(例如,LED、OLED、LCD等)來向使用者呈現資訊,並且使用者輸入設備126可以是鍵盤、滑鼠、軌跡板、圖形/繪圖板或其他合適的輸入設備。在一些實施方式中,顯示設備124和使用者輸入設備126集成在單個設備(例如,觸控式螢幕顯示器)內。通常,顯示設備124和使用者輸入設備126可以共同使得使用者能夠與計算系統108提供的圖形化使用者介面(GUI)進行交互,例如,用於如監測生物反應器102內發生的細胞培養過程的目的。然而,在一些實施方式中,計算系統108不包括顯示設備124和/或使用者輸入設備126。
記憶體128存儲一個或多個軟體應用程式(包括細胞培養程序控制(CCPC)應用程式130)的指令。CCPC應用程式130當由處理硬體120執行時通常被配置為與(多個)分析儀器104和輸入設備106通信以分別獲得細胞培養物屬性的測量值和控制細胞培養過程的一個或多個輸入。時間間隔可以是任何合適的時間長度(例如,每天一次、每小時一次等)。此外,時間間隔可以是固定的或可變的長度/持續時間(例如,具有設定的/預定的長度,或者替代地具有取決於手動和/或可變輸入的長度)。此外,不管時間間隔是否係固定的/預定的,時間間隔可以:  (1) 都具有相同的長度/持續時間;或者 (2) 包括兩個或更多個不同的長度/持續時間(例如,其中第一時間間隔持續一個小時,第二時間間隔持續三個小時等)。為此,CCPC應用程式130包括測量單元140和模型預測控制器(MPC)142。應當理解,CCPC應用程式130的各個單元可以分佈在不同的軟體應用程式中,和/或任何一個此類單元的功能可以在不同的應用軟體程式之間劃分。
測量單元140可以獲得(例如,請求或以其他方式監測)由(多個)分析儀器104在任何期望數量的時間間隔內每時間間隔一次地產生的測量結果。在一些實施方式中,測量單元140藉由處理從(多個)分析儀器104獲得的值來確定一個或多個細胞培養物屬性值。例如,測量單元140可以基於由(多個)分析儀器104之一更頻繁地(例如,每15分鐘一次,每小時一次等)提供的代謝物測量結果,每時間間隔一次地(例如,每天一次)確定平均代謝物濃度。作為另一示例,測量單元140可以分析由(多個)分析儀器104的光譜儀提供的拉曼掃描向量以確定或推斷一個或多個細胞培養物屬性的值(如上所討論的)。通常,為了便於解釋,如「測量的」和「測量」等術語在本文被廣泛地用於指物理/直接測量的值、軟感測的值、或者從物理/直接測量的或軟感測的值導出(例如,使用物理上/直接測量的或軟感測的值計算)的值,除非其使用的上下文清楚地指示了更具體的含義。
MPC 142可以應用由測量單元140獲得的細胞培養物屬性值作為對混合預測單元144的輸入,該混合預測單元預測預測範圍(例如,預定天數或其他時間間隔)內的未來細胞培養物屬性值。基於該等預測值,MPC 142的優化器146確定針對控制範圍的每個時間間隔(例如,每天)的控制值,該控制範圍通常是大於或等於一但不大於預測範圍的一些數量的時間間隔。具體而言,優化器146藉由優化(例如,最小化)目標函數來確定針對控制範圍的每個時間間隔的控制值,該目標函數受制於各種約束(例如,將變數保持在最小值與最大值之間)和由混合預測單元144提供的預測屬性值。在每個時間間隔,在一些實施方式中,CCPC應用程式130藉由生成控制信號並將該控制信號發送到輸入設備106來使用控制範圍內的第一控制值(即,對應於當前時間間隔的控制值)控制輸入設備106。例如,控制信號可以符合輸入設備106理解的特定協定,並且可以在協定消息的適當欄位中包括控制值。例如,如果輸入設備106係葡萄糖泵,則CCPC應用程式130可以生成控制消息,該控制消息在消息的特定欄位中指定特定的葡萄糖進料速率設定值。
混合預測單元144利用至少兩個模型來生成其預測。例如,混合預測單元144可以利用基於對細胞培養過程的第一性原理的理解而開發的第一性原理模型150以及使用合適的歷史資料離線訓練的資料驅動模型152。在該示例中,混合預測單元144使用第一性原理模型150來預測一個或多個細胞培養物屬性的值,已經發現針對該等細胞培養物屬性第一性原理建模比資料驅動方法表現得更好(例如,更準確),並且使用資料驅動模型152來預測一個或多個細胞培養物屬性的值,已經發現針對該等細胞培養物屬性資料驅動(機器學習)模型比第一性原理模型表現得更好(例如,更準確)。在一些實施方式中,例如,資料驅動模型152使用過去的測量結果(例如,由(多個)分析儀器104測量的過去的測量的代謝物濃度)來預測在預測範圍內某些代謝物濃度和/或其他細胞培養物屬性的未來濃度,並且第一性原理模型150基於過去的測量結果、已知的葡萄糖進料速率和來自資料驅動模型152的一個或多個輸出來預測未來葡萄糖濃度。
取決於實施方式,第一性原理模型150可以對單個現象建模,或者可以是對細胞培養過程中的多個現象建模的多個第一性原理模型的集合。資料驅動模型152可以是線性模型(如線性回歸器)或非線性模型(如前饋神經網路)。在一些實施方式中,資料驅動模型152包括兩個或更多個資料驅動模型。例如,資料驅動模型152可以包括不同的資料驅動模型以預測多個細胞培養物屬性中的每一個的值,每個這種模型在適當類型的歷史資料上被訓練。此外,資料驅動模型152可以包括兩種或更多種不同類型的模型來進行預測。例如,資料驅動模型152可以包括用於預測第一組代謝物濃度中的每一個的未來值的線性回歸器,並且包括用於預測第二組代謝物濃度和/或其他細胞培養物屬性(例如,滲透壓等)中的每一個的未來值的前饋神經網路。為了便於解釋,以下描述主要涉及單個第一性原理模型和單個資料驅動模型。然而,應當理解,下文所討論的原理可以擴展到多個第一性原理模型和/或多個資料驅動模型的使用。
在一些實施方式中,資料驅動模型152基於該屬性的過去(測量的)值以及一個或多個已知(過去或當前)的控制值來預測細胞培養物屬性的值。例如,資料驅動模型152可以僅基於過去測量的鈉濃度和已知的葡萄糖進料速率來預測當前的鈉濃度。另外地,在一些實施方式中,資料驅動模型152可以基於其他細胞培養物屬性的過去(測量的)值來預測細胞培養物屬性的值。例如,資料驅動模型152可以基於過去測量的多種代謝物(例如,鈉、葡萄糖、乳酸鹽等)的濃度和已知的葡萄糖進料速率來預測當前的鈉濃度。
資料驅動模型152可以具有任何合適的階(例如,二階、三階等),如本文所使用的術語「階」係指在形成對一個或多個未來時間間隔值的預測時用作模型輸入的測量結果中反映的不同時間間隔的最大數量。因此,例如,對當天和前一天測量的代謝物濃度進行操作的回歸模型將被稱為二階回歸模型,而對來自當天、前一天和前一天之前的一天的代謝物濃度進行操作的回歸模型將被稱為三階回歸模型。更一般地,對於用作模型輸入的至少一種細胞培養物屬性,二階模型將對在時間間隔 i和( i-x)處獲得的測量結果進行操作,而對於用作模型輸入的至少一種細胞培養物屬性,三階回歸模型將對在時間間隔 i、( i-x)和( i-y)處獲得的測量結果進行操作,其中, x係大於零的任何整數,並且 y係大於 x的任何整數。取決於實施方式,該模型可以是線性的或非線性的。
因為三階回歸模型需要來自兩個更早的時間間隔(例如,前兩天)的測量結果,所以可能無法對前兩個時間間隔(例如,第0天和第1天)使用這種模型。因此,在一些實施方式中,圖1的混合預測單元144最初使用二階回歸模型(例如,在第二時間間隔開始),並且然後切換到三階回歸模型(例如,在第三時間間隔開始)。在其他實施方式中,混合預測單元144對(多個)初始時間間隔使用其他技術(例如,在第一時間間隔,簡單地將兩個「先前測量」值設置為等於當前測量值)。
系統100的除圖1中所示的佈置之外的佈置也是可能的。例如,在一些實施方式中,系統100包括訓練和/或更新資料驅動模型152的伺服器(圖1中未示出)和/或實施混合預測單元144(以及可能還有優化器146)並作為web服務模型的一部分與計算系統108交換資料的伺服器。作為另一個示例,系統100可以包括一個或多個附加的電子可控輸入設備,類似於輸入設備106但是可能具有不同的類型,並且CCPC應用程式130包括多個MPC(每個類似於MPC 142,並且每個負責控制輸入設備中不同的輸入設備),即,MIMO(多輸入多輸出)MPC。例如,MPC 142可以控制葡萄糖泵,而CCPC應用程式130(或者存儲在記憶體128或另一個記憶體中的單獨的、類似的應用程式)的第二MPC可以控制葉輪的速度。然而,為了便於解釋,下面的描述主要集中在具有單個MPC 142和單個輸入設備106的實施方式上。
在一些實施方式中,CCPC應用程式130還安排(向使用者)呈現資訊,如測量值(例如,由測量單元140獲得的值)和/或由混合預測單元144輸出的未來值(例如,以實現細胞培養過程的並行人工監測/監督)。例如,CCPC應用程式130可以生成和/或填充顯示細胞培養物屬性的過去、當前和預測/未來值的圖,並使顯示設備124顯示該圖。可替代地或另外地,CCPC應用程式130可以使顯示設備124以表格格式和/或某種其他合適的格式顯示值。在仍其他實施方式中,CCPC應用程式130不向使用者顯示任何資訊。
圖2係可以在圖1的系統100中實施的示例架構200之框圖。在圖2中,細胞培養過程202在圖1的生物反應器102中發生。由測量單元140使用圖1的(多個)分析儀器104獲得各種細胞培養物測量結果204(即,測量的細胞培養物屬性值)。如上所述,細胞培養物測量結果204可以包括細胞培養物中的一組代謝物(例如,葡萄糖、乳酸鹽、鈉、鉀、銨和/或麩醯胺酸)中的一種、一些或全部的濃度,以及可能的一種或多種其他類型的測量的細胞培養物屬性,如VCD、TCD、活力、滲透壓等。如JIT(即時)或CNN(卷積神經網路)等資料驅動模型可以用於提供細胞培養物測量結果的近似值。
細胞培養物測量結果204係混合預測模型206的輸入,該混合預測模型包括圖1的第一性原理模型150和資料驅動模型152(如上文所討論的,這兩個模型中的一個或兩個可以包括多個模型)。在圖2中,延遲元件(z -1和z -2)用於指示過去的細胞培養物測量結果204也作為輸入提供給混合預測模型206。圖2示出了三階(回歸或神經網路)模型實施方式,其中至少混合預測模型206的(多個)資料驅動模型對所有細胞培養物測量結果204的當前時間間隔(例如,當天或當前小時等)和前兩個時間間隔(例如,過去兩天)的值進行操作。然而,在其他實施方式中,過去的值僅用於細胞培養物測量結果204的子集,和/或預測模型具有不同的階數(例如,二階、四階等)。
在每個時間間隔,混合預測模型206使用如上文所討論的資料驅動模型152和第一性原理模型150處理輸入(即,當前和過去的測量值)以生成MPC 142的有限預測範圍(例如,接下來的四個時間間隔,或接下來的六個時間間隔等)內的細胞培養物屬性的預測值。
在每個時間間隔,在優化階段208,優化器146例如使用預測分批軌跡優化對預測的未來值以及可能的其他資訊進行操作,以生成輸入設備106的控制值(例如,設定值)。優化器146(以及作為整體的MPC 142)努力最小化細胞培養物變數的量與設定值之間的差異,同時確保變數保持在規格內。因此,有限時間範圍內的優化問題可以被公式化為每批的約束優化問題。
優化器146將預測值(在預測範圍的每個時間間隔處)作為輸入應用於目標函數,該目標函數確定控制範圍的每個時間間隔處的控制值。最優控制值係優化(例如,最小化)目標(成本)函數的控制值,該目標函數受制於對因變數和/或引數的多個約束。約束可以包括例如最小葡萄糖進料(輸注)速率或代謝物濃度、最大葡萄糖進料速率和/或其他合適的約束。目標函數可以對具有期望值(設定值)的每個細胞培養物屬性進行操作,如不同代謝物的不同期望濃度。優化器146然後可以確定控制值(例如,葡萄糖泵進料速率的設定值)以引導細胞培養過程達到(多個)期望的目標。
在一些實施方式中,主要目標係最大化生物過程的生產率,同時最小化副產物(即,藉由操縱向培養物中進料葡萄糖的時間、量和方式)。作為結果,可以為每個變數定義期望的閾值,並且目標函數(由優化器146求解)可以發展為變數與其在時間範圍內的期望設定值之間的二次誤差的總和, (方程1A) 其中, (方程1B) 其中, i係時間間隔, N p 係預測範圍內的時間間隔的數量, N c 係控制範圍內的時間間隔的數量, M係設定值/目標已知的變數的數量(例如,如果目標函數考慮VCD、TCD、活力、滲透壓和葡萄糖、乳酸鹽、麩胺酸鹽、麩醯胺酸、銨、鉀和鈉濃度,則為11), 分別是狀態 和進料(輸入)的權重參數,並且 係狀態 的設定值。方程1B中的參數應該較佳的是針對所考慮的特定細胞培養過程進行調整。作為一個示例,VCD、TCD、活力、葡萄糖、乳酸鹽、麩醯胺酸、麩胺酸鹽、銨、鈉、鉀和滲透壓的歸一化設定值可以分別為2、2、85、0.3、0.1、0.16、0.08、0.08、0.22、0.26和0.6。
當細胞培養物變數按照預定義的規格變化時,每個生物過程皆為多產的。如果細胞培養物變數超出規格,則該過程將偏離標準,並且產物品質可能會受到不利影響。此外,細胞培養物變數的濃度變為負值通常不合情理。因此,基於生物過程預期,所有生物過程變數的歸一化值可以被優化器146約束以保持在特定的邊界內(例如,VCD和TDC不小於零,乳酸鹽、麩醯胺酸、麩胺酸鹽、銨和鉀濃度不大於1,葡萄糖濃度介於0.2與0.8之間,活力介於0.4與1之間,鈉濃度介於0.18與1之間,以及滲透壓介於0.33與1之間)。
在一些實施方式中,由混合預測單元144實施的線性和/或非線性模型只有一個輸入:  進料。在(在方程1B中)對於除了VCD之外的變數給出非零權重的實施方式中,這意味著控制器僅用單個輸入就將多個變數驅動到其設定值。此外,如果主要目標係最大化VCD,則可以使用高閾值,同時限制其他變數,使得該等變數保持在期望的範圍內。
值得注意的是,線性MPC係凸優化,而非線性MPC係非凸的。為了解決凸或非凸問題,在每個時間間隔/步驟,優化器146可以迭代拉格朗日函數的梯度下降,以優化預測範圍內的過程輸入(例如,如在Kiran等人, Control of Continuous Fed-Batch Fermentation Process Using Neural Network Based Model Predictive Controller [使用基於神經網路的模型預測控制器對連續進料分批發酵過程的控制], 2009, 生物過程與生物系統工程化, 32, 801-808中所討論的)。對於凸問題,該等迭代在每個時間步驟以全域最小值結束,而非凸問題有可能永遠不會收斂。另外地,如果梯度下降方法不收斂到全域最小值,則非線性MPC實施方式中的優化器146可以截斷迭代,這可能報告不正確的值。此外,當狀態約束被視為軟約束時,線性MPC的解係全域最優的。如果該等約束係硬約束,則優化問題的解可能變得不可行。作為結果,線性MPC中的線性模型獲得的全域最優解可以被認為係MPC問題中相對於非線性模型的另一個優勢。
現在回到圖2的示例,優化器208向細胞培養過程202(更具體地,向輸入設備106)提供控制值(例如,進料速率或進料體積,或者進料速率或進料體積變化等)作為設定值,並且還向混合預測模型206提供控制值。在該示例中,混合預測模型206使用控制值連同細胞培養物測量結果204作為模型輸入之一。
圖3描繪了在特定實施方式和場景中之示例MPC(如圖1的MPC 142)的操作300。在圖3中,x軸表示時間間隔( ii+1等)而y軸表示各種測量值、預測值或受控值的幅度。y軸左側的區域( i-1, i-2等)表示過去的時間間隔,y軸右側的區域( i+1, i+2等)表示未來的時間間隔,並且 i表示當前的時間間隔。圖3示出了過去(測量的)細胞培養物屬性值302和過去的控制值(設定值)304,以及由混合預測模型206(例如,由第一性原理模型150或資料驅動模型152)預測的預測範圍 N p 內的未來細胞培養物屬性值306,以及由MPC 142計算的控制範圍 N c 內的未來控制值/設定值308。在一些實施方式中,CCPC應用程式130僅使用控制範圍內的第一控制值312來在時間 i處控制輸入設備106,並且然後在下一個時間間隔重複預測/優化/控制過程(圖3中的時間 i+1變成時間 i,時間 i+2變成時間 i+1,等等)。
圖4描繪了可以由圖1的混合預測單元144(即,第一性原理模型150和/或資料驅動模型152)做出的預測的示例序列400。在圖4中,參數 i表示當前時間間隔。因此,在每個時間間隔係一天的示例中, i係當天, i+1係下一天, i-1係前一天,等等。序列400示出了針對當前時間間隔 i的三階預測模型(例如,用於資料驅動模型152的神經網路或三階回歸模型)的預測進展。具有虛線輪廓的框表示分析測量結果(例如,(多個)分析儀器104進行測量的時間間隔),而具有實線輪廓的框表示由三階預測模型預測的值。如在該示例中所見,將當前( i)和過去兩個( i-1和 i-2)時間間隔的細胞培養物屬性的分析測量結果輸入到預測模型中(可能與其他細胞培養物屬性的測量結果一起),這允許預測模型預測下一個時間間隔 i+1的細胞培養物屬性的值。預測模型然後使用時間間隔 i+1的預測值,連同 ii-1的測量值來預測下一個時間間隔 i+2的細胞培養物屬性值。在該特定示例中,預測模型然後使用時間間隔 i+1和 i+2的預測值,連同 i的測量值來預測下一個時間間隔 i+3的細胞培養物屬性值,等等,直到四個時間間隔(到 i+4)的預測範圍。
已經發現第一性原理模型示出了進料與細胞培養變數之間的物理關係。為了對這種關係進行正確地建模,在每個時間點,每個模型參數的資料通常需要係可用的和可識別的。為了識別模型參數,參數資料應該較佳的是以均勻的時間間隔收集。在進料分批生物過程中添加團注進料意味著添加的進料水平在一些採樣時間可能為零,這導致該過程具有不均勻的進料輸入,並且因此可能無法適當地識別模型參數。也就是說,進料資料集中稀疏且不均勻的進料添加可能使模型對進料不敏感,這對於控制器設計係不期望的。然而,在葡萄糖係感興趣的代謝物並且是進料的主要成分的實施方式中,可以如下簡化進料複雜性,並且集中於評估進料與葡萄糖水平之間的質量平衡: (針對非基於體積的資料集) (方程2a) (針對基於體積的資料集) (方程2b) 其中 係時間間隔 i處的消耗速率, 係時間間隔 i處的進料速率, 係時間間隔 i處的葡萄糖濃度, 係時間間隔 i處的生物反應器中培養基的工作體積,並且 係時間間隔 i處的活細胞密度。所有品質屬性可以是非基於體積的格式,並且方程2a右手側的最後一項在每個單元的基礎上更新消耗速率。
方程2a和方程2b中的消耗速率 係不容易測量的內部過程變數。因此,可以使用方程2a和方程2b並基於葡萄糖濃度和進料的過去值來估計,如下: (方程3) 消耗速率 係基於最新的測量結果估計的,因為該性質通常在整個培養中平滑變化。但是,如果發生快速變化,則可以藉由從批次開始到時間 i取估計值的平均值,使用 的蒙特卡洛估計進行過濾。
第一性原理模型150可以使用方程2和方程3來預測下一時間間隔的未來葡萄糖濃度值,並且然後進行一系列迭代預測(例如,類似於序列400)以預測預測範圍內所有時間間隔1,…, N p 的葡萄糖濃度。在其他實施方式中,使用不同的第一性原理模型來預測葡萄糖濃度,和/或替代地(或還)使用第一性原理模型預測除葡萄糖濃度之外的細胞培養物屬性。
如果進料用作模型結構中的輸入,則資料驅動模型(例如,資料驅動模型142)可能類似地遭受進料資料集中的稀疏性。由於葡萄糖水平隨時間變化(即,不受稀疏性影響)並且與葡萄糖進料具有物理關係,因此葡萄糖也可以用作資料驅動模型中的輸入。因此,為了獲得整個生物過程的綜合模型,混合方法將資料驅動模型與方程2和方程3的葡萄糖質量平衡模型組合。
在一些實施方式中,如上所述,資料驅動模型152係如線性回歸器等線性模型。例如,資料驅動模型152可以如下預測一個或多個細胞培養物屬性狀態: ;                                    (方程4) 其中 [ .]係具有 j個不同細胞培養物屬性(例如,VCD、除葡萄糖之外的代謝物、活力等)中的每一個的元素的陣列,並且其中 係合適的常數(或 j個常數的陣列)。可替代地,資料驅動模型152可以使用類似於方程4的模型,但是其包括 [ .]和/或 [ .]的一個或多個過去值(即,時間 i-1, i-2等)的附加項。在方程2至方程4的示例實施方式中,由資料驅動模型152預測的時間間隔 i+1處的VCD可以用作第一性原理模型150的輸入(例如,作為方程2和方程3的輸入)。
資料驅動模型152可以替代地是前饋神經網路。已經發現兩層神經網路比其他神經網路表現得更好。圖5中示出了前饋神經網路500的簡化示例。神經網路係公認的通用函數逼近器。也就是說,藉由操縱層數和訓練資料的可用性,並使用適當的訓練方法,神經網路可以近似任何非線性輸入-輸出行為。如圖5所示,神經網路500包括輸入層502中的多個輸入、多個內部或隱藏層504-1至504- L(其中 L係大於零的任何合適的整數)中的每一層的內部節點、以及輸出層506中的多個輸出。在該示例中,神經網路500係第( m+1)階神經網路,其對來自當天或其他時間間隔( )以及回到(並包括)前第m個時間間隔 的每個前一時間間隔的輸入進行操作,其中 m係大於零的任何合適的整數。雖然圖5示出了層506中的 n個輸出,但是在一些實施方式中,神經網路500在每次迭代僅包括下一時間間隔(即, )的預測值。然後,類似於圖4的序列400的預測序列可以用於運行神經網路500的多次迭代,從而生成期望的預測範圍的長度內的附加的預測值(例如, 等)。
神經網路500的控制方程可以表示為: (方程5) 在方程5中, 分別是在層502處應用的網路輸入向量和在層506處產生的網路輸出向量,並且 係藉由優化訓練成本函數找到的網路權重矩陣。神經網路訓練成本函數可以假設為傳統的「誤差平方和」(SSE): (方程6) 在方程6中, 係測量的輸出,並且 係訓練樣本的數量。已經提出了各種局部和全域優化方法,以藉由優化如方程6的函數等訓練成本函數來尋找網路權重參數。雖然局部優化方法相對較快,但其往往會陷入優化問題的局部極小值,從而導致較差的泛化性能。在一些實施方式中,使用縮放共軛梯度方法來優化訓練成本函數並找到網路權重參數。「縮放共軛梯度」係一種快速和自動化的訓練演算法,與許多其他訓練演算法不同,其沒有任何使用者依賴性參數,並且不太可能陷入優化問題的局部最小值。
如上所述,在一些實施方式中,神經網路500被訓練成基於層502處的輸入來預測給定時間間隔 i處的細胞培養物屬性(例如,代謝物濃度、VCD、滲透壓等),該等輸入包括一個或多個更早時間間隔處的濃度/屬性的值,以及那些一個或多個更早時間間隔處的葡萄糖濃度值(例如,測量值)。在一些實施方式中,例如,用於預測細胞屬性 [ .]的神經網路函數可以是: (方程7) 該三階示例也可以被稱為「三回歸器神經網路」。輸出 可以是單個神經網路的不同輸出,或者平行作業的不同神經網路的輸出。混合預測單元144可以藉由類似於圖4的序列400的預測序列重複方程7,以便預測預測範圍內所有時間間隔1,…, N p 的值。
給定來自細胞培養過程的粒度的、真實世界的歷史資料的有限可用性,資料驅動模型152(無論是神經網路還是回歸模型)的訓練可能是具有挑戰性的。例如,可能沒有每天測量和記錄代謝物濃度。因此,在一些實施方式中,使用線性插值來為更大的訓練資料集提供更多的資料點(即,「缺失」值),儘管這種插值往往不準確。在一些實施方式中,在資料驅動模型152的後續訓練中(即,在預測模型已經被初始訓練並投入使用之後),資料驅動模型152藉由使用細胞培養物屬性的測量值和預測值分別作為標籤和輸入來持續適應。以這種方式,預測準確度可以隨著時間繼續增加。
圖6至圖20展示了本文所討論的智慧控制技術的各種實施方式的性能,用於MPC 142的各種實施方式和各種細胞培養過程(例如,不同的藥物產物和/或過程參數)。
圖6A至圖6C係示出了當在第一細胞培養過程中對資料驅動模型(例如,資料驅動模型152)以及方程2和方程3的第一性原理模型(在該示例中,為質量平衡模型)使用線性回歸時,MPC 142的一個實施方式的針對各種細胞培養物屬性(葡萄糖濃度(GLC)、總細胞密度(TCD)、麩醯胺酸濃度(GLN)、鈉濃度(Na)、活細胞密度(VCD)、活力(VIAB)、麩胺酸鹽濃度(GLU)、鉀濃度(K)、乳酸鹽濃度(LAC)、銨濃度(NH4)和滲透壓(OSMO))的預測性能之歸一化曲線圖。圖6A至圖6C中的「預測」軌跡對應於由那些模型做出的預測,而「測量」軌跡對應於實際測量結果。在圖6C中還示出了(受控的)進料速率。
圖7A至圖7C係示出了針對圖6A至圖6C中反映的相同實施方式和相同細胞培養過程的線性MPC 142的性能之歸一化曲線圖。儘管圖6A至圖6C展示了混合預測單元144預測各種細胞培養物屬性有多好,但是圖7A至圖7C反而展示了使用線性模型的系統100表現得有多好(在該特定實施方式中),如「測量」軌跡所示,並與表示由MPC計算的優化問題的解的「最佳」軌跡相比較。
圖8A至圖8C係示出了針對與圖6A至圖6C相同的細胞培養物屬性和相同的細胞培養過程,但是對於資料驅動模型(例如,資料驅動模型152)以及方程2和方程3的第一性原理使用前饋神經網路的MPC 142的另一個實施方式的預測性能之歸一化曲線圖。同樣,「預測」軌跡對應於由那些模型做出的預測,而「測量」軌跡對應於實際測量結果。還示出了測量的進料速率。
圖9A至圖9C係示出了針對圖8A至圖8C中反映的相同實施方式和細胞培養過程的MPC 142的性能之歸一化曲線圖。儘管圖8A至圖8C展示了MPC 142(即,混合預測單元144)預測各種細胞培養物屬性有多好,但是圖9A至圖9C反而展示了系統100表現得有多好(在該特定實施方式中),如「測量」軌跡所示,並與表示由MPC計算的優化問題的解的「最佳」軌跡相比較。
使用圖6至圖7所示的實施方式(具有線性模型)和使用圖8至圖9所示的實施方式(具有非線性模型,更具體地是神經網路)進行的預測的均方根誤差(RMSE)在下面的表1中示出:
細胞培養物屬性 線性模型 (第 1 階) 非線性模型 (第 3 階)
VCD 1 0.95
TCD 1 0.96
VIAB 1 1.04
GLC 1 1.03
LAC 1 1.13
GLN 1 1.26
GLU 1 1.67
NH4 1 1.68
Na 1 0.97
K 1 1.06
OSMO 1 0.98
[表1]
圖10A至圖10C係示出了針對不同於圖6至圖9的細胞培養過程的MPC 142的各種實施方式的預測性能之歸一化曲線圖。特別地,圖10A至圖10C示出了與不使用該等預測模型(在圖10A至圖10C中標記為「離線」)的系統相比,MPC 142使用線性回歸模型、一階非線性(前饋神經網路)模型和三階非線性(前饋神經網路)模型的實施方式的預測性能。
圖11A至圖11D係示出了針對圖10A至圖10C中反映的相同實施方式和相同細胞培養過程的MPC 142的性能的歸一化曲線圖,同樣具有用於比較目的的「離線」系統結果。在圖11A至圖11D(以及下文所討論的其他附圖)中,「LMPC」表示當MPC 142使用圖10A至圖10C的線性回歸模型時系統100的性能,「NLMPC-1」表示當MPC 142使用圖10A至圖10C的一階前饋神經網路時系統100的性能,並且「NLMPC-3」表示當MPC 142使用圖10A至圖10C的三階前饋神經網路時系統100的性能。
使用圖10至圖11中表示的實施方式和細胞培養過程進行的預測的歸一化RMSE值如下表2所示:
細胞培養物屬性 線性模型 (第 1 階) 非線性模型 (第 1 階) 非線性模型 (第 3 階)
VCD 1.00 1.22 1.92
TCD 1.00 1.35 2.16
VIAB 1.00 1.24 1.71
GLC 1.00 1.94 1.94
LAC 1.00 1.24 1.32
GLN 1.00 2.37 2.02
GLU 1.00 1.22 1.58
NH4 1.00 2.01 1.74
Na 1.00 2.58 2.04
K 1.00 2.16 1.31
OSMO 1.00 0.97 1.39
[表2]
圖12A至圖12C係示出了針對不同於圖6至圖9和圖10至圖11的細胞培養過程的又另一細胞培養過程的MPC 142的各種實施方式的預測性能之歸一化曲線圖。特別地,圖12A至圖12C示出了與不使用該等預測模型(在圖12A至圖12C中標記為「離線」)的系統相比,MPC 142使用線性回歸模型、一階非線性(前饋神經網路)模型和三階非線性(前饋神經網路)模型的實施方式的預測性能。
圖13A至圖13D係示出了針對圖12A至圖12C中反映的相同實施方式和相同細胞培養過程的MPC 142的性能的歸一化曲線圖,同樣具有用於比較目的的「離線」系統結果。使用圖12至圖13中表示的實施方式和細胞培養過程進行的預測的歸一化RMSE值如下表3所示:
細胞培養物屬性 線性模型 (第 1 階) 非線性模型 (第 3 階)
VCD 1.00 1.40
TCD 1.00 1.45
VIAB 1.00 0.73
GLC - -
LAC 1.00 0.63
GLN 1.00 0.53
GLU 1.00 1.00
NH4 1.00 1.33
Na 1.00 0.65
K 1.00 0.89
OSMO 1.00 0.53
[表3]
表4比較了針對圖6至圖9的第一細胞培養過程、圖10至圖11的第二細胞培養過程和圖12至圖13的第三細胞培養過程,不使用混合預測模型(在表4中標記為「離線」)、線性回歸器(第一階)和前饋神經網路(第3階)的系統的(歸一化)所得集成VCD(iVCD):
細胞培養過程 離線 線性模型 (第 1 階) 非線性模型 (第 3 階)
第一 1.00 1.02 0.86
第二 1.00 1.20 0.67
第三 1.00 1.21 2.42
[表4]
總的來說,對於具有混合預測模型的MPC,線性模型提供了比非線性模型更好的RMSE性能。此外,從優化的角度來看,線性模型的較簡單結構對最優控制施加了較低的複雜度,從而提供了優於非線性方法的又另一好處。具體來說,對於至少一些細胞培養過程,發現雙回歸器(二階)線性模型比其他方法更準確,並且複雜度更低。
為了進一步評估系統100的某些實施方式的性能,將使用常規細胞培養控制方法的對照實驗與使用具有混合預測模型的MPC來控制葡萄糖進料的實驗進行比較。在該等實驗中,每天一次地收集樣品/測量結果,並且(對於具有混合預測模型的MPC)MPC計算每日葡萄糖進料策略以優化VCD。作為對優化階段的限制,葡萄糖進料速率被限制在12 g/L,並且還設定了3 g/L的最小進料速率,但是不需要強制執行。
圖14和圖15係將分別針對這兩個實驗(對於系統100的實施方式標記為「MPC反應器」,並且對於常規技術標記為「對照反應器」)的葡萄糖進料水平和VCD進行比較的歸一化圖,並且圖16A和圖16B示出了用於VCD預測的預測拉曼掃描向量與測量拉曼掃描向量(分別用於對照反應器和MPC反應器)。
圖17係將MPC和對照實驗的葡萄糖進行比較的歸一化圖,並且圖18A和圖18B示出了用於葡萄糖濃度預測的預測拉曼掃描向量與測量拉曼掃描向量(分別用於對照反應器和MPC反應器)。圖19包括對照系統和實施本文揭露的MPC/混合預測建模技術的實施方式的系統的滴定度(按過程日和最終日滴定度)和單位生產率的比較。圖20A和圖20B示出了用於滴定度預測的預測拉曼掃描向量與測量拉曼掃描向量(分別用於對照生物反應器和MPC生物反應器)。
表5將對照生物反應器和MPC/混合預測建模反應器的歸一化SE-HPLC HMW、rCE LC+HC和高甘露糖與典型的驗收標準進行比較:
反應器 SE-HPLC HMW rCE LC+HC 高甘露糖
對照 0.8651 1.0021 0.5398
MPC/混合預測 0.8635 1.0031 0.6311
驗收標準 ≤ 1.0000 ≥ 1.0000 ≤ 1.0000
[表5]
表6將對照生物反應器和MPC/混合預測建模生物反應器的歸一化酸性峰、鹼性峰3、鹼性峰和主峰與典型的驗收標準進行比較:
反應器 酸性峰 鹼性峰 3 鹼性峰 主峰
對照 0.6630 0.7752 0.8441 1.0419
MPC/混合預測 0.6327 0.6656 0.8026 1.0667
驗收標準 0.4028-1.000 ≤ 1.000 0.2838-1.000 ≥ 1.000
[表6] 如表6所示,MPC/混合預測生物反應器系統具有更高的主峰和更低的鹼性峰3,這係有利的。對於表5和表6中所示的其他參數,MPC/混合預測生物反應器系統的性能保持在可接受的範圍內。如貫穿圖6至圖20所示,MPC/混合預測生物反應器系統結合了對VCD、葡萄糖和滴定度的拉曼預測。線性MPC/混合預測生物反應器系統通常導致更多的生產細胞,而不是更多的細胞生產。當考慮到線性MPC/混合預測生物反應器系統營養不足大約2%時,這係重要的。如果已經進料了適當量的營養物,則VCD以及因此滴定度生產可能會更高。所得VCD的總體趨勢隨時間波動,並且這種VCD的波動係預期的,因為大體積的團注進料和細胞生長會導致培養物中的細胞密度下降或增加。此外,線性MPC/混合預測生物反應器系統試圖藉由推薦更多的進料來將葡萄糖維持在較高的水平。事實上,線性MPC/混合預測生物反應器系統推薦比手動條件多進料大約35%的葡萄糖。然而,線性MPC/混合預測生物反應器系統直到稍後一天才進料葡萄糖,這導致線性MPC/混合預測生物反應器系統在隨後幾天的VCD較低。另一方面,細胞的活力在整個批次中保持在相同水平,這證實了線性MPC/混合預測生物反應器系統具有細胞的健康環境。
藉由使用高斯過程(GP)回歸模型可以獲得另外的益處。如上所述,資料的不確定性和缺乏性會限制資料驅動建模技術的有效性。高斯過程回歸模型可以處理資料的內在不確定性,並且即使對於小資料集也能以令人滿意的方式執行。因此,在一些實施方式中,MPC 142中的資料驅動模型152係GP模型。這種方法在本文中被稱為「GP-MPC技術」或簡稱為「GP-MPC」。GP-MPC技術對生物反應器102中的細胞培養過程進行建模,並且可以用於設計和決定細胞培養過程的最佳/最優控制動作。使用GP-MPC,可以識別和強制執行細胞實現某些目標(如產物品質和產量)所採用的最佳代謝途徑,同時保持過程約束。藉由組合上述優越的滴定度生產和產品品質益處(對於主峰和鹼性峰3),線性MPC/混合預測生物反應器系統具有顯著降低成本的可能性(例如,5%或更多)。
GP模型為非線性動態系統的黑盒識別提供了一種概率的、非參數的建模方法。參見,例如,C. E. Rasmussen和C. K. Williams, Gaussian Processes for Machine Learning [機器學習的高斯過程] The MIT Press: Cambridge USA [麻省理工學院出版社:美國坎布裡奇], 2006。GP模型可以預測以觀察到的訓練點為條件的看不見的資料點的條件後驗分佈,並且將預測點的平均值計算為訓練資料的線性組合,該等線性組合的權重由距訓練輸入的核距離確定。GP模型可以用歷史資料離線訓練,如以上針對資料驅動模型152所討論的。
在資料驅動模型152係GP模型的一些實施方式中,GP模型的一個或多個預測被傳遞到葡萄糖質量平衡方程(例如,方程2和方程3中的VCD[ i+1]值)。葡萄糖不是操縱變數,而是進料的主要成分。目的是最大化VCD,同時將生物反應器102中的葡萄糖濃度保持在特定範圍內。
將GP與MPC組合帶來了多重挑戰,如計算負荷隨著訓練資料點的數量而呈立方增長。這也增加了解決所得到的最優控制問題所需的總計算量。優化需要雅可比式來評估最優方向並檢查最優性條件。GP模型可以充當優化問題的黑盒,而不需要任何顯式的數學運算式。在一些實施方式中,優化問題(即,優化器146)使用如有限差分等數值方法來計算雅可比式。計算有限差分逼近可能需要許多函數求值,這會減慢優化過程。為了加速計算過程,混合預測單元144可以評估雅可比函數(矩陣)並將雅可比函數傳遞給優化問題(即,傳遞給優化器146)。如上文所討論的,GP模型給出了映射輸入到輸出的函數的後驗分佈。高斯過程可以被微分以獲得梯度上的分佈。如果協方差函數係可微分的,則混合預測單元144可以以封閉形式計算梯度。因此,減少了對有限差分計算的需要。相應地,在GP模型的訓練和調整期間,混合預測單元144可以使用可微分的協方差函數(例如,平方指數協方差函數或其他合適的函數)。
GP-MPC技術可以產生與常規進料策略相比不同的進料策略。例如,GP-MPC技術可能建議在整個細胞培養過程中使用不同的進料體積,而不是僅在三天內對生物反應器進行進料。圖21係將使用GP-MPC技術和不使用GP-MPC技術(圖21中的「對照資料」)的過程的葡萄糖進料速率進行比較之歸一化曲線圖。如圖22所示,不同的進料策略轉化為稍高的整體活細胞密度(iVCD)。最終滴定度濃度與過程中的一些屬性高度相關,如VCD和滲透壓。可以為所有該等屬性設置目標,並且可以制定優化來滿足該等目標。例如,可以將若干權重分配給目標函數中的屬性以基於給定製造地點的需要來改變控制器的驅動因子。選擇某些代謝物相關屬性而不是滴定度來定義目標函數的原因係代謝物相關測量結果(例如,VCD)在每個採樣間隔皆為容易獲得的,而準確的滴定度估計值通常不容易獲得。
除了VCD,某些其他代謝物相關屬性的趨勢及其與對照資料的比較在圖23中示出。在GP-MPC的情況下,所有屬性都保持在其期望範圍內,並且在過程中遵循合理的趨勢。圖24中比較了對照資料和GP-MPC技術的滴定度值。有利地,與過程結束時的對照資料相比,GP-MPC技術可使滴定度提高15%。
總之,GP-MPC技術能夠在一致的狀態下觀察和維持細胞培養過程以實現各種目標,這取決於給定製造地點的需要。設計的系統可以確保最小的可變性以滿足品質目標,同時藉由即時進行必要的調整來優化更高的產量。高斯過程可以藉由指示預測平均值周圍的較高方差來突出顯示由於缺少資料或其複雜性而導致預測品質較差的過程區域。該資訊可以用於修改過程約束,以能夠處理特定區域中的非凸性和非線性。
圖25係在模型預測控制器中使用混合預測建模來控制細胞培養過程的示例方法2500的流程圖。方法2500可以由如圖1的系統100等系統來實施(例如,由執行CCPC應用程式130的指令的處理硬體120來實施)。方法2500可以在細胞培養過程中重複(例如,即時地)多個時間間隔(例如,多天中的每一天),例如每個時間間隔一次(每天一次,或每小時一次等),其中時間間隔 (1) 具有固定或可變的長度/持續時間,和 (2) 全部具有相同的長度/持續時間或包括兩個或更多個不同的長度/持續時間。
在框2502處,獲得與細胞培養物(例如,在如生物反應器102等生物反應器中)相關聯的細胞培養物屬性的當前值。例如,框2502可以包括:從另一個設備或系統(例如,從(多個)分析儀器104)接收當前值;直接測量該等值中的一些或所有(例如,藉由(多個)分析儀器104);和/或推斷或預測該等值中的一些或所有(例如,基於由(多個)分析儀器104生成的拉曼光譜測量結果/掃描向量)。獲得值的細胞培養物屬性可以包括一種或多種代謝物濃度(例如,葡萄糖、乳酸鹽、鈉、銨、麩醯胺酸、麩胺酸鹽、鉀)、VCD、TCD、活力、滲透壓和/或細胞培養物的一種或多種其他屬性。
在框2504處,生成細胞培養過程的物理輸入的控制值。物理輸入可以是例如由葡萄糖泵提供的葡萄糖進料速率,或者另一種類型的物理輸入(例如,如果溫度受到控制,則由加熱或冷卻設備提供的輸入,或者葉輪速度等)。框2504包括在框2506處基於在框2502處獲得的當前值來預測細胞培養物屬性的未來值。例如,框2506可以包括預測預測範圍的每個時間間隔的值。
預測可以基於細胞培養物屬性的最近測量結果(即,在框2502處獲得的「當前」值)和該等屬性中的一些或所有的可能的一個或多個早期測量值。框2506包括:使用一個或多個資料驅動模型(例如,資料驅動模型152)來預測細胞培養物屬性中的第一一個或多個屬性的未來值;以及使用一個或多個第一性原理模型(例如,第一性原理模型150)來預測細胞培養物屬性中的第二一個或多個屬性的未來值。例如,(多個)第一屬性可以包括VCD、TCD、活力、滲透壓、乳酸鹽濃度、麩醯胺酸濃度、麩胺酸鹽濃度、銨濃度、鈉濃度和/或鉀濃度,和/或(多個)第二屬性可以包括細胞培養物的葡萄糖濃度。在一些實施方式中,框2506包括將第一一個或多個屬性中的第一屬性的預測未來值(例如,由(多個)資料驅動模型之一預測的未來VCD值)作為輸入應用到(多個)第一性原理模型中的至少一個。(多個)第一性原理模型可以包括質量平衡模型,如由方程2和方程3表示的模型。(多個)資料驅動模型可以包括上文所討論的任何一個或多個資料驅動模型類型。例如,(多個)資料驅動模型可以包括任何合適階數的線性回歸模型、任何合適階數的前饋神經網路或其他非線性模型、如高斯過程模型等概率回歸模型等。
框2504還包括在框2508處藉由優化(例如,最小化)目標函數來確定控制值,該目標函數受制於在框2506處預測的未來值和(多個)任何其他約束(例如,最小和最大葡萄糖進料值)。例如,目標函數可以具有方程1A和方程1B的形式。例如,框2508可以包括確定針對控制範圍的每個時間間隔的控制值。
在框2510處,使用控制值(例如,使用對應於控制範圍的一組控制值中的第一個/最早的控制值)來控制細胞培養過程的物理輸入。例如,框2510可以包括:生成控制信號(例如,符合輸入設備106的協定的消息);以及將控制信號發送到適當的設備(例如,到輸入設備106)。作為更具體的示例,框2510可以包括藉由生成控制信號(例如,指定設定值的消息/命令)並將該信號發送到葡萄糖泵來控制葡萄糖進料速率。
現在將解決與本揭露內容有關的附加考慮。
本文所述之一些圖展示了具有一個或多個功能部件的示例框圖。將理解的是,這種框圖係出於說明的目的,並且所描述和示出的設備可以比所展示的具有額外的、更少的、或替代的部件。另外地,在各種實施方式中,部件(以及由相應部件提供的功能)可以與任何合適部件相關聯或以其他方式集成為其一部分。
本揭露內容之實施方式關於非暫態電腦可讀存儲介質,在該非暫態電腦可讀存儲介質上具有用於執行各種電腦實施操作的電腦代碼。術語「電腦可讀存儲介質」在本文中用於包括能夠存儲或編碼用於執行本文所述之操作、方法和技術的一系列指令或電腦代碼的任何介質。介質和電腦代碼可以是為了本揭露內容之實施方式的目的而特別設計和構造的介質和電腦代碼,或者該介質和電腦代碼可以是電腦軟體領域的技術人員公知和可獲得的類型。電腦可讀存儲介質的示例包括但不限於:磁性介質,如硬碟、軟碟、和磁帶;光學介質,如CD-ROM和全息設備;磁光介質,如光碟;以及被特別配置成存儲和執行程式碼的硬體設備,如ASIC、可程式設計邏輯設備(「PLD」)以及ROM和RAM設備。
電腦代碼的示例包括如由編譯器產生的機器代碼、以及包含由電腦使用解譯器或編譯器執行的較高級代碼的檔。例如,可以使用Java、C++、或其他對象導向的程式設計語言和開發工具來實施本揭露內容之實施方式。電腦代碼的附加示例包括加密代碼和壓縮代碼。此外,本揭露內容之實施方式可以作為電腦程式產品下載,該電腦程式產品可以經由傳輸通道從遠端電腦(例如,伺服器電腦)傳送到請求電腦(例如,使用者端電腦或不同的伺服器電腦)。本揭露內容之另一個實施方式可以用硬接線電路系統代替機器可執行軟體指令或與機器可執行軟體指令組合來實施。
如本文所使用的,除非上下文另有明確指明,否則單數術語「一個(a)」、「一種(an)」和「該(the)」可以包括複數個引用物。
如本文所使用的,術語「大約」、「基本上」、「基本」和「約」用於描述並且解釋小的變化。當與事件或情況相結合使用時,該等術語可以指代事件或情況恰好發生的情形以及事件或情況近似發生的情形。例如,當結合數值使用時,該等術語可以指代該數值小於或等於±10%,如小於或等於±5%,小於或等於±4%、小於或等於±3%、小於或等於±2%、小於或等於±1%、小於或等於±0.5%、小於或等於±0.1%、或小於或等於±0.05%的變化範圍。例如,如果值之間的差小於或等於值的平均值的±10%,如小於或等於±5%、小於或等於±4%、小於或等於±3%、小於或等於±2%、小於或等於±1%、小於或等於±0.5%、小於或等於±0.1%、或小於或等於±0.05%,則可以認為兩個數值「基本上」相同。
另外地,數量、比率、以及其他數值在本文有時以範圍格式呈現。應當理解,這種範圍格式係為了方便和簡潔而使用,並且應靈活地理解為包括明確指定為範圍極限的數值,但也包括涵蓋在該範圍內的所有單獨數值和子範圍,就好像每個數值或子範圍明確指定了一樣。
雖然已經參考本揭露內容之具體實施方式描述和展示了本揭露內容,但該等描述和圖示並不限制本揭露內容。熟悉該項技術者應當理解,在不脫離由所附請求項限定的本揭露內容之真實精神和範圍的情況下,可以進行各種改變並且可以替換等同物。該等圖示不一定係按比例繪製的。由於製造過程、容差和/或其他原因,本揭露內容中的藝術再現與實際裝置之間可能存在差異。可以存在未具體展示的本揭露內容之其他實施方式。說明書(除了申請專利範圍之外)和附圖應被視為說明性的而非限制性的。可以進行修改以使特定情況、材料、物質組成、技術、或過程適應本揭露內容之目的、精神和範圍。所有該等修改旨在落入所附請求項的範圍內。雖然已經參考按特定循序執行的特定操作描述了本文揭露的技術,但應理解,該等操作可以在不脫離本揭露內容之教導的情況下組合、細分、或重新排序以形成等同的技術。因此,除非本文有具體指示,否則操作的順序和分組並不是對本揭露內容之限制。
100:系統 102:生物反應器 104:分析儀器 106:輸入設備 108:計算系統 120:處理硬體 124:顯示設備 126:使用者輸入設備 128:記憶體 130:細胞培養程序控制(CCPC)應用程式 140:測量單元 142:模型預測控制器(MPC) 144:混合預測單元 146:優化器 150:第一性原理模型 152:資料驅動模型 200:示例架構 202:細胞培養過程 204:細胞培養物測量結果 206:混合預測模型 208:優化階段
熟悉該項技術者將理解,本文所描述的附圖係出於說明目的而包括的,而非限制本揭露內容。附圖不一定係按比例繪製,而是將重點放在說明本揭露內容之原理上。應當理解,在一些情況下,所描述的實施方式的各個方面可以被誇大或放大示出,以有助於理解所描述的實施方式。在附圖中,貫穿各附圖,相似的附圖標記通常指代功能相似和/或結構相似的部件。
[圖1]係根據本文揭露的技術可以用於監測和控制細胞培養過程的示例系統之簡化框圖。
[圖2]係可以在圖1的系統中實施的示例架構之框圖。
[圖3]描繪了可以用作圖1和/或圖2的模型預測控制器的模型預測控制器之示例操作。
[圖4]描繪了由圖1和/或圖2的預測模型做出的預測之示例序列。
[圖5]描繪了可以用作圖1的資料驅動模型之示例神經網路。
[圖6A至圖6C]係示出了針對第一細胞培養過程當使用具有第一性原理模型的線性回歸器時各種細胞培養物屬性的預測性能之歸一化曲線圖。
[圖7A至圖7C]係示出了針對第一細胞培養過程當使用具有第一性原理模型的線性回歸器時各種細胞培養物屬性的模型預測控制器性能之歸一化曲線圖。
[圖8A至圖8C]係示出了針對第一細胞培養過程當使用具有第一性原理模型的神經網路時各種細胞培養物屬性的預測性能之歸一化曲線圖。
[圖9A至圖9C]係示出了針對第一細胞培養過程當使用具有第一性原理模型的神經網路時各種細胞培養物屬性的模型預測控制器性能之歸一化曲線圖。
[圖10A至圖10C]係針對第二細胞培養過程將使用線性或非線性資料驅動預測模型時與使用第一性原理模型時各種細胞培養物屬性的預測性能進行比較之歸一化曲線圖。
[圖11A至圖11D]係針對第二細胞培養過程將使用線性或非線性資料驅動預測模型時與使用第一性原理模型時各種細胞培養物屬性的模型預測控制器性能進行比較之歸一化曲線圖。
[圖12A至圖12C]係針對第三細胞培養過程將使用線性或非線性資料驅動預測模型時與使用第一性原理模型時各種細胞培養物屬性的預測性能進行比較之歸一化曲線圖。
[圖13A至圖13D]係針對第三細胞培養過程將使用線性或非線性資料驅動預測模型時與使用第一性原理模型時各種細胞培養物屬性的模型預測控制器性能進行比較之歸一化曲線圖。
[圖14]係將使用和不使用本文揭露的模型預測控制和混合預測建模技術的過程的葡萄糖進料水平進行比較的歸一化圖。
[圖15]係將使用和不使用本文揭露的模型預測控制和混合預測建模技術的過程的活細胞密度進行比較之歸一化曲線圖。
[圖16A和圖16B]係示出了針對分別不使用和使用本文揭露的模型預測控制和混合預測建模技術的系統的活細胞密度的預測拉曼掃描向量與測量拉曼掃描向量之歸一化曲線圖。
[圖17]係將使用和不使用本文揭露的模型預測控制和混合預測建模技術的過程的葡萄糖濃度進行比較之歸一化曲線圖。
[圖18A和圖18B]係示出了針對分別不使用和使用本文揭露的模型預測控制和混合預測建模技術的系統的葡萄糖濃度的預測拉曼掃描向量與測量拉曼掃描向量之歸一化曲線圖。
[圖19]包括將使用和不使用本文揭露的模型預測控制和混合預測建模技術的過程的滴定度和單位生產率進行比較之歸一化曲線圖。
[圖20A和圖20B]係示出了針對分別不使用和使用本文揭露的模型預測控制和混合預測建模技術的系統的滴定度的預測拉曼掃描向量與測量拉曼掃描向量之歸一化曲線圖。
[圖21]係將使用和不使用本文揭露的模型預測控制和混合預測建模技術的過程的葡萄糖進料速率進行比較之歸一化曲線圖,其中使用高斯過程建模進行模型預測控制。
[圖22]係將使用和不使用本文揭露的模型預測控制和混合預測建模技術的過程的活細胞密度進行比較之歸一化曲線圖,其中使用高斯過程建模進行模型預測控制。
[圖23]示出了將使用和不使用本文揭露的模型預測控制和混合預測建模技術的過程的總細胞密度、葡萄糖濃度、活力和滲透壓進行比較之歸一化曲線圖,其中使用高斯過程建模進行模型預測控制。
[圖24]係將使用和不使用本文揭露的模型預測控制和混合預測建模技術的過程的滴定度進行比較之歸一化曲線圖,其中使用高斯過程建模進行模型預測控制。
[圖25]係在模型預測控制器中使用混合預測建模來控制細胞培養過程的示例方法之流程圖。
100:系統
102:生物反應器
104:分析儀器
106:輸入設備
108:計算系統
120:處理硬體
124:顯示設備
126:使用者輸入設備
128:記憶體
130:細胞培養程序控制(CCPC)應用程式
140:測量單元
142:模型預測控制器(MPC)
144:混合預測單元
146:優化器
150:第一性原理模型
152:資料驅動模型

Claims (38)

  1. 一種在模型預測控制器中使用混合預測建模來控制細胞培養過程之方法,該方法包括針對該細胞培養過程期間的多個時間間隔: 獲得與細胞培養物相關聯的細胞培養物屬性的當前值; 由處理硬體生成該細胞培養過程的物理輸入的控制值,其中,生成該控制值包括 基於該等當前值,至少藉由以下操作來預測該等細胞培養物屬性的未來值:(i) 使用一個或多個資料驅動模型來預測該等細胞培養物屬性中的第一一個或多個屬性的未來值,以及 (ii) 使用一個或多個第一性原理模型來預測該等細胞培養物屬性中的第二一個或多個屬性的未來值,以及 藉由優化受制於該等細胞培養物屬性的預測未來值的目標函數來確定該控制值;以及 由該處理硬體並使用該控制值來控制該細胞培養過程的物理輸入。
  2. 如請求項1所述之方法,其中: 該細胞培養過程的物理輸入係葡萄糖進料速率; 該第二一個或多個屬性包括該細胞培養物的葡萄糖濃度;並且 控制該細胞培養過程的物理輸入包括藉由向葡萄糖泵發送控制信號來控制該葡萄糖進料速率。
  3. 如請求項2所述之方法,其中,該第一一個或多個屬性包括活細胞密度、總細胞密度、活力、滲透壓、乳酸鹽濃度、麩醯胺酸濃度、麩胺酸鹽濃度、銨濃度、鈉濃度和/或鉀濃度。
  4. 如請求項1至3中任一項所述之方法,其中,使用該一個或多個第一性原理模型來預測該第二一個或多個屬性的未來值包括將該第一一個或多個屬性中的第一屬性的預測未來值作為輸入應用於該一個或多個第一性原理模型中的至少一個。
  5. 如請求項4所述之方法,其中,該第一屬性係活細胞密度。
  6. 如請求項1至5中任一項所述之方法,其中,該一個或多個資料驅動模型包括線性回歸模型。
  7. 如請求項1至6中任一項所述之方法,其中,該一個或多個資料驅動模型包括概率回歸模型。
  8. 如請求項7所述之方法,其中,該概率回歸模型係高斯過程回歸模型。
  9. 如請求項1至8中任一項所述之方法,其中,該一個或多個資料驅動模型包括非線性模型。
  10. 如請求項9所述之方法,其中,該非線性模型係前饋神經網路。
  11. 如請求項1至10中任一項所述之方法,其中,預測該等細胞培養物屬性的未來值係基於 (i) 該等細胞培養物屬性的當前值和 (ii) 該等細胞培養物屬性的一個或多個早期值。
  12. 如請求項1至11中任一項所述之方法,其中,使用該一個或多個第一性原理模型來預測該第二一個或多個屬性的未來值包括將一個或多個先前控制值作為輸入應用於該一個或多個第一性原理模型。
  13. 如請求項1至12中任一項所述之方法,其中,該等細胞培養物屬性的當前值係基於來自一個或多個分析儀器的測量結果而獲得的。
  14. 一種或多種存儲指令的非暫態電腦可讀介質,該等指令當由計算系統的處理硬體並針對細胞培養過程期間的多個時間間隔執行時使該計算系統: 獲得與細胞培養物相關聯的細胞培養物屬性的當前值; 生成該細胞培養過程的物理輸入的控制值,其中,生成該控制值包括 基於該等當前值,至少藉由以下操作來預測該等細胞培養物屬性的未來值:(i) 使用一個或多個資料驅動模型來預測該等細胞培養物屬性中的第一一個或多個屬性的未來值,以及 (ii) 使用一個或多個第一性原理模型來預測該等細胞培養物屬性中的第二一個或多個屬性的未來值,以及 藉由優化受制於該等細胞培養物屬性的預測未來值的目標函數來確定該控制值;以及 使用該控制值來控制該細胞培養過程的物理輸入。
  15. 如請求項14所述之一種或多種非暫態電腦可讀介質,其中: 該細胞培養過程的物理輸入係葡萄糖進料速率; 該第二一個或多個屬性包括該細胞培養物的葡萄糖濃度;並且 控制該細胞培養過程的物理輸入包括藉由向葡萄糖泵發送控制信號來控制該葡萄糖進料速率。
  16. 如請求項14或15所述之一種或多種非暫態電腦可讀介質,其中,該第一一個或多個屬性包括活細胞密度、總細胞密度、活力、滲透壓、乳酸鹽濃度、麩醯胺酸濃度、麩胺酸鹽濃度、銨濃度、鈉濃度和/或鉀濃度。
  17. 如請求項14至16中任一項所述之一種或多種非暫態電腦可讀介質,其中,使用該一個或多個第一性原理模型來預測該第二一個或多個屬性的未來值包括將該第一一個或多個屬性中的第一屬性的預測未來值作為輸入應用於該一個或多個第一性原理模型中的至少一個。
  18. 如請求項17所述之一種或多種非暫態電腦可讀介質,其中,該第一屬性係活細胞密度。
  19. 如請求項14至18中任一項所述之一種或多種非暫態電腦可讀介質,其中,該一個或多個資料驅動模型包括線性回歸模型。
  20. 如請求項14至19中任一項所述之一種或多種非暫態電腦可讀介質,其中,該一個或多個資料驅動模型包括概率回歸模型。
  21. 如請求項20所述之一種或多種非暫態電腦可讀介質,其中,該概率回歸模型係高斯過程回歸模型。
  22. 如請求項14至21中任一項所述之一種或多種非暫態電腦可讀介質,其中,該一個或多個資料驅動模型包括非線性模型。
  23. 如請求項20所述之一種或多種非暫態電腦可讀介質,其中,該非線性模型係前饋神經網路。
  24. 如請求項14至23中任一項所述之一種或多種非暫態電腦可讀介質,其中,預測該等細胞培養物屬性的未來值係基於 (i) 該等細胞培養物屬性的當前值和 (ii) 該等細胞培養物屬性的一個或多個早期值。
  25. 如請求項14至24中任一項所述之一種或多種非暫態電腦可讀介質,其中,使用該一個或多個第一性原理模型來預測該第一屬性的未來值包括將一個或多個先前控制值作為輸入應用於該一個或多個第一性原理模型。
  26. 如請求項14至25中任一項所述之一種或多種非暫態電腦可讀介質,其中,該等細胞培養物屬性的當前值係基於來自一個或多個分析儀器的測量結果而獲得的。
  27. 一種系統,包括: 生物反應器,該生物反應器被配置為在細胞培養過程期間容納細胞培養物; 電子可控輸入設備,該電子可控輸入設備被配置為向該細胞培養過程提供物理輸入; 一個或多個分析儀器,該一個或多個分析儀器被配置為測量與該細胞培養物相關聯的一個或多個細胞培養物屬性;以及 計算系統,該計算系統被配置為針對該細胞培養過程期間的一個或多個時間間隔, 基於該一個或多個分析儀器的測量結果獲得與該細胞培養物相關聯的細胞培養物屬性的當前值, 生成該細胞培養過程的物理輸入的控制值,其中,生成該控制值包括 基於該等當前值,至少藉由以下操作來預測該等細胞培養物屬性的未來值:(i) 使用一個或多個資料驅動模型來預測該等細胞培養物屬性中的第一一個或多個屬性的未來值,以及 (ii) 使用一個或多個第一性原理模型來預測該等細胞培養物屬性中的第二一個或多個屬性的未來值,以及 藉由優化受制於該等細胞培養物屬性的預測未來值的函數方程來確定該控制值;以及 藉由向該電子可控輸入設備發送控制信號來使用該控制值控制該細胞培養過程的物理輸入。
  28. 如請求項27所述之系統,其中: 該電子可控輸入設備包括葡萄糖泵; 該細胞培養過程的物理輸入係葡萄糖進料速率;並且 該第二一個或多個屬性包括該細胞培養物的葡萄糖濃度。
  29. 如請求項27或28所述之系統,其中,該第一一個或多個屬性包括活細胞密度、總細胞密度、活力、滲透壓、乳酸鹽濃度、麩醯胺酸濃度、麩胺酸鹽濃度、銨濃度、鈉濃度和/或鉀濃度。
  30. 如請求項27至29中任一項所述之系統,其中,使用該一個或多個第一性原理模型來預測該第二一個或多個屬性的未來值包括將該第一一個或多個屬性中的第一屬性的預測未來值作為輸入應用於該一個或多個第一性原理模型中的至少一個。
  31. 如請求項30所述之系統,其中,該第一屬性係活細胞密度。
  32. 如請求項27至31中任一項所述之系統,其中,該一個或多個資料驅動模型包括線性回歸模型。
  33. 如請求項27至32中任一項所述之系統,其中,該一個或多個資料驅動模型包括概率回歸模型。
  34. 如請求項33所述之系統,其中,該概率回歸模型係高斯過程回歸模型。
  35. 如請求項27至34中任一項所述之系統,其中,該一個或多個資料驅動模型包括非線性模型。
  36. 如請求項35所述之系統,其中,該非線性模型係前饋神經網路。
  37. 如請求項27至36中任一項所述之系統,其中,預測該等細胞培養物屬性的未來值係基於 (i) 該等細胞培養物屬性的當前值和 (ii) 該等細胞培養物屬性的一個或多個早期值。
  38. 如請求項27至37中任一項所述之系統,其中,使用該一個或多個第一性原理模型來預測該第二一個或多個屬性的未來值包括將一個或多個先前控制值作為輸入應用於該一個或多個第一性原理模型。
TW112107148A 2022-03-01 2023-02-24 用於控制細胞培養之混合預測建模 TW202346567A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202263315358P 2022-03-01 2022-03-01
US63/315,358 2022-03-01

Publications (1)

Publication Number Publication Date
TW202346567A true TW202346567A (zh) 2023-12-01

Family

ID=85724828

Family Applications (1)

Application Number Title Priority Date Filing Date
TW112107148A TW202346567A (zh) 2022-03-01 2023-02-24 用於控制細胞培養之混合預測建模

Country Status (7)

Country Link
US (1) US20230279332A1 (zh)
CN (1) CN118829718A (zh)
AR (1) AR128639A1 (zh)
AU (1) AU2023228806A1 (zh)
IL (1) IL314849A (zh)
TW (1) TW202346567A (zh)
WO (1) WO2023167802A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117481629B (zh) * 2023-12-29 2024-03-26 成都水木医疗科技有限公司 一种多功能胶体渗透压仪及其测定方法和应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10563163B2 (en) * 2014-07-02 2020-02-18 Biogen Ma Inc. Cross-scale modeling of bioreactor cultures using Raman spectroscopy
CN112119306B (zh) * 2017-12-29 2024-09-03 豪夫迈·罗氏有限公司 细胞培养物的代谢状态的预测
MX2021004510A (es) * 2018-10-23 2021-06-08 Amgen Inc Calibracion automatica y mantenimiento automatico de modelos espectroscopicos de raman para predicciones en tiempo real.

Also Published As

Publication number Publication date
US20230279332A1 (en) 2023-09-07
CN118829718A (zh) 2024-10-22
AR128639A1 (es) 2024-05-29
WO2023167802A8 (en) 2024-09-12
WO2023167802A1 (en) 2023-09-07
IL314849A (en) 2024-10-01
AU2023228806A1 (en) 2024-08-22

Similar Documents

Publication Publication Date Title
Mears et al. Mechanistic fermentation models for process design, monitoring, and control
CN112119306B (zh) 细胞培养物的代谢状态的预测
US20230081680A1 (en) Computer-implemented method, computer program product and hybrid system for cell metabolism state observer
Craven et al. Process model comparison and transferability across bioreactor scales and modes of operation for a mammalian cell bioprocess
Gomes et al. Integrating systems analysis and control for implementing process analytical technology in bioprocess development
AU2020330701B2 (en) Method for determining process variables in cell cultivation processes
CN111615674B (zh) 缩放工具
US20230272331A1 (en) Predictive Modeling and Control of Cell Culture
EP3901710B1 (en) Optimisation of processes for the production of chemical, pharmaceutical and/or biotechnological products
TW202346567A (zh) 用於控制細胞培養之混合預測建模
Mahanty Hybrid modeling in bioprocess dynamics: Structural variabilities, implementation strategies, and practical challenges
Shirsat et al. Modelling of mammalian cell cultures
Rashedi et al. Machine learning‐based model predictive controller design for cell culture processes
Zheng et al. Opportunities of Hybrid Model-based Reinforcement Learning for Cell Therapy Manufacturing Process Control
Liu et al. Adaptive control of nonlinear time-varying processes using selective recursive kernel learning method
Whitford Bioprocess intensification: Technologies and goals
Yatipanthalawa et al. Development and validation of a hybrid model for prediction of viable cell density, titer and cumulative glucose consumption in a mammalian cell culture system
Babor et al. Online process state estimation for Hansenula Polymorpha cultivation with 2D fluorescence spectra-based Chemometric model calibrated from a theoretical model in place of offline measurements
Julien et al. Bioreactor monitoring, modeling, and simulation
KR20240158250A (ko) 세포 배양을 제어하기 위한 하이브리드 예측 모델링
Mu'azzam et al. A roadmap for model-based bioprocess development
Monteiro et al. Hybrid dynamic model of monoclonal antibody production using CHO cells
Mears Novel strategies for control of fermentation processes
Zheng Sample-Efficient Reinforcement Learning and Its Applications
Panjwani et al. Predictive modeling for cell culture in commercial manufacturing of biotherapeutics