JP2021521412A - タンパク質の精製条件の決定 - Google Patents

タンパク質の精製条件の決定 Download PDF

Info

Publication number
JP2021521412A
JP2021521412A JP2020544212A JP2020544212A JP2021521412A JP 2021521412 A JP2021521412 A JP 2021521412A JP 2020544212 A JP2020544212 A JP 2020544212A JP 2020544212 A JP2020544212 A JP 2020544212A JP 2021521412 A JP2021521412 A JP 2021521412A
Authority
JP
Japan
Prior art keywords
protein
stationary phase
wells
proteins
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020544212A
Other languages
English (en)
Other versions
JPWO2019165148A5 (ja
JP7332610B2 (ja
Inventor
シェイヴァー,ジェレミー,マーティン
アミムー,タイルリ
ギレスピー,ロン
ケッチェム,ランダル,アール.
ガルシア,フェルナンド
Original Assignee
ジャスト バイオセラピューティクス,インコーポレイテッド
ジャスト バイオセラピューティクス,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジャスト バイオセラピューティクス,インコーポレイテッド, ジャスト バイオセラピューティクス,インコーポレイテッド filed Critical ジャスト バイオセラピューティクス,インコーポレイテッド
Publication of JP2021521412A publication Critical patent/JP2021521412A/ja
Publication of JPWO2019165148A5 publication Critical patent/JPWO2019165148A5/ja
Application granted granted Critical
Publication of JP7332610B2 publication Critical patent/JP7332610B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8693Models, e.g. prediction of retention times, method development and validation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01DSEPARATION
    • B01D15/00Separating processes involving the treatment of liquids with solid sorbents; Apparatus therefor
    • B01D15/08Selective adsorption, e.g. chromatography
    • B01D15/10Selective adsorption, e.g. chromatography characterised by constructional or operational features
    • B01D15/16Selective adsorption, e.g. chromatography characterised by constructional or operational features relating to the conditioning of the fluid carrier
    • B01D15/166Fluid composition conditioning, e.g. gradient
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8658Optimising operation parameters
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • G01N2030/8809Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
    • G01N2030/8813Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials
    • G01N2030/8831Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials involving peptides or proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • G01N2030/889Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 monitoring the quality of the stationary phase; column performance

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physiology (AREA)
  • Molecular Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本発明は、タンパク質の精製条件の決定に関連する技術に関する。いくつかの実施態様では、様々なpHレベル及び塩濃度における様々なクロマトグラフィー技術の収率及び純度を予測するモデルを作成することができる。当該モデルの作成に用いられる訓練データは、pHレベル及び塩濃度の様々な組み合わせで、様々なクロマトグラフィー技術の固定相材料を用いるクロマトグラフィーカラムを実行することで獲得することができる。さらなる実施態様では、当該訓練データは、マルチウェルプレートのウェルのサブセットに含まれる溶液を分析することで獲得することができ、ここで、ウェルのサブセットは、特定の固定相材料の特定の塩濃度及びpH値と関連する。さらに、当該モデルを用いて、費用を最小化しにしつつ、収率及び純度を最大化することにより、様々なタンパク質精製の最適条件を決定することができる。

Description

関連出願とのクロスレファレンス
本出願は、2018年2月21日に出願された発明の名称が「タンパク質の精製条件の決定」である米国仮出願第62/633,584号に対する優先権を主張し、その全体が参照により本明細書に援用される。
タンパク質は、化学結合を介して連結されるアミノ酸の配列から構成される。特定のタンパク質のアミノ酸配列は、当該タンパク質が発現されるデオキシリボ核酸(DNA)中のヌクレオチド配列に基づく。タンパク質の機能及び構造は、当該タンパク質のアミノ酸配列に基づくことができる。タンパク質は、酵素活性又は細胞シグナル伝達の調節等、生物体内で様々な機能を備える。ある種のタンパク質はまた、生物学的状態を治療するために治療的に用いられうる。例えば、抗体等のタンパク質は、ある場合には病原体に結合して、病原体を標的とし、T細胞又はマクロファージ等の生物体内の他の物質によって破壊される。別の例では、タンパク質は、分子に結合し、その分子を生物体内の標的位置に輸送して、生物学的条件の表現型を緩和させることができる。
タンパク質は様々な過程で発現されるが、発現したタンパク質は、当該タンパク質の発現に関与する不純物と共に溶液中に含まれることが多い。発現したタンパク質の精製は、多くの技術を用いて行うことができる。タンパク質の精製プロセスの最適化は、非常に高い収率及び純度を提供する精製条件を同定するには、様々なクロマトグラフィー技術及びその条件を用いる多くの実験系が必要なため、時間がかかり、費用がかかる可能性がある。
タンパク質の精製の最適条件を決定するアーキテクチャのいくつかの実施態様の図である。
マルチウェルプレートから得られたデータを用いてタンパク質精製の最適条件を決定する技術のいくつかの実施例を示す。
様々な精製条件下でタンパク質の純度及び収率を予測するモデルを決定する技術のいくつかの実施例を示す。
タンパク質精製の最適条件を決定するために複数のモデルを利用する技術のいくつかの実施態様を示す。
1又はそれ以上のクロマトグラフィープロセスを用いてタンパク質の精製条件を決定するシステムのいくつかの実施態様を示す。
1又はそれ以上のクロマトグラフィープロセスを用いてタンパク質の精製条件を決定する例示的なプロセスのフロー図である。
多数のpHレベル及び塩濃度に関して、タンパク質の収率及び純度を示す多数のユーザインターフェースを示す。
様々なpHレベル及び塩濃度におけるマルチモードクロマトグラフィーを用いてタンパク質の収率及び純度を決定するのに用いることができる様々なモデルの結果を示す。
本明細書に記載される概念は、タンパク質精製の最適条件の決定に関する。特に、本明細書に記載される技術及びシステムは、タンパク質発現後にタンパク質の精製に利用することができるクロマトグラフィープロセスの条件の決定に関する。いくつかの実施態様では、当該システムは、機械学習技術を利用して、クロマトグラフィープロセスのタイプ及びクロマトグラフィープロセスの条件を決定し、様々なタンパク質の最適な収率及び純度を導くことができる。
カラムクロマトグラフィーは、溶液中の不純物からタンパク質を分離するために様々な原理を利用することができる。カラムクロマトグラフィーは、垂直に配置されたカラムにある量の物質を入れることを含んでよく、ここで、当該物質は、当該カラムを通って流れる分子と相互作用する。異なる分子がカラム内に配置された物質と相互作用すると、当該分子は異なる速度でカラム内を移動する。したがって、ある分子は他の分子よりもカラムを通ってゆっくりと移動する場合があり、カラムを介して移動する分子が分離される。その後、異なる分子がカラムから排出されるときに捕捉されることができる。分子は、サイズ、形状、電荷、疎水性、それらの組み合わせ、又は分子とカラム内に配置された材料との間の相互作用を引き起こし得る他の特徴に基づいて分離することができる。様々な実施態様では、カラムを通って移動する分子と相互作用するカラム内に配置された材料は、固定相材料ということができる。カラムを通過する分子は、固定相を通過する移動相又は溶離液というものに含めることができる。いくつかのクロマトグラフィープロセスは、イオン交換クロマトグラフィー、アフィニティークロマトグラフィー、高圧液体クロマトグラフィー、疎水性相互作用クロマトグラフィー、混合モードクロマトグラフィー、逆相クロマトグラフィー、サイズ排除クロマトグラフィー等を含むことができる。
カラムクロマトグラフィーを用いるタンパク質精製プロセスの費用と有効性は、タンパク質精製に用いられるクロマトグラフィープロセスの種類に依存する。なぜなら、クロマトグラフィー技術によっては、他のクロマトグラフィー技術よりも特定のタンパク質を精製するのに有効である場合があるからである。タンパク質の精製に用いられるクロマトグラフィープロセスのタイプは、タンパク質精製費用に影響を及ぼしうる特定の固定相材料を用いる場合にも対応しうる。いくつかの例では、複数のクロマトグラフィー工程を利用してタンパク質を精製することができるが、タンパク質精製工程で用いられる各クロマトグラフィー工程では、タンパク質が若干量失われる場合がある。
通常、クロマトグラフィープロセスの選択及びタンパク質の精製条件の決定は、ジャーナル論文、研究論文、及び教科書等の当業者に利用可能な知識に基づき、試行錯誤のプロセスは、この知識に基づいて行われ、それによって、特定のタンパク質は、様々な条件下で、1又はそれ以上のクロマトグラフィープロセスを用いて精製される。クロマトグラフィーの技術及び条件が選択される従来のプロセスを用いると、範囲が限定され、非効率的である。すなわち、精製される各タンパク質に対して、固定相材料量及びタンパク質量が、タンパク質精製に用いられうるプロトコルの決定に用いられる。タンパク質を精製するクロマトグラフィープロセスを同定するには、固定相材料量及びタンパク質量が利用されるため、移動相溶液のpH及び塩濃度等の条件の組み合わせの数もまた制限される。特に、タンパク質の最大収率及び純度を提供する条件を決定する、少数とはいえない試行に供されるタンパク質及び固定相材料の費用及び時間は、極めて高くなる場合がある。
本明細書に記載された技術及びシステムは、限定された数のタンパク質について様々な条件下での異なるクロマトグラフィー技術に関するデータを収集し、次いで、多くの他のさらなるタンパク質の精製プロセスを最適化する機械学習を利用することにより、タンパク質精製条件を決定する従来の技術の問題を克服する。いくつかの実施態様では、タンパク質について得られた特定のデータに基づいて、当該タンパク質の最適なクロマトグラフィー条件を予測するモデルを開発することができる。例えば、様々な条件下で多数のクロマトグラフィー技術の収率及び純度を決定するモデルは、タンパク質の配列に基づくことができる。さらに、多数の条件下で多数のクロマトグラフィー技術の収率及び純度を決定するモデルは、タンパク質に関連する二次構造に基づくことができる。他の状況では、特定の条件に関する多くのクロマトグラフィー技術の収率及び純度を決定するモデルは、分析技術を用いて測定されるタンパク質の生物物理的特性の値に基づくことができる。
タンパク質の収率及び純度の決定に開発されたモデルを評価して、特定のクロマトグラフィー技術又はタンパク質に最適な収率及び純度を提供する技術の特定の組み合わせを決定することができる。特定のクロマトグラフィー技術又はタンパク質の最適な収率及び純度を提供するクロマトグラフィー技術の組み合わせを決定する場合、クロマトグラフィー技術を実施する費用を評価することもできる。クロマトグラフィー技術の費用は、固定相材料の費用、移動相の費用、用いられるカラムのサイズ、固定相材料の作用の困難性の程度、個々のクロマトグラフィー工程の収率、いくつかのクロマトグラフィー工程の複合収率、又はそれらの組み合わせに基づくことができる。
さらに、本明細書に記載の技術及びシステムは、タンパク質の収率及び純度の予測に用いられるモデルの生成に必要なデータ量を最小限にすることができる。様々な実施態様では、カラムで用いられるクロマトグラフィー条件は、マルチウェルプレートを用いてシミュレートすることができるクロマトグラフィー条件の最小数の組み合わせから決定することができる。クロマトグラフィー条件の最小の組み合わせ数は、様々な固定相材料の様々なクロマトグラフィー条件下で、参照データとマルチウェルプレートのウェルのサブセットとの間の差を最小化することで同定することができる。特に、ある種のタンパク質用の固定相材料のクロマトグラフィー条件のサブセットを、より広い範囲のタンパク質にわたって利用して、特定の固定相材料のタンパク質収率及び純度を予測するモデルを生成するための収率及び純度データを提供することができる。
本明細書に記載された技術及びシステムを利用すると、タンパク質精製の最適条件は、多数の異なる条件下で評価される各タンパク質のクロマトグラフィープロセスを実際に実行しなくても、多数のタンパク質について決定することができる。従って、タンパク質精製の最適条件を決定する費用は軽減され、効率は高まる。さらに、タンパク質の精製の収率及び純度を最大化する最適条件を決定するモデルを生成するために得られるデータ量が最小化されると、処理資源及びメモリ資源等の計算資源の量が最小化される。
図1は、タンパク質精製の最適条件を決定するアーキテクチャ100のいくつかの実施態様の図である。アーキテクチャ100は、訓練データ104を生成するため、代表的なタンパク質102等の多数のタンパク質を評価することができる。訓練データ104は、モデル生成システム106に提供され、様々なクロマトグラフィー技術のための多数の固定相材料の性能の測定値を予測する多数のモデルを生成することができる。性能の測定値は、個々の固定相材料に対する収率又は純度の少なくとも1つを含むことができる。いくつかの実施態様では、タンパク質102は抗体を含むことができる。例示的な実施例では、タンパク質102は、IgG抗体を含むことができる。
訓練データ104は、タンパク質102のアミノ酸配列の少なくとも部分を示す配列データ108を含むことができる。配列データ108は、タンパク質102の配列の個々の位置におけるアミノ酸を示すことができる。様々な実施態様では、配列データ108は、質量分析によって決定することができる。質量分析を用いてタンパク質配列を決定する特定の技術は、Hunt, D F et al. “Protein Sequencing by Tandem Mass Spectrometry.” Proceedings of the National Academy of Sciences of the United States of America 83.17 (1986): 6233−6237に見出すことができる。さらに、配列データ108は、Berg JM, Tymoczko JL, Stryer L. Biochemistry. 5th edition. New York: W H Freeman; 2002. Section 4.2, Amino Acid Sequences Can Be Determined by Automated Edman Degradation: https://www.ncbi.nlm.nih.gov/books/NBK22571/)に記載されるように、Edman分解を用いて決定することができる。さらに、配列データ108は、Smith, A. (2008) Nucleic acids to amino acids: DNA specifies protein. Nature Education 1(1):126に記載されているように、デオキシリボ核酸(DNA)配列又はタンパク質102に結合したリボ核酸(RNA)配列等のタンパク質102に結合したヌクレオチド配列から決定することができる。
訓練データ104はまた、タンパク質102の構造的特徴を示す構造データ110を含むことができる。構造データ110は、タンパク質102の二次的特徴、タンパク質102の三次的特徴、又はその両方を示すことができる。構造データ110は、ターン及び/又はループ等のタンパク質102の三次構造の特徴を示すことができる。特定の実施態様では、構造データ110は、αヘリックス、βターン、βシート、Ωループ、又はそれらの組み合わせを示すことができる。構造データ110はまた、タンパク質102の疎水性領域、タンパク質102の極性領域、特定の電荷を有するタンパク質102の領域、又はそれらの組み合わせを示すことができる。構造データ110は、タンパク質102の一種の二次構造又は一種の三次構造に関連する多数の位置を示すことができる。タンパク質102の二次構造は、レーザーラマン分光法によるタンパク質の二次構造の決定;J. L. Lippert, D. Tyminski, and P. J. Desmeules; Journal of the American Chemical Society 1976 98 (22), 7075-7080 DOI: 10.1021/ja00438a057における記載を含む多くの方法によって決定することができる。
訓練データ104はまた、1又はそれ以上の精製システム112によってタンパク質102を分析して得られたデータを含み、精製データ114を生成することができる。1又は複数の精製システム112は、1又は複数のクロマトグラフィー技術を含むことができる。特に実施形態では、タンパク質102は、様々なpHレベル及び塩濃度等の様々な条件下で、少なくとも1つのクロマトグラフィー技術を用いて発現された後、精製され得る。精製データ114はまた、タンパク質102に関して1又はそれ以上の精製システム112を利用して得られた収率及び純度のデータを含むことができる。1又はそれ以上の精製システム112は、イオン交換クロマトグラフィー、アフィニティークロマトグラフィー、疎水性相互作用クロマトグラフィー、マルチモードクロマトグラフィー、逆相クロマトグラフィー、サイズ排除クロマトグラフィー、又はそれらの組み合わせ等のクロマトグラフィープロセスを含むことができる。他の実施形態でも、他のクロマトグラフィー技術が用いられうる。いくつかの実施態様では、精製データ114は、様々な固定相材料に関してマルチウェルプレートから得られた純度及び収率値を分析することによって決定することができる。精製システム112に関して分析された固定相材料は、樹脂等のポリマー材料を含むことができる。特に実施態様では、精製システム112に関して分析された固定相材料は、シリカ含有材料を含むことができる。いくつかの例示的な例では、精製システム112に関して用いられる固定相材料は、シリカ、架橋アガロース、メタクリレート、親水性ポリビニルエーテル、セルロース、ヒドロゲル、ポリメタクリレート、ヒドロキシアパタイト、又はそれらの組み合わせを含むことができる。
訓練データ104はまた、タンパク質102を分析試験116により測定された属性118の生成により得られたデータを含むことができる。分析試験は、タンパク質102に関するデータを生成する多数のアッセイを含むことができる。測定された属性118は、サイズ排除クロマトグラフィーを用いて測定することができるタンパク質102の分子量を含むことができる。また、測定された属性118は、UV−Vis分光光度計を用いて測定された濁度を含んでもよい。さらに、測定された属性118は、示差走査蛍光測定によって決定されるタンパク質102の安定性の測定値を含むことができる。タンパク質102の安定性は、ケミカル・アンフォールディング・アッセイ又は粘度アッセイを用いて測定することもできる。さらに、測定された属性118は、自己相互作用ナノ粒子分光法(SINS)によって測定されたタンパク質102の領域間の相互作用の測定値を含むことができる。
訓練データ104は、様々なタンパク質精製技術の性能測定値を予測するモデルを決定することができるモデル生成システム106に提供することができる。モデル生成システム106によって生成される個々のモデルは、各固定相材料に関連付けることができる。例えば、第1モデル120は、第1固定相材料の収率及び/又は純度を予測することができる。さらに、第2モデル122は、第2固定相材料の収率及び/又は純度を予測することができる。モデル生成システム106は、N番目の固定相材料の収率及び/又は純度を予測できるN番目のモデル124まで生成することができる。いくつかの実施態様では、第1固定相材料を第1クロマトグラフィー技術に関連付けることができ、第2固定相材料を第1クロマトグラフィー技術とは異なる第2クロマトグラフィー技術に関連付けることができる。他の実施態様では、第1固定相材料は、第2固定相材料とは異なるが、同じクロマトグラフィー技術と関連付けることができる。例示的な実施例では、第1モデル120は、アニオン交換クロマトグラフィー技術に関連する固定相材料に関して製造することができ、第2モデル122は、疎水性相互作用クロマトグラフィー技術に関連する固定相材料に関して製造することができ、第N番目のモデル124は、混合モードクロマトグラフィー技術に関連する固定相材料に関して製造することができる。
126において、モデル生成システム106は、訓練データ104を分析して、代表的なタンパク質102を含むタンパク質群の特徴間の関係を同定することができる。いくつかの実施態様では、モデル生成システム106は、タンパク質の配列と測定された属性のうちの1又はそれ以上との間の関係を決定することができる。様々な実施態様では、モデル生成システム106は、1又はそれ以上の精製システム112の収率及び/又は純度と、配列データ108、構造データ110、及び/又はタンパク質102を含むタンパク質群について測定された属性118との間の関係を決定することができる。例えば、モデル生成システム106は、特定の配列が所定の位置にあるタンパク質が、特定の範囲内の濁度値でありうることを決定することができる。他の例では、モデル生成システム106は、ある範囲の分子量であるタンパク質が、陰イオン交換クロマトグラフィー技術を用いて精製したときに達成された収率との関係で、MMCを用いて精製した場合に相対的に高い収率と相関するように決定することができる。モデル生成システム106はまた、pHレベル及び/又は塩濃度等の精製条件と、訓練データ104の生成に用いられるタンパク質の配列、訓練データ104の生成に用いられるタンパク質の構造、訓練データ104の生成に用いられるタンパク質の測定された特性、又はそれらの組み合わせとの間の関係を決定することができる。さらに、モデル生成システム106は、精製条件と、1又はそれ以上の精製システム112で用いられる固定相材料のタイプとの間の関係を決定することができる。
128において、モデル生成システム106は、多数のモデルを生成して、1又は複数の精製システム112の収率及び/又は純度等の性能の測定値を予測することができる。特に、モデル生成システム106によって生成されたモデル、例えばモデル120、122、124は、訓練データ104の生成に用いられるタンパク質とは異なるタンパク質の性能の測定値を予測することができる。すなわち、モデル120、122、124は、訓練データ104の生成に用いられるタンパク質とは異なる配列があるタンパク質の性能の測定値を予測することができる。モデル生成システム106によって生成されたモデルは、配列データ108、構造データ110、精製条件、又は測定された属性118のうちの1又はそれ以上に関連する変数を含むことができる。また、当該モデルは、互いに対する変数の相対的な重みを示す変数の係数を含むことができる。当該モデルに含まれる変数及び係数は、演算126で決定される訓練データの様々な特徴の間の関係に基づくことができる。例示的な実施例では、モデル120、122、124は多項式モデルを含むことができる。
モデル生成システム106は、モデル120、122、124を決定する反復処理を実行することができる。例えば、モデル生成システム106は、特定の固定相材料の多項式関数を決定し、訓練データ104に対して多項式関数を試験することができる。多項式関数が訓練データ104と一致する性能の測定値を生成しない場合、モデル生成システム106は、初期多項式関数の変数及び/又は係数を修正してさらなる多項式関数を生成することができる。次いで、モデル生成システム106は、訓練データ104に関してさらなる多項式関数を評価することができる。モデル生成システム106は、モデルによって生成された結果が閾値量内の訓練データ104に対応するまで、各固定相材料についてモデルの多数の反復を評価することができる。すなわち、モデル生成システム106は、固定相材料のモデルを評価して、予測される結果と実際の結果との間の誤差を最小にすることができる。例示的な例では、モデル生成システム106は、局所的な最小値が達成されるまで、個々の固定相材料のモデルを反復的に試験することができる。さらなる例示的な例では、モデル生成システム106は、広域で最小値が達成されるまで、個々の固定相材料のためのモデルを反復的に試験することができる。さらに、モデル生成システム106は、所定数の訓練サイクルが完了するまで、個々の固定相材料のモデルを反復的に試験することができる。個々の固定相材料の精度が閾値精度よりも小さい状況では、さらなる固定サイクルを実行することができ、いくつかの状況では、モデルのパラメータをさらなる訓練サイクルの間に調整することができる。特定の実施形態では、個々の固定相材料に対するモデルの精度が閾値精度未満であるシナリオにおいて、モデルのハイパーパラメータは、さらなる訓練サイクルの間に調整され得る。
モデル生成システム106によって生成されたモデルは、精製条件最適化システム130に提供され得る。図1の例示的な例では、精製条件最適化システム130は、モデル120、122、124、又はそれらの組み合わせを利用して、訓練データ104の生成に用いられるタンパク質とは異なるタンパク質の精製条件を最適化することができる。例示的な実施例では、精製条件最適化システム130は、さらなるタンパク質132の精製の最適条件を決定することができる。精製条件最適化システム130は、さらなるタンパク質132に対応するさらなるタンパク質データ134を得ることができる。さらなるタンパク質データ134は、さらなるタンパク質132の配列、さらなるタンパク質132の1又はそれ以上の構造、さらなるタンパク質132の測定された属性、又はそれらの組み合わせを含むことができる。いくつかの実施態様では、さらなるタンパク質132は、タンパク質102に関していくつかの類似性があってよい。例えば、タンパク質102及びさらなるタンパク質132がともに抗体であり得る。別の例では、タンパク質102及びさらなるタンパク質132はともに、IgG抗体であり得る。他の例では、さらなるタンパク質132の分子量は、タンパク質102の分子量の少なくとも約2%、タンパク質102の分子量の少なくとも約5%、タンパク質102の少なくとも約10%、タンパク質102の分子量の少なくとも約15%、タンパク質102の分子量の少なくとも約20%、又はタンパク質102の分子量の少なくとも約25%の範囲内であり得る。
136では、精製条件システム130は、モデル生成システム106によって生成されたモデルのうちの1又はそれ以上に関して、さらなるタンパク質データ134を評価することができる。特に実施態様では、精製条件最適化システム130は、さらなるタンパク質データ134に基づいて、多くの固定相材料に関して、さらなるタンパク質132の収率及び純度値を決定することができる。例えば、精製条件最適化システム130は、第1モデル120、第2モデル122、及びN番目のモデル124に関するさらなるタンパク質データ134を評価し、モデル120、122、124に関連する各々の固定相材料に対するさらなるタンパク質132の収率及び純度値を決定することができる。
138では、精製条件最適化システム130は、1又はそれ以上のモデルを決定して、さらなるタンパク質132の精製を最適化することができる。特に実施態様では、精製条件最適化システム130は、さらなるタンパク質132のための精製条件140を生成することができる。精製条件140は、さらなるタンパク質132を精製する1又はそれ以上のクロマトグラフィー技術を示すことができる。精製条件140はまた、1又はそれ以上のpH値及び1又はそれ以上の塩濃度を示すことで、精製条件最適化システム130によって同定されたクロマトグラフィー技術を実施することができる。
精製条件最適化システム130は、さらなるタンパク質132について得られた収率及び純度の値を、モデル生成システム106によって生成された1又はそれ以上のモデルによって比較して、収率及び純度の値を最大化するモデルを決定することができる。いくつかの実施態様では、精製条件最適化システム130は、さらなるタンパク質132の純度及び収率の値を最大化するモデルの組み合わせを決定することができる。例示的な実施例では、精製条件最適化システム130は、第1モデル120に関連する固定相材料が、さらなるタンパク質の収率及び純度の値を最大化できることを決定することができる。別の例示的な実施例では、精製条件最適化システム130は、第1モデル120に関連する第1固定相材料を用いてさらなるタンパク質132を精製し、続いて第2モデル122に関連する第2固定相材料でさらなるタンパク質132を精製することによって、さらなるタンパク質132の収率及び純度の値を最大化するように決定することができる。さらに、精製条件及び最適化システム130は、精製条件140を、少なくとも部分的に、多くの固定相材料の費用に基づいて決定することができる。例示のため、精製条件最適化システム130は、モデル生成システム106によって生成されるモデル、例えばモデル120、モデル122、モデル124によって生成されるモデルに関連する固定相材料の収率値、純度値、及び費用の少なくとも部分に基づいて、精製条件140を決定することができる。
図2は、マルチウェルプレート202から得られたデータを用いてタンパク質精製の最適条件を決定する技術のいくつかの実施例を示す。図2の例示的な例では、代表的なウェル204等のマルチウェルプレート202のウェルは、四分円に分割することができる。例えば、マルチウェルプレート202は、第1四分円206、第2四分円208、第3四分円210、及び第4四分円212を含むことができる。図2の例示的な例では、各四分円は、異なる固定相材料と関連付けることができる。他の実施態様では、マルチウェルプレート202は、2つの部分、3つの部分、又は6つの部分等の異なる数の部分に分割して、異なる数の固定相材料を収容することができる。さらに、マルチウェルプレート202の各四分円は、4つの異なる塩濃度及び6つの異なるpHレベルに対応する4×6マトリクスを含むが、マルチウェルプレート202の各部分に関連するマトリクスは異なってよい。例示のため、マルチウェルプレート202の4×6マトリクスは、4つの異なるpHレベル及び6つの異なる塩濃度に対応し得る。さらなる例では、マルチウェルプレートは、8つのpHレベル及び4つの塩濃度又は8つの塩濃度及び4つのpHレベルに対応する8×4マトリクスを各々備える3つの部分に分割され得る。さらに、図2の例示的な例は、96穴であるマルチウェルプレート202を含むが、他の実施形態は、マルチウェルプレートのウェルは異なる数であってよい。
マルチウェルプレート202は、タンパク質214のセットに関する純度及び収率データを提供するため、多くの固定相材料を利用することができる。例示のため、マルチウェルプレート202の個々のウェルは、タンパク質214のセットから選択されたタンパク質の量及び固定相材料の量を含む溶液を含むことができる。マルチウェルプレートの個々のウェルに含まれる溶液もまた、pH値及び塩濃度を有することができる。pH値は、溶液中に含まれる酸の量又は溶液中に含まれる塩基の量に基づいてもよい。塩濃度は、溶液中に含まれる塩の量、例えば溶液中に含まれるNaClの量に基づいてもよい。弱酸塩(例えば、CHCOONa)又は弱塩基塩(例えば、NHCl)等の他の塩も溶液中で利用することができる。特に実施態様では、マルチウェルプレートのウェルに含まれる溶液のpH値は、約2.5〜約8.5、約3〜約8、約3〜約5、又は約5〜約8であり得る。さらに、マルチウェルプレート202の個々のウェルに含まれる溶液の塩濃度は、約0ミリモル(mM)〜約750mM、約20mM〜約650mM、約25mM〜約400mM、約30mM〜約200mM、又は約5mM〜約100mMであり得る。
マルチウェルプレートの個々のウェルの固定相材料、pH値、及び塩濃度に関する収率及び/又は純度の決定は、一定期間後の個々のウェルの溶液の分析に少なくとも部分的に基づくことができる。特に実施態様では、溶液のコロイド安定性は、溶液の光散乱特性、例えば濁度に基づいて決定することができ、溶液の化学的安定性は、化学的展開アッセイを用いて決定することができる。Guillermo Senisterra, Irene Chau, and Masoud Vedadi. ASSAY and Drug Development Technologies. Volume 10, Issue 2, Apr 2012を参照されたい。溶液の熱安定性は、例えば示差走査蛍光測定を介して決定することもできる。純度はサイズ排除クロマトグラフィーを用いて測定することができる。タンパク質のセット214のタンパク質の、マルチウェルプレート202の個々のウェルに含まれる固定相材料への結合もまた、個々のウェルの条件下で、タンパク質のセット212の個々のタンパク質の収率及び/又は純度値の決定に利用することができる。時として、個々のウェルに含まれる溶液を、特定のクロマトグラフィープロセスを通して流すことができる。さらに、個々のウェルの溶液中のタンパク質の量を、溶液が最初に個々のウェルに添加されたときの溶液中のタンパク質の初期量と比較して、マルチウェルプレート202の個々のウェルに含まれる固定相材料に結合したタンパク質の量を測定することができる。タンパク質のセット214に含まれる個々のタンパク質の特定の特性の値は、ある期間個々のウェル内に存在した後に分析することで、溶液における個々のタンパク質の安定性、個々のタンパク質の収率、及び/又は個々のタンパク質の純度を決定することもできる。例示として、タンパク質214のセットが抗体を含む場合、高分子量(HMW)成分を分析して、様々なpH値及び塩濃度における個々のタンパク質の安定性を決定することができる。
特定の実施態様では、マルチウェルプレート202の各四分円206、208、210、212は、タンパク質214のセットに含まれる1又はそれ以上のタンパク質の様々な実験条件を表すことができる。例えば、特定の四分円206、208、210、212に含まれる個々のウェルは、特定の固定相材料の塩濃度及びpH値の異なる組み合わせを表すことができる。他の状況では、複数の固定相材料を、様々なpH値及び特定の四分円206、208、210、212中の塩濃度で評価することができる。
本明細書に記載される実施態様では、1又はそれ以上の四分円206、208、210、212の用のウェルのサブセットは、四分円の凝集ウェル用のタンパク質の収率、純度、及び/又は安定性を表すと決定することができる。例示のため、図2に関して説明した技術は、第3四分円210の24のウェルに関連する条件から得られるデータを表す第3四分円210の5つのウェル又は6つのウェルを同定することができる。個々のタンパク質の収率、純度、及び/又は安定性を予測するのに利用できるデータを決定するために分析されるウェルの数を減らすことで、タンパク質量及び用いられる固定相材料量を最小限に抑えられる。図2の例示的な例では、第1ウェルセット216からN番目のウェルセット218までを分析して、最小数のウェルを同定することにより、タンパク質セット214の個々のタンパク質の収率、純度、及び/又は安定性データを決定することができる。第1ウェルセット216からN番目のウェルセット218までに含まれる個々のウェルは、図2の例示的な実施例では灰色で示され得る。
220では、ウェル216の第1セットを分析して、第1データセット222を生成することができる。ウェル216の第1組の分析は、第1データ組222を生成するウェル216の第1組の個々のウェルに関連するpH及び塩濃度値の下で、ウェル216の第1組の個々のウェルに含まれるタンパク質の収率及び/又は純度を決定することを含んでよい。ウェルの第1セット216の分析はまた、第1データセット222を生成するために、高分子量成分等の期間、各ウェルに残った後、ウェルの第1セットの個々のウェルに含まれるタンパク質の特定の特徴を決定することを含むことができる。さらに、第1データセット222を生成するために、溶液の濁度等、第1ウェルセット216の個々のウェルに含まれる溶液の特性を分析することができる。
N番目のウェルセットが224で分析され、N番目のデータセット226が生成されるまで、条件の異なる組み合わせを含む多くのさらなるウェルセットを分析することができる。場合によっては、各ラウンドの分析に対して分析されるウェルの組み合わせは、同数のウェルを含むことができるが、条件の異なる組み合わせである。特に実施態様では、第3四分円210のウェルは、ランダム又は疑似ランダムアルゴリズムにより選択して評価することができる。例示的な実施例では、モンテカルロ・アルゴリズムを利用して、個々のウェルの組み合わせを決定して、各ラウンドの分析について評価することができる。
ウェルの各組合せについて作成された個々のデータセットは、参照データセット230に関して228で分析することができる。参照データセット230は、第1ウェル216から第N番目のウェル218までの第1セットに含まれるウェルの数よりも、ウェルの第3四分円の多数のウェルから、ウェルの第N番目のセット218を介して生成することができる。例えば、参照データセット230は、第3四分円210のウェルの少なくとも約75%、第3四分円210のウェルの少なくとも約80%、第3四分円210のウェルの少なくとも約85%、第3四分円210のウェルの少なくとも約90%、又は第3四分円210のウェルの少なくとも約95%から生成することができる。様々な実施態様では、参照データセット230は、第1セットのウェル216から第n番目のセットのウェル218までの各々に含まれるウェルの少なくとも部分を含む、第3の象限に含まれるウェルのセットから導出され得る。参照データ230は、第1データセット222から第N番目のデータセット226までに含まれるデータに対応するデータを含むことができる。例示のため、参照データセット230は、第3四分円210に含まれる多数のウェルの収率及び/又は純度値、第3四分円210のウェルに含まれる溶液に関するデータ、及び第3四分円210のウェルに含まれるタンパク質の特性を示すデータを含むことができる。
特定の実施態様では、第1データセット222の少なくとも部分を参照データセット230の少なくとも部分と比較することができ、第1データセット222の少なくとも部分と参照データセット230の少なくとも部分との間の誤差量を決定することができる。次いで、ウェルの別の群を選択することができ、ウェルの第2群から導出されたデータの少なくとも部分を参照データセット230の少なくとも部分と比較することができ、ウェルの第2群から導出されたデータと参照データ230との間の誤差の量を決定することができる。多数のさらなるウェル群を分析することができ、さらなるウェル群から得られたデータを参照データ230と比較することができる。各連続するウェル群は、最小の誤差が達成されるまで、新たに選択されたウェル群と参照データとの間の誤差を減少させるような方法で分析される。ウェルの組み合わせから生成されるデータと参照データとの間の最小誤差に関連するウェルの組み合わせは、最適化されたウェル配置232によって表される。
最適化されたウェル配置232を利用して、最適化されたウェル配置232の生成に用いられるタンパク質214のセットとは異なるさらなるタンパク質のデータを生成することができる。図2の例示的な例では、さらなるタンパク質234を、最適化されたウェル配置232のウェルに対応する条件に関連するウェル内に配置することができる。特に、さらなるタンパク質234の量を、pH値、塩濃度、及び最適化されたウェル配置232の条件に対応する固定相材料の量で、マルチウェルプレートのウェル内に配置することができる。236において、さらなるタンパク質は、さらなるタンパク質データセット238を生成するために、最適化されたウェル配置232の条件に関して分析され得る。さらなるタンパク質データセット238は、さらなるタンパク質234に関して最適化されたウェル配置232のウェルの収率及び/又は純度値を含むことができる。さらなるタンパク質データセット238はまた、さらなるタンパク質234の最適化されたウェル配置の個々のウェルに含まれる溶液の特性を示すデータを含むことができる。
図3は、様々な精製条件下でタンパク質の純度及び収率を予測するモデルを決定する技術のいくつかの実施例を示す。特に、第1タンパク質302は、第1特徴付けデータ304と関連付けることができる。第1特徴付けデータ304は、第1タンパク質302の配列、第1タンパク質302の1又はそれ以上の二次構造、第1タンパク質302の1又はそれ以上の三次構造、又はそれらの組み合わせを含むことができる。第1特徴付けデータ304はまた、第1タンパク質302の生物物理的特性値を含むことができる。モデル生成システム106は、第1特徴付けデータ304を得ることができ、第1特徴付けデータ304を利用して、様々なタンパク質の収率及び純度を予測するモデルを生成することができる。モデル生成システム106はまた、収率および純度を予測するために利用されるモデルを生成するために、第N番目のタンパク質306までの他のタンパク質に関するデータを取得することができる。図3の例示的な例では、モデル生成システム106はまた、第N番目のタンパク質306に関する配列データ、第N番目のタンパク質の1つ以上の二次構造に関するデータ、第N番目のタンパク質306の1つ以上の三次構造に関するデータ、第N番目のタンパク質306に関する生物物理的特性データ、またはそれらの組み合わせを含む第N番目の特徴付けデータ308を取得することができる。
タンパク質の特徴付けデータに加えて、モデル生成システム106は、第1タンパク質302から第N番目のタンパク質306までの収率及び純度データを利用して、さらなるタンパク質の収率及び純度値を決定するモデルを生成することができる。例えば、精製条件310は、第1タンパク質302から第N番目のタンパク質306までのクロマトグラフィーカラム312に適用することができる。このようにして、第1タンパク質302から第N番目のタンパク質306までの第1純度及び収率値314を、pHレベル及び塩濃度の様々な組み合わせにおける複数の固定相材料に関して収集することができる。
モデル生成システム106は、第1特徴付けデータ304から第N番目の特徴付けデータ306まで、第1収率及び純度値314から第N番目の収率及び純度値316までを分析して、特徴付けデータ304...306に含まれる異なる変数と収率及び純度値314...316との間の関係を決定することができる。例えば、モデル生成システム106は、特定の固定相材料、ある範囲のpH値、及びある範囲の塩濃度等の特定の精製条件下で特定の配列特徴があるタンパク質の収率と純度値との間の関係を同定することができる。モデル生成システム106はまた、特定の精製条件下で1又はそれ以上の特定の生物物理的特性値があるタンパク質の収率と純度値との間の関係を同定することができる。さらに、モデル生成システム106は、特定の精製条件下で様々な位置に特定の二次構造を備えるタンパク質の収率と純度値との間の関係を同定することができる。
モデル生成システム106は、第1変数及び第1重み320がある第1モデル318から、第N番目変数及び第N番目重み324がある第N番目モデル322までの個々のモデルを生成することができる。第1モデル318からN番目のモデル322までの個々のモデルは、カラム312等のクロマトグラフィーカラム中のタンパク質の精製に利用することができる個々の固定相材料に対応し得る。例えば、第1モデル318は、アニオン交換クロマトグラフィーに用いられる固定相材料の収率及び純度値を予測することができる。別の例では、第N番目のモデル322は、マルチモードクロマトグラフィーで用いられる固定相材料の収率及び純度値を予測することができる。第1モデル318から第N番目のモデル322までの変数は、タンパク質の特徴付けデータの特徴に対応し得る。さらに、第1モデル318の変数は、様々なpHレベル及び塩濃度に対応し得る。例示のために、第1モデル318は、特定の固定相材料に関するタンパク質配列及び様々な二次構造の存在に関連する変数を含むことができる。第1モデル318はまた、特定の固定相材料に関するpHレベル及び塩濃度に関連する変数を含むことができる。第1モデル318から第N番目モデル322までに関連する重みは、変数が収率及び純度値に及ぼす影響の量を示すことができる。
例示的な実施態様では、さらなるタンパク質の特徴付けデータは、モデル生成システム106によって生成されたモデルのうちの1又はそれ以上に関して評価され得る。特定の例では、モデル生成システム106によって生成されたモデルは、固定相材料に関連付けることができ、タンパク質配列、多数のβシート、示差走査蛍光測定値、pHレベル、及び塩濃度に含まれる多数の疎水性アミノ酸に関連する変数がある。この例に続いて、さらなるタンパク質の配列に含まれる多数の疎水性アミノ酸、さらなるタンパク質に含まれる多数のβシート、及びさらなるタンパク質の示差走査蛍光測定値を示すさらなるタンパク質の特徴付けデータを、pHレベル及び塩濃度の範囲に関連して評価し、モデル生成システム106によって生成された1又はそれ以上のモデルにより、異なる固定相材料の収率及び純度値を予測することができる。
様々な実施態様では、モデル生成システム106は、主成分分析技術(PCA)を用いてモデルを生成することができる。例えば、モデル生成システム106は、単に1つのPCA変数又は2つのPCA変数として、第1収率及び純度値314から第N番目の収率及び純度値316までの収率及び純度値を特徴付けることができる。モデル生成システム106はまた、変数の各々の重みを決定することができる。このように、第1モデル318に含まれる第1変数及び第1重み320、ならびに第Nモデル322に含まれる第N変数及び第N重み324は、1又はそれ以上のPCA変数及びそれらの各々の重みを含むことができる。モデルに含める変数及び重みを決定するPCA技術を実施態様することによって、モデル生成システム106は、モデルを使用して収率及び/又は純度を予測するために利用されるプロセッササイクル等の計算能力を低下させてよい。
特定の実施形態では、モデル生成システム106は、分子の特徴付けデータ及び分子の精製に用いられるクロマトグラフィー技術に基づき、一連の特徴を有する分子群を用いて実施可能なモデルを生成することができる。例えば、特定の位置に変異体がある特定の配列がある分子、特定の範囲の生物物理的特性を備える分子、及び/又は特定の範囲の生物物理的特性を有する分子である。特定の実施形態では、モデル生成システム106は、分子群に含まれる分子のサブセットについて別々のモデルを生成することができる。例示的な実施例では、モデル生成システム106は、サイズ排除クロマトグラフィーを用いて精製される特定の特性セットを有するタンパク質群について単一モデルを生成することができる。別の例示的な実施例では、モデル生成システム106は、疎水性相互作用クロマトグラフィーを用いて精製される同じタンパク質群について複数のモデルを生成することができる。具体的には、モデル生成システム106は、クロマトグラフィーに含まれる固定相材料に関して比較的保持量が高い分子群に含まれる分子の収率及び/又は純度を予測する第1モデルを生成し、クロマトグラフィーカラムに含まれる固定相材料に関して保持量が比較的低い群に含まれる分子の収率及び/又は純度を予測する第2モデルを生成することができる。モデル生成システム106は、保持量の閾値量を利用して、保持量が比較的低い第2群に含まれる分子に対して保持量が比較的高い第1群に含まれる分子を決定することができる。いくつかの特定の例示的な実施例では、固定相材料に関する分子の保持は、保持係数kにより測定することができる。固定相材料に関する分子の保持は、所定の体積の移動相物質に対する保持時間等の時間係数及び/又は体積係数によっても測定することができる。
図4は、タンパク質精製の最適条件を決定する複数のモデルを利用する技術のいくつかの実施態様を示す。モデルは、図1及び図3のモデル生成システム106によって生成することができ、精製条件最適化システム130により利用して、様々なタンパク質精製の最適条件を決定することができる。図4の例示的な例では、タンパク質402の最適精製条件は、精製条件最適化システム130によって決定され得る。例示のため、タンパク質402に関連するタンパク質特徴付け404の少なくとも部分を精製条件最適化システム130に提供することができる。精製条件最適化システム130によって得られたタンパク質特徴付け404の部分は、様々なモデル406に含まれる変数に関連するデータに対応し得る。例えば、1又はそれ以上のモデル406が、タンパク質配列に含まれる前記多数の極性アミノ酸に関連する変数を含む場合、タンパク質特徴付けデータ404は、タンパク質402の配列に含まれる極性アミノ酸の数を含むことができる。いくつかの例示的な例では、化学的な非折り畳みは、純度及び/又は収率値を予測する特徴付け404に含まれる因子であり得る。他の例示的な例では、疎水性領域は、純度及び/又は収率値の予測因子であり得る。さらに他の例示的な例では、化学的展開及び疎水性はともに、純度及び/又は収率値を予測することができる。
第1モデル408等のN番目のモデル410までのモデル406に関するタンパク質特徴付けデータ404の少なくとも部分を分析することにより、精製条件最適化システム130は、様々なpHレベル及び塩濃度に関してタンパク質402の収率及び純度の値を生成することができる。特定の例では、タンパク質の特徴付けデータ404は、pHレベル及び塩濃度の個々の組み合わせに関する各々の収率及びタンパク質値を決定するため、モデル406に関して評価され得る。例示のため、精製条件最適化システム130は、第1モデル408に関して第1収率、純度、pH、及び塩濃度値412を、第Nモデル410に関して第N収率、純度、pH、及び塩濃度値414まで生成することができる。例示的な実施例では、精製条件最適化システム130は、pH5.5、塩濃度300mMにて、第1モデル408に関して、タンパク質402の収率90%及び純度85%を決定することができる。
モデル結果解析システム416は、モデル406によって得られた結果を得て、タンパク質精製の最適条件を決定することができる。場合によっては、タンパク質精製の最適条件は、特定のpHレベル及び特定の塩濃度の単一の固定相材料を含むことができる。他の場合では、タンパク質精製の最適条件は、1又はそれ以上のpHレベル及び1又はそれ以上の塩濃度における固定相材料の組み合わせを含むことができる。特定のシナリオでは、タンパク質402の精製の最適条件は、第1pHレベルで第1固定相材料及び第1塩濃度を備えるクロマトグラフィー技術を用いた後、第2pHレベルで第2固定相材料及び第2塩濃度を備えるさらなるクロマトグラフィー技術を用いて、タンパク質402を精製することを含み得る。モデル結果解析システム416はまた、様々な固定相材料の費用データを利用して、タンパク質精製の最適条件を決定することができる。様々な実施態様では、モデル結果解析システム416は、クロマトグラフィーカラムのサイズに関するデータ及び/又はクロマトグラフィーカラムのスループットデータを利用して、タンパク質精製の最適条件を決定することができる。
モデル結果解析システム416は、異なる固定相材料のpHレベル及び塩濃度のいくつかの組み合わせに関する収率及び純度データを示す1又はそれ以上のユーザインターフェースを生成することができる。例えば、モデル結果解析システム416は、x軸上の収率値及びy軸上の純度値を備える第1ユーザインターフェース416を生成することができる。第1ユーザインターフェース416に含まれる、純度対各収率は、特定のpHレベル及び塩濃度で特定の固定相材料と関連付けることができる。さらに、モデル結果解析システム416は、x軸上にpH値を、y軸上に塩濃度値を備える第2ユーザインターフェース420を生成することができる。第2ユーザインターフェース420に含まれる各pH及び塩濃度対は、特定の収率及び純度値と関連付けることができる。
図5は、1又はそれ以上のクロマトグラフィープロセスを用いてタンパク質の精製条件を決定するシステムのいくつかの実施例を示す。システム500は、1又はそれ以上の計算装置504によって実施できるタンパク質精製条件システム502を含む。いくつかの実施態様では、1又はそれ以上のコンピューティングデバイス504は、タンパク質精製条件システム502のユーザ等、タンパク質精製条件システム502を実施する実体の代わりに、1又はそれ以上のコンピューティングデバイス504を動作させるクラウド・コンピューティング・アーキテクチャに含めることができる。当該シナリオでは、クラウドコンピューティングアーキテクチャは、1又はそれ以上のコンピューティングデバイス504を用いて、タンパク質精製条件システム502を実施する実体の代わりに、1又はそれ以上の仮想マシンインスタンスをインスタンス化することができる。クラウドコンピューティングアーキテクチャは、タンパク質精製条件システム502を実施する物体から離れた場所に配置することができる。さらなる実施態様では、1又はそれ以上のコンピューティングデバイス504は、タンパク質精製条件システム502を実施する実体の直接制御下にあってもよい。例えば、タンパク質精製条件システム502を実施する実体は、1又はそれ以上のモデルを生成し、タンパク質を精製する条件を決定するため、モデルに関するタンパク質データを分析することに関連する操作を実行するために、1又はそれ以上のコンピュータ装置504を維持することができる。様々な実施態様では、1又はそれ以上の計算装置504は、1又はそれ以上のサーバコンピュータを含むことができる。
タンパク質精製条件システム502は、プロセッサ506等の1又はそれ以上のプロセッサを含むことができる。1又はそれ以上のプロセッサ506は、マイクロプロセッサ等の少なくとも1つのハードウェアプロセッサを含むことができる。場合によっては、1又はそれ以上のプロセッサ506は、中央処理装置、グラフィックス処理装置、又はCPUとGPUの両方、又は他の処理装置を含むことができる。さらに、1又は複数のプロセッサ506は、プログラムモジュール、プログラムデータ、及び/又は1又は複数のオペレーティングシステムを記憶することができるローカルメモリを含むことができる。
さらに、タンパク質精製条件システム502は、コンピュータ読取可能記憶媒体508等の、1又はそれ以上のコンピュータ読取可能記憶媒体を含むことができる。コンピュータ読取可能記憶媒体508は、コンピュータ読取可能命令、データ構造、プログラムモジュール、又は他のデータ等の情報の記憶のためのいかなる技術で実施される揮発性及び不揮発性メモリ及び/又は着脱可能及び非着脱可能媒体を含むことができる。そのようなコンピュータ読取可能記憶媒体508は、RAM、ROM、EEPROM、フラッシュメモリ又は他のメモリ技術、CD−ROM、デジタル多用途ディスク又は他の光学記憶装置、磁気カセット、磁気テープ、固体記憶装置、磁気ディスク記憶装置、RAID記憶システム、記憶アレイ、ネットワーク接続記憶装置、記憶領域ネットワーク、クラウド記憶装置、リムーバブル記憶媒体、又は所望の情報を記憶するために使用することができ、計算装置によってアクセスすることができる他の任意の媒体を含むことができるが、これらに限定されない。タンパク質精製条件システム502の構成に応じて、コンピュータ読取可能記憶媒体508は、有形のコンピュータ読取可能記憶媒体の一種であってもよく、非一過性記憶媒体であってもよい。
タンパク質精製条件システム502は、1又はそれ以上のインターネット、ケーブルネットワーク、衛星ネットワーク、広域無線通信ネットワーク、有線ローカルエリアネットワーク、無線ローカルエリアネットワーク、又は公衆交換電話ネットワーク等の1又はそれ以上のネットワークを介して、他のコンピュータ装置と通信する1又はそれ以上の通信インターフェース510を含むことができる。
コンピュータ読取可能記憶媒体508は、1又はそれ以上のプロセッサ506によって実行可能ないかなる数の機能コンポーネントをも記憶するために用いることができる。多くの実施態様では、当該機能コンポーネントは、1又はそれ以上のプロセッサ506によって実行可能な命令又はプログラムを含み、実行されると、タンパク質精製条件システム502に帰属される動作を実行するための動作ロジックを実施態様する。本明細書に記載される、タンパク質の精製の決定条件に関連する様々な機能及び特徴を実施する1又はそれ以上のプロセッサ506上で実行可能なタンパク質精製条件システム502の機能的構成要素は、タンパク質データ収集及び保存命令512、モデル生成命令514、精製条件最適化命令516、及びマルチウェルプレートサンプリング命令518を含む。
さらに、1又はそれ以上の計算装置504は、1又はそれ以上の入出力装置(図示せず)を含むことができる。1又はそれ以上の入出力装置は、表示装置、キーボード、リモートコントローラ、マウス、プリンタ、オーディオ入出力装置、スピーカ、マイクロホン、カメラなどを含むことができる。
タンパク質精製条件システム502は、RAM、ROM、EEPROM、フラッシュメモリ、1又はそれ以上のハードディスク、ソリッドステートドライブ、光メモリ(例えば、CD、DVD)、又は他の非過渡メモリ技術を含むことができるが、これらに限定されない、データ記憶装置520を含むことができる。データ記憶装置520は、タンパク質精製条件システム502によって利用される情報を維持し、タンパク質の精製条件を決定するために利用され得るモデルの生成に関連した操作を実行することができる。例えば、データ記憶装置520は、モデルを生成するために分析することができる訓練データ522を記憶することができる。
図5の例示的な例では、訓練データ522は、タンパク質の精製条件を決定するモデルを生成するためにアミノ酸配列を利用することができるタンパク質の配列データを含むことができる。配列データは、タンパク質精製条件モデルの生成に分析されるタンパク質の様々な位置に含まれるアミノ酸を示すことができる。訓練データ522はまた、タンパク質を精製する条件を決定するモデルの生成に構造データを用いることができるタンパク質の構造データを含むことができる。構造データは、タンパク質の二次構造、タンパク質の三次構造、又はタンパク質の二次構造と三次構造の両方を示す。訓練データ522はまた、様々なタンパク質の精製条件の決定モデルの生成に用いられうるタンパク質の様々な生物物理的特性の値を含む生物物理的特性データを含むことができる。さらに、訓練データ522は、pHレベル及び塩濃度の様々な組み合わせで、多くの固定相材料に関して得られたタンパク質の純度及び収率の値を含むことができる。
タンパク質データ収集及び保存命令508は、1又はそれ以上のプロセッサ506によって実行可能であり、タンパク質精製の条件を決定するモデルの生成用に評価されたタンパク質に関連するデータを取得及び保存することができる。いくつかの実施態様では、タンパク質データ収集及び保存命令508は、多くのソースから訓練データ522を得ることができる。特定の実施形態では、タンパク質データ収集及び保存命令512は、配列データ、構造データ、生物物理的特性データ、精製条件データ、クロマトグラフィープロセス用の性能測定値、又はそれらの組み合わせを、タンパク質関連データ用のリポジトリーである1又はそれ以上のウェブサイト及び/又は1又はそれ以上のデータベースから得ることができる。さらなる実施態様では、タンパク質データ収集及び保存命令512は、配列データ、構造データ、生物物理的特性データ、精製条件データ、及び/又はクロマトグラフィープロセス用の性能測定を捕捉する1又はそれ以上のユーザインターフェース要素を含む1又はそれ以上のユーザインターフェースを生成することができる。さらなる実施態様では、タンパク質データ収集及び保存命令512は、配列データ、構造データ、生物物理的特性データ、精製条件データ、クロマトグラフィープロセスのための性能測定値、又は1又はそれ以上のデータ記憶装置からそれらの組み合わせを得ることができる。1又はそれ以上のデータ記憶デバイスは、メモリスティック、フラッシュドライブ、又は親指ドライブ等のリムーバブルデータ記憶デバイスを含むことができる。1又は複数のデータ記憶装置は、有線ローカルエリアネットワーク、無線ローカルエリアネットワーク、無線ワイドエリアネットワーク、又はそれらの組み合わせ等の1又は複数のネットワークを介してタンパク質精製条件システム502に結合されたデータ記憶装置も含むことができる。
モデル生成命令514は、1又はそれ以上のプロセッサ506によって実行可能であり、1又はそれ以上のモデルを生成して、タンパク質の精製条件を決定することができる。モデル生成命令514は、訓練データ522を利用して、タンパク質の特徴とクロマトグラフィー技術の固定相材料の性能との間の関係を決定することができる。様々な実施態様では、モデル生成命令514は、タンパク質の配列、タンパク質の構造、タンパク質の測定された特性、又はそれらの組み合わせの間の関係、及び1又はそれ以上のクロマトグラフィー技術の収率及び/又は純度を同定することができる。モデル生成命令514はまた、pH値及び塩濃度等の精製条件と固定相材料の性能との間の関係を決定することができる。例えば、モデル生成命令514は、1又はそれ以上のクロマトグラフィー技術の、塩濃度及びpH値の様々な組み合わせと収率及び/又は純度との間の関係を決定することができる。
モデル生成命令514はまた、特定の特徴が固定相材料の性能に及ぼす量を決定することができる。特定の実施形態では、モデル生成命令514は、タンパク質配列の特定の部分が1又はそれ以上の固定相材料に関してタンパク質の収率及び純度に及ぼす影響の量を決定することができる。さらに、モデル生成命令514は、1又はそれ以上の固定相材料に関して、タンパク質の様々な構造が収率及び純度に及ぼす影響を決定することができる。さらに、モデル生成命令514は、濁度、分子量、及びタンパク質安定性等の測定された特性が、様々な固定相材料に関して純度及び/又は収率に及ぼす影響を決定することができる。特定の実施態様では、モデル生成命令514は、pHレベル及び塩濃度等の精製条件が1又はそれ以上の固定相材料の性能に及ぼす影響の量を決定することができる。様々な実施態様では、特定のタンパク質の特徴が精製プロセスの収率及び/又は純度に及ぼす影響は、モデルに含まれるタンパク質の特徴に関連する各変数に特定の重みを割り当てることで、モデルにおいて説明することができる。
タンパク質に関連する多数の特徴と固定相材料の性能との間の関係の決定後、モデル生成命令514は、各固定相材料について個々のモデルを生成することができる。モデルは、タンパク質の特性に対応する1又はそれ以上の入力に基づいてタンパク質の収率及び/又は純度を決定することができる。ある状況では、タンパク質のモデルを実施するために、タンパク質の最小限量の情報を得ることができる。例えば、モデルは、タンパク質の配列の少なくとも部分(例えば、タンパク質の特定の位置)、タンパク質に結合した多数のβシート、及び示差走査蛍光光度法によって示されるタンパク質の安定性に関する情報を利用して、pHレベル及び塩濃度の特定の範囲でのタンパク質の収率及び純度を予測することができる。この例の後、タンパク質精製条件システム502は、モデルに関連する配列部分に対応するタンパク質の配列の特定部分、βシートの数、及び特定のpH及び塩濃度でモデルに関連する固定相材料と精製した場合にタンパク質の収率及び純度を決定するタンパク質のDSFデータに関連する情報を得て、当該モデルを実施することができる。特定の実施態様では、モデルは多項式モデルを含むことができる。
精製条件最適化命令516は、1又はそれ以上のプロセッサ506によって実行可能であり、精製プロセスの費用を最小化しながら収率及び純度を最大化するタンパク質の精製条件を決定することができる。精製プロセスの費用は、固定相材料を用いて精製プロセスを実施の費用価値に関係することができ、また、いくつかのシナリオでは、各固定相材料及び/又は固定相材料の耐久性処理の困難性を含むことができる。いくつかの実施態様では、精製条件最適化命令516は、1又はそれ以上のモデルによりタンパク質を精製するため、最適条件の設定を決定することができる。タンパク質の精製条件の決定に用いられるモデルは、訓練データ522の少なくとも部分を使用して生成され得る。
精製条件最適化命令516は、特定のタンパク質の精製に利用する1又はそれ以上の固定相材料を決定することができる。いくつかの実施態様では、精製条件最適化命令516は、固定相材料の組合せを用いてタンパク質を精製することができることを決定することができる。例示するために、精製条件最適化命令516は、タンパク質が第1固定相材料を用いて精製され、続いて第2固定相材料を用いて精製され得ることを決定することができる。さらに、精製条件最適化命令516は、精製プロセスの最適条件を決定することができる。例えば、精製条件最適化命令516は、費用を最小限にしつつ、1又はそれ以上の固定相材料を用いて精製プロセスの収率及び純度を最大にするpH値の範囲及び塩濃度の範囲を決定することができる。いくつかの場合では、精製条件最適化命令516は、費用を最小限にしつつ、1又はそれ以上の固定相材料を用いて精製プロセスの収率及び純度を最大にするpH値及び塩濃度の単一の組み合わせを決定することができる。
マルチウェルプレートサンプリング命令518は、1又はそれ以上のプロセッサ506によって実行可能であり、固定相材料を用いてタンパク質の精製条件を提供するマルチウェルプレート内のより多数のウェルから選択されたウェルの試料を決定することができる。様々な実施態様では、マルチウェルプレートは、各々が一組の精製条件に関連する多数のウェルを含むことができる。例えば、マルチウェルプレートの個々のウェルは、固定相材料、pHレベル、及び塩濃度と関連付けることができる。マルチウェルプレートサンプリング命令518は、固定相材料とも関連するマルチウェルプレートのより多数のウェルをモデル化する個々のウェルのサブセットを決定することができる。例示のため、マルチウェルプレートサンプリング命令518は、24ウェル全体から得られた結果を再現するために用いることができる特定の固定相材料に関連する24のうちの5つのウェルを識別することができる。すなわち、マルチウェルプレートサンプリング命令518は、特定の固定相材料に対して最小量の誤差で24セットの精製条件の結果を再現することができる5セットの精製条件を識別することができる。様々な実施態様では、マルチウェルプレートサンプリング命令518は、マルチウェルプレートのウェルのサブセットから得られた収率及び純度の結果を、マルチウェルプレートのより多くのウェルから得られた収率及び純度の結果と比較するための反復プロセスを実行することができる。マルチウェルプレートサンプリング命令518は、マルチウェルプレートのウェルのセットから得られる参照データと、ウェルの特定のサブセットについての収率と純度値との間の誤差の量が参照データに関して最小化されるまで、マルチウェルプレートのウェルの様々なサブセットとの間の比較を実行することができる。参照データに関する誤差を最小化する特定の固定相材料の精製条件のサブセットを決定後、固定相材料についてのさらなるタンパク質の精製で、同じ精製条件のサブセットを用いることができる。
図6は、タンパク質の精製条件を決定する例示的なプロセスを示す。このプロセス(及び本明細書に記載される各プロセス)は、論理フローグラフとして示され、その各操作は、少なくとも部分的には、ハードウェア、ソフトウェア、又はそれらの組み合わせで実施可能な一連の操作を表す。ソフトウェアの文脈では、操作は、1又はそれ以上のプロセッサによって実行される場合に列挙される操作を実行する、1又はそれ以上のコンピュータ読取可能記憶媒体に記憶されたコンピュータ実行可能命令を表す。一般に、コンピュータ実行可能命令は、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含み、特定の機能を実行し、又は特定の抽象データ型を実施態様する。演算が記述される順序は、制限として解釈されることを意図するものではなく、記載される演算のいかなる数も、いかなる順序及び/又は並列に組み合わされて、プロセスを実行することができる。
図6は、1又はそれ以上のクロマトグラフィープロセスを用いてタンパク質の精製条件を決定する例示的プロセス600のフロー図である。工程600は、(i)カラムクロマトグラフィーシステム用の複数の固定相材料の固定相材料、(ii)タンパク質の量、及び(iii)pH及び塩濃度を有する溶液の量を含む各ウェルを有する複数のウェルを備えるプレートを提供することを含む。複数のウェルの各ウェルは、固定相材料、pH、及び塩濃度の異なる組み合わせを備えてよい。
604では、プロセス600は、複数のウェルの各ウェルの性能の測定値を決定することを含むことができる。複数のウェルの個々のウェルの性能の測定値は、個々のウェルに含まれる固定相材料に関するタンパク質の吸着を示すことができる。特に実施態様では、性能の測定値は、ウェルに含まれる固定相材料を利用するクロマトグラフィー技術の収率及び/又は純度を示すことができる。
606では、プロセス600は、複数のウェルに関する性能の個々の測定に少なくとも部分的に基づいて、ウェルのサブセットに関するクロマトグラフィー条件を決定することを含むことができる。クロマトグラフィー条件は、ウェルのサブセットの各ウェルについてのpH値及び塩濃度を含むことができる。ウェルのサブセットは、ウェルの様々なサブセットを反復的に選択し、基準データセットに関して誤差を最小化するウェルのサブセットを同定することによって決定することができる。
608では、プロセス600は、1又はそれ以上のクロマトグラフィープロセスの収率及び純度を予測する、複数の固定相材料用の複数のモデルを生成することを含むことができる。複数のモデルは、タンパク質のアミノ酸配列、タンパク質の1又はそれ以上の構造、又はタンパク質の特徴付けデータのうちの少なくとも1つに少なくとも部分的に基づいて生成することができる。特徴付けデータには、タンパク質の特性を示す分析機器から得られた値を含めることができる。
工程600は、少なくとも部分的に、クロマトグラフィー条件及び複数のモデルに基づいて、pH値の範囲の少なくとも1つのpH値、塩濃度の範囲の少なくとも1つの塩濃度、及びタンパク質の収率及び純度を最大にするための複数の固定相材料の1又はそれ以上の固定相材料を生成することを含むことができる。
〔実施形態例〕
(1)以下の:複数のウェルを備えるプレートを提供する工程であって、ここで、前記複数のウェルの個々のウェルが、(i)カラムクロマトグラフィーシステムの固定相材料、(ii)タンパク質の量、及び(iii)pH及び塩濃度を備える溶液量を含み;ここで、前記複数のウェルの各ウェルの前記固定相材料、pH、及び前記塩濃度の組み合わせは各々異なり;前記個々のウェルに含まれる前記固定相材料に関するタンパク質の吸着を示す、前記複数のウェルの各ウェルの性能の測定値を測定する工程;前記複数のウェルの各ウェルの性能の前記測定値に少なくとも部分的に基づいて、少なくとも部分的にクロマトグラフィーカラムの一連の条件に基づいて、複数の前記固定相材料用のタンパク質の収率及び純度を予測する複数のモデルを作成する工程であって、ここで:前記複数のモデルの各モデルは前記複数の固定相材料の個々の固定相材料と関連し;前記複数のモデルの各モデルは前記複数の固定相材料の異なる固定相材料と関連し;かつ、前記条件のセットは、pH値の範囲及び塩高度の範囲を備え、;前記複数のモデルを用いて、前記タンパク質の収率及び純度の組み合わせを最大化し、かつ、1又はそれ以上の固定相材料に関して、少なくとも1つのpH値及び少なくとも1つの塩濃度で、クロマトグラフィープロセスを実行する費用を最小化する、前記pH値の範囲の少なくとも1つのpH値、前記塩濃度の範囲の少なくとも1つの塩濃度、及び前記複数の固定相材料の前記1又はそれ以上の固定相材料を含む精製条件を作成する工程;を含む、方法。
(2)前記1又はそれ以上の固定相材料は、前記複数の固定相材料の個々の固定相材料の耐久性、前記タンパク質を精製するクロマトグラフィーカラムで利用されるべき前記個々の固定相材料の量、前記クロマトグラフィーカラムの大きさ、又はそれらの組み合わせに少なくとも部分的に基づいて決定される、(1)に記載の方法。
(3) 前記精製条件は、前記タンパク質が、第1pH値及び第1塩濃度において第1固定相材料を用いて精製された後、前記第1pH値とは異なる第2pH値及び前記第1塩濃度とは異なる第2塩濃度において前記第1固定相材料とは異なる第2固定相材料を用いて精製されることを示す、(1)又は(2)に記載の方法。
(4)前記性能の測定値が、収率、純度、一定期間後の溶液特性、一定期間後の前記溶液に含まれる前記タンパク質の残量特性、又はそれらの組み合わせを含む、(1)〜(3)のいずれか一項に記載の方法。
(5) 以下の:複数のタンパク質の収率データ及び純度データを作成する工程であって、前記収率データ及び前記純度データは、ある範囲のpH値にわたり、ある範囲の塩濃度にわたる複数のタンパク質各々及びカラムクロマトグラフィー技術の固定相材料の収率及び純度を示す;前記複数のタンパク質の個々のタンパク質のアミノ酸配列の少なくとも部分を示す配列データを取得する工程;前記複数のタンパク質の個々のタンパク質により呈示される1又はそれ以上の構造を示す構造データを取得する工程;前記複数のタンパク質の特徴付けデータを生成する工程であって、前記特徴付けデータは、前記複数のタンパク質の特性値を示す分析試験から得られた値を含み、1又はそれ以上のpH値及び1又はそれ以上の塩濃度値において、固定相材料用のさらなるタンパク質の収率及び純度を予測するモデルを作成する工程であって、ここで、前記モデルは、前記複数のタンパク質のアミノ酸配列と前記さらなるタンパク質のさらなるアミノ酸配列の類似性を示す配列成分、及び、前記複数のタンパク質の特性値と前記さらなるタンパク質の特性のさらなる特性の値の類似性を示す特徴付け成分とを含む、を含む、方法。
(6)前記収率データ及び前記純度データが、前記pH値の範囲及び前記塩濃度の範囲にわたり、固定相材料を用いて、多数の異なるタンパク質について多数のクロマトグラフィーカラムを行うことから測定される、(5)に記載の方法。
(7)前記収率データ及び前記純度データが、マルチウェルプレートのウェル由来の溶液を分析することにより測定され、ここで、前記マルチウェルプレートの個々のウェルは、前記タンパク質を含む溶液量及びpHレベル及び塩濃度を有する溶液量及び前記固定相材料量を含む、(5)又は(6)に記載の方法。
(8)前記1又は複数の構造が、疎水性領域、極性領域、折りたたみ、ターン、ループ、又はそれらの組み合わせを含む、(5)〜(7)のいずれか一項に記載の方法。
(9)以下の:前記さらなるタンパク質と前記複数のタンパク質は各々共通の二次構造を含み;前記さらなるタンパク質のアミノ酸配列の少なくとも部分及び前記複数のタンパク質のアミノ酸配列の少なくとも部分の同一性が少なくとも75%であり;分析試験は、前記複数のタンパク質の1又はそれ以上の生物物理的性質の値を産生し、前記さらなるタンパク質の1又はそれ以上の生物物理的性質のうちの1の生物物理的性質の値の範囲は、前記複数のタンパク質の生物物理的性質の値の範囲の少なくとも約90%の範囲内である、(5)〜(8)のいずれか一項に記載の方法。
(10)前記特徴付けデータが、前記複数のタンパク質の示差走査蛍光測定値、前記複数のタンパク質の分子量、前記複数のタンパク質を含む溶液の懸濁度、又はそれらの組み合わせの少なくとも1つに関連する、(5)〜(9)のいずれか一項に記載の方法。
(11)複数のウェルを備えるプレートを提供する工程であって、前記複数のウェルの個々のウェルは、(i)カラムクロマトグラフィーシステムの固定相材料、(ii)タンパク質量、及び(iii)pH及び塩濃度を有する溶液量を含み、ここで、前記複数のウェルの各ウェルの固定相材料、pH、及び塩濃度は各々異なる組み合わせであり、前記複数のウェルの各ウェルに関連するpHは、ある範囲のpH値に含まれ、前記複数のウェルの各ウェルに関連する塩濃度は、ある範囲の塩濃度値に含まれ、前記複数のウェルの第1ウェルの第1個々の固定相材料は、前記複数のウェルの第2ウェルの第2個々の固定相材料とは異なり、複数のウェルの各ウェルの性能の測定値を決定する工程であって、前記複数のウェルの個々のウェルの性能の前記測定値は、前記個々のウェルに含まれる前記固定相材料に対する前記タンパク質の吸着を示す;第1複数のウェルの性能の個々の測定値に少なくとも部分的に基づき、第1個々の固定相材料に対するさらなるタンパク質の性能の測定値、pH値の範囲、及び塩濃度値の範囲を予測する第1モデルを生成する工程;第1複数のウェルの性能の個々の測定値のサブセットに少なくとも部分的に基づき、第1個々の固定相材料に対するさらなるタンパク質の性能のさらなる測定値、pH値の範囲、及び塩濃度値の範囲を予測する第2モデルを生成する工程;前記第1モデルから生成された性能のさらなる測定値の第1結果及び、第2モデルから生成された性能のさらなる測定値の第2結果との間で比較を実行する工程;並びに、前記比較に少なくとも部分的に基づき、前記第1結果と前記第2結果との間の類似性を示す測定基準を決定する工程;を含む、方法。
(12)前記測定基準は、前記第1結果と前記第2結果との間の誤差量を示す、(11)に記載の方法。
(13)性能の第1測定値が、収率及び純度の値の第1組み合わせを含み、並びに性能の第2測定値が、収率と純度の値の第2組み合わせを含む、(11)又は(12)に記載の方法。
(14)pH値の範囲が約3〜8.5であり、塩濃度の範囲が約30ミリモル(mM)〜約700mMである、(11)〜(13)のいずれか一項に記載の方法。
(15)前記固定相材料が、イオン交換クロマトグラフィー、高圧液体クロマトグラフィー、混合モードクロマトグラフィー、疎水性相互作用クロマトグラフィー、サイズ排除クロマトグラフィー、アフィニティークロマトグラフィー、ヒドロキシアパタイト、逆相クロマトグラフィー、又はそれらの組み合わせに関する、(11)〜(14)のいずれか一項に記載の方法。
(16) 前記第2モデルが、前記複数のウェルのサブセットを繰り返し選択し、前記複数のウェルの前記サブセットの性能測定値と前記複数のウェルの各ウェルの性能測定値との間の誤差量を、前記誤差量を最小化するまで決定することにより得られる、(11)〜(15)のいずれか一項に記載の方法。
(17)以下の:複数のウェルを備えるプレートを提供する工程であって、前記複数のウェルの個々のウェルは、(i)カラムクロマトグラフィーシステム用の複数の固定相材料のうちの1の固定相材料、(ii)タンパク質量、及び(iii)pH及び塩濃度を有する溶液量を含み、ここで、前記複数のウェルの各ウェルの前記固定相材料、pH、及び前記塩濃度の組み合わせは各々異なり;前記個々のウェルに含まれる前記固定相材料に関する前記タンパク質の吸着を示す、前記複数のウェルの各ウェルの性能の測定値を測定する工程;前記複数のウェルの性能の個々の測定値に少なくとも部分的に基づいて、前記ウェルのサブセットの、前記ウェルのサブセットの各ウェルのpH値及び塩濃度を含むクロマトグラフィー条件を決定する工程;タンパク質のアミノ酸配列、前記タンパク質の1又はそれ以上の構造、又は前記タンパク質の特徴付けデータのうちの少なくとも1つに少なくとも部分的に基づいて、1又はそれ以上のクロマトグラフィープロセスの収率及び純度を予測する複数の固定相材料用の複数のモデルを生成する工程であって、前記特徴付けデータは、前記タンパク質の特性を示す分析機器から得られた値を含み;クロマトグラフィー条件及び複数のモデルに少なくとも部分的に基づいて、pH値の範囲の少なくとも1つのpH値、塩濃度の範囲の少なくとも1つの塩濃度、及び複数の固定相材料の1又はそれ以上の固定相材料を作成して、前記タンパク質の収率及び純度を最大化する工程;を含む、方法。
(18)さらに以下の:複数のモデルの少なくとも1つのモデルに少なくとも部分的に基づいて、特定のpH値、特定の塩濃度値、及び少なくとも1つの特定のクロマトグラフィー技術の組み合わせについての収率予測値及び純度予測値を予測する工程;pH値、塩濃度値、及びクロマトグラフィー技術の複数の組み合わせについて、収率予測値及び純度予測値を集約して、集約データセットを作成する工程;を含む、(17)に記載の方法。
(19)さらに以下の:前記集約データセットを含むユーザインターフェースを作成する工程であって、前記ユーザインターフェースは、複数の選択可能オプションを含み、個々の選択可能なオプションは、pH値、塩濃度値、及び少なくとも1つのクロマトグラフィー技術の各々の組み合わせに対応する;を含む、(18)に記載の方法。
(20)さらに以下の:前記複数の選択可能オプションの特定の選択可能オプションの選択を示すデータを受信する工程;かつ、前記データの受信に応じて、ユーザインターフェースに、少なくとも前記クロマトグラフィー技術、前記pH値、前記塩濃度値、及び前記選択可能なオプションに対応する金銭的費用の指標を表示させる工程;を含む、(19)に記載の方法。
(21)1又はそれ以上のプロセッサと、1又はそれ以上のプロセッサにより実行される場合に、以下の:複数のウェルを備えるプレートを提供する工程であって、ここで、複数のタンパク質の収率データ及び純度データを生成する工程であって、前記収率データ及び前記純度データは、前記複数のタンパク質各々の、pH値の範囲、塩濃度の範囲、及びカラムクロマトグラフィー技術の固定相材料の収率及び純度を示すデータであり;前記複数のタンパク質の個々のタンパク質のアミノ酸配列の少なくとも部分を示す配列データを取得する工程;前記複数のタンパク質の個々のタンパク質により呈示される1又はそれ以上の構造を示す構造データを取得する工程;前記複数のタンパク質の特徴付けデータを生成する工程であって、前記特徴付けデータは前記複数のタンパク質の特性の値を示す分析的試験から得られた値を示し;1又はそれ以上pH値及び1又はそれ以上の塩濃度値において、前記固定相材料用のさらなるタンパク質の収率及び純度を予測するモデルを生成する工程であって、前記モデルは、前記モデルは、前記複数のタンパク質のアミノ酸配列と前記さらなるタンパク質のアミノ酸配列との類似性を示す配列成分と、前記複数のタンパク質の特性の値と前記さらなるタンパク質の特性のさらなる値との類似性を示す特徴付け成分と、を含む;を含む動作を実行する、1又はそれ以上の非一時コンピュータ読取可能な媒体と、を含む、システム。
(22)前記1又はそれ以上の固定相材料は、前記複数の固定相材料の個々の固定相材料の耐久性、前記タンパク質を精製するクロマトグラフィーカラムで利用されるべき前記個々の固定相材料の量、前記クロマトグラフィーカラムの大きさ、又はそれらの組み合わせに少なくとも部分的に基づいて決定される、(21)に記載のシステム。
(23)前記精製条件は、前記タンパク質が、第1pH値及び第1塩濃度において第1固定相材料を用いて精製されるものであり、その後、前記第1pH値とは異なる第2pH値及び前記第1塩濃度とは異なる第2塩濃度において前記第1固定相材料とは異なる第2固定相材料を用いて精製されることを示す、(21)又は(22)に記載のシステム。
(24)前記性能の測定値が、収率、純度、一定期間後の溶液特性、一定期間後の前記溶液に含まれる前記タンパク質の残量特性、又はそれらの組み合わせを含む、(21)〜(23)のいずれか一項に記載のシステム。
(25)以下の:前記さらなるタンパク質と前記複数のタンパク質は各々共通の二次構造を含み;前記さらなるタンパク質のアミノ酸配列の少なくとも部分及び前記複数のタンパク質のアミノ酸配列の少なくとも部分の同一性が少なくとも75%であり;分析試験は、前記複数のタンパク質の1又はそれ以上の生物物理的性質の値を産生し、前記さらなるタンパク質の1又はそれ以上の生物物理的性質のうちの1の生物物理的性質の値の範囲は、前記複数のタンパク質の生物物理的性質の値の範囲の少なくとも約90%の範囲内である、(21)〜(24)のいずれか一項に記載のシステム。
(26)前記特徴付けデータが、前記複数のタンパク質の示差走査蛍光測定値、前記複数のタンパク質の分子量、前記複数のタンパク質を含む溶液の懸濁度、又はそれらの組み合わせの少なくとも1つに関連する、(21)〜(25)のいずれか一項に記載のシステム。
(27)1又はそれ以上のプロセッサと、1又はそれ以上のプロセッサにより実行される場合に、以下の:プレートの複数のウェルの各ウェルの性能の測定値を決定する工程であって、前記複数のウェルの個々のウェルの性能の前記測定値は、前記個々のウェルに含まれる前記固定相材料に対する前記タンパク質の吸着を示し、ここで、前記複数のウェルの個々のウェルは、(i)カラムクロマトグラフィーシステムの固定相材料、(ii)タンパク質量、及び(iii)pH及び塩濃度を有する溶液量を含み;前記複数のウェルの各ウェルの固定相材料、pH、及び塩濃度は各々異なる組み合わせであり;前記複数のウェルの各ウェルの性能の測定値に少なくとも部分的に基づき、クロマトグラフィーカラムの条件のセットに少なくとも部分的に基づき、複数の固定相材料のための複数の前記タンパク質の収率及び純度を予測する複数のモデルを生成する工程であって、ここで:前記複数のモデルの各モデルは、前記複数の固定相材料の個々の固定相材料に関連付けられ;前記複数のモデルの各モデルは、前記複数の固定相材料の異なる固定相材料に関連付けられ;かつ、前記条件のセットは、pH値の範囲及び塩濃度の範囲を含み;前記タンパク質の前記収率及び前記純度の組み合わせを最大化し、前記1又はそれ以上の固定相材料対して、前記少なくとも1つのpH値及び前記少なくとも1つの塩濃度でクロマトグラフィープロセスを実行する費用を最小化する、前記複数のモデルを用いて、前記pH値範囲の少なくとも1つのpH値、前記塩濃度の範囲の少なくとも1つの塩濃度、並びに前記複数の固定相材料のうちの1又はそれ以上の固定相材料を含む精製条件を生成する工程、を含む動作を実行する、1又はそれ以上の非一時コンピュータ読取可能な媒体を含む、システム。
(28)前記1又はそれ以上の固定相材料は、前記複数の固定相材料の個々の固定相材料の耐久性、前記タンパク質を精製するクロマトグラフィーカラムで利用されるべき前記個々の固定相材料の量、前記クロマトグラフィーカラムの大きさ、又はそれらの組み合わせに少なくとも部分的に基づいて決定される、(27)に記載のシステム。
(29)前記精製条件は、前記タンパク質が、第1pH値及び第1塩濃度において第1固定相材料を用いて精製されるものであり、その後、前記第1pH値とは異なる第2pH値及び前記第1塩濃度とは異なる第2塩濃度において前記第1固定相材料とは異なる第2固定相材料を用いて精製されることを示す、(27)又は(28)に記載のシステム。
(30)前記性能の測定値が、収率、純度、一定期間後の溶液特性、一定期間後の前記溶液に含まれる前記タンパク質の残量特性、又はそれらの組み合わせを含む、(27)〜(29)のいずれか一項に記載のシステム。
(31)1又はそれ以上のプロセッサと、1又はそれ以上のプロセッサにより実行される場合に、以下の:プレートの複数のウェルの各ウェルの性能の測定値を決定する工程であって、前記複数のウェルの個々のウェルの性能の前記測定値は、前記個々のウェルに含まれる前記固定相材料に対する前記タンパク質の吸着を示し;前記第1複数のウェルの性能の個々の測定値に少なくとも部分的に基づき、前記第1個々の固定相材料に対するさらなるタンパク質の性能のさらなる測定値、pH値の範囲、及び塩濃度値の範囲を予測する第1モデルを生成する工程;前記第1複数のウェルに対する個々の性能の測定値のサブセットに少なくとも部分的に基づき、前記第1個々の固定相材料に対する前記さらなるタンパク質の性能の前記さらなる測定値、前記pH値の範囲、及び前記塩濃度値の範囲を予測する第2モデルを生成する工程;前記第1モデルから生成された性能のさらなる測定値の第1結果と、前記第2モデルから生成された性能のさらなる測定値の第2結果との間で比較を実行する工程;かつ、前記比較に少なくとも部分的に基づき、前記第1結果と前記第2結果との間の類似性を示す判断基準を決定する工程;を含む、動作を実行する、1又はそれ以上の非一時コンピュータ読取可能な媒体を含む、システム。
(32) 32. 前記プレートが前記複数のウェルを含み、前記複数のウェルの個々のウェルが、(i)前記カラムクロマトグラフィーシステムの固定相材料、(ii)前記タンパク質の量、及び(iii)pH及び塩濃度を有する溶液の量を含み、前記複数のウェルの個々のウェルは、前記固定相材料、pH、及び前記塩濃度の異なる組み合わせを有し、前記複数のウェルの個々のウェルに関連するpHは、前記pH値の範囲に含まれ、前記複数のウェルの個々のウェルに関連する前記塩濃度は、前記塩濃度値の範囲に含まれ、前記複数のウェルの第1ウェルの第1個々の固定相材料は、前記複数のウェルの第2ウェルの第2個々の固定相材料とは異なる、(31)に記載のシステム。
(33)前記測定基準は、前記第1結果と前記第2結果との間の誤差量を示す、(31)又は(32)に記載のシステム。
(34)性能の第1測定値が、収率及び純度の値の第1組み合わせを含み、並びに性能の第2測定値が、収率と純度の値の第2組み合わせを含む、(31)又は(33)に記載のシステム。
(35)pH値の範囲が約3〜8.5であり、塩濃度の範囲が約30ミリモル(mM)〜約700mMである、(31)〜(34)のいずれか一項に記載のシステム。
(36)前記固定相材料が、イオン交換クロマトグラフィー、高圧液体クロマトグラフィー、混合モードクロマトグラフィー、疎水性相互作用クロマトグラフィー、サイズ排除クロマトグラフィー、アフィニティークロマトグラフィー、ヒドロキシアパタイト、逆相クロマトグラフィー、又はそれらの組み合わせに関する、(31)〜(35)のいずれか一項に記載のシステム。
(37) 前記第2モデルが、前記複数のウェルのサブセットを繰り返し選択し、前記複数のウェルの前記サブセットの性能測定値と前記複数のウェルの各ウェルの性能測定値との間の誤差量を、前記誤差量を最小化するまで決定することにより得られる、(31)〜(36)のいずれか一項に記載のシステム。
(38)1又はそれ以上のプロセッサと、1又はそれ以上のプロセッサにより実行される場合に、以下の:複数のウェルを備えるプレートを提供する工程であって、前記複数のウェルの個々のウェルは、(i)カラムクロマトグラフィーシステム用の複数の固定相材料のうちの1の固定相材料、(ii)タンパク質量、及び(iii)pH及び塩濃度を有する溶液量を含み、ここで、前記複数のウェルの各ウェルの前記固定相材料、pH、及び前記塩濃度の組み合わせは各々異なり;前記個々のウェルに含まれる前記固定相材料に関する前記タンパク質の吸着を示す、前記複数のウェルの各ウェルの性能の測定値を測定する工程;前記複数のウェルの性能の個々の測定値に少なくとも部分的に基づいて、前記ウェルのサブセットの、前記ウェルのサブセットの各ウェルのpH値及び塩濃度を含むクロマトグラフィー条件を決定する工程;タンパク質のアミノ酸配列、前記タンパク質の1又はそれ以上の構造、又は前記タンパク質の特徴付けデータのうちの少なくとも1つに少なくとも部分的に基づいて、1又はそれ以上のクロマトグラフィープロセスの収率及び純度を予測する複数の固定相材料用の複数のモデルを生成する工程であって、前記特徴付けデータは、前記タンパク質の特性を示す分析機器から得られた値を含み;クロマトグラフィー条件及び複数のモデルに少なくとも部分的に基づいて、pH値の範囲の少なくとも1つのpH値、塩濃度の範囲の少なくとも1つの塩濃度、及び複数の固定相材料の1又はそれ以上の固定相材料を作成して、前記タンパク質の収率及び純度を最大化する工程;を含む動作を実行する、1又はそれ以上の非一時コンピュータ読取可能な媒体を含む、システム。
(39)前記操作が、さらに以下の:複数のモデルの少なくとも1つのモデルに少なくとも部分的に基づいて、特定のpH値、特定の塩濃度値、及び少なくとも1つの特定のクロマトグラフィー技術の組み合わせについての収率予測値及び純度予測値を予測する工程;pH値、塩濃度値、及びクロマトグラフィー技術の複数の組み合わせについて、収率予測値及び純度予測値を集約して、集約データセットを作成する工程;を含む、(38)に記載のシステム。
(40)前記操作が、さらに以下の:前記集約データセットを含むユーザインターフェースを作成する工程であって、前記ユーザインターフェースは、複数の選択可能オプションを含み、個々の選択可能なオプションは、pH値、塩濃度値、及び少なくとも1つのクロマトグラフィー技術の各々の組み合わせに対応する;を含む、(38)に記載のシステム。
(41)前記操作は、さらに以下の:前記複数の選択可能オプションの特定の選択可能オプションの選択を示すデータを受信する工程;かつ、前記データの受信に応じて、ユーザインターフェースに、少なくとも前記クロマトグラフィー技術、前記pH値、前記塩濃度値、及び前記選択可能なオプションに対応する金銭的費用の指標を表示させる工程;を含む、(40)に記載のシステム。
図7は、多数のpHレベル及び塩濃度に関して、タンパク質の収率及び純度を示す多数のユーザインターフェースを示す。タンパク質の精製のための最適条件を示す。
図8は、様々なpHレベル及び塩濃度においてマルチモードクロマトグラフィーを用いてタンパク質の収率及び純度の決定に用いることができる様々なモデル由来の結果を示す。802は、マルチウェルプレートに含まれるウェルのセットの各ウェルからのデータに基づくモデルを示す。804は、802によって示されるモデルの生成に用いられるのと同じウェルのセットから選択されるウェルの第1サブセットからのデータに基づくモデルを示す。804で示されるモデルは、802で示されるモデルの生成に用いられるデータの約80%に基づく。806は、802によって示されるモデルの生成に用いられる同じウェルのセットから選択されるウェルの第2サブセットのデータから導出されるモデルを示す。806で示されるモデルは、802で示されるモデルの生成に用いられるデータの約20%に基づく。
〔緒言〕
ハイスループットスクリーニング(HTS)及び小型化は、下流プロセス開発を合理化する十分確立された戦略である。常套的開発では、下流プロセス全体にわたるHTS技術の利用は、全体的なプロセスの理解を高め、プロセス設計の誤差の回避により優れる。初期相開発の間、HTS法は、並列した複数の分子の開発を促進し、効率的で、相に適したワークストリームに情報を提供することができる。本研究は、単一の96穴フィルタプレート実験における統合下流プロセス開発の方法を記載する。プレート設計により、低pHウイルス不活化を含む全範囲の下流溶液条件にわたって、製品のコロイド、化学的及び熱的安定性に関するデータ収集が可能となる。さらに、同じプレートでバッチ結合試験を行い、5種類のクロマトグラフィー媒体におけるタンパク質−吸着剤の相互作用を調べた。
〔材料及び方法〕
この方法を、各ウェルに50μLの樹脂を含む96穴フィルタプレートを用いて実施した。負荷及び緩衝液調製を含む全方法を、ロボット液体ハンドリングシステム上で自動化した。溶液負荷調製後、プレートを装填し、60分間インキュベートし、その後、未結合物質を回収した。次に、ウェル中の樹脂を、クロマトグラフィーのモードに応じ試験リップ溶液又は溶出緩衝液のいずれかとインキュベートし、次いで、ストリップされた又は溶出された物質を回収した。負荷、非結合、溶出、及びストリップ試料について、タンパク質濃度及び標的不純物(例えば、HMW、HCP、又はクリップ)を分析した。96穴プレートで評価された樹脂は、結合/溶出モード及び陰イオン交換(AEX)、疎水性相互作用(HIC)、及びフロースルー(FT)モードでの混合モード(MMC)クロマトグラフィーにおけるプロテインA親和性及び陽イオン交換(CEX)クロマトグラフィーを含む。化1にプレートの構成を、表1に試験した運転条件を示す。
Figure 2021521412
化1において、96穴フィルタプレートの構成色は特定の樹脂(プロテインAアフィニティ:赤、AEX:黄、HIC:緑、MMC:紫、CEX樹脂1:淡青色と濃灰色、CEX樹脂2:濃青色と淡灰色)専用のプレートの領域を示す。
Figure 2021521412
溶液の安定性
分子の溶液安定性を評価することにより、潜在的な操作条件についての重要な洞察を得ることができる。下流プロセスにおける潜在的な溶液条件にわたるコロイド、化学的及び熱的安定性を用いて、製品が最も安定している操作空間を同定し、降伏損失及び凝集を最小限に抑える条件を同定した。図2は、2つの異なるモノクローナル抗体(mAb)について、光散乱によるコロイドの安定性とサイズ排除クロマトグラフィー(SEC)による化学的安定性を比較したものである。この例に示されるように、モノクローナル抗体1は、評価された下流の操作条件の範囲にわたって、沈殿及び凝集に関して比較的安定である。あるいは、mAb2は、高いpH及び低いイオン強度で沈殿し、高いpH及び高い塩強度で有意な凝集を示し、これらの溶液条件は、下流プロセス設計中に回避されるべきであることを示す。図3は、IgG1mAb及びFc融合タンパク質の示差走査蛍光光度法(DSF)による熱安定性の差を強調している。この実施例に示されるように、mAb3は、pHの上昇につれてより熱安定性が高くなると共に、IgG1に対して通常の熱安定性を示す。Fc融合タンパク質は、全体的にTmが低く、pH及び塩強度が高まると熱安定性が低下する。
Figure 2021521412
化2は、評価した下流プロセス条件の範囲における2mAbの溶液安定性の比較を示す。パネルA及びBは、各々モノクローナル抗体1の濁度及びHMWを示す。パネルC及びDは、モノクローナル抗体2の濁度及びHMWを示す。
Figure 2021521412
化3は、評価した下流プロセス条件の範囲に対するDSFによる熱安定性を示す。パネルAは、mAb3を、パネルBはFc融合タンパク質1を示す。
バッチ結合
96穴プレートを用いて、バッチ結合試験を実施し、広範囲のpH及び塩条件にわたる5種類のクロマトグラフィー媒体にわたるタンパク質−吸着剤の相互作用を調べた。このフォーマットを用いて、プロテインA溶出条件をスクリーニングし、静的樹脂容量、勾配溶出強度、及び2種類の陽イオン交換樹脂に対する選択性を評価し、単一分子に対してフロースルーモードで操作される3種類の異なる樹脂に対する生成物及び汚染物質の選択性を評価した。図4は、単一プレート実験で得られたデータの一例である。これらのデータは、プロテインAの収率及び低pHウイルス不活化に対する分子感受性を推定し、溶出強度、収率及び汚染物質に対する選択性に基づいてCEX樹脂を選択し、最後に、最適なフロースルー樹脂及び操作条件を特定するために使用することができます。本明細書に提示された統合プレートベースの方法は、個々のユニット動作のための設定点及び動作範囲に対する感度についての洞察を提供する。さらに、モードペアリングを使用して、全プロセスにわたって樹脂及び動作条件を選択することができる(図5)。
Figure 2021521412
化4は、単一バッチ結合実験中に生成されたデータの例を示す。パネルAは60分間の低pH保持後の溶出pH及びプールHMWに対するプロテインA収率を示し、パネルBは、2つのCEX樹脂の擬似クロマトグラムの結果を示す。パネルCは、2つのCEX樹脂の静止容量とHMWマスバランスを示す。パネルDは、2種類のCEX樹脂の純度(HMW)プロットであり、パネルEは、AEX、HIC、及びMMC樹脂をフロースルーモードで操作した場合の回収及び汚染物質の等高線図を示す。
Figure 2021521412
化5は、下流工程全体にわたるモードに対する純度対収率を示す。各データ点は、SEC(%モノマー)による純度及び異なるプロセスオプションに対する収率を表す。紫色の点はCEXと対合したプロテインAである。他の色は、タンパク質A及びCEXが異なる研磨オプション(AEX、HIC、又はMMC)と対であることを示す。パネルは、すべてのプロセスオプションの結果を示す。右側のパネルは、赤色のコールアウトボックスのズーム表示である。これは、全体的な収率が70%を超え、純度が98%を超える条件を示す。
提案したアプローチ法は、単一プレート系実験において、プロセス開発科学者が下流プロセス全体の分子製造可能性とプロセス操作範囲を決定する超高速開発サイクルが可能となる。この方法に必要な資源は、約100mgのタンパク質、かつ稼働時間は1日である。対照的に、従来のベンチスケールクロマトグラフィーシステム及びスケールダウンサイズカラムを用いて比較可能なデータを得るためには、仮定にもよるが、稼働時間は5〜8週間で、50gを超えるタンパク質が必要でありうる。
小型化自動ロボカラムクロマトグラフィーと組み合わせて動作条件を検証すると、提示された方法は、プロセスの理解とロバスト性を犠牲にすることなく、下流開発サイクルの効率を劇的に向上させることができる、位相に適した開発戦略に統合される。
上記主題は、例示としてのみ提供され、限定するものと解釈されるべきではない。さらに、クレームされた主題は、本開示のいずれかの部分に記載されたいずれかの又はすべての欠点を解決する実施態様に限定されない。図示及び説明される例示的な構成及び用途に従うことなく、また、以下の特許請求の範囲に記載される本発明の真の精神及び範囲から逸脱することなく、本明細書に記載される主題に対して様々な修正及び変更を行うことができる。

Claims (20)

  1. 以下の:
    複数のウェルを備えるプレートを提供する工程であって、ここで、前記複数のウェルの個々のウェルが、(i)カラムクロマトグラフィーシステムの固定相材料、(ii)タンパク質の量、及び(iii)pH及び塩濃度を備える溶液量を含み;ここで、前記複数のウェルの各ウェルの前記固定相材料、pH、及び前記塩濃度の組み合わせは各々異なり;
    前記個々のウェルに含まれる前記固定相材料に関するタンパク質の吸着を示す、前記複数のウェルの各ウェルの性能の測定値を測定する工程;
    前記複数のウェルの各ウェルの性能の前記測定値に少なくとも部分的に基づいて、少なくとも部分的にクロマトグラフィーカラムの一連の条件に基づいて、複数の前記固定相材料用のタンパク質の収率及び純度を予測する複数のモデルを作成する工程であって、ここで:
    前記複数のモデルの各モデルは前記複数の固定相材料の個々の固定相材料と関連し;
    前記複数のモデルの各モデルは前記複数の固定相材料の異なる固定相材料と関連し;かつ、
    前記条件のセットは、pH値の範囲及び塩高度の範囲を備え、;
    前記複数のモデルを用いて、前記タンパク質の収率及び純度の組み合わせを最大化し、かつ、1又はそれ以上の固定相材料に関して、少なくとも1つのpH値及び少なくとも1つの塩濃度で、クロマトグラフィープロセスを実行する費用を最小化する、前記pH値の範囲の少なくとも1つのpH値、前記塩濃度の範囲の少なくとも1つの塩濃度、及び前記複数の固定相材料の前記1又はそれ以上の固定相材料を含む精製条件を作成する工程;
    を含む、方法。
  2. 前記1又はそれ以上の固定相材料は、前記複数の固定相材料の個々の固定相材料の耐久性、前記タンパク質を精製するクロマトグラフィーカラムで利用されるべき前記個々の固定相材料の量、前記クロマトグラフィーカラムの大きさ、又はそれらの組み合わせに少なくとも部分的に基づいて決定される、請求項1に記載の方法。
  3. 前記精製条件は、前記タンパク質が、第1pH値及び第1塩濃度において第1固定相材料を用いて精製された後、前記第1pH値とは異なる第2pH値及び前記第1塩濃度とは異なる第2塩濃度において前記第1固定相材料とは異なる第2固定相材料を用いて精製されることを示す、請求項1又は2に記載の方法。
  4. 前記性能の測定値が、収率、純度、一定期間後の溶液特性、一定期間後の前記溶液に含まれる前記タンパク質の残量特性、又はそれらの組み合わせを含む、請求項1〜3のいずれか一項に記載の方法。
  5. 以下の:
    複数のタンパク質の収率データ及び純度データを作成する工程であって、前記収率データ及び前記純度データは、ある範囲のpH値にわたり、ある範囲の塩濃度にわたる複数のタンパク質各々及びカラムクロマトグラフィー技術の固定相材料の収率及び純度を示す;
    前記複数のタンパク質の個々のタンパク質のアミノ酸配列の少なくとも部分を示す配列データを取得する工程;
    前記複数のタンパク質の個々のタンパク質により呈示される1又はそれ以上の構造を示す構造データを取得する工程;
    前記複数のタンパク質の特徴付けデータを生成する工程であって、前記特徴付けデータは、前記複数のタンパク質の特性値を示す分析試験から得られた値を含み、
    1又はそれ以上のpH値及び1又はそれ以上の塩濃度値において、固定相材料用のさらなるタンパク質の収率及び純度を予測するモデルを作成する工程であって、ここで、前記モデルは、前記複数のタンパク質のアミノ酸配列と前記さらなるタンパク質のさらなるアミノ酸配列の類似性を示す配列成分、及び、前記複数のタンパク質の特性値と前記さらなるタンパク質の特性のさらなる特性値の類似性を示す特徴付け成分とを含む、
    を含む、方法。
  6. 前記収率データ及び前記純度データが、前記pH値の範囲及び前記塩濃度の範囲にわたり、固定相材料を用いて、多数の異なるタンパク質について多数のクロマトグラフィーカラムを行うことから測定される、請求項5に記載の方法。
  7. 前記収率データ及び前記純度データが、マルチウェルプレートのウェル由来の溶液を分析することにより測定され、ここで、前記マルチウェルプレートの個々のウェルは、前記タンパク質を含む溶液量及びpHレベル及び塩濃度を有する溶液量及び前記固定相材料量を含む、請求項5又は6に記載の方法。
  8. 前記1又は複数の構造が、疎水性領域、極性領域、折りたたみ、ターン、ループ、又はそれらの組み合わせを含む、請求項5〜7のいずれか一項に記載の方法。
  9. 以下の:
    前記さらなるタンパク質と前記複数のタンパク質は各々共通の二次構造を含み;
    前記さらなるタンパク質のアミノ酸配列の少なくとも部分及び前記複数のタンパク質のアミノ酸配列の少なくとも部分の同一性が少なくとも75%であり;
    分析試験は、前記複数のタンパク質の1又はそれ以上の生物物理的性質の値を産生し、前記さらなるタンパク質の1又はそれ以上の生物物理的性質のうちの1の生物物理的性質の値の範囲は、前記複数のタンパク質の生物物理的性質の値の範囲の少なくとも約90%の範囲内である、
    請求項5〜8のいずれか一項に記載の方法。
  10. 前記特徴付けデータが、前記複数のタンパク質の示差走査蛍光測定値、前記複数のタンパク質の分子量、前記複数のタンパク質を含む溶液の懸濁度、又はそれらの組み合わせの少なくとも1つに関連する、請求項5〜9のいずれか一項に記載の方法。
  11. 以下の:
    複数のウェルを備えるプレートを提供する工程であって、前記複数のウェルの個々のウェルは、(i)カラムクロマトグラフィーシステムの固定相材料、(ii)タンパク質量、及び(iii)pH及び塩濃度を有する溶液量を含み、ここで、
    前記複数のウェルの各ウェルの固定相材料、pH、及び塩濃度は各々異なる組み合わせであり、
    前記複数のウェルの各ウェルに関連するpHは、ある範囲のpH値に含まれ、
    前記複数のウェルの各ウェルに関連する塩濃度は、ある範囲の塩濃度値に含まれ、
    前記複数のウェルの第1ウェルの第1個々の固定相材料は、前記複数のウェルの第2ウェルの第2個々の固定相材料とは異なり、
    複数のウェルの各ウェルの性能の測定値を決定する工程であって、前記複数のウェルの個々のウェルの性能の前記測定値は、前記個々のウェルに含まれる前記固定相材料に対する前記タンパク質の吸着を示す;
    第1複数のウェルの性能の個々の測定値に少なくとも部分的に基づき、第1個々の固定相材料に対するさらなるタンパク質の性能の測定値、pH値の範囲、及び塩濃度値の範囲を予測する第1モデルを生成する工程;
    第1複数のウェルの性能の個々の測定値のサブセットに少なくとも部分的に基づき、第1個々の固定相材料に対するさらなるタンパク質の性能のさらなる測定値、pH値の範囲、及び塩濃度値の範囲を予測する第2モデルを生成する工程;
    前記第1モデルから生成された性能のさらなる測定値の第1結果及び、第2モデルから生成された性能のさらなる測定値の第2結果との間で比較を実行する工程;並びに
    前記比較に少なくとも部分的に基づき、前記第1結果と前記第2結果との間の類似性を示す測定基準を決定する工程;
    を含む、方法。
  12. 前記測定基準は、前記第1結果と前記第2結果との間の誤差量を示す、請求項11に記載の方法。
  13. 性能の第1測定値が、収率及び純度の値の第1組み合わせを含み、並びに性能の第2測定値が、収率と純度の値の第2組み合わせを含む、請求項11又は12に記載の方法。
  14. pH値の範囲が約3〜8.5であり、塩濃度の範囲が約30ミリモル(mM)〜約700mMである、請求項11〜13のいずれか一項に記載の方法。
  15. 前記固定相材料が、イオン交換クロマトグラフィー、高圧液体クロマトグラフィー、混合モードクロマトグラフィー、疎水性相互作用クロマトグラフィー、サイズ排除クロマトグラフィー、アフィニティークロマトグラフィー、ヒドロキシアパタイト、逆相クロマトグラフィー、又はそれらの組み合わせに関する、請求項11〜14のいずれか一項に記載の方法。
  16. 前記第2モデルが、前記複数のウェルのサブセットを繰り返し選択し、前記複数のウェルの前記サブセットの性能測定値と前記複数のウェルの各ウェルの性能測定値との間の誤差量を、前記誤差量を最小化するまで決定することにより得られる、請求項11〜15のいずれか一項に記載の方法。
  17. 以下の:
    複数のウェルを備えるプレートを提供する工程であって、前記複数のウェルの個々のウェルは、(i)カラムクロマトグラフィーシステム用の複数の固定相材料のうちの1の固定相材料、(ii)タンパク質量、及び(iii)pH及び塩濃度を有する溶液量を含み、ここで、前記複数のウェルの各ウェルの前記固定相材料、pH、及び前記塩濃度の組み合わせは各々異なり;
    前記個々のウェルに含まれる前記固定相材料に関する前記タンパク質の吸着を示す、前記複数のウェルの各ウェルの性能の測定値を測定する工程;
    前記複数のウェルの性能の個々の測定値に少なくとも部分的に基づいて、前記ウェルのサブセットの、前記ウェルのサブセットの各ウェルのpH値及び塩濃度を含むクロマトグラフィー条件を決定する工程;
    タンパク質のアミノ酸配列、前記タンパク質の1又はそれ以上の構造、又は前記タンパク質の特徴付けデータのうちの少なくとも1つに少なくとも部分的に基づいて、1又はそれ以上のクロマトグラフィープロセスの収率及び純度を予測する複数の固定相材料用の複数のモデルを生成する工程であって、前記特徴付けデータは、前記タンパク質の特性を示す分析機器から得られた値を含み;
    クロマトグラフィー条件及び複数のモデルに少なくとも部分的に基づいて、pH値の範囲の少なくとも1つのpH値、塩濃度の範囲の少なくとも1つの塩濃度、及び複数の固定相材料の1又はそれ以上の固定相材料を作成して、前記タンパク質の収率及び純度を最大化する工程;
    を含む、方法。
  18. さらに以下の:
    複数のモデルの少なくとも1つのモデルに少なくとも部分的に基づいて、特定のpH値、特定の塩濃度値、及び少なくとも1つの特定のクロマトグラフィー技術の組み合わせについての収率予測値及び純度予測値を予測する工程;
    pH値、塩濃度値、及びクロマトグラフィー技術の複数の組み合わせについて、収率予測値及び純度予測値を集約して、集約データセットを作成する工程;
    を含む、請求項17に記載の方法。
  19. さらに以下の:
    前記集約データセットを含むユーザインターフェースを作成する工程であって、前記ユーザインターフェースは、複数の選択可能オプションを含み、個々の選択可能なオプションは、pH値、塩濃度値、及び少なくとも1つのクロマトグラフィー技術の各々の組み合わせに対応する;
    を含む、請求項18に記載の方法。
  20. さらに以下の:
    前記複数の選択可能オプションの特定の選択可能オプションの選択を示すデータを受信する工程;かつ
    前記データの受信に応じて、ユーザインターフェースに、少なくとも前記クロマトグラフィー技術、前記pH値、前記塩濃度値、及び前記選択可能なオプションに対応する金銭的費用の指標を表示させる工程;
    を含む、請求項19に記載の方法。
JP2020544212A 2018-02-21 2019-02-21 タンパク質の精製条件の決定 Active JP7332610B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862633584P 2018-02-21 2018-02-21
US62/633,584 2018-02-21
PCT/US2019/019050 WO2019165148A1 (en) 2018-02-21 2019-02-21 Determining conditions for purification of proteins

Publications (3)

Publication Number Publication Date
JP2021521412A true JP2021521412A (ja) 2021-08-26
JPWO2019165148A5 JPWO2019165148A5 (ja) 2022-03-02
JP7332610B2 JP7332610B2 (ja) 2023-08-23

Family

ID=65763767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020544212A Active JP7332610B2 (ja) 2018-02-21 2019-02-21 タンパク質の精製条件の決定

Country Status (5)

Country Link
US (1) US20200408728A1 (ja)
EP (2) EP4372376A2 (ja)
JP (1) JP7332610B2 (ja)
CA (1) CA3091905C (ja)
WO (1) WO2019165148A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2022013313A (es) * 2020-04-23 2022-11-30 Amgen Inc Seleccion de parametros de cromatografia para la fabricacion de proteinas terapeuticas.
CN116261566A (zh) * 2020-09-21 2023-06-13 拜耳医药保健有限责任公司 病原体清除系统和方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003530572A (ja) * 2000-04-11 2003-10-14 ザ プロクター アンド ギャンブル カンパニー 高速液体クロマトグラフィー・パラメータのモデル化、予測、及び最適化のための方法
US20060096924A1 (en) * 2002-09-19 2006-05-11 Hartmut Schlueter Method for discovering suitable chromatography conditions for the separation of biological molecules
JP2009539931A (ja) * 2006-06-14 2009-11-19 ベーリンガー インゲルハイム ファルマ ゲゼルシャフト ミット ベシュレンクテル ハフツング ウント コンパニー コマンディトゲゼルシャフト 生体分子のクロマトグラフィー精製プロセスの最適化方法
US20160367911A1 (en) * 2015-06-16 2016-12-22 Ge Healthcare Bio-Sciences Ab Determination of chromatography conditions
JP2017534060A (ja) * 2014-11-12 2017-11-16 ジーイー・ヘルスケア・バイオサイエンス・アクチボラグ 液体クロマトグラフィープロトコルにおける実験パラメータの影響を決定するための方法及びシステム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040034477A1 (en) * 2002-08-19 2004-02-19 Mcbrien Michael Methods for modeling chromatographic variables

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003530572A (ja) * 2000-04-11 2003-10-14 ザ プロクター アンド ギャンブル カンパニー 高速液体クロマトグラフィー・パラメータのモデル化、予測、及び最適化のための方法
US20060096924A1 (en) * 2002-09-19 2006-05-11 Hartmut Schlueter Method for discovering suitable chromatography conditions for the separation of biological molecules
JP2009539931A (ja) * 2006-06-14 2009-11-19 ベーリンガー インゲルハイム ファルマ ゲゼルシャフト ミット ベシュレンクテル ハフツング ウント コンパニー コマンディトゲゼルシャフト 生体分子のクロマトグラフィー精製プロセスの最適化方法
JP2017534060A (ja) * 2014-11-12 2017-11-16 ジーイー・ヘルスケア・バイオサイエンス・アクチボラグ 液体クロマトグラフィープロトコルにおける実験パラメータの影響を決定するための方法及びシステム
US20160367911A1 (en) * 2015-06-16 2016-12-22 Ge Healthcare Bio-Sciences Ab Determination of chromatography conditions

Also Published As

Publication number Publication date
EP4372376A2 (en) 2024-05-22
EP3755447B1 (en) 2024-03-06
CA3091905C (en) 2023-03-21
WO2019165148A1 (en) 2019-08-29
CA3091905A1 (en) 2019-08-29
EP3755447A1 (en) 2020-12-30
JP7332610B2 (ja) 2023-08-23
US20200408728A1 (en) 2020-12-31

Similar Documents

Publication Publication Date Title
Hanke et al. Purifying biopharmaceuticals: knowledge-based chromatographic process development
Almeida Predictive non-linear modeling of complex data by artificial neural networks
Uhlén Affinity as a tool in life science
Rüdt et al. Real‐time monitoring and control of the load phase of a protein A capture step
JP5530367B2 (ja) 分子動力学を使用してタンパク質またはその他のバイオポリマー中の相関残基を決定するための方法
Smith Striving for purity: advances in protein purification
Ayoglu et al. Systematic antibody and antigen-based proteomic profiling with microarrays
Hause et al. Targeted protein-omic methods are bridging the gap between proteomic and hypothesis-driven protein analysis approaches
Kim et al. A short survey of computational analysis methods in analysing ChIP-seq data
Hahn et al. Calibration‐free inverse modeling of ion‐exchange chromatography in industrial antibody purification
JP7332610B2 (ja) タンパク質の精製条件の決定
Evans et al. Optimization of a micro-scale, high throughput process development tool and the demonstration of comparable process performance and product quality with biopharmaceutical manufacturing processes
Ditto et al. The emerging role of biosensor-based epitope binning and mapping in antibody-based drug discovery
Maes et al. Designing biomedical proteomics experiments: state-of-the-art and future perspectives
Saleh et al. Modeling the impact of amino acid substitution in a monoclonal antibody on cation exchange chromatography
Carrillo-Rodriguez et al. Mass spectrometry-based proteomics workflows in cancer research: the relevance of choosing the right steps
Altern et al. Isotherm model discrimination for multimodal chromatography using mechanistic models derived from high-throughput batch isotherm data
Kalia et al. Proteomics: a paradigm shift
US10376813B2 (en) Determination of chromatography conditions
JP2021523680A (ja) アミノ酸配列改変に基づくタンパク質の特性への影響の決定
Disela et al. Characterisation of the E. coli HMS174 and BLR host cell proteome to guide purification process development
Lietta et al. An experimental and modeling combined approach in preparative hydrophobic interaction chromatography
CN112129868B (zh) 用于通过液相色谱法优化缓冲条件的方法和系统
Marakova et al. Greenness of proteomic sample preparation and analysis techniques for biopharmaceuticals
CN103488913A (zh) 一种用于利用测序数据将肽映射到蛋白质的计算方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230810

R150 Certificate of patent or registration of utility model

Ref document number: 7332610

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150