JP7153131B2

JP7153131B2 - 培養装置の性能を検証する方法

Info

Publication number: JP7153131B2
Application number: JP2021510653A
Authority: JP
Inventors: トビアスグロスコフ; オリバーポップ; トビアスヴァロシャ
Original assignee: F Hoffmann La Roche AG
Current assignee: F Hoffmann La Roche AG
Priority date: 2018-08-27
Filing date: 2019-08-23
Publication date: 2022-10-13
Anticipated expiration: 2039-08-23
Also published as: SG11202101683PA; WO2020043601A1; JP2021534782A; CN112639478A; KR20210035875A; US20210257045A1; EP3844505A1

Description

本発明は、細胞培養の分野、より正確には、高スループットの細胞培養の分野に関する。本明細書では、細胞培養が問題による影響を受けているかどうかを判定するための方法が報告される。実験によって決定されたデータのアライメントまたは／および一貫性の制御は、特にインシリコ代謝モデリングで利用されている。細胞モデルによる代謝フラックス解析を用いることにより、モデルと実験とのフィットに基づいてインビトロデータの一貫性をチェックすることができる。

発明の背景
現代のバイオ治療薬（ｂｉｏｔｈｅｒａｐｅｕｔｉｃｓ）は、癌、糖尿病、または関節リウマチのような複雑な多因子疾患の治療において高まる需要に応えている。ほとんどのバイオ治療薬は、例えば、チャイニーズハムスター卵巣（ＣＨＯ）細胞のような確立された哺乳動物細胞株または大腸菌（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ：Ｅ．ｃｏｌｉ）のようなよく特徴づけられた細菌株で産生される。

細胞株の開発およびプロセスの開発は、特に遺伝子増幅およびクローン選択が必要であるために、細胞ベースのバイオプロセスでは従来から時間がかかり、煩雑であった。このことは、前臨床および臨床評価を受けている多くの薬剤候補に十分な材料を迅速に提供する必要性と対立する。

バイオ治療薬の生産のための細胞株開発のスピードアップは、時間と労力のかかるインビトロおよびインビボでの方法を支えるインシリコ方法の開発に強い推進力を生み出した。

高生産細胞株およびバイオプロセスの徹底的な特徴づけは、前臨床および臨床応用のための多量かつ高品質のバイオ治療薬の頑健で一貫した生産に適したクローンをしっかりと確実に選択するために不可欠である。これには、バイオプロセス開発中に適切な方法を適用して、細胞クローンおよびプロセスの有意義な特徴づけを可能にすることが必要である。

プロセス分析技術（ＰＡＴ）を使用したオンラインプロセスの監視の最近の進歩と、工業的細胞培養における重要な生成物の品質特性への注目の高まりにより、現在利用できるプロセスデータの幅および量は大幅に増加した。

このような豊富なプロセスデータから情報を取り出し、バイオプロセス性能を予測するために、統計モデルに基づく多変量データ分析が、現在適用されている方法の中で優位に立っている（Ｐａｉｓら，Ｃｕｒｒ．Ｏｐｉｎ．Ｂｉｏｔｅｃｈｎｏｌ．３０Ｃ（２０１４）１６１－１６７（非特許文献1）；Ｓｃｈａｕｂら，ｉｎ：ＨｕＷＳ，ＺｅｎｇＡ－Ｐ，ｅｄｉｔｏｒｓ．Ｇｅｎｏｍｉｃｓａｎｄｓｙｓｔｅｍｓｂｉｏｌｏｇｙｏｆｍａｍｍａｌｉａｎｃｅｌｌｃｕｌｔｕｒｅ．ＢｅｒｌｉｎＨｅｉｄｅｌｂｅｒｇ：Ｓｐｒｉｎｇｅｒ．２０１２，１３３－１６３．ｈｔｔｐ：／／ｌｉｎｋ．ｓｐｒｉｎｇｅｒ．ｃｏｍ／ｃｈａｐｔｅｒ／１０．１００７／１０＿２０１０＿９８（非特許文献2））。並行して、いくつかの哺乳動物細胞株について、機構的代謝モデルが開発された（Ｄｉｅｔｍａｉｒら，Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．１０９（２０１２）１４０４－１４１４（非特許文献3）；ＮｏｌａｎａｎｄＬｅｅ，Ｍｅｔａｂ．Ｅｎｇ．１３（２０１１）１０８－１２４（非特許文献4）；Ｐｒｏｖｏｓｔら，ＢｉｏｐｒｏｃｅｓｓＢｉｏｓｙｓｔ．Ｅｎｇ．２９（２００６）３４９－３６６（非特許文献5）；Ｓｅｌｖａｒａｓｕら，Ｍｏｌ．Ｂｉｏｓｙｓｔ．６（２０１０）１５２－１６１（非特許文献6）；Ｓｈｅｉｋｈら，Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．２１（２００５）１１２－１２１（非特許文献7））。このようなモデルは、新たに利用可能なゲノム情報（Ｂｉｒｚｅｌｅら，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．３８（２０１０）３９９９－４０１０（非特許文献8）；Ｂｒｉｎｋｒｏｌｆら，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３１（２０１３）６９４－６９５（非特許文献9）；Ｌｅｗｉｓら，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３１（２０１３）７５９－７６５（非特許文献10））と、定量的な代謝物測定を活用して、細胞外データのみに基づいて、細胞内の状態を包括的に評価することができるため、魅力的である。このように、プロセス開発およびクローン選択においても、そのようなモデルはマイクロバイオリアクターのようなスケールダウン発酵システムともうまく連動する（ＢａｒｅｉｔｈｅｒａｎｄＰｏｌｌａｒｄ，Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．２７（２０１１）２－１４（非特許文献11）；Ｈｓｕら，Ｃｙｔｏｔｅｃｈｎｏｌ．６４（２０１２）６６７－６７８（非特許文献12））。これらのシステムでは、プロセス条件を大規模プロセスなどの制御されたプロセスシナリオに近づけることができるので、より予測的なクローンの特徴づけが提供され、受け入れが進んでいる（Ｐｏｒｔｅｒら，Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．２６（２０１０）４４６－１４５４ａｎｄ１４５５－１４６４（非特許文献13）；Ｒａｍｅｅｚら，Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．３０（２０１４）７１８－７２７（非特許文献14））。

Ｃｈａｒａｎｉｙａ，Ｓ．ら（Ｊ．Ｂｉｏｔｅｃｈｎｏｌ．１４７（２０１０）１８６－１９７）（非特許文献15）は、生産性の高いプロセスの特徴を発見するための製造データのマイニングを開示した。そこでは、最大マージンベースのサポートベクター回帰アルゴリズムと組み合わせたカーネルベースのアプローチを使用して、すべてのプロセスパラメータを統合し、主要な細胞培養性能パラメータの予測モデルが開発された。また、このモデルは、プロセスの結果を予測する際の関連性に応じて、プロセスパラメータを特定し、ランク付けするためにも使用された。

Ｐｏｐｐ，Ｏ．ら（Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．１１３（２０１６）２００５－２０１９）（非特許文献16）は、代謝クローン性能の包括的な特徴づけをサポートするためのハイブリッドアプローチを開示した。このアプローチは、代謝物プロファイリングと多変量データ解析およびフラクソミクスを組み合わせて、目的の細胞表現型に関連する主要な代謝形質のデータ駆動型の機構的解析を可能にした。著者らは、１０の組換えＣＨＯ－Ｋ１生産クローンおよび宿主細胞株のセットで代謝性能を定量化して比較する方法論を適用し、成長および生成物形成をキャプチャするだけでなく、細胞内クローンの生理学およびプロセス中の代謝の変化に関する情報も取り入れたクローンの性能の判定基準の拡張されたセットを得ることができた。これらの基準を使用することにより、定量的なクローンのランク付けが可能になり、比較的高い生成物力価を生じる高生産ＣＨＯ－Ｋ１クローン間の代謝の違いを識別することができた。

国際公開第２０１１／１４００９３号（特許文献1）明細書は、対象における非アルコール性脂肪性肝疾患、非アルコール性脂肪性幹疾患、および／または肝線維症の重症度を評価する方法を開示した。この方法には、対象から身体サンプルを取得し、健康な個体のサンプルと比較した場合のサンプル中の少なくとも１つの酸化脂肪酸生成物のレベルを決定することが含まれる。

国際公開第２０１１／１３６５１５号（特許文献2）明細書は、ごく最近に、ゲノム規模の技術により、哺乳動物細胞におけるタンパク質生成の複雑な生体分子基盤を解明するシステムレベルの解析が可能になったことを開示した。これにより、プロセスの理解が深まり、さらなるプロセスの最適化のための知識ベースのアプローチを演繹することが期待される。この文書は、このような知識ベースのアプローチを使用する合理的な細胞培養プロセスの方法を説明した。

Ｐａｕｌ，Ｗ．ら（ｈｔｔｐｓ：／／ｄｃ．ｅｎｇｃｏｎｆｉｎｔｌ．ｏｒｇ／ｃｃｅｘｖｉ／１６１／）（非特許文献17）は、代謝／プロセスのモデリングおよび結果において新しいアプローチを開示した。彼らは、ハイブリッド代謝モデルが、細胞内代謝フラックス計算および明日の細胞の代謝状態の予測のための新しいアプローチを可能にすることを見出した。これらのモデルは代謝駆動型のプロセス制御を可能にする。人工ニューラルネットワークは、信頼度が高く、２乗平均平方根誤差（ＲＭＳＥ）が約２０％と低い（ＰＯＣ）代謝フラックス値の推定に成功した。

現在の代謝モデルベースの方法は、開発されたモデルに手動で挿入されたデータに依存している。破損したデータ入力が生じ、モデル出力全体に損害を与える可能性がある。仮に実行された場合、外れ値の検出方法は、不規則なデータ構造に依存するが、生物学的関連性およびデータの相互検証には依存しない。

国際公開第２０１１／１４００９３号国際公開第２０１１／１３６５１５号

Ｐａｉｓら，Ｃｕｒｒ．Ｏｐｉｎ．Ｂｉｏｔｅｃｈｎｏｌ．３０Ｃ（２０１４）１６１－１６７Ｓｃｈａｕｂら，ｉｎ：ＨｕＷＳ，ＺｅｎｇＡ－Ｐ，ｅｄｉｔｏｒｓ．Ｇｅｎｏｍｉｃｓａｎｄｓｙｓｔｅｍｓｂｉｏｌｏｇｙｏｆｍａｍｍａｌｉａｎｃｅｌｌｃｕｌｔｕｒｅ．ＢｅｒｌｉｎＨｅｉｄｅｌｂｅｒｇ：Ｓｐｒｉｎｇｅｒ．２０１２，１３３－１６３．ｈｔｔｐ：／／ｌｉｎｋ．ｓｐｒｉｎｇｅｒ．ｃｏｍ／ｃｈａｐｔｅｒ／１０．１００７／１０＿２０１０＿９８Ｄｉｅｔｍａｉｒら，Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．１０９（２０１２）１４０４－１４１４ＮｏｌａｎａｎｄＬｅｅ，Ｍｅｔａｂ．Ｅｎｇ．１３（２０１１）１０８－１２４Ｐｒｏｖｏｓｔら，ＢｉｏｐｒｏｃｅｓｓＢｉｏｓｙｓｔ．Ｅｎｇ．２９（２００６）３４９－３６６Ｓｅｌｖａｒａｓｕら，Ｍｏｌ．Ｂｉｏｓｙｓｔ．６（２０１０）１５２－１６１Ｓｈｅｉｋｈら，Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．２１（２００５）１１２－１２１Ｂｉｒｚｅｌｅら，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．３８（２０１０）３９９９－４０１０Ｂｒｉｎｋｒｏｌｆら，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３１（２０１３）６９４－６９５Ｌｅｗｉｓら，Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．３１（２０１３）７５９－７６５ＢａｒｅｉｔｈｅｒａｎｄＰｏｌｌａｒｄ，Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．２７（２０１１）２－１４Ｈｓｕら，Ｃｙｔｏｔｅｃｈｎｏｌ．６４（２０１２）６６７－６７８Ｐｏｒｔｅｒら，Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．２６（２０１０）４４６－１４５４ａｎｄ１４５５－１４６４Ｒａｍｅｅｚら，Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．３０（２０１４）７１８－７２７Ｃｈａｒａｎｉｙａ，Ｓ．ら（Ｊ．Ｂｉｏｔｅｃｈｎｏｌ．１４７（２０１０）１８６－１９７）Ｐｏｐｐ，Ｏ．ら（Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．１１３（２０１６）２００５－２０１９）Ｐａｕｌ，Ｗ．ら（ｈｔｔｐｓ：／／ｄｃ．ｅｎｇｃｏｎｆｉｎｔｌ．ｏｒｇ／ｃｃｅｘｖｉ／１６１／）

本発明の１つの目的は、インシリコでのモデリングおよび代謝フラックス解析を使用して、問題による影響を受ける細胞培養の特定または決定のための方法、すなわち、実験によって決定されたデータのアライメントおよび／または一貫性の制御のための方法を提供することであった。モデルと実験データとの適合度を決定することにより、問題による影響を受けている培養を特定することができる。この問題は、技術的問題または生物学的問題のいずれかであり得る。技術的問題は、培養を行うために使用されるハードウェアの故障に基づく。生物学的問題は、例えば培養物の細菌または真菌による汚染に起因する細胞自体に基づいている。好ましくは、問題は、培養を実行および／または監視するために使用されるハードウェア、すなわち、プローブ、容器、電子、デバイス、分析などに関連する技術的問題である。

したがって、（確立された）代謝モデルに対する実験データの適合度（ＧｏＦ）を決定することによって培養性能を検証するための方法が本発明において提供される。

本発明によるすべての方法は、以下の第１の一連のステップ：
－組換え異種ポリペプチド、好ましくは抗体を発現する細胞クローンの培養中に取得したプロセスデータを、同じ組換え異種ポリペプチドを発現する同じ細胞に対して生成された代謝モデルを使用してフィッティングするステップ、および
－得られたフィットが未加工データに対して１０％を超えるオフセットを示す場合に、培養が問題による影響を受けていると判定するステップ；
あるいは以下の第２の一連のステップ：
－細胞クローンの培養のプロセスデータを受け取るステップであって、該細胞クローンが前記細胞に対して異種のポリペプチド、好ましくは抗体を産生するステップ、
－前記細胞に対して確立された代謝モデルを使用してデータをフィッティングし、統計的相関法、好ましくはピアソンのカイ二乗検定によって決定されたカイ^２（χ^２とも表記される）値によってそのフィットを特徴づけるステップ、および
－カイ^２値が５よりも大きい場合に、問題による影響を受けているとプロセスデータを特定するステップ
のいずれかを含む。

本発明の実施形態の詳細な説明
定義
本明細書において使用される「フラックス解析」という用語は、生化学的化学量論的反応および経路の数学的検査を意味する。

本明細書において使用される「フラックスバランス解析」という用語、略して「ＦＢＡ」は、所与の目的関数を最大化または最小化するための線形代数による生化学的化学量論的モデルの最適化を意味する。

本明細書において使用される「制約フラックス解析」という用語は、代謝モデルにおける各反応の最大および最小許容フラックス値が規定値を超えないように制約されるフラックス解析を意味する。

本明細書において使用される「ゲノム規模」という用語は、生物の遺伝子の能力の生化学的化学量論的反応への徹底的なマッピングを意味する。ゲノム規模モデルは、生物の配列決定されたゲノム情報から導き出され、文献情報および実験的検証によってさらに精選される。

本明細書において使用される「インプロセス制御」という用語は、培養プロセスを制御し、分析し、解釈するために必要な物理的培養パラメータならびに細胞表現型および代謝型パラメータの連続値（例えば、数分以内の値）または離散値（例えば、毎日１回の値）、量およびレベルを評価するための方法およびアプローチを意味する。パラメータは、この目的のためにオンライン、アットライン、またはオフラインのいずれかで生成することができる。

本明細書において使用される「プロセスデータ」という用語は、速度などの（計算された）結果変数を含む、オンラインおよびオフラインで取得した時間的プロセスパラメータ値の合計を意味する。「プロセスデータ」は、経時的に取得され、アーカイブ、すなわち保存される。本明細書において使用される「プロセスデータ」という用語は、少なくとも、生存度；生細胞密度；生細胞体積；栄養素、例えばグルコース、リン酸、アミノ酸、脂肪酸など、ならびに代謝物、例えば乳酸、アンモニアなどの消費および生成速度；生成物；プロセス関連パラメータ、例えば、物理的パラメータ温度、溶存酸素濃度、ｐＨ、通気速度、反応器質量、追加された補正液、および／または追加された供給などの変数を含む。プロセスデータを形成するプロセスパラメータは分析値であるため、これらには技術的な問題が生じやすい。これらの技術的な問題は、特に、サンプリング、使用された分析装置、または人間が関与している場合にはヒューマンエラーに関連している。

本明細書において使用される「哺乳動物細胞クローン」という用語は、分泌された異種ポリペプチドをコードする核酸でトランスフェクトされており、前記分泌された異種ポリペプチドを発現している哺乳動物細胞を意味する。

本明細書において使用される「代謝フラックス解析」という用語、略して「ＭＦＡ」は、生化学反応にわたる測定されたフラックスの生化学的化学量論的モデルへのマッピング、およびその後のモデル内の全エラーの最小化を意味する。

本明細書において使用される「代謝ネットワーク（再）構築」という用語は、代謝反応ネットワークの構築につながる活性の組合せを意味する。生化学経路情報の収集に加えて、代謝ネットワークの精選および検証が、機能的な代謝ネットワークの再構築を得るために必要である。

本明細書において使用される「多変量データ分析」という用語は、統計的または数学的分析と組み合わせた／統計的または数学的分析に関連する複数のパラメータの観察および分析を意味する。

本明細書において使用される「ネットワークモデル」という用語は、生物の生化学反応ネットワークの数学的表現を意味する。

本明細書において使用される「親哺乳動物細胞」という用語は、分泌された異種ポリペプチドをコードする核酸でトランスフェクトされる前の哺乳動物細胞を意味する。

本明細書において使用される「インプロセス記録データの検証」という用語は、発酵システム内で生成されたデータを測定によって信憑性がるかどうかチェックすることを意味する。

本明細書において使用される「統計的相関法」という用語は、変数の対が互いに、ｉ）関連しているかどうか、およびｉｉ）どれほど強く関連しているかを示すことができる統計的方法を意味する。

本明細書において使用される「ピアソンのカイ二乗検定」という用語は、観測された度数分布が理論分布と異なるかどうかを計算するための方法を意味する。これは相関係数であり、２つの変数の共分散をその標準偏差の積で除算したものである。その結果は、２つの変数ＸとＹの間の線形相関の尺度である。その値は＋１と－１の間であり、１は完全な正の線形相関であり、０は線形相関がなく、－１は完全な負の線形相関である。

モデルの生成
以下のモデルの生成の説明は、単に本発明を実施するために有用な方法の記述を提供するために提供されていることが明確に指摘されている。これは、本発明を例示するために行われるものであって、本発明を制限するためではない。モデル構築のための多数の異なる方法およびアプローチは、当業者に公知であり、本発明による方法においても同様に適用することができる。

本発明による方法は、同じモデルが本発明による方法のすべてのステップで使用される限り、どんな代謝モデルで実行されてもよい。

本発明による方法は、細胞の代謝モデルが利用可能であるか、または標準的な方法によって取得することができる限り、どんな哺乳動物細胞で実行されてもよい。

以下に、本発明による方法において有用な代謝モデルを生成するための例示的な方法が概説される。

ＣＨＯネットワークモデルの構築、フラックス分析、性能測定、および多変量データ分析
Ｐｏｐｐ，Ｏ．ら（Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．１１３（２０１６）２００５－２０１９；また、参照により本明細書に援用される同文献中で引用された参考文献）に報告されたようなアプローチが、本発明による方法で使用されるモデルを生成するための例示的な方法として次に行われる。これは以下に要約され、実施例の項でより詳細に概説される。

５つの区画（サイトゾル、ミトコンドリア、ＥＲ、ゴルジ体、バイオリアクター）を含むゲノムベースのＣＨＯネットワークモデルが、データベースおよび一次文献を含む公開情報源から、確立された手順に従って、以下に概説されるアプローチに基づいて構築された（すべて参照により本明細書に組み込まれる）。

－Ｏｂｅｒｈａｒｄｔら（Ｍｏｌ．Ｓｙｓｔ．Ｂｉｏｌ．５（２００９）３２０）は、ゲノム規模の代謝再構築のアプリケーションを開示した。その中で、モデルの構築および分析のためのいくつかのリソースが存在することが概説されている。著者らによれば、これまで、すべての信頼性の高いゲノム規模の代謝再構築は、４段階のプロセスで手動で構築されてきた。第１に、最初の再構築は、既知遺伝子を機能的カテゴリーにリンクさせ、遺伝子型と表現型の間のギャップを埋めるのに役立つ、ＫＥＧＧおよびＥＸＰＡＳＹなどのオンラインデータベースからの情報と組み合わせた遺伝子アノテーションデータから構築される。第２に、最初の再構築は、一次文献の調査を通じて精選される。次に、再構築は、制約ベースのアプローチによって分析することができる数学モデルに変換される。第３に、再構築は、モデル予測と表現型データの比較を通じて検証される。最後の第４ステップでは、代謝再構築は、ウェットラボおよびドライラボのサイクルに付される。これにより、精度が向上し、主要な仮説の調査が可能になる。

再構築には、配列決定されたゲノムから得られたＢＬＡＳＴ相同性スコアに基づく、半自動化された遺伝子アノテーションデータが含まれ、これはモデル構築中のギャップ分析のために、生物に特有の文献からの詳細な、場合により手作業で収集されたデータで増強されている。それにより、以前にアノテーションされていなかった遺伝子機能が、不完全ではあるが本質的な代謝経路を解析することによって、遺伝子アノテーションの知識に組み込まれる。文献検索によって補完されたギャップ分析プロセスにより、以前は見過ごされていた表現型データが明らかになり、生物に存在する可能性が高いが、対応する遺伝子に現在アノテーションされていない酵素の仮説を立てることが可能になる。このプロセスは、特定の生物で行われた作業を圧縮するのに役立つ。ギャップ分析ステップは、知識ベースとしてのゲノム規模の再構築を、その分析に向けて完全な一揃いのネットワークツールを適用することができる機能モデルとしての代謝ＧＥＮＲＥに変換するためにも重要である。

再構築の努力により、比フラックス、Ｐ／Ｏ比、およびＡＴＰの維持費用などの細胞のパラメータの質の高い推定値が提供され、これらの理論値が、生物学的研究における仮説の構築または検証によく使用されることは一般的である。ホモサピエンス代謝の２つの既存の再構築を除いて、平均の真核生物ネットワークのサイズは、８００、８００、および１３００（それぞれ、代謝物、遺伝子、および反応）である。真核生物ゲノムの全ＯＲＦの６～１３％が、代謝ＧＥＮＲＥに一般に含まれている。

細胞内代謝フラックスは、^１３Ｃ標識グルコース実験の使用を通して決定されることができる。この実験ではケモスタット培養の細胞の増殖の間に標識された炭素が追跡され、計算による方法を用いて、増殖中に炭素が細胞の内部でとった経路が再構築される。代謝ＧＥＮＲＥは、代謝物濃度データを解釈するためのフレームワークとしても使用されている。ある研究では、ハイスループットＧＣ－ＭＳ法を使用して、Ｓ．セレビシエ（Ｓ．ｃｅｒｅｖｉｓｉａｅ）中の５２の代謝物の濃度が決定された。既知の環境条件下での代謝物濃度の違いは、改変Ｓ．セレビシエ代謝ＧＥＮＲＥにマッピングされ、次に、このマッピングは、細胞内の代謝調節のエフェクターを調べるためにトランスクリプトームデータと組み合わされた。トランスクリプトームデータは、特に、タンパク質発現データ、タンパク質－タンパク質相互作用データ、タンパク質－代謝物相互作用データ、および物理的相互作用データなどの他のデータタイプに関連している場合が多い。特に、複数のデータタイプを考慮すると、代謝ＧＥＮＲＥは、データ解釈の貴重なツールになり得る。

代謝ＧＥＮＲＥは、他のシステム、制約、および摂動をその上に重ね合わせることができる低解像度の青写真と見るのが最適である。規制データおよびシグナル伝達データ、ならびにその他の高次システムを制約セットに組み込むことで、代謝ＧＥＮＲＥはますます機敏になり、現実的な細胞表現型を表すようになってきている。

ＦＢＡは、制約ベースのモデリングにおいて最も単純で情報量の多い方法の１つとして、この分野での標準となっており、通常はバイオマス反応を目的とする。ＦＢＡはネットワークを介して代謝フラックス値を予測する。ＦＢＡは特に、１つの最適解しか生成しないが、等しく有効な複数の最適条件が存在することは極めて一般的である。この概念は、フラックス変動解析と呼ばれるＦＢＡの延長線上で検討されてきた。フラックス変動解析は、最適解を１つだけ選ぶのではなく最適解空間全体を調査するが、ＦＢＡ結果の解釈を抑制する重要な注意点がある。

場合によっては、少数の重要なパラメータを知っていることが、代謝および調節のダイナミクスを予測するのに十分であり得ることが示されている。

代謝ＧＥＮＲＥは、インシリコ表現型とインビボデータのさまざまなセットを比較することに検証される場合が多い。モデルをどのように検証すべきかについての標準は存在しない。これは既存のモデルの検証における方法の分散した表現から明らかある。近年、インシリコとインビボの代謝表現型の間で予想される不一致のレベルを定量化するための努力がなされてきた。ある注目すべき研究では、Ｓ．セレビシエの４６５の単一遺伝子変異体が、それぞれ１６の異なる増殖条件下で増殖され定量化された。公開されている２つのＳ．セレビシエ代謝ＧＥＮＲＥの性能の分析により、感受性（非必須遺伝子の総数に対して正確に予測した非必須遺伝子）は約９５％、特異性（必須遺伝子の総数に対して正確に予測した必須遺伝子）は５０～６０％の間であることが明らかになった。これらの数は、さらなる分析で誤りであることが判明したいくつかのインビボ実験の失格によって、約９５～９８％および６９～８６％（それぞれ）と大幅に改善された。

－Ｓｈｅｉｋｈら（Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．２１（２００５）１１２－１２１）は、再構築した代謝ネットワークを開示した。アノテーションされたＯＲＦだけが再構築されたネットワークで説明された。追加の遺伝子産物は、文献の生化学的証拠に基づいて含められた。全遺伝子生成物から、特有の反応が定義された。輸送プロセスも、さらなる反応を説明した。輸送プロセスを数に入れない場合、最大の経路には、アミノ酸、炭水化物、およびヌクレオチド代謝が含められた。これらも炭素および窒素代謝の骨格を構成した。輸送反応のほとんどは、アミノ酸および炭水化物のプロトン結合輸送に関連している。輸送反応の多くは、生理学的考察に基づいて推測される。このようなネットワークは一般的であり、組織または細胞種間の違いを考慮していないことに注意することが重要である。

バイオマス合成の代謝物の排出量は、バイオマス組成に関する文献で入手可能な情報に基づいて計算された。この情報は、ハイブリドーマを含むさまざまな細胞株を調査するさまざまな情報源から収集された。平均細胞組成が計算され、バイオマス方程式の各成分の要件を推定するために使用された：（単位は％、ｗ／ｗ）タンパク質、７４．２；ＤＮＡ、１．６；ＲＮＡ、６．１；炭水化物、４．５；脂質、１０．１。平均アミノ酸組成が構築された。コレステロールは、膜にかなりの量で存在することが知られているため、バイオマス方程式に含まれる唯一のステロイドであった。

成長および非成長に関連するＡＴＰ要件は、文献の推定値であるかまたは文献で入手可能な実験データから計算される。Ｐ／Ｏ比（電子伝達系によって運ばれる電子１ｍｏｌあたりに産生されるｍｏｌＡＴＰ）で表される酸化的リン酸化の効率は、文献データに基づいて２．５とされた。ＡＴＰに関する重合コストは、大腸菌に見出されるものと同じであると仮定された。つまり、以下の高分子の合成および処理のコストは、ｍｏｌＡＴＰ／ｍｏｌで表して、タンパク質、４．３；ＲＮＡ、０．４；およびＤＮＡ、１．４である。アミノ酸、リボヌクレオチド、およびデスオキシリボヌクレオチドの合計に、ＡＴＰのそれぞれのコストを乗算すると、合計コストは、２９．２ｍｍｏｌ／ｇＤＷと計算された。ＡＴＰ収量（ＹｘＡＴＰ）および維持（ｍＡＴＰ）は、総ＡＴＰ生成量が、酸素取り込みおよび乳酸生成の関数として表され得ると仮定して、連続ハイブリドーマ培養から推定した。ｒ_ＡＴＰ＝ｒ_ｌａｃ＋５＊ｒ_Ｏ２、ここでｒ_ＡＴＰはＡＴＰ生成速度であり、ｒ_ｌａｃは乳酸生成速度であり、ｒ_Ｏ２は酸素消費速度である。増殖速度、μを用いる維持エネルギーモデルの加重線形回帰：ｒ_ＡＴＰ＝Ｙｘ_ＡＴＰ＊μ＋ｍ_ＡＴＰは、ｍ_ＡＴＰについて１．５５ｍｍｏｌＡＴＰ／ｇＤＷ／ｈ、Ｙｘ_ＡＴＰについて３７．８ｍｍｏｌＡＴＰ／ｇＤＷ／ｈの推定値をもたらした。したがって、成長関連維持ＡＴＰは、８．６ｍｍｏｌＡＴＰ／ｇＤＷ／ｈと推定された。

所与制約下でのインシリコ成長に必要な反応は比較的少なく、これは代謝ネットワークに含まれる柔軟性を反映している。これらは主に、主要な異化経路（解糖、ＴＣＡサイクル、およびＰＰ経路）、ヌクレオチド代謝、および酸化的リン酸化に関与している。また、バイオマス前駆体の生合成経路での（主に脂質およびヌクレオチド代謝での）反応を削除すると、細胞は成長できなくなる。すべての細胞成分を考慮に入れると、必須反応の数は増加する。また、制御により、実際の細胞では代替経路が実現不可能になる場合がある。しかし、一般的なインシリコ細胞には、さまざまな細胞種の反応が含まれており、これは所与細胞で決して共存しない可能性がある。

しかし、培養動物細胞は、大腸菌およびＳ．セレビシエに類似するオーバーフロー代謝を示し、中枢炭素代謝に共有性がある可能性を示唆する。

動物細胞は、しばしば、高いグルタミン取り込み率、ミトコンドリアのグルタミナーゼによるアンモニアの放出、およびそれによりアラニンおよび／またはアスパラギン酸に生成されるグルタミン酸の部分酸化を特徴とするグルタミノリシスとして公知の第２の特徴を示す。その名前が示すように、グルタミノリシスは、乳酸の生成に似たエネルギー論を基準にして合理化されている。しかし、解糖とは異なり、グルタミノリシスは、ＴＣＡサイクルおよび酸化的リン酸化に依存してエネルギーを生成する。

グルコース、酸素、およびグルタミンの取り込みは、実験で観察される速度に固定されるが、乳酸、アンモニア、グルタミン酸、アスパラギン酸、およびアラニンの取り込みは制約がないままであった。ネズミハイブリドーマはグルタミンを合成することができないため、グルタミンシンセターゼはモデルから除去された。同様に、ハイブリドーマ系統の必須アミノ酸の取り込みは、推定した生合成要求量と同一であり、異化作用がほとんどまたは全くないことを示すため、必須アミノ酸の異化作用反応は除去された。最後に、他の非必須アミノ酸（セリン、アスパラギン、グリシン、およびプロリン）の取り込み速度または生成速度は、モノクローナル抗体の生成速度と同様に実際の速度に固定された。これは、モデリングの人為的結果、例えば、主要な窒素基質としてのグルタミンの代わりにアスパラギンを使用することを防ぐために行われた。

これらのシミュレーションでは、特に非必須アミノ酸の取り込みについて、複数の解が本質的に見出される。これらは多くの経路（例えば、解糖におけるセリン／グリシン、ＴＣＡサイクルにおけるアスパラギン酸／グルタミン酸／グルタミン／、グルタミノリシスにおけるアスパラギン／プロリン）で相互作用するため、非必須アミノ酸に関連するフラックス分布のいくつかの解によって目的関数を達成することができる。

組換えタンパク質の生成は細胞の目的関数ではない可能性が高いとしても、理論上の生成速度と実験上の生成速度を比較することはなお重要である。さまざまな増殖速度のモノクローナル抗体の最大理論生成速度を計算し、実験によって決定した非成長関連値の０．００８４ｍｍｏｌ／ｇＤＷ／ｈと比較した。これらのシミュレーションでは、必須アミノ酸は制約されていなかった。すなわち、それらはバイオマス要件を満たすために自由に取り込むことができた。炭素収支は、グルコースおよび非必須アミノ酸を制約することによって閉じられていた。窒素収支および酸化還元収支は、それぞれ、アンモニア生成速度および酸素取り込み速度を制約することによって閉じられていた。廃棄物代謝は大量の乳酸生成をもたらした。解糖とグルタミノリシスは、炭素とエネルギー代謝の両方において相互作用する。大量の解糖ＮＡＤＨは、乳酸デヒドロゲナーゼによって再酸化される。ＮＡＤＰＨはグルタミノリシスに関与しており、グルタミノリシスでは、グルタミン酸デヒドロゲナーゼ酵によるグルタミン窒素のバイオマスへの同化でＮＡＤＰＨが生成される。ＮＡＤＨとＮＡＤＰＨ代謝の相互作用は、トランスヒドロゲナーゼ反応（Ｅ．Ｃ．１．６．１．２）および両方の補因子を使用することが可能なアイソザイムによって起こる。

－Ｓｅｌｖａｒａｓｕら（Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．１０２（２００９）９２３－９３４）は、大腸菌ｉＪＲ９０４のゲノム規模のインシリコ代謝モデルを使用した。これは、ＤＨ５ａ大腸菌株の挙動を模倣するようにわずかに変更された。このモデルは、７６２の代謝物（外部代謝物を含む）と９３２の生化学反応（輸送プロセスを含む）で構成されている。代謝フラックスを決定するために、Ｓｅｌｖａｒａｓｕらは、化学量論的制約（代謝物の物質収支）と熱力学的制約（反応の可逆性）を受ける代謝ネットワークモデルの制約ベースのフラックス解析を行った。測定されたすべての栄養素および生成物（グルコース、トレハロース、アミノ酸および酢酸を含む）の残留濃度プロファイルを前処理してそれらの比消費量または生成速度を計算し、その後、モデルの容量制約として指定した。酸素取り込み速度および二酸化炭素発生速度は制約されなかった。最後に、増殖期の細胞の目的である細胞増殖速度を、線形計画法（ＬＰ）を使用して最大化し、それによって最適な表現型に対応する一連の代謝フラックス分布が得られた。Ｓｅｌｖａｒａｓｕらは、スタンドアロン型のフラックス解析プログラムＭｅｔａＦｌｕｘＮｅｔを使用してＬＰ問題を解決した。指数増殖期の光学密度値（ＯＤ６００）測定から得られた比増殖速度は、結果を検証するためのインシリコモデルによって予測された細胞増殖と比較された。

発酵培養は、主にＳｅｌｖａｒａｓｕらによって、３つの異なる増殖期：高い増殖速度を特徴とする初期の指数増殖期（第１期、１～３時間）、後期の指数増殖期（第２期、４～６時間）および酢酸塩を主要な炭素源として消費する酢酸塩消費期（早期定常期；第３期、８～１０時間）の間で調査された。インシリコフラックス解析は、３つすべての期で実施された。第１期および第２期の間に測定されたすべての栄養素の比消費速度がランク付けされた。

Ｓｅｌｖａｒａｓｕらの知見は、アルギニン、セリン、グルコースおよびトレハロースなどの感受性の高い栄養素は細胞代謝の機能に重要な役割を果たすため、複合培地中でのこれらの正確な測定の必要性を強調する。そのような測定は、効率的な培地成分を設計するための重要な情報も提供する場合がある。

フラックス分布に基づいて、細胞内での特定の代謝物の消費および生成を分析するために、特定の代謝物の周囲に流入または流出するすべてのフラックスの総和（フラックス合計）が計算された。

Ｓｅｌｖａｒａｓｕらによって報告されたインシリコ代謝モデルは、細胞増殖速度をかなりよく予測したが、補充培地中の他の重要な代謝物を考慮することによって、予測はさらに改善することができる。また、このことは、複合培地条件下で細胞代謝を正確に評価するために、他の主要な代謝物を定義し、正確に測定する必要性も示している。

早期定常期の表現型の状態および代謝挙動は、他の栄養素／生成物の増殖速度および消費／生成速度を実験値に制約しながら、ＡＴＰフラックスを最小化することによって最もよく特徴づけることができる。それにもかかわらず、結果として得られたシミュレートされた代謝フラックスは、シミュレートされた代謝挙動を、遺伝子発現プロファイルから得られる内部フラックスの変化と、または実験によって決定されたフラックスとを比較することによって、定性的または定量的に検証されなければならない。

－Ｓｅｌｖａｒａｓｕら（Ｍｏｌ．Ｂｉｏｓｙｓｔ．６（２０１０）１５２－１６１）は、マウス代謝ネットワークのゲノム規模の再構築について報告した。マウスのゲノム規模の代謝ネットワークは、以前のモデルおよびさまざまなリソースからの関連情報に基づいて体系的に再構築された。

マウス２６の以前の一般的なモデルが、Ｓｅｌｖａｒａｓｕらによって出発点として検討された。最初に、モデルにおいて繰り返される反応または冗長な反応が特定され、除去された。次に、モデルのさまざまなシミュレーションを実行して、異なる炭素源からバイオマスを規定する各細胞成分を生成するその能力を検証した。これにより、Ｓｅｌｖａｒａｓｕらは、ネットワーク内の欠落しているリンクまたはギャップを見つけ出し、その後にいくつかのオンラインリソース（ＫＥＧＧ、ＲＩＫＥＮ、ＭＧＩ、ＢＲＥＮＤＡ、およびＥｘＰａＳｙ）および関連文献から得られた関連する酵素反応および輸送反応をハツカネズミ（Ｍ．ｍｕｓｃｕｌｕｓ）に追加することによってそれらを埋めることができた。さらに、新しいオープンリーディングフレーム（ＯＲＦ）およびＧＰＲの関連に関する情報も含まれていたため、モデルの範囲は大幅に拡大している。

Ｓｅｌｖａｒａｓｕらの再構築されたゲノム規模のマウスネットワークの視覚化および統計解析は、すべてネットワーク分析ソフトウェア、ＢｉｏＮｅｔＭｉｎｅｒ（ｈｔｔｐ：／／ｂｉｏ．ｎｅｔｍｉｎｅｒ．ｃｏｍ）を使用して実行された。大規模なマウスネットワークは、ＢｉｏＮｅｔＭｉｎｅｒ埋め込みグラフレイアウトアルゴリズム、Ｆｏｒｃｅ－ＤｉｒｅｃｔｅｄＫａｍａｄａ－Ｋａｗａｉ、およびＧＥＭによって効率的に視覚化され得る。その上、高度に連結された代謝物と架橋代謝物を、度数および媒介中心性をそれぞれ使用して特定することによって、ネットワークトポロジーを統計的に解析することができる。

再構築されたゲノム規模の代謝ネットワークが化学量論的にバランスが取れていれば、制約ベースのフラックス解析を利用することにより、モデルの予測能力を定量的にも定性的にも調べることができる。最初に、細胞増殖期の定常的な仮定の下では、細胞のバイオマス生成は、細胞増殖表現型を定量化するために最大化される、妥当な細胞の目的として考えることができる。次に、得られる増殖速度を実験的に観察された比増殖速度と比較する。その後、最少培地要件および遺伝子欠失解析をシミュレートすることにより、モデルを定性的に評価することができる。最小栄養成分は、培地から消費されたすべての基質の総和を最小化することによって決定することができる。決定された最小培地条件下で、細胞増殖を最大化し、各反応フラックスをゼロになるように制約した。反応および対応する遺伝子は、除去するとゼロ成長となった場合に、必須であると見なされた。同様に、細胞増殖条件下で各代謝物のフラックス合計を強制的にゼロにすることにより、必須代謝物を同定することができる。最後に、マウスの代謝の機能的構成は、遺伝子／代謝物の必須性と、ネットワークの構造的特徴とのその相関に基づいて調べることができる。これらの線形最適化の問題はすべて、ＭｅｔａＦｌｕｘＮｅｔおよびＧＡＭＳ／ＣＰＬＥＸ１０．０によって解決された。

マウス２６の以前のモデルと比較して、Ｓｅｌｖａｒａｓｕらは新しく４９０の反応を追加し、遺伝子－タンパク質反応（ＧＰＲ）関連に関する最新情報と、脂質、アミノ酸、炭水化物およびヌクレオチドの代謝に関する詳細な説明を提供した。このモデルは、７２４の遺伝子、７１５の酵素、１１６２の内部代謝物、および１４９４の反応で構成され、１２４６の反応はサイトゾル（１０８５）およびミトコンドリア（１６１）内の生化学変換であり、２４８の反応は、細胞内膜と細胞外膜間（１７１）およびサイトゾルとミトコンドリア間（７７）の代謝物輸送を説明する交換反応である。生化学反応に加えて、Ｓｅｌｖａｒａｓｕらは、タンパク質、脂質、炭水化物、ＤＮＡ、ＲＮＡ、および他の細胞成分のような生合成前駆体のドレインからの細胞バイオマスをその実験組成およびそれらの変換および構築のための関連するエネルギー補因子で表現するための１つのバランス式を導出した。再構築プロセスの間に、シミュレーション結果が定量的にも定性的にも実験的観察と一致するまで、モデルの一貫性、正確性、完成度をチェックすることにより、結果として得られるネットワークの手動キュレーションが反復的に実行された。これにより、Ｓｅｌｖａｒａｓｕらはモデルを改良するための知識ギャップを見出すことができた。

マウスモデルの予測能力は、プロリン、アスパラギンおよびアスパラギン酸を添加したＤＭＥＭ培地で増殖させた、抗Ｆモノクローナル抗体を産生するマウスハイブリドーマ細胞のバッチ培養データに基づく制約ベースのフラックス解析を使用して試験された。バイオマス生成は、培養中の栄養素／生成物の測定された比消費／生成速度を制約する細胞増殖条件をシミュレートするために最大化された。得られた増殖速度（０．０４８ｈ^－１）は、バッチ培養全体の平均比増殖速度（０．０３６２ｈ^－１）よりも高かった。Ｓｅｌｖａｒａｓｕらは、インシリコシミュレーションに関連する測定値を使用して、指数増殖期のより現実的な運用条件を反映させることで、増殖予測を改善することができると考えた。

定性的モデル予測のために、Ｓｅｌｖａｒａｓｕらは、細胞増殖のための最小培地要件についてインシリコ解析を行い、最終的に必要な培地成分を特定した。Ｓｅｌｖａｒａｓｕらは、必須アミノ酸、葉酸およびリン酸を含めた。これらは実験的に観察された必須成分および実験動物の栄養要件とほぼ一致する。しかし、インシリコ解析では、一部の最少培地成分、例えば増殖因子、補因子、およびミネラル（ビオチン、チアミン、ビタミン、カルシウムおよびマグネシウムイオンなど）などを特定することができなかった。当然のことながら、予測されたマウス細胞の増殖は、グルコースの取り込みだけの影響を直接受けたわけではなかった。代わりに、それは必須アミノ酸の取り込みによって決定されたため、グルコースが不足しているか制限されている条件下では、微生物細胞とは違って、哺乳動物系は必須アミノ酸のような他の栄養素を利用することによって生き残ることができるという以前の観察が確認された。

遺伝子必須性解析によっても、Ｓｅｌｖａｒａｓｕらは、新しいマウスモデルを反復的に検証し、改善することができた。現在および以前のモデルを使用して予測されたすべての必須遺伝子は、ＫＯＭＰ（ＫｎｏｃｋＯｕｔＭｏｕｓｅＰｒｏｊｅｃｔ）データベースの実験によって報告された必須遺伝子と比較された。ほとんどのインシリコ必須遺伝子は実験によって確認されたが、Ｓｅｌｖａｒａｓｕらは、いくつかの誤検出予測も見出した。このような情報をモデルに新たに含めて、予測を改善することができる。

再構築されたモデルの特徴的な機能は、構造的および機能的な観点から調査された。まず、統計的ネットワーク分析により、弱い連結反応の大規模クラスター（全反応の８９％）と、１～１７の連結反応を有する１１９の小さなクラスターが特定された。次に、Ｓｅｌｖａｒａｓｕらは、ネットワークの直径を計算し、一方、補因子代謝物（例えば、ＡＴＰ、Ｈ_２Ｏ、ＣＯ_２など）は、ネットワークの主要なハブとしてそれらを特定する生物学的に無意味な結果を防ぐために除外された。結果として得られた、大規模クラスターのネットワークの直径は４０と測定された。平均経路長（ＡＰＬ）も８．５１と計算され、ネットワーク内の代謝物のほとんどが、ほぼ３Ｂ４の反応によって相互間で変換され得ることが明らかになった。同様の分析が、以前のモデルから大幅に改善された３つの主要なサブネットワーク、炭水化物、アミノ酸および脂質代謝について行われ、その結果さまざまなネットワーク直径およびＡＰＬが得られた。

Ｓｅｌｖａｒａｓｕらは、代謝物の度数および媒介中心性を計算することによりネットワークトポロジーも調査し、したがってネットワーク内の高度に接続された重要な（橋渡しの）成分を特定した。Ｓｅｌｖａｒａｓｕらは、必須代謝物とその中心性スコアを比較することによりネットワークのトポロジー特性をさらに調査した。細胞増殖の必須代謝物は、フラックス合計アプローチを使用して得られた。必須代謝物の平均中心性スコア（度数：６．３７および媒介中心性：０．００１９８）は、非必須代謝物のスコア（度数２．５５および媒介中心性：０．０００３９）よりもはるかに高いことが観察された。予想外に、代謝物の中心性は代謝物の必須性と明確に相関していなかった。

Ｓｅｌｖａｒａｓｕらは、限定培地での細胞増殖用の一連の必須遺伝子を特定した。最初に、単一遺伝子反応の関連は、富栄養培地（ＲＭ）ならびに最小培地（ＭＭ）条件下で遺伝子欠失解析を実行することを想定した。ＲＭ条件下の１０９の必須反応のうち、９３は遺伝子関連、６は非遺伝子関連、１０はアミノ酸の輸送のための反応であった。興味深いことに、必須反応のうち最も高い割合（５９％）は脂質代謝（脂肪酸生合成および脂肪酸代謝）によるものであり、それが環境外乱に対して最も脆弱なサブシステムの１つでありうることが示されている。ＭＭ条件下でのさらなる６つの反応は、アミノ酸（５）および炭水化物（１）の代謝によるものである。ＧＰＲの関連を考慮した場合、現在のゲノム規模のモデルには多くのアイソザイムおよび多機能タンパク質が存在するため、７２の必須遺伝子のみが特定された。例えば、多機能タンパク質の一つである脂肪酸シンターゼ（ｆａｓＮ）は、単独で脂質代謝の３７の反応を触媒したが、他の遺伝子またはタンパク質は、代謝ネットワークの少なくとも２以上の反応に関連している。

必須反応の割合（１０％）が低いということは、マウスの代謝が、代替経路によって同じ表現型を得るために内部変化に対して非常に柔軟で頑健であることを意味し、それにより、２つの反応／遺伝子が必須でなくなり、ネットワークが柔軟になる。このような組合せ遺伝子／反応を調査する観点で、Ｓｅｌｖａｒａｓｕらはダブルノックアウト解析を行った。９．５＊１０^６組以上の１３８５の非必須反応から、Ｓｅｌｖａｒａｓｕらは１１４の特有の反応を含む１３９組の致命的な反応しか特定することができなかった。最も必須な組は次の２つのカテゴリーに属する：（ｉ）同じ代謝物を生成する２つの反応、および（ｉｉ）同じ代謝物を生成し消費する後続の２つの反応。同様の分析がうまく適用され、Ｈ．ピロリの機能的特徴が解明された。その結果、細胞の頑健性が実証され、創薬ターゲットを特定するための複数の欠失解析が示唆される。

本発明を実証するために使用される例示的なモデル（以下の実施例の項の材料および方法を参照）では、中心代謝経路（解糖、クエン酸サイクル、ペントースリン酸経路、呼吸鎖）に加えて、主要なバイオマス構成要素（タンパク質、脂質、ＲＮＡ、ＤＮＡ、炭水化物）の生合成、Ｃ_１－代謝、およびアミノ酸分解経路が含まれている。組換えタンパク質生成物形成の調査のために、組換えタンパク質のアミノ酸組成および代表的なグリコシル化構造（生成物分子あたり２つのシアル酸付加された（ｓｉａｌｉｌａｔｅｄ）二分岐グリカン）を説明する、対応する一組の生成物形成反応を定式化した。結果として得られたモデルは、６５４の反応、５８３の代謝物を含み、２６６のＯＲＦを表した。バイオマス組成は、ＣＨＯ細胞またはマウス細胞株に関する以前の研究に匹敵するものが選択された（例えば、Ａｌｔａｍｉｒａｎｏら，Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．１７（２００１）１０３２－１０４１；Ｂｏｎａｒｉｕｓら，Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．５０（１９９６）２９９－３１８；Ｓｅｌｖａｒａｓｕら，Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．１０９（２０１２）１４１５－１４２９）。

モデルの再構築およびモデルのシミュレーションは、市販のソフトウェアパッケージを使用して実行された。モデルの検証では、元素収支および電荷収支がすべての反応で閉じられていることが確認された。さらに、フラックスバランス解析（例えば、ＳａｖｉｎｅｌｌおよびＰａｕｌｓｏｎ，Ｊ．Ｔｈｅｏｒ．Ｂｉｏｌ．１５４（１９９２）４２１－４５４および４５５－４７３参照）を使用して個々の経路の機能性が検証された。ＣＨＯ発酵中に収集された時系列の転写データは、ネットワーク内の（不）活性代謝経路を描写するのに役立ち、優勢なアイソザイム種の特定を支援した。

細胞の取り込み速度および生成速度の推定は、最初に発酵プロセス全体を生理学的に異なるプロセスフェーズに細分化することによって実行された。これは、例えば、プロセスフェーズの最適な数がχ^２ベースの適合度検定を使用して決定される、計算最適化手順によって実行され得る。各プロセスフェーズの間に、一定の細胞生理が想定され、バイオマス特異的速度が一定であることを意味していた。これらのバイオマス特異的速度は、非線形回帰を使用して決定された。結果として得られる取り込み速度および生成速度は、代謝フラックス解析を実行するための入力として役立つ場合がある（例えば、Ｍａｉｅｒら，Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．１００（２００８）３５５－３７０；Ｎｉｋｌａｓら，Ｃｕｒｒ．Ｏｐｉｎ．Ｂｉｏｔｅｃｈｎｏｌ．２１（２０１０）６３－６９；Ｓｔｅｐｈａｎｏｐｏｕｌｏｓら，１９９８，Ｍｅｔａｂｏｌｉｃｅｎｇｉｎｅｅｒｉｎｇ：Ｐｒｉｎｃｉｐｌｅｓａｎｄｍｅｔｈｏｄｏｌｏｇｉｅｓ．ＳａｎＤｉｅｇｏ：ＡｃａｄｅｍｉｃＰｒｅｓｓ参照）。計算されたフラックス分布の熱力学的一貫性が確認された。

代謝物データ、プロセスデータ、および細胞内フラックス分布のピアソン相関とスピアマン相関の計算は、市販のソフトウェアパッケージ（以下の実施例の項の材料および方法を参照）を使用して実行された。

本発明の実施形態
機構的代謝モデリングは以下の場合に有用であり得る：
－高産生クローンの効率的かつ迅速な選択／評価、
－培地組成、供給体制、およびプロセスパラメータの調節／最適化による体積力価の増加、
－培地組成、供給体制、およびプロセスパラメータの調節／最適化による生成物の質の向上、および／または
－高スループットデータおよび圧縮の、読み取りおよび解釈可能な形式への統合。

機構的モデリングにより、細胞内代謝フラックス（ＭＦＡ）およびその最適化（ＦＢＡ）の時間分解能および分析が可能になる。機構的モデリングの全体的な目標は、自動化されたＣＨＯ細胞性能分析のための高スループット方法であり、それによりプロセスの最適化および／またはクローンの選択が可能になる。

しかし、この方法では、有用かつ信頼性の高い結果／読み出しを得るために、信頼性が高く一貫した入力（未加工）データが必要である。

今回、本発明者らが見出したのは、機構的代謝モデリングは、次のような高スループット培養データの品質管理にも使用することができることである。
－培養実行中の技術的な問題、例えば、プローブのシャットダウン、センサドリフト、パイプの詰まり、インプロセス制御解析エラー、オフライン解析エラー、培地調製の問題などの特定、
および／または
－プロセス制御における前処理／データ一貫性のチェック。

したがって、本発明は、任意のインプロセスおよび最終培養データについて、効率的で、一貫性があり、場合によりユーザーに依存しないデータ一貫性チェックのための方法を含む。本発明による方法は、高スループット用途に特に適している。

ここでは、一般的なモデル、すなわち、例えば、インライン、アットラインおよびオフラインのさまざまな異なるデータからの発酵データの効率的なデータ統合ならびに解釈および／またはデータ解析のポイントとして、すべてのＣＨＯクローンおよびＣＨＯベースのプロセスならびに大腸菌クローンおよび大腸菌ベースのプロセスに使用することができるモデルの使用が報告されている。このモデルは、データのクロスチェックが可能であり、データの自由度を低下させる（「その値は意味があるか？」）。データの不適合度（lack-of-fit）は、破損した／不一致のデータソース（複数可）（例えば、欠陥センサ、欠落データ、ヒューマンエラーなど）を特定するために使用される。これにより、より信頼性が高く、より効率的かつ迅速な高産生クローンの特定および／または選択および／または評価のための機構的代謝モデリング；培地組成、供給体制、およびプロセスパラメータの調節／最適化により体積力価を増加させるためのスクリーニングプロセス；培養中の技術的問題の特定（例えば、プローブのシャットダウン）、ＩＰＫ分析；高スループットデータおよび圧縮の、読み取りおよび解釈可能な形式への統合；信頼性の高い知識の生成；または／およびプロセス制御における前処理／データ一貫性チェックを使用することが可能になる。

一例では、すべて同じ組換えモノクローナルＩｇＧ４抗体を安定して発現する、さまざまなＣＨＯ－Ｋ１細胞クローンが使用された。包括的な代謝プロファイリングを実行するために、培地を毎日サンプリングした。

培養全体にわたる代謝細胞の性能を詳細に評価するために、ＣＨＯ代謝ネットワークモデルが用いられた。各培養は、以下の表１に示されるように、生理学的および代謝的に異なる５つのプロセスフェーズ、第１期（Ｐｈ１）から第５期（Ｐｈ５）に細分化された。細胞取り込みおよび生成速度は、実施例１に記載されるように決定された。

（表１）例示的な代謝モデルに用いられた宿主細胞株（ＨＣＬ）および組換えＣＨＯクローンの代謝フェーズ。ＨＣＬおよび組換えＣＨＯクローンの異なる代謝フェーズが特定された（ＨＣＬおよび１０クローン、３データセット）。

このステップには、供給およびサンプリングイベントを含むプロセス全体の物質収支が含まれていた。各プロセスフェーズについて、細胞内フラックス分布を、ネットワークモデルを使用して計算した。細胞生理学の経時的変化を考慮し、エンドポイントデータのみに依存しないことにより、これは各細胞／クローン／フェーズの包括的な特徴づけをもたらした。

正規化されたスコアを使用することにより、指標の種類（細胞外濃度測定、取り込み速度、細胞内フラックスなど）を組み合わせたスコアリングスキームに統合することができる。その上、時系列データの入手可能性に基づいて、個々の指標の最も関連性の高いプロセスの部分での定量化は、経時的なスコアを割り当てることによって可能となった。例えば、速い細胞増殖はプロセスの早い段階でより重要であると点数が付けられたが、高い比生産性は６日目以降、すなわち、高い細胞数が確立され、生成物形成の大部分が行われた後に特に注目された。

合計で約４０の異なる指標が定義され、組換えタンパク質とバイオマスの形成および代謝効率に関するＣＨＯ細胞とクローンの代謝性能が特徴づけられた（以下の表２を参照）。

（表２）定義された代謝性能の指標。ＣＨＯネットワークモデルによって計算された選択された代謝性能パラメータをクラスタリングすることにより、６つの代謝性能基準がＣＨＯ代謝の主要な特徴として定義された：「生成物形成」、「細胞増殖」、「乳酸形成」、「アンモニウム形成」、「代謝クローン効率」、および「呼吸」。ランク順は、性能指標の高レベル（「１」）または低レベル（「０」）のどちらが優先されるかを示す。

関心のある特定の形質は、２以上の指標（例えば、ハイエンドの力価および高い比生産性の両方が優れた生産クローンに望ましいであろう）によって特徴づけられたため、関連する指標は、異なるカテゴリー：生成物形成、細胞増殖、乳酸形成、アンモニウム放出、呼吸代謝、および代謝クローン効率に分類される。

クローンの特性評価に適したモデルは、いくつかの要件を満たす必要がある。（ｉ）性能判定基準のためのクローン間の高感度の識別、（ｉｉ）クローン形質の包括的な特徴づけ、および（ｉｉｉ）培養実行の通常の変動を平準化するための評価手順の頑健性。

第１の目的に関して、生成物力価および細胞増殖は、クローン性能の高感度の尺度として日常的に機能している。変動係数を分散の尺度として使用すると、「代謝クローン効率」のカテゴリーも高感度のクローン特徴づけ基準に貢献したが、乳酸形成および呼吸代謝はあまり情報価値がなかった。それにもかかわらず、それらは、特に大規模でプロセス性能に大きな影響を与える細胞特性を反映するため、包括的なクローンの特徴づけに貢献する。

細胞外代謝物データならびに細胞内フラックス分布は、生成物力価、生存細胞密度の積分（ＩＶＣＤ）、および比生産性だけでなく、バイオマスおよび生成物形成の炭素収量、細胞内グルタミンシンセターゼの速度、および維持のための予測ＡＴＰ要件をはじめとする代謝細胞性能の事前に定義された尺度を計算するのに役立った。

したがって、このモデルは、ＣＨＯ培養の詳細な代謝分析を利用した経験に基づいている。これは、組換えＣＨＯクローンおよびプロセス変動の機構的特徴づけおよび同定のための統合的なマルチレベルワークフローである。より具体的には、このモデルは、シェーカーフラスコまたはマルチウェルプレートでの小規模培養に適用可能である。同様に、制御された多重小規模バイオリアクターおよび詳細な高スループット分析を、プロセスパラメータ、主要な代謝性能マーカー、および重要な生成物の品質特性を決定するために使用することができる。

本発明では、代謝ネットワークシミュレーション環境が、ＣＨＯクローンの特徴づけおよび高スループットデータ検証に適用される。

ひとたび確立され、インシリコで細胞プロセスをミラーリングするために適切であることが証明された、細胞外測定値（例えば、２－オキソグルタル酸塩、５－オキソプロリン、酢酸塩、β－アラニン、β－Ｄ－グルコース、β－メチルノルロイシン、バイオマス、酪酸塩、コリン、クエン酸塩、ＣＯ_２、Ｄ－グルコン酸塩、Ｄ－マンノース、エタノールアミン、蟻酸塩、フマル酸塩、ＧＡＢＡ、グリシン、Ｈ２Ｓ、カリウム、Ｌ－アラニン、Ｌ－アルギニン、Ｌ－アスパラギン、Ｌ－アスパラギン酸塩、Ｌ－シトルリン、Ｌ－システイン、Ｌ－シスチン、Ｌ－グルタミン酸塩、Ｌ－グルタミン、Ｌ－ヒスチジン、Ｌ－イソロイシン、Ｌ－乳酸、Ｌ－ロイシン、Ｌ－リジン、Ｌ－メチオニン、Ｌ－オルニチン、Ｌ－フェニルアラニン、Ｌ－プロリン、Ｌ－セリン、Ｌ－トレオニン、Ｌ－トリプトファン、Ｌ－チロシン、Ｌ－バリン、ミオ－イノシトール、Ｎ－アセチルプトレッシン、Ｎ１－アセチルスペルミジン、Ｎ１－アセチルスペルミン、Ｎ８－アセチルスペルミジン、ナトリウム、Ｏ_２、リン酸、オルトリン酸、生成物、プトレシン、ピルビン酸塩、スペルミジン、スペルミン、コハク酸塩、硫酸塩、ウリジンなど）に基づいて細胞内生化学反応をシミュレートするために使用される同じ機構的モデルは、新しい培養データセットのプロセス中に記録されたデータの検証または／および一貫性チェックに使用することができることが見出された。

既存の代謝モデルを使用してフィッティングされた高スループットスクリーニング（ＨＴＳ）インプロセスデータは、モデルフィットの質の偏差が不規則に大きいこと、すなわち、モデルに基づいて計算されたフィッティングされた線が実験データから大きく逸脱していた、すなわち、不良にフィッティングされたことを示した。このような不良なフィットには、クローンの分散、データの（不）一貫性、技術的な問題など、さまざまな理由が考えられる。

これらの理由のうち、技術的な問題が最も危険であり、それによって潜在的に適しているクローンが廃棄される。とりわけ、技術的な問題は、例えば、オフガス（ＣＯ_２、Ｏ_２）が発生しない、培養中のｐＨセンサのドリフト、パイプが詰まっていてポンプが作動しているにもかかわらず供給が追加されない、デブリが測定されていない、代謝物（例えば、有機酸およびその前駆体、ポリアミンおよびその前駆体、糖類およびその前駆体、活性化糖類およびその前駆体、ヌクレオチドおよびその前駆体、ヌクレオシドおよびその前駆体、酸化還元等価物およびその前駆体、酸化還元活性化合物およびその前駆体、脂質およびその前駆体、内因性宿主タンパク質など）が測定されていない、サンプル図面がない、バイオマスまたは代謝物の測定が不正確である、誤った値になる解析誤差などであり得る。

図１では、不完全な供給データに起因する例示的な技術的問題の影響が示される。図１Ａでは、不完全な供給データに基づく培養の分析が示される。図１Ｂでは、完全な供給データによる同じ培養の分析が示される。不完全なデータのために、結果として得られる、代謝モデルに基づくフィットが不良であることがはっきりと分かる（不良なモデルフィットは、モデル化されたフィット（線）と未加工データ（箱）のオフセットで示される）。データを疑ったり確認したりするまでもなく、これは、それぞれのクローンがうまく動作していないことを示唆する。しかし、実際にはデータ入力に誤りがあった。すなわち、間違ったグルコース濃度が入力されていた。データの一貫性についてデータのチェックが実行されないならば、この問題は発見されないことになる。

一般に発酵データセットは２週間に及び、オンラインの約１５のパラメータおよびオフラインの約３０のパラメータの毎日のデータポイントを含む。このプロセスデータセットは、細胞クローンの生物学的分散ならびに用いる装置および培養方法のプロセスの分散の影響を受ける。

生物学的分散は、例えば、バイオマス蓄積、生成物形成（速度）、栄養消費（速度）、廃棄物形成（速度）、または細胞生存度の頑健性におけるクローン間の差異が原因である。

プロセスの分散は、許容範囲内での技術的変動、例えば、開始濃度、容器サイズ／形状、温度、撹拌速度および均一性、ガス化、供給、質量／体積バランス、その上／補正剤の添加／量などの技術的変動を反映している。

生物学的および技術的分散の組合せは、プロセスデータに反映される。

信頼性の高い代謝モデルの生成には、広範囲のクローン、生成物、規模、データ密度、宿主細胞株、および培養プラットフォームで得られた入力データが使用される。

データの質の評価に使用される例示的なデータセットが以下の表３に示される。

（表３）モデル開発のための５１の異なる培養実験（バッチ）の概要表。「ＨＣＰ」：宿主細胞タンパク質；「＋」：データあり；「－」：データなし；「ｎａ」：宿主細胞株（複数可）が生成物を生成していないため、該当しない。

上の表に示すような再現を用いて、モデルを訓練し、採用した。これにより、不一致のある実行を特定することが可能であった。分析は、図２の実行９、１４、および５１について例となるように示されている。

発酵５１は、一部のデータポイントが１：１の線からずれていることから、モデルと矛盾していることがわかる。この１：１の線からのオフセットは、それぞれのパラメータのデータの一貫性が悪いことを示している。

この分析は、複数の発酵のために再度行われている。それぞれのデータおよびその相関関係を図３に示す。高いχ^２（カイ＾２）値＞５または０に近い値（例えば、＜０．１）である発酵は、それぞれの使用されたモデルバリアントで失敗した。特定の実行は、培養されたクローンに基づくのではなく、実験的技術的欠陥に基づく不一致を示すことが分かる。

この説明に限定されるものではないが、一部の不一致は、データポイントの数が限られていること（培養フェーズごとに３未満、または全体で６未満）、オンラインまたはアットラインの分析装置の技術的な問題、あるいはオフガス分析によるＨＣＰ（宿主細胞タンパク質）またはＯＵＲ（酸素取り込み速度）の決定のエラーが原因である。

本発明による方法は、不一致の、すなわち間違った入力データを特定するために使用することができる。これは、誤ったオフガス測定により、実験とモデル予測との間に偏差が生じた、以下の実施例に示される。

カイ^２値は、それぞれのパラメータのモデルと実験の間のフィットの質を決定するために使用される。この分析により、１つを除くすべてのシナリオで、カイ^２値が同じ範囲にあることが明らかになった。例外的なシナリオでは、酸素取り込みの測定値は解析に含まれていた（表４参照）。これらのデータの不適合度は、根本的な理由を特定することによって解決することができ得る。この不一致を解決した後、カイ^２値は、調査したすべてのシナリオで許容可能であった。

（表４）シナリオごとに分析されたカイ^２値の中央値。シナリオ「モデル１」には、誤っている精選されたＯＵＲデータを含むデータセットが使用された。他のすべてのシナリオでは、精選されたＯＵＲデータセットが使用された。

ＯＵＲデータが間違っているシナリオ「モデル１」のカイ^２値から、モデルと実験との間に不良なフィットがあることが分かる。修正データを使用した場合に、許容可能なモデルフィットが得られる。

酸素は動物細胞の代謝における重要な基質である。酸素取り込み速度（ＯＵＲ）は細胞の活性の優れた指標であり、一部の条件下でも生細胞の数の優れた指標であることが報告されている。ＯＵＲの測定は多くのさまざまな理由で困難である。特に、比消費速度が非常に低いこと（０．２×１０^－１２ｍｏｌ細胞ｈ^－１）、溶存酸素濃度の変動に対する細胞の感受性、および細胞を損傷することなく酸素を提供することの困難さは、ＯＵＲの測定方法の開発のために考慮に入れなければならない問題である。液相かまたは反応器全体の周囲のいずれかの酸素収支に基づく、溶存酸素の濃度が変わりやすいかまたは安定しているさまざまな溶液が報告されている。ＯＵＲを決定するために、次の２つのアプローチのうちの１つが一般に使用される。酸素物質収支を書くために、反応器全体（方程式（１））または液相のみ（方程式（２））を考慮することが可能である：

（Ｒｕｆｆｉｅｕｘ，Ｐ－Ａ．ら，Ｊ．Ｂｉｏｔｅｃｈｎｏｌ．６３（１９９８）８５－９５参照）。

したがって、ＯＵＲは直接測定可能な値ではない。これはさまざまな追加の変数に依存し、計算を必要とする。

現在のケースで入力データを見直すことにより、計算に使用された数式に誤り（間違った因数１０００）が含まれていたことがわかった。本発明による方法に基づいてそれを同定した後、データを精選された式で再処理し、表４（上記参照）に示されるように改善されたカイ^２値が得られた。

本発明による方法は、一方では、上記で概説したようにデータ生成中の技術的および運用上の問題を特定することができ、また、入力データおよび計算データの正確性を検証することもできる。これにより、決定されたデータが実際にはそれぞれのクローンの特性、すなわちその表現型であり、技術的または運用上のエラーによるものではないことが確認される。これは以下の例に示される。

２つのクローンを同じ培養条件下で培養した。生細胞密度はクローン１とクローン２の間で同等であったが（図４Ａ参照）、培養培地中の乳酸濃度は異なっていた（図４Ｂ参照）。ここで、クローン２で観察された低い乳酸レベルが信頼できるかどうか、したがってクローンの遺伝子型／表現型の特性が信頼できるかどうかが疑問視される可能性がある。本発明による方法を使用することにより、第２のクローンの表現型が技術的な逸脱または問題によるものではなく、データによって正しく反映されていることを確立することができる。これは、対応する代謝モデルを使用する分析によって例証される。すべての代謝フェーズ１～５の良好なモデルフィット（調整された速度とブラックボックス速度が一致、図５参照）は、測定された速度の実現可能性を示している。低レベルの乳酸は、機構的代謝モデリングによって有意義に説明することができる。

したがって、本発明は、
－細胞クローンを選択／評価する、
－培地組成、供給体制、およびプロセスパラメータの調節／最適化により細胞クローンの体積力価を増加させる、
－培地組成、供給体制、およびプロセスパラメータの調節／最適化により生成物の質を向上させる、
－培養の実行またはインプロセス制御分析中の技術的問題を特定する、
－プロセス制御における前処理／データ一貫性をチェックする
ための方法を含む。

これらの方法の本質的な要素は同じである：それぞれの細胞株の機構的モデルへのフィットを使用してデータセットを制御する。

本発明の目的は、本明細書に概説されているように、独立した請求項および態様に規定される、培養プロセスデータが技術的問題による影響を受けているかどうかを判定するための改良された方法を提供することである。本発明の実施形態は従属請求項に記載されている。本発明の実施形態は、相互に排他的でなければ、互いに自由に組み合わせることができる。

細胞を培養する間、例えば副生成物を生成するために、経時的な、すなわち時間的なプロセスデータが取得され、アーカイブされる。このプロセスデータは、オンラインおよびオフラインの時間的プロセスパラメータの合計である。したがって、プロセスデータは、それぞれのプロセスパラメータおよび結果変数、例えば特定の速度などの時間力学を反映する。結果変数は、例えば、変形、正規化、統合、および欠測値の計算を伴う前処理ステップで取得される場合が多い。

培養装置は、一般に自動制御システムおよびデータロギングシステムを備えており、これにより、取得したプロセスデータはオンラインで電子的に記録され、アーカイブされる。取得したオンラインプロセスパラメータには、制御パラメータおよび制御動作パラメータが含まれる。制御パラメータには、溶存酸素（ＤＯ）、ｐＨ、および特定のレベルに制御される容器温度（例えば、３７℃の容器温度）などのパラメータが含まれるのに対して、制御動作パラメータには、コントローラーの応答、ＤＯを制御するための空気および酸素の散布速度、ならびにｐＨを制御するための塩基添加および二酸化炭素散布速度などのパラメータが含まれる。容器容積およびオーバーレイガス流量などの他の重要なパラメータもオンラインで取得される。体積酸素取り込み速度（ＯＵＲ）は約４時間ごとに推定されるが、他のすべてのオンラインパラメータは、数日間続く実施の全期間にわたってほぼ連続的に（少なくとも毎日、数秒に１回まで）取得される。値が連続しているこれらのパラメータに加えて、さまざまな弁の状態のような「離散」パラメータがある。これは、多くの場合、バイナリ（「オフ／オン」状態）である。これらの弁は、特に、接種材料、培地、塩基、消泡剤、およびガス散布を追加するためのさまざまなポートを制御する。さらに、栄養素の消費および代謝物の生成に関連するいくつかのパラメータは、バイオリアクターから定期的にサンプルを引き出すことによりオフラインで測定される（例として以下の表５参照）。パラメータには、物理的および状態パラメータ、化学的パラメータ、および生理学的パラメータが含まれる。オフラインパラメータのサンプリング周波数の違いのために、すべてのオフライン測定値は、線形補間法を使用して前処理することができる（例えば、Ｃｈａｒａｎｉｙａ，Ｓ．ら，Ｊ．Ｂｉｏｔｅｃｈｎｏｌ．１４７（２０１０）１８６－１９７参照）。

（表５）細胞培養中の一部の従来のオフライン、アットラインおよびインラインで測定されたパラメータの概説。

一態様では、本発明は、以下のステップを含む、細胞クローンの培養中に取得したプロセスデータが問題による影響を受けているかどうかを判定するための方法を提供する。
－場合により、哺乳動物細胞クローンまたは細菌細胞クローン（組換え異種ポリペプチドを発現）の代謝モデルを提供するステップ、
－場合により、組換え異種ポリペプチドを発現している哺乳動物細胞クローンまたは細菌細胞クローンの培養のためのプロセスデータを取得するステップ、
－組換え異種ポリペプチドを発現している哺乳動物細胞クローンまたは細菌細胞クローンの培養中に取得したプロセスデータを、同じ組換え異種ポリペプチドを発現している同じ哺乳動物細胞または細菌細胞に対して生成された代謝モデルを使用してフィッティングするステップ、および
－モデル化されたフィットが未加工データに対して１０％を超えるオフセットを示す場合に、培養が問題による影響を受けていると判定するステップ。

一態様では、本発明は、以下のステップを含む、細胞クローンの培養中に取得したプロセスデータが問題による影響を受けているかどうかを判定するための方法を提供する。
－細胞クローン培養のプロセスデータを受け取るステップであって、細胞クローンが前記細胞に対して異種のポリペプチドを生成するステップ、および
－前記細胞に対して確立された代謝モデルを使用してデータをフィッティングし、完全フィットを表す値１を用いる統計的相関法によって、好ましくはピアソンのカイ二乗検定によって決定されたカイ^２値によって、フィットを特徴づけるステップであって、
これにより、相関値（カイ^２値）が５よりも大きい場合に、プロセスデータが問題による影響を受けているステップ。

一態様では、本発明は、異種ポリペプチドを発現している（および生成している）細胞クローンを選択するための方法を提供し、該方法は、以下のステップを含む：
ａ）同じ異種ポリペプチドを生成する多数の（単離されたまたは単一の）細胞クローンを別々に培養し、それにより培養中に時間的なプロセスデータが記録されるステップ、
ｂ）同じ細胞に対して作製された代謝モデル（場合により同じ組換え異種ポリペプチドを発現する）を使用して、各クローンのステップａ）で取得したプロセスデータを個別にフィッティングし、それにより、すべてのクローンに同じモデルが使用されるステップ、
ｃ）前記代謝モデルにおいてステップａ）で取得した前記培養のプロセスデータに対してステップｂ）で得られたフィットが（ｉ）未加工データに対して１０％を上回るオフセットを示すか、または（ｉｉ）フィットに対する、統計的相関法で決定された相関値、好ましくはピアソンのカイ二乗検定によって決定されたカイ^２値が５以上であり、値１が完全フィットである場合に、ステップａ）の多数の培養のうちのある培養が問題による影響を受けていると決定するステップ、
ｄ）ステップｃ）で決定されるように培養で問題があった細胞クローンを用いて、ステップａ）からｃ）を繰り返すか、
または
ステップｃ）で決定されるように培養で問題のあるクローンがない場合、多数のクローンの中から、（ｉ）最大の力価、および／または（ｉｉ）生成物の質、および／または（ｉｉｉ）代謝性能指標値の組合せの中での最大スコアを有するクローンを選択するステップ（実施例４参照）。

一態様では、本発明は、異種ポリペプチドを発現している（および生成している）細胞のための改善された培養条件を特定するための方法を提供し、該方法は、以下のステップを含む：
ａ）異種ポリペプチドを生成または分泌する哺乳動物細胞または細菌細胞を培養条件の第１のセットで培養し、それにより、培養中に時間的なプロセスデータが記録されるステップ、
ｂ）同じ哺乳動物細胞または細菌細胞に対して作製された代謝モデル（場合により、生成された同じ組換え異種ポリペプチドを発現する）を使用して、ステップａ）で取得したプロセスデータをフィッティングするステップ、
ｃ）前記代謝モデルにおいてステップａ）で取得した前記培養のプロセスデータに対してステップｂ）で得られたフィットが（ｉ）未加工データに対して１０％を上回るオフセットを示すか、または（ｉｉ）フィットに対する、統計的相関法で決定された相関値、好ましくはピアソンのカイ二乗検定によって決定されたカイ^２値が５以上であり、値１が完全フィットである場合に、ステップａ）の培養が問題による影響を受けていると決定するステップ、
ｄ）ｉ）ステップｃ）で決定されるように培養に問題があった場合には、培養条件の第１のセットを用いてステップａ）からｃ）を繰り返すステップ
または
ｉｉ）ステップｃ）で決定されるように培養に問題がなかった場合には、培養条件の第１のセットとは異なる培養条件の第２のセットを用いてステップａ）からｃ）を繰り返すステップ
ｅ）ｉ）培養条件の第２のセットで得られた（ｉ）力価、および／または（ｉｉ）生成物の質、および／または（ｉｉｉ）代謝性能指標値の組合せのスコアが、培養条件の第１のセットで得られた（ｉ）力価、および／または（ｉｉ）生成物の質、および／または（ｉｉｉ）代謝性能指標値の組合せのスコアと比較して改善されていない場合に、第１の培養条件の同じセットと、以前に使用されたどんな培養条件のセットとも異なる（すなわち、それは前記第１および前記第２の培養条件のセットとも、以前の方法で使用された他のすべての培養条件のセットとも異なる）第２の培養条件の新しいセットを用いてステップａ）からｄ）を繰り返すか、
または
ｉｉ）培養条件の第２のセットで得られた（ｉ）力価、および／または（ｉｉ）生成物の質、および／または（ｉｉｉ）代謝性能指標値の組合せのスコアが、培養条件の第１のセットで得られた（ｉ）力価、および／または（ｉｉ）生成物の質、および／または（ｉｉｉ）代謝性能指標値の組合せのスコアと比較して改善されている場合に、培養条件の第２のセットを改善された培養条件として特定するステップ。

すべての態様および実施形態の一実施形態では、問題は技術的な問題である。

すべての態様および実施形態の一実施形態では、異種ポリペプチドを分泌する哺乳動物細胞または哺乳動物細胞クローンは、異種ポリペプチドをコードする核酸を哺乳動物細胞にトランスフェクトし、前記異種ポリペプチドを発現させ、前記異種ポリペプチドを培養培地に分泌させることにより得られたものである。

すべての態様および実施形態の一実施形態では、フィットのための統計的相関法によって決定された相関値は、２またはそれ以上である。すべての態様および実施形態の一実施形態では、フィットのための統計的相関法によって決定された相関値は、１またはそれ以上である。

すべての態様および実施形態の一実施形態では、フィットに対するピアソンのカイ二乗検定によって決定されたカイ^２値は、２またはそれ以上である。すべての態様および実施形態の一実施形態では、フィットに対するピアソンのカイ二乗検定によって決定されたカイ^２値は、１またはそれ以上である。

すべての態様および実施形態の一実施形態では、オフセットは、モデル化され測定されたデータの１：１の線から１０％を超えるオフセットである。

すべての態様および実施形態の一実施形態では、哺乳動物細胞はＣＨＯ細胞である。１つの好ましい実施形態では、ＣＨＯ細胞はＣＨＯ－Ｋ１細胞である。

すべての態様および実施形態の一実施形態では、異種ポリペプチドは組換えポリペプチドである。

すべての態様および実施形態の一実施形態では、異種ポリペプチドはモノクローナル抗体である。一実施形態では、モノクローナル抗体は、治療用モノクローナル抗体である。

すべての態様および実施形態の一実施形態では、プロセスデータは、少なくとも１５のプロセスパラメータの時間的な値を含む。一実施形態では、プロセスデータは、少なくとも２０のプロセスパラメータの時間的な値を含む。一実施形態では、プロセスデータは、少なくとも３０のプロセスパラメータの時間的な値を含む。一実施形態では、プロセスデータは、少なくとも４０のプロセスパラメータの時間的な値を含む。１つの好ましい実施形態では、プロセスデータは、少なくとも１２のオンラインプロセスパラメータおよび少なくとも２８のオフラインプロセスパラメータの時間的な値を含む。

すべての態様および実施形態の一実施形態では、プロセスデータは、各プロセスパラメータに対して少なくとも６つの時間的な値を含む。

すべての態様および実施形態の一実施形態では、代謝モデルは、ゲノムベースの代謝モデルである。一実施形態では、ゲノムベースの代謝モデルは、５つの区画を含む。一実施形態では、５つの区画は、サイトゾル、ミトコンドリア、小胞体、ゴルジ体およびバイオリアクターである。好ましい一実施形態では、代謝モデルは、解糖、クエン酸回路、ペントースリン酸経路、および呼吸鎖の中心代謝経路と、主要なバイオマス構成要素のタンパク質、脂質、ＲＮＡ、ＤＮＡ、および炭水化物の生合成と、Ｃ１代謝と、アミノ酸分解経路と、を含む。

すべての態様および実施形態の一実施形態では、代謝モデルには、最大１２００の代謝物、最大８００の遺伝子、および最大１５００の反応が含まれる。

すべての態様および実施形態の一実施形態では、代謝モデルには、少なくとも６００の反応、５００の代謝物および２５０の遺伝子（オープンリーディングフレーム）が含まれる。好ましい一実施形態では、代謝モデルには、少なくとも６５４の反応、５８３の代謝物および２６６のオープンリーディングフレームが含まれる。

すべての態様および実施形態の一実施形態では、炭素収支は代謝モデルでは閉じられている。一実施形態では、炭素収支の閉鎖は、グルコースおよび非必須アミノ酸を制約することによる。

すべての態様および実施形態の一実施形態では、窒素および酸化還元収支は代謝モデルでは閉じられている。一実施形態では、窒素収支および酸化還元収支の閉鎖は、それぞれ、アンモニア生成速度および酸素取り込み速度を制約することによる。

すべての態様および実施形態の一実施形態では、細胞の取り込み速度および生成速度の推定は、最初に発酵プロセス全体を生理学的に異なるプロセスフェーズに細分化することによって実行される（場合により計算最適化手順によって；かつ／または場合によりプロセスフェーズの最適な数はχ^２ベースの適合度検定を使用して決定される）。一実施形態では、各プロセスフェーズ中には、一定の細胞生理学が想定され、かつ／または一定のバイオマス特異的速度が想定される。一実施形態では、バイオマス特異的速度は、非線形回帰を使用して決定される。

すべての態様および実施形態の一実施形態では、代謝モデルは、（ｉ）既知の遺伝子を機能的カテゴリーに関連付けるデータベースからの情報と組み合わせた遺伝子アノテーションデータから初期再構築を構築するステップ；（ｉｉ）一次文献からのデータを使用し、制約ベースのアプローチで数学モデルに変換することによってモデルを改良するステップ；（ｉｉｉ）モデル予測と表現型データの比較を通じてモデルを検証するステップ；および（ｉｖ）精度を向上させるために、モデルを継続的なウェットラボおよびドライラボのサイクルに付すことにより、代謝再構築を改善するステップを含む４段階のプロセスを使用して構築されている。

すべての態様および実施形態の一実施形態では、代謝モデルは、哺乳動物細胞のアノテーションされたオープンリーディングフレームのみを含む。一実施形態では、モデルは、文献で検証された遺伝子産物をさらに含む。一実施形態では、モデルは、アミノ酸生合成と代謝経路、炭水化物生合成と代謝経路、およびヌクレオチド生合成と代謝経路をさらに含む。一実施形態では、代謝モデルは、輸送プロセスをさらに含む。一実施形態では、代謝モデルは、繰り返される反応または冗長な反応を特定し、除去することにより、さらに洗練される。

すべての態様および実施形態の一実施形態では、代謝モデルは、バイオマス式の各成分の要件を推定するために、平均細胞組成（ｗ／ｗ）７４．２％のタンパク質、１．６％のＤＮＡ、６．１％のＲＮＡ、４．５％の炭水化物、および１０．１％の脂質に基づいている。一実施形態では、バイオマス式は、コレステロールをさらに含む。

すべての態様および実施形態の一実施形態では、酸化的リン酸化の効率は、電子伝達系によって運ばれる電子のモルあたりに生成されるモルＡＴＰの比で表される２．５である。一実施形態では、代謝モデルは、２９．２ｍｍｏｌＡＴＰ／ｇ乾重の、生体高分子（ＲＮＡ、ＤＮＡ、タンパク質）生成のためのＡＴＰのコストを使用する。一実施形態では、代謝モデルは、維持に１．５５ｍｍｏｌＡＴＰ／ｇＤＷ／ｈ、ＡＴＰ収量に３７．８ｍｍｏｌＡＴＰ／ｇＤＷ／ｈ、成長関連の維持に８．６ｍｍｏｌＡＴＰ／ｇＤＷ／ｈの値をさらに使用する。

すべての態様および実施形態の一実施形態では、代謝モデルは、必須アミノ酸、葉酸およびリン酸の取り込み速度、代謝速度、および分泌速度を含む。一実施形態では、代謝モデルは、ビオチン、チアミン、ビタミン、カルシウムおよびマグネシウムイオンの取り込み速度、代謝速度、および分泌速度をさらに含む。

すべての態様および実施形態の一実施形態では、グルコース、酸素、およびグルタミンの取り込みは、代謝モデルでは実験的に観察された速度に固定されている。一実施形態では、さらに、乳酸、アンモニア、グルタミン酸、アスパラギン酸、およびアラニンの取り込み、代謝、および分泌速度が代謝モデルにおいて制約されないままである。

すべての態様および実施形態の一実施形態では、必須アミノ酸の取り込み速度は、代謝モデルでは除去されている。一実施形態では、さらに、非必須アミノ酸の（好ましくはセリン、アスパラギン、グリシン、およびプロリンの）取り込みまたは生成速度は、代謝モデルでは実験的に観察された速度に固定されている。

すべての態様および実施形態の一実施形態では、代謝モデルは、ハイブリッドモデルアプローチにおいて、遺伝子およびシグナル伝達調節エレメント、酵素反応速度および物理化学パラメータを組み合わせる。

すべての態様および実施形態の一実施形態では、モノクローナル抗体の最大生成速度は、０．００８４ｍｍｏｌ抗体／ｇＤＷ／ｈ（ＤＷ＝乾重）の値に設定されている。

すべての態様および実施形態の一実施形態では、代謝モデルの代謝フラックスは、化学量論的制約（代謝物の物質収支）および熱力学的制約（反応の可逆性）を受ける代謝ネットワークモデルの制約ベースのフラックス分析によって決定される。

すべての態様および実施形態の一実施形態では、代謝モデルは３つの異なるフェーズを含む。好ましい一実施形態では、３つのフェーズは、（ｉ）１日目から３日目まで続く最初の初期の指数増殖期；（ｉｉ）４日目から６日目まで続く後期の指数増殖期；および（ｉｉｉ）８日目から１０日目まで続く初期の定常期を含む。

すべての態様および実施形態の一実施形態では、代謝モデルの第１のフェーズでの細胞の目的は、バイオマス生成である（そしてこれは最大化される）。

すべての態様および実施形態の一実施形態では、代謝モデルの第２のフェーズでの細胞の目的は、エネルギー最適化である（そしてこれは最小化される）。

すべての態様および実施形態の一実施形態では、代謝モデルの第３のフェーズでの細胞の目的は、タンパク質生成である（そしてこれは最大化される）。

すべての態様および実施形態の好ましい一実施形態では、代謝モデルの第１のフェーズでの細胞の目的はバイオマス生成であり（そしてこれは最大化される）、代謝モデルの第２のフェーズでの細胞の目的はエネルギー最適化であり（そしてこれは最小化される）、代謝モデルの第３のフェーズでの細胞の目的はタンパク質生成である（そしてこれは最大化される）。

すべての態様および実施形態の一実施形態では、代謝ネットワークモデルおよびそのハイブリッドモデルは、（ｉ）取り込み速度および消費速度をシミュレートするため、（ｉｉ）細胞内フラックスおよび濃度をシミュレートするため、ならびに（ｉｉｉ）データの一貫性、精度、および完全性をチェックするための、バッチ、スプリットバッチ、フェドバッチ、灌流、強化および連続培養のようなあらゆる種類の細胞培養戦略に使用される。

すべての態様および実施形態の一実施形態では、代謝モデルは、再構築プロセス中に、シミュレーション結果を実験結果と比較することによって一貫性、精度、および完全性について繰り返しチェックされ、シミュレーション結果が（場合により定量的にも定性的にも）実験結果の１０％以内になるまで採用／調整される。

統計モデルの適合度は、根本的なモデル化プロセスに関してモデルの質、すなわち、モデルと実験データの相関がどの程度良好であるかを特徴づけるために使用することができる。一般に、適合度は、実験値とモデルによる予測値との間の偏差を合計する。

適合度を説明する１つの方法は、ピアソンのカイ二乗検定である。これは、実験結果とモデル化された結果の頻度の差の合計に基づいており、それぞれが２乗され、期待値で除算される：

［式中、
Ｏ_ｉは、ｂｉｎｉの実験によって決定された頻度（すなわち、カウント）を意味し
Ｅ_ｉは、帰無仮説によって主張されたｂｉｎｉのモデル化された頻度を意味する］。

Ｅ_ｉは、次式によって計算することができる：

［式中、
Ｆは、分析対象の分布の累積分布関数を意味し
Ｙ_ｕは、クラスｉの上限を意味し、
Ｙ_ｌは、クラスｉの下限を意味し、かつ
Ｎは、データポイントの数を意味する］。

得られた値をカイ二乗分布と比較して適合度を決定することができる。

平均すると、各項は約１であると予想することができる。したがって、同様に、合計はデータポイントの数と相関するはずであると予想される。フィッティングされた関数で自動的にヒットできなかったデータポイントの数は「自由度」の数と呼ばれる。

決定的なのは、偏差とエラーバーの相対的なサイズである。「良好な」点は、誤差（σ）に対する偏差（Δ）の比率が小さい（１未満）点であり、「不良な」点は、誤差に対する偏差の比率が１よりも大きいため、曲線が誤差バーを通過できない点である（第３のデータポイントの場合と同様）。平均して、良好なフィットは、異常に大きな偏差と異常に小さな偏差が同じくらい多い、つまり、平均して、偏差と誤差の比率は約１になる。（もちろん、完璧なフィットでは、曲線はすべてのデータ点を通過する：偏差はゼロ）。χ^２は、各データポイントの偏差と誤差の比の二乗の和として定義される：

自由度（ｄ．ｆ．）は、調整可能なパラメータの数によって削減されたデータポイントの数に等しい。

以下の実施例および図は、本発明の理解を助けるために提供されており、その真の範囲は、添付の特許請求の範囲に記載されている。本発明の精神から逸脱することなく、記載された手順に変更を加えることができることが理解される。

破損し、修正された供給濃度データを用いる１４日間の流加培養実験の代謝モデルフィット。１４日間の流加培養は、離散測定されたインプロセスデータ（一般的な誤差分散のあるブラックボックス）に基づいて、５つの異なる段階的な代謝（水平線）に分けられる。黒線は、生成された代謝物の消費の速度（ドリフト量に基づく）にフィットする。測定およびモデル化されたデータのオフセット（Ａ）は、破損したデータ入力を示す。測定データとモデル化データの一致が、修正されたデータセット（Ｂ）について示される。図１Ａの説明を参照のこと。調整されたモデル速度に対してプロットされた測定量から決定された速度からの平均と標準偏差の相関プロット。発酵９（薄い灰色の円）、１４（灰色の逆三角形）および５１（黒色の四角形）が示される。破線は、１：１の相関線を意味する。速度は、測定量から決定される。さまざまな培養とモデルシナリオの組合せのχ^２値。表示されるχ^２は、試験された発酵バッチの各代謝フェーズおよびモデルバリアント（モデル１からモデル６）におけるχ^２の中央値である（表３も参照）。ヒートマップの右側の番号は再現グループである。図３－１の説明を参照のこと。同じ産物を発現する２つの異なる組換えＣＨＯクローン（クローン１およびクローン２）の生細胞密度および乳酸動態が示されている。細胞は流加プロセスによって培養され、プロセス制御分析の離散アットラインによって分析された。１４日間の流加プロセスで同じ生成物を発現する組換えＣＨＯクローン１およびクローン２のモデル化された速度。測定された（調整された）速度（一般的なエラー分散のあるブラックボックス）およびモデル化された（ブラックボックス）速度が、５つすべての代謝フェーズ（水平線）について表示される。

材料および方法
生成物の定量化、代謝物およびアミノ酸分析：
発酵ブロス中の生成物力価、代謝産物およびアミノ酸濃度の定量化のために、細胞を遠心分離によって取り除いた。グルコース、乳酸、およびアンモニウムの濃度は、ＣｅｄｅｘＢｉｏＨＴバイオプロセスアナライザー（ＲｏｃｈｅＤｉａｇｎｏｓｔｉｃｓＧｍｂＨ、マンハイム）を使用して、特定の検定を使用して測定した。無細胞上清は、その後のタンパク質定量化またはアミノ酸分析のために、それぞれ０．２μｍまたは３ｋＤａ膜で滅菌フィルタにかけた。生成物力価は、以前に記載されたＰｏｒｏｓＡＨＰＬＣ法によって定量化した［Ｚｅｃｋら、２０１２］。発酵上清中のアミノ酸レベルは、ＡｇｉｌｅｎｔＲＲＬＣ１２００システム（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ，サンタクララ）および蛍光検出器を使用して社内の方法によって測定した。

タンパク質の測定：
細胞タンパク質含有量の抽出には、Ｍｅｍ－ＰＥＲ（商標）ＰｌｕｓＭｅｍｂｒａｎｅＰｒｏｔｅｉｎＥｘｔｒａｃｔｉｏｎキット（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ，ダルムシュタット）およびＣｅｄｅｘＨｉＲｅｓアナライザーを適用した。第１のステップでは、ＣｅｄｅｘＨｉＲｅｓアナライザーを使用して特定量の生細胞を収集し、ファルコンチューブに移した。次に、同封の浮遊哺乳動物細胞用Ｍｅｍ－ＰＥＲ（商標）取扱説明書（取扱説明書番号８９８４２、ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、ダルムシュタット）のプロトコール２に従って、細胞タンパク質を抽出した。タンパク質を抽出し、１．５ｍＬチューブに収集した後、ＢｒａｄｆｏｒｄＣｏｏｍａｓｓｉｅ（登録商標）ＰｌｕｓＴＭアッセイキットおよびマイクロプレート手順Ａ（取扱説明書第２３２３６、ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、ダルムシュタット）を使用して、タンパク質濃度を測定した。この場合、通常のＢＳＡタンパク質標準の代わりに、独自のＣＨＯ宿主細胞タンパク質標準を使用して、所与サンプルの測定されたＣＨＯタンパク質と、独自の宿主細胞タンパク質混合物から作成した標準曲線との間の公平性を利用した。

その後、測定されたタンパク質含有量ｃ_{タンパク質，測定}を、ＣｅｄｅｘＨｉＲｅｓアナライザーからの総細胞密度ＴＣＤおよび生存度Ｖデータと、そしてもちろん試験管の容積Ｖ_{タンパク質，試験管}および細胞含有サンプルの体積Ｖ_サンプルと組み合わせて、細胞あたりのタンパク質含有量を以下のように計算する：

平均単一細胞質量、体積および密度の決定：
平均細胞質量の決定には、まずＣｅｄｅｘＨｉＲｅｓアナライザー（ＲｏｃｈｅＤｉａｇｎｏｓｔｉｃｓＧｍｂＨ、マンハイム、ドイツ）機を使用して所与サンプルの細胞濃度を決定する。さらに、ＣｅｄｅｘＨｉＲｅｓ装置により、細胞直径（装置内の細胞体積の計算に使用）、細胞生存度および凝集速度のような形態学的パラメータを得る。

細胞質量の決定は、細胞全体の質量ｍ_細胞全体が、細胞のバイオマスｍ_{細胞バイオマス}（細胞膜、細胞成分、タンパク質など）および水ｍ_水の合計からなるという仮定に基づいて行われる。
ｍ_細胞全体＝ｍ_{細胞バイオマス}＋ｍ_水

細胞含有サンプルをバランスの取れたファルコンチューブにピペットで移し、上清から分離した。洗浄ステップは、細胞だけが確実にファルコン内に残るようにする。その後、ファルコンを乾燥キャビネット内で８０℃で少なくとも２４時間乾燥させて水を除去した。したがって、細胞バイオマスは、空のファルコンチューブｍ_{ファルコン，空}および乾燥バイオマスを含むファルコンチューブｍ_{ファルコン，乾燥}の重量差によって測定することができる。測定した総細胞密度ＴＣＤおよびサンプル体積Ｖ_サンプルと組み合わせて、平均細胞質量を以下の通り計算することができる：

酸素取り込み速度（ＯＵＲ）の決定：
酸素取り込み速度ＯＵＲの決定には、動力学的方法を適用した。動力学的方法はよく知られた標準的手順であり、一般に液内細胞培養の酸素消費量に基づく。発酵中、バイオリアクター内の溶存酸素濃度（クラーク電極で測定）は定義された値に調整されているため、溶存酸素の時間的変化は０と見なすことができる。

動力学的方法を適用する場合、ガス処理は一定時間の間中断され、酸素プローブによって記録され得る細胞の呼吸活動によってのみ溶存酸素が減少する。

ＯＵＲは、ガス処理が再開されるまで、溶存酸素の枯渇によって決定することができる。

ＣＨＯネットワークモデルの再構築およびフラックス解析：
５つの区画（サイトゾル、ミトコンドリア、ＥＲ、ゴルジ体、バイオリアクター）を含むゲノムベースのＣＨＯネットワークモデルが、確立された手順に従って、データベースおよび一次文献を含む公開情報源から構築された［Ｓｈｅｉｋｈら，Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．２１（２００５）１１２－１２１；Ｓｅｌｖａｒａｓｕら，Ｍｏｌ．Ｂｉｏｓｙｓｔ．６（２０１０）１５２－１６１；Ｏｂｅｒｈａｒｄｔら，Ｍｏｌ．Ｓｙｓｔ．Ｂｉｏｌ．５（２００９）３２０］。中心代謝経路（解糖、クエン酸回路、ペントースリン酸経路、呼吸鎖）に加えて、モデルは、主要なバイオマス構成要素（タンパク質、脂質、ＲＮＡ、ＤＮＡ、および炭水化物）の生合成、Ｃ１代謝、およびアミノ酸分解経路を説明する。調査した組換えタンパク質生成物について、組換えタンパク質のアミノ酸組成および代表的なグリコシル化構造（生成物分子あたり２つのシアル酸付加された（ｓｉａｌｉｌａｔｅｄ）二分岐グリカン）を説明する、対応する一組の生成物形成反応を定式化した。結果として得られたモデルは、６５４の反応、５８３の代謝物を含み、２６６のＯＲＦを表した。バイオマス組成は、ＣＨＯ細胞またはマウス細胞株に関する以前の研究に匹敵するものが選択された（例えば、Ａｌｔａｍｉｒａｎｏら，Ｂｉｏｔｅｃｈｎｏｌ．Ｐｒｏｇ．１７（２００１）１０３２－１０４１；Ｂｏｎａｒｉｕｓら，Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．５０（１９９６）２９９－３１８；Ｓｅｌｖａｒａｓｕら，Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．１０９（２０１２）１４１５－１４２９）。下記の表６および７を参照されたい。

（表６）ネットワークシミュレーションで用いたＣＨＯ－Ｋ１細胞のバイオマス組成

（表７）ネットワークシミュレーションで用いたＣＨＯ－Ｋ１細胞の高分子組成

モデルの再構築およびモデルのシミュレーションは、ＩｎｓｉｌｉｃｏＤｉｓｃｏｖｅｒｙ８０２（商標）ソフトウェアｖ３．２（ＩｎｓｉｌｉｃｏＢｉｏｔｅｃｈｎｏｌｏｇｙＡＧ，シュトゥットガルト）を使用して実行された。モデルの検証では、元素収支および電荷収支がすべての反応で閉じていることが確認された。さらに、フラックスバランス解析［ＳａｖｉｎｅｌｌおよびＰａｕｌｓｏｎ，Ｊ．Ｔｈｅｏｒ．Ｂｉｏｌ．１５４（１９９２）４２１－４５４および４５５－４７３］を使用して個々の経路の機能性が検証された。ＣＨＯ発酵中に収集された時系列の転写データは、ネットワーク内の（不）活性代謝経路を描写するのに役立ち、優勢なアイソザイム種の特定を支援した。結果として得られるネットワークモデルには、それでも細胞外代謝物の測定とネットワークの化学量論だけでは解決できない内部自由度が含まれていた。このような場合、得られたフラックス分布の比較可能性を確保するために、最もエネルギー効率の高い代謝経路が活性化され、他の経路は不活性化されていると考えられた。重要なことに、この選択は、測定値から推測される細胞の取り込みおよび生成速度の調整された値に影響を与えなかった。

細胞の取り込み速度および生成速度の推定は、最初に、計算による最適化手順を通じて、発酵プロセス全体を生理学的に異なるプロセスフェーズに細分化することによって実行された。この最適化は、細胞数、タンパク質生成物、および細胞外代謝物の測定された時系列データ入力として使用する進化戦略［Ｍｕｌｌｅｒら，２００９，Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１１ｔｈＡｎｎｕａｌｃｏｎｆｅｒｅｎｃｅｏｎＧｅｎｅｔｉｃａｎｄｅｖｏｌｕｔｉｏｎａｒｙｃｏｍｐｕｔａｔｉｏｎ．モントリオール、カナダ：ＡＣＭｐｐ．１４１１－１４１８．ｈｔｔｐ：／／ｄｌ．ａｃｍ．ｏｒｇ／ｃｉｔａｔｉｏｎ．ｃｆｍ？ｉｄ＝１５７００９０で利用可能］を用いて実行された。プロセスフェーズの最適数は、ＬｅｉｇｈｔｙおよびＡｎｔｏｎｉｅｗｉｃｚによって報告された方法に類似したχ^２ベースの適合度検定を使用して決定された［Ｍｅｔａｂ．Ｅｎｇ．１３（２０１１）７４５－７５５］。各プロセスフェーズの間に、一定の細胞生理が想定され、バイオマス特異的速度が一定であることを意味していた。これらのバイオマス特異的速度は、非線形回帰を使用して決定された。個々の栄養素の取り込み速度は、必要に応じて接種せずに実行された対照発酵から決定された半減期データに基づいて、化学分解の影響について修正された。結果として得られた取り込み速度および生成速度は、代謝フラックス解析を実行するための入力として機能し［Ｍａｉｅｒら，Ｂｉｏｔｅｃｈｎｏｌ．Ｂｉｏｅｎｇ．１００（２００８）３５５－３７０；Ｎｉｋｌａｓら，Ｃｕｒｒ．Ｏｐｉｎ．Ｂｉｏｔｅｃｈｎｏｌ．２１（２０１０）６３－６９；Ｓｔｅｐｈａｎｏｐｏｕｌｏｓら，１９９８，Ｍｅｔａｂｏｌｉｃｅｎｇｉｎｅｅｒｉｎｇ：Ｐｒｉｎｃｉｐｌｅｓａｎｄｍｅｔｈｏｄｏｌｏｇｉｅｓ．ＳａｎＤｉｅｇｏ：ＡｃａｄｅｍｉｃＰｒｅｓｓ］、計算されたフラックス分布の熱力学的一貫性が確認された（すなわち、既知の不可逆反応の方向性の違反はない）。

性能測定、および多変量データ分析の定義：
代謝物データ、プロセスデータ、および細胞内フラックス分布のピアソン相関とスピアマン相関の計算は、統計ソフトウェアＲｖ２．１３．２、Ｓｔａｔｓパッケージ［ＲＣｏｒｅＴｅａｍ、２０１３］、ＪＭＰ（ＳＡＳ、Ｍａｒｌｏｗ）、およびＱｌｕｃｏｒｅ（ＱｌｕｃｏｒｅＡＢ、Ｌｕｎｄ）を使用して実行された。多重検定のｐ値の補正は、ＦＤＲ＜０．０５で、または示される通りに、偽発見率（ＦＤＲ）を制御するために、ＢｅｎｊａｍｉｎｉおよびＨｏｃｈｂｅｒｇの方法［ＢｅｎｊａｍｉｎｉおよびＨｏｃｈｂｅｒｇ，１９９５］を使用して実行された。各培養の複合選択スコアは、以下のように計算された：複合スコアＣＳは、カテゴリースコア（ＣＡＳ_ｉ）の加重和として定義された。

ここで、

である。重み係数は、所与の選択プロセスに応じて選択された。各カテゴリースコアＣＡＳ_ｉは、カテゴリーに含まれる個々の指標（ＩＮＤ_ｉ，ｊ）の加重平均として指定された。

この場合も、

である。各指標ＩＮＤ_ｉ，ｊは、所与性能の尺度ＰＭ^{スケーリング}のスケーリングされた時間加重平均として決定された：

上記の重み係数について記載したのと同じ制限が

に適用され、

である。

ここでは、濃度、モル量、バイオマス特異的取り込み／生成速度、細胞内フラックスまたは速度が性能の測定値として採用され、適切な基準値を使用して帰無の無次元量に正規化された。異なるスケーリング手順を採用して、これらの特性を達成し、高い値が望ましいと考えられる特性（例えば、製品力価）と低い値が好ましいと考えられる特性（例えば、副生成物収量）を区別することができる。ここで使用したスケーリングの観測値の範囲は以下の通りである。

性能測定値ＰＭ_ｉ，ｊは、非負の値のみを想定して定義され、

および

は、それぞれすべてのクローンおよびすべての時間点での性能測定値の最大値と最小値を表す。スケーリングされた性能指標および重み係数をこのように選択すると、複合スコアＣＳの達成可能な値は０から１の範囲になる。後者の値は、１つのクローンが、すべての指標およびこの指標がゼロ以外の重みを受けるすべての時間点について、最大の指標値を示した場合にのみ想定される。

単一クローンの力価スコアの例示的計算
最終的な力価を考慮する際には、生成物形成カテゴリーのスコアをｗ_{生成物形成}＝１、それ以外のカテゴリーｉについてはｗ_ｉ＝０とした。生成物力価は唯一の能動的基準であるため、生成物形成（ＰｒｏｄｕｃｔＦｏｒｍａｔｉｏｎ）カテゴリー内での重み付けは

となるが、

、および

となる。スケーリングされた性能の尺度の場合、これは、

となり、ｉ＝「生成物形成（ＰｒｏｄｕｃｔＦｏｒｍａｔｉｏｎ）」であり、ｊ＝「代謝フェーズでの最大力価」である。高い力価値が好ましいため、スケーリングされた性能の尺度は、次式から計算される。

例示的なクローンについて、これらの値を以下の表８に示す。

（表８）本明細書に概説されている重み付け手順に従った最終的な力価スコアの計算例

実施例１
組換えＣＨＯクローンの比較と代謝性能指標によるランキング
クローン比較実験のために、同じモノクローナルＩｇＧ４抗体を発現している１０の組換えＣＨＯ－Ｋ１クローン（ＣＬ４～ＣＬ１３）を使用した。異なる生成物の比較研究のために、上記と同じモノクローナルＩｇＧ４抗体を発現しているさらなるクローンＣＬ１４と、モノクローナルＩｇＧ１抗体を発現している他の２つの生成クローン（ＣＬ２およびＣＬ３）を使用した。組換えＣＨＯ－Ｋ１クローンは、シードトレインおよびその後の流加実験のために、タンパク質を含まない、化学的に定義された独自の培地で培養した。シードトレイン培養は、設定点が７％ＣＯ_２および３７℃に制御された加湿インキュベーターを使用して振盪フラスコで実行した。クローンは３～４日ごとに分割した。すべての実験で、実験開始までの培養（２１日）で同じ年齢のクローンを使用した。流加クローン比較実験では、ＣＬ４からＣＬ１３を、タンパク質を含まない化学的に定義された独自のベース培地を使用して、５００ｍＬ振盪フラスコ内の２３０ｍＬ培地で１３日間培養した。２つのタンパク質を含まない化学的に定義された独自のフィード培地（フィードＡおよびフィードＢ）を、３日目（フィードＡ、１日あたり開始培養量の３％）または６日目（フィードＢ、１日あたり開始培養量の２％）以降に毎日補充した。完全に制御されたクローン培養流加実験は、２Ｌの小規模バイオリアクター（ＳａｒｔｏｒｉｕｓＳｔｅｄｉｍ、Ｇｏｅｔｔｉｎｇｅｎ）で、前記と同じタンパク質を含まない化学的に定義された独自のベースおよびフィード培地を使用して１４日間実行された。生成のようなプロセスでは、同じ２つのタンパク質を含まない化学的に定義された独自のフィード培地（フィードＡおよびフィードＢ）を、３日目（フィードＡ、１日あたり開始培養量の２％）または６日目（フィードＢ、１日あたり開始培養量の２％）から１４日目まで毎日補充した。すべての培養実験は３回繰り返して行った。生細胞および総細胞密度および細胞直径の分析には、自動化されたＣｅｄｅｘＨｉＲｅｓシステム（ＲｏｃｈｅＤｉａｇｎｏｓｔｉｃｓＧｍｂＨ、マンハイム）を使用した。生細胞密度および総細胞密度は、製造業者の説明書に従ってトリパンブルー排除染色法を使用して識別した。発酵ブロス中の生成物力価、代謝産物およびアミノ酸濃度は、以前に記載されているように定量化されたＺｅｃｋら、２０１２）。

組換えＣＨＯクローンの代謝フィンガープリントおよび全体的な性能の評価のために、代謝フラックスモデルを使用して、予め定義された代謝性能指標（表２参照）およびそれぞれのスコアリングシステムを計算して、集計および累積値を生成した（表８参照）。これにより、ＣＨＯクローンの開発および選択のためのクローンランキングの自動かつユーザー非依存性の（個人の解釈を回避する）生成が可能になる。

実施例２
組換えＣＨＯクローン培養のための異なる発酵スケールの比較
代謝フラックス解析アプローチは、高スループット使用のための自動化されたＣＨＯ細胞性能分析を確立するために適用された。この目的のために、さまざまなモノクローナル抗体を発現する、さまざまな規模で実施された培養を危うくする（ｃｏｍｐｒｏｍｉｓｉｎｇ）豊富なデータセットを利用し、必要に応じて精選した（表３参照）。パイプラインの設計に使用された方法には、ゲノム規模の代謝ネットワークモデリング、プロセスフェーズの特定、代謝フラックス解析、およびクローン性能指標の分析が含まれていた。実行された統計解析には、縮小χ^２検定、相互検証、および反復分析が含まれていた。解析の結果、データセットの変換および変形エラーを解決し、χ^２検定の許容ウィンドウを決定することができた。さらに、宿主細胞のタンパク質および酸素取り込み測定の形で追加の測定パラメータを考慮に入れた場合の影響を分析した。

初期のフェーズでは、代謝分析のための統合されたデータ基準が確立された。モデル設定におけるさまざまな仮定（さまざまな細胞バイオマス組成）の影響、および縮小されたχ^２および性能指標値にデータを含めるための影響をテストするためのモデルシナリオに基づくアプローチは、流加培養データを、さまざまな細胞株、クローン、生成物またはプラットフォームで実行された、さまざまな規模のＣＨＯプロセスからの包括的な細胞分析データおよび元素分析とともに使用して分析された。さまざまな仮定およびパラメータの結果、モデル１から６が得られた（表４および図３参照）。

実施例３
ＯＵＲおよびＨＣＰ測定によるＣＨＯクローン性能分析
この目的のために、追加の測定値を含めることの影響、ＨＣＰおよびＯＵＲデータセットを表す培養のサブセットを分析した（表３参照）。ここで、どちらの場合も、追加データを考慮すると、χ^２を増やすことにより、実験から取得した情報量が改善されることが見出された。詳細には、宿主細胞タンパク質（１３％ポイント増加）および酸素取り込み速度（２５％ポイント増加）の測定値を考慮すると、ＣＨＯ発酵の情報量の有意な増加が得られた（表９参照）。

（表９）χ^２検定の詳細な結果。ＨＣＰおよびＯＵＲの測定モデルの影響を分析するために、ＨＣＰおよびＯＵＲが測定された培養のみを使用してシナリオ１（モデル１）を再評価した。

実施例４
乳酸代謝型の異なるＣＨＯクローンの代謝表現型の解析
乳酸はＣＨＯ培養の最も顕著な副生成物であり、それにより、培養ブロス中の濃度レベルおよび細胞特異的な形成および消費速度はプロセス制御分析において発酵として日常的に分析されている。ＣＨＯクローン開発評価プロセスの最終候補は、多くの場合、同じまたは関連するＣＨＯ親細胞および／またはプールに由来する。それでも、代謝型（培養における代謝表現型）は大きく異なる可能性がある。

クローン評価プロセスでは、同じ組換え生成物を発現する２つの異なるＣＨＯクローンを流加実験で評価した。それにより、クローン１とクローン２の細胞増殖はわずかにしか変化しないが、測定された乳酸濃度はかなりの違いを示した（図４）。クローン１は、培養の途中で４０００ｍｇ／Ｌの最大乳酸レベルに達し、その後に再代謝の表現型が見られた。対照的に、クローン２は最大で５００ｍｇ／Ｌの乳酸にさえ到達せず、プロセス時間のほとんどの全体的なレベルは測定不能であった。クローン２起源のこの乳酸測定値が真の代謝型に由来するのか、または例えば間違った測定値、破損したデータなどに由来するのかを評価するために、本発明による代謝フラックス解析アプローチを使用して乳酸値の確率を解析した。そのために、モデルは、乳酸と乳酸以外のすべての測定されたインプロセス制御パラメータを検討する。クローン１とクローン２の特定された５つすべての代謝フェーズすべてについて、調整された乳酸速度とモデル化された「ブラックボックス」速度の一致により、クローン２の乳酸代謝型が正しいことが確認された（図５）。

引用文献（すべて参照により本明細書に組み込まれる）：

Claims

哺乳動物細胞または細菌細胞の培養中に取得したプロセスデータが問題による影響を受けているかどうかを判定するための方法であって、
－組換え異種ポリペプチドを発現している前記哺乳動物細胞または細菌細胞の前記培養中に取得した前記プロセスデータを、同じ組換え異種ポリペプチドを発現している同じ哺乳動物細胞または細菌細胞に対して生成された代謝モデルを使用してフィッティングするステップと、
－（ｉ）モデル化されたフィットが未加工データに対して１０％を上回るオフセットを示すか
または
（ｉｉ）モデル化されたフィットのピアソンのカイ二乗検定によって決定されたカイ^２値が５よりも大きい
場合に、前記培養が問題による影響を受けていると決定するステップと
を含む、前記方法。
異種ポリペプチドを発現している細胞を選択するための方法であって、
ａ）同じ異種ポリペプチドを生成する多数の哺乳動物細胞クローンまたは細菌細胞クローンを別々に培養し、それにより前記培養中に時間的なプロセスデータが記録されるステップと、
ｂ）同じ哺乳動物細胞または細菌細胞に対して生成された同じ代謝モデルを使用して、ステップａ）で取得した各クローンの前記プロセスデータを個別にフィッティングするステップと、
ｃ）前記代謝モデルにおいてステップａ）で取得した前記培養の前記プロセスデータに対してステップｂ）で得られたフィットが（ｉ）未加工データに対して１０％を上回るオフセットを示すか、または（ｉｉ）前記フィットに対するピアソンのカイ二乗検定によって決定された前記カイ^２値が５以上である場合に、ステップａ）の培養が問題による影響を受けていると決定するステップと、
ｄ）ステップｃ）で決定されるように前記培養で問題があった前記クローンを用いてステップａ）からｃ）を繰り返すステップか、
または
ステップｃ）で決定されるように前記培養で問題のあるクローンがない場合、（ｉ）最大の力価、および／または（ｉｉ）最高レベルの意図される生成物の品質特性（複数可）、および／または（ｉｉｉ）代謝性能指標において好ましい代謝表現型／最大ラングを有する異種ポリペプチドを発現している細胞として前記多数のクローンの中から前記クローンを選択するステップと
を含む、前記方法。
前記フィットに対するピアソンのカイ二乗検定によって決定されたカイ^２値が、１以上である、請求項１～２のいずれか一項に記載の方法。
前記細胞が、（ｉ）ＣＨＯ細胞である哺乳動物細胞、および／または（ｉｉ）大腸菌（Ｅ．ｃｏｌｉ）である細菌細胞である、請求項１～３のいずれか一項に記載の方法。
前記異種ポリペプチドが抗体である、請求項１～４のいずれか一項に記載の方法。
前記プロセスデータが、少なくとも１５のプロセスパラメータの時間的な値を含む、請求項１～５のいずれか一項に記載の方法。
前記プロセスデータが、少なくとも１２のオンラインプロセスパラメータと少なくとも２８のオフラインプロセスパラメータの時間的な値を含む、請求項１～６のいずれか一項に記載の方法。
前記プロセスデータが、各プロセスパラメータに対して少なくとも６つの時間的な値を含む、請求項１～７のいずれか一項に記載の方法。
－前記代謝モデルが、ゲノムベースの代謝モデルであり、かつ／または
－前記代謝モデルが、５つの区画であるサイトゾル、ミトコンドリア、小胞体、ゴルジ体およびバイオリアクターを含み、かつ／または
－前記代謝モデルが、解糖、クエン酸回路、ペントースリン酸経路、および呼吸鎖の中心代謝経路と、主要なバイオマス構成要素のタンパク質、脂質、ＲＮＡ、ＤＮＡ、および炭水化物の生合成と、Ｃ１代謝と、アミノ酸分解経路と、を含む、
請求項１～８のいずれか一項に記載の方法。
前記代謝モデルが、少なくとも６００の反応、５００の代謝物および２５０の遺伝子を含む、請求項１～９のいずれか一項に記載の方法。
前記問題が技術的な問題である、請求項１～１０のいずれか一項に記載の方法。