JP2007164798A - 調節された反応ネットワークの全体的特性を決定するためのモデルおよび方法 - Google Patents

調節された反応ネットワークの全体的特性を決定するためのモデルおよび方法 Download PDF

Info

Publication number
JP2007164798A
JP2007164798A JP2006353839A JP2006353839A JP2007164798A JP 2007164798 A JP2007164798 A JP 2007164798A JP 2006353839 A JP2006353839 A JP 2006353839A JP 2006353839 A JP2006353839 A JP 2006353839A JP 2007164798 A JP2007164798 A JP 2007164798A
Authority
JP
Japan
Prior art keywords
reaction
media
constraint
reactions
data structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006353839A
Other languages
English (en)
Other versions
JP4870547B2 (ja
Inventor
Bernhard O Palsson
バーナード オー. パルソーン
Markus W Covert
マーカス ダブリュー. コバート
Christophe H Schilling
クリストファ エイチ. スチリング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Genomatica Inc
Original Assignee
University of California
Genomatica Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California, Genomatica Inc filed Critical University of California
Publication of JP2007164798A publication Critical patent/JP2007164798A/ja
Application granted granted Critical
Publication of JP4870547B2 publication Critical patent/JP4870547B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/10Boolean models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/30Dynamic-time models

Abstract

本発明は、反応に関連がある調節制御を組み込んだ反応ネットワークのモデルを提供する。本発明のモデルを使用して反応ネットワークの全体的特徴を決定する方法が提供される。また、調節事象により種々の時点で反応ネットワークに生じる変化をモデリングするための方法を提供する。
【選択図】なし

Description

発明の背景
本発明は、米国国立科学財団(the National Science Foundation of the United States)によって与えられた助成金番号BES-9814092の下に米国政府の支援によりなされた。米国政府は、本発明に一定の権利を有し得る。
本発明は、概して生物学的システムの解析のための計算アプローチに関し、より詳細には、調節された生物学的反応ネットワークの活性をシミュレーションおよび予測するためのコンピュータ読み取り可能な媒体類および方法に関する。
全ての細胞の挙動は、多くの相互関係のある遺伝子、遺伝子産物、および化学反応の同時に起こる機能および統合に関係する。この相互接続性のために、細胞の挙動に対する、単一遺伝子もしくは遺伝子産物の変化の効果、または薬剤もしくは環境因子の効果を演繹的に予測することは、事実上不可能である。種々の条件下で正確に細胞の挙動を予測する能力は、医薬および産業の多くの領域において極めて価値があろう。たとえば、どの遺伝子産物が適切な薬剤標的であるかを予測することが可能であるならば、有効な抗生剤または抗腫瘍剤を開発するための時間が相当短縮されるであろう。同様に、特定の産業上重要な産物を産生するための微生物の最適発酵条件および遺伝的構成を予測することが可能であれば、これらの微生物の性能を迅速かつ経済的に改良することができるであろう。
計算アプローチは、生物体の挙動を予測および解析可能にすることを目的として最近開発され、生物内で起こる生物学的反応ネットワークを再構築した。最も強力な現在のアプローチのうちの1つは、制約に基づくモデリングを含み、数学的に定義された「解空間」を提供し、ここには、起こりうる全ての生物学的システムの挙動がなければならない。次いで、種々の条件下における能力の範囲および生物学的系の好ましい挙動を決定するために、解空間を探索することができる。大部分がゲノム配列データに由来する反応ネットワークを利用するモデルは、多くの生物について開発されており、「ゲノム規模」モデルといわれている。
現在の制約に基づくモデルでは、遺伝子欠損の効果をシミュレーションする場合などに、個々のモデラーによる決定がなされて反応を除去しない限り、ネットワークにおける全ての反応が常に利用できると考えられる。これは、全ての反応に必要とされるタンパク質の全てが系に機能的に存在すること、およびこれらに関連した遺伝子が常に発現されることを意味する。その上、現在の制約に基づくモデルでは、必要な基質が利用できる限り、反応を生じさせることができる。しかし、複雑な調節制御は、ある反応を特定の条件下でのみ生じさせる生物学的系に置かれているため、天然においてこうした場合はない。
反応が実際に生物中で起こるかどうかは、多数の調節因子、および必要な基質がまさに存在することとは別の事象に依存する。これらの調節因子および事象は、反応に関するタンパク質もしくは酵素の活性を調節すること、タンパク質もしくは酵素の構造を安定化もしくは不安定にする補助因子を調節すること、タンパク質もしくは酵素の構築を調節すること、mRNAのタンパク質への翻訳を調節すること、遺伝子のmRNAへの転写を調節すること、これらのプロセスのいずれの制御をも補助すること、または未知の機構によって作用することができる。
細胞の挙動の記述を試みた現在の制約に基づくモデルは、ネットワークにおいて特定の反応が実際に起こるかどうかを決定する、これらの複雑な調節制御を考慮していない。したがって、現在のモデルは、環境または遺伝的な変化の影響を正確に予測または記述することができない。したがって、様々な条件下で生物の挙動を正確にシミュレーションして効果的に解析するために使用することができるモデルおよびモデリング方法が要求されている。本発明は、この要求を満たし、そのうえ関連した利点をも提供する。
国際公開公報第00/46405号 Schillingら、J. Theor. Biol. 203:229-248(2000) Schillingら、Biotech. Bioeng. 71:286-306(2000) Schillingら、Biotech. Prog. 15:288-295(1999) Edwardsら、Proc. Natl. Acad. Sci. USA 97:5528-5533(2000) Edwardsら、J. Biol. Chem. 274: 17410-17416 (1999) VarmaおよびPalsson、Biotech. 12: 994-998 (1994) FellおよびSmall、J. Biochem. 138: 781-786 (1986) MajewskiおよびDomach, Biotech. Bioeng. 35: 732-738 (1990) Vanrolleghemら、Biotech. Prog. 12: 434-448 (1996) Edwardsら、Nature Biotech. 19: 125-130 (2001) Thomas, J. Theor. Biol. 73:631-656 (1978) Thomas, J. Theoretical Biol. 42:563-585(1973) Ogataら、Nucleic Acids Res. 27:29-34(1999) Altschulら、Nucleic Acids Res. 25:3389-3402(1997) Pearsonら、Genomics 46:24-36 (1997) Overbeekら、Nucleic Acids Res. 28:123-125(2000) Eisenbergら、Nature 405:823-826 (2000) Selkovら、Proc. Natl. Acad. Sci. USA 97:3509-3514(2000) Ermolaevaら、Nucleic Acids Res. 29:1216-1221 (2001) Salgadoら、Nucleic Acids Re. 29:72-74 (2001) McAdamsおよびArkin, Ann. Rev. Biophy. Biomol. Struc. 27:199-224 (1998) VarmaおよびPalsson、Applied Environ. Micro. 60: 3724-3731 (1994) OhおよびLiao, Biotech. Prog. 16:278-286(2000) LendenmannおよびEgli Microbiology 141:71-78(1995)
発明の概要
本発明は、コンピュータ読み取り可能な媒体または媒体類であって、(a)生化学的反応ネットワークにおける複数の反応物と複数の反応を関連づけるデータ構造であって、前記反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される産物、および、基質と産物を関連づける化学量論係数を含み、少なくとも1つの反応は、調節された反応であるデータ構造と、(b)複数の反応のための制約セットであって、前記制約セットは、調節された反応のための可変制約を含む、媒体または媒体類を提供する。
本発明は、さらに、生化学的反応ネットワークの全体的特性を決定するための方法を提供する。本方法は、(a)生化学的反応ネットワークにおける複数の反応物と複数の反応を関連づけるデータ構造であって、前記反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、および、基質と産物を関連づける化学量論係数を含み、少なくとも1つの反応は、調節された反応であるデータ構造を提供する工程と;(b)複数の反応のための制約セットであって、前記制約セットは、調節された反応のための可変制約を含む制約セットを提供する工程と;(c)可変制約に条件依存的な値を提供する工程と;(d)目的関数を提供する工程と、(e)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定することにより、生化学的反応ネットワークの全体的特性を決定する工程とを含む。
また、第一回目および第二回目において生化学的反応ネットワークの全体的特性を決定するための方法が、本発明によって提供される。本方法は、(a)生化学的反応ネットワークにおける複数の反応物と複数の反応を関連づけるデータ構造であって、前記反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、および、基質と産物を関連づける化学量論係数を含み、少なくとも1つの反応は、調節された反応である、データ構造を提供する工程と;(b)複数の反応のための制約セットであって、前記制約セットは、調節された反応のための可変制約を含む制約セットを提供する工程と;(c)可変制約に条件依存的な値を提供する工程と;(d)目的関数を提供する工程と;(e)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つの第一回目のフラックス分布を決定することにより、第一回目の生化学的反応ネットワークの全体的特性を決定する工程と;(f)可変制約に提供された値を修正する工程と、(g)工程(e)を繰り返すことにより、第二回目の生化学的反応ネットワークの全体的特性を決定する工程とを含む。
本発明(1)は、以下のものを含む、コンピュータ読み取り可能な媒体または媒体類である:
(a)生化学的反応ネットワークにおける複数の反応物と複数の反応を関係づけるデータ構造、
ここで、該反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、および、該基質と該産物とを関係づける化学量論係数を含み、該反応の少なくとも1つは調節された反応である;
(b)該調節された反応のための可変制約を含む、該複数の反応のための制約セット。
本発明(2)は、可変制約がデータ構造における少なくとも一つの反応の結果に依存する、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(3)は、可変制約が調節事象の結果に依存する、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(4)は、可変制約が時間に依存する、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(5)は、可変制約が生化学的反応ネットワーク関係物の存在に依存する、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(6)は、関係物が、基質、産物、反応、タンパク質、巨大分子、酵素、および遺伝子からなる群より選択される、本発明(5)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(7)は、生化学的反応ネットワークが代謝反応を含む、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(8)は、調節データ構造をさらに含む、本発明(1)のコンピュータ読み取り可能な媒体または媒体類であって、可変制約が該調節データ構造によって表される調節事象の結果に依存する、媒体または媒体類である。
本発明(9)は、本発明(8)のコンピュータ読み取り可能な媒体または媒体類であって、調節データ構造が、遺伝子の転写、RNAの翻訳、タンパク質の翻訳後修飾、タンパク質の阻害、タンパク質の活性化、タンパク質の構築、pHの変化、レドックス電位の変化、温度の変化、時間の経過、およびタンパク質の分解からなる群より選択される調節事象を表す、媒体または媒体類である。
本発明(10)は、調節事象がシグナル伝達経路による、本発明(8)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(11)は、生化学的反応ネットワークおよび調節データ構造が単一の細胞において起こる反応または事象を表す、本発明(8)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(12)は、生化学的反応ネットワークが細胞集団の第一の細胞において起こる反応を表し、調節データ構造が該集団の第二の細胞において起こる事象を表す、本発明(8)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(13)は、細胞集団が多細胞生物の細胞を含む、本発明(12)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(14)は、可変制約と調節事象の結果を関連づける制約関数をさらに含む、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(15)は、制約関数が二進数である、本発明(14)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(16)は、調節事象がブールの論理によって表される、本発明(14)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(17)は、以下のものをさらに含む、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である:
(c)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも一つのフラックス分布を決定するためのコマンド、
ここで、該少なくとも一つのフラックス分布は、生化学的反応ネットワークの全体的特性を決定し、該全体的特性は、調節された反応を介したフラックスに依存する。
本発明(18)は、コマンドが、制約セットがデータ表現に適用されるときに、目的関数を最小または最大にする実行可能なフラックス分布の範囲を決定する、本発明(17)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(19)は、コマンドが最適化問題を含む、本発明(17)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(20)は、最適化問題が線形最適化問題または非線形最適化問題を含む、本発明(19)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(21)は、本発明(17)のコンピュータ読み取り可能な媒体または媒体類であって、データ構造を修正するための少なくとも一つのコマンドを送ることができるユーザインタフェース、制約セットもしくは該制約セットをデータ表現に適用するためのコマンド、またはその組合せをさらに含む、媒体または媒体類である。
本発明(22)は、ユーザインタフェースが、複数の反応に関するさらなる情報にアクセスするためにユーザが選択してもよいリンクをさらに含む、本発明(21)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(23)は、データ構造が線形代数方程式のセットを含む、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(24)は、データ構造がマトリックスを含む、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(25)は、少なくとも一つのフラックス分布をフラックス分布地図として表すためのコマンドをさらに含む、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(26)は、複数の反応物の少なくとも一つの反応物または複数の反応の少なくとも一つの反応が注釈をつけられている、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(27)は、注釈がコンパートメントに少なくとも一つの反応物を割り当てることを含む、本発明(26)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(28)は、複数の反応における第一の基質または産物が第一のコンパートメントに割り当てられ、該複数の反応における第二の基質または産物が第二のコンパートメントに割り当てられる、本発明(27)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(29)は、注釈がオープンリーディングフレームまたはタンパク質に割り当てること含む、本発明(26)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(30)は、注釈が信頼度評価を含む、本発明(26)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(31)は、特定の生物の1つまたは複数の遺伝子もしくはタンパク質とデータ構造の1つまたは複数の反応を関係づける遺伝子データベースをさらに含む、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(32)は、生化学的反応ネットワークが、解糖、TCAサイクル、ペントースリン酸経路、呼吸、アミノ酸の生合成、アミノ酸の分解、プリンの生合成、ピリミジンの生合成、脂質の生合成、脂肪酸の代謝、補助因子の生合成、細胞壁成分の代謝、代謝物の輸送、および、炭素、窒素、硫黄、リン酸塩、水素、または酸素の代謝からなる群より選択される反応を含む、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(33)は、複数の反応が調節された反応であり、該調節された反応の制約が可変制約を含む、本発明(1)のコンピュータ読み取り可能な媒体または媒体類である。
本発明(34)は、以下の工程を含む、生化学的反応ネットワークの全体的特性を決定するための方法である:
(a)生化学的反応ネットワークにおける複数の反応物と複数の反応を関係づけるデータ構造を提供する工程
ここで、該反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、および、該基質と該産物とを関係づける化学量論係数を含み、該反応の少なくとも1つは調節された反応である;
(b)該複数の反応のための制約セットを提供する工程
ここで、該制約セットは、該調節された反応のための可変制約を含む;
(c)該可変制約に条件依存的な値を提供する工程;
(d)目的関数を提供する工程;
(e)該制約セットが該データ構造に適用されるときに、該目的関数を最小または最大にする少なくとも1つのフラックス分布を決定することにより、該生化学的反応ネットワークの全体的特性を決定する工程。
本発明(35)は、可変制約に提供される値がデータ構造の少なくとも1つの反応の結果に応答して変化する、本発明(24)の方法である。
本発明(36)は、可変制約に提供される値が調節事象の結果に応答して変化する、本発明(34)の方法である。
本発明(37)は、可変制約に提供される値が時間に応答して変化する、本発明(34)の方法である。
本発明(38)は、可変制約に提供される値が生化学的反応ネットワーク関係物の存在に応答して変化する、本発明(34)の方法である。
本発明(39)は、関係物が、基質、産物、反応、酵素、タンパク質、巨大分子、および遺伝子からなる群より選択される、本発明(38)の方法である。
本発明(40)は、生化学的反応ネットワークが代謝反応を含む、本発明(34)の方法である。
本発明(41)は、調節データ構造をさらに含む、本発明(34)の方法であって、可変制約に提供される値が、該調節データ構造によって表される調節事象の結果によって変化する方法である。
本発明(42)は、調節事象が、遺伝子の転写、RNAの翻訳、タンパク質の翻訳後修飾、タンパク質の阻害、タンパク質の活性化、タンパク質の構築、pHの変化、レドックス電位の変化、温度の変化、時間の経過、およびタンパク質の分解からなる群より選択される、本発明(41)の方法である。
本発明(43)は、調節事象がシグナル伝達経路による、本発明(41)の方法である。
本発明(44)は、生化学的反応ネットワークおよび調節データ構造が単一の細胞において起こる反応または事象を表す、本発明(41)の方法である。
本発明(45)は、調節事象が調節反応を含む、本発明(41)の方法である。
本発明(46)は、生化学的反応ネットワークが細胞集団の第一の細胞において起こる反応を表し、調節データ構造が該集団の第二の細胞において起こる事象を表す、本発明(41)の方法である。
本発明(47)は、細胞集団が多細胞生物の細胞を含む、本発明(46)の方法である。
本発明(48)は、可変制約と調節事象の結果を関連づける制約関数をさらに含む、本発明(41)の方法である。
本発明(49)は、制約関数が二進数である、請求項48記載の方法である。
本発明(50)は、調節事象がブールの論理によって表現される、本発明(48)の方法である。
本発明(51)は、制約関数が、調節データ構造の結果の第一のセットを第一の二進数値と関連づけ、該調節データ構造の結果の第二のセットを第二の二進数値と関連づける、本発明(48)の方法である。
本発明(52)は、制約関数が調節データ構造の結果のセットを単一の整数値と関連づける、本発明(48)の方法である。
本発明(53)は、フラックス分布が最適化によって決定される、本発明(34)の方法である。
本発明(54)は、最適化が線形最適化または非線形最適化を含む、本発明(53)の方法である。
本発明(55)は、データ構造もしくは制約セット、または両方を修正する工程をさらに含む、本発明(34)の方法である。
本発明(56)は、データ構造が線形代数方程式のセットを含む、本発明(34)の方法である。
本発明(57)は、データ構造がマトリックスを含む、本発明(34)の方法である。
本発明(58)は、フラックス分布地図を作成する工程をさらに含む、本発明(34)の方法である。
本発明(59)は、生化学的反応ネットワークが、解糖、TCAサイクル、ペントースリン酸経路、呼吸、アミノ酸の生合成、アミノ酸の分解、プリンの生合成、ピリミジンの生合成、脂質の生合成、脂肪酸の代謝、補助因子の生合成、細胞壁成分の代謝、代謝物の輸送、および、炭素源、窒素源、酸素源、リン酸塩源、水素源、または硫黄源の代謝からなる群より選択される反応を含む、本発明(34)の方法である。
本発明(60)は、全体的特性が、増殖、エネルギー産生、レドックス等価物の産生、バイオマス産生、バイオマス前駆体の産生、タンパク質の産生、アミノ酸の産生、プリンの産生、ピリミジンの産生、脂質の産生、脂肪酸の産生、補助因子の産生、細胞壁成分の産生、代謝物の輸送、発生、細胞間のシグナリング、および、炭素、窒素、硫黄、リン酸塩、水素、または酸素の消費からなる群より選択される、本発明(34)の方法である。
本発明(61)は、全体的特性が、タンパク質の分解、アミノ酸の分解、プリンの分解、ピリミジンの分解、脂質の分解、脂肪酸の分解、補助因子の分解、および、細胞壁成分の分解からなる群より選択される、本発明(34)の方法である。
本発明(62)は、可変制約が条件依存的な制約値および制約関数を含み、該可変制約が該条件依存的な制約値に作用する該制約関数によって修正される、本発明(34)の方法である。
本発明(63)は、制約関数が二進数である、本発明(62)の方法である。
本発明(64)は、特定の生物の1つまたは複数のオープンリーディングフレームもしくはタンパク質とデータ構造の1つまたは複数の反応を関係づける遺伝子データベースを提供する工程をさらに含む、本発明(34)の方法である。
本発明(65)は、複数の反応において反応を行うタンパク質をコードするオープンリーディングフレームを同定する工程をさらに含む、本発明(64)の方法である。
本発明(66)は、複数の反応において反応を行うタンパク質を同定する工程をさらに含む、本発明(64)の方法である。
本発明(67)は、以下の工程を含む、生物の変異体の表現型を決定するための方法である:
(i)特定の生物において天然に存在しない反応を同定する工程、
(ii)本発明(34)の方法に従って生化学的反応ネットワークの全体的特性を決定する工程、
ここで、データ構造が、該生物の複数の反応物を該生物の生化学的反応ネットワークの複数の反応に関係づけ、該生物において天然に存在しない該反応をさらに含む。
本発明(68)は、以下の工程を含む、生物の変異体の表現型を決定するための方法である:
(i)遺伝子データベースのオープンリーディングフレームまたはタンパク質に関係づけられた反応を同定する工程、
(ii)本発明(34)の方法に従って生化学的反応ネットワークの全体的特性を決定する工程、
ここで、該オープンリーディングフレームもしくはタンパク質に関係づけられた該反応はデータ構造に存在しないか、またはフラックスを有しないことに制約される。
本発明(69)は、以下の工程を含む、生物学的反応ネットワークにおける1つまたは複数の反応の活性に対する薬剤の効果を決定するための方法である:
(i)遺伝子データベースのオープンリーディングフレームまたはタンパク質に関連づけられた反応を同定する工程、
(ii)該オープンリーディングフレームの発現または該タンパク質の活性を変化させる候補薬剤を同定する工程、
(iii)請求項34記載の方法に従って生化学的反応ネットワークの全体的特性を決定する工程、
ここで、該オープンリーディングフレームまたはタンパク質に関係づけられた該反応はデータ構造に存在しないか、減少したフラックスを有することに制約されるか、またはフラックスを有しないことに制約される。
本発明(70)は、複数の反応が調節された反応であり、該調節された反応についての制約が変数境界値を含む、本発明(34)の方法である。
本発明(71)は、以下の工程を含む、第一回目および第二回目において生化学的反応ネットワークの全体的特性を決定するための方法である:
(a)生化学的反応ネットワークにおける複数の反応物と複数の反応を関係づけるデータ構造を提供する工程、
ここで、該反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、および、該基質および該産物を関係づける化学量論係数を含み、該反応の少なくとも1つは調節された反応である;
(b)該複数の反応のための制約セットを提供する工程、
ここで、該制約セットは、該調節された反応のための可変制約を含む;
(c)該可変制約に条件依存的な値を提供する工程;
(d)目的関数を提供する工程;
(e)該制約セットが該データ構造に適用されるときに、該目的関数を最小または最大にする少なくとも1つの第一回目のフラックス分布を決定することにより、該第一回目の該生化学的反応ネットワークの全体的特性を決定する工程;
(f)該可変制約に提供された該値を修正する工程、
(g)工程(e)を繰り返すことにより、第二回目の該生化学的反応ネットワークの全体的特性を決定する工程である。
本発明(72)は、値が第一回目のフラックス分布に基づいて修正される、本発明(71)の方法である。
本発明(73)は、値が環境条件の変化に基づいて修正される、本発明(71)の方法である。
本発明(74)は、特定の時間点の回数分、工程(e)から(g)を繰り返す工程をさらに含む、本発明(71)の方法である。
発明の詳細な説明
本発明は、生物学的系において見られる生化学的反応ネットワークなどの、調節された反応ネットワークのインシリコモデルを提供する。本発明のモデルは、全体として反応ネットワークに許される活性範囲を定義することにより、反応ネットワークのあらゆるおよび全ての起こりうる機能を含む解空間を定義する。本発明によれば、調節事象の活性または結果を表す関数を利用することにより、調節事象をモデルに組み込むことができる。反応ネットワークで生じる調節事象を記述する利点は、調節により反応ネットワークのための活性範囲を減少するので、解空間をより小さくすることができ、これによりインシリコモデルの予測能力を増大させることができる。
解空間は、周知の代謝反応の化学量論などの制約、並びに反応熱力学および反応を通じて最大のフラックスと関連する容量制約によって定義される。これらは、すべての系が遵守しなければならない物理的-化学的制約の例である。本発明のモデルおよび方法を使用して、これらの制約によって定義される空間を探索し、凸解析、線型計画法、極度経路の計算などの解析技術(たとえば、Schillingら、J. Theor. Biol. 203:229-248(2000)(非特許文献1); Schillingら、Biotech. Bioeng. 71:286-306(2000)(非特許文献2)、およびSchillingら、Biotech. Prog. 15:288-295(1999)(非特許文献3)に記載されている)を使用して、生物学的系の表現型の能力および好ましい挙動を決定することができる。このように、空間は、再構成されたネットワークのあらゆるおよび全ての起こりうる機能を含む。
ゲノム配列データ、生化学的なデータ、および生理学的なデータの使用を通じて完全な生物について定義された反応ネットワークに対して、この解空間は、たとえば国際公開公報第00/46405号(特許文献1)に記載されたような生物の機能的な能力を記述する。この細胞モデルを開発するための一般的なアプローチは、制約に基づくモデリングとして当業者に既知であり、フラックスバランス解析、代謝経路解析、および極度経路解析などの方法を含む。ゲノム規模モデルは、大腸菌(Edwardsら、Proc. Natl. Acad. Sci. USA 97:5528-5533(2000)(非特許文献4))、インフルエンザ菌(Haemophilus influenzae)(Edwardsら、J. Biol. Chem. 274: 17410-17416 (1999)(非特許文献5))、およびヘリコバクターピロリを含む多くの生物について作製されている。当業者に既知のこれらのおよびその他の制約に基づくモデルは、全体的特性に対する調節の効果を予測することができるモデルを制作するために、またはこれらの生物の全体的な機能を予測するために、本発明の方法に従って修正することができる。
一旦解空間が定義されると、種々の条件下で起こりうる解を決定するために解析することができる。1つのアプローチは、代謝定常状態における代謝フラックスバランシングに基づいており、これはVarmaおよびPalsson、Biotech. 12: 994-998 (1994)(非特許文献6)に記載されたように行うことができる。フラックスバランスアプローチを代謝ネットワークに適用して、FellおよびSmall、J. Biochem. 138: 781-786 (1986)(非特許文献7)に記載されたように脂肪細胞代謝の全体的特性を、MajewskiおよびDomach, Biotech. Bioeng. 35: 732-738 (1990)(非特許文献8)に記載されたようにATP極大化条件下における大腸菌からのアセテート分泌を、およびVanrolleghemら、Biotech. Prog. 12: 434-448 (1996)(非特許文献9)に記載されたように酵母によるエタノール分泌を、シミュレーションまたは予測することができる。その上、このアプローチは、種々の単一炭素源における大腸菌の増殖、および、インフルエンザ菌(H. influenzae)の代謝を予測またはシミュレーションするために使用することができる(EdwardsおよびPalsson, Proc. Natl. Acad. Sci. 97: 5528-5533 (2000), EdwardsおよびPalsson, J. Bio. Chem. 274: 17410-17416 (1999)、並びにEdwardsら、Nature Biotech. 19: 125-130 (2001)(非特許文献10)に記載されたように)。
独立型の制約に基づくモデルから生じる定義された解空間は、概念上のものおよび基本的な科学目的として有用なものであるので、これらの体積および次元数が大きいことにより、これらは予測能力が制限されていた。本発明は、どのように反応ネットワークの機能的な操作が制御され/調節されるかについて関連する制約を組み入れるための方法を提供する。本発明の利点は、制約に基づくモデルに調節制約を組み込むことにより、解空間の次元数および体積を減少させることができ、これによりモデルの予測能力が改善されることである。したがって、制約に基づくモデルに本発明の調節制約を組み込むことにより、特定の変異または変異のセットにより生じる、起こりうる表現型の範囲をより容易に予測することができる。
本発明は、コンピュータ読み取り可能な媒体または媒体類であって、(a)生化学的反応ネットワークにおける複数の反応物と複数の反応を関連づけるデータ構造であって、前記反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、および、基質と産物を関連づける化学量論係数を含み、少なくとも1つの反応は調節された反応である、データ構造と、(b)複数の反応のための制約セットであって、前記制約セットは調節された反応のための可変制約を含む、制約セットを含む、媒体または媒体類を提供する。
本明細書において使用されるものとして、「生化学的反応ネットワーク」の用語は、生存可能な生物学的生物の中で、または生存可能な生物学的生物によって生じ得る化学転換の集まりを意味することが意図される。生存可能な生物学的生物の中で、または生存可能な生物学的生物によって生じ得る化学転換は、たとえば以下で言及されるものなどの、特定の生物に天然に生じる反応;特定の界、門、属、科、種、または環境ニッチにおけるものなどの生物のサブセットに天然に生じる反応;あるいは、天然に遍在性である反応を含み得る。生存可能な生物学的生物の中で、または生存可能な生物学的生物によって生じ得る化学転換は、たとえば、真核細胞、原核細胞、単細胞生物、または多細胞生物に起こるものを含み得る。この語に含まれる化学転換の集まりは、実質的に完全であることもでき、あるいは、たとえば、中枢もしくは末梢の代謝経路などの代謝に関する反応、シグナル伝達に関する反応、増殖もしくは発生に関する反応、または細胞周期制御に関する反応を含む、反応のサブセットであり得る。
中枢の代謝経路は、解糖、ペントースリン酸経路(PPP)、トリカルボン酸(TCA)サイクル、および呼吸に属する反応を含む。
末梢の代謝経路は、中枢の代謝経路の一部でない1つまたは複数の反応を含む代謝経路である。本発明のデータ構造またはモデルに表すことができる末梢の代謝経路の反応の例は、アミノ酸の生合成、アミノ酸の分解、プリンの生合成、ピリミジンの生合成、脂質の生合成、脂肪酸の代謝、補助因子の生合成、細胞壁成分の代謝、代謝物の運搬、または、炭素源、窒素源、リン酸塩源、酸素源、硫黄源、もしくは水素源の代謝に関するものを含む。
本明細書において使用するものとして、「反応」の用語は、基質を消費するか、または産物を形成する化学転換を意味することを意図する。本用語に含まれる化学転換は、生物によって遺伝的にコードされる1つまたは複数の酵素の活性により生じることもでき、または細胞もしくは生物において自発的に生じることもできる。本用語に含まれる化学転換は、たとえば、求核付加もしくは求電子付加、求核置換もしくは求電子置換、脱離、還元もしくは酸化、または、反応物が膜を超えて輸送されるか、もしくは1つのコンパートメントからもう一つへ輸送されるときに生じるものなどの位置の変化によるものなどの、基質から産物への転換を含む。反応の基質および産物は、これらが化学的に同じものである場合であっても、特定のコンパートメントにおける位置によって区別することができる。したがって、第一のコンパートメントから第二のコンパートメントまで化学的に変化しない反応物を輸送する反応は、その基質として第一のコンパートメントに反応物を有し、その産物として第二のコンパートメントに反応物を有する。本用語は、巨大分子を、第一のコンホメーションまたは基質コンホメーションから、第二のコンホメーションまたは産物コンホメーションに変化させる転換を含み得る。このようなコンホメーションの変化は、たとえばホルモンもしくは受容体などのリガンドが結合することによるエネルギー伝達のためか、または光の吸収などの物理的刺激からによるものでもあり得る。インシリコモデルまたはデータ構造に関して使用される場合、反応は、基質を消費するかまたは産物を産生する化学転換を表すことを意図することが理解されるであろう。
本明細書で使用されるものとして、「調節された」の用語は、データ構造における反応に関して使用される場合、制約の値の変化によりフラックス変化を受ける反応、または可変制約を有する反応を意味することを意図する。
本明細書で使用されるものとして、「調節反応」の用語は、触媒の活性を変化させる化学転換または相互作用を意味することを意図する。化学転換または相互作用は、たとえば触媒が翻訳後に修飾されるときに生じるものなど、触媒の活性を直接変化させることができ、または、化学転換もしくは結合事象が触媒の発現変化を引き起こすときに生じるものなど、触媒の活性を間接的に変化させることもできる。したがって、転写または翻訳の調節経路は、間接的に触媒または関連する反応を変化させることができる。同様に、間接的な調節反応は、調節反応ネットワークの下流の成分または関係物によって生じる反応を含み得る。データ構造またはインシリコモデルに関して使用される場合、本用語は、第一の反応を意味することを意図し、第一の反応は、第二の反応の制約の値を変化させることにより第二の反応を通じてフラックスを変化させる関数によって第二の反応と関連する。
本明細書で使用されるものとして、「反応物」の用語は、反応の基質または産物である化学物質を意味することを意図する。本用語は、生物のゲノムによってコードされる1つもしくは複数の酵素によって触媒される反応、1つもしくは複数の非遺伝的にコードされる触媒によって触媒される生物において生じる反応、または細胞もしくは生物において自発的に生じる反応の基質もしくは産物を含み得る。代謝物は、本用語の意味の範囲内の反応物であることが理解される。インシリコモデルまたはデータ構造に関して使用される場合、反応物は、反応の基質または産物である化学物質を表すことが理解されるであろう。
本明細書で使用されるものとして、「基質」の用語は、反応により1つまたは複数の産物に転換され得る反応物を意味することを意図する。本用語は、たとえば、求核付加もしくは求電子付加、求核置換もしくは求電子置換、脱離、還元もしくは酸化により化学的に変化される反応物、または膜を超えて輸送されるか、もしくは異なるコンパートメントへ輸送されることなどにより位置が変化する反応物を含み得る。本用語は、エネルギーの伝達により、コンホメーションを変化させる巨大分子を含み得る。
本明細書で使用されるものとして、「産物」の用語は、1つまたは複数の基質との反応によって生じる反応物を意味することを意図する。本用語は、たとえば、求核付加もしくは求電子付加、求核置換もしくは求電子置換、脱離、還元もしくは酸化により化学的に変化される反応物、または膜を超えて輸送されるか、もしくは異なるコンパートメントへ輸送されることなどにより位置が変化する反応物を含み得る。本用語は、エネルギーの伝達により、コンホメーションを変化させる巨大分子を含み得る。
本明細書で使用されるものとして、「データ構造」の用語は、操作することができるか、または解析することができるフォーマットの情報の表現を意味することを意図する。本用語に含まれるフォーマットは、たとえば、情報のリスト、2つ以上の情報のリストを相関させるマトリックス、線形代数方程式などの方程式のセット、またはブール・ステートメント(Boolean statement)のセットであることもできる。本用語に含まれる情報は、たとえば、化学反応の基質もしくは産物、1つもしくは複数の基質を1つもしくは複数の産物と関連づける化学反応、または反応に配置される制約であることもできる。したがって、本発明のデータ構造は、生化学的反応ネットワークなどの反応ネットワークの表現であることもできる。
複数の反応物は、反応によりこの反応物が消費または産生される、それぞれの反応物を表現するあらゆるデータ構造における複数の反応に関連させることができる。したがって、データ構造は、生物学的反応ネットワークまたは系の表現に役立つ。本発明のデータ構造に含まれる複数の反応物の中の1つの反応物または複数の反応の中の1つの反応には、注釈をつけることができる。このような注釈により、それぞれの反応物を、化学種およびこれが存在する細胞のコンパートメントによって同定することができる。したがって、たとえば、細胞外コンパートメントのグルコース対サイトゾルのグルコースの間で区別をすることができる。データ構造は、第一のコンパートメントに割り当てられた複数の反応の中の第一の基質または産物と、第二のコンパートメントに割り当てられた複数の反応の中の第二の基質または産物とを含み得る。反応物を割り当てることができるコンパートメントの例は、細胞の細胞内空間;細胞のまわりの細胞外空間;ミトコンドリア、小胞体、ゴルジ装置、液胞、もしくは核などのオルガネラ内の空間;または膜によってもう一つから分離されたあらゆる細胞成分の空間を含む。加えて、反応物のそれぞれは、一次または二次代謝産物として特定することもできる。一次または二次代謝産物として反応物を同定することでは、反応内の反応物間にいかなる化学的差異も示さないが、このような表示は、大きな反応ネットワークの視覚的な表現を補助することができる。
本発明のデータ構造またはモデルに使用する反応物は、化合物データベースから得ることができ、または貯蔵することができる。このような化合物データベースは、様々な生物由来の化合物を含む普遍的データベースであることができ、またあるいは、特定の生物もしくは反応ネットワークに特異的であることもできる。本発明のデータ構造またはモデルに含まれる反応は、基質、産物、および特定の生物の複数の代謝反応の化学量論を含む代謝反応データベースから得ることもできる。
本発明のデータ構造またはモデルに表現される反応には、注釈をつけて、反応に触媒作用を及ぼす巨大分子または巨大分子を発現するオープンリーディングフレームを示すこともできる。その他の注釈情報は、たとえば、特定の反応に触媒作用を及ぼす酵素(類)の名称(類)、酵素をコードする遺伝子(類)、特定の代謝反応のEC番号、反応が属する反応のサブセット、情報が得られた参照に対する引用、または特定の生化学的反応ネットワークもしくは生物で起こると考えられる反応の信頼度のレベルを含むことができる。このような情報は、本発明の代謝反応データベースまたはモデルを構築する過程において、下記のように得ることができる。本発明のデータ構造またはモデルに使用される注釈がつけられた反応は、特定の生物における1つもしくは複数の遺伝子またはタンパク質による1つまたは複数の反応に関する遺伝子データベースから得られ、または貯蔵することができる。
本明細書で使用されるものとして、「化学量論係数」の用語は、化学反応における1つまたは複数の反応物および1つまたは複数の産物の量を関係づける数値的定数を意味することを意図する。本発明のデータ構造またはモデルの反応物は、特定の反応の基質または産物のいずれかとして指定でき、別々の化学量論係数を有するそれぞれをこれらに割り当てて、反応中で生じる化学転換を記述することができる。また、それぞれの反応は、可逆的または不可逆的方向で生じるものとして記載される。可逆反応は、正方向および逆方向の両方で作動する1つの反応として表すことが、または、一方が正反応に対応し、他方が逆反応に対応する2つの不可逆反応に分解することができる。
本明細書に記載されたシステムおよび方法は、Intel.RTM.マイクロプロセッサに基づき、かつMicrosoft Windowsオペレーティングシステムを動かすものなどの、従来のどのようなホストコンピュータシステムでも実行することができる。IBM.RTM.、DEC.RTM.、Motorola.RTM.マイクロプロセッサに基づいてUNIXまたはLINUXオペレーティングシステムを使用するものなど、その他のシステムも想定される。本明細書に記載されるシステムおよび方法は、また、クライアント-サーバー系およびインターネットなどの広い領域のネットワーク上で走らせるために実行することもできる。
本発明の方法またはシステムを実行するソフトウェアは、Java、C、C++、Visual Basic、FORTRAN、またはCOBOLなどの周知のどのようなコンピュータ言語で書かれることもでき、周知の互換性を持ついずれのコンパイラを使用しても編集することができる。本発明のソフトウェアは、通常ホストコンピュータシステムのメモリに貯蔵された指令により動作する。メモリまたはコンピュータ読み取り可能な媒体は、ハードディスク、フロッピーディスク、コンパクトディスク、光磁気ディスク(magneto-optical disc)、ランダム・アクセス・メモリ(Random Access Memory)、読込専用メモリ(Read Only Memory)、またはフラッシュ・メモリ(Flash Memory)であることもできる。本発明に使用されるメモリまたはコンピュータ読み取り可能な媒体は、単一のコンピュータ内に含まれることができ、またはネットワークにおいて分散されることもできる。ネットワークは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)などの当業者に既知の多くの従来のネットワークシステムのいずれであることもできる。本発明において使用することができるクライアント-サーバー環境、データベースサーバ、およびネットワークは、周知技術である。たとえば、データベースサーバは、UNIXなどのオペレーティングシステムで実行することができ、関係型データベース管理システム、ワールドワイドウェブアプリケーション、およびワールドワイドウェブサーバーを実行することもできる。また、その他のタイプのメモリおよびコンピュータ読み取り可能な媒体も、本発明の範囲内で機能することが想定される。
本発明は、さらに、生化学的反応ネットワークの全体的特性を決定するための方法を提供する。本方法は、(a)生化学的反応ネットワークにおける複数の反応と複数の反応物を関連づけるデータ構造であって、前記反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、および、基質と産物を関連づける化学量論係数を含み、少なくとも1つの反応は調節された反応である、データ構造を提供する工程と;(b)複数の反応のための制約セットであって、前記制約セットは、調節された反応のための可変制約を含む制約セットを提供する工程と;(c)可変制約に条件依存的な値を提供する工程と;(d)目的関数を提供する工程と;(e)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つのフラックス分布を決定することにより、生化学的反応ネットワークの全体的特性を決定する工程とを含む。
本明細書で使用されるものとして、「全体的特性」の用語は、全体として生物の能力または質を意味することを意図する。また、この用語は、生物の初期状態から最終状態への変化の大きさまたは速度を意図する動的性質をいう。この用語は、生物によって消費され、もしくは産生される化学物質の量、生物によって消費され、もしくは産生される化学物質の速度、生物の増殖の量もしくは速度、生物の反応の特定のサブセットを介したエネルギー、質量、もしくは電子フローの量もしくは速度を含むことができる。
本明細書で使用されるものとして、「調節データ構造」の用語は、事象、反応、または反応を活性化または阻害する反応のネットワークの表現を意味することを意図し、この表現は、操作されるかまたは解析され得る型式である。反応を活性化する事象は、反応を開始する事象または反応の活性のレベルもしくは速度を増大する事象であることもできる。反応を阻害する事象は、反応を停止する事象または反応の活性の速度もしくはレベルを減少させる事象であることもできる。調節されたデータ構造において表現することができる反応は、たとえば、転写反応および翻訳反応などの反応に触媒作用を及ぼす巨大分子の発現を制御する反応、リン酸化、脱リン酸化、プレニル化、メチル化、酸化、もしくは共有結合性改変などのタンパク質または酵素の翻訳後修飾を引き起こす反応、プレ配列もしくはプロ配列の除去などのタンパク質または酵素をプロセスする反応、タンパク質または酵素を分解する反応、あるいはタンパク質または酵素の構築を引き起こす反応を含む。調節データ構造によって表現することができる反応のネットワークの例を図3に示す。
本明細書で使用されるものとして、「調節事象」の用語は、反応に利用できる反応物の量から独立した反応を介したフラックスの修飾因子を意味することを意図する。本用語に含まれる修飾は、反応に触媒作用を及ぼす酵素の存在、不存在、または量の変化であることもできる。本用語に含まれる修飾因子は、シグナル伝達反応などの調節反応、またはpH、温度、レドックス電位、もしくは時間の変化などの環境条件であることもできる。インシリコモデルまたはデータ構造に関して使用される場合、調節事象は反応に利用できる反応物の量から独立した反応を介したフラックスの修飾因子を表現することを意図することが、理解されるであろう。
本明細書で使用されるものとして、「制約」の用語は、反応のための上または下の境界を意味することを意図する。境界は、反応を介した質量、電子、またはエネルギーの最小または最大のフローを特定することができる。境界は、さらに反応の方向性を特定することができる。境界は、ゼロ、無限大、または整数などの数的な値のような定常的な値であることができる。あるいは、境界は、以下に記載の通り、可変境界値であることができる。
本明細書において使用されるものとして、「可変」の用語は、制約に関して使用される場合、関数によって作用する反応の値のあらゆるセットを推定することができるということを意味することを意図する。「関数」の用語は、コンピュータおよび数学の技術において理解される用語の意味と一致していることを意図する。関数は、反応に対応する変化がオフまたはオンであるように、二進法であることもできる。あるいは、境界値の変化が活性の増加または減少と対応するように、連続関数を使用することができる。また、このような増加または減少は、値のセットを簡素な整数値に転換することができる関数によって貯蔵すること、または効果的にデジタル化することができる。本用語に含まれる関数は、反応物、反応、酵素、もしくは遺伝子などの生化学的反応ネットワーク関係物の存在、不存在、または量と境界値を相関させることができる。本用語に含まれる関数は、境界限界によって制約される反応を含む反応ネットワークにおける少なくとも一つの反応の結果と境界値を相関させることができる。また、本用語に含まれる関数は、時間、pH、温度、またはレドックス電位などの環境条件と境界値を相関させることができる。
活発に生じる反応の能力は、まさに基質の利用可能性を越えて多数のさらなる因子に依存する。これらの因子は、本発明のモデルおよび方法の変数制約として表現することができ、たとえば、タンパク質/酵素を安定化させるために必要な補助因子の存在、酵素の阻害因子および活性化因子の有無、対応するmRNA転写産物の翻訳を介したタンパク質/酵素の活性形成、関連する遺伝子(類)の転写、化学反応を生物内で実行することができるかどうかを最終的に決定するこれらのプロセスの制御を補助する化学シグナルおよび/またはタンパク質の存在を含む。
図1は、生化学的反応ネットワークの調節されたモデルの開発および実施ための、一般的なプロセス100を示す。本プロセスは、生化学的反応ネットワークを表現するデータ構造が構築される工程110で始まる。本プロセスは、ネット反応方程式とともに、ネットワークで生じ得る全ての反応の一覧を示す反応インデックスの作成により始まることができる。上記記載の通り、このようなリストは、反応データベースに由来するか、または貯蔵することができる。図2Aに表された用例反応ネットワークを想定した場合、5つの代謝産物を相互変換する4つのバランスのとれた生化学的反応がある。ある代謝産物の入力および出力を可能にするために付加される3つの交換反応がある。このネットワークのための反応インデックスは、7つの反応を含むみ、次の通りである:
Figure 2007164798
本発明のモデルに含まれる反応は、内部系反応または交換反応を含み得る。内部系反応は、化学種および伝達プロセスの化学的および電気的にバランスのとれた相互変換であり、これはある代謝産物の相対的な量を補給または排出するのに役立つ。これらの内部系反応は、トランスフォーメーションまたはトランスロケーションとして分類することもできる。トランスフォーメーションは、基質および産物として化合物の異なったセットを含む反応であり、一方、トランスロケーションは、異なったコンパートメントに位置する反応物を含む。したがって、単に細胞外環境からサイトゾルまで代謝産物を輸送する反応は、その化学組成を変えず、単にトランスロケーションとして分類されるだけであるが、細胞外のグルコースを取り込んで、これをサイトゾルのグルコース-6-リン酸に変換するホスホトランスフェラーゼシステム(PTS)などの反応は、トランスロケーションおよびトランスフォーメーションである。
交換反応は、供与源および受け側を構成するものであり、コンパートメントへの、およびコンパートメントからの、または推定上の系の境界を越えて、代謝産物の通過を可能にする。これらの反応は、シミュレーション目的のためのモデルに含まれ、特定の生物に配置される代謝需要を表現する。これらは、ある場合には化学的にバランスがとれているが、典型的には、これらはバランスが悪く、しばしば単一の基質または産物のみしか有することができない。規定の問題として、交換反応は、さらに需要交換および入力/出力交換反応に分類される。
入力/出力交換反応は、細胞外の反応物を反応ネットワーク/系に入れるため、または出すために使用される。それぞれの細胞外代謝産物について、対応する入力/出力交換反応を作成することもできる。これらの反応は、常に可逆的であり、反応によって産生される1つの産物および産物なしの化学量論係数を有する基質として示される代謝産物を有する。この特定の規約は、代謝産物が産生されるか、または系から流出した場合に、反応が正のフラックス値(活性レベル)をとり、代謝産物が消費されるか、または系に導入された場合に、負のフラックス値をとることができるように用いられる。これらの反応は、どの代謝産物を細胞に利用できるか、また、どれが細胞によって排泄され得るかを正確に特定するためにシミュレーションの過程でさらに制約されるであろう。
需要交換反応は、常に少なくとも一つの基質を含む不可逆的反応として特定される。これらの反応は、典型的には、代謝ネットワークによる細胞内代謝産物、または増殖反応の表現におけるものなどのバランスのとれた比の多くの反応物の集積産物を表現するために公式化される。需要交換反応は、本モデルにおけるどのような代謝産物に対しても導入され得る。最も一般的には、これらの反応は、アミノ酸、ヌクレオチド、ホスホリピド、およびその他のバイオマス成分などの、新たな細胞を作成することを目的とする細胞によって産生されることが必要とされる代謝産物、または別の目的のために産生される代謝産物に導入される。これらの代謝産物が一旦同定されると、不可逆的であり、かつ1つの化学量論係数を有する基質として代謝産物を特定する需要交換反応を作成することができる。これらの規定により、反応がアクティブである場合、潜在的産生需要を満たしている系により、代謝産物の純産生が引き起こされる。反応ネットワークデータ構造において表現され、かつ本発明の方法によって解析することができるプロセスの例は、たとえばタンパク質の発現レベルおよび増殖速度を含む。
個々の代謝産物に配置されるこれらの需要交換反応に加えて、定義された化学量論比の多数の代謝産物を利用する需要交換反応を導入することもできる。これらの反応は、集積された需要交換反応と称する。全ての交換反応と同様に、これらは化学的にバランスがとれている。集積された需要反応の例は、細胞に配置された細胞増殖に関連する同時的な増殖需要または産生要求をシミュレートするために使用される反応であろう。
次いで、プロセスは、工程120に移動し、ここでは、データ構造を作成するために、ネットワークの数学的な表現がこの反応のリストから作成される。これは、当該技術における既知の方法を使用して達成され、基質または産物として参加している種々の反応による代謝産物の産生の割合と消費の割合の間の相違として経時的に代謝産物の濃度変化を記述した、代謝産物のそれぞれについての動的なマスバランス方程式のリストを導く(たとえば、Schillingら、J. Theor. Biol. 203: 229-248 (2000)を参照されたい)。プソイド(pseudo)定常状態を考慮する場合、これらの動的なマスバランスは、ネットワークにおける代謝産物のバランスを記述する一連の線形方程式に変換される。図2Aの用例ネットワークについて、線形マスバランス方程式は、次の通りである:
0=A_in-R1
0=R1-R3-R4
0=C_in-R2
0=R2+R3-R4
0=R4-E_out
熱力学的原理により、化学反応は、事実上、本質的に可逆的または不可逆的であることができる。これにより、反応を介したフラックスの方向性のある流れに制約が付加される。反応が不可逆的であるとみなされる場合、フラックスは正に制約され、可逆的である場合、これは正または負のどのような値であることもできる。用例ネットワークについては、反応は、全て不可逆的であると考えられ、以下の一連の線形不等式として表される制約のセットを導く:
0≦R1≦∞
0≦R2≦∞
0≦R3≦∞
0≦R4≦∞
0≦A_in≦∞
0≦C_in≦∞
0≦E_out≦∞
集合的に、これらの5つの線形方程式および7つの線形不等式は、定常状態条件下の反応ネットワークを記述し、ネットワークにおける化学量論的および反応熱力学的に配置される制約を表現する。
次いで、プロセス100は工程130に続き、ここでは、生化学的反応ネットワークにおける反応のあらゆる既知の調節が決定される。これにより、反応ネットワークと相互作用する調節ネットワークが構築される。図2の用例ネットワークについては、反応R2は、調節される唯一の反応である。これは、代謝産物Aが存在し、かつネットワークによる取込みに利用できる場合に、反応R2の進行が阻害される方式で制御される。これは、代謝産物Cがネットワークによって使用されることを防止するであろう。これは、大腸菌などの原核生物に共通して見られる異化代謝産物抑制の概念に類似しており、さらなる詳細が以下の実施例に例示される。この基本的な調節反応を、図2Bに例示する。
反応の調節が決定されたことにより、プロセス100は工程140へ移動し、ここでは、調節ネットワークが数学的に記述されて、調節データ構造を作製するために使用される。調節データ構造は、調節反応をブールの論理ステートメントで表現することができる。ネットワークにおけるそれぞれの反応に対して、ブール変数を導入することができる(Reg反応)。変数は、反応が反応ネットワークに利用できる場合に1の値をとり、反応がいくつかの調節的特徴により制限される場合に0の値を取る。次いで、数学的に調節ネットワークを表現するために、一連のブールのステートメントを導入することができる。用例ネットワークでは、調節データ構造は、次のように記述される:
Reg-R1=1
Reg-R2=IF NOT(A_in)
Reg-R3=1
Reg-R4=1
Reg-A_in=1
Reg-C_in=1
Reg-E_out=1
これらのステートメントは、反応A_inが起こらない場合(すなわち、代謝産物Aがない場合)に、R2が起こり得ることを示す。同様に、調節を変数Aに割り当てることができ、これにより、R2の制御を引き起こす閾値濃度の上もしくは下にAが存在すること、または存在しないことを示すであろう。この形態の調節の表現を以下の実施例に記述した。生化学的反応ネットワークにおける反応のそれぞれに対応する変数に値を提供し、この値が、調節構造に従って反応が進行し得るかどうかを示す値であるいかなる関数も、調節データ構造における調節反応または調節反応セットを表現するために使用することができる。
工程120の線形方程式および不等式の組合せ、並びに工程140で生じるブールのステートメントは、生化学的反応ネットワークおよびその調節の、統合されたモデルを表現する。代謝反応ネットワークのためのこのようなモデルを実施例に提供し、組合せ代謝/調節反応モデルと呼ぶ。次いで、シミュレーションを実行して本モデルの性能を決定するため、およびこれが変更条件下で表す生物学的系の全体的活性を予測するために、本発明の統合されたモデルを実行することができる。これを達成するために、プロセス100は、工程150に移動する。
工程150において、本モデルに対する初期条件およびパラメータを指定することにより、シミュレーションが公式化される。代謝産物AおよびCが共に10ユニット/分の速度でネットワークに取り込まれるように利用できる条件下で、ネットワークによる代謝産物Eの最大産生を決定するために、シミュレーションが行われる。したがって、反応A_inおよびC_inに配置される制約は以下の通りである:
0≦A_in≦10
0≦C_in≦10。
たとえば工程130および140を行わないことにより、調節がモデルに組み込まれない場合、生化学的反応ネットワークは、10ユニット/分の割合でAおよびCを共に利用して、10ユニット/分の速度で、代謝産物Eを最大限に産生するであろう。これを図2Cに例示する。解は、線型計画法に対して当業者に既知のアルゴリズムを使用して算出することができる。
ネットワークに対する調節の制約があるので、反応ネットワークの性能に影響を与えるであろう調節に関連するさらなる制約が存在するどうかを決定するために、検討する環境条件におけるこれらの制約の効果が考慮され得る。このような制約は、条件依存的な制約を構成する。したがって、プロセス100は、工程160へ移動し、ここでは、反応制約が、条件に関連するあらゆる調節の特徴に基づいて調整される。図2の用例ネットワークにおいて、代謝産物Aが反応ネットワークによって取り込まれた場合、変数Reg-R2が0であるとする(これは反応R2が阻害されることを意味する)ブール規則がある。この例で考慮される条件により、Aを取込みのために利用でき、したがって、反応R2を阻害するであろう。考慮される特定の条件について、調節ブール反応変数の全ての値は、次の通りである。
Reg-R1=1
Reg-R2=0
Reg-R3=1
Reg-R4=1
Reg-A_in=1
Reg-C_in=1
Reg-E_out=1
次いで、工程120のそれぞれの反応に配置した反応制約を、以下の一般的な方程式を使用して改良することができる:
Figure 2007164798
反応R2を検討すると、特にこの方程式は、次のように書かれる:
(0)*Reg-R2≦R2≦(∞)*Reg-R2
Reg-R2は、ゼロに等しいので、これにより、生化学的反応ネットワークにおける反応R2のもとの制約が次のように変更される:
0≦R2≦0
考慮に入れる調節ネットワークの効果および関連する値に対する条件依存的な制約セットにより、生化学的反応ネットワークの挙動を、考慮される条件についてシミュレーションすることができる。これにより、プロセス100が工程180へ移動する。上記制約に示したとおり、ここで阻害される反応R2による用例モデルについては、代謝産物Cは、そこに表現されたネットワークに取り込まれないであろう。Eの最大の産生は、やはり線型計画法の使用によって算出することができ、5ユニット/分の値を導き出す。完全な解およびフラックス分布を図2Dに例示する。これは、図2Cに示した調節制約を伴わないモデルの解と対比される。調節制約の統合により、問題のための解空間が作り直され、用例ネットワークの産生能力を減少した。
上記記述は、調節制約を生化学的反応ネットワークのモデルに組み込むことができ、種々の条件下で系の性能をシミュレーションするために使用することができる、一般的なプロセスを示し、プロセス100を終結させる。上記記載のマトリックスまたはその他などの、反応物を反応ネットワークの反応と関係づけるその他のデータ構造を本プロセスに使用できることが理解される。また、可変制約の値を変更させるための関数として、調節反応についてその他の表現を使用できることが理解される。このような表現は、たとえばファジー論理(fuzzy logic)、発見的な規則に基づく記述、微分方程式、または系の動態力学を詳述する速度方程式を含み得る。
調節の分子機序の組み込み
上記例証したとおり、調節構造は、反応が特定の環境条件によって阻害されることを述べる一般的な制御を含むことができる。したがって、生物内の特定の化学反応の活動の性質を決定する原因となる調節構造に分子機序およびさらなる詳細を組み込むこともできる。その上、調節は、本発明のモデルによってシミュレーションすることができ、モデル化された反応ネットワーク内に含まれる正確な分子機序についての知識なしに、全体的特性を予測するために使用することができる。したがって、本モデルは、ネットワークのいずれか1つの反応のインビボにおける観測からは明らかでないか、もしくはインビボにおける特定の反応に対する効果が知られていない全体的調節事象または原因の関係を、インシリコで予測するために使用することができる。このような全体的な調節効果は、pH、温度、レドックス電位、または時間経過の変化などの全体的な環境要因から生じるものを含み得る。
生化学的反応ネットワークが総細胞代謝ネットワークであって、その大多数の反応は、遺伝子が生物のゲノムにコードされている酵素およびタンパク質によって触媒される生化学的反応ネットワークである場合を考える。ネットワーク内には、あらゆる反応の活性状態を制御して決定するための広範な潜在的機構がある。調節制御は、たとえば転写制御;RNAプロセシング制御;RNA輸送制御(真核生物のみ);翻訳制御;mRNA分解制御、または活性化、阻害、リン酸化、もしくは必要な補助因子などのタンパク質活性制御を含む種々のレベルで起こることができる。ひとまとめにすると、これらの調節反応は、どの遺伝子および対応するタンパク質が細胞に発現されるかを決定するであろう。したがって、必要とされる遺伝子が必要とされる調節または制御環境と共に細胞に存在する場合、関連する化学反応は進行することができる。
図3は、遺伝子関連反応に関する多くの異なったタイプの調節事象を含む反応の、用例調節ネットワークを例示する概略図を提供する。これらの事象は、たとえば同じか、または異なったオペロンのタンパク質もしくはそのサブユニットの転写の誘導性の調節、タンパク質または酵素サブユニット(構成的におよび誘導的に発現される遺伝子の両者によってコードされるものを含む)の構築、または機能的な酵素のための補助因子の必要性を含むことができる。上記した論理ステートメントなどの関数は、これらの調節事象を表すためのモデルに含まれ得る。図3に示すように、論理的プロセス(rxnLogic)の状態は、反応に適用される条件特異的な制約セットを決定することにより、化学量論的反応を制限する。図3に示した調節ネットワークは、転写因子(TF)を経た転写レベルの調節を含み、遺伝子の構成的な発現を示す。さらに、図3は、転写、翻訳、タンパク質構築、および補助因子の必要性のプロセスを、どのように論理ステートメントに組み込むことができるかを示す。論理的プロセスおよび関数は、活性化事象のための(a1、a2)、転写事象のための(c1、c2、c3)、翻訳事象のための(l1、l2、l3)、タンパク質構築のための(p1)、および反応プロセスのための(rxnLogic)を含む。記銘変数は、転写因子、mRNA転写産物、翻訳されたタンパク質サブユニット、および機能的タンパク質に対応する(TF*、M遺伝子1、M遺伝子2、M遺伝子3、P遺伝子1、P遺伝子2、P遺伝子3、およびProtein)である。論理ステートメントの使用は、たとえばThomas, J. Theor. Biol. 73:631-656 (1978)(非特許文献11)に記載されている。
過渡的実施
本発明は、第一回目および第二回目において生化学的反応ネットワークの全体的特性を決定するための方法を提供する。本方法は、(a)生化学的反応ネットワークにおける複数の反応物と複数の反応を関係づけるデータ構造であって、前記反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、および、基質と産物を関連づける化学量論係数を含み、少なくとも1つの反応は調節された反応である、データ構造を提供する工程と;(b)複数の反応のための制約セットであって、前記制約セットは調節された反応のための可変制約を含む、制約セットを提供する工程と;(c)可変制約に条件依存的な値を提供する工程と;(d)目的関数を提供する工程と;(e)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも1つの第一回目のフラックス分布を決定することにより、第一回目の生化学的反応ネットワークの全体的特性を決定する工程と;(f)工程(e)繰り返すことにより、第二回目の生化学的反応ネットワークの全体的特性を決定する工程とを含む。本方法は、たとえば、工程(e)の繰り返しの前に可変制約に提供された値を修正する工程を含むことができる。
上記の通り、本モデルの調節成分は、転写調節並びに代謝に関連したその他の調節事象を記述するために、ブール論理方程式または機能的に同等な方法の開発によって特定することができる。一例として転写調節を使用すると、転写は、転写事象に依存する反応の制約において、値1によって表すことができ、転写の不存在は、値0によって表することができる。同様に、酵素または調節タンパク質の存在、または細胞内もしくは細胞外のある条件の存在は、酵素、タンパク質、または条件が存在する場合は1として表され、そうでない場合は0と表されてもよい。ブールの論理表現は、AND、OR、およびNOTなどの周知の修飾因子を含むことができ、これを使用して調節事象の結果を支配する方程式を開発することができる。
遺伝子の発現状態および関連する反応の活性は、細胞内の動的特性である。細胞環境中で条件が変化するので、遺伝子は、連続的にアップレギュレートされ、またはダウンレギュレートされる。この状況は、細胞内で過渡的なプロセスの調節がなされる。調節構造においてこの状況を取り扱うために、論理的記述のそれぞれのプロセスについて時間遅れ(time delay)を導入することができる。時間遅れは、Thomas, J. Theoretical Biol. 42:563-585(1973)(非特許文献12)に記載されたように、ブールの論理モデリングによって表現することができる。
時間遅れによりモデル化することができる例示的な系を図4に表す。この系は、プロセスtransによって転写される遺伝子Gを含み、酵素Eを生じる。次いで、この酵素は、基質Aの産物Bへの転換をする反応rxnに触媒作用を及ぼす。産物Bは、転写プロセスtransが阻害されるようにGの近くの結合部位と相互作用する。言い換えると、転写事象transは、遺伝子Gがゲノムに存在し、産物Bが存在せずにDNAに結合しない場合に生じる。この状況を記載する論理方程式は:
trans= IF (G)AND NOT(B)
である。
タンパク質合成のための一定時間が経過した後、転写/翻訳プロセスtransの進行により、酵素Eの有意な量を生じるであろう。同様に、あるタンパク質の減衰時間の後、プロセスtransの不存在により、Eの減衰そして最終的に枯渇を生じるであろう。
反応rxnを進行させるために必要なのは、AおよびEの存在であり、そのための論理方程式は:
rxn = IF (A) AND(E)
と書くことができる。
所与の時点の細胞における酵素または調節タンパク質の存在は、細胞の以前の転写履歴並びにタンパク質合成および減衰の速度に依存する。特定の転写ユニットの転写事象が生じたために、タンパク質合成のための充分な時間が経過した場合、酵素Eが細胞に存在すると考えられる。酵素Eは、細胞がその特定の転写ユニットについて別の転写事象に遭遇することなくEが減衰する時間が経過するまで、存在する。したがって、タンパク質合成および分解の時間遅れなどの動的パラメータまたは遺伝子転写の調節を表現する原因関係を、本発明のモデルに含むことができる。定常状態条件下において、タンパク質合成および分解の時間の平均は等しい。
一旦、代謝ネットワークにおける調節された酵素の存在が、所与の時間間隔(t1→t2)について決定されると、酵素が時間間隔の間に「存在しない」と決定された場合、酵素を介したフラックスがゼロにセットされる。この制限は、代謝ネットワークに一時的な制約を付加するものと考えられるかもしれない
vk(t)= 0、when t1≦t≦t2
式中、vkは所与の時点tにおける反応を介したフラックスである。所与の時間間隔において酵素が「存在」する場合、対応するフラックスは、調節によって制約されないままである。
調節を伴う生化学的反応ネットワークモデルを過渡的に実施するのためのプロセスを、図5に例示する。このプロセス200は、工程210より開始され、ここでは、まず検討されるシミュレーション時間が多くの時間工程に分けられる。例としては、1時間のシミュレーションであり、それぞれ6分の10回の工程に分割されてもよい。時間ゼロで開始して、調節構造に対する入力パラメータの初期条件は、工程220(プロセス100の工程150に類似している)において確立される。次いで、プロセス200は、工程230(プロセス100の工程160に類似している)へ移動し、工程220で確立された入力パラメータに基づいて、生化学的反応ネットワークモデルにおける反応と関係する調節変数の状態を決定する。次いで、生化学的反応ネットワークの反応に配置された制約は、ネットワークのそれぞれの反応と関係する調節変数の状態に基づいて改良される。この工程240は、プロセス100の工程170に類似している。次いで、プロセス200は、工程250に移動し、ここでは、プロセス100の工程180に類似した反応ネットワークについてのフラックス分布が算出される。次いで、プロセス200は、工程260における決定を経て進行し、1が存在する場合に次の進んだ時点へ進む。さらなる時点がない場合、プロセス200は終了する。さらに考慮される時間工程がある場合、プロセスは工程270に進む。この工程において、調節構造に対する入力のための初期条件および初期反応制約は、工程250において見出された以前の時間工程から算出された解に基づいて設定される。次いで、問題は、工程280(プロセス100の工程150に類似している)の時点で完全に公式化され、ここでは、シミュレーションされる条件に基づいて、条件に対してさらなる変化を挿入することができる。次いで、プロセスは、工程230、240、および250を介したループとなり、工程260において決定に達し、再び次の時点へと続く。次いで、プロセス200は、指定された条件に対するモデルの完全な過渡応答を提供するであろう。
時間遅れ、またはその他の時間依存的な調節構造の記述を使用することにより、環境条件の変化に対する反応ネットワークの過渡応答を予測する機能が与えられる。また、本発明のこの態様は、基質利用可能性などの環境要因の変化に対する全体的応答、または遺伝子除去もしくは付加などの内部の変化に対する全体的応答を調査するための、実験的に対して計算的な方法を提供する。
代謝および調節の細胞全体のモデルを考慮する場合、この解析により、遺伝子発現の過渡的な変化を予測することができ、したがって遺伝子発現を検討するための、実験的ストラテジーに対して計算的ストラテジーを提供する。したがって、本発明は、遺伝子チップまたはマイクロアレイ発現実験の結果を解析し、解釈し、および予測するためのハイスループットな計算方法を提供する。遺伝子発現レベルを予測するための、本発明のモデルの使用を実施例IVに示し、図8、9、および10のパネルCに示す。
ゲノム規模の実施
小さな反応ネットワークに関して上記例証したが、複数の調節された反応を含む複数の反応のための調節された生化学的反応ネットワークモデルを構築して、実行することができる。本明細書で使用されるものとして、反応、反応物、または事象に関して使用されるときに、「複数」の用語は、少なくとも2つの反応、反応物、または事象を意味することが意図される。本用語は、2から特定の生物に天然に生じる数の範囲のいかなる数の反応、反応物、または事象をも含み得る。したがって、本用語は、たとえば少なくとも10、50、100、150、250、400、500、750、1000もしくはそれ以上の反応、反応物、または事象を含み得る。また、本用語は、特定の生物に天然に生じる反応の総数の少なくとも20%、30%、50%、60%、75%、90%、95%、または98%など、特定の生物において天然に生じる反応の総数の一部を含み得る。生物全体の代謝反応または実質的に生物の代謝反応の全てを含む調節モデルは、ゲノム規模調節代謝モデルである。
一つの態様において、本発明は、ゲノム注釈データおよび選択的に生化学データから構築されるゲノム規模調節代謝モデルを提供する。シーケンスされたゲノムを有する標的生物の代謝遺伝子および調節遺伝子の機能は、同様の生物に由来する遺伝子のデータベースに対して相同検索をすることによって決定することができる。一旦、潜在的な機能が標的生物のそれぞれの代謝および調節遺伝子に割り当てられると、生じるデータを解析することができる。本発明のこの態様において使用することができる注釈および情報は、ゲノム配列、注釈データ、または転写ユニットの位置もしくは調節タンパク質の結合部位などの調節データ、並びに生物のバイオマス要求を含む。このような情報は、代謝遺伝子型および調節遺伝子型を表す本質的にゲノムとして完全なデータ構造を構築するために使用することができる。これらのデータ構造は、上記したものなどの数学的方法を使用して解析することができる。
図6は、生物由来のゲノム配列および生化学的データからゲノム規模の代謝調節モデルを作成するための手順を例示する工程系統図を示す。このプロセス300は、生物のシーケンスされたゲノムを得ることにより、工程310で開始する。多くの生物のゲノムのDNA配列は、The Institute for Genome Research database(TIGR)、the Kyoto Encyclopedia of Genes and Genomes(KEGG)(Ogataら、Nucleic Acids Res. 27:29-34(1999)(非特許文献13)などの公開されている商業的データベース、および現在個人的なセクターから利用可能なその他多くのものにおいて、容易に見出すことができる。
一旦、標的生物のゲノムDNAのヌクレオチド配列が得られると、ゲノム内から遺伝子をコードするコード領域またはオープンリーディングフレーム(ORF)を決定することができる。これにより、プロセス300は、工程320へ移動され、ここで、ORFが同定される。たとえば、適節な位置、鎖、およびオープンリーディングフレームのリーディングフレームを同定するために、プロモーターもしくはリボゾーム結合部位の配列などのシグナルによって、または位置塩基頻度もしくはコドン優先度などの内容によって、遺伝子検索を行うことができる。ORFを決定するためのコンピュータプログラムは、たとえばウィスコンシン大学の遺伝子コンピューターグループ(University of Wisconsin Genetics Computer Group)および国立バイオテクノロジー情報センター(National Center for Biotechnology Information)から入手可能である。
ゲノム配列の機能的な注釈における次の工程は、機能の割り当てられた配列上のコード領域またはオープンリーディングフレーム(ORF)に注釈をつけることである。これにより、プロセス300は、工程330へ移動され、ゲノム注釈として当業者に既知のものを完了する。それぞれのORFは、これに推定機能を割り当てることを目的として、まず最初にデータベースに対して検索がなされる。BLASTまたはFASTAファミリのプログラムなどの確立されたアルゴリズムを、所与の配列と配列データベースに蓄積された遺伝子/タンパク質配列との間の類似性を決定するために使用することができる(Altschulら、Nucleic Acids Res. 25:3389-3402(1997)(非特許文献14)およびPearsonら、Genomics 46:24-36 (1997)(非特許文献15))。新たにシーケンスされた生物の遺伝子の大部分は、通常、その他の生物で見出された遺伝子に対する相同性から容易に同定することができる。
シーケンスされた生物の数は増えるので、機能によるか、または位置による遺伝子クラスター形成などの遺伝子産物の機能を決定するための新規技術が開発されている。関連する代謝機能を持ついくつかの遺伝子は、細胞において一定の機能を遂行する一定の「経路」を特定するものと考えられるかもしれない。一旦、遺伝子にORFの相同性による関数が割り当てられると、遺伝子を経路によって分類することができ、経路を埋める遺伝子などを位置づけるために、その他の生物に対する比較を、利用可能なコンピュータアルゴリズムを経て行うことができる。種々の生物のクロモソームの相対的な遺伝子座の比較を、オペロンクラスター形成を予測するために使用してもよい。予測されたオペロンは、アサートされた(asserted)経路、および遺伝子機能の帰属のためのその他の方法として使用することができる(Overbeekら、Nucleic Acids Res. 28:123-125(2000)(非特許文献16)およびEisenbergら、Nature 405:823-826 (2000)(非特許文献17))。
多くの場合、完全およびさらに部分的なゲノム、または「ギャップのある」ゲノムの機能的な注釈は、以前に行われており(Selkovら、Proc. Natl. Acad. Sci. USA 97:3509-3514(2000)(非特許文献18))、What Is Thereデータベース(WIT)(Overbeekら、Nucleic Acids Res. 28:123-125(2000))またはKEGGなどのウェブサイトで見出すことができる。
次いで、プロセス300は、工程340へ移動し、ここでは、細胞の代謝および/または代謝調節に関係する遺伝子の全てが決定される。細胞における代謝反応および機能に関する全ての遺伝子は、遺伝子型のサブセットのみを含む。細胞における代謝反応および機能に関与する遺伝子を含む遺伝子サブセットは、特定の生物の代謝遺伝子型と呼ばれる。したがって、生物の代謝遺伝子型は、生物の代謝に関与する遺伝子のほとんどまたは全てを含む。代謝遺伝子型における代謝遺伝子セットから産生される遺伝子産物は、ゲノム配列から決定されたような標的生物内で起こることが知られている酵素反応および輸送反応の全てまたは大部分を実行する。
細胞における遺伝子産物合成の転写調節に関与する遺伝子のコレクションには、遺伝子型のもう一つのサブセットを含む。このサブセットをさらに減少させて、代謝遺伝子型に見出される遺伝子または転写調節遺伝子のいずれかの転写を調節するこれらの遺伝子を取り込むことができる。この遺伝子のサブセットの選択を始めるためには、機能的な遺伝子の割り当てのリストを単に検索して、細胞の代謝に関与する遺伝子を見出すことができる。これは、中枢代謝、アミノ酸代謝、ヌクレオチド代謝、脂肪酸代謝および脂質代謝、含水炭素同化作用、ビタミンおよび補助因子生合成、エネルギーおよびレドックス生成、または上記したその他のものなどの代謝経路に直接、もしくはその調節に関与する遺伝子を含むであろう。
プロセス300の経路は、工程351-354および工程361-364が平行して起こるものとして記述され、それぞれ代謝モデルおよび調節モデルの構築をカバーする。一旦これらの経路が完了されると、モデルの代謝成分および調節成分が特定される。これらの経路を以下にさらに詳細に記載する。
現在までにゲノムが完全にシーケンスされた生物の多くはまた、広範な生化学的研究の対象であった。妥当な生化学的反応をゲノムに見出された酵素に割り当てるために;ゲノムにおいてすでに見出された情報を確認して精細に調べるために;または現在のゲノムデータによって示されていない反応もしくは経路の存在を決定するために、代謝生化学の文献を調査することができる。
工程351では、代謝遺伝子型の遺伝子のそれぞれに対し、それぞれの代謝遺伝子産物によって行われる反応についての生化学的情報を収集する。代謝遺伝子型のそれぞれの遺伝子については、基質および産物、並びにそれぞれの遺伝子の遺伝子産物によって行われるどのような反応の化学量論も、生化学文献を参照することにより、または実験技術を介して決定することができる。これは、反応の熱力学的な不可逆性または可逆性の性質に関する情報を含む。それぞれの反応の化学量論は、反応物が産物に転換される分子の比を提供する。
場合によっては、インビトロにおけるアッセイおよび実験データから生じることが知られている細胞代謝におけるいくつかの反応が、なお残っていてもよい。これらは、遺伝子またはタンパク質がさらに同定されなければならないか、またはゲノムシークエンシングおよび機能の割り当てから同定されていない、かなり特徴づけられた反応を含むであろう。また、これは、輸送に関する特徴づけられていない遺伝子による、細胞へまたは細胞からの代謝産物の輸送を含む。したがって、遺伝子情報を欠失する1つの理由は、既知の生化学的転換を行う実際の遺伝子の特徴付けを欠いているためであろう。したがって、既存の生化学の文献および利用できる実験データを慎重に再調査することにより、さらなる代謝反応を、代謝遺伝子型から決定される代謝反応のリストに加えることができる。工程352では、これらのいわゆる非遺伝子関連反応の付加を導き、モデルにおける反応リストを増大させる。これは、反応の基質、産物、可逆性、不可逆性、および化学量論に関する情報を含むであろう。
次いで、プロセス300は工程353へ移動し、ここでは、ゲノム、生化学的および生理学的なデータから集められた集合的な情報に基づいて、生物株で起こると想定される反応を一覧表示する。この生物株特異的な反応のセットは、生物特異的反応インデックスと呼ばれる。この反応インデックスは、ネットワークで起こり得る化学反応のリストを含む。反応およびそれらの化学量論についてのこの情報は、本発明のデータ構造において、マトリックス、典型的には化学量論的マトリックスと称するものなどとして表すことができる。マトリックスのそれぞれの列は、所与の反応またはフラックスに対応し、それぞれの行は、所与の反応/フラックスに関与する種々の代謝産物に対応する。可逆反応は、正方向と逆方向の両方で作動することができる1つの反応として表すことができ、および1つの正反応と1つの逆反応とに分けることができ、この場合は全てのフラックスは正の値のみを取ることができる。したがって、マトリックスにおける所与の位置は、興味の対象の特定のフラックス(所与の列に一覧を示した)における代謝産物(所与の行に一覧を示した)の化学量論的関与を記述する。あわせると、ゲノム特異的な化学量論的マトリックスの全ての列は、生物に存在することが決定された化学転換および細胞輸送プロセスの全てを表す。これは、代謝ネットワーク内で作動する全ての内部フラックスおよびいわゆる交換フラックスを含む。生じた生物株特異的な化学量論的マトリックスは、ゲノム的におよび生化学的に定義された生物の基本的代謝の表現である。
制約は、反応の熱力学および必要とされるさらなる生化学的情報に基づく反応に配置することができる。これらの制約は、一般的な問題の公式化において反応に配置される「デフォルト制約」と呼ばれ、工程354で特定される。ネットワークにおける反応の全ては、上の境界および下の境界により制約することができる。これらの境界は、有限の数値、ゼロ、または負もしくは正の無限大の値であり得る。可逆反応については、下の境界は、負の無限大に設定され、上の境界は、正の無限大に設定されるであろう。これらの境界の設定により、そのフラックスレベルに関して制約のない反応が効果的に行われるであろう。あるいは、反応は不可逆的であってもよく、この場合、下の境界はゼロであり、および上の境界は正の無限大であり、これにより、反応が正のフラックス値をとるように強制する。反応の最大フラックス容量に関する情報が利用できる場合、上の境界をこの最大容量と等しく指定することができ、これは許容される反応のフラックスレベルをさらに制約するのに役立つであろう。
工程354の完了により、本モデルの代謝部分の構築が完了する。平行して、後述する工程361から364に詳述するとおり、本モデルの調節部分も構築される。
調節構造を構築する際に使用することができる2つの潜在的なアプローチは、「ボトム−アップ」および「トップ−ダウン」アプローチである。「ボトム−アップ」アプローチでは、ユニットとして転写される単一遺伝子または一群の遺伝子であり得る転写ユニットを決定するために、生化学の文献を検索する。これは、生化学の文献から、または配列解析などのバイオインフォマティクス技術を使用してプロモーター領域を相同性等によって見出すことで決定することができる(Ermolaevaら、Nucleic Acids Res. 29:1216-1221 (2001)(非特許文献19))。RegulonDBなどのデータベースは、一般に研究された生物について、この情報を公衆に利用可能にする(Salgadoら、Nucleic Acids Re. 29:72-74 (2001)(非特許文献20))。
次いで、生物の転写ユニットを位置づけることができる。これは、配列解析により、たとえば、細菌ゲノムの推定上のプロモーター結合配列を位置づけること、並びに機能の割り当ておよび位置によって、もしくは生化学の文献を研究することによって、遺伝子を群化することにより行われてもよい。プロセス300の工程361では、本モデルの調節成分と考えられる代謝および調節遺伝子が、転写ユニットとして同定される。
同定された転写ユニットの転写調節は、生化学の文献および/またはデータベースを使用して、さらに調査することもできる。それぞれの転写ユニットは、1つまたは複数の調節機構によって調節されてもよく、または構成的に発現されていてもよい。タンパク質は、一般にこれらが転写ユニットの転写を抑制または活性化するであろうDNA上の部位に結合する。これらの結合部位は、既知の結合部位との相同性により、特定のゲノム配列を同定してもよい。さらに、それぞれの調節タンパク質について、このような結合部位および調節タンパク質を実験的に調査して、抑制または活性化などの調節の性質としてこのような特徴を決定してもよく;適切な結合部位に対するそれぞれの調節タンパク質の結合親和性、または特定の転写ユニットの発現を調節するために同時調節タンパク質の共同/相互作用を決定してもよい。
配列解析または機能的相同性による、転写ユニット上のこれらの調節結合部位の同定を、プロセス300の工程362に表す。したがって、代謝ネットワークにおける反応がどのように調節されるかを決定する初期プロセスは、予測された調節事象と転写ユニットの関連を決定することによって行うことができる。決定を完了するために、工程363を行うことができ、ここでは、転写ユニットの実際の生物学的調節方法が、これが既知である限り解明される。さらに、酵素の阻害または酵素補助因子の必要性などの、転写から独立した事象に関連したどのような調節をもこの工程で集めることができ、調節構造にさらなる情報を付加することができる。
工程361〜363に記載した調節構造を解明するための別のアプローチは、どの遺伝子が特定の生理学的条件下で実際に使用されているかを決定するために実行される発現プロファイリングまたは同様の技術、並びに発現遺伝子間の関係を現象学的および系統的に見出すための系同定の方法を含む。したがって、発現プロファイリングおよび系同定の使用により、全体の系の挙動が一度に測定されるので、本質的に「トップ−ダウン」アプローチを含むアプローチを介して、遺伝子の群、関連する反応、またはさらに興味対象の生理学的条件下で操作可能な極度経路を見出すために使用することができる。「トップ−ダウン」または「ボトム−アップ」アプローチは、ゲノム規模で生物の調節構造を定義するために、別々に、または組み合わせて使用してもよい。
本モデルに包含するために同定された生物学的調節機構および現象により、次いで、プロセス300は工程364へ移動し、ここでは、調節構造は、本モデルの代謝成分による統合のためのデータ構造に、数学的に表現される。本モデルの調節成分は、ブールの論理(または、等価)方程式を開発することによって特定し、転写調節並びに代謝と関連するその他のあらゆる調節事象を記述することができる。これは、転写ユニットが転写される場合、転写ユニットの発現を値1に制限し、転写されない場合、0に制限することを含む。同様に、酵素または調節タンパク質の存在、または細胞内もしくは細胞外の一定条件の存在は、酵素、タンパク質、または条件が存在する場合、1と表してもよく、そうでない場合、0と表してもよい。特定の転写ユニットからのタンパク質の合成時間は、実験的に、生化学の文献から、または他のタンパク質に対する類似性から見積もって決定してもよい。調節パラメータ間のさらなる時間依存性を特定することもでき、遅延を調節構造に導入することもできる。
プロセス300のこの時点で、代謝および調節ネットワークが開発され、かつ数学的に記述されて、これらの完全な解析をすることができる。調節が現在、代謝に配置する制約の影響を評価するために、調節制約のない代謝ネットワークの研究に使用される一般的なアプローチを、なお使用することができる。この例は、解空間に対する調節の効果を検討するために、経路解析と調節構造を組み合わせることである。経路解析では、解空間の特徴を研究するために凸解析の原理を使用する。経路解析によって算出される極度経路は、解空間のエッジであり、ここには最適な解がなければならない(Schillingら、J. Theor. Biol. 203: 229-258 (2000))。代謝ネットワーク能力を記述する極度経路は、解空間にまたがる一組のベクトルを決定することによって算出される。それぞれのベクトルは、極度経路を表す(Schillingら、Biotech. Bioeng. 71:286-306 (2000))。これらのベクトルを作製するために使用されるアルゴリズムは、最近詳細に記載されている(Schillingら、J. Theor. Bio. 203:229-248 (2000))。所与の環境において対応する調節制約を決定し(たとえば、遺伝子転写の抑制)、課された調節制約と矛盾する極度経路を除去する。この手順では、解空間を減少し、かつ所与の状況についてモデル減少の方法として役立つようにこれをカスタマイズする。
プロセス300では、フラックスバランス解析の使用を介して、統合された調節および代謝ネットワークを検討し、生物の最適な代謝特性を研究する。これは、プロセス300を工程370へ移動し、ここでは、生物特異的な生化学的および生理学的なデータのコレクションが集められる。これらのデータは、バイオマス組成、取込み速度、および種々の環境条件下における生物の維持要求を含むことができる。生物の取込み速度および維持要求を決定するために実験を行うことができ、またあるいは、これらの値は、文献から得ることもできる。細胞に輸送される代謝産物の取込み速度は、増殖培地類からの基質の枯渇を測定することにより実験的に決定することができる。また、ユニットバイオマスあたりの取込み速度を決定するために、それぞれの時点のバイオマスの測定を行うことができる。維持要求は、ケモスタット実験から決定することができる。たとえば、グルコース取込み速度を増殖速度に対しプロットして、y-切片を非増殖関連維持要求と解釈することもできる。増殖関連維持要求は、増殖速度対グルコース取込み速度のプロットの実験的に決定された点に、モデル結果をあてはめることによって決定することができる。
その上、生物に配置された代謝需要を決定することもできる。代謝需要は、細胞増殖が考慮される目的関数である場合、細胞の乾燥重量組成から容易に決定することができる。大腸菌および枯草菌などのよく研究された生物の場合、乾燥重量組成は、公開された文献を利用できる。しかし、場合によっては、実験的に問題の生物についての細胞の乾燥重量組成を決定することが必要であろう。これは、ヌクレオチド、アミノ酸、その他の特定の画分を提供する、より詳細な解析により、RNA、DNA、タンパク質、および脂質を含む細胞の種々の成分について達成することができる。
提供された充分な生化学的および生理学的なデータにより、適切な制約を関連反応に対して特定することができ、増殖に関する需要フラックスが正しい位置に置かれる。これにより、統合された調節代謝モデルを使用して、生物に関して解決されるべき一般的な問題の完全な公式化が導かれる。これにより、プロセス300が工程380へ移動し、ここでは、フラックスバランス解析の基礎を形成している一般的な線型計画法問題が、代謝および調節制約の組合せに基づいて公式化される。これは、以下で詳細に議論する。
代謝過渡事象および/または代謝反応を特徴づけている時間定数は、時間から日オーダーの細胞増殖の時間定数と比較して、ミリ秒から秒オーダーであり、典型的には非常に迅速である(McAdamsおよびArkin, Ann. Rev. Biophy. Biomol. Struc. 27:199-224 (1998)(非特許文献21))。したがって、過渡的なマスバランスを単純化して、定常状態の挙動を考慮するだけにすることもできる。代謝系におけるすべての代謝産物に在る動的マスバランスから得られた時間微分(time derivative)を削除することにより、以下のマトリックス記号で表される線形方程式の系が得られる;
S・v=0、
式中、Sは系の化学量論的マトリックスをいい、vはフラックスベクターである。この方程式は、長期間にわたり、代謝産物の形成フラックスが減生フラックスによってバランスされていなければならないことを単に述べている。さもないと、代謝産物の有意な量が代謝ネットワーク内に蓄積するであろう。生物学的系にこの方程式を適用すると、Sは反応インデックスから生じる系に特異的な化学量論的マトリックスを表す。
定義された代謝遺伝子型の代謝能力を決定するために、上記方程式を、代謝フラックスおよび内部代謝反応vについて解き、一方で、これらのフラックスの活性に制約を課す。典型的には、代謝フラックスの数(n)は、マスバランスまたは代謝産物の数(m)より大きく(すなわち、n > m)、この方程式および系のフラックスに配置されるいかなる制約をも満たす複数の実行可能なフラックス分布が生じる。この解の範囲は、代謝反応の所与のセットで達成することができるフラックス分布の柔軟性を表す。この方程式に対する解は、制限された領域に見いだされる。この方程式および系のフラックスに配置されるいかなる制約をも満たす許容される解は、代謝遺伝子の特定のセットにより達成することができる全ての代謝フラックス分布を定義するので、この部分空間は、所与の生物の代謝遺伝子型の能力を定義する。
代謝遺伝子型の特別な利用を、これらの特定の条件下で発現される代謝表現型と定義することができる。代謝関数の目的は、所与の代謝遺伝子型のなかで代謝ネットワークの「最良」の使用を探索するために選択され得る。上記方程式に対する解は、特定の目的を最小にするフラックス分布が見出される線型計画法の問題として公式化することができる。数学的に、この最適化は、以下のように示すことができる;
Figure 2007164798
式中、Zは、代謝フラックスviの線形組合せとして表される目的である。また、最適化は、等価極大問題(equivalent maximization problem)として;すなわちZにおける符号を変えることによって述べることができる。
このZの一般的な表現は、多くの多様な目的(objective)の公式化を可能にする。これらの目的により、株、遺伝子型代謝能力の探索、または細胞の最大増殖などの生理学的に意味がある目的関数のための目的をデザインすることができる。こうした適用については、増殖は、バイオマス組成の文献値または実験的に測定した値に基づいて生合成の必要性の観点で定義されるものである。したがって、バイオマス生成は、適切な割合で、中間代謝物を排出する更なる反応フラックスとして記載することができ、目的関数Zとして表される。中間代謝物を排出することに加えて、この反応フラックスは、遭遇するに違いないどのような維持要求をも取り込むように、ATP、NADH、およびNADPHなどのエネルギー分子を利用するように形成することができる。次いで、この新規反応フラックスは、系が目的関数として満たさなければならないもう一つの制約/バランス方程式となる。化学量論マトリックスSにさらなる列を付加して、代謝系に配置された産生需要を記述するためにこのようなフラックスを表すことに類似している。このように、この新規フラックスを目的関数としてセットし、その他のフラックスの全てに対する所与の制約セットについて、このフラックスの値を最大にするように系に要求することが、生物の増殖をシミュレーションするための方法である。
線形計画法を使用して、上記の通りに、以下の形態で、代謝ネットワークにおけるいかなるフラックスの値にもさらなる制約を配置することができる。
βj≦vj≦αj
これらの制約は、所与の反応を介して最大限に許容されるフラックスの表現であることができ、おそらく、αjの値が有限の値をとる場合に存在する酵素の限られた量から生じた。また、値βjが有限の値をとる場合の一定の代謝反応を介した最小フラックスについての知識を含むように、これらの制約を使用することができる。その上、ある可逆反応または輸送フラックスをそのままにすることを選択して、正および逆様式で作動する場合、βjを負の無限大に、およびαjを正の無限大にセットすることにより、フラックスを制約がないままにしてもよい。反応が正の反応だけで進行する場合、βjはゼロにセットされるが、αjは正の無限大にセットされる。
これらの基本的な制約を反応の値に割り当てるこの工程は、プロセス300の工程354において起こるものである。これらの制約は、工程380において公式化された興味の対象の問題について検討すべき、一定の環境または遺伝的条件に基づいて、さらに改良することができる。たとえば、遺伝的欠失の事象をシミュレーションするために、上記方程式においてβjおよびαjをゼロに設定することにより、問題の遺伝子に関連する対応する代謝反応の全てを介したフラックスを、ゼロに減少させる。
インビボにおける生物の環境に基づいて、バイオマスのために必須な分子の生合成に利用できる代謝資源を決定することができる。対応する輸送フラックスを活性にすることにより、代謝ネットワークによって産生される基質および副生成物の入力および出力によるインシリコ生物が提供される。したがって、一例として、特定の増殖基質の不共存をシミュレートすることを望む場合、単に対応する輸送フラックスを制約することにより、代謝産物を細胞に入れることができ、βjおよびαjをゼロにさせることにより、ゼロになる。他方、基質が輸送機構を経て細胞に入ること、または出ることのみができる場合、対応するフラックスは、このシナリオを適切に制約して反映することができる。
系においてフラックスに配置されるあらゆる一般的な制約と共にゲノム特異的な化学量論的マトリックスの線型計画法表現、および起こりうるあらゆる目的関数により、インシリコ代謝モデルの公式化が完了する。次いで、多数の条件をシミュレーションすること、および線型計画法の使用を介してフラックス分布を生じることにより、インシリコモデルを代謝能力の予測のために使用することができる。プロセス100で議論したとおりの調節制約の取込みにより、いかなる調節の表現も伴わずに、制約に基づくモデリングの現在の技術に基づいて、困難であった代謝性能問題を探索するために、または解空間を減少して制約に基づくモデルの予測力を増大するために、本モデルを使用することができる。
一旦モデルが構築されたならば、プロセス200に記載したものなどの手順を使用して、表現型の動的プロフィールを作製するためにこれらを使用してもよい。このアプローチは、たとえば、組合せ代謝/調節モデルから、動的な遺伝子発現、代謝フラックス、および細胞外の基質/副産物濃度を算出するために使用することができる。
バッチ実験において、消費された代謝産物および分泌された代謝産物の時間プロフィール、並びに遺伝子発現プロフィールを予測するために、実験時間を短時間の工程Δtに分割してもよい(VarmaおよびPalsson, Biotechnology 12:994-998(1994)、並びにVarmaおよびPalsson、Applied Environ. Micro. 60: 3724-3731 (1994)(非特許文献22))。
t=0で開始し、ここでは実験の初期条件が指定され、プロセス200で議論したとおり、次の工程のための濃度および遺伝子発現を予測するために組合せ調節/代謝モデルを使用してもよい。細胞の初期条件は、実験の条件によって、またはコンピュータシミュレーションの以前の条件によって決定される。細胞外の基質濃度またはバイオマス濃度などの条件は、実験的に見出すことができる。調節タンパク質の初期における有無は、実験的に(すなわちマイクロアレイもしくは遺伝子チップ技術を使用することによって)、またはブールの論理方程式の定常状態解を考慮することによって見出してもよい。
転写および代謝調節は、上記の通りにブールの表現を使用して記述することができる。転写の状態は、特定の時間間隔における所与の条件から見出される。特に、転写は、細胞内代謝産物、細胞外代謝産物、調節タンパク質、シグナリング分子、またはこれらもしくはその他の因子のあらゆる組合せの存在または過剰によって変化されてもよい。それぞれの転写ユニットの転写を支配する論理的方程式は、転写が起こるか、または起こらないかどうかを決定するために使用することができる。
細胞内における酵素または調節タンパク質の存在は、細胞の以前の転写履歴、並びにタンパク質合成および減衰の速度に依存する。特定の転写ユニットの転写事象が生じたために、タンパク質合成に必要な時間が経過した場合、タンパク質(類)は、細胞内に存在し、細胞が特定の転写ユニットについて別の転写事象をうけることなくタンパク質(類)が減衰するための時間が経過するまで、細胞に存在したままであると考えられる。
一旦代謝ネットワークにおける全ての調節された酵素の存在が所与の時間間隔について決定されると、本モデルの代謝成分における反応の制約を変更することにより、過渡的な調節の効果が反映される。代謝過渡事象および/または代謝反応を特徴づける時間定数は、しばしば転写調節を特徴づけるものよりも速いオーダーであり、それぞれの時間間隔の間、準定常状態では、化学量論的マトリックスが一定に存在すると想定され得る。
一旦これらの過渡的な制約が課されて、空間の新規な体積および次元数が決定されたならば、生物のための解空間を定義する極度経路を再計算してもよい。これにより、もとの解空間の生物学的に意味があるサブセットが生成することとなり、これは以前に細胞に利用できた挙動の小画分のみを含んでいてもよい。
一旦調節によって課される制約が決定されて適用されると、以下の方程式を使用して、全ての利用できる基質の濃度を計測して、単位時間あたりの単位バイオマスにつき利用できる基質の量(毎時グラム乾燥重量あたりのミリモル)を決定することができる:
Figure 2007164798
式中、Scは基質濃度であり、Xは細胞密度である。利用できる基質が最大取込み速度より大きい場合、最大取込み速度が使用される。次いで、説明したとおりに、フラックスバランスモデルにより、実際の基質取込みSu、並びに増殖速度μおよび副生成物分泌の可能性を決定する。
一旦代謝フラックス分布が算出されると、フラックスバランス解析を使用して、次の時間工程について、細胞内条件をフラックス分布から決定することができ、次の時間工程のための細胞外基質濃度を以下の標準微分方程式から決定することができる:
Figure 2007164798
Figure 2007164798
次いで、これらの条件は、次の時点のために使用される。これは、発生をカバーしているプロセス300の工程380で公式化されることもできる1つのタイプの問題、すなわち、生物の代謝性能の過渡的調査、および生物特異的なゲノム規模の調節された代謝モデルの実施を提供する。工程380の完了により、プロセス300が終わる。
上で記載したとおり、フラックスバランス解析および関連した調節制約を統合することにより、広範囲にわたる条件下で遺伝子発現および細胞代謝をシミュレーションするための方法が提供される。上記したプロセスは、完全にシーケンスされ、かつ注釈をつけたゲノムについて調節/代謝遺伝子型を作製するために使用することができるソフトウェアアプリケーションに、全体的にあるいは部分的に具現化することができる。その上、本ソフトウェアアプリケーションは、生物が種々の条件下における増殖に必要な生体分子を産生する能力を予測するように、ネットワークをさらなる解析に使用して操作することができ、これにより、以下の実施例に示したように、遺伝子発現パターンおよび代謝フラックスにおいて生じる変化をシミュレーションすることができる。
最近のマイクロアレイおよび遺伝子チップ技術などの実験法の開発により、所与の条件下で全ての生物の遺伝子発現を決定することが可能になった。同様の規模で遺伝子発現を予測してシミュレーションする能力は、これらの新規技術の開発および使用を進めるであろう。本発明のモデルは、多種多様な条件下で、大腸菌における遺伝子転写変化を予測することが可能であり、実施例に記載し、図8〜10のパネルCに示したように、これを実験的な遺伝子配列データと直接比較してもよい。本明細書に記載した組合せ調節/代謝モデルは、定性的に遺伝子発現の変化を予測すること、インシリコで発現アレイを製作することができる。
本発明の利点は、ゲノムデータが病原体などの新たに発見された生物について利用でき、かつ機能的データが制限されたか、または利用できない場合に、使用することができるということである。この場合、特定の生物の生理学について学ぶ能力、およびいかなる特定の生化学データも伴わずにその代謝能力を調査する能力は、非常に重要となるであろう。
本明細書では、大腸菌に関して例証したが、本発明のモデルおよび方法は、生化学的情報またはゲノム配列情報が利用できるどのような生物にも適用することができる。たとえば、インフルエンザ菌(Haemophilus influenzae)(呼吸器の病原体)のモデルを、大腸菌に対する相同性から構築することができる。代謝ネットワークおよびネットワークを表現するデータ構造は、記載したとおりに、ゲノム配列から構築することができる。また、記載したとおり、調節タンパク質は、その他の生物の調節タンパク質に対する相同性から決定することができ、転写ユニットおよび調節タンパク質結合部位を同定することができる。
一旦上記の情報が決定されると、調節論理は、上で例示した大腸菌モデルなどの別の生物由来のモデルに対する相同性により、並びに調節結合部位および転写ユニットの位置から推定することができる。生物についての組合せ調節/代謝モデルの結果から、大腸菌またはモデル経路に関して本明細書に例示したものと同様の方法を使用して、代謝および遺伝子発現の変化を解析、解釈、および予測することができる。
さらに、組合せ調節/代謝モデルは、マイクロアレイデータを使用して、多数の生物について作製可能であることが想定される。この場合、アレイデータから作製される調節ネットワークを、現存のモデルに組み込むことができる。さらに、マイクロアレイデータおよび利用できる文献を、調節ネットワークを再構築するために一緒に使用することもできる。
配列情報および、または生化学情報が存在するいずれの原核生物、古生物(archae)、または真核生物も、本発明に従ってモデル化することができる。本発明のモデルおよび方法によってシミュレーションすることができるその他の生物の例は、枯草菌(Bacillus subtilis)、酵母(Saccharomyces cerevisiae)、インフルエンザ菌(Haemophilus influenzae)、ヘリコバクターピロリ菌(Helicobacter pylori)、ショウジョウバエ(Drosophila melanogaster)、またはヒト(Homo sapiens)を含む。
また、その他の生物学的ネットワークの活性または機能をシミュレーションするために、フラックスバランス解析および線形最適化による調節構造の取込みを使用することができる。当業者であれば、たとえば、細胞、細胞群、器官、生物、または生態システム、のネットワークを含む様々な生物学的ネットワークをシミュレーションするために、上記モデルおよび方法を適用することが可能であろう。ネットワークの個々の工程またはプロセスにおける活性は、特定の工程またはプロセスを、これらが作用する成分と関連づけるデータ構造に変更することができる。さらに、活性は、上記の通りに制約セットを使用して、制約され得る。一例として、本方法は、シグナリングパートナー間の相互作用が反応として表現され、かつ1つのパートナーからもう一つに流れるエネルギー量に関して制約される系を経た自由エネルギーのフラックスとして、シグナル伝達系をシミュレーションするために使用することができる。調節は、シグナリング系の間のクロストークの効果に関して、制約を変化させることによって取り込むことができる。同様に、生理学的系は、特定の器官、組織、または細胞と生理学的機能を関連づけるデータ構造を作製することにより、シミュレーションすることができ、調節データ構造または事象は、ホルモン、病原体、もしくは生理学的な系に影響を及ぼす環境要因などの刺激または傷害の効果を表現するために、取り込むことができる。もう一つの例は、生物および生態学的なプロセスを関連づけるデータ構造を構築することができる生態システムであって、調節には環境要因の変化の表現を含むことができる生態システムである。
以下の実施例は、組合せ調節/代謝モデルの構築および実施を示し、本モデル予測の実験的確認を提供する。以下の実施例は、本発明を例示することを意図するが、限定されない。
実施例I
例示的な代謝モデルにおける経路の減少
本実施例は、調節制約を有する骨格代謝モデルの構築を記述する。本実施例は、フラックスバランス解析シミュレーションにおける調節制約の含有が、本モデルによって産生される数学的な解空間の大きさおよび次元数を減少することにより、骨格代謝モデルの予測能力を増大することを示す。
コア代謝における生化学的反応ネットワークの骨格は公式化されており、20反応を含み、そのうちの7つは、図7の上段のパネルに示すように調節される。このネットワークは、解糖、ペントースリン酸経路、TCAサイクル、発酵経路、アミノ酸生合成、および細胞増殖を含むコア代謝プロセスの簡略化された表現を、異化産物抑制、好気性/嫌気性の調節、アミノ酸生合成の調節、および炭素貯蔵調節を含む対応する調節経路とともに提供した。骨格生化学的反応ネットワークは、骨格組合せ調節/代謝モデルとして表現され、ここでは、反応が反応物および化学量論係数の線形方程式として表現され、および調節が図7下段のパネルで示したように、調節論理ステートメントによって表現される。図7に示すように、4つの調節タンパク質(Rpo2、RPc1、RPh、およびRPb)は、骨格ネットワークおよびモデルの20反応のうちの7つを調節した。
骨格組合せ調節/代謝モデルを、極度経路解析を使用して解析した。既知のアルゴリズムを使用して、ネットワークにおける代謝反応を考慮することにより、所与のサンプル系について80の極度経路を計算した(Schillingら、J. Theor. Biol. 2203: 229-248 (2000))。代謝ネットワークに5つ入力し、これらの入力をブールの論理を使用して表現し、それぞれ存在する場合はONまたは存在しない場合はOFFとみなして、細胞によって認識される可能性がある合計25=32の起こり得る環境がある。これらの環境を表1に一覧を示す。それぞれの環境において、ネットワークにおける酵素のいくつかの転写は、調節により制限されてもよい。(a)細胞が利用できる基質(外部環境)および(b)細胞に存在する酵素(内部環境)によって系に課される制約は、所与の時間においてモデルに利用できる極度経路の数を減少させた。表1は、本モデルが利用できる経路の最も多い数が26であり;最も低いものが2であったことを示す。これは、調節制約に供された反応がない場合の同様のモデルと比較して、67.5%〜97.5%の間の、解空間における極度経路の数の減少と対応した。
これらの結果は、フラックスバランス解析シミュレーションにおける調節制約の含有が数学的な解空間の大きさおよび次元数を減少して、その後にさらなる制約を課すことにより、代謝ネットワークの能力を減少することを示す。
実施例II
大腸菌の代謝および調節遺伝子型並びにインシリコモデル
本実施例は、大腸菌K-12についてのゲノム規模の組合せ調節/代謝モデルの構築を示す。
大腸菌K-12ゲノムの注釈をつけた配列は、NCBI(ncbi.nlm.gov)によって維持されるサイトのGenbankから得た。注釈をつけた配列は、ヌクレオチド配列並びにオープンリーディングフレームの位置および割り当てを含んだ。また、このような注釈をつけた配列は、ゲノミック研究所(The Institute for Genomic Research)(tigr.org.)などの、その他の供与源から得ることもできる。注釈をつけた配列から、細胞の代謝および/または代謝調節に関与する遺伝子を同定した。大腸菌K-12のコア組合せ調節/代謝モデルは、細胞の代謝もしくは代謝調節、または両方ともに関与するものであると注釈をつけた遺伝子に関連する反応を含めることにより作製した。
さらにモデルを開発するために、生化学の文献の詳細な検索を行った。代謝遺伝子型の遺伝子によって表現されない生化学的データから生じることが知られるいずれのさらなる反応も、大腸菌K-12組合せ調節/代謝モデルに付加した。
tula.cifn.unam.mx:8850/regulondb/regulonintro.frameset(Salgadoら、Nucleic Acids Res. 29 :72-74 (2001))で利用できるなものなどの大腸菌調節を取扱う生化学文献およびオンライン資源を使用して、さらなる転写ユニットおよび調節タンパク質結合部位を同定した。それぞれの転写ユニットの調節の性質は、生化学の文献に基づいて決定した。調節情報は、それぞれの反応についてブールの論理表現を使用して、ゲノム特異的な調節構造に組み込んだ。
生じた大腸菌K-12コア代謝/調節モデルでは、16の調節タンパク質、および113の反応に触媒作用を及ぼす73の酵素を含む149の遺伝子産物を表現した。本モデルに含まれる酵素のうちの43の合成は、ゲノム配列注釈および生化学の文献に基づいて、転写調節によって制御されることが見出され;その結果、本モデルに対する反応のうちの45の利用可能性は、論理ステートメントによって制御された。組合せ調節/代謝ネットワークのさらなる詳細を表2に示すが、この表は、中枢の大腸菌系の代謝反応および調節規則の一覧を示す。
大腸菌の取込み速度および維持要求は、公開された文献から得られ、本モデルに交換反応として取り込んだ。生じたインシリコモデルは、大腸菌コア代謝能力およびこれらの能力の転写調節を表現した。K-12大腸菌の場合において、以下に示したように、インシリコモデルの予測能力を評価するために、全体の代謝挙動についての多数のデータおよびインビボにおける遺伝子型についての詳細な生化学情報を利用することができる。
実施例III
変異体ノックアウトシミュレーション
本実施例は、種々の炭素源における種々の大腸菌変異体の増殖をインシリコで予測するための、独立型代謝モデルおよび組合せ調節/代謝モデルの使用を記載する。本実施例は、インシリコ代謝モデルが、試験した変異体の大多数において、インビボにおいて観察される増殖表現型を予測することができ、代謝モデルへ調節を取込むことにより、代謝モデルの予測能力を増大させることを示す。
限定培地において増殖する大腸菌変異株の能力を確認するために、実施例2に記載した組合せ調節/代謝モデルを使用した。調節論理を欠く同様のモデルも作製した。これを独立型代謝モデルと呼ぶ。それぞれの場合において、組合せ調節/代謝モデルまたは独立型代謝モデルによる予測を、文献からの実験データと比較した。表3は、増殖について「+」または増殖なしについて「-」としてスコアし、(インビボにおける観測)/(独立型代謝モデル)/(組合せ調節/代謝モデル)の順で表した比較の結果を示す。「N」は、これらの条件についてデータを利用できなかったことを示す。組合せ調節/代謝モデルが正しい予測を行った場合に、独立型代謝モデルによって予測されないか、または間違って予測されるかのいずれかのものは、陰を付けた箱で示す。行は、特定の変異体を表し、列は、特定の炭素源における増殖の結果を表し、「glc」はグルコース、「gl」はグリセロール、「suc」はコハク酸、「ac」はアセテート、「rib」はリボース、および「(-O2)」は嫌気的条件である。
表3に示すように、インシリコ独立型代謝モデルによって予測された増殖結果は、変異体の83.6%(シミュレーションした116の場合のうちの97)の文献に由来する経験的に決定されたインビボの結果と相関した。116の場合のうちの16について不正確な予測がなされた。rpiRは調節遺伝子であり、したがって独立型代謝モデルに含まれなかったため、rpiR変異体に関する3つの場合では、予測することができなかった。
組合せ調節/代謝モデルでは、変異体の91.4%(シミュレーションした116の場合のうちの106)において増殖特性について正しい予測がなされ、調節されていない独立型代謝モデルを通して9個を正しい予測に改善した。前者のモデルにより増殖能力が正しく予測されたが、後者ではなされなかった変異体は、aceEF、fumA、ppc、rpiA、およびrpiRであった。残りの不正確な予測を表3に示し、また、ほとんどの場合、組合せ調節/代謝モデルで説明されない効果である毒性物質の蓄積によるものであった。
2つのモデルによって示差的に予測された9つの変異体をより詳細に検討するために、組合せ調節/代謝モデルを使用した。組合せ調節/代謝モデルの予測によれば、aceEF-lpdAオペロンによってコードされるピルビン酸デヒドロゲナーゼは、大腸菌の発酵性相当物であるピルビン酸ギ酸リアーゼの好気性ダウンレギュレーションのため、好気条件下における最小グルコースおよび最小コハク酸培地での大腸菌の増殖に致死的な変異である。同様に、フマラーゼA(fumA)は、好気性条件下で一般に転写される唯一のフマラーゼである。ホスホエノールピルビン酸カルボキシラーゼ(ppc)は、グリオキシル酸経路のダウンレギュレーションのために、致死的な変異であることが正しく予測された。
リボースリン酸イソメラーゼA(rpiA)およびリボースリプレッサータンパク質RpiRにより、組合せ調節/代謝モデルを使用して、どのように調節遺伝子変異体の表現型をシミュレーションすることができるのかを例示する。2つのイソメラーゼは、rpiAおよびrpiB遺伝子によってコードされるリブロース5-リン酸塩およびリボース5-リン酸塩の相互変換のために大腸菌に存在する。rpiAの発現は、恒常的であると考えられるが、rpiBの発現は、RpiRの非存在下で起こり、これはリボースによって不活性化される。その結果、rpiA変異体は、リボース栄養要求体であるが、rpiB変異体は、無発現(null)表現型を示す。組合せ調節/代謝モデルによって正確に予測されたように、rpiA変異体においてrpiRがさらに変異することにより、rpiBの抑制ができず、リボースの非存在下における増殖能が回復する。
これらの結果は、生物の代謝の解空間に調節制約を課すことにより、より正確に制約空間を生じることを示す。この精度の改良により、独立型代謝モデルによって行われる9つの誤予測を矯正することができた。さらに、組合せ調節/代謝モデルによってなされた3つのrpiR変異体の増殖予測によって示されるように、このような制約により、調節遺伝子変異の表現型の正確な予測を可能となる。
実施例IV
代謝変化および関連する調節
本実施例は、増殖実験の過程にわたり定量的に大腸菌の増殖をシミュレーションするための、組合せ調節/代謝モデルの使用を示す。また、本実施例は、実験データに対する、生じた増殖、基質取込み、および副生成物分泌の時間経過の比較を示す。
バッチ式培養によりグルコースで好気的に培養されたときに、大腸菌は、インビボでアセテートを分泌し;グルコースが生育環境から除去されると、そのときは、アセテートを基質として再利用することが観察された。組合せ調節/代謝および独立型代謝モデルを使用して、グルコース最少培地における大腸菌の好気的なバッチ式培養における活性をシミュレーションした。図8のパネルAは、実験データ(閉じた四角)を示す3回のプロットと、組合せ調節/代謝モデル(実線)並びに独立型代謝モデル(点線)を使用して行った対応するシミュレーションとを示す。アセテートプロットでは、示したとおり、調節/代謝モデル予測が、独立型代謝モデルのものと異なった。図8のパネルBは、パラメータがVarmaおよびPalsson Appl. Env. Micro. 60:3724-3731 (1994)により評価され、または得られる時間プロットを作製するために必要なパラメータを含む表を示す。組合せ調節/代謝と代謝型独立とのシミュレーション間の主な相違は、増殖培地中のグルコースの枯渇に対する系の遅滞性反応にある。独立型代謝ネットワークでは、タンパク質合成に付随した遅延を説明することができない。
図8のパネルCは、アレイ型式で表現される調節ネットワークにおいて、選択された遺伝子のアップレギュレーションもしくはダウンレギュレーション、または調節タンパク質の活性のインシリコ予測を示す(暗い-遺伝子転写/タンパク質活性、明るい-転写抑制/タンパク質不活性)。異化産物抑制タンパク質(CRP)の調節は、表2に提供したブールのステートメントのセットによって表現される。CRP活性を図8に表現し、グルコースまたはアセテートが系に受け入れられたときに、それぞれGLCまたはACとして表示する。インシリコアレイは、4つの遺伝子産物、aceA、aceB、acs、およびppsAのアップレギュレーション、並びに3つの遺伝子産物、adhE、ptsGHI-crr、およびpykFのダウンレギュレーションを予測した。OhおよびLiao, Biotech. Prog. 16:278-286(2000)(非特許文献23)に記載されたように、大腸菌の111遺伝子のコレクションにおける示差的な転写プロフィールを検出するために、DNAマイクロアレイ技術を使用し、そこで報告されたように、好気的なグルコースにおける増殖、対、アセテートにおける増殖についての遺伝子発現の差が、図8Cに含まれる。発現データが公開されている組合せ調節/代謝モデルに含まれる8つの遺伝子は、組合せ調節/代謝モデルの予測と定性的に一致する。組合せ調節/代謝モデルがアセテートを再利用する能力は、グリオキサル酸分路遺伝子、aceA、およびaceBのアップレギュレーションに依存し、OhおよびLiao, Biotech. Progress 16:278-286(2000)において報告された大規模な転写の相違(20倍)についての説明を提供する。
さらに、組合せ調節/代謝モデルは、調節されることが知られているが原因は知られていない2つの遺伝子、ppsAおよびadhEの調節についての解釈を示唆した。組合せ調節/代謝モデルは、第二の調節変化が異化産物活性化タンパク質Craによって誘導され、一旦グルコースが培地から枯渇すると、これがフルクトース6-リン酸およびフルクトース1,6-二リン酸の細胞内濃度の低下に応答することを示した。組合せ調節/代謝モデルによれば、この第二の調節変化は、ppsAおよびadhEのアップレギュレーションの原因である。
インシリコモデルを、グルコースにおける嫌気的な増殖をシミュレーションするために使用し、その結果を図9に示した。これらの条件下において、独立型代謝モデルでは、組合せ調節/代謝モデルと同様の予測がなされ、以下の顕著な例外があった:組合せ調節/代謝モデルは、特定のアイソザイムの使用についての予測が可能であった。たとえば、両モデルとも、最適なフラックス分布の一部としてフマラーゼ活性を必要とするが;しかし、2つのモデルのうち、組合せ調節/代謝モデルのみが、嫌気的条件下で発現されているものとしてfumB遺伝子産物を特異的に決定することが可能であった。
グルコースおよびラクトースにおける大腸菌の好気的な増殖を、インシリコモデルを使用してシミュレーションし、混合バッチ式培養に由来するインビボにおける観察と、Kremlingら、Metabolic Eng. 3: 362-379 (2001)に記載されたとおりの、動態力学的モデルについて報告された結果と比較した。図10に示すように、全体的に、組合せ調節/代謝モデルの予測は、インビボにおける観測とよく一致し、Kremlingモデルによってなされる予測に匹敵し、および独立型代謝モデルの予測よりよかった。独立型代謝モデルにおける本実験の結果を正確に予測する能力の欠損は、グルコースおよびラクトースの並行した取込みによる可能性が高く、より迅速な基質の枯渇およびより速い増殖速度を生じる。面白いことに、炭素源取込みのより大きなフラックスのために、この場合、独立型代謝モデルでは、大腸菌増殖が炭素制限よりもむしろ酸素制限であるべきと予測された。したがって、アセテートおよびホルメート(ギ酸塩、formate)の分泌は、独立型代謝モデルによって予測された。対照的に、組合せ調節/代謝モデルでは、これらの条件下で分泌が起こらないであろうと予測した。
シミュレーションのためのインシリコアレイでは(図10C)、ちょうど5時間において生じる1つの遺伝子発現の変化を示した。一旦培地中のグルコースが枯渇すると、ラクトース取込みのアップレギュレーションおよび分解機構により、ガラクトース代謝の鍵となる酵素と共に、系が炭素源としてラクトースを使用することを可能にする。
細胞の増殖および副生成物分泌のシミュレーション結果を解釈するために、調節制約の付加を使用した。グルコース/アセテートシミュレーションでは、グリオキサル酸分路のアップレギュレーションがアセテートの再利用を可能にし、第二の調節変化がppsAおよびadhEなどの遺伝子の調節の原因となることを示し、これらの両方が、これらの条件における最近のマイクロアレイ研究において、未知の機構によって明らかな理由もなく調節されることが見出された(OhおよびLiao, Biotech. Progress. 16:278-286(2000))。グルコース-ラクトースのディオーキシー成長(diauxic growth)のシミュレーションでは、galおよびlacオペロンのアップレギュレーションが、観察されたディオーキシー変化にきわめて重要であることを示した。
独立型代謝モデルによって産生されるものと、組合せ調節/代謝シミュレーションとを比較することにより、調節進化の原因を推定することが可能であった。グルコース発酵の場合、観察される表現型に対して比較的小さな調節の効果であることから、生物が突然の酸素欠乏に即座に応答することができる系を進化させたことが示唆された。加えて、グルコース-ラクトースのディオーキシー増殖の場合、独立型モデルでは、ラクトースおよびグルコースの取込みの組合せが、バイオマス産生のために炭素の制限よりもむしろ酸素の制限を系に引き起こし、アセテートおよびホルメートの分泌を生じて、増殖収率を減少し得ることを示した。この所見は、大腸菌が単一炭素供与源培地で増殖する際に、その増殖率を最適化するように進化した(Edwardsら、Nature Biotech. 1:125-130(2001)およびIbarraら、提出済)ことと、細胞で酸素が制限されるよりもむしろ炭素が制限された飢餓条件下では異化産物抑制が生じない(LendenmannおよびEgli Microbiology 141:71-78(1995)(非特許文献24))ことの証拠を合わせて、基質取込みの調節は、単一基質における最適の増殖収率を維持する手段として進化したという仮説が示唆される。したがって、インシリコモデルは、調節ネットワークストラテジーなどの幅広いく基本的なトピックに立ち向かう仮説を打ち立てるために使用することができる。
これらの結果は、代謝モデルに調節制約を付加することにより、シミュレーション結果に実質的な影響を有し、細胞の実際の表現型をよく反映させたシミュレーションを得ることができることを示す。これらの結果は、さらに、組合せ調節/代謝モデルが比較的少ないパラメータで大腸菌の中枢の代謝および調節の挙動特徴および全体的特性を正確に捕らえる能力を有することを示す。
本出願の全体にわたって、種々の刊行物が参照されている。本出願において、これらの刊行物の開示は、本発明が属する技術分野の水準をより完全に記載するために、その全体が参照として本明細書に組み入れられる。
本発明は、上で提供した実施例に関して記載したが、本発明の精神から逸脱することなく種々の改変がなされ得ることは理解されるべきである。したがって、本発明は請求の範囲のみによって限定される。
Figure 2007164798
Figure 2007164798
Figure 2007164798
Figure 2007164798
Figure 2007164798
調節された生化学的反応ネットワークモデルを開発して実行するための方法を例示する工程系統図を示す。 パネルAは、例示的な生化学的反応ネットワークを示し;パネルBは、パネルAの反応ネットワークのための例示的な調節制御構造を示し;パネルCは、考慮される調節制約を伴わずに、パネルAの生化学的反応ネットワークのための例示的なシミュレーションされたフラックス分布を示し;パネルDは、パネルBに表した調節制約を含む、生化学的反応ネットワークのためのシミュレーションされたフラックス分布を示す。 代謝ネットワークの反応と関連した調節ネットワークの概略図を示す。 調節事象によって動作される反応の概略図を示す。 調節された生化学的反応ネットワークモデルの過渡的または時間依存的な実施を例示する工程系統図を示す。 生化学的反応ネットワークのゲノム規模の調節されたモデルを開発するための方法を例示する工程系統図を示す。 ネットワークに含まれる20の代謝反応の化学量論を含む表と共に、簡略化されたコア代謝ネットワークの概略図を示す。 パネルAは、グルコース再利用を伴うアセテートにおける大腸菌の好気的増殖のシミュレーションを示し;パネルBは、パネルAのプロットを作製するために使用したパラメータの表を示し;パネルCは、調節ネットワークにおける、選択した遺伝子のアップレギュレーションもしくはダウンレギュレーション、または調節タンパク質の活性を示すインシリコアレイを示す。 パネルAは、グルコースにおける大腸菌の嫌気的増殖のシミュレーションを示し;パネルBは、パネルAのプロットを作製するために使用したパラメータの表を示し;パネルCは、調節ネットワークにおける、選択した遺伝子のアップレギュレーションもしくはダウンレギュレーション、または調節タンパク質の活性を示すインシリコアレイを示す。 パネルAは、グルコースおよびラクトースにおける大腸菌の好気的増殖のシミュレーションを示し;パネルBは、パネルAのプロットを作製するために使用したパラメータの表を示し;パネルCは、調節ネットワークにおける、選択した遺伝子のアップレギュレーションもしくはダウンレギュレーション、または調節タンパク質の活性を示すインシリコアレイを示す。

Claims (74)

  1. 以下のものを含む、コンピュータ読み取り可能な媒体または媒体類:
    (a)生化学的反応ネットワークにおける複数の反応物と複数の反応を関係づけるデータ構造、
    ここで、該反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、および、該基質と該産物とを関係づける化学量論係数を含み、該反応の少なくとも1つは調節された反応である;
    (b)該調節された反応のための可変制約を含む、該複数の反応のための制約セット。
  2. 可変制約がデータ構造における少なくとも一つの反応の結果に依存する、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  3. 可変制約が調節事象の結果に依存する、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  4. 可変制約が時間に依存する、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  5. 可変制約が生化学的反応ネットワーク関係物の存在に依存する、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  6. 関係物が、基質、産物、反応、タンパク質、巨大分子、酵素、および遺伝子からなる群より選択される、請求項5記載のコンピュータ読み取り可能な媒体または媒体類。
  7. 生化学的反応ネットワークが代謝反応を含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  8. 調節データ構造をさらに含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類であって、可変制約が該調節データ構造によって表される調節事象の結果に依存する、媒体または媒体類。
  9. 請求項8記載のコンピュータ読み取り可能な媒体または媒体類であって、調節データ構造が、遺伝子の転写、RNAの翻訳、タンパク質の翻訳後修飾、タンパク質の阻害、タンパク質の活性化、タンパク質の構築、pHの変化、レドックス電位の変化、温度の変化、時間の経過、およびタンパク質の分解からなる群より選択される調節事象を表す、媒体または媒体類。
  10. 調節事象がシグナル伝達経路による、請求項8記載のコンピュータ読み取り可能な媒体または媒体類。
  11. 生化学的反応ネットワークおよび調節データ構造が単一の細胞において起こる反応または事象を表す、請求項8記載のコンピュータ読み取り可能な媒体または媒体類。
  12. 生化学的反応ネットワークが細胞集団の第一の細胞において起こる反応を表し、調節データ構造が該集団の第二の細胞において起こる事象を表す、請求項8記載のコンピュータ読み取り可能な媒体または媒体類。
  13. 細胞集団が多細胞生物の細胞を含む、請求項12記載のコンピュータ読み取り可能な媒体または媒体類。
  14. 可変制約と調節事象の結果を関連づける制約関数をさらに含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  15. 制約関数が二進数である、請求項14記載のコンピュータ読み取り可能な媒体または媒体類。
  16. 調節事象がブールの論理によって表される、請求項14記載のコンピュータ読み取り可能な媒体または媒体類。
  17. 以下のものをさらに含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類、
    (c)制約セットがデータ構造に適用されるときに、目的関数を最小または最大にする少なくとも一つのフラックス分布を決定するためのコマンド、
    ここで、該少なくとも一つのフラックス分布は、生化学的反応ネットワークの全体的特性を決定し、該全体的特性は、調節された反応を介したフラックスに依存する。
  18. コマンドが、制約セットがデータ表現に適用されるときに、目的関数を最小または最大にする実行可能なフラックス分布の範囲を決定する、請求項17記載のコンピュータ読み取り可能な媒体または媒体類。
  19. コマンドが最適化問題を含む、請求項17記載のコンピュータ読み取り可能な媒体または媒体類。
  20. 最適化問題が線形最適化問題または非線形最適化問題を含む、請求項19記載のコンピュータ読み取り可能な媒体または媒体類。
  21. 請求項17記載のコンピュータ読み取り可能な媒体または媒体類であって、データ構造を修正するための少なくとも一つのコマンドを送ることができるユーザインタフェース、制約セットもしくは該制約セットをデータ表現に適用するためのコマンド、またはその組合せをさらに含む、媒体または媒体類。
  22. ユーザインタフェースが、複数の反応に関するさらなる情報にアクセスするためにユーザが選択してもよいリンクをさらに含む、請求項21記載のコンピュータ読み取り可能な媒体または媒体類。
  23. データ構造が線形代数方程式のセットを含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  24. データ構造がマトリックスを含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  25. 少なくとも一つのフラックス分布をフラックス分布地図として表すためのコマンドをさらに含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  26. 複数の反応物の少なくとも一つの反応物または複数の反応の少なくとも一つの反応が注釈をつけられている、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  27. 注釈がコンパートメントに少なくとも一つの反応物を割り当てることを含む、請求項26記載のコンピュータ読み取り可能な媒体または媒体類。
  28. 複数の反応における第一の基質または産物が第一のコンパートメントに割り当てられ、該複数の反応における第二の基質または産物が第二のコンパートメントに割り当てられる、請求項27記載のコンピュータ読み取り可能な媒体または媒体類。
  29. 注釈がオープンリーディングフレームまたはタンパク質に割り当てること含む、請求項26記載のコンピュータ読み取り可能な媒体または媒体類。
  30. 注釈が信頼度評価を含む、請求項26記載のコンピュータ読み取り可能な媒体または媒体類。
  31. 特定の生物の1つまたは複数の遺伝子もしくはタンパク質とデータ構造の1つまたは複数の反応を関係づける遺伝子データベースをさらに含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  32. 生化学的反応ネットワークが、解糖、TCAサイクル、ペントースリン酸経路、呼吸、アミノ酸の生合成、アミノ酸の分解、プリンの生合成、ピリミジンの生合成、脂質の生合成、脂肪酸の代謝、補助因子の生合成、細胞壁成分の代謝、代謝物の輸送、および、炭素、窒素、硫黄、リン酸塩、水素、または酸素の代謝からなる群より選択される反応を含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  33. 複数の反応が調節された反応であり、該調節された反応の制約が可変制約を含む、請求項1記載のコンピュータ読み取り可能な媒体または媒体類。
  34. 以下の工程を含む、生化学的反応ネットワークの全体的特性を決定するための方法:
    (a)生化学的反応ネットワークにおける複数の反応物と複数の反応を関係づけるデータ構造を提供する工程
    ここで、該反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、および、該基質と該産物とを関係づける化学量論係数を含み、該反応の少なくとも1つは調節された反応である;
    (b)該複数の反応のための制約セットを提供する工程
    ここで、該制約セットは、該調節された反応のための可変制約を含む;
    (c)該可変制約に条件依存的な値を提供する工程;
    (d)目的関数を提供する工程;
    (e)該制約セットが該データ構造に適用されるときに、該目的関数を最小または最大にする少なくとも1つのフラックス分布を決定することにより、該生化学的反応ネットワークの全体的特性を決定する工程。
  35. 可変制約に提供される値がデータ構造の少なくとも1つの反応の結果に応答して変化する、請求項34記載の方法。
  36. 可変制約に提供される値が調節事象の結果に応答して変化する、請求項34記載の方法。
  37. 可変制約に提供される値が時間に応答して変化する、請求項34記載の方法。
  38. 可変制約に提供される値が生化学的反応ネットワーク関係物の存在に応答して変化する、請求項34記載の方法。
  39. 関係物が、基質、産物、反応、酵素、タンパク質、巨大分子、および遺伝子からなる群より選択される、請求項38記載の方法。
  40. 生化学的反応ネットワークが代謝反応を含む、請求項34記載の方法。
  41. 調節データ構造をさらに含む、請求項34記載の方法であって、可変制約に提供される値が、該調節データ構造によって表される調節事象の結果によって変化する方法。
  42. 調節事象が、遺伝子の転写、RNAの翻訳、タンパク質の翻訳後修飾、タンパク質の阻害、タンパク質の活性化、タンパク質の構築、pHの変化、レドックス電位の変化、温度の変化、時間の経過、およびタンパク質の分解からなる群より選択される、請求項41記載の方法。
  43. 調節事象がシグナル伝達経路による、請求項41記載の方法。
  44. 生化学的反応ネットワークおよび調節データ構造が単一の細胞において起こる反応または事象を表す、請求項41記載の方法。
  45. 調節事象が調節反応を含む、請求項41記載の方法。
  46. 生化学的反応ネットワークが細胞集団の第一の細胞において起こる反応を表し、調節データ構造が該集団の第二の細胞において起こる事象を表す、請求項41記載の方法。
  47. 細胞集団が多細胞生物の細胞を含む、請求項46記載の方法。
  48. 可変制約と調節事象の結果を関連づける制約関数をさらに含む、請求項41記載の方法。
  49. 制約関数が二進数である、請求項48記載の方法。
  50. 調節事象がブールの論理によって表現される、請求項48記載の方法。
  51. 制約関数が、調節データ構造の結果の第一のセットを第一の二進数値と関連づけ、該調節データ構造の結果の第二のセットを第二の二進数値と関連づける、請求項48記載の方法。
  52. 制約関数が調節データ構造の結果のセットを単一の整数値と関連づける、請求項48記載の方法。
  53. フラックス分布が最適化によって決定される、請求項34記載の方法。
  54. 最適化が線形最適化または非線形最適化を含む、請求項53記載の方法。
  55. データ構造もしくは制約セット、または両方を修正する工程をさらに含む、請求項34記載の方法。
  56. データ構造が線形代数方程式のセットを含む、請求項34記載の方法。
  57. データ構造がマトリックスを含む、請求項34記載の方法。
  58. フラックス分布地図を作成する工程をさらに含む、請求項34記載の方法。
  59. 生化学的反応ネットワークが、解糖、TCAサイクル、ペントースリン酸経路、呼吸、アミノ酸の生合成、アミノ酸の分解、プリンの生合成、ピリミジンの生合成、脂質の生合成、脂肪酸の代謝、補助因子の生合成、細胞壁成分の代謝、代謝物の輸送、および、炭素源、窒素源、酸素源、リン酸塩源、水素源、または硫黄源の代謝からなる群より選択される反応を含む、請求項34記載の方法。
  60. 全体的特性が、増殖、エネルギー産生、レドックス等価物の産生、バイオマス産生、バイオマス前駆体の産生、タンパク質の産生、アミノ酸の産生、プリンの産生、ピリミジンの産生、脂質の産生、脂肪酸の産生、補助因子の産生、細胞壁成分の産生、代謝物の輸送、発生、細胞間のシグナリング、および、炭素、窒素、硫黄、リン酸塩、水素、または酸素の消費からなる群より選択される、請求項34記載の方法。
  61. 全体的特性が、タンパク質の分解、アミノ酸の分解、プリンの分解、ピリミジンの分解、脂質の分解、脂肪酸の分解、補助因子の分解、および、細胞壁成分の分解からなる群より選択される、請求項34記載の方法。
  62. 可変制約が条件依存的な制約値および制約関数を含み、該可変制約が該条件依存的な制約値に作用する該制約関数によって修正される、請求項34記載の方法。
  63. 制約関数が二進数である、請求項62記載の方法。
  64. 特定の生物の1つまたは複数のオープンリーディングフレームもしくはタンパク質とデータ構造の1つまたは複数の反応を関係づける遺伝子データベースを提供する工程をさらに含む、請求項34記載の方法。
  65. 複数の反応において反応を行うタンパク質をコードするオープンリーディングフレームを同定する工程をさらに含む、請求項64記載の方法。
  66. 複数の反応において反応を行うタンパク質を同定する工程をさらに含む、請求項64記載の方法。
  67. 以下の工程を含む、生物の変異体の表現型を決定するための方法:
    (i)特定の生物において天然に存在しない反応を同定する工程、
    (ii)請求項34記載の方法に従って生化学的反応ネットワークの全体的特性を決定する工程、
    ここで、データ構造が、該生物の複数の反応物を該生物の生化学的反応ネットワークの複数の反応に関係づけ、該生物において天然に存在しない該反応をさらに含む。
  68. 以下の工程を含む、生物の変異体の表現型を決定するための方法:
    (i)遺伝子データベースのオープンリーディングフレームまたはタンパク質に関係づけられた反応を同定する工程、
    (ii)請求項34記載の方法に従って生化学的反応ネットワークの全体的特性を決定する工程、
    ここで、該オープンリーディングフレームもしくはタンパク質に関係づけられた該反応はデータ構造に存在しないか、またはフラックスを有しないことに制約される。
  69. 以下の工程を含む、生物学的反応ネットワークにおける1つまたは複数の反応の活性に対する薬剤の効果を決定するための方法:
    (i)遺伝子データベースのオープンリーディングフレームまたはタンパク質に関連づけられた反応を同定する工程、
    (ii)該オープンリーディングフレームの発現または該タンパク質の活性を変化させる候補薬剤を同定する工程、
    (iii)請求項34記載の方法に従って生化学的反応ネットワークの全体的特性を決定する工程、
    ここで、該オープンリーディングフレームまたはタンパク質に関係づけられた該反応はデータ構造に存在しないか、減少したフラックスを有することに制約されるか、またはフラックスを有しないことに制約される。
  70. 複数の反応が調節された反応であり、該調節された反応についての制約が変数境界値を含む、請求項34記載の方法。
  71. 以下の工程を含む、第一回目および第二回目において生化学的反応ネットワークの全体的特性を決定するための方法:
    (a)生化学的反応ネットワークにおける複数の反応物と複数の反応を関係づけるデータ構造を提供する工程、
    ここで、該反応のそれぞれは、反応の基質として同定される反応物、反応の産物として同定される反応物、および、該基質および該産物を関係づける化学量論係数を含み、該反応の少なくとも1つは調節された反応である;
    (b)該複数の反応のための制約セットを提供する工程、
    ここで、該制約セットは、該調節された反応のための可変制約を含む;
    (c)該可変制約に条件依存的な値を提供する工程;
    (d)目的関数を提供する工程;
    (e)該制約セットが該データ構造に適用されるときに、該目的関数を最小または最大にする少なくとも1つの第一回目のフラックス分布を決定することにより、該第一回目の該生化学的反応ネットワークの全体的特性を決定する工程;
    (f)該可変制約に提供された該値を修正する工程、
    (g)工程(e)を繰り返すことにより、第二回目の該生化学的反応ネットワークの全体的特性を決定する工程。
  72. 値が第一回目のフラックス分布に基づいて修正される、請求項71記載の方法。
  73. 値が環境条件の変化に基づいて修正される、請求項71記載の方法。
  74. 特定の時間点の回数分、工程(e)から(g)を繰り返す工程をさらに含む、請求項71記載の方法。
JP2006353839A 2001-03-01 2006-12-28 調節された反応ネットワークの全体的特性を決定するためのモデルおよび方法 Expired - Fee Related JP4870547B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US27275401P 2001-03-01 2001-03-01
US60/272,754 2001-03-01
US32302801P 2001-09-14 2001-09-14
US60/323,028 2001-09-14

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002570752A Division JP2004533037A (ja) 2001-03-01 2002-03-01 調節された反応ネットワークの全体的特性を決定するためのモデルおよび方法

Publications (2)

Publication Number Publication Date
JP2007164798A true JP2007164798A (ja) 2007-06-28
JP4870547B2 JP4870547B2 (ja) 2012-02-08

Family

ID=29254234

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2002570752A Pending JP2004533037A (ja) 2001-03-01 2002-03-01 調節された反応ネットワークの全体的特性を決定するためのモデルおよび方法
JP2006353839A Expired - Fee Related JP4870547B2 (ja) 2001-03-01 2006-12-28 調節された反応ネットワークの全体的特性を決定するためのモデルおよび方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2002570752A Pending JP2004533037A (ja) 2001-03-01 2002-03-01 調節された反応ネットワークの全体的特性を決定するためのモデルおよび方法

Country Status (5)

Country Link
US (2) US20030059792A1 (ja)
EP (1) EP1381860A4 (ja)
JP (2) JP2004533037A (ja)
CA (1) CA2439260C (ja)
WO (1) WO2002070730A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011055820A1 (ja) * 2009-11-09 2011-05-12 大日本住友製薬株式会社 支援装置、支援方法、及びコンピュータプログラム
JP2014147399A (ja) * 2008-03-27 2014-08-21 Genomatica Inc アジピン酸および他の化合物を生成するための微生物
CN105718757A (zh) * 2016-01-25 2016-06-29 青岛理工大学 一种dna扩增过程的数据建模方法

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1147229A2 (en) * 1999-02-02 2001-10-24 Bernhard O. Palsson Methods for identifying drug targets based on genomic sequence data
US7127379B2 (en) * 2001-01-31 2006-10-24 The Regents Of The University Of California Method for the evolutionary design of biochemical reaction networks
US7751981B2 (en) * 2001-10-26 2010-07-06 The Regents Of The University Of California Articles of manufacture and methods for modeling Saccharomyces cerevisiae metabolism
JP2003180400A (ja) * 2001-12-20 2003-07-02 Japan Science & Technology Corp 代謝回路情報処理方法、代謝回路情報処理装置、プログラム、および、記録媒体
US20030224363A1 (en) * 2002-03-19 2003-12-04 Park Sung M. Compositions and methods for modeling bacillus subtilis metabolism
US8949032B2 (en) * 2002-03-29 2015-02-03 Genomatica, Inc. Multicellular metabolic models and methods
JP2005521929A (ja) * 2002-03-29 2005-07-21 ジェノマティカ・インコーポレイテッド ヒト代謝モデルおよび方法
US7856317B2 (en) * 2002-06-14 2010-12-21 Genomatica, Inc. Systems and methods for constructing genomic-based phenotypic models
US7869957B2 (en) * 2002-10-15 2011-01-11 The Regents Of The University Of California Methods and systems to identify operational reaction pathways
WO2004035009A2 (en) * 2002-10-15 2004-04-29 The Regents Of The University Of California Methods and systems to identify operational reaction pathways
EP1649403A2 (en) * 2003-07-29 2006-04-26 Ajinomoto Co., Inc. Method for determining metabolic flux affecting substance production
JP2005129015A (ja) * 2003-09-30 2005-05-19 Fujitsu Ltd シミュレーションにおけるモデルパラメータ決定プログラム、および決定装置
US8510054B2 (en) * 2004-02-05 2013-08-13 Ajinomoto Co., Inc. Intracellular metabolic flux analysis method using substrate labeled with isotope
US8315196B2 (en) * 2004-02-17 2012-11-20 Microsoft Corporation Method for determining placement of internet taps in wireless neighborhood networks
JP2005270909A (ja) * 2004-03-26 2005-10-06 Advanced Telecommunication Research Institute International ハードウエアシミュレータ
JP4761286B2 (ja) * 2004-03-26 2011-08-31 株式会社国際電気通信基礎技術研究所 ハードウエアシミュレータ
AU2004322970B2 (en) * 2004-08-26 2010-04-01 The Penn State Research Foundation Method for redesign of microbial production systems
KR100630836B1 (ko) * 2005-04-08 2006-10-02 한국과학기술원 인-실리코 분석을 통한 균주 개량방법
KR100655495B1 (ko) * 2005-07-11 2006-12-08 한국과학기술원 대사산물들의 플럭스 섬을 이용한 인-실리코 생물 개량방법
WO2007032568A1 (en) * 2005-09-15 2007-03-22 Korea Advanced Institute Of Science And Technology Method for improving organisms using flux scanning based on enforced objective flux
KR100727053B1 (ko) * 2006-05-04 2007-06-12 한국과학기술원 대사산물들의 플럭스 섬 프로파일링을 이용한 생물개량방법
US7788041B2 (en) * 2006-10-04 2010-08-31 The Regents Of The University Of California Compositions and methods for modeling human metabolism
WO2008091627A2 (en) * 2007-01-22 2008-07-31 Genomatica, Inc. Methods and organisms for growth-coupled production of 3-hydroxypropionic acid
BRPI0808988A2 (pt) 2007-03-16 2011-11-08 Genomatica Inc micro-organismos e métodos para a produção de 1,4-butanodiol (1,4-bdo)
US20090023182A1 (en) * 2007-07-18 2009-01-22 Schilling Christophe H Complementary metabolizing organisms and methods of making same
WO2009045637A2 (en) 2007-08-10 2009-04-09 Genomatica, Inc. Methods for the synthesis of acrylic acid and derivatives from fumaric acid
US7947483B2 (en) 2007-08-10 2011-05-24 Genomatica, Inc. Methods and organisms for the growth-coupled production of 1,4-butanediol
CN101978042B (zh) 2008-01-22 2017-03-08 基因组股份公司 利用合成气或其它气态碳源和甲醇的方法和有机体
US8301393B2 (en) * 2008-02-19 2012-10-30 The Regents Of The University Of California Methods and systems for genome-scale kinetic modeling
CA3081506A1 (en) * 2008-03-05 2009-09-11 Genomatica, Inc. Long chain alcohol-producing organisms
JP2011519561A (ja) 2008-05-01 2011-07-14 ジェノマティカ, インコーポレイテッド メタクリル酸の産生のための微生物
BRPI0913901A2 (pt) 2008-06-17 2016-12-13 Genomatica Inc micro-organismos e métodos para a biossíntese de fumarato, malato e acrilato
US20100021978A1 (en) * 2008-07-23 2010-01-28 Genomatica, Inc. Methods and organisms for production of 3-hydroxypropionic acid
CA2735883C (en) * 2008-09-10 2020-05-05 Genomatica, Inc. Microorganisms for the production of 1,4-butanediol
US8647642B2 (en) 2008-09-18 2014-02-11 Aviex Technologies, Llc Live bacterial vaccines resistant to carbon dioxide (CO2), acidic PH and/or osmolarity for viral infection prophylaxis or treatment
US20100184173A1 (en) * 2008-11-14 2010-07-22 Genomatica, Inc. Microorganisms for the production of methyl ethyl ketone and 2-butanol
KR20110097951A (ko) 2008-12-16 2011-08-31 게노마티카 인코포레이티드 합성가스와 다른 탄소원을 유용 제품으로 전환시키기 위한 미생물 및 방법
EP2401696B1 (en) * 2009-02-26 2017-06-21 Intrexon CEU, Inc. Mammalian cell line models and related methods
KR102302146B1 (ko) 2009-04-30 2021-09-14 게노마티카 인코포레이티드 1,3-부탄다이올 생산 유기체
EP2425006A4 (en) 2009-04-30 2013-01-23 Genomatica Inc ORGANISMS FOR THE MANUFACTURE OF ISOPROPANOL, N-BUTANOL AND ISOBUTANOL
ES2749423T3 (es) 2009-05-07 2020-03-20 Genomatica Inc Microorganismos y métodos para la biosíntesis de adipato, hexametilendiamina y ácido 6-aminocaproico
JP2012526561A (ja) * 2009-05-15 2012-11-01 ゲノマチカ, インク. シクロヘキサノンの産生のための生物
CN102459138A (zh) * 2009-06-04 2012-05-16 基因组股份公司 分离发酵液成分的方法
US8129169B2 (en) 2009-06-04 2012-03-06 Genomatica, Inc. Microorganisms for the production of 1,4-butanediol and related methods
US8420375B2 (en) * 2009-06-10 2013-04-16 Genomatica, Inc. Microorganisms and methods for carbon-efficient biosynthesis of MEK and 2-butanol
DK2462221T3 (en) 2009-08-05 2017-05-22 Genomatica Inc SEMISYNTHETIC TEREPHTHALIC ACID BY MICRO-ORGANISMS PRODUCING MUCONIC ACID
BR112012005296A2 (pt) 2009-09-09 2019-01-15 Genomatica Inc microorganismos e métodos para a coprodução de isopropanol com alcoóis primários, diós e ácidos.
CN105441374A (zh) 2009-10-13 2016-03-30 基因组股份公司 生产1,4-丁二醇、4-羟基丁醛、4-羟基丁酰-coa、腐胺和相关化合物的微生物及其相关方法
US20110097767A1 (en) * 2009-10-23 2011-04-28 Priti Pharkya Microorganisms for the production of aniline
US8530210B2 (en) 2009-11-25 2013-09-10 Genomatica, Inc. Microorganisms and methods for the coproduction 1,4-butanediol and gamma-butyrolactone
RU2012128843A (ru) 2009-12-10 2014-01-20 Дженоматика, Инк. Способы и организмы для превращения синтез-газа или других газообразных источников углерода и метанола в 1,3-бутандиол
WO2011094131A1 (en) 2010-01-29 2011-08-04 Genomatica, Inc. Microorganisms and methods for the biosynthesis of p-toluate and terephthalate
US8445244B2 (en) * 2010-02-23 2013-05-21 Genomatica, Inc. Methods for increasing product yields
US8048661B2 (en) * 2010-02-23 2011-11-01 Genomatica, Inc. Microbial organisms comprising exogenous nucleic acids encoding reductive TCA pathway enzymes
US9023636B2 (en) 2010-04-30 2015-05-05 Genomatica, Inc. Microorganisms and methods for the biosynthesis of propylene
MX336229B (es) 2010-05-05 2016-01-08 Genomatica Inc Microorganismos y metodos para la biosintesis de butadieno.
WO2012018624A2 (en) 2010-07-26 2012-02-09 Genomatica, Inc. Microorganisms and methods for the biosynthesis of aromatics, 2,4-pentadienoate and 1,3-butadiene
CA2826293A1 (en) 2011-02-02 2012-08-09 Genomatica, Inc. Microorganisms and methods for the biosynthesis of butadiene
US8617862B2 (en) 2011-06-22 2013-12-31 Genomatica, Inc. Microorganisms for producing propylene and methods related thereto
US9169486B2 (en) 2011-06-22 2015-10-27 Genomatica, Inc. Microorganisms for producing butadiene and methods related thereto
JP6272757B2 (ja) 2011-08-19 2018-01-31 ジェノマティカ, インコーポレイテッド 2,4−ペンタジエノエート、ブタジエン、プロピレン、1,3−ブタンジオールおよび関連アルコールを生成するための微生物および方法
CA2848972A1 (en) 2011-09-16 2013-03-21 Genomatica, Inc. Microorganisms and methods for producing alkenes
WO2013067432A1 (en) 2011-11-02 2013-05-10 Genomatica, Inc. Microorganisms and methods for the production of caprolactone
AU2013202630B2 (en) 2012-01-20 2015-10-01 Genomatica, Inc. Microorganisms and processes for producing terephthalic acid and its salts
EP2855687B1 (en) 2012-06-04 2020-04-22 Genomatica, Inc. Microorganisms and methods for production of 4-hydroxybutyrate, 1,4-butanediol and related compounds
US9657316B2 (en) 2012-08-27 2017-05-23 Genomatica, Inc. Microorganisms and methods for enhancing the availability of reducing equivalents in the presence of methanol, and for producing 1,4-butanediol related thereto
EP2909325A4 (en) 2012-10-22 2016-05-25 Genomatica Inc MICROORGANISMS AND METHODS FOR ENHANCING THE AVAILABILITY OF REDUCING EQUIVALENTS IN THE PRESENCE OF METHANOL, AND THE PRODUCTION OF SUCCINATE CORRESPONDING
US9346902B2 (en) 2012-11-05 2016-05-24 Genomatica, Inc. Microorganisms and methods for enhancing the availability of reducing equivalents in the presence of methanol, and for producing 3-hydroxyisobutyrate or methacrylic acid related thereto
WO2014071286A1 (en) 2012-11-05 2014-05-08 Genomatica, Inc. Microorganisms for enhancing the availability of reducing equivalents in the presence of methanol, and for producing 1,2-propanediol
WO2014076232A2 (en) 2012-11-19 2014-05-22 Novozymes A/S Isopropanol production by recombinant hosts using an hmg-coa intermediate
WO2014085330A1 (en) 2012-11-30 2014-06-05 Novozymes, Inc. 3-hydroxypropionic acid production by recombinant yeasts
MY175370A (en) 2012-12-17 2020-06-23 Genomatica Inc Microorganisms and methods for enhancing the availability of reducing equivalents in the presence of methanol, and for producing adipate, 6-aminocaproate, hexamethylenediamine or caprolactam related thereto
US20160040172A1 (en) 2013-03-15 2016-02-11 Genomatica, Inc. Microorganisms and methods for producing butadiene and related compounds by formate assimilation
US20140371417A1 (en) 2013-04-26 2014-12-18 Genomatica, Inc. Microorganisms and methods for production of 4-hydroxybutyrate, 1,4-butanediol and related compounds
WO2014190251A1 (en) 2013-05-24 2014-11-27 Genomatica, Inc. Microorganisms and methods for producing (3r)-hydroxybutyl (3r)-hydroxybutyrate
BR112016001778A2 (pt) 2013-07-31 2017-09-05 Novozymes As Célula transgênica de levedura, composição, e, métodos de produção de 3-hp e de produção de ácido acrílico ou um sal do mesmo
WO2015077752A1 (en) 2013-11-25 2015-05-28 Genomatica, Inc. Methods for enhancing microbial production of specific length fatty alcohols in the presence of methanol
EP3077501B1 (en) 2013-12-03 2021-07-28 Genomatica, Inc. Microorganisms and methods for improving product yields on methanol using acetyl-coa synthesis
US10597684B2 (en) * 2013-12-27 2020-03-24 Genomatica, Inc. Methods and organisms with increased carbon flux efficiencies
EP3167066A4 (en) 2014-07-11 2018-03-07 Genomatica, Inc. Microorganisms and methods for the production of butadiene using acetyl-coa
WO2016100910A1 (en) 2014-12-19 2016-06-23 Novozymes A/S Recombinant host cells for the production of 3-hydroxypropionic acid
CN107406821B (zh) 2015-02-27 2021-10-15 诺维信公司 用于生产3-羟基丙酸的突变宿主细胞
EP3341475A1 (en) 2015-08-24 2018-07-04 Novozymes A/S Beta-alanine aminotransferases for the production of 3-hydroxypropionic acid
KR101610785B1 (ko) * 2015-09-11 2016-04-08 한국과학기술정보연구원 세포 내 반응 시뮬레이션 장치 및 방법
US11129906B1 (en) 2016-12-07 2021-09-28 David Gordon Bermudes Chimeric protein toxins for expression by therapeutic bacteria
US11180535B1 (en) 2016-12-07 2021-11-23 David Gordon Bermudes Saccharide binding, tumor penetration, and cytotoxic antitumor chimeric peptides from therapeutic bacteria
CA3047840A1 (en) 2016-12-21 2018-06-28 Creatus Biosciences Inc. Method and organism expressing metschnikowia xylose transporters for increased xylose uptake
CA3047841A1 (en) 2016-12-21 2018-06-28 Creatus Biosciences Inc. Xylitol producing metschnikowia species
JP2020515255A (ja) 2017-03-31 2020-05-28 ジェノマティカ, インコーポレイテッド アルデヒドデヒドロゲナーゼバリアントおよび使用の方法
EP3601547A1 (en) 2017-03-31 2020-02-05 Genomatica, Inc. 3-hydroxybutyryl-coa dehydrogenase variants and methods of use
US20210079334A1 (en) 2018-01-30 2021-03-18 Genomatica, Inc. Fermentation systems and methods with substantially uniform volumetric uptake rate of a reactive gaseous component
US11508459B2 (en) * 2018-01-31 2022-11-22 X Development Llc Modified FBA in a production network
CN113179645A (zh) 2018-09-26 2021-07-27 基因组股份公司 醛脱氢酶变体及其使用方法
CN110767261B (zh) * 2019-09-29 2023-07-18 天津科技大学 一种自动化构建高精度基因组尺度代谢网络模型的方法
US20220148684A1 (en) * 2020-11-09 2022-05-12 X Development Llc In silico enzymology

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5273038A (en) * 1990-07-09 1993-12-28 Beavin William C Computer simulation of live organ
US5639949A (en) * 1990-08-20 1997-06-17 Ciba-Geigy Corporation Genes for the synthesis of antipathogenic substances
JP3523252B2 (ja) * 1990-11-21 2004-04-26 ホウテン ファーマシューティカルズ インコーポレイテッド 等モル多種オリゴマー混合物、特にオリゴペプチド混合物の合成
US5553234A (en) * 1994-09-23 1996-09-03 International Business Machines Corporation System and method for including stored procedures, user-defined functions, and trigger processing in an existing unit of work
US6983227B1 (en) * 1995-01-17 2006-01-03 Intertech Ventures, Ltd. Virtual models of complex systems
US5930154A (en) * 1995-01-17 1999-07-27 Intertech Ventures, Ltd. Computer-based system and methods for information storage, modeling and simulation of complex systems organized in discrete compartments in time and space
US5914891A (en) * 1995-01-20 1999-06-22 Board Of Trustees, The Leland Stanford Junior University System and method for simulating operation of biochemical systems
US6329139B1 (en) * 1995-04-25 2001-12-11 Discovery Partners International Automated sorting system for matrices with memory
US6326140B1 (en) * 1995-08-09 2001-12-04 Regents Of The University Of California Systems for generating and analyzing stimulus-response output signal matrices
US5947899A (en) * 1996-08-23 1999-09-07 Physiome Sciences Computational system and method for modeling the heart
EP1717322B1 (en) * 1997-01-17 2012-07-18 Codexis Mayflower Holdings, LLC Evolution of whole cells and organisms by recursive sequence recombination
US6165709A (en) * 1997-02-28 2000-12-26 Fred Hutchinson Cancer Research Center Methods for drug target screening
US6132969A (en) * 1998-06-19 2000-10-17 Rosetta Inpharmatics, Inc. Methods for testing biological network models
US6351712B1 (en) * 1998-12-28 2002-02-26 Rosetta Inpharmatics, Inc. Statistical combining of cell expression profiles
US6370478B1 (en) * 1998-12-28 2002-04-09 Rosetta Inpharmatics, Inc. Methods for drug interaction prediction using biological response profiles
EP1147229A2 (en) * 1999-02-02 2001-10-24 Bernhard O. Palsson Methods for identifying drug targets based on genomic sequence data
FR2789981B1 (fr) * 1999-02-19 2001-05-04 Oreal Tete de distribution verrouillable et distributeur ainsi equipe
US6200803B1 (en) * 1999-05-21 2001-03-13 Rosetta Inpharmatics, Inc. Essential genes of yeast as targets for antifungal agents, herbicides, insecticides and anti-proliferative drugs
US6221597B1 (en) * 1999-05-21 2001-04-24 Rosetta Inpharmatics, Inc. Essential genes of yeast as targets for antifungal agents, herbicides, insecticides and anti-proliferative drugs
AU2257401A (en) * 1999-12-08 2001-06-18 California Institute Of Technology Directed evolution of biosynthetic and biodegration pathways
US6986940B1 (en) * 2000-07-27 2006-01-17 General Electric Company Fiber reinforced composite article, fiber member, and method for making
US20020087275A1 (en) * 2000-07-31 2002-07-04 Junhyong Kim Visualization and manipulation of biomolecular relationships using graph operators
US7127379B2 (en) * 2001-01-31 2006-10-24 The Regents Of The University Of California Method for the evolutionary design of biochemical reaction networks
EP1419472A2 (en) * 2001-08-16 2004-05-19 Biotech Research Ventures Pte Ltd Method for modelling biochemical pathways
US7751981B2 (en) * 2001-10-26 2010-07-06 The Regents Of The University Of California Articles of manufacture and methods for modeling Saccharomyces cerevisiae metabolism
US20030224363A1 (en) * 2002-03-19 2003-12-04 Park Sung M. Compositions and methods for modeling bacillus subtilis metabolism
JP2005521929A (ja) * 2002-03-29 2005-07-21 ジェノマティカ・インコーポレイテッド ヒト代謝モデルおよび方法
US8949032B2 (en) * 2002-03-29 2015-02-03 Genomatica, Inc. Multicellular metabolic models and methods
US7856317B2 (en) * 2002-06-14 2010-12-21 Genomatica, Inc. Systems and methods for constructing genomic-based phenotypic models
EP1532516A4 (en) * 2002-07-10 2007-05-23 Penn State Res Found METHOD FOR DETERMINING GENE KNOCKOUT STRATEGIES
WO2004035009A2 (en) * 2002-10-15 2004-04-29 The Regents Of The University Of California Methods and systems to identify operational reaction pathways
WO2007030830A2 (en) * 2005-09-09 2007-03-15 Genomatica, Inc. Methods and organisms for the growth-coupled production of succinate

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN6010064913, Hatzimanikatis, V., "Analysis and design of metabolic reaction networks via mixed−integer linear optimization", AIChE Journal, 199605, Vol.42, No.5, p.1277−92 *
JPN6010064915, Varma, A., "Metabolic Flux Balancing: Basic Concepts, Scientific and Practical Use", Nature Biotechnology, 199410, Vol.12, p.994−8 *
JPN6010064918, Edwards, J.S., "Systems properties of the Haemophilus influenzae Rd metabolic genotype", The Journal of biological chemistry, 199906, Vol.274, No.25, p.17410−6 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014147399A (ja) * 2008-03-27 2014-08-21 Genomatica Inc アジピン酸および他の化合物を生成するための微生物
WO2011055820A1 (ja) * 2009-11-09 2011-05-12 大日本住友製薬株式会社 支援装置、支援方法、及びコンピュータプログラム
CN105718757A (zh) * 2016-01-25 2016-06-29 青岛理工大学 一种dna扩增过程的数据建模方法

Also Published As

Publication number Publication date
JP2004533037A (ja) 2004-10-28
EP1381860A4 (en) 2008-10-15
EP1381860A2 (en) 2004-01-21
WO2002070730A3 (en) 2003-10-23
WO2002070730A2 (en) 2002-09-12
US20170140092A1 (en) 2017-05-18
US20030059792A1 (en) 2003-03-27
CA2439260C (en) 2012-10-23
JP4870547B2 (ja) 2012-02-08
CA2439260A1 (en) 2002-09-12

Similar Documents

Publication Publication Date Title
JP4870547B2 (ja) 調節された反応ネットワークの全体的特性を決定するためのモデルおよび方法
Covert et al. Transcriptional regulation in constraints-based metabolic models of Escherichia coli* 210
US7920994B2 (en) Method for the evolutionary design of biochemical reaction networks
Ruppin et al. Metabolic reconstruction, constraint-based analysis and game theory to probe genome-scale metabolic networks
Machado et al. Co-evolution of strain design methods based on flux balance and elementary mode analysis
Santos et al. A practical guide to genome-scale metabolic models and their analysis
JP2014211907A (ja) ヒト代謝モデルおよび方法
Boghigian et al. Utilizing elementary mode analysis, pathway thermodynamics, and a genetic algorithm for metabolic flux determination and optimal metabolic network design
WO2012027470A2 (en) Articles of manufacture and methods for modeling chinese hamster ovary (cho) cell metabolism
KR20200015916A (ko) 표현형 최적화의 처리량을 증가시키기 위한 유전자 변형의 우선순위 결정
US10878935B2 (en) Systems and methods for determining genotypes for performing physiological functions
Ullah et al. FDBC: a comprehensive platform of the fungi databases collection
US20150127317A1 (en) Method for in silico Modeling of Gene Product Expression and Metabolism
Lachance et al. The use of in silico genome-scale models for the rational design of minimal cells
AU2012203405B2 (en) Models and methods for determining systemic properties of regulated reaction networks
AU2002306625A1 (en) Models and methods for determining systemic properties of regulated reaction networks
AU2007249073B2 (en) Method for the evolutionary design of biochemical reaction networks
AU2002243765B2 (en) Method for the evolutionary design of biochemical reaction networks
AU2008201168A1 (en) Models and methods for determining systemic properties of regulated reaction networks
Österlund Reconstruction of Biological Networks for Integrative analysis
AU2002243765A1 (en) Method for the evolutionary design of biochemical reaction networks

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091116

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100215

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110208

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110214

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110303

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110308

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110502

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110510

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111018

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111117

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees