JP2002518021A - 生物学的ネットワークモデルのテスト方法 - Google Patents

生物学的ネットワークモデルのテスト方法

Info

Publication number
JP2002518021A
JP2002518021A JP2000554875A JP2000554875A JP2002518021A JP 2002518021 A JP2002518021 A JP 2002518021A JP 2000554875 A JP2000554875 A JP 2000554875A JP 2000554875 A JP2000554875 A JP 2000554875A JP 2002518021 A JP2002518021 A JP 2002518021A
Authority
JP
Japan
Prior art keywords
input
input state
pair
network model
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000554875A
Other languages
English (en)
Inventor
ストウトン,ロナルド
カープ,リチャード,エム.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rosetta Inpharmatics LLC
Original Assignee
Rosetta Inpharmatics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rosetta Inpharmatics LLC filed Critical Rosetta Inpharmatics LLC
Publication of JP2002518021A publication Critical patent/JP2002518021A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/10Boolean models

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

(57)【要約】 本発明は、あるネットワークモデルが生物学的系における生物学的経路をいかにうまく表しているかをテストし、確認するための方法およびシステムを提供する。このネットワークモデルは、入力細胞構成要素(例えば、mRNAまたはタンパク質の存在量)を、細胞構成要素(これらは前記生物学的系における前記経路に影響される)の出力クラスと関連付ける論理演算子のネットワークを含む。本発明の方法は、まず、ネットワークモデルをテストするための、ネットワークの摂動に対する生物学的系の相対変化を比較する完全かつ効率的な実験の選択を規定する。本発明の方法はまた、出力クラスが選択された実験に応答していかに挙動するかをネットワークモデルから予測すること、選択された実験で実際に観察された細胞構成要素の相対変化の尺度(measure)を見出すこと、観察された各細胞構成要素の、該細胞構成要素が最も強い相関を有する出力クラスに対する適合度を見出すこと、ならびに観察された各細胞構成要素の個々の適合度からネットワークモデルの全適合度を確定することによる、ネットワークモデルの生物学的系に対する全体的な適合度の確定を規定する。さらに、これらの方法は、実験により確定した可能性のある適合度の分布を用いて非母数統計検定にしたがって全体的適合度の有意性を検定することを規定する。本発明はまた、これらの方法の計算ステップを実行するためのコンピュータシステムも提供する。

Description

【発明の詳細な説明】
【0001】1.発明の分野 本発明の分野は、生物学的経路の決定、および、特に生物学的経路のネットワ
ークモデルのテストと確認のための方法とシステムに関する。
【0002】2.発明の背景 酵母または哺乳動物細胞のような生物学的系は、環境的入力、タンパク質相互
作用、遺伝子制御などを含む、相互作用経路の非常に複雑化した集まりである。
これらの経路に関する知識の向上は、多くの科学的および技術的分野で大変重要
である。
【0003】 たったの一例に過ぎないが、薬剤や薬剤の候補物質の作用の生物学的経路の同
定またはその知識の向上は、大変商業性があり、かつ人類にとっての重要性があ
る。薬物による影響を受ける細胞の経路の一次的な分子標的は、元来その薬物は
特異的薬物スクリーニングによって選択されているために、しばしば周知でり、
もしくは推測されるが、そのような一次的な経路への作用を証明すること、およ
び、時として予想もしない経路において、有害または有益でありうる他の二次的
な経路に沿った作用を定量することは重要である。薬剤の発見のような他の場合
では、候補となる薬剤の作用の一次的経路が未知であり、これらが決定されなけ
ればならない。
【0004】 薬剤の発見は、ヒトの疾病の治療の開発に重要な段階であるが、現在、2つの
アプローチが優性である。この2つのどちらも薬剤の候補の作用の経路に関する
情報を直接的には提供しない。ひとつめのアプローチは、特異的な生物学的アッ
セイで測定される細胞(例えば、アポトーシスの誘導)または組織(例えば、血
管形成阻害)に所望の効果を有する化合物のスクリーニングによって始まる。続
いて、所望の活性を有する化合物は、効力、安定性、または他の特性を増強する
よう改変され、その改変された化合物を該アッセイにて再試験する。このアプロ
ーチでは作用機構または該候補薬物により影響される細胞性経路の情報がほとん
どあるいは全く得られない。
【0005】 薬剤発見の2つめのアプローチは、一般的にはクローン化された遺伝子配列、
または単離された酵素もしくはタンパク質である既知の分子標的への特異的な影
響についての多くの化合物の試験を含む。例えば、多くの化合物を特異的なプロ
モーターからの転写あるいは同定されているタンパク質の結合のレベルを変える
能力について試験できる、ハイスループットアッセイを開発できる。ハイスルー
プットスクリーニングの使用は、薬物の候補を同定するには有力な方法論である
が、これもまた、細胞または組織のレベルにおける化合物の影響に関する情報、
特に実際の細胞性経路の受ける影響に関する情報は、ほとんど、あるいは全く提
供しない。
【0006】 実際、候補薬剤の効力や毒性の経路の解析は薬物開発過程の重要な部分を消費
しうる(たとえば、DeVita ら著、Cancer: Principles & Practice of Oncology
第5版、1997 Lippincott-Raven Publishers, Philadelphiaの、Oliff ら、「M
olecular Targets for Drug Development」参照)。従って、該解析を改良する
方法は、現在、大変価値がある。
【0007】 過去に、既知の入力に対する系の応答を単に観察するだけで、重要な生物学的
系内で起こるある程度の経路や機構(薬剤作用の経路も含む)について、いくら
かの情報が収集できるようになった。その観察される応答は、一般に、遺伝子発
現(つまり、mRNA存在量)および/またはタンパク質存在量であった。該入力は
遺伝子突然変異(遺伝子欠失など)、薬剤処理、環境的成長条件の変化を含む実
験的摂動(perturbation)である。
【0008】 しかし、観察された入出力関係のみから系の詳細を推論する試みは、通常は見
込みのない課題であった。たとえ経路の仮説が有用であっても、示差的諸実験が
、経路の仮説についての、十分な或いは有効な、テストまたは確認を提供するか
どうかを決定することはた易いことではなかった。さらにそのような諸実験があ
ったとしても、それらの結果を経路の仮説の観点からどのように解釈するかは、
必ずしも知られていなかった。
【0009】 多くの試みと精緻な測定にもかかわらず、タンパク質とmRNA濃度のような単純
な観察から、生物学的系の経路を再構成することに関しては、時間依存的相互作
用に大変乏しく、明確な進歩はほとんど成し遂げらていない。(McAdamsら 1995
, Circuit simulation of genetic network, Science 269:650-656; Reinitzら
1995, Mechnism of eve stripe formation, Mechanisms of Development 49:133
-158)。
【0010】 この問題に対する一つのアプローチでは、この問題に関係する別の学問分野か
らモデル化の手法を導入することが行われてきた。例えば、電気工学技術の世界
で一般的なブール表示とネットワークモデルが生物システムに応用されてきた(
Mikulecky, 1990, modeling intestinal absorption and other nutrition-rela
ted processes using PSPICE and STELLA, J. of Ped. Gastroenterolgy and Nu
trition 11:7-20; McAdamsら 1995 Circuit simulation of genetic network, S
cience 269:650-656)。一つの適用は発生段階、特に逐次的な生物体発生期間の
遺伝子転写制御についてであった(Yuhら、1998, Genomic Cis-regulatory logic
: Experimental and computational analysis of a sea urchin gene, Science
279:1896-1902)。
【0011】 生物体における生物学的経路のモデルを開発しテストするにあたって注目され
るべき困難さで、最近達成された生物学的測定技術の多大な進歩の効果的利用が
妨げられてきた。
【0012】 これらには遺伝子転写測定法 (Schenaら 1995, Quantitative monitoring of
gene expression patterns with a complementary DNA microarray, Science 2
70: 467-470; Lockhortら 1996, Expression monitoring by hybridization to
high-density oligonucleotide arrays, Nature Biotechnology 14:1675-1680;
Blanchardら 1996, Sequence to array: Probing the genome’s secrets, Nat
ure Biotechnology 14, 1649; 薬物スクリーニング法についての米国特許第5,56
9,588号(1996年10月29日に発行, Ashbyら)) とタンパク質量測定法(MaCormacke
tら 1997, Direct analysis and identification of proteins in mixture by
LC,MC,MS and database searching at the low-femtomole level, Anal. Chem.
69(4):767-776; Chait, Trawling for proteins in the post-genome era, Natu
re Biotechnology 14:1544) の最近の進歩が含まれる。 一層の技術的進歩は生
物学的系を修飾し摂動させる能力に関して行われた(Montensenら 1992, Produ
ction of homozygous mutant ES cells with a single targeting construct, M
ol. Cell. Biol. 12:2391-2395; Wachら 1994, New heterologous modules for
classical or PCR-based gene disruptions in Saccharomyces cerevisiae, Y
east 10:1793-1808)。そして、もちろん、もし定量的方法が利用可能なら、利
用可能な単位コストあたりの計算能力の急速な増加は、それらの開発をより一層
経済的に優れたものにするであろう。
【0013】3.発明の概要 したがって、本発明の目的は、現在利用可能な強力な遺伝子発現測定法および
細胞摂動技術を利用する、生物学的経路のネットワークモデルの定量的テストお
よび確認のための方法およびシステムを提供することにより、従来技術の問題を
解決することである。
【0014】 本発明の方法およびシステムは、一部は、注意深く選択した、実在する問題の
戦略上の単純化および抽象化からなる群が、有用且つ有意な結論を迅速且つ容易
に取得することを可能にするという発見に基づくものである。重要な抽象化の1
つは、ネットワークモデルの入力および出力をバイナリ値に粗変換すること(coa
rsening)および生物学的系における細胞構成要素同士の相互作用を簡単な組合わ
せの規則を用いて論理ゲートとしてモデル化することを含む。重要な単純化の1
つは、単一の状態での絶対量を調べる代わりに生物学的系における2つの状態間
の相対変化を比較する実験に対してネットワークモデルをテストおよび確認する
ことを含む。さらに重要な単純化は、ネットワークモデルが生物学的系と全く相
関関係がないという帰無仮説を否定するために実験的に誘導した確率分布を用い
ることにより、実験データを考慮してネットワークモデルの有意性を評価するこ
とを含む。
【0015】 より詳細には、本発明は、あるネットワークモデルが生物学的系における生物
学的経路をいかにうまく表しているかをテストおよび確認するための方法および
システムを提供する。このネットワークモデルは、入力細胞構成要素(例えばmRN
Aまたはタンパク質の存在量または活性)を細胞構成要素(細胞構成要素は、生物
学的系の経路に影響される)の出力クラスに関連付ける論理演算子のネットワー
クを含む。本発明の方法は、まず、ネットワークモデルをテストするための、ネ
ットワークの摂動に対する生物学的系の相対変化を比較する完全かつ効率的な実
験の選択を規定する。この方法はまた、出力クラスが選択された実験に応答して
いかに挙動するかをネットワークモデルから予測すること、選択された実験で実
際に観察された細胞構成要素の相対変化の尺度を見出すこと、観察された細胞構
成要素それぞれの、前記細胞構成要素が最も強い相関を有する出力クラスに対す
る適合度を見出すこと、ならびに観察された細胞構成要素それぞれの個々の適合
度からネットワークモデルの全体的適合度を確定することによる、ネットワーク
モデルの生物学的系に対する全体的な適合度の確定も規定する。さらに、これら
の方法は、実験により確定した可能性のある適合度の分布を用いて非母数統計検
定にしたがって全体的適合度の有意性を検定することを規定する。本発明はまた
、これらの方法の計算ステップを実行するためのコンピュータシステムも提供す
る。
【0016】 さらに、本発明は下記の態様を有する。本発明の方法は、接続(connection)が
限定されたモデルから出発してより完全で有意なモデルが得られ得るように、ネ
ットワークモデルの反復リファインメント (iterative refinement)の実行も規
定する。
【0017】 完全かつ効率的な実験は、入力状態と出力クラスの間の論理関係の集合として
、ネットワークモデルの定式化(formulation)からルーチン的且つ自動的に選択
され得る。実験の労力または試薬のコストに関連し得るもののようなコストを実
験タイプに割り当てる場合、実験テストは全体的なコストを最小化するように選
択され得る。
【0018】 好適な単純化の場合でさえ、ネットワークモデルについて確定された適合度は
、典型的にはその統計学的挙動が分析学的にモデル化するのが困難または不可能
である実験誤差を有する。したがって、本発明の方法は、好ましくは、観察デー
タの数値ランダム化を実行して、任意のモデルの前記データに対する適合度の実
験的確率分布を得る。
【0019】 第1の実施形態においては、本発明は、生物学的系のネットワークモデルをテ
ストする方法であって、(a) 複数の実測相対変化のそれぞれが、複数の規定相対
変化のそれぞれといかにうまく適合しているかを判定するステップ、ここで、前
記規定相対変化は、あるネットワークモデルに対する標準化影響マトリックス(i
nfluence matrix)により得られるものである;(b)各細胞構成要素を前記ネット
ワークモデルの特定の出力クラスに割り当てるステップ、ここで、各細胞構成要
素は、前記細胞構成要素の実測相対変化と最も適合する規定相対変化を有する出
力クラスに割り当てられる;ならびに(c) ネットワークテスト実験から得られた
データ(すなわち、1種以上の細胞構成要素についての実測相対変化のデータ)の
全体的適合度を確定するステップを含んでなり、それによって前記ネットワーク
モデルが前記全体的適合度によりテストまたは確認される方法を提供する。
【0020】 上記の第1の実施形態のネットワークモデルは、(i) 複数の入力構成要素、こ
こで、1以上の入力構成要素の摂動は入力状態を含む;(ii)出力状態と関連した
挙動の複数の出力クラス;および(iii) 前記入力状態と前記出力状態との間の論
理関係であって、それにより前記出力状態が前記論理関係にしたがって前記入力
状態に依存するものを含んでなる。第1の実施形態の標準化影響マトリックスは
、第1の入力状態から第2の入力状態までの各出力クラスの前記規定相対変化を
規定する。第1の実施形態の実測相対変化は、1以上のネットワークテスト実験
から得られたデータにより与えられる。このネットワークテスト実験は、第1の
入力状態から第2の入力状態までの1以上の細胞構成要素の相対変化の測定を含
む。
【0021】 第1の実施形態の第1の態様においては、各実測相対変化が各規定相対変化に
いかにうまく適合するかを判定するステップは、各実測相対変化と各規定相対変
化との間の差の目的関数の値を確定することを含む。
【0022】 第1の実施形態の第2の態様においては、まず、前記判定ステップが、各細胞
構成要素についての適合度を確定することを含み、ここで、適合度は細胞構成要
素の実測相対変化についての目的関数の最大値であり;第2に、全体的適合度は
各細胞構成要素の適合度値を組み合わせることにより得られる。
【0023】 第1の実施形態の第3の態様においては、本発明は、(d)全体的適合度値の期
待確率分布を得ること;および(e)期待確率分布を考慮して実際の全体的適合度
値の統計学的有意性を評価することを含む方法によって、全体的適合度の有意性
を評価するステップをさらに含む。
【0024】 第1の実施形態の第4の態様においては、期待確率分布を得るステップ(d)は
、(i)細胞構成要素に関して実測相対変化をランダム化すること;(ii) 細胞構成
要素のランダム化された実測相対変化についての目的関数の最大値を確定するこ
とにより各細胞構成要素についての「ランダム化された」適合度値を確定するこ
と;(iii) 各細胞構成要素の前記ランダム化された適合度値を組み合わせること
により全体的ランダム化適合度値を確定すること;ならびに(iv) ステップ(i)〜
(iii)を繰り返して複数の全体的ランダム化適合度値を確定することを含んでな
り、それによって得られる複数のランダム化された適合度値は、全体的適合度値
の期待確率分布を含む。
【0025】 第2の実施形態においては、本発明は、プロセッサーと前記プロセッサーに連
結されたメモリーを含む、生物学的系においてネットワークモデルをテストする
ためのコンピュータシステムを提供する。前記メモリーには1種以上のプログラ
ムがコード化されており、前記プログラムはプロセッサーに上記方法のステップ
を含む方法を実行させるものである。
【0026】 第2の実施形態の特定の態様においては、プログラムはさらに、プロセッサー
に、ネットワークモデルについての影響マトリックスを構築させる。ここで構築
された影響マトリックスは、上記方法のステップで用いられる標準化影響マトリ
ックスである。
【0027】4.図面の簡単な説明 本発明における、これらおよびほかの目的、特徴、および利点は、添付した図
、詳細な説明、および添付の請求項を見ると、当業者には明らかであろう。
【0028】 図面の説明については下記を参照されたい。
【0029】5.詳細な説明 この項は最初に、本発明を一般的に記述し、二番目に、次の小節で本発明の個
々のステップおよび構成要素の詳細を紹介する。
【0030】 図1は、生物学的系に存在するネットワークモデルに関する仮説をテストする
ための本発明の方法を概略的に図示する。本発明によれば、ネットワークモデル
は、特別な方法で、生物学的系(例えば、細胞、組織、患者、など)に影響を及
ぼすと仮定される関係する一連の細胞構成要素を含む。その影響が起こる機構は
知られているか、または推測されるかもしれないので、従って、ネットワークモ
デルの選択を導くことができ、続いて該モデルは本発明によりリファインメント
(refinement)されうる。一方、これらの機構は知られていないかもしれず、その
ような場合、最初に想像されるネットワークモデルは、本発明による実験データ
に適合するようリファインメントされうる。ネットワークモデル中にあり、生物
学的系において測定される細胞構成要素は、あらゆるタイプのものであり得る。
例として、とりわけ、それらは、mRNA種の存在量(遺伝子発現を示す)、または
タンパク質種の存在量、またはタンパク質種の活性でありうる。
【0031】 したがって、図1に関しては、本発明の方法は、生物学的ネットワークを形成
する細胞構成要素の関係および影響に関する最初の仮説101によって開始する。
この最初の仮説、および続いてリファインメントされた仮説(もしあれば)は、
ネットワークモデル102に正確に表されており、これは、同等に、ネットワーク
入力および出力に結びつく一以上の関係として、またはこれらの関係、および入
力と出力との結びつきをも示す図として、表される。入力はネットワークモデル
中に存在する細胞構成要素に対する摂動および変更を表し、出力は、該ネットワ
ーク中に存在しない他のあらゆる細胞構成要素に該入力に対する摂動や変更にお
いて想定されうる一般の応答のクラスを表す。換言すれば、ネットワークモデル
にしたがって、ネットワーク中に存在しない生物学的系内のいかなる細胞構成要
素も経路の入力の摂動や変更に応答して、一般の出力クラスのうちの一つにした
がって挙動するはずである。
【0032】 実験的には、ネットワークモデル102は図1に図示される実施形態の他のステ
ップにしたがってテストされ、確認される。ステップ103では、ネットワークモ
デルは、ネットワークのテスト、または確認に必要かつ十分であろう効果的な一
組の実験を作り出すように、好ましくは自動的に、加工される。これらの実験は
、細胞構成要素への入力の摂動または変更(実験的に可能でなければならない)
で構成され、生物学的系104で実行される。生物学的系における他の細胞構成要
素への変化(ネットワークの一部として摂動されない)はこれらの実験中に観察
される。同様に、ネットワークモデル102は、生物学的系104で実行された時の効
果的な実験の結果を予想できるように必ず加工されうる。
【0033】 次に、段階105において、定量的比較は、該生物学的系において観察される応
答に対して、ネットワークモデルの一般の出力クラスがいかによく適合するかを
決めるために、これらの予想に対して実験的に観察された変化からなる。好まし
くは、該定量的比較は、適合の統計的有意性の評価も含む。この適合を鑑みるこ
とで、前のステップを繰り返すことによって最初のネットワークモデル(または
容易にリファインメントされた型)を(さらに)リファインメントでき、また、
試験できる。
【0034】 下記の項では、これらのステップおよびその実行の詳細を述べる。項5.1は、
生物学的ネットワーク、ネットワークモデル、および本発明によるネットワーク
モデルについての好ましい表記を記載している。この好ましい表記はネットワー
クモデルの明確であいまいでない記述を規定する。項5.2では、生物学的系にお
ける実験の際に細胞構成要素に観察される変化を表すのに適した定量的尺度、ネ
ットワークモデルによる細胞構成要素中の変化の予測、および適切に表された実
験結果に対する予想の適合度の評価を、記述する。項5.3では、実験データのネ
ットワークモデルへの適合度の統計的有意性の判定について記述している。これ
は、生物学的系に対するネットワークモデルの定量的比較の一部として好ましい
。項5.4では、ネットワークモデルのテストおよび確認において、いかに効率的
な実験が選ばれるかということについて述べる。項5.5では、生物学的ネットワ
ークへの細胞構成要素の入力を変化、または摂動させるため、および、一般の細
胞構成要素における変化の測定するために、使用した実際の実験技術を記述する
。最後に、項5.6は、コンピュータによる本発明の方法の典型的な実施を記載し
ている。
【0035】5.1. ネットワークモデルの表示 この項では、第1に本発明におけるネットワークモデル、第2にネットワーク
モデルのいくつかの例、そして3番目にフィードバックを伴うネットワークの処
理を一般的に記述する。この項は、本発明において目的の「細胞構成要素」の一
般的記述で締めくくる。
【0036】一般的ネットワークモデル 本発明の生物学的ネットワークモデルは、選択された一組の細胞構成要素(「
入力」細胞構成要素、または「入力構成要素」として知られる)を生物学的系の
別の構成要素(細胞または組織など)に単純に関係づける。選択された細胞構成
要素は、例えば、目的の薬剤の作用と関連する一組のタンパク質または遺伝子で
ありうる。ネットワークモデルは、該入力構成要素への変更または摂動を、おそ
らく薬剤への暴露によって、結果としての別の細胞構成要素における応答、すな
わち、対応する「出力状態」に関係づける。一方、ネットワークモデルは、「休
止状態」で見いだされるような、入力構成要素へのそのような摂動の欠如も対応
する出力状態に関係づける。これらのモデルは、知識が限定されたり、あるいは
不完全であるという状況を解明することを指向しているので、効果的なモデル化
を促進するために重要な詳細を抽象化する。特に、本発明のネットワークモデル
は、好ましくは、入力細胞構成要素の生物学的作用メカニズムの詳細、および入
力細胞構成要素の実際の作用の数値的詳細を抽象化する。
【0037】 特に、ネットワークモデルが生物学的系で諸作用を反映する詳細のレベルは本
発明において重要である。実際には、ネットワークの入力細胞構成要素に対する
摂動または変更、およびその後の生物学的系での他の細胞構成要素の変化は、連
続的で、実際の存在量または活性の範囲を有しているのだが、生物学的系におい
て重要かつ有用な情報が、これらの摂動および変化の粗くて不連続な(しばしば
バイナリの)抽象化と提示だけから、獲得されうることは、本発明が基づく抜本
的な発見である。したがって、本発明では、ネットワークに入力される細胞構成
要素への摂動と変更の値は、慣習的に値“0”と“1”で示される二成分量によ
って説明される。言い換えれば、本発明の目的にとっては、摂動または変更は、
存在または非存在のいずれかであるとみなされる。一般的には、入力構成要素の
基準状態は“0”で表示される。例えば“0”はmRNA種の通常の存在量、タンパ
ク質種の通常の存在量、または通常活性、または、薬物または他の非通常的に生
じる摂動がない状態を示すのに使われうる。一方で、例示すると、“1”は通常
起こっているmRNAの発現を妨げる遺伝子欠失、または、タンパク質存在量または
活性への摂動、または薬物への暴露の存在を表示するために使われる。しかしな
がら、“0”は細胞構成要素への最初の摂動の出現を表示するのにも使用され、
一方で、“1”はその次の摂動の出現を表示する。入力の“状態”または“入力
状態”は、ここでは入力細胞構成要素(摂動されない細胞構成要素もまた考慮さ
れる)に適用されうる摂動とまたは変更の集合を意味するのに用いられている。
【0038】 さらに、本発明では、出力クラスは入力細胞構成要素への摂動または変更の値
のブール関数であると解される。それぞれの出力クラスは、生物学的ネットワー
クの入力細胞構成要素への特定の一連の摂動に応答する、バイナリ値の特有のパ
ターンを有する。特定の出力クラスに関連したバイナリ値の特有のパターンは、
ここでは、“出力状態”と示している。当業界で公知であるように、このような
ブール関数は、摂動の値を表す変数に作用する基本的な、AND、ORそしてNOTの演
算子の使用により標準的書式で表されうる。
【0039】 あるいは、これらのブール関数を結節点が初等ブール演算子を意味し、そして
結合が入力細胞構成要素から、その他の結節点から、または出力クラスに対して
伝導される影響を意味するネットワーク(本明細書中で「グラフ」とも称される
)として表現することができる。現実の生物学的機序および経路は論理的なAND
、ORまたはNOTではないが、発明者はこうした論理的構成体を基礎とするモデル
が現実の生物学的ネットワークの接続性および影響に関する有用な結果を取得す
るのに十分であることを発見した。後に考察するように、適用の一般性を失うこ
とがないままで、本発明のネットワークモデルにはフィードバックループがない
ものと仮定することができる。
【0040】 ネットワークモデルの明確な説明を助長するため、ブール関数に関係するシス
テムの入力および出力を論理学的分野において知られているフォーマットで明白
に記号化する。この標準的記号化の代表例となる説明を以後の実施例に示す。
【0041】 出力クラスに現われる現実の数値、「0」または「1」の解釈は本発明のさらに
別の基礎を形成する第2の主要な発見を根拠としている。この第2の発見にした
がって、ネットワークモデルに対して実験的に観察された入力の2つの状態間の
差異、基準状態と摂動された状態の間または2つの異なる摂動された状態間の差
異など、を考慮するだけで、ネットワーク仮説の試験および確認が驚くほど単純
化される。ネットワークモデルの試験および確認は1つの状態での細胞構成要素
の(絶対的)存在量または活性に依存するのではなく、またモデル−データ間の
比較は常に出力の「変化」に基づくものなので、すべての場合において出力クラ
スの現実のバイナリ値に対して何ら特定の意味を割り当てる必要はない。例えば
、「0」は特定の細胞構成要素の存在もしくは不在または中間値を表す場合があ
り、一方「1」は逆にそれぞれその細胞構成要素の不在もしくは存在または別の
中間値を表すことがある。
【0042】 あるいは、ネットワークモデルに対する所定の入力の中間状態(例えば、遺伝
子発現の場合ならば完全な「オン」でも「オフ」でもなく、または薬剤処理の場
合ならば部分的阻害)を「0」状態と解釈し、一方任意のその他の状態を「1」状
態と解釈することができる。また、出力の1つの変化を達成するために複数の中
間状態を使用することができ、次にこの変化の存在または不在がそのネットワー
クの接続性を知らせる。以下の第5.5.1節に記載するように、特定の遺伝子およ
びタンパク質の機能の継続した制御を使用して、こうした中間状態を達成するこ
とができる。
【0043】 本発明は生物学的ネットワークに対する入力の2つの状態間の変化の実験的比
較を利用するので、実験上意味があるのは2つの状態によって産生される細胞構
成要素の相対数値であり、また出力クラスにおいて意味があるのは異なる入力の
状態によって生成された数値の比較である。こうした比較は2つの状態間の変化
(「0」から「1」へ若しくは「1」から「0」へ)または無変化(「0」から「0」
へ若しくは「1」から「1」へ)を表すことができる。好ましい1実施形態におい
て、出力クラスにおけるこれらの比較について、予測された変化の別の様相を抽
象化するように、さらに大枠の抽象化をする。特定すると、変化の様相を変化の
出現から抽象化する。この抽象化した変化を本明細書中で「影響マトリックス」
として知られるマトリックス中に集合させるが、これはネットワークモデルの実
験用の予測を表す。
【0044】 ネットワークモデル中に存在する認知の程度に適切なものとして、いくつかの
レベルの抽象化または「粗化(coarsenings)」が使用される。一般的に、特定の
生物学的ネットワークについて認知量が多いほど、より詳細な抽象化を有効に利
用することができる。例えば、特定の生物学的ネットワークに関連してあらかじ
めほとんど知られていない場合は、最も粗い表現法が適当である。こうした表現
法において、影響マトリックス中の数値は2つの入力状態(実験)間の比較にお
いて変化の方向すらも無視されて、細胞構成要素が変化したかまたは変化しなか
ったかを示すことができるだけである。そのネットワークについてもっと知られ
ている場合は、影響マトリックス中の数値は2つの入力状態の比較において細胞
構成要素が増加したか減少したか、またはその逆を示す。さらに枠取りが小さい
表現法では、影響マトリックス数値は各比較中の各構成分に関して変化の特定の
方向をも表すことができる。
【0045】 高レベルの抽象化の例として、接続およびゲートのネットワークが絶対状態で
はなく変化の伝導を表すことができる。例えば、飽和状態でない2つの数値間の
任意の1入力を変化させることによって、差異がある1組の入力状態を形成する
ことができる。その入力に対する所定の出力クラスの応答に相当する影響マトリ
ックスエレメントは、その入力をその出力に接続するなんらかのネットワーク経
路があれば、「1」にセットされ、なければ「0」にセットされる。次に、ネット
ワークの接続結節点を形成するブールゲートは事実上すべて「OR」ゲートにセッ
トされる。差異がある1組の入力数値が提供される場合は、いずれかの入力の状
態は「1」であり、入力のいずれかが「1」の場合は、いずれかのゲートの出力が
「1」である。その場合、論理的ゲートの解釈は絶対状態ではなく、変化の伝導
点である。下記に示すモデル−データ間の比較操作を完全に適用することができ
る。なぜならば、この比較は絶対的状態ではなく、変化対非変化のレベルでなさ
れるからである。これらの連続して変化し得る摂動のための方法として、定量可
能な発現系、トランスフェクションおよび特定の既知の作動薬が含まれ、これら
は下記第5.5.1節でさらに詳細に議論する。
【0046】 記載したように、本発明について重要なのは、この方法のステップを反復して
適用することによって、ネットワークモデルを反復リファインメントすることが
できる点である。したがって、当初最も大まかな表現を使用する場合でも、この
モデルのリファインメントによってネットワークの別の実験および別の知識が得
られ、それによってもっと粗いリファインメント化モデルの使用が可能になる。
あるいは、当初のモデルが実験データにうまく適合しない場合は、最初に粗化し
て検索を単純化し、有意な別の構成を持つようにモデルを改良することができる
【0047】 本発明においては、少なくとも試験および確認のための実験を誘導するため、
またその実験の結果を予測するための両方のためにネットワークモデルを使用す
る。したがってこのネットワークモデルから、好ましくはコンピューター操作を
含むルーチン的な、いずれも完全でしかもそのネットワークモデルを有効に試験
および確認する様式で、可能な実験が誘導される。下記、第5.4節を参照された
い。誘導される実験は出力クラスのいずれの1組でも少なくとも1回の実験によ
って識別されるという意味で完全である。実験は何らかの目的とする実験の設計
基準、例えば最少コストであるとかまたは最も迅速な実施など、を最少化する点
で有効である。あるいは、実験を常用の検査、実験的直観などの別の手法によっ
て単純に選択するか、または単純にすべての可能な比較を含ませることができる
(したがって不必要な情報を生む可能性がある)。これらの実験を1生物学的系
において実施し、変化した細胞構成要素を観察する。一般的に、変化した細胞構
成要素の適切な特性(例えば存在量、活性、その他)を、相対的数値を取得する
ための各実験を確定する入力細胞構成要素の2つの状態において比較する。
【0048】 試験用実験のための有効な選択を導く他に、ネットワークモデルはこれらの実
験の結果の予測もする。下記、第5.2節を参照されたい。一般的に、特定のネッ
トワークモデルにしたがって、影響マトリックスは、その特定のモデルで採用し
た抽象化または粗化の程度にしたがって(入力細胞構成要素に対する一定のセッ
トの摂動の結果を一対ずつ比較する)実験の予測された結果を集積する。したが
って、ネットワークモデルの定量的比較は、その生物学的系の細胞構成要素につ
いて観察されたすべての変化がその生物学的ネットワークの出力クラスの1つに
どれだけうまく分類されるか、または適合するかをチェックするものである。こ
の総合的適合がよいほど、そのネットワークモデルはより優良である。好ましく
は、その定量比較はその全体的適合度の数値的指標を戻すものである。
【0049】 好ましい1実施形態において、定量比較105にさらにそのネットワークモデル
についてわかった全体的適合度の有意性に関する統計的試験が含まれる。下記第
5.3節を参照されたい。これらの試験は、そのネットワークモデルが生物学的系1
04とは何ら関係しないという意味の帰無仮説に対する、現実のネットワークモデ
ルを試験するための、実験的確率分布を構成する。これらの試験からそのネット
ワークモデルがその生物学的系に何ら関係しないという数値としての確率値(本
明細書中では「P値」とも称される)が生成される。
【0050】 場合によって、決定されたP値から見て、その前のステップを反復することに
よって、当初のネットワーク仮説を繰り返しリファインメントすることができる
。例えば、当初のネットワーク仮説を変更またはリファインメントして、その前
のステップを反復し、新しいP値を取得することができる。新しいP値が当初のP
値よりも良好ならば、さらによいP値を持つモデルの探索におけるその後のリフ
ァインメントのための基礎として、このリファインメントされた仮説を使用する
ことができる。こうした改善の到達点は、有意性の何らかの閾値以下のP値を持
つ方向への、または研究中の生物学的系または生物学的サブシステムの様相の有
用な表現となる方向への、ネットワークモデルの収束である。典型的なP値の閾
値は36%以下、好ましくは5%以下、さらにより好ましくは1%以下(ネットワー
クモデルがその生物学的系に関係がない見込み)である。
【0051】ネットワークモデルの例 好ましい記号化で示すネットワークモデルのいくつかの例を以下に示す。図2A
で説明する基本的な生物学的活性についての第1のネットワークモデルを図2Bに
示す。図2Aにおいて、タンパク質Pは遺伝子Gによって発現され、正常では機能F1
に誘導される。しかし、薬剤Dと組合せたとき、タンパク質Pは新しいセットの機
能F2に再誘導される。薬剤Dのタンパク質Pとの組合せによって当初の機能F1から
タンパク質Pの分子のいくつかが除去されるので、タンパク質Pの当初の機能の喪
失に伴う効果の1クラスとなる。薬剤Dのタンパク質Pとの複合が新しい機能F2を
産生するので、この複合に伴う効果の別のクラスとなる。「タンパク質再誘導」
と称されるこのタイプの薬剤の作用は、免疫抑制剤、Tacrolimus(FK506)およ
びCyclosporin Aのそれらに対応する結合相手、FK506結合性タンパク質およびシ
クロフィリンを介したカルシニューリンタンパク質に対する作用に代表される(
Cardenasら、Perspectives in Drug Discovery and Design,2:103-126,1994)。
例えば図7Bにおいて、出力クラス1、2、および3は薬剤Tacrolimusによるタンパ
ク質fprの再誘導を表し、出力クラス5、6、および7は薬剤CyclosporinAによるタ
ンパク質cphの再誘導を表す。
【0052】 図2Bは論理演算および接続によるこれらの効果の明確な表現であるネットワー
クモデルを示している。入力は薬剤Dへの曝露についてD、(遺伝子Gの欠失によ
るなどの)タンパク質Pの摂動をPで表示している。結節点201はこれら演算子、
この場合はAND演算子について「Λ」によって表示された論理演算を示している
。結節点間のリンクの意味は、この図に示す凡例によって指示している。出力ク
ラス1、2、および3はこのネットワークの外に出る弧(arc)を示す(図の記号化の
このフォーマットは本記載を通して利用される)。この図は出力クラスに関する
以下のブール式と等価である。
【0053】 出力クラス1=D 出力クラス2=PΛD 出力クラス3=PΛD [式中、「Λ」は論理的ANDを表示し、「」は論理的NOTを表示する] この出力クラスは表1(当分野で「真理値表」としても知られている)によっ
ても表現される。
【0054】
【表1】 表1:図2Bの出力クラス この表中、最上列には図2Bのネットワークモデルに対する入力変動または変更
に関する可能な数値のセットを列記している。記載したように、各セットは入力
状態と称され、各状態はこの表の第2列に表示している。このネットワークモデ
ルにはこれに含まれる生物学的系に対するこのネットワークのすべての効果を説
明するために、仮定された3つの出力クラスが記載されている。出力クラス1、2
、および3は表1中で続く列に列記された各種の入力状態中の数値を持つ。
【0055】 図2Bの出力クラス1、2、および3は、生物学的系(または細胞)が列記された
入力状態になった時の細胞構成要素の挙動をモデル化している。以下にさらに記
載するように、細胞構成要素としては中でもmRNA存在量(遺伝子発現を表す)、
タンパク質存在量、またはタンパク質活性がある。本発明に従うこのネットワー
クモデルの使用には、どの特定の出力クラスによってどの特定の細胞構成要素を
モデル化するかに関する推測的な知識を必要としない。むしろ、このネットワー
クモデルの優良性は、このシステム上の実験に応答して、これらのクラスの1つ
によって細胞構成要素中に観察される変化がどんなによくモデル化されているか
によって決まる。
【0056】 本発明において一般的に、出力クラスは好ましくは共通元のないセットである
。換言すると、Pによって仲介されない細胞構成要素上の薬剤Dの効果があれば(
出力クラス1)、この細胞構成要素がタンパク質Pを介しても薬剤Dに影響されず
、またタンパク質Pによって直接にも影響されない(出力クラス3および2)。共
通元のない出力クラスの使用は、一般的に観察される生物学的系をモデル化し、
そのネットワークモデルのその後の分析を単純化する点において、効果的である
ことがわかった。
【0057】 やはり記載したように、各種状態中の出力クラスの数値は絶対的解釈を与える
ものではない。その代わりに、それらは相対的変化について比較される。したが
って、このネットワークモデルのテストのための実験では、入力細胞構成要素、
薬剤Dおよびタンパク質Pの一対の状態間の細胞構成要素における変化が比較され
る。この比較は上記および第5.2節にさらに詳細に記載するように、抽象化され
る可能性がある。例えば、表2は図2Bのネットワークモデル上の実験1、2、およ
び3の結果を示している。
【0058】
【表2】 表2:図2Bをテストするための実験 表2において、3つの列は3種の実験の結果を示している:実験1はタンパク質P
の存在下で薬剤Dへの曝露があるかまたはないときの生物学的系の応答を比較し
、実験2は薬剤Dへの曝露の不在下でタンパク質Pが存在または不在のときの生物
学的系の応答を比較し、そして実験3はタンパク質Pの不在下で薬剤Dへの曝露が
あるかまたはないときの生物学的系の応答を比較している。表2の項目は表1の対
応する項目から直接得られる。
【0059】 所定のネットワークモデルを試験するための実験の系統的な選択は第5.4節に
記載する。タンパク質Pは、例えば当分野で既知でまた第5.5節に示す技法による
(図2Aの)遺伝子Gの欠失またはノックアウトによって、不在とすることができ
る。
【0060】 任意の細胞構成要素について、絶対値「0」または「1」の意味は不定であるが
、変化は有意である。抽象化の最低レベルにおいて、「0」から「1」への変化は
「1」から「0」への変化とは別の方向であるものとみなされる。好ましい抽象化
のレベルにおいて、「0」から「1」への変化は「1」から「0」への変化とは単に
異なるものとみなされる。抽象化の最高レベルにおいて、「0」から「1」への変
化または「1」から「0」への変化は無変化とは異なるものとみなされる。これら
の抽象化を使用して、第5.2節に記載するように実験の結果を予測する。
【0061】 表2の例示の実験について、3つの実験の各クラスの挙動は別個である。したが
って、明確に観察された応答を有する細胞構成要素(例えば遺伝子またはタンパ
ク質の存在量または活性)は、これらの3つの実験に対するその応答に基づいて
、3つのクラスの1つに適合するかもしれないし、あるいはあまり適合しないかも
しれない。細胞構成要素によっては、図2Bのネットワークモデルの仮定において
、単なる実験誤差または不正確さによって、どのクラスにも適合しない挙動が観
察されることがある。その他の細胞構成要素でも、統計的に有意でなく、どのク
ラスにも確実に入れることができない小さな変化だけが観察されることがある。
本発明にしたがうすべての場合において、ネットワークモデルの質の尺度は、全
細胞構成要素の観察された挙動の出力クラスへの適合度の総合的な質である。好
ましくは、適合化の方法はその適合度の質を示す数量値に還元されるものである
【0062】 別々のモデルを適合度の質を比較することによって、効率的に比較する。例え
ば、図2Bとは別の1ネットワークモデルでは生物学的系に対して薬剤Dおよびタン
パク質Pの複合体の効果を省略することができる。したがって、出力クラス3は存
在せず、すなわち表2は最終横列がなくなる。その場合、出力クラスが2つのみと
なり、細胞構成要素の観察される挙動はクラス1またはクラス2によってモデル化
されることになる。この別のモデルの適合度の質を当初のモデルと比較して、勝
れているモデルを決定することができる。
【0063】 以下に示すのは、単純な生物学的状況に適切な生物学的ネットワークのその他
の3つの例である。図3A-Cは酵母における接合経路で出現するような1シグナル
経路におけるキナーゼカスケードに適切なモデルを説明している(Cardenasら、
Perspectives in Drug Discovery and Design,2:103-126,1994)。図3Aはシグナ
ル分子Sがタンパク質P1を活性化し、次にこれがタンパク質P2を活性化し、後者
が次にタンパク質P3を活性化する、生物学的機序を表している。出力クラス1お
よび2はその存在量または活性がこのシグナル経路の上流での事象の結果として
変化する、細胞構成要素(例えばmRNA若しくはタンパク質の存在量、またはタン
パク質の活性)を含んでいる。出力クラス3はこのシグナル経路によって最終的
に標的とされる細胞構成要素を含んでいる。
【0064】 図3Bは図3Aの生物学的機序に対応するネットワークモデルである。図3Cはモデ
ル化した論理的関係を示している。この経路におけるタンパク質の相互作用はAN
D演算子によってモデル化されるものと仮定する。これは活性化のためには両入
力(経路中の先行するタンパク質の活性化および当面のタンパク質の存在)が存
在しなければならないことを意味している。このネットワークの主要な生物学的
機能はクラス3によって表される最終の変化に影響を与えることであるが、中間
タンパク質P1およびP2の活性によって副次的影響が出現し得る。これらの副次的
影響はクラス1および2によってモデル化される。3つのクラスをすべて含むこと
によって、この経路の活性化の順序、すなわちシグナルSがタンパク質P1を活性
化し、これがタンパク質P2を活性化し、これがタンパク質P3を活性化することを
、これらの別のクラスにおける変化の観察から、再構築することが可能になる。
【0065】 当業者ならば図3Bのネットワークモデルが図3Cの論理的関係と等価であること
を容易に理解するであろう。さらに、当業者は表1と同様のある状態の真理値表
、および表2に類似する実験結果の表中のこれらの表現のいずれかをどのように
解釈するかを容易に理解するであろう。
【0066】 図4A-Bは遺伝子G4の発現を調節する転写複合体がタンパク質P1、P2、およびP3
から形成され、この遺伝子からタンパク質P4が発現される、ある生物学的状況に
適切である。この3つの転写因子は遺伝子G4に対して相乗的に作用し、この場合
遺伝子G4の発現は3つの因子全部の結合量の生成に依存する。図4Aはこの生物学
的機序を表現している。
【0067】 図4Bは転写因子の相乗的作用が1つのAND演算子で表現されている、対応する
ネットワークモデルである。単一の出力クラスを表示する論理的関係も説明され
ている。相乗的作用と同様に、AND演算子は遺伝子G4の活性化のためには因子の
全部が存在することが必要とされるが、この演算子は結合した因子の量に影響を
受けない。したがって、本発明が基礎としている二元近似法に一致するネットワ
ークモデルは転写因子の現実の数値から各因子が存在または不在のみに抽象化し
ている。
【0068】 図5A-Bは余分な転写因子が関与する状況に適切である。この場合、タンパク質
P1またはタンパク質P2のいずれかが十分量存在するならば、G3の転写はその量に
相当する量が誘導される。図5Aはこの生物学的機序を説明し、図5Bは対応するネ
ットワークモデルを説明している。単一の出力クラスを表示する論理的関係も説
明されている。余分な転写因子の代替作用と同様に、OR演算子は遺伝子G3の活性
化のために因子の1つのみの存在を必要とするが、この演算子は存在する因子の
量に影響されない。この場合、このネットワークモデルも基礎となる生物学的系
の二元近似法を抽象化している。
【0069】 これらの例から、当業者は本発明のその後のステップの実用化に好適な仮説の
生物学的機序からネットワークモデルをどのように構築するかを理解するであろ
う。あるいは、技術者は任意の生物学的機序の予備知識がなくても、現実の実験
データに存在するパターンを考慮することによって、ネットワークモデルを構築
することができる。
【0070】フィードバックによるネットワークの処理 本発明のネットワークモデルは、ネットワーク中の論理的操作の間にフィード
バックを含んでいない。なぜならば、こうしたフィードバックはモデルに対して
細胞構成要素状態の入力による出力クラスの応答の明白な判定を妨げるからであ
る。フィードバックは多くの生物学的機序およびシステムに普遍的な性質である
ことが知られ、また予想されるが、本発明のネットワークモデルからフィードバ
ックが無いことは少なくとも以下の論法を制限するものではない。
【0071】 一般的に、生物学的系中のフィードバックは、変動の効果を排除することまた
はその効果の方向性を逆転することもなく、その変動の効果を弱くする傾向があ
ることが知られている。本発明は細胞構成要素の特性の数値における変化の二元
抽象法を基礎としているので、フィードバックはネットワークモデルへの測定入
力もモデルの試験および確認のために使用する測定値の変化も変更することはな
い。換言すれば、フィードバックがあってもなくても、変動が細胞構成要素に対
して同一の方向の観察し得る変化をもたらす限り、本発明で使用するネットワー
クモデルにおいてフィードバックを考慮する必要はない。なぜならばこれらのモ
デルは実際の数量値に影響されないからである。
【0072】 これらの変動の性質および効果を図6に示す例によって説明する。図6は最も単
純な安定したフィードバックネットワークを説明している。この場合、細胞構成
要素Bは(曲線的な阻害性リンクによって)細胞構成要素Aを阻害するが、一方細
胞構成要素Aは(直線的な刺激性リンクによって)細胞構成要素Bを活性化する。
このネットワークは、AおよびBが任意のタイプの細胞構成要素、例えば、中でも
mRNA存在量、タンパク質存在量、タンパク質活性である場合を含む。AおよびBは
、生物学的サブシステム全体を表現することもでき、同様におそらくそのネット
ワークモデル自体によって表現される。
【0073】 生物学的系のための有用な近似化であることが多い、以下の単純なフィードバ
ックモデルにおいて、AおよびBの特性、例えばそれらの存在量または活性をそれ
ぞれ[A]および[B]で表示するが、それらは以下の微分式にしたがって時間に支配
される。
【0074】
【数1】 これらの式中、「a」および「b」はそれぞれAおよびBの正の生成速度、α
AによるBの阻害の正の定数、βはBによるAの活性化の正の定数、αおよびβ はそれぞれAおよびBの正の分解速度である。
【0075】 最初に、以下の関係、αb>βaが成立するならば、これらの等式はAおよ
びBについて安定な平衡関係があることが容易に判定されうる。この安定な平衡
において、数値[A]および[B]は、これらの等式にフィードバック阻害が不在(す
なわちβが0)だとした場合の数値よりも低くなる。したがってこの生物学的
系ではフィードバックは基準のレベルを低下させる。第2に、[A]を強制的に0(
または対等に[B]を強制的に0)にすることによってネットワークの変動に介入す
ると、[B](または[A])の新しい平衡値が生成される。この新しい[B]の数値は
フィードバックが存在してもしなくても(すなわちβが0であってもなくても
)同様に[B]の旧数値とは異なっている。しかし、フィードバックの場合は基準
状態の数値が低下するので、(直観的に予想されるように)変動による変化の数
量もまたフィードバックによって低下する。
【0076】 したがって、このフィードバックネットワークにおいては、予想されるように
、変化の大きさではなく変化の方向のみを考慮するように抽象化された挙動はフ
ィードバックがないネットワークの挙動と同一である。当業者であれば、本発明
の基礎にある抽象化の観点から、本発明のネットワークモデルにフィードバック
が不在であっても、本発明の方法の各種の生物学的系への応用性を制限するもの
ではないことを容易に理解するであろう。
【0077】対象とする細胞構成要素 本発明のネットワークモデルには細胞、生物体または生物学的系一般のその他
の細胞構成要素に対してその摂動が影響を与える入力細胞構成要素の限定された
セットが含まれる。記述の便宜のためのみであって限定するわけではないが、細
胞構成要素を細胞の生物学的状態の各種の態様に属するものとして便宜的に分類
する。この適用において、また細胞構成要素とは便宜的に、細胞中に天然に存在
するかまたは薬剤など天然には存在しない、外因性の因子の存在を称するものと
する。
【0078】 本明細書で使用する、細胞の生物学的状態の1態様として、特定のネットワー
クモデルを試験および確認するためなどの意図される目的のために細胞を特徴づ
けるのに十分な、細胞構成要素の集合体の状態を意味するものとする。細胞の生
物学的状態の態様として、特定のネットワークモデルに関係する薬剤などの、外
因性因子の存在または不在が含まれる。これらの構成要素の状態について実施さ
れる改変および/または摂動、ならびに測定および/または観察はその存在量(
すなわち細胞中の量若しくは濃度、薬剤への曝露レベル)、またはそれらの活性
、または改変(例えばリン酸化)の状態、または対象とするネットワークモデル
の試験および確認に関係するその他の測定であり得る。各種の実施形態において
、本発明には細胞構成要素の別種の集合または態様についての、こうした改変お
よび/または変動、ならびにこうした測定および/または観察の実施が含まれる
(本明細書で使用する場合、用語「細胞構成要素」は既知のミトコンドリア、リ
ゾチームその他などの細胞下オルガネラを意味することを意図していない)。
【0079】 以下に、本発明において対象とする細胞の生物学的状態の各種の態様を記載す
る。本発明において有効に測定される細胞の生物学的状態の1態様はその転写状
態である。細胞の転写状態として、所定のセットの条件下でその細胞中の構成RN
A種、特にmRNAの同一性および存在量が含まれる。対象とする特定のネットワー
クモデルを試験および確認するために、好ましくは、細胞中の全構成RNA種の実
質的な画分が測定されるが、少なくとも十分な1画分を測定する。転写状態は本
発明で測定される、現状として好ましい生物学的状態の1態様である。これは、
いくつかの現存する遺伝子発現技術のいずれかによって、例えばcDNA存在量を測
定することによって、都合よく決定することができる。
【0080】 本発明において有効に測定される細胞の生物学的状態の別の態様はその翻訳状
態である。細胞の翻訳状態として、所定のセットの条件下でその細胞中の構成タ
ンパク質種の同一性および存在量が含まれる。対象とする特定のネットワークモ
デルを試験および確認するために、好ましくは、細胞中の全構成タンパク質種の
実質的な画分が測定されるが、少なくとも十分な1画分を測定する。当業者に知
られているように、転写状態が翻訳状態に相当することが多い。
【0081】 細胞の生物学的状態の他の局面も、本発明で用いられる。例えば、本明細書中
で用いる語句である、細胞の活性状態は、所定の一連の条件下の細胞中での構成
タンパク質種(及びまた、任意に触媒的に活性な核酸種)を含む。当業者には公
知な、翻訳状態は、しばしば活性状態を代表する。
【0082】 本発明はまた、適当な場合には、その中で細胞の異なる生物学的状態の局面の
測定が組み合わされる細胞の生物学的状態の「混合された」局面に適用し得る。
例えば、ある混合された局面では、あるRNA種及びあるタンパク質種の存在量が
、ある他のタンパク質種の活性の測定と組み合わされる。さらに、本発明が、測
定され得る細胞の生物学的状態の他の局面にも適用し得ることは、以下のことか
ら高く評価されるであろう。
【0083】 生物学的ネットワークモデルに細胞構成要素を入力するための摂動又は変更は
、通常、本発明の特定の実施態様において、(それらの直接に変更されている細
胞構成要素に加えて)測定及び/又は観察されている細胞の生物学的状態の局面
がどれであっても、他の多くの細胞構成要素に影響を与えるだろう。例えば、目
的のネットワークモデルの結果並びに細胞内に存在することが知られている他の
調節、恒常性、及び補償性ネットワーク並びに系の結果として、ネットワークモ
デルの入力への摂動は、細胞又は生物学的系中の複雑でしばしば予測できない間
接的な効果を有する。内部補償の結果として、生物学的系への多くの摂動は、そ
の系の外部挙動に無言の(muted)効果のみを有するが、それは、しかしながら
、個々のエレメント(例えば、細胞中での、遺伝子発現)の内部応答に深く影響
を及ぼし得る。
【0084】 目的のネットワークモデルへの入力を摂動させることは、ここでは、上記原理
の1例とみなす。これらの摂動は、その生物学的ネットワークの出力のみに直接
影響するだろうが、これらの出力によって阻害若しくは刺激される、又はこれら
の出力において補償的変化するように増加若しくは減少される追加的な細胞構成
要素も影響されるだろう。他の細胞構成要素は、第2層構成要素のレベル又は活
性の変化等によっても影響されるだろう。従って、生物学的ネットワークの直接
効果は、ネットワークより下流の多数有り得る間接効果に隠される。
【0085】 本発明によれば、これら全ての下流効果の分析によって、特定のネットワーク
モデルをテストし、確認するのに有用な重要な情報が提供される。もし、ネット
ワークモデルが有用であれば、応答する細胞構成要素について観察される相対変
化は、そのモデルの出力クラスの1つによって適合されるはずである。これらの
下流効果の正確な性質及び機構がはっきりと分かっていない場合、本発明による
実験結果の予測のための抽象化の1つを使用することは有利であり得る。例えば
、変化の方向性を無視でき、またそのモデルは、そのモデルへの細胞構成要素入
力の種々の摂動状態によって作り出される変化または無変化のパターンに適合で
きる。あるいは、より低い抽象化のレベルにおいては、モデルは、1つの方向で
の変化、他の方向での変化、及び(変化の方向のサインを無視する)無変化のパ
ターンに適合できる。
【0086】5.2. ネットワークモデルの実験的テスト このセクションでは、ネットワークモデルをどのようにテストし、実験データ
との比較によって確認するかを記載する。好ましくは、第1に、各実験の2つの
状態における細胞構成要素の直接の実験観察を、これら2つの状態の間の構成要
素の相対変化の有用な尺度に変換する。第2に、ネットワークモデルの抽象化さ
れた予測を含む影響マトリックスをそのモデルから直接的に構成する。最後に、
第3として、各細胞構成要素の相対変化の観察された尺度を、影響マトリックス
による最良の出力クラスに割り当て、全体的な適合度をそのネットワークモデル
について見出す。
【0087】 次いで、セクション5.3では、全体的な適合度の有意性の統計的尺度の決定を
記載する。ネットワークモデルのテスト及び確認のための実験を選択する方法は
、セクション5.4に記載する。
【0088】細胞構成要素の相対変化の尺度 本発明によるネットワークモデルのテスト及び確認のために用いられる実験は
、細胞構成要素の特徴を、そのモデルに入力される、その細胞構成要素への異な
る摂動又は変更によって特徴付けられる2つの異なる状態で測定し観察する差異
的発現測定(differential expression measurements)を含む。例えば、細胞中
の遺伝子の発現は、その細胞が目的のネットワークモデルへのタンパク質の入力
を阻害する薬物に暴露されていない1つの状態、並びに細胞がそのような薬物に
暴露されているもう1つの状態の、細胞性RNAから誘導されるcDNA濃度を測定す
ることによって観察できる。
【0089】 一般に、実験データは、特に、個々のmRNA種もしくは個々のタンパク質種の存
在量、又は個々のタンパク質の活性等の測定値若しくは算出値からなっている。
各細胞構成要素について、入力細胞構成要素の摂動の2つの状態から得られる各
実験の2つの測定値が存在する。
【0090】 差異的発現測定は、実験を設計する努力にも拘わらず、殆どのエラーが2つの
測定値の間の差、若しくは比を無効にしてしまう、多くのバイアスに悩まされる
。個々の分子種は、2つの蛍光標識に別々に依存する方法で増幅され、標識され
、ハイブリダイズされることにより、各遺伝子は、それ自身に固有のバイアスを
有する。これらのバイアスは、蛍光指示が差異的な対の2つのメンバーの間で逆
になる場合、一対の実験の平均値をとることによって低減できる。
【0091】 制御パラメーターが同定できる場合には、バイアスは、オープンリーディングフ
レーム(ORF)長等の制御パラメーターに対する比率(より長い遺伝子は、一方
の蛍光と比較して他方の蛍光を用いるとより非効率に逆転写される)の傾きを無
くす(detrending)ことによって排除することもできる。
【0092】 記載したように、本発明の方法は、ネットワークモデルの予測値をこれら2つ
の状態での観察から確定される細胞構成要素の相対値と比較する。相対値を用い
ることは、実験的測定値におけるシステム的なエラーを、そのような相対値から
実質的に取り消すことができ、そしてそのネットワークモデルの不確実性の効果
又は知識の不足が顕著に低減されるので有利である。ネットワークモデルによっ
て予測できない実験結果の詳細は、抽象化される。
【0093】 これらの相対値は、対応する実験値とは異なるやり方で決定できる。ある実施
態様では、相対値は、2つの入力状態で観察される値の間の単なる比であり得る
。乗算効果は、広い範囲の観測値に亘り加算効果よりも大きな有意性を有するこ
とが見出されたので、対応する値の差を用いることは好ましくない。無変化の場
合に1になる比の代わりに、無変化の場合に0になる観測値の比の(ある底に対
する)対数を用いることがより好ましい。対数に類似した他の単調な関数を、対
数の代わりに用いることができる。例えば、最初のmRNA種の細胞当たり1〜4コピ
ーの変化は、第2のmRNA種の細胞当たり200〜800コピーの変化に対して、恐らく
同様の有意性を有する。他方、そのような第2mRNA種の細胞当たり200〜203コピ
ーの変化は、遙かに低い有意性を有するだろう。
【0094】 さらに、決定された相対値はまた、関係する細胞の特徴が、例えば、より豊富
であったり、より活性がある等であれば、同乗算変化に、より大きなウエイトを
与えることが好ましい。これは、より大きな関数的測定誤差が、より豊富でない
、より活性でない等の細胞構成要素のデータ中に存在するだろうからである。例
えば、第1mRNA種の細胞当たり1〜4コピーの実測変化は、第2mRNA種の細胞当た
り200〜800コピーの実測変化と同程度に統計的有意ではないであろう。
【0095】 それ故、好ましい相対値の尺度は、豊富であったり又は活性である等の種の測
定値に対する観測値の比の対数と同様に挙動するが、その存在量、活性等がかな
り小さく、それらの測定値が統計的誤差によって著しく影響を受けるであろう種
の測定値に対しては、0に向かう傾向がある。そのような観測値から相対変化を
確定するための好ましい関数の例を、下記式で示す。
【0096】
【数2】 この式において:[A]1及び[A]2は、比較される2つの状態の細胞構成要素Aに
ついて測定された値であり;「σ」は、期待加法的RMS測定誤差を示し;「f」は
、期待乗法的小数誤差レベル(expected multiplicative fractional error)を
示す。この式の分母は、加法的+乗法的RMS測定誤差の組み合わせである。加法
的RMS誤差レベル「σ」及び乗法的RMS誤差レベル「f」は、当業界で周知のよう
に決定される。
【0097】 この相対値の決定は、以下の理由で有利である。第1に、この式は、[A]が高
い値のとき、[A]のわずかな変化に対して[A]2/[A]1の対数のように挙動し、加
法的誤差レベルσと比べて小さい[A]値では0に近づく。この式はまた、A>>B、
σ(「>>」は非常により大きいことを示す)又はB>>A、σのとき、±f1に近づ
く。この後者の性質は、[A]1に対する[A]2の比がより大きいほどより大きなxの
値となるような、全ての細胞構成要素の変化の程度についての定量的情報を保持
しながら、任意の大きな単一の変化、つまり1つの細胞構成要素について測定さ
れる増加又は減少のいずれかに過度のウエイトが置かれることを防止する。最後
に、[A]1に対する[A]2の比が比較的小さい場合、この式は、測定誤差について想
定される標準偏差「σ」の単位での相対変化を確定する。
【0098】 細胞の転写状態を転写アレイによって測定する、好ましい実施態様(セクショ
ン5.5を参照されたい)では、式2は特に好ましい性質を有する。加法的RMS誤差
レベルは、例えば、転写アレイ上のオリゴマーへのハイブリダイゼーションにお
けるバックグラウンド変動、蛍光スポットの画像取得、画像加工等から生じる。
乗法的RMS誤差レベルは、例えば、全系の獲得変動によるシステム的変動、2つ
の蛍光体の異なる性質による処理における変動等から生じる。
【0099】 本発明は、類似の有利な性質を有する他の相対値決定にも同様に適用し得る。
例えば、[A]1及び[A]2が小さい値であるときには同様には挙動しないとしても、
相対値の別の尺度は、[A]2/[A]1比の対数である。
【0100】影響マトリックス(Influence Matrix)の構成 特定のネットワークモデルから導かれる実験的予測は、本明細書中で「影響マ
トリックス」と呼ばれるアレイに含まれる。影響マトリックスは、「g」によっ
て示され、「gni」によって示されるエレメントを有する。詳細には、「gni」は
、i番目の実験に対応するn番目の出力クラスで予測される挙動を意味する。エレ
メントgの値は、抽象化のレベル、又はそのモデルが実験に対応した異なる出力
クラスでの変化のサインの間の関係を予測するために十分詳細か否かという、そ
のモデルの「粗雑さ(coarseness)」に依存する。
【0101】 影響マトリックスは、ネットワークモデル及び2段階工程による一連の実験的
比較から構成される:二段階工程の第1は、非標準化影響マトリックスを構成し
;第2は、非標準化マトリックスを標準化する。第1工程に関して、一連の実験
的比較の各実験は、生物学的系の2つの状態の間の比較を特定化し、ここで各状
態はネットワークモデルに対する細胞構成要素入力への摂動若しくは変更の特定
パターンによって、又は摂動若しくは変更の不在によって定義される。とりわけ
、ネットワークダイヤグラムとして、論理関係として、又は真理値表としての、
ネットワークモデルの同等な典型(equivalent representative)のうちの任意
の便利な1つを用いることによって、各実験に対する各クラスの予測応答は機械
的に決定される。これらの応答は、2つの実験状態の間の変化(「0」から「1」
又は「1」から「0」)又は無変化(「0」から「0」又は「1」から「1」)のいず
れかである。
【0102】 非標準化影響マトリックスは、このモデルで適用される抽象化のレベル、又は
粗雑さによるこれらの予測値から構成される。好ましい実施態様では、2つの抽
象化レベルが存在し、それを表3にまとめる。抽象化の最も高いレベルに従えば
、細胞構成要素は特定の実験的比較において変化する又は変化しないという事実
のみが考慮される。変化の方向は無視される。このレベルについては、非標準化
影響マトリックスのエレメントは、表3の第3列から選択される。
【0103】 次の抽象化のレベルによれば、細胞構成要素の変化の方向が考慮される。この
得られた影響マトリックスは、細胞構成要素の変化の相対的サインのみが考慮さ
れる最初の方法で全体的な適合度を決定するのに、続けて利用できる。ここで、
ネットワークモデルは、細胞構成要素は、2つの異なる実験において反対方向に
変化することのみを予測することができるが、それが変化する方向を予測するこ
とはできないと想定される。処理の第2の方法では、ネットワークモデルは、変
化の方向を予測できると仮定され、そして、変化の方向は、全体的な適合度を確
定する上で考慮される。このレベルについては、非標準化影響マトリックスのエ
レメントは、表3の第2列から選択される。
【0104】
【表3】 表3:影響マトリックス値 非標準化影響マトリックスは、各出力クラスに対して1つの横列(row)及び
各実験的比較に対して1つの列を有するように容易に構成される。i番目の実験
に対するn番目の出力クラスに対するエレメント値ginは、適当な抽象化のレベル
に対応する縦列から、及びi番目の実験に対するn番目の出力クラスに対して為さ
れる予測値に対応する横列から選択される。
【0105】 例えば、表4は、細胞構成要素の変化の方向が考慮された抽象化レベルについ
てのセクション5.1の表2に記載した実験1、2、および3に対応した図2Bのネ
ットワークに対する非標準化影響マトリックスである。
【0106】
【表4】 表4:図2Bに対する影響マトリックス これに対し、表5は、細胞構成要素が変化したか変化しなかったかのみを考慮
する抽象化レベルについてセクション5.1の表2に記載された実験1、2、及び3に
対応した図2Bのネットワークに対する非標準化影響マトリックスである。
【0107】
【表5】 表5:図2Bに対する影響マトリックス 次に、非標準化影響マトリックスは標準化される。正しい標準化は、種々の予
測される変化に対する表3中の−1、0、及び1のやや恣意的な割り当てが、適合度
確定の結果を歪ませないことを保証するものである。好ましい標準化においては
、gの各横列は、0に等しい平均を有し、また他の全ての横列のものと等しい各横
列のエレメントの平方和(二乗された標準偏差)を有するために、他の横列と関
係なく、線形的に標準化される。好ましくは、全横列の標準偏差は、1に設定さ
れている。
【0108】 例えば、その好ましい標準化によれば、表4は、結果として表6の標準化影響マ
トリックスとなる。
【0109】
【表6】 表6:図2Bに対する標準化影響マトリックス また、表5は、結果として表7の標準化影響マトリックスになる。
【0110】
【表7】 表7:図2Bに対する標準化影響マトリックス 全体的な適合度の確定 次に、標準化された影響マトリックスを考慮して、第1に、一組の実験からな
る種々の実験について、その細胞構成要素の挙動に最も適合するその出力クラス
に対して、観察される変化を有する細胞構成要素を割り当てることにより、そし
て第2に、個々の細胞構成要素の適合度を考慮して、全体的な適合度を確定する
ことにより、一組の実験に対するネットワークモデルの全体的な適合度を確定す
る。好ましい実施態様では、目的尺度は、それが影響マトリックスの各出力クラ
スとどの様にうまく適合するかについて、変化した各細胞構成要素に対する数値
的指標を与える。次に、細胞構成要素は、最大の目的数値指標を有する出力クラ
スに対して割り当てられ、またその最大の数値指標はその細胞構成要素の適合度
とされる。ネットワークモデルの全体的な適合度は、個々の細胞構成要素に対す
る全適合度に単調に依存するものとされる。例えば、全体的な適合度は、個々の
適合度の和である。
【0111】 好ましい目的尺度は、影響マトリックスの横列と前記小節による細胞構成要素
について観察される変化の尺度の相関(この場合には「ドット積」とも呼ぶ)で
ある。説明のみの目的で、各実験の細胞構成要素について観察される変化をベク
トルx中に集約することは便利であり、ベクトルの各要素は、観察される変化の
尺度の1つである。次いで、当業界で周知のように、影響マトリックスのi番目
の横列と観察される変化との相関は、その横列giの対応する要素の積と変化のベ
クトルxの和である。次に、影響マトリックスgの全ての横列とオブザーバー(ob
server)変化との相関は、影響マトリックスと変化のベクトルとの単なる行列積
、g*xである。
【0112】 詳細には、細胞構成要素中の変化又は無変化の事実のみが、影響マトリックス
を構成するのに考慮され、細胞構成要素の変化の方向は無視される場合には、影
響マトリックスの相関は、変化の絶対値に対するものであることが好ましい。こ
の場合、下記: が、その要素が要素xの絶対値であるベクトルを示すとすると、相関: は、目的適合尺度である。次いで、細胞構成要素は、その横列がこの相関におい
て最高値を有する出力クラスに割り当てられる。
【0113】 したがって、細胞構成要素の相対変化方向が影響マトリックスを構成するのに
考慮され、ネットワークモデルが相対変化方向のみを予測する場合には、細胞構
成要素は、その横列がこの相関における最高絶対値を有する出力クラスに割り当
てられる。つまり、この場合には、下記: は目的適合尺度である。
【0114】 最後に、細胞構成要素の変化の絶対的方向がネットワークモデルの影響マトリ
ックスで予測される場合には、細胞構成要素は、その横列がこの相関の最高値を
有する出力クラスに割り当てられる。つまり、この場合、単純相関g*xは、目的
適合尺度である。
【0115】 下記において、「n(k)」は、上記の場合に従って観察され、測定された細胞構
成要素kに最も適合する出力クラスを示すために用いられる。
【0116】 例えば、上記のこれら最初の2つの場合の図2Bのネットワークモデルの結果を
予測する上で表5及び6の標準化影響マトリックスを考慮すると、細胞構成要素の
実験1、2、及び3で観察された変化の尺度は、ベクトルx=(+2.3、+1.2、-4.7)
であることが観察される。xと表5との相関は、結果として: となる。従って、これらの観察される変化を有する細胞構成要素は、(最大相関
値4.7を有する)出力クラス3によって最も適合され、その場合、変化の相対的方
向は、ネットワークモデルによって予測される。次に、表6との相関: (=(+2.3、+1.2、+4.7))は、結果として: となる。ネットワークモデルが変化の方向すら予測しない場合には、この細胞構
成要素は、(最大相関値2.7を有する)出力クラス1によって最も適合される。
【0117】 観察される変化を有する全ての細胞構成要素が、それらの最も適合する出力ク
ラスに一旦割り当てられれば、そのネットワークモデルの全体的な適合度は、全
ての観察される細胞構成要素に対して最も適合する出力クラスの個々の相関値の
和として確定される。この全体的な適合度は、次の式によって示すことができる
【0118】
【数3】 この式では、「F」は、全体的な適合度値を示し、他の数量は、前述の意味を
有する(「xk」は、k番目の細胞構成要素について測定された変化を示す)。こ
の和は、観察され測定された細胞構成要素の全体である。第1の式は、変化の相
対的方向が考慮される場合に適切であり、第2の式は、変化又は無変化のみが考
慮される場合に適切である。あるいは、全体的な適合度は、全てのこれらの相関
値の任意の単調な関数であり得る。
【0119】 別の実施態様では、実験的摂動に対する小さな又は観察できない応答を有する
細胞構成要素は、実験ノイズを減らすために、適合度確定から除外することがで
きる。客観的に、要素: の和に対する閾値を設定することができる。他方、適合度確定において小さな変
化を有する細胞構成要素を含めることにより、遠い関係にある細胞構成要素の任
意の摂動の「リップルダウン(ripple-down)」効果を捉えることができる。個
別には有意に測定できないけれども、これらの小さな効果は、総計で、ネットワ
ークモデルをテスト又は確認するのに有用で重要な情報を提供できる。小さな変
化を有する細胞構成要素を排除するための閾値は、場合に基づいて(on a case
by case basis)設定できる。
【0120】 全体的な適合度に統計的有意性を割り当てるための基準は、セクション5.3に
記載した。
【0121】 本発明はまた、適合良好性決定の別の実施態様にも適用できる。例えば、絶対
値関数の代わりに、平方関数(又は他の単調正関数(positive function))を
用いることができる。細胞構成要素を、最大の(g*x)2又は(g*x2)(ここで、x2
その要素が要素xの平方であるベクトルを示す)を有する出力クラスに割り当て
ることができる。あるいは、目的尺度は、(g*x2)であり得る。これらの代替は、
それらが、目的関数の絶対値の順位を変えないので、一般的に、細胞構成要素出
力クラス割当を変えない。しかしながら、全ての遺伝子に対する適合値が組み合
わされて全体的適合値を形成するときは、細胞構成要素の変化の尺度がより大き
な値には、より大きなウエイトが置かれる。
【0122】5.3. 統計的有意性の決定 全体的な適合度の統計的有意性は、生物学的系を代表するネットワークモデル
の有意性を決定するために決定されるのが好ましい。任意に、それらが最も適合
するクラスへの個々の細胞構成要素の割当の統計的有意性も決定される。
【0123】ノンパラメトリックな統計学的方法 全体的な適合度の統計的有意性を決定するために、Fの可能な値の分布に関す
る情報が容易に得られないので、本発明では、ノンパラメトリック統計学の方法
を用いるのが好ましい。より詳細には、ノンパラメトリック法は、帰無仮説が真
である場合、すなわち、ネットワークモデルが無作為入力データに適合する場合
の、全体的な適合度値Fの分布を得るために用いられる。次に、実際に測定され
た適合度を、この無の分布(null distribution)が真である場合に期待される
分布と比較する。実際に観察されたか又はより高い適合度が、この分布において
見出されることが少なければ少ないほど、この場合に帰無仮説が真であることも
ネットワークモデルがより有意であることも少ない。別のモデルは、それによっ
てデータに対する忠実度についてランク付けし、このようにして、例えば、モデ
ルのパラメーターの数を変えることによって、又は影響マトリックスにおける変
化によって、導入されるバイアスを回避することができる。Fisherの方法(例え
ば、Conover, 第2版, 1980, 実用的ノンパラメトリック統計学(Practical Non-
parametric Statistics), セクション5.11, John Wiley社発行を参照されたい
。)によれば、分布は、次のように、単純で有利に経験的に得ることができる。
【0124】 第1に、実際に観察され測定されたデータは、データを作り出す特定の実験に
関して無作為に順序を変えられる。つまり、2つの特定の入力状態の間の細胞構
成要素での変化を比較する実験は、他の特定入力状態と比較する実験から無作為
に選択される復帰データ(returning data)として処理される。これは、無作為
入力データが、実際の入力データと同じ実際の値の分布を有することを有利に保
証する。次に、前記の方法は、無作為データに関してネットワークモデルの適合
度を決定するのに用いられる。最後に、これらの工程は、適合度値の十分に有意
な分布(又はヒストグラム)を得るために、十分な回数繰り返される。500と200
0の間の繰り返しで通常十分であることが、特定の場合に見出された。
【0125】 詳細には、これらの方法は、下記の方法によって代表できる。実験の数をMと
すると、先ず、整数1...Mの無作為順列Dが、当業界で公知の組み合わせプロ
グラミングの方法によって得られる。例えば、モンテカルロ法(Monte Carlo me
thods)は、そのような順列を見出すのに使用できる。次いで、各細胞構成要素
について観察されたデータを摂動させる。xk,iがi番目の実験のk番目の細胞構成
要素について観察され測定されたデータならば、無作為化されたデータxρ k,i
、下記式によって与えられる。
【0126】
【数4】 影響マトリックスgを用いて、各観察された細胞構成要素に最も適合する出力
クラスが見出される。k番目の細胞構成要素に最も適合する出力クラスは、n(p)(
k)で示される。このランダム化されたデータへの全体的な適合度F(p)は、前述の
ように、下記式によって示される。
【0127】
【数5】 十分な数のF(p)値は、実際の適合度の有意性を判断するために用いられる分布
Fのヒストグラムを得るために決定される。そのような実際に決定されたFよりも
大きい、ランダム化されたF(p)のフラクションは、ネットワークモデルの有意性
(P値)である。
【0128】 任意に、個々の細胞構成要素が出力クラスに最も良く適合される有意性もまた
、評価することができる。特定の細胞構成要素の最も良く適合する出力クラスへ
の適合の有意性を評価する第1の方法は、全体的な適合度を評価するための前述
の方法と実質的に類似しており、ネットワークモデルをテストし確認するために
用いられる幾つかの、好ましくは少なくとも6回の実験を行う場合に適用できる
。その細胞構成要素の実際の適合度の有意性は、前述のようにランダム化された
データから経験的に決定される、その細胞構成要素の適合度の分布を考慮して評
価される。実測値よりも良い適合値を有するデータランダム化のフラクションは
有意値である。これは、ネットワークモデルの全体的なP値について用いられた
方法に類似した方法である。
【0129】 特定の細胞構成要素の最も良く適合する出力クラスへの適合の有意性を評価す
るための第2の方法は、設定された実験でネットワークモデルをテストし確認す
るために用いられる実験の数が少ない、好ましくは5回未満の場合に適用できる
。この場合、順列の数が小さすぎて、前述の方法による個々のクラスの割当に対
する高い有意値を得ることができない。クラスの割当の有意性の評価は、例えば
、測定誤差の重要性についての事前の知識、実験から実験に(from experiment
to experiment)関係しない測定誤差、及びガウス誤差分布(Gaussian error di
stribution)を評価することによるパラメトリック法から得ることができる。
【0130】 セクション5.2でのその定義を考慮して、細胞構成要素における変化の尺度xは
単位分散を有する。影響マトリックスの横列gnも、標準化されて単位分散を有す
るので、相関gn*xkの分散は、事前の前提を考慮すると、実験の数Nに等しい。そ
の結果、P値は、k番目の細胞構成要素の、「erf」で示される標準誤差関数を用
いるn番目の出力クラスへの適合に割り当てることができる。
【0131】
【数6】 ある細胞構成要素の、ある出力クラスへの適合の有意性を評価するいずれの方
法を用いるにしても、複数の出力クラスへの割当のためにP値を決定することは
しばしば有利である。例えば、k番目の細胞構成要素を、有意性確率Paを有するa
'番目の出力クラス、有意性確率Pbを有するb'番目の出力クラス等へ割り当てる
ことができる(これらの確率は合計されて単一になる(unity))。
【0132】最尤法 事前確率分布を変化の尺度xに対して評価できる本発明の実施態様では、最尤
法は、リソートしてモンテカルロランダム化しない、別のネットワークモデルの
統計的有意性の強力な評価法を提供する。この最尤法は、当業者であれば公知で
あろう(例えば、HL Van Trees, 1968, 検出、評価及び変調理論(Detection Es
timation and Modulation Theory), 第I巻, Wiley and Sons社発行を参照され
たい)。このアプローチによれば、要素gniに対して可能な影響マトリックス値
(例えば、-1、0、及び+1)は、実験iのクラスnの遺伝子の挙動に対する別個の
仮定Hniとしてみなされる。遺伝子kがクラスnにあると仮定した、一連の実験i=
1〜Mに渡る一連の変化尺度xkiを観察する尤度は、そのとき
【数7】 (式中、P(x|H)は、仮定Hに与えられた観測値xの事前確率を示す。)である。3
つの状態の場合(下方変化H、無変化H0、及び上方変化H+)についての典型的
なパラメトリック確率分布は、
【数8】
【数9】
【数10】 (式中、μk及びσkは、それぞれ仮定H+によって予測されるxkiの平均値及び標
準偏差である。σk0は、帰無仮説H0によって予測される標準偏差である。μk
σk0、及びσkは、xがそのモデルで変化することが確認されているか、変化する
ことが確認されていない場合の反復実験から推定される。)である。
【0133】 全てのモデルの出力クラスが影響する実験は、そのクラス割当が未知であって
も、μk及びσkの推定値を与える。このように、好ましい実施態様では、最尤法
は、全ての出力クラスで変化を引き起こす入力状態の組み合わせ(すなわち、差
異的実験)を有するネットワークモデルに用いられる。あまり好ましくない実施
態様では、実験によって全ての出力クラスで同時に変化を引き起こすネットワー
クモデルを見出すことができない。そのような実施態様では、P(x|H+)及びP(x|H )の汎関数形態(functional forms)は、経験的に決定できない。しかしなが
ら、近似関数形態(approximate forms)は、変化が確認されているそれらの出
力クラスについてのxの通常の挙動に基づいて仮定することができる。
【0134】 例えば、xが上記セクション5.2の式2に従って定義される実施態様では、xの限
界値(limiting value)は、+1/f及び-1/fである。次いで、P(x|H+)及びP(x|H )についての典型的な近似関数の確率分布は、それぞれ[−1/f、0]及び[0、+1/f]
の間隔に渡る一様分布である。これらの一様分布の「0」末端は、測定誤差の寄
与を考慮して滑らかに延びている必要がある。これは、例えば、それらを上記式
8のP(x|H0)を与える関数などのガウス関数の1/2(half)と結合させる(joining
)ことによってなされ得る。変化が期待される実験でのxの典型的な値の事前の
知識に応答する確率分布の他の可能な近似関数形態は、当業者であれば明らかで
あろう。
【0135】 最尤法はまた、2つの状態の局面、すなわち、仮定が無変化H0、及び変化H1
みである場合について一般化することができる。そのような一般化は、上記に教
示された例を考慮すれば当業者であれば明らかであろう。
【0136】 確率分布P(xki|H)、及び尤度Lnkが一旦決定されれば、k番目の細胞構成要素の
クラス割当n(k)は、一連の変化尺度xki、すなわち、演算
【数11】 を観察する最大尤度(すなわち、極大)を有するクラス、nであるように単純に
決定され、全体的なモデル尤度は、
【数12】 となる。
【0137】 そして、好ましいネットワークモデルは、Lの最大値を有するものである。
【0138】5.4. 効率的な実験の選択 このセクションでは、それによって特定のネットワークモデルをテストし確認
するための実験を、常用として自動的に選択するための方法を記載する。これら
の方法を、第1に一般的に記載し、次いで第2に、好ましい実施態様の典型的な
説明を行う。
【0139】一般実験選択方法 本発明のネットワークモデルには細胞成分の入力セット、出力クラスのセット
、および出力クラスの応答を入力細胞成分への摂動および改変と結び付ける論理
関係が含まれる。特に、細胞成分の入力セット中に存在するまたは存在しない特
定の摂動および/または改変は入力の状態と呼ばれる。さらに、本発明の実験は
細胞成分中の相対変化を観測するので、それらは状態の対によって定義される。
【0140】 実験を選択する方法は2つの主要な工程、すなわち、すべての出力クラスを区
別するに十分な入力状態のカバーリングセットを選択する第1工程、および(こ
れもまた入力状態の「カバーリング」セットと呼ばれる)すべての出力クラスを
実験的に区別するに十分であり、カバーリングセット中のこれらの状態の対によ
って定義される実験を選択する第2工程を含む。第1工程に関しては、カバーリン
グ状態は実験的に認識することができる可能な状態からのみ選択される。典型的
には、可能な摂動が必ずしもすべて組み合わせることができるわけではではなく
、可能な入力状態を定義できるものに限られる。例えば、望まない、おそらく有
毒な相互作用を有する2つの薬剤で同時に細胞を処理することは可能でないし、
または生物学的系において1を超えるまたは2つの別個の遺伝子をノックアウトす
ることはできないなどである。
【0141】 可能な状態から、すべての出力クラスを区別するために十分な数のカバーリン
グ状態を選択する。出力クラス対を区別するために2つの基準を満たす状態を選
択すべきである。最初の基準は、2つの出力クラスが異なる挙動をとる少なくと
も1つの選ばれた状態が存在することである(一方が「0」ならば他方は「1」、
またはその逆)。出力クラスが異なる挙動をとることの決定は、例えばネットワ
ークの図形、論理関係、またはネットワークモデルの正確な表から下すことがで
きる。
【0142】 出力クラスの挙動における論理的反転が区別できない場合には、それは|g*x
|が適合度良好として用いられる場合であり、2番目のあまりはっきりしない基
準は2つの出力クラスが同じ挙動をとる少なくとも1つの選ばれた状態が存在する
ことである。この場合によれば論理的反転が異なっている2つの出力クラスを実
際に区別することができないのでこの基準が出てくる。例えば、5つの実験に対
して応答0、1、1、0、および1を有する出力クラス(すなわち、影響マトリック
スの列)を応答1、0、 0、 1、および0を有する出力クラスと区別することがで
きない。結論として、出力クラスの各対にとって、論理的反転を区別するために
出力クラスが同じ挙動をとるカバーリングセット状態がまた存在すべきである。
【0143】 好ましくは、対象となるいくつかの目的基準を最小にするために可能な選択が
多数存在するところでこの状態の選択を行う。好ましい実施形態において、費用
を各入力状態に割り当て、目的関数は各状態の費用の合計である。例えば異なる
摂動または改変は異なる経済的コストを持ち得る。ある薬剤はその他の薬剤より
も著しく高価であってもよく、遺伝子欠損またはノックアウトは本質的に高価で
あってもよいなどである。それゆえ、1つの目的基準はすべての選ばれた状態を
作り出すための総経済的コストを最少にすることができる。別の目的基準として
は、選ばれたあらゆる状態を作り出すために必要な総時間を最少にすることがで
きる。本発明は、かかるいずれの目的基準にも適応でき、それは直線的であるこ
とが好まししい。
【0144】 状態の可能性のあるあらゆる組み合わせの徹底的な調査をはじめ、目的関数を
最少にする選択をするためには、当技術分野で公知のアルゴリズムのいずれかに
従いカバーリング状態のセットの選択をすることができる。一次プログラミング
の方法に従う好ましい実施は後に記載する。
【0145】 第2工程に関しては、実験はすべての出力クラスを実験的に区別するに十分で
ある状態のカバーリングセットから状態の対として選択される。すべての出力ク
ラスの対を実験的に区別するに十分な入力状態の対のセットを「入力状態の対の
カバーリングセット」と呼ぶ。すべてのカバーリング状態の対によって定義され
る実験はすべての出力クラスを区別するに十分であるが、カバーリング状態のか
かる対の最少数を選択することが好ましい。
【0146】 図9は4つの入力状態に応答する2つの入力状態に対して可能なすべての応答を
図示している。図9中のそれぞれの楕円形の節は、2番目の出力クラスの応答の表
示にわたって位置を定めた1番目の出力クラスの応答の表示を含み、個別の入力
状態に対応する。発明者ら典型的な出力クラスの挙動における論理的反転を区別
できない場合には、これら2つの出力クラスを区別するために、実線でつないだ
状態の1対かまたは破線でつないだ状態の両方の対のいずれかで実験を定義すべ
きである。要するに、2つの出力クラスを区別するために、2つの出力クラスが実
験を定義する2つの状態における以下の応答、(0,0)対(1,0)、または(1,0)対(1,1
)、または(1,1)対(0,1)、または(0,1)対(0,0)の1つを有するようにいずれか1つ
の実験を定義すべきである。あるいは、2つの出力クラスが以下の応答、(0,0)対
(1,1)、および(1,0)対(0,1)を有するように2つの実験を定義すべきである。発明
者らが出力クラスの挙動における論理的反転を区別することができる場合には、
図9中の破線または実線の一方のみを必要とする。
【0147】 好ましくは、実験に対して可能な選択が多数存在するところで、対象となる目
的関数を全体で最少にする状態を比較する実験を選択する。あるいは、実験が最
少数となる答えを選択する。
【0148】 前述のように、状態のすべての可能な組み合わせの徹底的な調査をはじめ、目
的関数を最少にする選択をするためには、当技術分野で公知のアルゴリズムのい
ずれかに従い実験の選択をすることができる。一次プログラミングの方法に従う
好ましい実施は後に記載する。
【0149】好ましい実施形態の例示 一次プログラミング技術を用いる上記方法の好ましい実施を次に記載し、図2B
に図示したネットワークモデルで例示する。この実施には以下の一連の工程が含
まれ、その各々を以下に記載する。
【0150】 (1)可能な入力状態を決定する。
【0151】 (2)コストを入力状態に割り当てる。
【0152】 (3)ネットワークモデルから導き出した入力/出力表を作る。
【0153】 (4)答えが(その入力状態が出力クラスの任意の対の挙動を区別するに十分であ
る)カバーリング状態のセットを与える第1の一次不等式を作る。
【0154】 (5)第1の一次不等式を解く。
【0155】 (6)答えが入力状態の任意の対を区別することができる実験を与える第2の一次不
等式を作る。その実験は工程5において見出される入力状態の対によって定義さ
れる。
【0156】 (7)第2の一次不等式を解く。
【0157】 第1工程において、実験的に可能な入力状態をすべての可能な入力状態の中か
ら本発明の特定の実施に利用できる実験技術を考慮して選択する。変数α=1、…
、Mとし、ここでM個の可能な入力状態が存在する。もしN個の入力細胞成分が存
在するなら、2個より多い可能な入力状態が存在することができる。
【0158】 第2工程において、それぞれの可能な入力状態を対象の目的費用関数に従い正
費用、Cαに割り当てる。
【0159】 第3工程において、入力/出力(正確な)表を第5.1節に記載したネットワーク
に対して導き出す。かかる表を標準的組み合わせプログラミング技術によりコン
ピューターの実行において作り出すことができる。図2Bに図示したネットワーク
の例示的場合において、前の入力/出力表、表1をここで便宜上表8として繰り返
す。
【0160】
【表8】 表8:図2Bの出力クラス ここですべての4つの状態、状態1-4が実行可能であると仮定すると、M=4である
【0161】 第4工程において、答えがカバーリング状態のセットを与える一次方程式を作
り出す。これらの不等式を表すには、変数xαを1とし、あるいは条件αがカバー
する条件内であれば0とする。さらに、出力クラスを区別するために状態の2つの
基準を表すために、もし出力クラスiおよびjが状態αにおいて異なる挙動をと
るならば係数SDijαを1とし、そうでなければ0とし、もし出力クラスiおよびj
が状態αにおいて同じ挙動をとるならば係数SSijαを1とし、そうでなければ0と
する。係数SDおよびSSの両方を入力/出力表の決まった実験によって作り出すこ
とができる。次いでその解がカバーリング状態のセットを与える一次プログラミ
ングの問題は、 関数:
【数13】 を最少にし、制約:
【数14】 を受ける。
【0162】 αの合計はすべての可能な状態を超え、表示iおよびjはi>=jですべての可能な状
態を超えて変化する。実験の決定の適合良好性に強さを加える余分のカバーリン
グに対し、式14の右辺を2に等しい整数(二重のカバーリング)またはそれより
大きい整数に合わせる。
【0163】 第5工程において、式13および14を当業者に十分公知の方法を用いて解く。式1
3および14のような一次不等式は一次最適化の分野で十分公知であり、これを通
常に解いて、例えば半導体電子工学の試験設計に関連しては回路の欠陥を絶縁す
る(例えば、Roth, 1980, Computer Logic, Testing and Verification, Comput
er Science Press; Stephan, Brayton, およびSangiovanni-Vincentelli, 1996,
"Combinational Test Generation Using Satisfiability", IEEE Transactions
on Computer-Aided Design of Integrated Circuits and Systems, 15:1167-11
76; Bryan, 1992, "Symboric Boolean Manipulation with Ordered Binary Deci
sion Diagrams", ACM Computing Surveys, 24:293-318; ならびにBondyaおよびM
urty, 1976, Graph Theory with Applications, Macmillan: London, 1976参照
)。
【0164】 特に、式13および14が混合整数一次プログラミング(MILP)問題として知られた
ある種の問題をなすことは当業者であれば認識しているだろう。MILP問題は数学
的最適化の当業者に十分公知である種々の方法によって解けばよい。好ましい実
施形態では、本発明のMILP問題(すなわち、式13および14の答え)は、本明細書
で分岐結合アルゴリズムと呼ばれるアルゴリズムによって解く。分岐結合アルゴ
リズムは当業者に十分公知である(例えば、LawlerおよびWood, 1966, 「分岐結
合法:概観」,OR, 14:699-719; NemhauserおよびWolsey, 1988, Integer and Co
mbinatorial Optimization, Wiley, pp.349-367; PapadimitriuosおよびSteigli
tz, 1982, Combinatorial Optimization: Algorithms and Complexity, Prentic
e-Hall: Englewood Cliffs, New Jersey, pp.433-453参照)。
【0165】 式13および14、ならびに例示的表8に関連してここで分岐結合法を示す。以下
の式はカバーリング状態のセットを記載する。
【0166】 出力クラス1および2に対して、 x2+x3+x4>=1 (a) x1>=1 (b) 出力クラス1および3に対して、 x2>=1 (c) x1+x3+x4>=1 (d) 出力クラス2および3に対して、 x3+x4>=1 (e) x1+x2>=1 (f) 変数の数の増加によって分類した順に解いた不等式を用い、常に最低越すと状
態で始める分岐構造において解を求める。従って上の式(a)-(f)を(b)、(c)、(d)
、(e)、(f)、(a)、(d)の順に解く。我々はx1=1(x1「真」)として(b)を解き、次
いでx2=1(x2「真」)として(c)を解く。これらの2つの条件で即(f)が解ける。(e)
を解くために我々はx3=1またはx4=1のいずれかを試すことができる。これは探索
中の枝を構成する。我々は最初に試みるどちらかの最低コスト条件を選択する。
この例において、我々は(a)および(d)のいずれかを解く選択を行う。
【0167】 目的関数の式13をx1+x2+x3+x4と仮定するならば、各条件に対する費用が等し
いという仮定が影響し、次いで式(a)-(f)はカバーリング状態の組に対して以下
の2つの答え、(1,2,3)および(1,2,4)を有し、探索中の2つの可能な枝に対応する
。一般に、その他の枝を含む任意の答えに対する総コストは常により高いので、
樹形図の中で最低レベルにあるより低いコストの枝を探すことのみが必要である
【0168】 第6工程において、答えがすべての出力クラスを区別する実験を与える一次等
式を作り出す。これらの不等式を表すために、入力状態の対(α、β)を有する実
験を定義するならば変数yαβを1とし、そうでなければ0とする。さらに出力ク
ラスを区別するための実験の基準を表すために、出力クラスiおよびjが表9に従
い許容される状態αおよびβにおいて異なる挙動をとるならば係数Eij,αβを1
とし、そうでなければ0とする。係数Eは図9に図示した許容される実験を考慮し
、入力/出力表の決まった実験によって作り出すことができ、その表の記載の中
に挙げる。次いで、答えがカバーリング状態の組を与える一次プログラミング問
題は、 関数:
【数15】 を最少にし、制約:
【数16】 を受ける。
【0169】 上式16の第2項は図9において破線で表された入力状態の組み合わせを考慮に入
れる。上式14の後の解説と同様に、実験条件対の二重またはそれより大きいカバ
ーリングは式16の右辺で「1」を「2」およびそれより大きい整数に置き換えて探すこ
とができる。αおよびβの合計はすべての可能な状態を超え、表示iおよびjはi>
=jですべての可能な状態を超えて変化する。その他の実施形態において、別の目
的関数を前述のように用いることができる。
【0170】 第7工程において、式15および16を単純アルゴリズムまたは好ましい分岐結合
探索法のような当技術分野で公知であるいずれかの方法によって解く。
【0171】 式15および16、ならびに例示としての表8を考慮し、以下の式は出力クラスを
区別するための実験を記載する。
【0172】 出力クラス1および2に対して、 y12+y13+y14>=1 出力クラス1および3に対して、 y13+y14+y23+y24>=1 出力クラス2および3に対して、 y12>=1 カバーリング状態として(1,2,3)を選択する場合には、実験の十分な組は、状
態1と2とを比較する最初の実験および状態1と3とを比較する2番目の実験からな
る。カバーリング状態として(1,2,4)を選択する場合には、実験の十分なセット
は、状態1と2とを比較する最初の実験および状態1と4とを比較する2番目の実験
からなる。
【0173】5.5. 実験的試験技術 5.2節に記載されたネットワークモデルの実験的試験および確認は、ネットワ
ークモデルへ入力された細胞構成要素の実験的改変または摂動、および細胞また
は生物学的系中のその他の細胞構成要素の応答の実験的測定に依存する。例えば
、本発明のある実施形態において、入力細胞構成要素の改変または摂動を特定の
薬剤への暴露によって、または遺伝子欠損のような遺伝子操作によって達成する
ことができ、細胞構成要素の応答の測定をmRNA(またはそれに由来するcDNA)の存
在量を測定する遺伝子発現技術によって達成することができる。
【0174】 この節は要求される改変/摂動および測定のための種々の実験技術を示してい
る。本発明はこれらの技術および同じ結果を達成するその他の技術に適用できる
【0175】5.5.1. 細胞の改変方法 細胞の種々のレベルで生体ネットワークモデルに入力された細胞構成要素の標
的となる改変および/または摂動のための方法はますます広く知られており、当
技術分野に応用されている。細胞構成要素を特異的に標的化、および改変または
摂動することができる任意のかかる方法を本発明に用いることができる。改変/
摂動を飽和させることによって細胞構成要素の存在量(または活性など)を、未
改変/未摂動レベルと未改変/未摂動レベルとは明らかに異なる改変/摂動レベ
ルとの間に変化させる。好ましくは、特定の細胞構成要素を制御しながら改変ま
たは摂動することもできる方法(例えば、遺伝子発現、RNA濃縮、タンパク質の
存在量、タンパク質活性など)を用いる。制御可能な改変/摂動によって細胞構
成要素の存在量(または活性など)を複数の制御可能な改変/摂動レベルにより
段階的に増加または段階的に減少させる。もちろん、制御可能な改変/摂動技術
は飽和形式でもまた用いることができる。
【0176】 以下の方法は細胞構成要素の改変に用いることができ、それによって試験しま
たは確認すべきネットワークモデルに入力された細胞構成要素の改変/摂動を引
き起こすものの例示である。好ましい改変方法は複数の細胞構成要素のそれぞれ
を、最も好ましくはかかる細胞構成要素の実在する画分を別個に標的化すること
ができる。
【0177】 生体ネットワークモデルは、ゲノムまたは発現した配列情報が入手でき、かつ
特定の遺伝子の発現を飽和させまたは制御しながら改変させる方法が入手できる
任意の生物由来の細胞型の細胞中で試験または確認することが好ましい。ゲノム
の配列決定は現在ヒト、線虫、アラビドプシス(Arabidopsis)を含む数種の真核
生物について進行中であり、出願されている。好ましい実施形態において、本発
明は酵母を用いて、最も好ましくはサッカロミセス・セレビシエ(Saccharomyces
cerevisiae)を用いて行われる。なぜならばS. セレビシエ系統の全ゲノムの配
列が決定されているからである。さらに、十分に確立した方法を酵母遺伝子の発
現の改変または摂動に利用できる。好ましい酵母の系統は、系統S288Cのような
酵母のゲノム配列が公知となっているS. セレビシエ系統であるか、またはそれ
と本質的に当遺伝子の誘導体である(例えば、Nature 369, 371-8(1994); P.N.A
.S. 92:3809-13(1995); E.M.B.O. J. 13:5795-5809(1994); Science 265:2077-2
082(1994); E.M.B.O. J. 15:2031-49(1996)を参照し、これらすべては引用する
ことにより本明細書の開示の一部とされる)。しかしながら、その他の系統を同
様に使用してもよい。酵母系統はAmerican Type Culture Collectiom, Rockvill
e, MD 20852から入手できる。酵母を取り扱う標準技術はC. Koiser, S. Michael
is 及びA. Mitchell, 1994, 酵母遺伝学における方法: A Cold Spring Harbor
Laboratoryのコースマニュアル, Cold Spring Harbor Laboratory Press, New Y
ork; およびShermanら, 1986, 酵母遺伝子学における方法:研究室マニュアル,
Cold Spring Harbor Laboratory, Cold Spring Harbor, New Yorkに記載されて
おり、これらは両方ともそれらの全部を引用することにより本明細書の開示の一
部とされる。
【0178】 酵母のその他の利点は研究室において簡単に取り扱えることであり、生物学的
機能がしばしば酵母とヒトとの間で共通していることである。例えば、ヒトの遺
伝病において欠損していると同定されたタンパク質のほとんど半分が酵母タンパ
ク質とアミノ酸の類似性を示す(Goffeauら, 6000遺伝子をもつ生命体, Science
274:546-567)。
【0179】 以下に記載した例示の方法には滴定可能な発現系の使用、トランスフェクショ
ンまたはウイルス変換系の使用、RNAの存在量または活性の直接改変、遺伝子改
変の飽和/改変方法の使用、タンパク質の存在量の直接改変、および特異的な公
知の作用をもつ薬剤(または一般に化学部分)の使用を含むタンパク質活性の直
接改変が含まれる。
【0180】滴定可能な発現系 酵母を用いる好ましい実施形態において、任意の数種の公知の滴定可能な、ま
たは等しく制御可能な、発芽酵母サッカロミセス・セレビシエにおいて使用でき
る発現系は本発明に利用できる(Mumbergら, 1994, サッカロミセス・セレビシエ
の調節可能なプロモーター:転写活性の比較および異種発現へのそれらの利用,
Nucl. Acids Res. 22:5767-5768)。通常、遺伝子発現はその染色体上で制御可能
な外因性プロモーターによって置換され制御されるべき遺伝子のプロモーターの
転写制御によって制御されている。酵母において最も普通に用いられる制御可能
なプロモーターはGAL1プロモーターである(Johnsonら, 1984, サッカロミセス・
セレビシエにおいて異なるGAL1-GAL10プロモーターを調節する配列, Mol Cell.
Biol. 8:1440-1448)。GAL1プロモーターは増殖培地中でグルコースの存在によっ
て強く抑制され、グルコースの存在量を減らしおよびガラクトースの存在によっ
て発現が高レベルになるように徐々に段階的にスイッチが入れられる。GAL1プロ
モーターは通常対象遺伝子上で5-100倍の範囲の発現制御を許容する。
【0181】 その他の頻繁に用いられるプロモーター系には、増殖培地中でメチオニンの不
在により誘発されるMET25プロモーター(Kerjanら, 1986, サッカロミセス・セレ
ビシエMET25遺伝子のヌクレオチド配列, Nucl. Acids. Res. 14:7861-7871)及び
、銅によって誘発されるCUP1プロモーター(Mascorro-Gallardoら, 1996, サッカ
ロミセス・セレビシエにおいて遺伝子発現を調節するCUP1プロモーターに基づく
ベクターの構築, Gene 172:169-170)が含まれる。これらのプロモーター系のす
べてが増殖培地中で制御する部分の存在量を増加させる変化によって増加的に制
御することができる遺伝子発現において制御可能である。
【0182】 上に挙げた発現系の1つの欠点は(例えば、炭素供給源の変化、あるアミノ酸
の除去によって引き起こされた)プロモーター活性の制御が、しばしば独立して
その他の遺伝子の発現レベルを変える細胞生理学にその他の変化をもたらすこと
である。最近開発された酵母用の系、Tet系はこの問題をはるかに緩和する(Gari
ら, 1997, サッカロミセス・セレビシエにおいて調節した発現系のためのテトラ
サイクリンで調節可能なプロモーター系を有するベクターの組, Yeast 13:837-8
48)。哺乳類の発現系(Gossenら, 1995, 哺乳類の細胞におけるテトラサイクリン
による転写の活性化, Proc. Nat. Acad. Sci. USA 89:5547-5551)から採用され
たTetプロモーターを抗生物質テトラサイクリンまたは構造的に関連した化合物
のドキシサイクリンの濃度によって調節する。従ってドキシサイクリンの不在下
ではプロモーターは高レベルの発現を誘発し、ドキシサイクリンのレベルを増加
させて添加することによりプロモーター活性の抑制の増加がもたらされる。中間
レベルの遺伝子発現を定常状態で薬剤を中間レベルで添加することによって達成
することができる。さらに、プロモーター活性の最大抑制(10μg/ml)を与えるド
キシサイクリンのレベルは野生型酵母細胞の増殖速度にあまり影響を及ぼさない
(Gariら, 1997, サッカロミセス・セレビシエにおいて調節した発現系のための
テトラサイクリンで調節可能なプロモーター系を有するベクターの組, Yeast 13
:837-848)。
【0183】 哺乳類の細胞において、遺伝子の発現を滴定する数手段が利用できる(Spencer
, 1996, 哺乳類における条件付き突然変異の作出, Trends Genet. 12:181-187)
。前述したように、Tet系はその原型であるドキシサイクリンの添加が転写を抑
制する「正方向」系、およびドキシサイクリンの添加が転写を促進するより新し
い「逆方向」系の両方において広く用いられている(Gossenら, 1995, 哺乳類細胞
におけるテトラサイクリンによる転写の活性化, Proc. Nat. Acad. Sci. USA 89
:5547-5551; Hoffmanら, 1997,低い基礎発現を有する新規のテトラサイクリン依
存性発現ベクターおよび種々の哺乳類細胞系における有力な調節特性, Nucl. Ac
ids. Res. 25:1078-1079)。哺乳類の細胞において通常用いられる他の制御可能
ナプロモーター系はEvansおよび共同研究者によって開発されたエクジソン(ecd
ysone)で誘発可能な系であり(Noら, 1996, 哺乳類の細胞におけるエクジソンで
誘発可能な遺伝子発現および形質転換マウス, Proc. Nat. Acad. Sci. USA 93:3
346-3351)、その発現は培養細胞に加えたムリステロンのレベルによって制御さ
れる。最後に、Schreiber、Crabtree、および共同研究者によって開発された「化
学誘発による二量化」(CID)系(Belshawら, 1996, タンパク質の異種二量化を誘発
する合成リガンドによるタンパク質の会合および細胞下局在化の制御, Proc. Na
t. Acad. Sci. USA 93:4604-4607; Spencer, 1996, 哺乳類における条件付き突
然変異の作出, Trends Genet. 12:181-187)ならびに酵母における同様の系を用
いて、発現を調節することができる。この系において、対象遺伝子をCIDに応答
するプロモーターの制御下に配置し、2つの異なる雑種タンパク質を発現する細
胞にトランスフェクトする。2つの異なる雑種タンパク質の一方はFKBP12と接合
したDNA結合ドメインを含み、FK506と結合する。他方の雑種タンパク質はこれも
またFKBP12と接合した転写活性化ドメインを含む。CID誘発分子 はFK1012であり、DNA結合および転写活性化雑種タンパク質の両方と同時に結合
することができるFK506の同種二量化型である。FK1012が段階的に存在する中で
、制御された遺伝子の段階的な転写が活性化される。
【0184】 前述した哺乳類の発現系のそれぞれに対して、当業者にとっては十分公知のこ
とではあるが、対象遺伝子を制御可能なプロモーターの制御下に配置し、抗生物
質耐性遺伝子に沿ってこの構築物を収穫するプラスミドを培養した哺乳類細胞に
トランスフェクトする。一般に、プラスミドDNAをゲノムに組み込み、薬剤耐性
コロニーを選んで調節した遺伝子の適切な発現についてスクリーニングする。別
法として、調節した遺伝子をプラスミドの複製に必要なEpstein-Barrウイルスの
成分を含むpCEP4(Invitrogen, Inc.)のようなエピソームプラスミド中に挿入す
ることができる。
【0185】 好ましい実施形態において、前述したもののような滴定可能な発現系を、用途
として相当する内因性遺伝子および/または遺伝子活性を欠く細胞または生物、
例えば内因性遺伝子が破壊され、または欠損している生物中に導入する。かかる
「ノックアウト」を産生させる方法は当業者にとっては十分公知であり、例えば
、Pettittら, 1996, Proc. Nat. Acad. Sci. USA 92:10824-10830; Ramirez-Sol
isら, 1993, Methods Enzymol. 225:855-878; およびThomasら, 1987, Cell 51:
503-512を参照のこと。
【0186】哺乳類細胞に対するトランスフェクション系 標的遺伝子のトランスフェクションまたはウイルス形質導入を哺乳類細胞にお
ける細胞成分中の制御可能な摂動に導入することができる。好ましくは、標的遺
伝子のトランスフェクションまたは形質導入には、対象の標的遺伝子を本来発現
しない細胞を用いることができる。かかる発現しない細胞は、本来標的遺伝子を
発現しない組織から得ることができ、または標的遺伝子を細胞中で特異的に突然
変異させることができる。対象標的遺伝子を多くの哺乳類発現プラスミド、例え
ばpcDNA3.1 +/-系(Invitrogen, Inc.) の中の1つまたはレトロウイルスベクター
にクローン化し、発現しない宿主細胞に導入することができる。標的遺伝子を発
現するトランスフェクト細胞または形質導入細胞を、発現ベクターによってコー
ドされた薬剤耐性マーカーについての選抜によって単離してもよい。遺伝子転写
レベルはトランスフェクション投与量の単調な作用である。このようにして標的
遺伝子のレベルを変化させる効果を研究してもよい。
【0187】 この方法の用途の特定の例は、srcファミリーのタンパク質チロシンキナーゼ
、lck、T細胞受容体活性化経路の鍵成分を標的化する薬剤の探索である(Anderso
nら, 1994, T細胞シグナリングにおけるタンパク質チロシンキナーゼp56(lck)の
関係および胸腺細胞の開発, Adv. Immunol. 56:171-178)。この酵素の阻害剤は
潜在的な免疫抑制剤として興味深い(Hanke JH, 1996, 新規で効能あるsrcファミ
リー選択的チロシンキナーゼ阻害剤, J. Biol. Chem 271(2):695-701)。lckキナ
ーゼを発現しないJurkat T細胞系の特異的変異体(JcaM1)は有効である(Strausら
, 1992, T細胞抗原受容体によるシグナル変換におけるlckチロシンキナーゼの関
係に関する遺伝的証拠, Cell 70:585-593)。それゆえに、トランスフェクション
または形質導入によるlck遺伝子のJcaM1への導入によって、lckキナーゼによっ
て調節されたT細胞の活性化のネットワークモデルの特異的摂動が可能になる。
トランスフェクションまたは形質導入の効率は関係しないので、この方法は制御
可能な(または飽和させる)改変または摂動をもたらす。この方法は一般に摂動
すべき遺伝子を正常では発現しない細胞中での遺伝子発現またはタンパク質存在
量の摂動の供給に有用である。
【0188】飽和改変/改変方法 遺伝子欠損または破壊のような遺伝改変技術を用いて飽和改変/摂動を達成す
ることができる。好ましい実施形態において、かかる遺伝技術を酵母を用いて、
最も好ましくはサッカロミセス・セレビシエを用いて行われる。なぜならばS.
セレビシエ系統の全ゲノムの配列は決定されていからである。特異的遺伝子を欠
損しまたはそうでなければ破壊または改変するための十分に確立された方法を酵
母に利用でき、それらは本明細書において記載されている。さらに生物が再生す
る能力にほとんどまたは全く影響することなくS. セレビシエ中のほとんどの遺
伝子を1度に欠損させることができる。
【0189】 ある実施形態において、Baudinら, 1993, サッカロミセス・セレビシエにおけ
る直接遺伝子欠損のための簡単で効率のよい方法, Nucl. Acids Res. 21:3329-3
330(これはその全部を引用することにより本明細書の開示の一部とされる)の方
法を用いて、酵母遺伝子を破壊または欠損させる。この方法は遺伝子置換カセッ
トで働く選択的マーカー、例えばKanMx遺伝子を使用する。カセットを半数体酵
母系統に形質転換し、同種組換えによって標的遺伝子(ORF)の選択可能マーカー
への置換が起こる。ある実施形態において、正確な全欠失突然変異(開始コドン
から停止コドンへの欠損)が発生する。これもまたWachら, 1994, サッカロミセ
ス・セレビシエにおける古典的またはPCRに基づく遺伝子破壊のための新しい異
種モジュール, Yeast 10:1793-1808; Rothstein, 1991, Methods Enzymol. 194:
281を参照のこと。これらはそれぞれその全部を引用することにより本明細書の
開示の一部とされる。正確な全欠失変異体を用いる利点は、それが末端切断型産
物に関連した残存しているまたは変化した機能で問題を避けるということである
【0190】 しかしながら、いくつかの実施形態においては、全タンパク質コード配列より
も少なく影響する欠損または突然変異、例えば複数のドメインおよび複数の活性
を有するタンパク質のたった1つのドメインの欠損を用いる。いくつかの実施形
態において、酵母の形質転換に用いられる(例えば、選択可能なマーカーを含む
)ポリヌクレオチドには、例えばShoemakerら, 1996, Nature Genetics 14:450
に記載されているような得られた欠損系統の唯一の証明するものとして役立つオ
リゴヌクレオチドマーカーが含まれる。ひとたび作れば、内部KanMx配列および
破壊されたオープンリーディングフレームに直接位置する酵母ゲノム中の外部プ
ライマーを用いるPCR、ならびに期待された大きさのPCR産物をアッセイすること
によって破壊を実証することができる。酵母を用いる場合には3つの酵母系統、
すなわちaおよびa’接合型の半数体系統、ならびに(必須遺伝子の欠損用の)二
倍体系統においてORFを破壊するのにしばしば有利である。
【0191】 対象遺伝子に対するプロモーターを改変することによって、通常はプロモータ
ーを誘発可能なプロモーターのような本来遺伝子と関連したもの以外のプロモー
ターで置換することによって、過剰発現変異体を作製することが好ましい。さら
に、または別法として、エンハンサー配列を添加しまたは改変することができる
。あらかじめ決められた遺伝子からの発現を増加させるための遺伝改変を行うた
めの方法は当技術分野において十分公知である。かかる方法には対象遺伝子を運
ぶプラスミドのようなベクターに対する発現が含まれる。
【0192】 酵母細胞に加えて、本発明の方法を少なくとも1つの遺伝子のゲノム配列が入
手できる(または将来入手できるようになる)任意の真核生物、例えば果物ハエ
(例えば、D.メラノガスター(melanogaster))、線虫(例えば、C.エレガンス(eleg
ans))、ならびにマウスおよびヒトから誘導される細胞のような哺乳類細胞由来
の細胞を用いて行うことができる。例えば、C.エレガンスゲノムの60%より多く
が配列決定されている(「機能的ゲノム分析用に開発された技術を検討する専門
者会議,」 Genetic Engineering News:16, Nov. 15, 1996)。特異的遺伝子を破
壊する方法は当業者にとって十分公知であり、例えばAnderson, 1995, Methods
Cell Biol. 48:31; Pettittら, 1996, Development 122:4149-4157; Spradling
ら, 1995, Proc. Natl. Acad. Sci. USA; Ramirez-Solisら, 1993, Methods Enz
ymol. 225:855; およびThomasら, 1987, Cell 51:503を参照。これらはそれぞれ
その全部を引用することにより本明細書の開示の一部とされる。例えば、個々の
遺伝子の標的化された欠損はネズミ系において記載されている(Mortensenら, 19
92, 単一標的化構築物によるホモ接合性変異体のES細胞の産生, Mol. Cell. Bio
l. 12:2391-2395)。
【0193】RNAの存在量または活性を改変する方法 RNAの存在量または活性を改変する方法は現在3つの分類、リボザイム、アンチ
センス種、およびRNAアプタマーに属する(Goodら, 1997, Gene Therapy 4:45-54
)。制御可能な応用または細胞のこれらの物質への暴露によってRNA存在量の制御
可能な摂動が可能になる。
【0194】 リボザイムはRNA開裂反応を触媒することができるRNAである(Cech, 1967, Sci
ence 236:1532-1539; 1990年10月4日に公開されたPCT国際公開WO 90/11364; Sar
verら, 1990, Science 247:1222-1225)。「ヘアピン」および「ハンマーヘッド
」RNAリボザイムを特定の標的mRNAを特異的に開裂するように設計することがで
きる。高度に配列特異的な方法でその他のRNA分子を開裂することができ、ほと
んど全種類のRNAを標的化することができるリボザイム活性を有する短いRNA分子
を設計するための規則が確立されている(Haseloffら, 1988, Nature 334:585-59
1; Koizumiら, 1988, FEBS Lett., 228:228-230; Koizumiら, 1988, FEBS Lett.
, 239:285-288)。リボザイム法には細胞をかかる小さいRNAリボザイム分子に暴
露すること、細胞中で発現を誘発することなどが含まれる(GrassiおよびMarini,
1996, Annals of Medicine 28:499-510; Gibson, 1996, Cancer and Metastasi
s Reviews 15:287-299)。
【0195】 リボザイムをin vivoにおいてmRNAの開裂に触媒的に有効であるために十分な
数で通常に発現させることができ、それによって細胞中でmRNAの存在量を改変す
ることができる(Cottonら, 1989, in vivoにおけるRNAのリボザイムを媒介した
分解, The EMBO J. 8:3861-3866)。特に、前の規則に従い設計され、および例え
ば標準ホスホルアミダイト化学によって合成されたリボザイムコードDNA配列を
、tRNAをコードする遺伝子のアンチコドンステムおよびループ中で制限酵素部位
に結合することができ、次いでそれを当技術分野において決まった方法によって
対象細胞中で形質転換して発現させる。好ましくは、誘発可能なプロモーター(
例えば、グルココルチコイドまたはテトラサイクリン応答性要素)もまたこの構
築物に導入され、その結果リボザイム発現を選択的に制御することができる。飽
和させる用途として、高度におよび成分的に活性なプロモーターを用いることが
できる。tDNA遺伝子(すなわち、tRNAをコードする遺伝子)は、それらの大きさ
が小さいこと、転写速度が速いこと、および異なる種類の組織の至る所で発現す
ることから本願において有用である。それゆえリボザイムを通常ほとんどいかな
るmRNA配列も切断するように設計することができ、細胞を通常かかるリボザイム
配列をコードするDNAで形質転換することができ、その結果、制御可能でかつ触
媒的に有効な量のリボザイムが発現する。従って、細胞中のほとんどいかなるDN
A種の存在量も改変しまたは摂動することができる。
【0196】 別の実施形態において、標的RNA(好ましくはmRNA)種の活性、特異的にその
翻訳速度をアンチセンス核酸の制御可能な適用によって制御しながら阻害するこ
とができる。高レベルの適用によって飽和させる阻害がもたらされる。本明細書
において「アンチセンス」核酸とは、コードおよび/または非コード領域と相補
性のある領域によって標的RNA、例えばその翻訳開始領域の配列特異的(例えば
、非ポリA)部分とハイブリダイズすることができる核酸をいう。本発明のアン
チセンス核酸は二本鎖または一本鎖のRNAもしくはDNAまたはそれらの変異体もし
くは誘導体であってもよく、それらを直接制御可能な方法で細胞に投与すること
ができ、あるいはそれを標的RNAの翻訳を摂動するに十分な制御可能な量での外
因性の導入された配列の転写によって細胞内で産生することができる。
【0197】 好ましくは、アンチセンス核酸は、少なくとも6個のヌクレオチドから成り、
好ましくは、オリゴヌクレオチド(6〜約200のオリゴヌクレオチド)である。特
定の態様では、このオリゴヌクレオチドは、少なくとも10のヌクレオチド、少な
くとも15のヌクレオチド、少なくとも100のヌクレオチド、少なくとも200のヌク
レオチドである。このオリゴヌクレオチドは、DNAもしくはRNA、あるいは、その
キメラ混合体または誘導体もしくは修飾体、一本鎖または二本鎖のいずれでもよ
い。オリゴヌクレオチドは、塩基成分、糖成分、もしくは燐酸エステルバックボ
ーンで修飾することができる。また、このオリゴヌクレオチドは、ペプチド等の
他の付随基、または、細胞膜を通した輸送を促進する薬剤(例えば、Letsinger
ら、1989、Proc. Natl. Acad. Sci. U.S.A. 86:6553〜6556;Lemaitreら、1987
、Proc. Natl. Acad. Sci. 84:648〜652;1988年12月15日に公開されたPCT公開
番号WO88/09810号を参照)、ハイブリダーゼーション開始切断剤(例えば、Krol
ら、1988、BioTechniques 6:958〜976)あるいは、インターカレート剤(例え
ば、Zon、1988、Pharm. Res. 5:539〜549参照)を含んでもよい。
【0198】 本発明の好ましい態様では、好ましくは、一本鎖DNAとして、アンチセンスオ
リゴヌクレオチドが提供される。このオリゴヌクレオチドは、一般に当業者には
公知の構築物を用いて、その構造上のあらゆる位置で修飾することができる。
【0199】 アンチセンスオリゴヌクレオチドは、限定するものではないが、5-フルオロウ
ラシル、5-ブロモウラシル、5-クロロウラシル、5-ヨードウラシル、ヒポキサン
チン、キサンチン、4-アセチルシトシン、5-(カルボキシヒドロキシルメチル)
ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメ
チルアミノメチルウラシル、ジヒドロウラシル、ベータ-D-ガラクトシルキュー
オシン(beta-D-garactosyl queosine)、イノシン、N6-イソペンテニルアデニン
、1-メチルグアニン、1-メチルイノシン、2,2-ジメチルグアニン、2-メチルアデ
ニン、2-メチルグアニン、3-メチルシトシン、5-メチルシトシン、N6-アデニン
、7-メチルグアニン、5-メチルアミノメチルウラシル、5-メトキシアミノメチル
-2-チオウラシル、ベータ-D-マンノシルキューオシン(beta-D-mannosyl queosin
e)、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、2-メチルチ
オ-N6-イソペンテニルアデニン、ウラシル-5-オキシ酢酸(v)、ワイブトオキ
ソシン(wybutoxosine)、プソイドウラシル(pseudouracil)、キューオシン(queos
ine)、2-チオシトシン、5-メチル-2-チオウラシル、2-チオウラシル、4-チオウ
ラシル、5-メチルウラシル、ウラシル-5-オキシ酢酸メチルエステル、ウラシル-
5-オキシ酢酸(v)、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキ
シプロピル)ウラシル、(acp3)w、ならびに2,6-ジアミノプリンを含む群より
選択される少なくとも1つの修飾塩基成分を含む。
【0200】 別の実施形態では、上記オリゴヌクレオチドは、限定するものではないが、ア
ラビノース、2-フルオロアラビノース、キシルロース、ならびにヘキソースを含
む群から選択される少なくとも1つの修飾糖成分を含む。
【0201】 さらに別の実施形態では、上記オリゴヌクレオチドは、ホスホロチオネート、
ホスホロジチオネート、ホスホルアミドチオネート、ホスホルアミデート、ホス
ホルジアミデート、メチルホスホネート、アルキルホスホトリエステル、ホルム
アセタールもしくはその類似体から成る群より選択される少なくとも1つの修飾
リン酸エステルバックボーンを含む。
【0202】 さらに別の実施形態では、上記オリゴヌクレオチドは、2-a-アノマーオリゴヌ
クレオチドである。a-アノマーオリゴヌクレオチドは、相補的RNAと特定の二本
鎖ハイブリッドを形成するが、ここでは、通常のβ-ユニットとは反対に、鎖は
互いに平行に延びる(Gautierら、1987、Nucl. Acids Res. 15:6625から6641)
【0203】 オリゴヌクレオチドは、別の分子、例えば、ペプチド、ハイブリダイゼーショ
ン開始架橋剤、輸送剤、ハイブリダイゼーション開始切断剤等の他の分子と共役
させてもよい。
【0204】 本発明のアンチセンス核酸は、標的RNA種の少なくとも一部と相補的な配列を
含む。しかし、絶対相補性は、好ましくはあるが、必要ではない。ここで述べる
「RNA種の少なくとも一部と相補的な」配列とは、RNAとハイブリダイズして、安
定した二重らせんを形成するのに十分な相補性を有する配列を意味する。従って
、二本鎖アンチセンス核酸の場合には、二重らせんDNAの一本鎖を試験するか、
あるいは、三重らせん形成を検定することができる。ハイブリダイズする能力は
、相補性の程度と、アンチセンス核酸の長さの両方に左右される。一般に、ハイ
ブリダイズする核酸が長いほど、それに含まれる標的RNAとの塩基ミスマッチが
多くなるため、さらに安定した二重らせん(もしくは、場合に応じて、三重らせ
ん)が形成される。当業者であれば、ハイブリダイズされた複合体の融点を測定
する標準的方法を用いて、許容可能なミスマッチの程度を決定することができる
だろう。標的RNAの翻訳抑制に有効となるアンチセンス核酸の量は、標準的アッ
セイ方法により測定することができる。
【0205】 本発明のオリゴヌクレオチドは、当業者には公知の標準的方法、例えば、自動
DNA合成装置(Biosearch、Applied Biosystems等から市場で入手可能なもの等)
の使用により、合成することができる。例として、Steinらの方法により、ホス
ホロチオネートオリゴヌクレオチドを合成することができ(1988、Nucl. Acids
Res. 16:3209)、また、制御された有孔ガラスポリマー支持体の使用により、
メチルホスホネートオリゴヌクレオチドを調製することができる(Sarinら、198
8、Proc. Natl. Acad. Sci. U.S.A. 85:7448〜7451)。別の形態では、オリゴ
ヌクレオチドは、2’-0-メチルリボヌクレオチド(Inoueら、1987、Nucl. Acids
Res. 15:6131〜6148)、またはキメラRNA-DNA類似体(Inoueら、1987、FEBS L
ett. 215:327〜330)である。
【0206】 合成されたアンチセンスオリゴヌクレオチドを、制御もしくは飽和方式で細胞
に投与することができる。例えば、アンチセンスオリゴヌクレオチドが、細胞に
摂取される制御レベルで、これらオリゴヌクレオチドを細胞の増殖環境におくこ
とができる。このアンチセンスオリゴヌクレオチドの摂取は、当業者には公知の
方法を用いて、補助することができる。
【0207】 別の実施形態では、本発明のアンチセンス核酸は、外性配列からの転写により
、細胞内に制御下で発現させる。発現が高レベルで行われるよう制御する場合に
は、飽和摂動または変更(modification)が起こる。例えば、ベクターをin viv
oに導入して、該ベクターが細胞により吸収されるようにすることができる。こ
の細胞内で、ベクターまたはその一部が転写され、本発明のアンチセンス核酸(
RNA)を生成する。このようなベクターは、アンチセンス核酸をコードする配列
を含む。このようなベクターは、転写されてアンチセンスRNAを生成できる限り
、エピソームのままでいるか、あるいは、染色体的に統合されることができる。
このベクターは、当業者には標準的な組換えDNA技術により構築することができ
る。ベクターは、哺乳動物細胞での複製および発現に使用される、プラスミド、
ウイルス、その他、当業者には公知のものである。上記アンチセンスRNAをコー
ドする配列の発現は、関心のある細胞内で作用する当業者には公知のあらゆるプ
ロモーターによって行うことができる。このようなプロモーターは、誘導性また
は構成性のいずれでもよい。最も好ましくは、アンチセンスオリゴヌクレオチド
の制御された発現を達成するために、外性成分の投与によって、制御可能または
誘導可能なものである。このような制御可能なプロモーターは、Tetプロモータ
ーを含む。哺乳動物細胞用のその他の使用可能なプロモーターには、限定するも
のではないが、SV40初期プロモーター領域(BernoistおよびChambon、1981、Nat
ure 290:304〜310)、ラウスニワトリ肉腫ウイルスの3’長末端リピートに含ま
れるプロモーター(Yamamotoら、1980、Cell 22:787〜797)、ヘルペスチミジ
ンキナーゼプロモーター(Wagnerら、1981、Proc. Natl. Acad. Sci. U.S.A. 7
8:1441〜1445)、メタロチネイン遺伝子の調節配列(Brinsterら、1982、Natur
e 296:39〜42)等が含まれる。
【0208】 従って、アンチセンス核酸は、慣例的手順により、実質的にあらゆるmRNA配列
を標的とするように設計することができる。また、慣例的手順により、このよう
なアンチセンス配列をコードする核酸で、細胞を形質転換するか、あるいは、該
核酸に暴露することにより、有効かつ、制御可能な量または飽和量のアンチセン
ス核酸を発現させることが可能である。従って、細胞における実質的にあらゆる
RNA種の翻訳を変更もしくは摂動することができる。
【0209】 最後に、さらに別の形態では、RNAアプタマーを細胞に導入する、もしくは発
現させることができる。RNAアプタマーは、タンパク質の翻訳を特異的に阻害す
ることができるTatおよびRev RNA(Goodら、1997、Gene Therapy 4:45〜54)等
、タンパク質用の特異的RNAリガンドである。
【0210】タンパク質存在量の変更方法 タンパク質存在量の変更方法には、中でも、タンパク質分解速度を変更するも
の、ならびに、抗体(天然標的タンパク質種の活性の存在量に影響を及ぼすタン
パク質に結合する)を用いたものが含まれる。あるタンパク質種の分解速度の増
加(または減少)により、その種の存在量が減少(または増加)する。温度上昇
および/または特定薬剤への暴露に応答する標的タンパク質の分解速度の増加方
法は、当業者には公知であり、本発明で使用することができる。例えば、ある方
法では、熱誘導性または薬剤誘導性N末端デグロン(degron)を用いるが、これは
、より高い温度(例えば、37℃)での急速なタンパク質分解を促進する分解シグ
ナルを露出し、また、より低い温度(例えば、23℃)では隠れて、急速な分解を
阻止するN末端タンパク質断片である(Dohmenら、1994、Science 263:1273〜1
276)。このようなデグロンの例として、N末端ValがArgによって置換され、位
置66のProがLeuで置換されたマウスジヒドロ葉酸還元酵素の変異型である、Arg-
DHFRtsがある。この方法によれば、例えば、標的タンパク質、Pの遺伝子を、当
業者には公知の標準的遺伝子ターゲッティング方法(Lodishら、1995、Molecula
r Biology of the Cell、W.H. Freeman and Co.、New York、特に第8章)により
、融合タンパク質Ub-Arg-DHFRts-P(“Ub”はユビキチンを示す)をコードする
遺伝子で置換する。N末端ユビキチンは、N末端デグロンを露出する翻訳の後、
速やかに切断される。より低い温度では、Arg-DHFRts内部のリシンが露出されず
、融合タンパク質のユビキチン化が起こらず、分解は遅速であるため、活性標的
タンパク質レベルは高い。より高い温度で(メトトリキセートの不在下で)は、
Arg-DHFRts内部のリシンが露出され、融合タンパク質のユビキチン化が起こり、
分解は高速であるため、活性標的タンパク質レベルは低い。分解の熱活性化は、
露出メトトリキセートにより制御可能に阻止されるため、この方法は、分解速度
の制御可能な変更も可能にする。この方法は、薬剤や温度変化等の他の誘導因子
に応答性の他のN末端デグロンにも適用可能である。
【0211】 標的タンパク質の活性は、(中和)抗体により低下させることもできる。この
ような抗体に、制御または飽和露出を施すことにより、制御または飽和方式で、
タンパク質存在量/活性を変更もしくは摂動することができる。例えば、タンパ
ク質表面上の適切なエピトープに対する抗体は、存在量を減少させ、これによっ
て、低下した活性もしくは最小限活性の複合体へと、活性型を凝集させることに
より、標的タンパク質の野生型活性型の活性を間接的に低下させる。あるいは、
例えば、活性部位と直接相互作用する、あるいは、活性部位への基質の接近を阻
害することにより、抗体が、タンパク質活性を直接低下させることも可能である
。反対に、場合によっては、(活性化)抗体も、タンパク質およびその活性部位
と相互作用して、活性を高めることができる。いずれの場合も、抗体(以下に記
載する各種の)を特定のタンパク質種に対して提示し(以下に記載する方法によ
って)、その作用を選別することができる。抗体の作用を検定し、標的タンパク
質種の濃度および/または活性を高める、もしくは低下させる適切な抗体を選択
することができる。このようなアッセイは、抗体を細胞へと導入し(以下参照)
、当業者には公知の標準的手段(免疫検定等)により、標的タンパク質の野生型
量または活性の濃度を検定することから成る。野生型の正味活性は、標的タンパ
ク質の既知活性に適した検定手段により検定することができる。
【0212】 抗体は、様々な方法で細胞に導入することができる。このような方法には、例
えば、細胞への抗体の微量注射(Morganら、1988、Immunology Today 9:84〜86
)、または、所望の抗体を細胞にコードするハイブリドーマmRNAの形質転換(Bu
rkeら、1984、Cell 36:847〜858)が含まれる。さらに別の方法では、組換え抗
体を操作し、非常に多様な種類の非リンパ系細胞に異所発現させることにより、
標的タンパク質に結合させると共に、標的タンパク質の活性を阻害することがで
きる(Bioccaら、1995、Trends in Cell Biology 5:248〜252)。抗体の発現は
、好ましくは、Tetプロモーター、もしくは、構成的に活性のプロモーター(飽
和摂動を起こすための)等の制御可能なプロモーターの制御下で行う。第1のス
テップは、標的タンパク質に対して適切な特異性を有する特定のモノクローナル
抗体の選択である(以下参照)。次に、選択した抗体の可変領域をコードする配
列を様々な操作抗体フォーマット中にクローン化することができる。このような
抗体フォーマットには、例えば、全抗体、Fabフラグメント、Fvフラグメント、
一本鎖Fvフラグメント(ペプチドリンカーにより統合されたVHおよびVL領域)(
”ScFV” フラグメント)、ダイアボディ(diabodies)(異なる特異性を有する
2つの会合したScFvフラグメント)等(Haydenら、1997、Current Opinion in I
mmunology 9:210〜212)が含まれる。各種フォーマットの細胞内発現した抗体
は、様々な既知の細胞内リーダー配列(Bradburyら、1995、Antibody Engineeri
ng(vol. 2)(Borrebaeck ed.)、pp.295〜361、IRL Press)との融合体として
それらを発現させることにより、細胞コンパートメント(例えば、細胞質、核、
ミトコンドリア等)にターゲッティングすることができる。特に、ScFvフォーマ
ットは、細胞質ターゲッティングに特に適していると思われる。
【0213】 抗体のタイプには、ポリクローナル、モノクローナル、キメラ型、一本鎖、Fa
bフラグメント、ならびにFab発現ライブラリーが含まれるが、これらに限定され
るわけではない。当業者には公知の各種方法を用いて、標的タンパク質に対する
ポリクローナル抗体を生成することができる。抗体の生成のために、様々な宿主
動物を標的タンパク質の注射により免疫することができる。このような宿主動物
には、ウサギ、マウス、ラット等が含まれるが、これらに限定されない。宿主の
種に応じて、各種アジュバントを用いて、免疫応答を高めることができる。この
ようなアジュバントとして、限定するものではないが、フロイントアジュバント
(完全および不完全)、水酸化アルミニウム等のミネラルゲル、リゾレシチン等
の界面活性物質、プルロニックポリオール、ポリアニオン、ペプチド、油性エマ
ルション、ジニトロフェノール、ならびに、カルメット・ゲラン菌(BCG)およ
びcoryneobacterium parvumが含まれる。
【0214】 標的タンパク質に向けられるモノクローナル抗体を調製するには、培養中の連
続的細胞系による抗体分子を生成するあらゆる方法を用いることができる。この
ような方法には、限定するものではないが、次のものが含まれる:Kohlerおよび
Milsteinにより最初に開発されたハイブリドーマ法(1975、Nature 256:495〜4
97)、トリーマ法、ヒトB細胞ハイブリドーマ法(Kozborら、1983、Immunology
Today 4:72)、ならびにヒトモノクローナル抗体を生成するEBVハイブリドーマ
法(Coleら、1985、in Monoclonal Antibodies and Cancer Therapy、Alan R. L
iss, Inc.、pp. 77〜96)。本発明の別の形態では、最近の技術(PCT/US90/0254
5)を用いて、モノクローナル抗体を無菌動物に生成することができる。本発明
によれば、ヒト抗体を使用してもよく、これらは、ヒトハイブリドーマを用いて
(Coteら、1983、Proc. Natl. Acad. Sci. USA 80:2026〜2030)、あるいは、E
BVウイルスでヒトB細胞をin vitroで形質転換する(Coleら、1985、in Monoclo
nal Antibodies and Cancer Therapy、Alan R. Liss、Inc.、pp. 77〜96)こと
により、取得することができる。実際に、本発明によれば、標的タンパク質に特
異的なマウス抗体分子由来の遺伝子を、適切な生物活性を有するヒト抗体分子と
一緒に、スプライシングすることにより、「キメラ抗体」を生成するために開発
された方法(Morrisonら、1984、Proc. Natl. Acad. Sci. USA 81:6851〜6855
;Neubergerら、1984、Nature 312:604〜608;Takedaら、1985、Nature 314:4
52〜454)を使用することができる。尚、このような抗体は、本発明の範囲に含
まれる。
【0215】 さらに、モノクローナル抗体が有利である場合には、ファージ展示方法(Mark
sら、1992、J. Biol. Chem. 267:16007〜16010)を用いて、大きな抗体ライブ
ラリーから、該モノクローナル抗体を選択することも可能である。この方法を用
いることにより、1012までの異なる抗体のライブラリーをfd繊維状ファージの表
面に発現させて、モノクローナル抗体の選択に利用可能な抗体の「単一ポット(
pot)」in vitro免疫系が形成されている(Griffithsら、1994、EMBO J. 13:32
45〜3260)。このようなライブラリーからの抗体の選択は、当業者には公知の方
法によって実施することができる。このような方法には、上記ファージを固定化
した標的タンパク質に接触させ、該標的に結合させたファージをクローン化した
後、抗体可変領域をコードする配列を、所望の抗体フォーマットを発現する適切
なベクター中にサブクローン化する方法が含まれる。
【0216】 本発明によれば、一本鎖抗体の生成のために記載された方法(米国特許第4,94
6,778号)に基づいて、標的タンパク質に特異的な一本鎖抗体を生成することが
できる。本発明の別の形態は、Fab発現ライブラリーの構築のために記載された
方法(Huseら、1989、Science 246:1275〜1281)を用いて、標的タンパク質に
対する所望の特異性を有するモノクローナルFabフラグメントの高速かつ容易な
特定を可能にする。
【0217】 当業者には公知の方法によって、標的タンパク質のイディオタイプを含む抗体
フラグメントを生成することができる。例えば、このようなフラグメントは、抗
体分子のペプシン消化により構成することができるF(ab’)2フラグメント:該F(
ab’)2フラグメントのジスルフィド架橋を減少することにより生成することがで
きるFab’フラグメント;パパインおよび還元剤で抗体分子を処理することによ
り生成することができるFabフラグメント;ならびに、Fvフラグメントを含むが
、これらに限定されるわけではない。
【0218】 抗体の生成では、所望の抗体のスクリーニングは、当業者には公知の方法、例
えば、ELISA(固相酵素免疫検定法)により、達成することができる。標的タン
パク質に特異的な抗体を選択するために、標的タンパク質に結合する抗体につい
て、生成されたハイブリドーマ、または、ファージ展示抗体ライブラリーを検定
することができる。
【0219】タンパク質活性の変更方法 タンパク質活性を直接変更する方法には、中でも、前記のように、ドミナント
・ネガティブ突然変異、特定の薬剤または化学成分、ならびに、抗体の使用が含
まれる。
【0220】 ドミナント・ネガティブ突然変異は、外性遺伝子もしくは突然変異外性遺伝子
に対する突然変異であり、これら遺伝子が細胞中で発現すると、標的とするタン
パク質種の活性を破壊する。標的とするタンパク質種の構造および活性に応じて
、該標的の活性を破壊するドミナント・ネガティブ突然変異を構築する適切な戦
略の選択を導く一般原則が存在する(Hershkowitz、1987、Nature 329:219〜22
2)。活性単量体型の場合には、不活性型の過剰発現により、標的タンパク質の
正味活性を大幅に低下させるのに十分な天然基質またはリガンドの競合を引き起
こすことができる。このような過剰発現は、例えば、活性の増加したプロモータ
ー、好ましくは、制御可能もしくは誘導プロモーター、あるいは、構成的に発現
させたプロモーターを、突然変異遺伝子と会合させることにより達成することが
できる。あるいは、活性部位残基への変更を実施して、標的リガンドとの、実質
的に不可逆の会合を起こすことも可能である。これは、所定のチロシン・キナー
ゼで、活性部位セリン残基を注意深く置換することにより達成することができる
(Perlmetterら、1996、Current Opinion in Immunology 8:285〜290)。
【0221】 多量体活性型の場合には、複数の戦略が、ドミナント・ネガティブ突然変異体
の選択を導くことができる。多量体活性は、多量体会合ドメインに結合して、多
量体の形成を阻害する外性タンパク質断片をコードする遺伝子の発現により、制
御もしくは飽和方式で、低下させることができる。あるいは、特定タイプの不活
性タンパク質単位の制御可能または飽和式過剰発現が、不活性多量体中の野生型
活性単位を拘束し、これによって、多量体の活性を低下させることができる(No
ckaら、1990、The EMBO J. 9:1805〜1813)。例えば、二量体DNA結合タンパク
質の場合には、DNA結合単位からDNA結合ドメインを欠失させる、あるいは、活性
化単位から活性化ドメインを欠失させることができる。また、この場合、DNA結
合ドメイン単位を、該ドメインが活性化単位との会合を起こすことなく、発現さ
せることもできる。これによって、発現の活性化の可能性なしに、DNA結合部位
が拘束される。特定タイプの単位が、立体配座の変更を通常に経る場合には、硬
質(rigid)単位の発現が、得られる複合体を不活性化する。さらに別の例では
、細胞の機動、有糸分裂過程、細胞のアーキテクチャー等、細胞の作用機構に関
与するタンパク質が、典型的には、二、三のタイプの多数のサブユニットの会合
から構成される。これらの構造は、構造欠陥を有する少数の単量体単位の含有に
よる破壊に対して、非常に感受性が高いことが多い。このような突然変異単量体
は、関連するタンパク質活性を破壊し、制御または飽和方式で、細胞中に発現さ
せることができる。
【0222】 ドミナント・ネガティブ突然変異以外にも、当業者には公知の突然変異誘発お
よびスクリーニング方法で、温度(または、その他の外的要因)に対して感受性
の高い突然変異標的タンパク質をみいだすことができる。
【0223】 また、当業者には、標的タンパク質と結合する抗体、および該タンパク質を阻
害する抗体の発現を、別のドミナント・ネガティブ戦略として使用できることが
理解されよう。
【0224】特定の既知作用を有する薬剤 最後に、外来薬剤またはリガンドへの暴露により、所定標的タンパク質の活性
を、制御もしくは飽和方式で、変更または摂動することができる。本発明の方法
は、薬剤作用の経路の生物学的ネットワークモデルを試験または確認するのにし
ばしば使用されることから、薬剤暴露は、ネットワークモデルへの細胞構成要素
入力を変更/摂動する重要な方法である。好ましい態様では、薬剤暴露または遺
伝子操作(遺伝子欠失やノックアウト等)のいずれかによって、入力細胞構成要
素を摂動し、遺伝子発現方法(以下に記載する遺伝子転写産物アレイとのハイブ
リダイゼーション等)によって、システム応答を測定する。
【0225】 好ましい形態では、細胞中のただ1つの標的タンパク質と相互作用し、その標
的タンパク質だけの活性を変更して、該活性を増加または減少させる薬剤が知ら
れている。この薬剤の量を変えながら、これに細胞を段階的に暴露することによ
って、上記標的タンパク質を入力として有するネットワークモデルの段階的摂動
を実施する。また、飽和暴露によって、飽和変更/摂動を実施する。例えば、シ
クロスポリンAは、シクロフィリンとの複合体として作用し、カルシニューリン
・タンパク質の非常に特異的な調節剤である。従って、シクロスポリンAを連続
的に滴定することにより、所望量のカルシニューリン・タンパク質の阻害を発生
させることができる。あるいは、シクロスポリンAに対する飽和暴露により、カ
ルシニューリン・タンパク質を最大限に阻害することも可能である。
【0226】 上記より好ましくはないが、個別の、識別可能な、かつ非重複作用を有する数
種(例えば、2〜5)の標的タンパク質だけの活性を変更する薬剤が知られてお
り、使用されている。このような薬剤に対する段階的(または飽和)暴露により
、これらのタンパク質を入力として有する、恐らく、複数のネットワークモデル
に、段階的(または飽和)摂動を実施する。
【0227】 酵母の場合には、初期対数段階で、酵母を回収するのが好ましい。なぜなら、
このとき、発現パターンが、回収時期に対してかなり非感受性になるためである
。上記薬剤は、該薬剤の特定の特性に応じた段階的量を添加するが、通常、1ng
/ml〜100mg/mlである。場合によっては、DMSO等の溶剤に薬剤を溶解させること
もある。
【0228】 本発明の方法を用いて、生体システムにおける薬剤作用の経路をモデル化する
場合には、好ましくは、薬剤暴露の飽和レベルを使用することにより、実質的な
毒性もしくは増殖欠陥(細胞培養物の場合)を起こすことなく、最大数の細胞構
成要素(例えば、細胞の転写状態で測定されるように)から、明瞭な応答を発生
させる。これは、あらゆる固定閾値を越えて、作用を被る細胞構成要素の数に関
して、薬剤暴露に対する生体システムの応答が、薬剤暴露のレベルの上昇と共に
増加するためである。薬剤作用の各経路について、作用を被る細胞構成要素の同
一性は実質的に一定であるのに対し、作用の大きさは、暴露レベルに応じて増加
する。しかし、暴露レベルが高いほど、作用を被る細胞経路は多くなり、従って
、作用を被る細胞構成要素も多くなる。この挙動は、メトトレキセート、FK506
、シクロスポリンAならびにトリコスタチンなどの薬剤の暴露範囲全体について
確認されている。従って、薬剤作用の最も適したネットワークモデルは、典型的
に、薬剤濃度に応じて変化する。薬剤作用の全スペクトルを解明するためには、
最も高い実際濃度を用いるのが好ましい。
【0229】5.5.2.測定方法 本発明の実験上の試験および確認方法もまた、モデルへの細胞構成要素入力の
変更/摂動に対する細胞構成要素の応答の測定値(ネットワークモデル以外の)
に応じて異なる。測定される細胞構成要素は、細胞の、あらゆる局面の生物学的
状態に由来するものでよい。これらは、RNA存在量を測定する転写状態、タンパ
ク質存在量を測定する翻訳状態、タンパク質活性を測定する活性状態に由来する
ものでよい。また、細胞の特性も、例えば、他の細胞構成要素のRNA存在量(遺
伝子発現)と一緒に、1つ以上のタンパク質の活性を測定する混合局面に由来す
るものでよい。この節では、細胞構成要素の薬剤もしくは経路応答を測定する例
示的方法を記載する。本発明は、このような測定の他の方法にも適用することが
できる。
【0230】 好ましくは、本発明で、他の細胞構成要素の転写状態を測定する。転写状態は
、次の小節で記載する、核酸または核酸擬似プローブのアレイとのハイブリダイ
ゼーション方法、あるいは、その次の小節に記載する他の遺伝子発現方法により
、測定することができる。どのように測定したとしても、得られる結果は、通常
、DNA発現比率を表す(ただし、RNA分解速度に差はないものとする)のRNA存在
量比率を示す値を含む応答データである。
【0231】 その他の本発明の多様な実施形態では、翻訳状態、活性状態、もしくは混合形
態等、転写状態以外の生物学的状態の局面を測定することができる。
【0232】 あらゆる実施形態で、いつ測定を行うかとはほぼ無関係に、細胞構成要素の測
定を実施すべきである。例えば、酵母では、初期対数段階で、発現パターンが、
回収時期に対して、かなり非感受性であることが明らかにされている(DeRisiら
、1997、Exploring the metabolic and genetic control of gene expression o
n a genomic scale、Science 278:680〜686)。従って、好ましくは、酵母細胞
は、測定のため、初期対数段階に、1または2回回収し、測定時期が変動しないよ
うにする。
【0233】5.5.2.1 転写状態の測定 好ましくは、転写状態の測定は、この小節に記載する転写産物配列とのハイブ
リダイゼーションにより実施する。転写状態測定の他の方法については、この小
節で後にいくつか説明する。
【0234】転写産物一般 好ましい実施形態では、本発明は、「転写産物アレイ」(ここでは、「マイク
ロアレイ」とも呼ぶ)を使用する。転写産物アレイは、細胞における転写状態を
分析する、特に、関心のある薬剤の段階的レベル、または、生物学的ネットワー
クモデルへの細胞構成要素入力に対する段階的変更/摂動に暴露された細胞の転
写状態を測定するのに使用することができる。
【0235】 ある実施形態では、細胞に存在するmRNA転写産物を呈示する、検出可能に標識
されたポリヌクレオチドをマイクロアレイとハイブリダイズすることにより、転
写産物アレイを生成する。マイクロアレイは、細胞または生物のゲノムにおける
遺伝子の多く、好ましくは遺伝子のほとんどもしくはほぼ全ての産物の結合(例
えば、ハイブリダイゼーション)部位の定序アレイを備えた表面である。マイク
ロアレイは、多くの方法で作製することができ、そのいくつかを以下に記載する
。どのように作製したとしても、マイクロアレイは、いくつかの共通する特徴を
持っている。これらのアレイは、再生可能であり、所定アレイの複数のコピーを
生成し、容易に互いに比較することができる。好ましくは、マイクロアレイは、
小型で、通常、5cm2より小さく、結合(例えば、核酸ハイブリダイゼーション
)条件下で、安定した材料から成る。マイクロアレイ中の所定の結合部位または
結合部位の唯一のセットが、細胞における1つの遺伝子の産物と特異的に結合す
ることになる。特定のmRNAにつき、2つ以上の物理的結合部位(以後[部位]と
呼ぶ)が存在する可能性があるが、明瞭化のために、以下の説明では、単一の部
位があるものと仮定する。特定の実施形態では、各位置に既知配列の添加核酸を
含む、位置的にアクセス可能なアレイを使用する。
【0236】 細胞のRNAに相補的なcDNAを作製し、適切なハイブリダイゼーションの条件下
で、マイクロアレイとハイブリダイズさせると、特定遺伝子に対応するアレイ中
の部位に対するハイブリダイゼーションレベルが、細胞における、該遺伝子から
転写されたmRNAの優勢を表すことは理解されよう。例えば、全細胞mRNAに相補的
な、検出可能に標識された(例えば、発蛍光団で)cDNAをマイクロアレイとハイ
ブリダイズすると、細胞に転写されていない遺伝子(例えば、該遺伝子の産物に
特異的に結合する能力のある遺伝子)に対応するアレイ上の部位は、シグナル(
例えば、蛍光シグナル)をほとんど、または全く持たず、また、コードされたmR
NAが優勢である遺伝子は、比較的強いシグナルを持つようになる。
【0237】 好ましい実施形態では、2つの異なる細胞に由来するcDNAを、マイクロアレイ
の結合部位にハイブリダイズする。薬剤応答の場合には、一方の細胞を薬剤に暴
露し、同じタイプの他方の細胞は該薬剤に暴露しないでおく。ネットワークモデ
ルへの細胞構成要素入力に施す変更/摂動に対する応答の場合には、1つの細胞
をこのような変更/摂動に暴露し、同じタイプの別の細胞は経路摂動に暴露しな
いでおく。一般に、生体ネットワークモデルを試験または確認するための実験は
、典型的に、ネットワークモデルへの入力の2つの状態の比較を含むため、好ま
しくは、1つの細胞を入力細胞構成要素の一状態に暴露し、他方の細胞は、入力
細胞構成要素の他の状態に暴露する。2つの細胞タイプの各々に由来するcDNAを
それぞれ別様に標識し、識別できるようにする。ある実施形態では、例えば、薬
剤で処理した(または、変更/摂動に暴露した)細胞に由来するcDNAを、蛍光標
識dNTPを用いて合成し、薬剤暴露していない第2細胞由来のcDNAを、ローダミン
標識dNTPを用いて合成する。これら2つのcDNAを混合し、マイクロアレイとハイ
ブリダイズすると、各cDNAセットからのシグナルの相対同一性が、アレイ上の各
部位について決定され、特定のmRNAの存在量の相対差が検出される。
【0238】 以上述べた実施例では、薬剤処理した(または変更/摂動した)細胞由来のcD
NAは、発蛍光団が刺激されると、緑色の蛍光を発し、非処理細胞由来のcDNAは赤
色の蛍光を発する。その結果、薬剤処理(または変更/摂動)が、直接もしくは
間接的に、細胞中の特定のmRNAの相対存在量に全く作用を及ぼさない場合には、
両細胞で、mRNAが同様に優勢となり、逆転写後に、赤色標識および緑色標識cDNA
が同様に優勢となる。マイクロアレイにハイブリダイズされると、上記種のRNA
に対する結合部位が、両発蛍光団に特有の波長を発する(そして、組み合わせに
より、茶色に見える)。対照的に、薬剤暴露した(または変更/摂動した)細胞
が、細胞におけるmRNAの優勢を直接または間接的に増加する薬剤で処理される場
合には、赤色に対する緑色の比が高くなる。また、該薬剤が、mRNAの優勢を減少
させる場合には、この比も低くなる。
【0239】 遺伝子発現の改変を規定するための、2色蛍光標識および検出計画の使用につ
いては、例えば、Shenaら、1995、Quantitative Monitoring of gene expressio
n patterns with a complementary DNA microarray, Science 270:467〜470に
記載されており、その全文が、参照として、あらゆる目的のために本明細書に組
み込まれる。2つの異なる発蛍光団で標識したcDNAを用いる利点は、2つの細胞
状態で各々配列された遺伝子に対応するmRNAレベルの直接、かつ、内部制御され
た比較を達成することができ、従って、実験条件(例えば、ハイブリダイゼーシ
ョン条件)の些細な相違による変動が、後に行う分析に影響しないことである。
しかし、単一細胞由来のcDNAを用いて、例えば、薬剤処理した、または、経路摂
動した細胞と、非処理細胞における特定mRNAの絶対量を比較することも可能であ
ることは認識されるだろう。
【0240】 好ましくは、繰り返し行った実験からの遺伝子発現データを統合することによ
り、ランダムに発生した実験上の誤差を減少および特性決定する。このような特
性決定により、等式2の加法的実験誤差項の推定値、6が得られる。さらに、対
の2色示差ハイブリダイゼーション実験における蛍光標識を逆転することにより
、個々の遺伝子、アレイスポット位置、実験プロトコル、ならびに観測設備に特
有の蛍光標識依存性および色依存性偏差を減少させることができる。これら偏差
の特性決定により、等式2の乗法的実験誤差項の推定値、fが得られる。
【0241】マイクロアレイの作製 マイクロアレイは、当業者には公知であり、配列が、遺伝子産物(例えば、cD
NA、mDNA、cRNA、ポリペプチド、ならびにその断片)に対応するプローブを、特
異的に、既知の位置で、ハイブリダイズもしくは結合させることのできる表面か
ら構成される。ある実施形態では、マイクロアレイは、各位置が、遺伝子により
コードされた産物(例えば、タンパク質またはRNA)に対する個別の結合部位を
呈示し、かつ、生物のゲノムにおける遺伝子のほとんどまたはほぼ全ての産物に
ついて、結合部位が存在するアレイ(すなわち、マトリクス)である。好ましい
実施形態では、「結合部位」(以後、「部位」)は、特定のコグネイト(cognate
)cDNAが特異的にハイブリダイズすることのできる核酸もしくは核酸類似体であ
る。結合部位の核酸もしくは類似体は、例えば、合成オリゴマー、完全長cDNA、
完全長より短いcDNA、あるいは、遺伝子断片でよい。
【0242】 好ましい実施形態では、マイクロアレイは、標的生物のゲノムにおける全てま
たはほぼ全ての遺伝子の産物に対する結合部位を含むが、このような包括性は必
ずしも必要ではない。通常、マイクロアレイは、ゲノム中の遺伝子の少なくとも
約50%、多くの場合、少なくとも約75%、さらに多くの場合、少なくとも約85%
、さらに多くの場合には、少なくとも約90%、また、最も多くの場合、少なくと
も約99%に対応する結合部位を有することになる。好ましくは、マイクロアレイ
は、関心のある生体ネットワークモデルの試験および確認に関する遺伝子に対す
る結合部位を有する。「遺伝子」は、メッセンジャーRNAが、生物(例えば、単
一細胞であれば)または多細胞生物におけるある細胞に転写される好ましくは少
なくとも50、75、もしくは99のアミノ酸のオープンリーディングフレーム(ORF
)として同定される。一ゲノム中の遺伝子の数は、生物によって、あるいは、該
ゲノムのよく特性決定された部分からの外挿によって発現されるmRNAの数から推
定することができる。関心のある生物のゲノムが配列決定されている場合には、
ORFの数を決定し、mRNAコード領域を、DNA配列の分析により同定する。例えば、
ビール酵母菌ゲノムは、完全に配列決定されており、99アミノ酸より長い約6275
のオープンリーディングフレーム(ORF)を持つことが報告されている。これらO
RFの分析から、タンパク質産物を指定すると思われる5885のORFがあることがわ
かる(Goffeauら、1996、Life with 6000 genes, Science 274:546〜567、その
全文は、あらゆる目的のために、参照として、本明細書に組み込まれる)。対照
的に、ヒトゲノムは、約105の遺伝子を含むと推定される。
【0243】マイクロアレイ用の核酸の作製 前述のように、特定のコグネイトcDNAが特異的にハイブリダイズする「結合部
位」は、通常、この結合部位に結合する核酸もしくは核酸類似体である。ある実
施形態では、マイクロアレイの結合部位は、生物のゲノムにおける各遺伝子の少
なくとも一部に対応するDNAポリヌクレオチドである。これらDNAは、例えば、ゲ
ノムDNA、cDNA(例えば、RT-PCRによる)、あるいはクローン化した配列由来の
遺伝子セグメントのポリメラーゼ連鎖反応(PCR)増幅により、取得することが
できる。PCRプライマーは、遺伝子またはcDNAの既知配列に基づいて、選択され
、これによって、ユニーク断片(すなわち、マイクロアレイの他の断片と、10塩
基を超える連続した同一配列を共有しない断片)の増幅が行われる。コンピュー
タープログラムは、要求される特異性および最適増幅特性を備えるプライマーの
設計に有用である。例えば、「Oligo」5.0版(National Biosciences)を参照の
こと。非常に長い遺伝子に対応する結合部位の場合には、該遺伝子の3’末端付
近でセグメントを増幅することにより、オリゴ-dtで感作したcDNAプローブを、
マイクロアレイとハイブリダイズさせたとき、完全長プローブより短いプローブ
が効率的に結合するようにするのが好ましいこともある。典型的には、マイクロ
アレイ上の格遺伝子断片は、長さが、約50bp〜約2000bp、さらに典型的には、約
100bp〜約1000bp、通常、約300bp〜約800bpの範囲である。PCR法は、よく知れら
れており、例えば、Innisら編集の、1990、PCR Protocols:A Guide to Methods
and Applications、Academic Press Inc. San Diego, CA(その全文は、あらゆ
る目的のために、参照として本明細書に組み込む)に記載されている。コンピュ
ーター制御ロボットシステムが、核酸の単離および増幅に有用であることは明ら
かであろう。
【0244】 マイクロアレイ用の核酸を生成する別の手段は、例えば、N-ホスホネートまた
はホスホアミダイト化学(Froehlerら、1986、Nucleic Acid Res 14:5399〜540
7;McBrideら、1983、Tetrahedron Lett. 24:245〜248)を用いた、合成ポリヌ
クレオチドまたはオリゴヌクレオチドの合成による。合成配列は、長さが、約15
〜約500塩基、さらに典型的には、約20〜約50塩基である。いくつかの実施形態
では、合成核酸は、非天然塩基、例えば、イノシンを含む。前述したように、ハ
イブリダイゼーション用の結合部位として、核酸類似体を用いてもよい。適した
核酸類似体の例として、ペプチド核酸がある(例えば、Egholmら、1993、PNA Hy
bridizes to complementary oligonucleotides obeying the Watson-Crick hydr
ogen-bonding rules、Nature 365:566〜568;また、米国特許第5,539,083号を
参照のこと)。
【0245】 別の実施形態では、結合(ハイブリダイゼーション)部位は、遺伝子、cDNA(
例えば、発現させた配列タグ)、もしくはそこからの挿入断片のプラスミドまた
はファージクローンから成る(Nguyenら、1995、Differential gene expression
in the murine thymus assayed by quantitative hybridization of arrayed c
DNA clones、Genomics 29:209〜209)。さらに別の実施形態では、結合部位の
ポリヌクレオチドはRNAである。
【0246】固相表面への核酸の結合 核酸または類似体を固相支持体に結合させる。この固相支持体は、ガラス、プ
ラスチック(例えば、ポリプロピレン、ナイロン)、ポリアクリルアミド、ニト
ロセルロース、あるいはその他の材料から成るものでよい。表面に核酸を結合す
るのに好ましい方法は、一般的に、Schenaらにより、1995、Quantitative monit
oring of gene expression patterns with a complementary DNA microarray、S
cience 270:460〜470に記載されているように、ガラスプレートへの印刷による
ものである。この方法は、cDNAのマイクロアレイを作製するのに特に有用である
。ままた、DeRisiら、1996、Use of cDNA microarray to analize gene express
ion patterns in human cancer、Nature Genetics 14:457〜460;Shalonら、19
96、A DNA microarray system for analyzing complex DNA samples using two-
color flurescent probe hybridization、Genome Res. 6:639〜645;ならびに
、Schenaら、1995、Parallel human genome analysis;microarray-based expre
ssion of 1000 genes、Proc, Natl. Acad. Sci. USA 93:10539〜11286を参照。
以上掲げた文献は、すべて、その全文を、あらゆる目的のために、参照として本
明細書に組み込むものとする。
【0247】 マイクロアレイを作製する第2の好ましい方法は、高密度オリゴヌクレオチド
アレイを作製することから成る。in situ合成のための写真平版法(Fodorら、19
91、Light-directed spatially addressable parallel chemical synthesis、Sc
ience251:767〜773;Peaseら、1994、Light-directed oligonucleotide arrays
for rapid DNA sequence analysis、Proc. Natl. Acad. Sci. USA 91:5022〜5
026;Lockhartら、1996、Expression monitoring by hybridization to high-de
nsity oligonucleotide arrays、Nature Biotech 14:1675;米国特許第5,578,
832号;第5,556,752号;第5,510,270号を参照、尚、これらの文献は、すべて、
その全文を、あらゆる目的のために、参照として本明細書に組み込む)、あるい
は、その他の規定オリゴヌクレオチドの高速合成および沈着方法(Blanchardら
、1996、High-Density Oligonucleotide arrays、Biosensors & Bioelectoronic
s 11:687〜90)を用いて、表面上の規定位置に、規定配列に相補的な数千のオ
リゴヌクレオチドを含むアレイを生成する方法が知られている。これらの方法を
用いる際には、既知配列のオリゴヌクレオチド(例えば、20-mers)を、誘導体
化したスライドガラス等の表面上に直接合成する。通常、生成されるアレイは冗
長であり、1つのRNAに複数のオリゴヌクレオチドを含む。オリゴヌクレオチド
プローブを選択することにより、場合によって、スプライシングされたmRNAを検
出することができる。
【0248】 例えば、マスキング(MaskosおよびSouthern、1992、Nuc. Acids Res. 20:16
79〜1684)による等のマイクロアレイを作製するその他の方法を使用してもよい
。原則として、例えば、ナイロンハイブリダイゼーション膜上のドットブロット
(Sambrookら、Molecular Cloning−A Laboratory Manual(第2版)、Vol. 1〜
3、Cold Spring Harbor Laboratory、Cold Spring Harbor、New York、1989を
参照、尚、これらの文献は、すべて、その全文を、あらゆる目的のために、参照
として本明細書に組み込む)等のあらゆるタイプのアレイを使用することができ
るが、当業者には認識されるように、ハイブリダイゼーション量が少なくてすむ
ことから、非常に小さいアレイが好ましい。
【0249】標識したプローブの作製 全RNAおよびポリ(A)RNAの調製方法は周知であり、Sambrookら(前掲)に概
略的に記載されている。1つの実施形態において、RNAは、本発明において関心
のある種々のタイプの細胞からチオシアン酸グアニジウム溶解およびそれに続く
CsCl遠心分離(Chirgwinら, 1979, Biochemistry 18:5294-5299)を用いて抽出
される。ポリ(A)RNAは、オリゴdTセルロースを用いた選択により選択される(
Sambrookら,前掲を参照)。関心のある細胞としては、野生型細胞、薬物に暴露
した野生型細胞、改変/摂動させた細胞構成成分(cellular constituent)を有
する細胞、および改変/摂動させた細胞構成成分を有する薬物に暴露した細胞が
挙げられる。
【0250】 標識したcDNAは、mRNAからオリゴdTプライム化逆転写またはランダムプライム
化逆転写により調製し、それら両者の逆転写は当業界で周知である(例えば、Kl
ugおよびBerger, 1987, Methods Enzymol. 152:316-325を参照)。逆転写は、検
出可能な標識に結合させたdNTPの存在下で、最も好ましくは蛍光標識したdNTPの
存在下で行うことができる。あるいはまた、単離したmRNAを、標識したdNTPの存
在下で二本鎖cDNAのin vitro転写により合成した標識化アンチセンスRNAに変換
してもよい(Lockhartら, 1996, Expression monitoring by hybridization to
high-density oligonucleotide arrays, Nature Biotech. 14:1675, あらゆる目
的のためにその全文を引用により組み入れる)。別の実施形態では、該cDNAもし
くはRNAプローブは検出可能な標識の不在下で合成して、その後で例えばビオチ
ン化dNTPもしくはrNTPを取り込ませることにより、またはある同様の手段(例え
ば、ビオチンのソラレン誘導体をRNAに光架橋すること)により標識し、続いて
標識化ストレプトアビジン(例えば、フィコエリスリン結合ストレプトアビジン
)もしくは同等物を添加することができる。
【0251】 蛍光標識化プローブを用いる場合、多くの適切な発蛍光団が知られており、例
えばフルオレセイン、リサミン、フィコエリスリン、ローダミン(Perkin Elmer Cetus)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、FluorX(Amersham)などが挙げ
られる(例えば、Kricka, 1992, Nonisotopic DNA Probe Techniques, Academic Press San Diego, CAを参照)。容易に区別できるように異なる発光スペクトル
を有する発蛍光団の対が選ばれることが理解されよう。
【0252】 別の実施形態では、蛍光標識以外の標識が用いられる。例えば、放射性標識ま
たは異なる発光スペクトルを有する1対の放射性標識が用い得る(Zhaoら, 1995
, High density cDNA filter analysis: a novel approach for large-scale, q
uantitative analysis of gene expression, Gene 156:207;Pietuら, 1996, No
vel gene transcripts preferantially expressed in human muscles revealed
by quantitative hybridization of a high density cDNA array, Genome Res.
6:492を参照)。しかし、放射性粒子が散乱すること、そしてそのために広く間
隔があいている結合部位が必要になるために、放射性同位体の使用はあまり好ま
しくない実施形態である。
【0253】 1つの実施形態において、標識したcDNAは、0.5mM dGTP、dATPおよびdCTPと0.
1mM dTTPと蛍光デオキシリボヌクレオチド[例えば0.1mM ローダミン110 UTP(P
erkin Elmer Cetus)または0.1mM Cy3 dUTP(Amersham)]とを含む混合物を逆
転写酵素(例えばSuperScriptTM II, LTI Inc.)と共に42℃で60分間インキュベ
ートすることにより合成される。
【0254】マイクロアレイへのハイブリダイゼーション 核酸ハイブリダイゼーションおよび洗浄条件は、該プローブが特定のアレイ部
位に「特異的に結合する」か、あるいは「特異的にハイブリダイズする」ように
、すなわち該プローブが相補的核酸配列を有する配列アレイ部位にハイブリダイ
ズ、二本鎖形成または結合するが、非相補的核酸配列を有する部位にはハイブリ
ダイズしないように選択される。本明細書中で用いられるように、ある1つのポ
リヌクレオチド配列が他に対して相補性であると考えられるのは、それらポリヌ
クレオチドの短い方が25塩基よりも短いか等しい場合に標準的な塩基対合ルール
を用いてミスマッチが全くない場合、またはそれらポリヌクレオチドの短い方が
25塩基よりも長い場合に5%以下のミスマッチがある場合である。好ましくは、
それらポリヌクレオチドは完全に相補性(ミスマッチが全くない)である。特定
のハイブリダイゼーション条件が特定のハイブリダイゼーションを引き起こすこ
とは、ネガティブコントロールを含むハイブリダイゼーションアッセイを行うこ
とにより容易に実証できる(例えば、Shalonら, 前掲,およびCheeら,前掲を参照
)。
【0255】 最適なハイブリダイゼーション条件は、標識化プローブおよび固定化ポリヌク
レオチドもしくはオリゴヌクレオチドの長さ(例えば、オリゴマーか、200塩基
よりも長いポリヌクレオチドか)およびタイプ(例えば、RNA、DNA、PNA)に応
じて決まる。核酸についての特定の(すなわち、ストリンジェントな)ハイブリ
ダイゼーション条件の一般的なパラメーターは、Sambrookら,前掲およびAusubel
ら, 1987, Current Protocols in Molecular Biology, Greene Publishing and
Wiley-Interscience, New York(あらゆる目的のためにその全文を引用により
組み入れる)に記載されている。SchenaらのcDNAマイクロアレイを用いる場合、
典型的なハイブリダイゼーション条件は、5×SSC+0.2% SDSにおいて65℃にて
4時間にわたりハイブリダイズした後、低ストリンジェンシー洗浄用緩衝液(1
×SSC+0.2% SDS)中で25℃にて、続いて高ストリンジェンシー洗浄用緩衝液(
0.1×SSC+0.2% SDS)中で25℃にて10分間洗浄することである(Shenaら, 1996
, Proc. Natl. Acad. Sci. USA, 93:10614)。有用なハイブリダイゼーション条
件はまた、例えばTijessen, 1993, Hybridization With Nucleic Acid Probes,
Elsevier Science Publishers B.V. およびKricka, 1992, Nonisotopic DNA Pro
be Techniques, Academic Press San Diego, CAにも提供されている。
【0256】シグナル検出およびデータ解析 蛍光標識したプローブを用いる場合、転写産物アレイの各部位における蛍光発
光は、好ましくは走査型共焦点レーザー顕微鏡法により検出できる。1つの実施
形態では、適切な励起線を用いて、用いる2種の発蛍光団の各々について別々の
スキャンを行う。あるいまたは、該2種の発蛍光団に特異的な波長における同時
試料照射を可能にするレーザーを用いてもよく、該2種の発蛍光団からの発光は
同時に分析できる(Shalonら, 1996, A DNA microarray system for analyzing
complex DNA samples using two-color fluorescent probe hybridization, Gen
ome Research 6:639-645を参照;これはあらゆる目的のためにその全文を引用に
より組み入れる)。好ましい実施形態では、該アレイは、コンピューター制御さ
れたX−Yステージおよび顕微鏡対物レンズを備えるレーザー蛍光スキャナーを
用いてスキャンされる。該2種の発蛍光団を順次励起させることは多重線混合気
体レーザー(multi-line, mixed gas laser)を用いて達成され、発光した光は
波長により分配され、2本の光倍増管を用いて検出される。蛍光レーザースキャ
ニング装置はSchenaら, 1996, Genome Res. 6:639-645および本明細書中で引用
している他の参考文献に記載されている。あるいまたは、Fergusonら, 1996, Na
ture Biotech. 14:1681-1684に記載の光ファイバー束を用いて、多数の部位にお
けるmRNAの存在量レベルを同時にモニターしてもよい。
【0257】 シグナルを記録し、好ましい実施形態では、例えば12ビットのアナログ-デジ
タルボードを用いてコンピューターにより解析する。1つの実施形態では、スキ
ャンした画像は、図形プログラム(例えば、Hijaak Graphics Suite)を用いて
スペックルを消し、次に各部位における各波長での平均ハイブリダイゼーション
のスプレッドシートを作成する画像グリッディングプログラム(image gridding
program)を用いて解析する。必要であれば、該2種の発蛍光団(fluors)のチャ
ンネル間の「クロストーク」(すなわちオーバーラップ)について実験的に求め
た補正を行ってもよい。転写産物アレイ上の任意の特定のハイブリダイゼーショ
ン部位について、該2種の発蛍光団間での発光の割合を算出することが好ましい
。この割合は、コグネート遺伝子の絶対的な発現レベルとは無関係であるが、そ
の発現が薬物投与、遺伝子欠失または任意の他の試験事象により有意に調節(mo
dulate)されている遺伝子については有用である。
【0258】 本発明の方法によれば、2種の細胞もしくは細胞系におけるmRNAの相対的存在
量は、摂動として評価されてその大きさを求めるか(すなわち、試験した該2種
のmRNA供給源間で存在量が異なる)、または摂動していないと評価される(すな
わち、相対的存在量は同じ)。本明細書中で用いられるように、該2種のRNA供給
源の間の差異が少なくとも約25%の係数(一方の供給源では他方の供給源よりも
供給源由来のRNAが25%だけ多い)のもの、さらに一般的には約50%の係数のも
の、さらに多くの場合には約2(2倍多い)、3(3倍多い)または5(5倍多
い)の係数のものが摂動として記録される。現在の検出方法は、約3倍から約5
倍のオーダーの差異という信頼性のある検出を可能にするが、さらに感度の高い
方法を開発することが期待される。
【0259】 好ましくは、摂動を正または負として同定することに加えて、摂動の大きさを
検出することが有利である。これは、上記で述べたように、差次標識(differen
tial labeling)に用いた2種の発蛍光団間の発光の割合を算出すること、また
は当業者に容易に明らかである類似の方法により行うことができる。相対的摂動
の大きさは、最も好ましくは、セクション5.2の方程式2で表わされる。
【0260】実験的測定の方法 本発明の1つの実施形態において、関心のある細胞の転写状態を反映する転写
産物アレイは、それぞれ関心のある異なる細胞のmRNAに対応する(相補的である
)2種の別々に標識したプローブの混合物をマイクロアレイにハイブリダイズす
ることにより作製される。本発明によれば、該2種の細胞は同じタイプのもの、
すなわち同じ種および株のものであるが、少数(例えば1つ、2つ、3つまたは
5つ、好ましくは1つ)の座において遺伝子的に異なるものであってもよい。あ
るいはまた、それらは同質遺伝子であって、かつそれらの環境的歴史が異なるも
の(例えば、薬物に暴露されたものなのか、薬物に暴露されていないものなのか
)である。
【0261】 本発明にしたがう実験を行うために、(関心のある生物学的系の)細胞を、ネ
ットワークモデルに入力された細胞構成成分の第1の状態の存在下およびこれら
の入力された細胞構成成分の第2の状態の存在下で調製または増殖させる。これ
らの状態は、該モデルを試験するのに選ばれた実験により求められる。典型的に
は、これらの状態としては、入力された細胞構成成分の特定のものについての改
変/摂動(例えば遺伝子欠失によるもの)、ならびに1種以上の薬物への暴露が
挙げられる。cDNA(またはmRNA)は、該2種の細胞から誘導され、該細胞の起源
に応じて別々に標識され、転写産物アレイを構築するのに用いられ、その転写産
物アレイを測定して、改変された発現を有するmRNAおよび該薬物への暴露による
改変の程度を求める。それにより、該細胞の本実験に対する応答が得られ、セク
ション5.2および5.2の方法で用いて、該ネットワークモデルの該細胞に対する全
体的な適合度(goodness of fit)およびその統計的な有意性が求められる。
【0262】 本発明の特定の実施形態では、段階的な薬物への暴露および改変/摂動調節パ
ラメーターの段階的なレベルの測定を行うことは有利である。これは、先にセク
ション5.1で記載したネットワークモデルの論理演算子の連続的解釈の場合に有
利である。それはまた、段階的な暴露および改変を用いて飽和レベルを明確に同
定する場合にも有利である。この場合、段階的薬物暴露および段階的摂動調節パ
ラメーターのレベルの密度は、個々の遺伝子応答における急峻さおよび構造によ
り決まる−すなわち、該応答の最も急峻な部分が急峻になる程、該応答を適切に
解析するのに必要なレベルが密になる。好ましくは、全範囲の100倍にわたって
6レベルから10レベルの摂動または暴露があることが、遺伝子発現応答を解析す
るのに丁度十分であった。しかし、この経路をより精細に表わすためには、より
暴露することが好ましい。
【0263】 さらに、実験誤差を低減するためには、二色差次的ハイブリダイゼーション実
験において蛍光標識を逆にして、個々の遺伝子またはアレイスポット位置に固有
のバイアスを低減することが好ましい。つまり、まず最初に1つの標識化のより
(例えば、第1の入力状態に暴露した細胞を第1の蛍光色素で標識し、第2の入力
状態に暴露した細胞を第2の蛍光色素で標識することにより)該2種の細胞から
のmRNAの遺伝子発現を測定し、次に逆に標識することにより(例えば、該第1の
入力状態に暴露した細胞を第2の蛍光色素で標識し、第2の入力状態に暴露した
細胞を第1の蛍光色素で標識することにより)該2種の細胞からの遺伝子発現を測
定することが好ましい。
【0264】 これらの入力状態を複数回測定することにより、実験誤差が追加的に示されて
調節される。さらに、段階的改変/摂動の場合には、暴露レベルおよび改変/摂
動調節パラメーターレベルについて複数回測定することにより、実験誤差がさら
に調節される。
【0265】転写状態測定の他の方法 細胞の転写状態は、当業界で公知の他の遺伝子発現技術により測定できる。幾
つかのそのような技術により、電気泳動分析について制約された複雑性を有する
制限断片のプールが得られ、例えば、二重制限酵素消化をフェージングプライマ
ーと組み合せた方法(例えば、欧州特許第0 534858 A1、1992年9月24日出願、Z
abeauらを参照)または規定したmRNA末端に最も近い部位を有する制限断片を選
択する方法(例えば、Prasharら, 1996, Proc. Natl. Acad. Sci. USA 93:659-6
63を参照)が挙げられる。他の方法はcDNAプールを統計的にサンプリングするも
のであり、これは例えば複数のcDNAの各々における十分な塩基(例えば、20〜50
塩基)の配列決定を行って各cDNAを同定すること、または規定したmRNA末端に対
して既知の位置で生じる短いタグ(例えば9〜10塩基)の配列決定を行うこと(例
えば、Velculescu, 1995, Science 270:484-487を参照)により行われる。
【0266】 経路パターン。
【0267】5.5.2.2. 他の局面の測定 本発明の種々の実施形態において、翻訳状態、活性状態または混合局面のよう
な転写状態以外の生物学的状態の局面(aspects)を、薬物応答および経路応答
を得る目的で測定することができる。これらの実施形態の詳細を本セクションで
説明する。
【0268】翻訳状態の測定に基づく実施形態 翻訳状態の測定は、幾つかの方法にしたがって行うことができる。例えば、タ
ンパク質の全ゲノム(すなわち、「プロテオーム(proteome)」, Goffeauら, 前
掲)のモニタリングは、結合部位が細胞ゲノムによりコードされる複数のタンパ
ク質種に特異的な固定化された(好ましくはモノクローナルの)抗体を含むマイ
クロアレイを構築することにより行うことができる。好ましくは、抗体は該コー
ドされたタンパク質の実質的画分、または少なくとも関心のある生物学的ネット
ワークモデルの試験または確認に関連するタンパク質について存在する。モノク
ローナル抗体の作製方法は周知である(例えば、HarlowおよびLane, 1988, Anti
bodies: A Laboratory Manual, Cold Spring Harbor, New Yorkを参照;これは
あらゆる目的のためにその全文を引用により組み入れる)。好ましい実施形態で
は、モノクローナル抗体は、該細胞のゲノム配列に基づいて設計された合成ペプ
チド断片に対して生起する。そのような抗体アレイを用いると、該細胞からのタ
ンパク質は該アレイに接触し、それらの結合が当業界で公知のアッセイによりア
ッセイされる。
【0269】 あるいはまた、タンパク質は、二次元ゲル電気泳動システムにより分離しても
よい。二次元ゲル電気泳動は当業界で周知であり、典型的には第1の次元に沿っ
た等電点電気泳動およびそれに続く第2の次元に沿ったSDS-PAGE電気泳動を含む
。例えば、Hamesら, 1990, Gel Electrophoresis of Proteins: A Pracitical A
pproach, IRL Press, New York;Shevchenkoら, 1996, Proc. Natl. Acad. Sci.
USA 93:1440-1445;Saglioccoら, 1996, Yeast 12:1519-1533;Lander, 1996, Science 274:536-539を参照されたい。得られる電気泳動図は多くの方法により
分析でき、例えば質量分光測定法、ウエスタンブロッティング、ポリクローナル
抗体およびモノクローナル抗体を用いたイムノブロッティング分析、ならびに内
部およびN末端ミクロシーケンシングが挙げられる。これらの方法を用いれば、
薬物に暴露した細胞内(例えば酵母内)または例えば特定の遺伝子の欠失もしく
は過剰発現により改変された細胞内などの所与の生理学的条件下で産生されるタ
ンパク質全ての実質的な画分を同定することが可能である。
【0270】生物学的状態の他の局面に基づく実施形態 mRNAの存在量以外の細胞構成成分のモニタリングでは、現在のところ、mRNAの
モニタリングでは生じない特定の技術的困難が出てくるが、当業者には、ネット
ワークモデルに入力される細胞構成成分を改変/摂動させる種々の公知の方法を
適用することを含む本発明の方法の使用が、モニターし得るどのような細胞構成
成分にも適用可能であることは明らかである。
【0271】 特に、薬物作用の特性決定に関連するタンパク質の活性が測定できる場合、本
発明の実施形態は、そのような測定に基づくものであり得る。活性の測定は、特
定の活性を特性決定するのに適切な任意の機能的、生化学的もしくは物理的手段
により行うことができる。活性が化学的形質転換に関与する場合、細胞性タンパ
ク質は天然の基質と接触させて、形質転換の速度を測定すればよい。活性が多量
体単位における結合(association)(例えば、活性化DNA結合性複合体とDNAと
の結合)に関与する場合、結合したタンパク質もしくは結合の二次的結果物の量
(例えば転写されたmRNAの量)を測定すればよい。また、(例えば細胞周期の調
節におけるように)機能的活性だけがわかっている場合、該機能の性能を観察す
ればよい。しかし、既知で測定されたタンパク質活性の変化は、本発明の前述の
方法により分析される応答データを形成する。
【0272】 別の非限定的な実施形態では、細胞の生物学的状態の混合局面の応答データを
形成することができる。応答データは、例えば特定のmRNAの存在量の変化、特定
のタンパク質の存在量の変化、および特定のタンパク質の活性の変化から構成さ
れ得る。
【0273】5.6. コンピュータによる実施 好ましい実施形態において、先の方法の計算工程は、生物学的系のネットワー
クモデルを形成しテストするための有力かつ簡便な設備を提供するために、コン
ピュータシステムまたは1つ以上のネットワーク化コンピュータシステムで実施
される。図11には、本発明の解析方法の実施に好適な典型的なコンピュータシス
テムを示す。コンピュータシステム1101は、内部コンポーネントを含み外部コン
ポーネントに連結されている単一のハードウェアプラットフォームとして示され
ている。このコンピュータシステムの内部コンポーネントは、メインメモリー11
03と内部連結されている処理エレメント1102を含む。例えば、コンピュータシス
テム1101は、クロック速度が200Mhzまたはそれ以上でありかつメインメモリーが
32MBまたはそれ以上であるIntel Pentiumをベースとするプロセッサーであって
もよい。
【0274】 外部コンポーネントには大容量記憶装置1104が含まれる。この大容量記憶装置
は1つ以上のハードディスクであってもよい(これらは典型的にはプロセッサー
およびメモリーと一緒にパッケージングされる)。典型的には、そのようなハー
ドディスクは、少なくとも1GBの記憶装置を提供する。他の外部コンポーネント
にはユーザーインターフェース装置105が含まれ、これはモニターおよびキーボ
ード、ならびに位置決め装置1106であってもよく、この位置決め装置は「マウス
」または他の図形入力装置(図示せず)であってもよい。典型的には、コンピュ
ータシステム1101はまた、他のローカルコンピュータシステム、リモートコンピ
ュータシステムまたは広域通信ネットワーク(例えばインターネット)にも連結
されている。このネットワーク連結により、コンピュータシステム1101が他のコ
ンピュータシステムとデータおよび処理タスクを共有できるようになる。
【0275】 このシステムを操作する際にメモリーにロードされるものは幾つかのソフトウ
ェアコンポーネントであり、これらは当業界で一般的なもの、および本発明に専
用なものの両者である。これらのソフトウェアコンポーネントは、本発明の方法
にしたがって該コンピュータシステムを全体的に機能させる。これらのソフトウ
ェアコンポーネントは典型的には大容量記憶装置1104に格納される。あるいはま
た、該ソフトウェアコンポーネントは、フロッピーディスクまたはCD-ROMのよう
な取り外し可能な媒体(図示せず)に格納されてもよい。ソフトウェアコンポー
ネント1110はオペレーティングシステムであり、これはコンピュータシステム11
01およびそのネットワーク相互接続を管理する役割を果たす。このオペレーティ
ングシステムは、例えば、Windows 95、Windows 98またはWindows NT のようなM
icrosoft Windowsファミリーのものであってもよいし、あるいはSun Solarisの
ようなUnixオペレーティングシステムのものであってもよい。ソフトウェアコン
ポーネント1111は共通言語、および本発明に特有の方法を実施するプログラムを
支援するためにこのシステムにうまい具合に存在している機能である。本発明の
解析方法をプログラムするのに用い得る言語としては、C、C++、またはあまり好
ましくはないがJAVAが挙げられる。最も好ましくは、本発明の方法は、アルゴリ
ズムを用いることを含む、方程式の記号によるエントリおよび高レベル仕様の処
理を可能にする数理的ソフトウェアパッケージでプログラムされ、このために、
ユーザーは個々の方程式またはアルゴリズムを手順としてプログラムする必要が
なくなる。そのようなパッケージとしては、例えばMathworks(Natuck, MA)製
のMatlab、Wolfram Research(Champaign, IL)製のMathematica、およびMathso
ft(Cambridge,MA)製のMathCADが挙げられる。ソフトウェアコンポーネント111
2は、手順言語または記号パッケージでプログラムされるような本発明の解析方
法である。
【0276】 好ましい実施形態において、該解析ソフトウェアコンポーネントは、実際には
、図12に示すような互いに相互作用する4つの別個のソフトウェアコンポーネン
トを含む。解析ソフトウェアコンポーネント1201は、該システムの操作に必要な
全てのデータを含むデータベースである。そのようなデータとしては一般に先の
実験の結果、ゲノムのデータ、実験の手順およびコスト、ならびに当業者には明
らかな他の情報が挙げられるが、必ずしもそれらに限定する必要はない。解析ソ
フトウェアコンポーネント1202は、第5.2節に記載のネットワークモデルをテス
トするための方法、第5.3節に記載のネットワークモデルの統計的有意性の決定
方法、および第5.4節に記載の有効な実験の選択方法などの、本発明の解析方法
を実行する1つ以上のプログラムを含む、データ整理および計算のコンポーネン
トである。解析ソフトウェアコンポーネント1203はユーザーインターフェース(
UI)であり、これは、該コンピュータシステムのユーザーに、テストネットワー
クモデルおよび場合によっては実験データーの制御および入力を提供する。この
ユーザーインターフェースは、該システムに仮説を指定するためのドラッグ・ア
ンド・ドロップインターフェースを含む。該ユーザーインターフェースは、大容
量記憶装置コンポーネント(例えばハードドライブ)からの、または取り外し可
能な媒体(例えばフロッピーディスクもしくはCD-ROM)からの、またはネットワ
ーク(例えばローカルエリアネットワーク、もしくはインターネットのような広
域通信ネットワーク)により本システムと通信している別のコンピュータシステ
ムからのネットワークモデルおよび/または実験データをロードするための手段
を含む。解析ソフトウェアコンポーネント1204は制御ソフトウェアであり、本明
細書中ではUIサーバーとも呼ばれており、これは該コンピュータシステムの他の
ソフトウェアコンポーネントを制御する。
【0277】 別の好ましい実施形態において、本発明のコンピュータシステムは、複数のハ
ードウェアプラットフォームを含み、それらはそれぞれ図11について上記したハ
ードウェアコンポーネント(例えば、メモリー、プロセッサー、等)を有する。
そのような実施形態では、上記した1つ以上の解析ソフトウェアコンポーネント
が該システムの別のハードウェアプラットフォームに設置されていてもよい。こ
の実施形態の典型的な実施を図13に示す。図13において、UIコンポーネントはMi
crosoft Windows NTワークステーション(1303)で作動しているリモートウエブ
ブラウザ(例えば、Netscape NavigatorまたはMicrosoft Internet Explorer)
から作動している。制御ソフトウェアコンポーネントはHTTPサーバー(1304)で
作動しており、このサーバーはC/C++および/またはJavaで書き込まれている特
殊化したソフトウェアと連動して作動する。この例におけるデータベースコンポ
ーネントは、Sun Solarisオペレーティングシステムを採用しているSunサーバー
(1301)で作動するOracleデータベースを含む。データの解析はMatlab(Mathwo
rks, Natick, MA)内で起こり、本発明のデータ解析方法および補正方法を実施
する特殊化Matlabプログラムと連動してWindows NTサーバー(1302)で実行する
【0278】 コンポーネント1302および1304は、インターネットのようなネットワークによ
り、TCP/IPベースのネットワークプロトコル(network procols)を用いて互い
に通信している。該データベースへの通信はSQLまたはその変形言語(variants
)に基づくものである。制御モジュール(1304)はTCP/IPによりデータ整理モ
ジュール(1302)と通信し、NFSなどによりファイルを共用する。制御ソフトウ
ェアはHTTPによりユーザーインターフェース(1303)と通信し、それに特殊化し
たJavaコードをダウンロードする。
【0279】 本発明の解析方法を実施するための別のシステムおよび方法は当業者には明ら
かであり、それらは添付の請求の範囲内であると理解すべきである。特に、添付
の請求の範囲は、当業者には容易に明らかである、本発明の方法を実施するため
の別のプログラム構造を包含するものである。
【0280】 典型的な実施においては、本発明の方法を実行するために、先に記載されてい
るコンピュータシステムは図10に示す詳細なプロセスを実施する。ステップ1001
において、最初のネットワークモデルがユーザーにより、好ましくは位置決め装
置1106を用いてアクセスされたグラフィカルユーザーインターフェースにより特
定される。このインターフェースは、ドラッグ・アンド・ドロップメタファーを
提供するようにプログラムされ、ユーザーが、コンピュータ画面上のネットワー
クコンポーネントを表わす図形アイコンを操作することによりネットワークモデ
ルをアセンブリできるようにする。図2B、3B、4Bおよび5Bはネットワークモデル
の可能性のある図形表現を示す。このインターフェースは、慣用で利用可能なグ
ラフィカルユーザーインターフェースであるAPI(アプリケーションプログラミ
ングインターフェース)のいずれかを用いてプログラムできる。例えば、実施は
、Java’s Abstract Windowing Toolkit、Tcl/Tk、Microsoft Foundation Class
esを用いるか用いないWin32、Macintoshユーザーインターフェース、またはMoti
fもしくはOpen Look Intrinsics Toolkit(OLIT)のような適切な小型装置(widg
et)ツールキットおよびユーザーインターフェース小型装置作製のためのXtツー
ルキットを用いるX-Windowsシステムにおいて行い得るだろう。
【0281】 ステップ1002において、実施プログラムは図形ネットワークモデルを、該ネッ
トワークモデルに入力される細胞構成成分と図形表示に相当する出力クラスとの
論理的な関係へと翻訳する。簡便な中間表示は先に説明し例示したようなブール
関係(Boolean relations)である。あるいはまた、ネットワークモデルを規定
する論理関係を直接入力してもよい。そのような模式的レイアウトからブール関
係への翻訳は、以下の幾つかのステップで進みうる:外部ノードの標識、内部ノ
ードの標識、および全ての連結したノード間の特定の論理演算子の記録。こうし
て構築されたデータ構造は実際には、ユーザーが回路記述を図形的に規定する時
点で生じ、コンピュータのメモリーおよびファイルシステムに格納され得る。さ
らに、視覚的回路設計プログラムはソフトウェアのサードパーティ供給元から容
易に入手可能であり、該供給元のツールを生体ネットワークを記述するプロセス
で利用することができる。Synario(MINC Inc., Colorado Springs, CO)のよう
なそうしたツールにより、論理ゲートネットワークのコンピュータ産業で標準的
な記述が、SPICEのネットワークリストまたはより網羅的なVHDL、Verilog、Abel
およびAlteraハードウェア記述言語のような種々の標準フォーマットで得られる
。該ソフトウェアは、そのようなツールの出力またはグラフィカルモデラーの出
力を用いて、必要なブール関係がプロセスのステップ1003および1004に送られる
ようにする。
【0282】 ステップ1003において、実施可能な実験が定められる。まず第1に、実施可能
な実験は、摂動の改変を実験的に可能な入力細胞構成成分に制限する制約条件に
より特定される。例えば、そのような制約条件としては、一回にたった1つの遺
伝子の欠失だけが可能であること、またはたった1種のみの薬物に暴露すること
が可能であること、を挙げることができる。第2に、その実施可能な実験の条件
についてのコストを割り当てる。例えば、希少(rate)で高価な薬物または遺伝
子欠失を実施する労力のコストがこれらのコストを割り当てる上で考え得る。こ
れらのコストは、所望のネットワーク出力クラスを識別するのに最適な実験セッ
トを選択する過程で考慮される種々の選択肢を比較検討するのに用いられる。
【0283】 ステップ1004において、有効かつ完全な実験セットは、第5.4節の方法にした
がって誘導され、詳細は上記に示してある。これらの実験は、ステップ1003で入
力される制約条件を満足するので、実施可能である。それらは、全ての出力クラ
スを識別できるという点において完全である。最後に、それらは、先に入力され
たコストに基づいて目的の関数(function)を最小限に抑えるという点において
効果的である。
【0284】 ステップ1005において、選択された実験を実験室で行って測定データを得て、
これをコンピュータ記憶装置に入力する。このデータは典型的には大容量記憶装
置に格納されるか、または他のネットワークを付加したコンピュータシステム上
に大容量記憶装置をアセンブリする。あるいはまた、該データはフロッピーディ
スクまたはCD-ROMのような取り外し可能な媒体に格納してもよい。
【0285】 最後に、ステップ1006において、第5.2節および第5.3節に記載の方法を行って
、ステップ1005で入力された実験データに対するネットワークモデルの全体的な
適合度、ならびにその全体的な適合度の統計的有意性の両者を得る。この方法は
、Matlab(Mathworks, Natick, MA)またはS-Plus(Mathsoft, Cabridge, MA)
のような統計的解析用の市販のソフトウェアパッケージにおいて一連の関数とし
て実施してもよい。あるいはまた、クリティカルパスでの種々の手順をC/C++の
ようなプログラミング言語で記述してもよい。制御およびサーバーソフトウェア
はまたC/C++またはJavaのような言語で個別に記述されてもよい。
【0286】 該システムは、図12および13を参照して上記で記載したコンポーネントにおい
て実施されるので、各コンポーネントが独立したモジュール方式でスケーラブル
な様式で操作できるように設計される。各コンポーネントは、互いに同一または
異なるソフトウェアで作動する。そのような設計により、解決すべき問題の大き
さおよび複雑さが増大するにしたがって、および新しいハードウェアおよびソフ
トウェアが入手可能になるにしたがって、該システムがスケールアップされるよ
うになる。
【0287】 ステップ1006で求めた結果は、簡便なフォーマット(好ましくは図的フォーマ
ット)でユーザーに出力され、将来的に参照するために、ハードドライブまたは
取り外し可能な媒体(例えばフロッピーディスクまたはCD-ROM)のような大容量
記憶装置に格納してもよい。少なくとも全体的な適合度およびその有意性が出力
される。好ましくは、ユーザーが選択した細胞構成成分に最も良く適合する出力
クラスも出力される。さらに、任意の中間計算ステップからのデータも場合によ
っては格納し出力できる。例えば、実験的に求めた適合度値のヒストグラムは、
好ましくはユーザーの要求があり次第表示できる。
【0288】 場合により、元のネットワークモデルは、さらなるネットワークモデルを得る
ために、ステップ1007において、先の結果を考慮して洗練され(refine)、次に
これを先のステップ1002〜1006にしたがってテストし確認することができる。こ
のさらなるネットワークモデルが元のネットワークモデルよりも高い有意性を有
することが判明した場合、それは洗練され向上したモデルとして受け入れること
ができる。第5.1節および第5.2節で記載したように、このプロセスを繰り返して
、徐々に洗練され向上したモデルを得ることができる。
【0289】6. 実施例 先に記載の本発明を説明するために以下の実施例を示すが、これらの実施例は
その記載を限定するものではない。
【0290】 図7Aは、酵母細胞における観察および測定に合致した、免疫抑制に関連する生
物学的ネットワークモデルを示す。このネットワークモデルの入力した細胞構成
成分は、2種の免疫抑制性薬物であるFK506[タクロリマス(tacrolimus)とし
ても知られている]およびシクロスポリンA(本明細書中ではCyAと呼ぶ)、なら
びにタンパク質(またはコード遺伝子)であるfpr(FK506結合性タンパク質)、
cna(カルシニューリンタンパク質)およびcph(CyA結合性タンパク質)である
。出力クラスは1、2、3、4、5、6および7と名付ける。図7Aは、演算子の
論理構造を示す(ノード標識cnaはAND演算子である)。ネットワーク有意性のP
値は後で説明する。
【0291】 哺乳動物において、FK506およびCyAは、該ネットワークモデルの構造と類似す
る構造の別々の、しかし相近する経路を経由してcnaの機能を抑制するように作
用することが知られている。cnaタンパク質はT細胞活性化核因子(NF-AT)の核
への移動を可能にするのに必要であり、カルシニューリンを抑制することにより
、抗原に応答してT細胞の増殖が抑制され、免疫応答が抑制される。中間体であ
るfprタンパク質およびcphタンパク質は、その正常な機能が正確なタンパク質フ
ォールディングを含むプロリンイソメラーゼであるイムノフィリンである。これ
らの薬物は、それらの各々に結合しcnaに対して抑制的なタンパク質と複合体を
形成し、生来のタンパク質のフォールディング機能を行うことができない。
【0292】 酵母では(これからもデータを得た)、同族の(homologous)タンパク質を有す
るほぼ同様の経路が存在する。しかし、cna同族体は因子接合停止からの回復に
必要である。
【0293】 図7Bは、図7Aのネットワークモデルから誘導した標準化していない影響マトリ
ックス(influence matrix)を示す。この影響マトリックスから、細胞構成成分
の変化の方向が後続の実験から決定できると考えられる。実施可能な実験は、単
一の遺伝子欠失を有する細胞を野生型の細胞(以下、「WT」という)と比較する
ものに限定され、そこにおいて、FK506またはCyAに暴露された細胞をそのように
暴露されなかった細胞と比較し、薬物暴露の比較は単一の遺伝子欠失を有する細
胞において行った。
【0294】 このネットワークモデルに生来関連しているそのような実施可能な実験の実験
対が12あった。これらの実験は、影響マトリックスの見出しに述べてある。この
影響マトリックスの7つの列は、このネットワーク仮説により規定される7種の
出力クラスに相当する。
【0295】 詳細に説明すると、例えば、「WT対WT」の実験は対照実験であり、そこにおて
、摂動状態および非摂動状態の両者とも同じ野生型の株であり、したがって、そ
こにおいてはどのような細胞構成成分の変化も全く観察されないと予期された。
他の実験は適当に名付けた。例えば、「+/-FK506(-cna)」と名付けた実験は、
cna遺伝子が欠失しておりFK506に暴露した細胞とcna遺伝子は欠失しているがFK5
06には暴露していない細胞との比較を意味する。この特定の実験は、cnaタンパ
ク質がなかったために、出力クラス4(cnaの影響に該当するクラス)において
全く変化を生じなかった。したがって、このカラムの第4列目は「0」である。F
K506(タクロリマス)への暴露は出力クラス1、2および3に影響を及ぼし、こ
れらの全てはFK506により影響を受けた。FK506に暴露した細胞をそのように暴露
しなかった細胞と比較すると、出力クラス1では薬物の作用の損失があり、した
がって非標準化影響マトリックスにおいて「−1」をエントリーする。出力クラ
ス2では、fprタンパク質については薬物の抑制の損失があり、したがって「1
」をエントリーする。出力クラス3では、薬物−タンパク質複合体の作用の損失
があり、したがって「−1」をエントリーする。
【0296】 図7Aのネットワークモデルをテストするのに用いるデータは、図7Bのマトリッ
クスの見出しに記載されている比較の対が関与する12の実験からなるものであっ
た。これらのデータは、第5.5.2節の方法にしたがって、酵母Saccharomyces cer
evisiaeのcDNAサンプルの、該酵母ゲノムの6249の発現遺伝子全部を含むcDNA転
写産物アレイへの二色蛍光ハイブリダイゼーションから得た。実験的比較の各対
については、集めたデータは、その6249の遺伝子の各々についての発現レベルの
対からなるものであった。このゲノム広域発現データから、140の発現遺伝子の
サブセットが選択され、これらはこの12種の実験のうちの少なくとも2種におい
て、係数2よりも大きな変化を有するという敷居値(threshold)を越えていた。
各実験におけるこれら140の選択した遺伝子の各々に関するこの2種の存在量測
定を用いて、第5.2節にしたがって変化の尺度xを得た。全体的な適合度もまた
第5.2節にしたがって比較したが、これには、図7Bの非標準化影響マトリックス
を標準化すること、および前記の140の選択した遺伝子の各々に関して7種の出力
クラスの中から最も良く適合する出力クラスを見つけることが含まれる。酵母発
現データに対する図7Aのネットワークモデルの適合度(140の選択した遺伝子に
ついての個々の適合度値の合計)は360であることがわかった。
【0297】 この適合度の統計的有意性は第5.3節の方法にしたがって試験した。140の選択
した遺伝子の各々について、12種の実験から得られた12個のxの値をランダムに
順番を入れ替えた。それによって、前記モデルと前記データとの相関関係がラン
ダム化された。このランダム化は、各遺伝子ごとに別々に行った。そのようなデ
ータのランダム化の各々および各遺伝子について最も良く適合する出力クラスを
再決定し、それぞれのデータランダム化について全体的な適合度を再決定した。
これらのランダム化および再決定を1000回繰り返し、得られた適合度値をヒスト
グラムとしてプロットした。
【0298】 図8は、得られたヒストグラムを示す。横軸には適合度値をプロットし、縦軸
には1000回のランダム化においてそれぞれの適合度値が見出された回数をプロッ
トしてある。したがって、このヒストグラムは、ネットワークモデルが観察され
たデータと全く関係がないという帰無仮説下での適合度値の確率分布であった。
その場合、この分布に関して、実際に見られた適合度の位置360(矢印801で示さ
れる)はこの帰無仮説の確率であった。2.4%のランダムな適合度値は、実際に
見られた適合度のものよりも大きかったので、P値は0.024である。したがって
、図7Aのネットワークモデルは、酵母の挙動と有意に相関していると結論付けら
れた。
【0299】 洗練されたモデルを検索するために、幾つかの別のネットワークモデルをテス
トした。第1の別のネットワークモデルでは、CyAからcnaタンパク質への連結701
を加えた。この第1の別のものについて全体的な適合度値を上記のようにして求
めた。求められたP値は0.030であった。このことから、元のネットワークモデ
ルとこの第1の別のネットワークモデルが実質的に同じように有意であることが
示された。
【0300】 第2の別のネットワークモデルでは、fprタンパク質からcnaタンパク質への連
結702を行い、この第2の別のものについての全体的な適合度値を上記のようにし
て求めた。求められたP値は0.307であった。このことから、この第2の別のネ
ットワークモデルが酵母のデータを説明する上で実質的に全く有意性を持たず、
したがって前のネットワークモデルと比較して向上していないことが示された。
【0301】 これらの別のネットワークモデルと元のネットワークモデルとの比較から、P
値を用いることにより選択肢であるネットワークモデル間での正確な選択が可能
になることが示される。
【0302】 さらに、第5.2節で記載されているように、選択された140の遺伝子のうちの個
々のものが最も良好に適合する出力クラスに割り当てられた。図7A〜Bに示す7
つのクラスがある。例えば、出力クラス2および3はFK506の「副作用」つまり
「対象外(off-target)」の作用と考えることができ、出力クラス4は目的とす
るFK506の「主要」な作用、つまり「対象」となる作用であった。第5.2節の最も
良く適合する方法をこのデータに適用したところ、出力クラス4がカルシニュー
リン依存的な方法で調節されることがわかっている多くの遺伝子の有意に最も良
く適合するクラスであることが示された。
【0303】7. 引用文献 本明細書中で引用した全ての参考文献は、それぞれの刊行物または特許または
特許出願があらゆる目的のためにその全文が引用により組み入れられると明確か
つ個別に示されているのと同程度に、それらの全文をあらゆる目的のために引用
により本明細書に組み入れるものとする。
【0304】 当業者であれば理解するように、本発明の精神および範囲から逸脱することな
しに本発明の多くの変更および改変を行うことが可能である。本明細書中に記載
されている具体的な実施形態は単に例示のために示されているにすぎず、本発明
は添付の請求の範囲の条項、ならびにそのような請求の範囲の権利が与えられる
等価物の全範囲によってのみ限定されるものである。
【図面の簡単な説明】
【図1】 図1は、本発明によるネットワーク仮説のテストの一般的な方法を図示する。
【図2】 図2A-Bは、本発明による第一の典型的なネットワークモデルを図示する。
【図3】 図3A-Cは、本発明による第二の典型的なネットワークモデルを図示する。
【図4】 図4A-Bは、本発明による第三の典型的なネットワークモデルを図示する。
【図5】 図5A-Bは、本発明による第四の典型的なネットワークモデルを図示する。
【図6】 図6は、本発明による典型的なフィードバック制御ネットワークモデルを図示
する。
【図7】 図7Aは、免疫抑制剤FK506およびシクロスポリンAに関連する典型的なネットワ
ークモデルを図示する。 図7Bは、図7Aのネットワークモデルに関する非標準化影響マトリックスを図
示する。
【図8】 図8は、本発明の方法によって決められた適合度の棒グラフを示す。
【図9】 図9は、ネットワークモデルをテストおよび確認する実験の選択を図示する。
【図10】 図10は、本発明の方法の実行を図示する。
【図11】 図11は、一つのハードウェアプラットフォームに構成部品を全て内蔵した本発
明のコンピュータシステムの典型的な実施形態を図示する。
【図12】 図12は、本発明のコンピュータシステムの分析ソフトウェア構成部品の好まし
い実施形態を概略的に図示する。
【図13】 図13は、分析ソフトウェア構成部品を分離ハードウェアプラットフォームに内
蔵した本発明のコンピュータシステムの典型的な実施形態を図示する。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) //(C12Q 1/06 C12R 1:865) C12R 1:865) C12N 15/00 F (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,UG,ZW),E A(AM,AZ,BY,KG,KZ,MD,RU,TJ ,TM),AE,AL,AM,AT,AU,AZ,BA ,BB,BG,BR,BY,CA,CH,CN,CU, CZ,DE,DK,EE,ES,FI,GB,GD,G E,GH,GM,HR,HU,ID,IL,IN,IS ,JP,KE,KG,KP,KR,KZ,LC,LK, LR,LS,LT,LU,LV,MD,MG,MK,M N,MW,MX,NO,NZ,PL,PT,RO,RU ,SD,SE,SG,SI,SK,SL,TJ,TM, TR,TT,UA,UG,UZ,VN,YU,ZA,Z W (72)発明者 カープ,リチャード,エム. アメリカ合衆国 98105 ワシントン州, シアトル,ノースイースト ウィンダーメ ア ロード 6530 Fターム(参考) 2G045 AA40 CB01 CB21 DA12 DA13 DA14 DA36 FB02 FB03 JA01 4B024 AA11 AA20 BA80 4B063 QA01 QA13 QQ02 QQ07 QQ09 QQ53 QR55 QS34

Claims (53)

    【特許請求の範囲】
  1. 【請求項1】 あるネットワークモデルを生物学的系においてテストまたは
    確認する方法であって、 (a) 複数の実測相対変化のそれぞれが、複数の規定相対変化のそれぞれといか
    にうまく適合しているかを判定するステップ、ここで、前記規定相対変化は、あ
    るネットワークモデルに対する標準化影響マトリックス(influence matrix)によ
    り得られるものであり、前記ネットワークモデルは、 (i) 複数の入力構成要素であって1以上の前記入力構成要素の摂動(perturb
    ation)が入力状態を含んでいるもの、 (ii) 出力状態と関連した挙動の複数の出力クラス、および (iii) 前記入力状態と前記出力状態との間の論理関係であって、それにより
    前記出力状態が前記論理関係にしたがって前記入力状態に依存するもの を含んでなり、 前記標準化影響マトリックスは、第1の入力状態から第2の入力状態までの各
    出力クラスの前記規定相対変化を規定するものであり、 前記実測相対変化は、第1の入力状態から第2の入力状態までの1以上の細胞
    構成要素の相対変化を測定することを含む1以上のネットワークテスト実験で得
    られたデータから与えられるものである; (b) 前記の各細胞構成要素を特定の出力クラスに割り当てるステップ、ここで
    、各細胞構成要素は、前記細胞構成要素の実測相対変化と最も適合する規定相対
    変化を有する出力クラスに割り当てられる;ならびに (c) 前記データの前記ネットワークモデルに対する全体的な適合度を確定する
    ステップ を含んでなり、 それによって前記ネットワークモデルが前記全体的適合度によりテストまたは
    確認されるものである、前記方法。
  2. 【請求項2】 前記の各実測相対変化が前記の各規定相対変化といかにうま
    く適合しているかを判定する前記ステップが、前記の各実測相対変化と前記の各
    規定相対変化との差の目的尺度(objective measure)の値を確定することを含む
    、請求項1に記載の方法。
  3. 【請求項3】 (i) 前記の各実測相対変化が前記の各規定相対変化といかに
    うまく適合しているかを判定する前記ステップが、前記各細胞構成要素について
    の適合度を確定することを含んでなり、ここで、前記適合度は前記細胞構成要素
    の前記実測相対変化についての前記目的尺度の最大値であり、そして (ii) 前記全体的適合度が、各細胞構成要素の前記適合度値を組み合わせるこ
    とにより得られるものである、 請求項2に記載の方法。
  4. 【請求項4】 (i) 全体的適合度値の期待確率分布(expected probability
    distribution)を得ること、および (ii) 前記期待確率分布を考慮して前記全体的適合度の統計学的有意性を評価
    すること を含む方法によって前記全体的適合度の有意性を評価するステップをさらに含む
    、請求項3に記載の方法。
  5. 【請求項5】 前記期待確率分布が、 (i) 前記細胞構成要素に関して前記実測相対変化をランダム化すること; (ii) 前記細胞構成要素の前記ランダム化された実測相対変化について前記目
    的尺度の最大値を確定することにより、前記各細胞構成要素についての「ランダ
    ム化された」適合度値を確定すること; (iii) 前記各細胞構成要素の前記ランダム化された適合度値を組み合わせるこ
    とにより、全体的ランダム化適合度値を確定すること;および (iv) ステップ(i)〜(iii)を繰り返して複数の全体的ランダム化適合度値を確
    定すること を含んでなる方法により得られ、 それによって前記複数のランダム化された適合度値が、全体的適合度値の前記
    期待確率分布を含むものである、 請求項4に記載の方法。
  6. 【請求項6】 (i) 前記各細胞構成要素について確定された前記適合度が、
    前記細胞構成要素の前記実測相対変化を観察する最大尤度(maximum likelihood)
    を含み、 (ii) 前記全体的適合度が前記最大尤度の積(product)により得られる、 請求項3に記載の方法。
  7. 【請求項7】 最尤法にしたがって別のネットワークモデルの統計学的有意
    性を評価するステップをさらに含む、請求項1に記載の方法。
  8. 【請求項8】 前記標準化影響マトリックスにより確定された前記相対変化
    が相対変化の有無の指標(indication)を含む、請求項1に記載の方法。
  9. 【請求項9】 前記標準化影響マトリックスにより確定された前記相対変化
    が、相対変化の有無および変化の相対方向の指標を含む、請求項1に記載の方法
  10. 【請求項10】 前記標準化影響マトリックスにより確定された前記相対変
    化が、相対変化が無いことまたは相対的な増加もしくは減少の指標を含む、請求
    項1に記載の方法。
  11. 【請求項11】 前記標準化影響マトリックスが、(i) 出力クラスの挙動を
    規定する前記標準化影響マトリックスの全エレメントの平均がゼロであるように
    、かつ(ii) 出力クラスの挙動を規定する前記標準化影響マトリックスの全エレ
    メントの平方和が、任意のその他の出力クラスの挙動を規定する前記標準化影響
    マトリックスの全エレメントの平方和と同じ値をもつように標準化される、請求
    項1に記載の方法。
  12. 【請求項12】 前記目的尺度が、前記出力クラスのうちの1つについての
    前記標準化影響マトリックスにおいて、前記細胞構成要素の前記実測相対変化と
    前記細胞構成要素の前記規定相対変化との相関を含む、請求項2に記載の方法。
  13. 【請求項13】 前記目的尺度が前記相関の絶対値を含む、請求項12に記
    載の方法。
  14. 【請求項14】 前記相関が、前記出力クラスのうちの1つについての前記
    標準化影響マトリックスにおいて、前記細胞構成要素の前記実測相対変化の絶対
    値と前記細胞構成要素の前記規定相対変化の絶対値を相関させることを含む、請
    求項10に記載の方法。
  15. 【請求項15】 実測相対変化を用いて各細胞構成要素について見出された
    前記適合度値を組み合わせて全体的適合度を得ることが、実測相対変化を用いて
    各細胞構成要素について見出された前記適合度値を加えることを含む方法により
    行われる、請求項3に記載の方法。
  16. 【請求項16】 細胞構成要素の前記実測相対変化が、期待加法的測定誤差
    (expected additive measurement error)および期待乗法的測定誤差(expected m
    ultiplicative measurement error)により標準化される、請求項1に記載の方法
  17. 【請求項17】 前記実測相対変化をランダム化する前記ステップが、摂動
    により行われる、請求項5に記載の方法。
  18. 【請求項18】 ステップ(a)の前に、 (i) 入力状態の被覆集合(covering set)を確定すること、ここで、入力状態の
    被覆集合は、任意の出力クラスの対に関し、前記出力クラスの対を区別する入力
    状態を含む;ならびに (ii) 前記ネットワークテスト実験を、入力状態の対の被覆集合によって規定
    されるネットワークテスト実験を含むように選択すること、ここで、入力状態の
    対の被覆集合は、任意の出力クラスの対に関し、前記出力クラスの対を区別する
    前記入力状態の被覆集合から選択される入力状態の対を含む を含んでなる方法により前記ネットワークテスト実験を選択するステップをさら
    に含む、請求項1に記載の方法。
  19. 【請求項19】 前記入力状態の被覆集合における入力状態が、前記出力ク
    ラスの対が異なる挙動を有する前記被覆集合において少なくとも1つの入力状態
    が存在する場合であって、さらに前記出力クラスの対が同一の挙動を有する前記
    被覆集合において少なくとも1つの入力状態が存在する場合に、出力クラスの対
    を区別するものである、請求項18に記載の方法。
  20. 【請求項20】 前記入力状態の被覆集合の選択が、分枝限定アルゴリズム
    の使用を含む方法によって線形整数計画法の問題を解くことを含む方法により行
    われ、ここで、 (a) 前記線形整数計画法の問題が前記入力状態の被覆集合を表すものであり、
    そして (b) 前記線形整数計画法の問題が各出力クラスの不等式の対を含み、前記不等
    式の対が、 (i) 前記出力クラスの対が異なる挙動を有する全入力状態を表す第1の不等
    式、および (ii) 前記出力クラスの対が同一の挙動を有する全入力状態を表す第2の不
    等式 からなる、 請求項19に記載の方法。
  21. 【請求項21】 前記入力状態が、割り当てられた個々の実験コストであり
    、前記線形整数計画法の問題を解くことが、前記入力状態の被覆集合において全
    入力状態の前記コストの合計を最小化するものである、請求項20に記載の方法
  22. 【請求項22】 入力状態の対の前記被覆集合における入力状態の対が、 (i) 入力状態の対の前記被覆集合が、前記出力クラスの対が前記入力状態の対
    のうちの一方のメンバーである入力状態において挙動(0,0)を有し、前記入力状
    態の対のうちの他方のメンバーである入力状態において挙動(1,0)を有するよう
    な入力状態の対を含む場合、または (ii) 前記入力状態の対の被覆集合が、前記出力クラスの対が前記入力状態の
    対のうちの一方のメンバーである入力状態において挙動(1,0)を有し、前記入力
    状態の対のうちの他方のメンバーである入力状態において挙動(1,1)を有するよ
    うな入力状態の対を含む場合、または (iii) 前記入力状態の対の被覆集合が、前記出力クラスの対が前記入力状態の
    対のうちの一方のメンバーである入力状態において挙動(1,1)を有し、前記入力
    状態の対のうちの他方のメンバーである入力状態において挙動(0,1)を有するよ
    うな入力状態の対を含む場合、または (iv) 前記入力状態の対の被覆集合が、前記出力クラスの対が前記入力状態の
    対のうちの一方のメンバーである入力状態において挙動(0,1)を有し、前記入力
    状態の対のうちの他方のメンバーである入力状態において挙動(0,0)を有するよ
    うな入力状態の対を含む場合、または (v) 前記入力状態の対の被覆集合が、前記出力クラスの対が前記入力状態の対
    のうちの一方のメンバーである入力状態において挙動(0,0)を有し、前記入力状
    態の対のうちの他方のメンバーである入力状態において挙動(1,1)を有するよう
    な第1の入力状態の対、ならびに前記出力クラスの対が前記入力状態の対のうち
    の一方のメンバーである入力状態において挙動(0,1)を有し、前記入力状態の対
    のうちの他方のメンバーである入力状態において挙動(1,0)を有するような第2
    の入力状態の対を含む場合に、 出力クラスの対を区別するものである、請求項18に記載の方法。
  23. 【請求項23】 前記選択されたネットワークテスト実験を規定する前記入
    力状態の対の被覆集合が、分枝限定アルゴリズムの使用を含む方法によって線形
    整数計画法の問題を解くことを含む方法により選択され、ここで、 (a) 前記線形整数計画法の問題が前記入力状態の対の被覆集合を表すものであ
    り、そして (b) 前記線形整数計画法の問題が各出力クラスの対についての不等式を含み、
    前記不等式は、前記出力クラスの対が異なる挙動を有する入力状態の対全てを表
    すものである、 請求項22に記載の方法。
  24. 【請求項24】 前記生物学的系が1以上の酵母細胞を含む、請求項1に記
    載の方法。
  25. 【請求項25】 前記酵母が、サッカロミセス・セレビシエ(Saccharomyces
    cerevisiae)株である、請求項24に記載の方法。
  26. 【請求項26】 前記入力構成要素が1種以上の薬剤を含み、前記1種以上
    の薬剤の前記摂動が、前記1種以上の薬剤のうちの1種以上の不在と、前記1種
    以上の薬剤のうちの1種以上に曝すことを含む、請求項1に記載の方法。
  27. 【請求項27】 前記細胞構成要素が、前記生物学的系に存在する複数のRN
    A種の存在量を含む、請求項1に記載の方法。
  28. 【請求項28】 前記複数のRNA種の存在量が、遺伝子転写産物アレイを、
    前記生物学的系由来のRNAまたは前記RNAから誘導されたcDNAと接触させることを
    含む方法により測定され、ここで、遺伝子転写産物アレイは、核酸または核酸模
    擬体が結合した表面を含んでなり、前記核酸または核酸模擬体は前記複数のRNA
    種または前記RNA種から誘導されたcDNAとハイブリダイズ可能なものである、請
    求項27に記載の方法。
  29. 【請求項29】 前記の1種以上のネットワークテスト実験の実施が、1種
    以上の遺伝子転写産物アレイを、前記入力状態の前記第1のものに曝される前記
    生物学的系由来のRNAまたは前記RNAから誘導されたcDNA、ならびに前記入力状態
    の前記第2のものに曝される前記生物学的系由来のRNAまたは前記RNAから誘導さ
    れたcDNAと接触させることを含む、請求項28に記載の方法。
  30. 【請求項30】 前記細胞構成要素が、前記生物学的系に存在する複数のタ
    ンパク質種の存在量を含む、請求項1に記載の方法。
  31. 【請求項31】 前記複数のタンパク質種の存在量が、抗体アレイを前記生
    物学的系由来のタンパク質と接触させることを含む方法により測定され、ここで
    、前記抗体アレイは抗体が結合された表面を含んでなり、前記抗体は前記複数の
    タンパク質種と結合可能なものである、請求項30に記載の方法。
  32. 【請求項32】 前記複数のタンパク質種の存在量が、前記生物学的系由来
    のタンパク質の二次元電気泳動の実施を含む方法により測定される、請求項30
    に記載の方法。
  33. 【請求項33】 前記細胞構成要素が、前記生物学的系に存在する複数のタ
    ンパク質種の活性を含む、請求項1に記載の方法。
  34. 【請求項34】 前記1種以上の入力構成要素の摂動が、前記1種以上の入
    力構成要素を変更することを含む方法により生起される、請求項1に記載の方法
  35. 【請求項35】 前記1種以上の入力構成要素が、前記入力構成要素をコー
    ドする遺伝子を欠失させることを含む方法により変更される、請求項34に記載
    の方法。
  36. 【請求項36】 前記1種以上の入力構成要素が、制御可能な発現系の制御
    下で前記1種以上の入力構成要素の発現を引き起こすことを含む方法により変更
    される、請求項34に記載の方法。
  37. 【請求項37】 前記1種以上の入力構成要素が、前記1種以上の入力構成
    要素を発現する遺伝子の制御可能なトランスフェクションを含む方法により変更
    される、請求項34に記載の方法。
  38. 【請求項38】 前記1種以上の入力構成要素が、前記生物学的系における
    前記1種以上の入力構成要素をコードするRNA種の存在量を制御可能な様式で減
    少させることを含む方法により変更される、請求項34に記載の方法。
  39. 【請求項39】 前記RNA種の存在量を制御可能な様式で減少させる前記方
    法が、前記生物学的系を、前記RNA種の切断を標的とするリボザイムに曝すこと
    を含む、請求項38に記載の方法。
  40. 【請求項40】 前記1種以上の入力構成要素が、前記生物学的系において
    前記1種以上の入力構成要素をコードするRNA種の翻訳速度を制御可能な様式で減
    少させることを含む方法により変更される、請求項34に記載の方法。
  41. 【請求項41】 RNA種の翻訳速度を制御可能な様式で減少させる前記方法
    が、前記生物学的系を、前記RNA種または前記RNA種をコードするDNAにハイブリ
    ダイズするアンチセンス核酸またはアンチセンス核酸模擬体に曝すことを含む、
    請求項40に記載の方法。
  42. 【請求項42】 前記1種以上の入力細胞構成要素がタンパク質種の存在量
    またはタンパク質種の活性であり、前記1種以上の入力構成要素が、前記生物学
    的系において前記存在量の1以上を制御可能な様式で減少させることを含む方法
    により変更される、請求項34に記載の方法。
  43. 【請求項43】 前記存在量の1以上を制御可能な様式で減少させる前記方
    法が、前記生物学的系において、前記タンパク質種の1種以上の、前記タンパク
    質種とデグロン(degron)とを含む融合タンパク質としての発現を引き起こすこと
    を含み、前記デグロンは前記タンパク質種の分解速度を増大するように制御可能
    である、請求項42に記載の方法。
  44. 【請求項44】 前記1種以上の入力構成要素がタンパク質種の活性であり
    、前記1種以上の入力構成要素が前記生物学的系において前記活性を制御可能な
    様式で減少させることを含む方法により変更される、請求項34に記載の方法。
  45. 【請求項45】 前記活性を制御可能な様式で減少させる前記方法が、前記
    生物学的系を抗体に曝すことを含み、前記抗体が前記タンパク質種に結合するも
    のである、請求項44に記載の方法。
  46. 【請求項46】 前記活性を制御可能な様式で減少させる前記方法が、前記
    生物学的系を、前記タンパク質種の前記活性を直接且つ特異的に阻害する薬剤に
    曝すことを含む、請求項44に記載の方法。
  47. 【請求項47】 前記活性を制御可能な様式で減少させる前記方法が、前記
    生物学的系を、ドミナントネガティブ突然変異タンパク質種に曝すことを含み、
    前記ドミナントネガティブ突然変異タンパク質種が前記活性を阻害するタンパク
    質である、請求項44に記載の方法。
  48. 【請求項48】 あるネットワークモデルを生物学的系においてテストまた
    は確認するためのコンピュータシステムであって、前記コンピュータシステムは
    プロセッサーと前記プロセッサーに連結されたメモリーとを含んでなり、前記メ
    モリーには1種以上のプログラムがコード化されており、前記1種以上のプログ
    ラムは、前記プロセッサーに、下記のステップ: (a) 複数の実測相対変化のそれぞれが、複数の規定相対変化のそれぞれといか
    にうまく適合しているかを判定するステップ、ここで、前記規定相対変化は、あ
    るネットワークモデルに対する標準化影響マトリックス(influence matrix)によ
    り得られるものであり、前記ネットワークモデルは、 (i) 複数の入力構成要素であって1以上の前記入力構成要素の摂動(perturb
    ation)が入力状態を含んでいるもの、 (ii) 出力状態と関連した挙動の複数の出力クラス、および (iii) 前記入力状態と前記出力状態との間の論理関係であって、それにより
    前記出力状態が前記論理関係にしたがって前記入力状態に依存するもの を含んでなり、 前記標準化影響マトリックスは、第1の入力状態から第2の入力状態までの各
    出力クラスの前記規定相対変化を規定するものであり、 前記実測相対変化は、第1の入力状態から第2の入力状態までの1以上の細胞
    構成要素の相対変化を測定することを含む1以上のネットワークテスト実験で得
    られたデータから与えられるものである; (b) 前記の各細胞構成要素を特定の出力クラスに割り当てるステップ、ここで
    、各細胞構成要素は、前記細胞構成要素の実測相対変化と最も適合する規定相対
    変化を有する出力クラスに割り当てられる;ならびに (c) 前記データの前記ネットワークモデルに対する全体的な適合度を確定する
    ステップ を含んでなり、 それによって前記ネットワークモデルが前記全体的な適合度によりテストまた
    は確認されるものである方法 を実行させるものである、上記システム。
  49. 【請求項49】 前記プログラムが、前記プロセッサーに、前記の各実測相
    対変化と前記の各規定相対変化との間の差の目的尺度の値を確定することにより
    、前記各実測相対変化が前記各規定相対変化といかにうまく適合しているかを判
    定する前記ステップをさらに実行させるものである、請求項48に記載のコンピ
    ュータシステム。
  50. 【請求項50】 前記プログラムが、前記プロセッサーに、 (i) 前記各細胞構成要素についての適合度の確定、ここで、前記適合度は前記
    細胞構成要素の前記実測相対変化についての前記目的尺度の最大値である、 (ii) 前記各細胞構成要素の前記適合度値を組み合わせることによる前記全体
    的適合度の前記値の確定 をさらに実行させるものである、請求項49に記載のコンピュータシステム。
  51. 【請求項51】 前記1以上のプログラムが、ステップ(d)後に、前記プロ
    セッサーに、前記全体的適合度の有意性を見出すステップをさらに実行させるも
    のである、請求項50に記載のコンピュータシステム。
  52. 【請求項52】 前記全体的適合度の前記有意性を評価する前記ステップが
    、 (i) 前記実測相対変化を用いて各細胞構成要素のランダム化された適合度値を
    見出すこと、ここで前記ランダム化適合度値は、前記細胞構成要素のランダム化
    実測相対変化が前記各出力クラスについての前記標準化影響マトリックスにおけ
    る前記規定相対変化にいかにうまく適合するかの前記目的尺度の最大値であり、
    前記ネットワークテスト実験のうちの1つにおいて測定されたものとみなされる
    細胞構成要素の前記ランダム化された実測相対変化における相対変化は、前記ネ
    ットワークテスト実験のうちのランダムに選択されたものにおいて実際に測定さ
    れた実測相対変化である; (ii) 各細胞構成要素の前記ランダム化適合度値を前記実測相対変化と組み合
    わせることにより全体的ランダム化適合度値を見出すこと; (iii) 複数の全体的ランダム化適合度値を得るためにステップ(a)および(b)を
    繰り返し実行すること;ならびに (iv) 前記適合度の有意性を、前記全体的適合度値よりも良好な適合度を表す
    前記全体的ランダム化適合度値の割合(%)として確定すること を含む、請求項51に記載のコンピュータシステム。
  53. 【請求項53】 前記1以上のプログラムが、前記プロセッサーに、 (i) 入力状態の被覆集合を確定すること、ここで、入力状態の被覆集合は、任
    意の出力クラスの対に関し、前記出力クラスの対を区別する入力状態を含む;な
    らびに (ii) 前記ネットワークテスト実験を、入力状態の対の被覆集合によって規定
    されるネットワークテスト実験を含むように選択すること、ここで、入力状態の
    対の被覆集合は、任意の出力クラスの対に関し、前記出力クラスの対を区別する
    前記入力状態の被覆集合から選択される入力状態の対を含む を含む方法によって、前記ネットワークテスト実験を選択するステップをさらに
    実行させるものである、請求項48に記載のコンピュータシステム。
JP2000554875A 1998-06-19 1999-06-17 生物学的ネットワークモデルのテスト方法 Pending JP2002518021A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/099,722 1998-06-19
US09/099,722 US6132969A (en) 1998-06-19 1998-06-19 Methods for testing biological network models
PCT/US1999/013749 WO1999066067A1 (en) 1998-06-19 1999-06-17 Methods for testing biological network models

Publications (1)

Publication Number Publication Date
JP2002518021A true JP2002518021A (ja) 2002-06-25

Family

ID=22276320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000554875A Pending JP2002518021A (ja) 1998-06-19 1999-06-17 生物学的ネットワークモデルのテスト方法

Country Status (7)

Country Link
US (1) US6132969A (ja)
EP (1) EP1086240A4 (ja)
JP (1) JP2002518021A (ja)
AU (1) AU750741B2 (ja)
CA (1) CA2335187A1 (ja)
IL (1) IL140389A0 (ja)
WO (1) WO1999066067A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005797A (ja) * 1999-06-21 2001-01-12 Japan Science & Technology Corp ネットワーク推定方法および装置
JP2009512440A (ja) * 2005-10-21 2009-03-26 ジーンニュース インコーポレーティッド バイオマーカー産物レベルを疾患に相関させるための方法および装置
JP2022501011A (ja) * 2018-07-16 2022-01-06 フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー 細胞を分析する方法

Families Citing this family (113)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5965352A (en) 1998-05-08 1999-10-12 Rosetta Inpharmatics, Inc. Methods for identifying pathways of drug action
US6324479B1 (en) 1998-05-08 2001-11-27 Rosetta Impharmatics, Inc. Methods of determining protein activity levels using gene expression profiles
US6218122B1 (en) * 1998-06-19 2001-04-17 Rosetta Inpharmatics, Inc. Methods of monitoring disease states and therapies using gene expression profiles
US6146830A (en) 1998-09-23 2000-11-14 Rosetta Inpharmatics, Inc. Method for determining the presence of a number of primary targets of a drug
US6950752B1 (en) 1998-10-27 2005-09-27 Rosetta Inpharmatics Llc Methods for removing artifact from biological profiles
US6468476B1 (en) * 1998-10-27 2002-10-22 Rosetta Inpharmatics, Inc. Methods for using-co-regulated genesets to enhance detection and classification of gene expression patterns
US6222093B1 (en) * 1998-12-28 2001-04-24 Rosetta Inpharmatics, Inc. Methods for determining therapeutic index from gene expression profiles
AU3482200A (en) * 1999-02-02 2000-08-25 Bernhard Palsson Methods for identifying drug targets based on genomic sequence data
US6692916B2 (en) 1999-06-28 2004-02-17 Source Precision Medicine, Inc. Systems and methods for characterizing a biological condition or agent using precision gene expression profiles
US20080183395A1 (en) * 1999-06-28 2008-07-31 Michael Bevilacqua Gene expression profiling for identification, monitoring and treatment of multiple sclerosis
US6960439B2 (en) 1999-06-28 2005-11-01 Source Precision Medicine, Inc. Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
US20040225449A1 (en) * 1999-06-28 2004-11-11 Bevilacqua Michael P. Systems and methods for characterizing a biological condition or agent using selected gene expression profiles
US20060115826A1 (en) * 1999-06-28 2006-06-01 Michael Bevilacqua Gene expression profiling for identification monitoring and treatment of multiple sclerosis
US20050060101A1 (en) * 1999-06-28 2005-03-17 Bevilacqua Michael P. Systems and methods for characterizing a biological condition or agent using precision gene expression profiles
US6529861B1 (en) * 1999-07-02 2003-03-04 Intel Corporation Power consumption reduction for domino circuits
US6556962B1 (en) * 1999-07-02 2003-04-29 Intel Corporation Method for reducing network costs and its application to domino circuits
US7371516B1 (en) 1999-07-16 2008-05-13 Rosetta Inpharmatics Llc Methods for determining the specificity and sensitivity of oligonucleo tides for hybridization
US7013221B1 (en) 1999-07-16 2006-03-14 Rosetta Inpharmatics Llc Iterative probe design and detailed expression profiling with flexible in-situ synthesis arrays
US6529045B2 (en) 1999-09-28 2003-03-04 Intel Corporation NMOS precharge domino logic
AU2001229464A1 (en) * 2000-01-14 2001-07-24 Saba Software, Inc. Method and apparatus for a web content platform
AU2001227857A1 (en) * 2000-01-14 2001-07-24 Saba Software, Inc. Method and apparatus for a business applications management system platform
US6492837B1 (en) 2000-03-17 2002-12-10 Intel Corporation Domino logic with output predischarge
WO2001077684A2 (en) * 2000-04-10 2001-10-18 The Scripps Research Institute Proteomic analysis using activity-based probe libraries
US7003403B1 (en) * 2000-06-15 2006-02-21 The United States Of America As Represented By The Department Of Health And Human Services Quantifying gene relatedness via nonlinear prediction of gene
US6832205B1 (en) 2000-06-30 2004-12-14 General Electric Company System and method for automatically predicting the timing and costs of service events in a life cycle of a product
WO2002002740A2 (en) * 2000-07-05 2002-01-10 Rosetta Inpharmatics, Inc. Methods and compositions for determining gene function
US7590493B2 (en) * 2000-07-31 2009-09-15 Ocimum Biosolutions, Inc. Methods for determining hepatotoxins
AU2001280889A1 (en) * 2000-07-31 2002-02-13 Gene Logic, Inc. Molecular toxicology modeling
US6713257B2 (en) 2000-08-25 2004-03-30 Rosetta Inpharmatics Llc Gene discovery using microarrays
US7807447B1 (en) 2000-08-25 2010-10-05 Merck Sharp & Dohme Corp. Compositions and methods for exon profiling
CA2422021A1 (en) * 2000-09-12 2003-03-11 Institute Of Medicinal Molecular Design, Inc. Method of generating molecule-function network
WO2002037102A2 (en) * 2000-10-20 2002-05-10 Children's Medical Center Corporation Methods for analyzing dynamic changes in cellular informatics
GB0225109D0 (en) * 2002-10-29 2002-12-11 Univ Newcastle Method of and apparatus for identifying components of a network having high importance for network integrity
US7319945B1 (en) * 2000-11-10 2008-01-15 California Institute Of Technology Automated methods for simulating a biological network
US6988109B2 (en) * 2000-12-06 2006-01-17 Io Informatics, Inc. System, method, software architecture, and business model for an intelligent object based information technology platform
US20100223295A1 (en) * 2000-12-06 2010-09-02 Io Informatics, Inc. Applied Semantic Knowledgebases and Applications Thereof
US6486706B2 (en) 2000-12-06 2002-11-26 Intel Corporation Domino logic with low-threshold NMOS pull-up
US7197505B2 (en) * 2000-12-22 2007-03-27 Star Bridge Systems, Inc. Multi-dimensional recursive wavefront behavioral synthesis
US7127379B2 (en) * 2001-01-31 2006-10-24 The Regents Of The University Of California Method for the evolutionary design of biochemical reaction networks
EP2051177A1 (en) * 2001-02-09 2009-04-22 The Trustees of Columbia University in the City of New York Method for the prediction of molecular interaction networks
US20030059792A1 (en) * 2001-03-01 2003-03-27 Palsson Bernhard O. Models and methods for determining systemic properties of regulated reaction networks
AU2002252370A1 (en) * 2001-03-12 2002-09-24 Irm, Llc. Genomics-driven high speed cellular assays, development thereof, and collections of cellular reporters
AU2002303234A1 (en) * 2001-04-02 2002-10-15 Cytoprint, Inc. Methods and apparatus for discovering, identifying and comparing biological activity mechanisms
EP1392850A2 (en) * 2001-04-27 2004-03-03 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Berlin Method and system for identifying targets by nucleocytoplasmic cycling and use thereof
US7415358B2 (en) * 2001-05-22 2008-08-19 Ocimum Biosolutions, Inc. Molecular toxicology modeling
US20030014232A1 (en) * 2001-05-22 2003-01-16 Paterson Thomas S. Methods for predicting biological activities of cellular constituents
US20070015146A1 (en) * 2001-05-22 2007-01-18 Gene Logic, Inc. Molecular nephrotoxicology modeling
US20020194201A1 (en) * 2001-06-05 2002-12-19 Wilbanks John Thompson Systems, methods and computer program products for integrating biological/chemical databases to create an ontology network
US20020194154A1 (en) * 2001-06-05 2002-12-19 Levy Joshua Lerner Systems, methods and computer program products for integrating biological/chemical databases using aliases
WO2002103608A2 (en) * 2001-06-14 2002-12-27 Ramot University Authority For Applied Research & Industrial Development Ltd. Method of expanding a biological network
US7110525B1 (en) 2001-06-25 2006-09-19 Toby Heller Agent training sensitive call routing system
US6691042B2 (en) 2001-07-02 2004-02-10 Rosetta Inpharmatics Llc Methods for generating differential profiles by combining data obtained in separate measurements
US20070054269A1 (en) * 2001-07-10 2007-03-08 Mendrick Donna L Molecular cardiotoxicology modeling
US7447594B2 (en) * 2001-07-10 2008-11-04 Ocimum Biosolutions, Inc. Molecular cardiotoxicology modeling
US20040014040A1 (en) * 2001-07-10 2004-01-22 Donna Mendrick Cardiotoxin molecular toxicology modeling
US20050154536A1 (en) * 2001-08-30 2005-07-14 The University Of Pittsburgh - Of The Commonwealth System Of Higher Education Two-part drug discovery system
US20030087285A1 (en) * 2001-08-30 2003-05-08 Chow Carson C. Algorithm for estimating the outcome of inflammation following injury or infection
US7751981B2 (en) 2001-10-26 2010-07-06 The Regents Of The University Of California Articles of manufacture and methods for modeling Saccharomyces cerevisiae metabolism
WO2003040992A1 (en) * 2001-11-02 2003-05-15 Gene Network Sciences, Inc. Methods and systems for the identification of components of mammalian biochemical networks as targets for therapeutic agents
US7415359B2 (en) * 2001-11-02 2008-08-19 Gene Network Sciences, Inc. Methods and systems for the identification of components of mammalian biochemical networks as targets for therapeutic agents
CN1612936A (zh) 2001-11-09 2005-05-04 苏尔斯精细医药公司 利用基因表达分布图识别、监控和治疗疾病以及鉴定生物学状态
US20040023295A1 (en) * 2001-11-21 2004-02-05 Carol Hamilton Methods and systems for analyzing complex biological systems
US7308363B2 (en) * 2002-01-23 2007-12-11 Sri International Modeling and evaluation metabolic reaction pathways and culturing cells
US7623969B2 (en) * 2002-01-31 2009-11-24 The Institute For Systems Biology Gene discovery for the system assignment of gene function
AU2003214981A1 (en) * 2002-01-31 2003-09-02 Gene Logic, Inc. Molecular hepatotoxicology modeling
US7418351B2 (en) 2002-01-31 2008-08-26 Rosetta Inpharmatics Llc Methods for analysis of measurement errors in measured signals
JP2005516310A (ja) * 2002-02-01 2005-06-02 ロゼッタ インファーマティクス エルエルシー 遺伝子を特定し、形質に関連する経路を明らかにするコンピュータ・システムおよび方法
US20060293873A1 (en) * 2002-03-06 2006-12-28 Trustees Of Boston University Systems and methods for reverse engineering models of biological networks
US20070016390A1 (en) * 2002-03-06 2007-01-18 Bernardo Diego D Systems and methods for reverse engineering models of biological networks
US20030224363A1 (en) * 2002-03-19 2003-12-04 Park Sung M. Compositions and methods for modeling bacillus subtilis metabolism
US8949032B2 (en) * 2002-03-29 2015-02-03 Genomatica, Inc. Multicellular metabolic models and methods
JP2005521929A (ja) * 2002-03-29 2005-07-21 ジェノマティカ・インコーポレイテッド ヒト代謝モデルおよび方法
AU2003233585A1 (en) * 2002-05-20 2003-12-12 Rosetta Inpharmatics Llc Computer systems and methods for subdividing a complex disease into component diseases
WO2003100541A2 (en) * 2002-05-24 2003-12-04 Global Genomics Ab Methods for profiling molecules with an objective function
US6763308B2 (en) 2002-05-28 2004-07-13 Sas Institute Inc. Statistical outlier detection for gene expression microarray data
US7856317B2 (en) * 2002-06-14 2010-12-21 Genomatica, Inc. Systems and methods for constructing genomic-based phenotypic models
WO2004013727A2 (en) * 2002-08-02 2004-02-12 Rosetta Inpharmatics Llc Computer systems and methods that use clinical and expression quantitative trait loci to associate genes with traits
AU2003270041A1 (en) * 2002-08-29 2004-03-19 Gene Network Sciences, Inc. Systems and methods for inferring biological networks
ATE391904T1 (de) * 2002-10-10 2008-04-15 Bluegnome Ltd Bildanalyse von mikroarrays
US7869957B2 (en) * 2002-10-15 2011-01-11 The Regents Of The University Of California Methods and systems to identify operational reaction pathways
WO2004035009A2 (en) * 2002-10-15 2004-04-29 The Regents Of The University Of California Methods and systems to identify operational reaction pathways
US8843356B2 (en) 2002-12-27 2014-09-23 Merck Sharp & Dohme Corp. Computer systems and methods for associating genes with traits using cross species data
US7996155B2 (en) 2003-01-22 2011-08-09 Microsoft Corporation ANOVA method for data analysis
US9818136B1 (en) 2003-02-05 2017-11-14 Steven M. Hoffberg System and method for determining contingent relevance
JP2006525811A (ja) 2003-05-16 2006-11-16 ロゼッタ インファーマティクス エルエルシー Rna干渉の方法と組成物
WO2004109447A2 (en) 2003-05-30 2004-12-16 Rosetta Inpharmatics Llc Computer systems and methods for identifying surrogate markers
US7853406B2 (en) * 2003-06-13 2010-12-14 Entelos, Inc. Predictive toxicology for biological systems
US20070038386A1 (en) * 2003-08-05 2007-02-15 Schadt Eric E Computer systems and methods for inferring casuality from cellular constituent abundance data
WO2005014793A2 (en) * 2003-08-07 2005-02-17 Gene Logic, Inc. Primary rat hepatocyte toxicity modeling
US20050059083A1 (en) * 2003-09-15 2005-03-17 Becton Dickinson And Company High throughput method to identify ligands for cell attachment
US20050060100A1 (en) * 2003-09-15 2005-03-17 Becton Dickinson And Company Computer software and algorithms for systems biologically linked to cellular phenotype
JP2007535305A (ja) * 2003-11-24 2007-12-06 ジーン ロジック インコーポレイテッド 分子毒性モデリングのための方法
US8554486B2 (en) * 2004-02-20 2013-10-08 The Mathworks, Inc. Method, computer program product, and apparatus for selective memory restoration of a simulation
US7881872B2 (en) 2004-03-12 2011-02-01 Microsoft Corporation Methods of analyzing multi-channel profiles
US20080281526A1 (en) * 2004-03-22 2008-11-13 Diggans James C Methods For Molecular Toxicology Modeling
WO2005100989A2 (en) * 2004-04-07 2005-10-27 Gene Logic, Inc. Hepatotoxicity molecular models
WO2005107412A2 (en) * 2004-04-30 2005-11-17 Rosetta Inpharmatics Llc Systems and methods for reconstruction gene networks in segregating populations
EP1789786A4 (en) * 2004-08-18 2008-02-13 Abbott Molecular Inc DETERMINING DATA QUALITY AND / OR SEGMENTAL ANEUMS USING A COMPUTER SYSTEM
US20090087848A1 (en) * 2004-08-18 2009-04-02 Abbott Molecular, Inc. Determining segmental aneusomy in large target arrays using a computer system
US7836111B1 (en) 2005-01-31 2010-11-16 Hewlett-Packard Development Company, L.P. Detecting change in data
US7809781B1 (en) * 2005-04-29 2010-10-05 Hewlett-Packard Development Company, L.P. Determining a time point corresponding to change in data values based on fitting with respect to plural aggregate value sets
US8447526B2 (en) 2005-05-23 2013-05-21 Microsoft Corporation Methods and computer systems for analyzing high-throughput assays
GB0523832D0 (en) * 2005-11-23 2006-01-04 Univ City Non-invasive optical monitoring of glucose using an adaptive modelling scheme
US7437249B2 (en) 2006-06-30 2008-10-14 Agilent Technologies, Inc. Methods and systems for detrending signal intensity data from chemical arrays
WO2008103881A2 (en) * 2007-02-22 2008-08-28 New Jersey Institute Technology Systems and methods for fault diagnosis in molecular networks
US20090023182A1 (en) * 2007-07-18 2009-01-22 Schilling Christophe H Complementary metabolizing organisms and methods of making same
WO2009155009A1 (en) 2008-05-27 2009-12-23 Memorial Sloan Kettering Cancer Center Models for combinatorial perturbations of living biological systems
US20130005590A1 (en) * 2011-06-06 2013-01-03 The Regents Of The University Of California Synthetic biology tools
EP2608122A1 (en) * 2011-12-22 2013-06-26 Philip Morris Products S.A. Systems and methods for quantifying the impact of biological perturbations
CN104838372B (zh) * 2012-10-09 2018-11-02 凡弗3基因组有限公司 用于生物路径中的调控互动的学习和识别的系统和方法
US20190025297A1 (en) * 2013-03-15 2019-01-24 Nri R&D Patent Licensing, Llc Stepwise and Blockwise Biochemical Network Laboratory Breadboard Systems and Techniques for Signaling, Disease Research, Drug Discovery, Cell Biology, and Other Applications
US10546019B2 (en) 2015-03-23 2020-01-28 International Business Machines Corporation Simplified visualization and relevancy assessment of biological pathways
CN107133492B (zh) * 2017-05-02 2020-08-25 温州大学 一种基于pagis识别基因通路的方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US6040138A (en) * 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5800992A (en) * 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5744101A (en) * 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5645988A (en) * 1991-05-08 1997-07-08 The United States Of America As Represented By The Department Of Health And Human Services Methods of identifying drugs with selective effects against cancer cells
WO1994017208A1 (en) * 1993-01-21 1994-08-04 President And Fellows Of Harvard College Methods and diagnostic kits utilizing mammalian stress promoters to determine toxicity of a compound
US5569588A (en) * 1995-08-09 1996-10-29 The Regents Of The University Of California Methods for drug screening
US5777888A (en) * 1995-08-09 1998-07-07 Regents Of The University Of California Systems for generating and analyzing stimulus-response output signal matrices
AU2253397A (en) * 1996-01-23 1997-08-20 Affymetrix, Inc. Nucleic acid analysis techniques
EP0816511B2 (en) * 1996-06-27 2006-06-14 Clondiag Chip Technologies GmbH Method of screening substances

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005797A (ja) * 1999-06-21 2001-01-12 Japan Science & Technology Corp ネットワーク推定方法および装置
JP2009512440A (ja) * 2005-10-21 2009-03-26 ジーンニュース インコーポレーティッド バイオマーカー産物レベルを疾患に相関させるための方法および装置
JP2013150612A (ja) * 2005-10-21 2013-08-08 Genenews Inc バイオマーカー産物レベルを疾患に相関させるための方法および装置
JP2022501011A (ja) * 2018-07-16 2022-01-06 フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー 細胞を分析する方法
JP7548672B2 (ja) 2018-07-16 2024-09-10 フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー 細胞を分析する方法

Also Published As

Publication number Publication date
EP1086240A4 (en) 2005-07-27
EP1086240A1 (en) 2001-03-28
WO1999066067A1 (en) 1999-12-23
AU750741B2 (en) 2002-07-25
IL140389A0 (en) 2002-02-10
CA2335187A1 (en) 1999-12-23
US6132969A (en) 2000-10-17
AU4693599A (en) 2000-01-05

Similar Documents

Publication Publication Date Title
JP2002518021A (ja) 生物学的ネットワークモデルのテスト方法
US6203987B1 (en) Methods for using co-regulated genesets to enhance detection and classification of gene expression patterns
US7599799B2 (en) Methods for using co-regulated genesets to enhance detection and classification of gene expression patterns
US6950752B1 (en) Methods for removing artifact from biological profiles
US6801859B1 (en) Methods of characterizing drug activities using consensus profiles
US5965352A (en) Methods for identifying pathways of drug action
US6324479B1 (en) Methods of determining protein activity levels using gene expression profiles
US8412460B2 (en) Methods and systems for characterizing a cellular constituent using response profiles
US6370478B1 (en) Methods for drug interaction prediction using biological response profiles
CA2282792A1 (en) Methods for drug target screening
AU773456B2 (en) Methods for using co-regulated genesets to enhance detection and classification of gene expression patterns
JP2002533699A (ja) 強力なプロファイル識別方法
US20020146694A1 (en) Functionating genomes with cross-species coregulation