JP2002528095A - 同時調節された遺伝子セットを使用して遺伝子発現パターンの検出および分類を向上させる方法 - Google Patents

同時調節された遺伝子セットを使用して遺伝子発現パターンの検出および分類を向上させる方法

Info

Publication number
JP2002528095A
JP2002528095A JP2000578488A JP2000578488A JP2002528095A JP 2002528095 A JP2002528095 A JP 2002528095A JP 2000578488 A JP2000578488 A JP 2000578488A JP 2000578488 A JP2000578488 A JP 2000578488A JP 2002528095 A JP2002528095 A JP 2002528095A
Authority
JP
Japan
Prior art keywords
gene
profile
biological
cell component
genes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000578488A
Other languages
English (en)
Inventor
フレンド,ステファン、エイチ.
ストートン,ローランド
ヘ,ユドン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rosetta Inpharmatics LLC
Original Assignee
Rosetta Inpharmatics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/179,569 external-priority patent/US6203987B1/en
Priority claimed from US09/220,275 external-priority patent/US6950752B1/en
Application filed by Rosetta Inpharmatics LLC filed Critical Rosetta Inpharmatics LLC
Publication of JP2002528095A publication Critical patent/JP2002528095A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Microbiology (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)

Abstract

(57)【要約】 本発明は、生物学的応答パターンの検出を向上させる方法を提供する。本発明の実施形態の1つでは、遺伝子を、その発現の同時調節(co-regulation)に応じて、基本遺伝子セットへ分類する。遺伝子セット内に含まれる個々の遺伝子の発現は、射影法(projection process)により、遺伝子セットに対する単一の遺伝子発現値で表される。次いで、個々の遺伝子の発現ではなくて遺伝子セットの発現値を、生物学的応答の比較および検出を非常に高感度で行うための基準として使用する。本発明の別の実施形態では、生物学的応答を、その生物学的プロフィールの類似度に応じて分類する。本発明の方法は多くの有用な用途を有し、特に薬剤の開発と発見の分野で有用である。例えば、本発明の方法を使用して、生物学的応答を非常に高感度で比較することが可能である。このような方法に従って比較し得る生物学的応答としては、突然変異または温度変化に対する生物学的応答といった単一摂動(single perturbation)に対する応答、並びに特定の薬剤による力価測定といった段階的摂動(graded perturbation)に対する応答が挙げられる。本発明の方法はまた、特定のタイプの生物学的応答に関与する細胞構成成分、特に遺伝子を同定するのにも有用である。さらに、本発明の方法を使用して、1以上の特定の遺伝子セットを生じる摂動(例えば、新規の薬剤または突然変異)を同定することも可能である。さらに、本発明の方法を使用して、生物学的応答のデータ中に含まれる実験によるアーティファクト(artifact)を除去することも可能である。

Description

【発明の詳細な説明】
【0001】発明の説明 これは1998年12月23日付で提出した出願番号09/220,275の部分継続であり、こ
の09/220,275は1998年10月27日付で提出した出願番号09/179,569の部分継続であ
るが、これらの各々を参照により本明細書中にその全体を組み込むこととする。
【0002】 1. 本発明の技術分野 本発明の技術分野は摂動(perturbation)に対する生物学的応答の検出の増強方
法に関する。とりわけ、本発明は、特定の特異的遺伝子調節を検出する能力およ
び細胞内の遺伝子調節の複雑なパターンを作り出す化合物の作用をより正確に分
類する能力を改善する目的で生物学的発現パターンの構造を分析するための方法
に関する。
【0003】 2. 本発明の背景 過去10年間の間にいくつかの技術によって多数の転写産物の発現レベルをいか
なる1時点でもモニターすることが可能となった(例えば、Schenaら, 1995, Quan
titative monitoring of gene expression patterns with a complementary DNA
micro-array, Science 270:467-470; Lockhartら, 1996, Expression monitori
ng by hybridization to high-density oligonucleotide arrays, Nature Biote
chnology 14:1675-1680; Blanchardら, 1996, Sequence to array:Probing the
genome's secrets, Nature Biotechnology 14, 1649; 米国特許第5,569,588号19
96年10月29日発行, Ashbyら, 名称"Method for Drug Screening"を参照せよ)。
完全なゲノムが既知の生物体では細胞内の全ての遺伝子の転写産物を分析するこ
とが可能である。ゲノムについての知識が現在増加しつつあるヒトなどのその他
の生物では、細胞内の多数の遺伝子を同時にモニターすることが可能である。
【0004】 このようなモニタリング技術は、種々の病的または生理学的状態においてアッ
プレギュレートされているまたはダウンレギュレートされている遺伝子の同定、
細胞の状態をシグナル伝達するメンバーの分析、および種々の医薬品の標的の同
定に応用されてきた。例えば、FriendとHartwell, 米国provisional 特許申請第
60/039,134号, 1997年2月28日出願; Stoughton, 米国特許申請第09/099,722号,
1998年6月19日出願; StoughtonとFriend, 米国特許申請第09/074,983号, 1998年
5月8日出願; FriendとHartwell, 米国provisional特許申請第60/056,109号, 199
7年8月20日出願; FriendとHartwell, 米国特許申請第09/031,216号, 1998年2月2
6日出願; FriendとStoughton, 米国provisional特許申請第60/084,742号(1998年
5月8日出願)、第60/090,004号(1998年6月19日出願)および第60/090,046号(1998
年6月19日出願)を参照すればよいが、これらの全てを本明細書に参照によりいか
なる目的のためにも組み込むこととする。
【0005】 細胞の種々の構成成分のレベルは薬剤による処理およびその他の細胞の生物学
的状態の摂動に応答して変化することが知られている。そのような「細胞構成成
分」を複数測定した結果は、摂動の影響について、およびその摂動が細胞の生物
学的状態に与える影響についての豊富な情報を含んでいる。そのような測定は典
型的には上述のような遺伝子発現レベルの測定からなるが、その他の細胞構成成
分、例えば、限定はされないが、どのタンパク質が豊富に存在しているか、もし
くはタンパク質の活性のレベルなどを含めることもできる。そのような測定結果
を集めたものは一般的には細胞の生物学的状態の「プロフィール」と呼ばれる。 細胞の構成成分の数は典型的には哺乳類細胞では10万のオーダーである。従っ
て、特定の細胞のプロフィールは典型的には非常に複雑である。摂動を生じさせ
る作用物のいかなるものでもその一つのものによって少数または多数の細胞構成
成分にその量もしくは活性レベルに変化を生じさせることができる。従って、あ
る与えられた摂動に対してどのような応答が生ずるかということの知識を持たな
ければ、その摂動の作用を完全にもしくは少なくともその大部分を特徴づけよう
とするならば、これらの約10種の構成成分の応答について個別に測定すること
が必要となる。測定時のエラーも加わった生物学的応答データの複雑性によって
、生物学的応答データの分析は挑戦的な仕事となっている。
【0006】 プロフィールの変化を定量するために用いられる現行の技術は、偽の検出、検
出の失敗、もしくは不正確な定量的測定などの測定エラーが高率に起こるために
うまく行かない。従って、当業界では生物学的発現パターンの構造の検出を増強
するための方法に対して非常に大きな要望がある。とりわけ、細胞構成成分の測
定のセット、例えば細胞の生物学的状態のプロフィール中での測定値のグループ
および構造を見つけ出すことが必要とされている。そのような構造の例としては
、異なる遺伝子の発現レベルの調節それぞれの間の関連、異なる薬剤もしくは薬
剤候補品間の関連、および薬剤と遺伝子のセットの調節の間の関連が挙げられる
。本明細書中の参照文献に関する考察もしくは引用は、その参照文献を本発明の
先行技術であると認めたものと解釈されるべきではない。
【0007】 3. 本発明の要旨 本発明は、種々の摂動、例えばある薬剤、薬剤候補品、もしくは生物学的経路
を探索するためにデザインされた実験条件などの摂動に対する生物学的システム
の応答の構造、ならびに特定の疾病もしくは疾病状態、または特定の疾病もしく
は疾病状態の治療に対応する生物学的システムの変化の検出を増強するための方
法を提供する。本発明の方法は、薬剤の発見、薬物療法のモニタリング、遺伝的
分析、および臨床診断の分野に広範な応用ができる。本発明はまた、生物学的応
答パターン、薬剤発見、薬物療法モニタリング、および臨床診断の増強された検
出を行うための器具およびコンピューターの操作法をも提供する。
【0008】 本発明の1態様では、細胞構成成分をそれらの同時変動(co-variation)に基づ
いてグループに分類するための方法(測定可能な生物学的変化、例えば遺伝子転
写産物およびタンパク質の活性)を提供する。それらのグループの各々は、摂動
に応答して同時変動する細胞構成成分を含んでいる。これらのグループは細胞構
成成分セットと呼ばれる。
【0009】 いくつかの特定の実施形態においては、遺伝子はそれらの転写の同時変動、そ
れはおそらくは同時調節の程度にしたがってグループ分けされる。同時変動する
転写産物を有する遺伝子のグループを遺伝子セットと呼ぶ。種々の摂動に応答す
る遺伝子の転写の同時変動を分析するために、クラスター分析またはその他の統
計学的分類法が用いられる。好ましい実施形態においては、クラスター分析また
はその他の統計学的分類法は、種々の摂動に応答する2つ以上の遺伝子(もしくは
その他の細胞構成成分)の類似性(すなわち同時変動)を評価するための新規の「
距離(distance)」もしくは「類似性(similarity)」の尺度を用いている。特定の
1実施形態においては、提示された同時調節の量によって細胞構成成分と関連し
ている「類似性のツリー」もしくは「クラスターツリー」を構築するために種々
の細胞性の摂動によって得られた発現プロフィール(例えば多数の遺伝子の転写
率を集めたもの)にクラスター化アルゴリズムが適用される。遺伝子セットはク
ラスターツリーを異なるレベルで分枝階層で切断することによって得られるクラ
スターツリーの枝にあるものとして定義される。いくつかの実施形態においては
、切断レベルは測定した遺伝子から予測される別個の応答経路の数に基づいて選
択される。いくつかの他の実施形態においては、ツリーは個々の枝の間の最小距
離の値によって真に別のものと考えられる数に分けられる。
【0010】 いくつかの好ましい実施形態においては、真に別個の枝を定義するために客観
的統計学的検定が行われる。そのような統計学的検定の典型的な1実施形態では
、試験を行った全ての摂動を通じて各遺伝子の応答について摂動インデックスの
モンテカルロランダム化を行う。いくつかの好ましい実施形態においては1個も
しくは2個の遺伝子を有するクラスターは棄てる。しかし、いくつかのその他の
実施形態においては、1もしくは2個の遺伝子を有する小クラスターは遺伝子セッ
トに含まれる。より詳細に述べれば、本発明の好ましい統計学的検定は、(a)上
述のクラスター分析もしくはその他の統計学的技法によって決定されたクラスタ
ー(すなわち、例えば遺伝子セットなどの細胞構成成分のセット)の「コンパクト
さの程度」の尺度を得ること、および(b)そのようにして得た「コンパクトさの
程度」の尺度を、数を増加させたクラスター中に再グループ化させた細胞構成成
分のコンパクトさの程度の仮説の尺度との比較、からなる。そのような比較は典
型的には、それらの2セットのクラスターのコンパクトさの程度の相異を求める
ことからなる。さらに、試験を行った全ての摂動を通じて各遺伝子の応答につい
て摂動インデックスのモンテカルロランダム化を行うことによって、コンパクト
さの程度の相異の統計学的分布が作成される。コンパクトさの程度の実際の相異
についての統計学的な有意差の有無は、このコンパクトさの程度の実際の相異を
、モンテカルロランダム化からのコンパクトさの程度の相異の統計学的分布と比
較することによって決定される。
【0011】 クラスター化セットにおける摂動の多様性が非常に大きくなるに連れて、明確
に区別しうる遺伝子セットはより小規模でより多数となる。しかし、本発明の発
見したことは、非常に大きな実験セットであっても、それらの一貫性を維持した
多数の遺伝子セットがあるということである。これらの遺伝子セットは削減し得
ない(irreducible)遺伝子セットと呼ばれる。本発明のいくつかの実施形態にお
いては、多数の多様な摂動がこれらの削減し得ない遺伝子セットを得るために適
用される。
【0012】 統計学的に導いた遺伝子セットは、同時調節されているメンバーであることの
確認、またはより強固に同時調節されているサブグループの同定のために調節配
列の情報を用いてより精度を上げることができる。そのような実施形態において
は、遺伝子セットは、その個々の生物学的実験的摂動、例えば特異的突然変異、
もしくは特異的増殖条件、もしくは特異的化合物などの摂動に対する応答パター
ンによって定義することができる。統計学的に導いた遺伝子セットはさらに遺伝
子調節の生物学的な理解に基づいて精度を上げることができる。また別の好まし
い1実施形態においては、遺伝子を遺伝子セットに分類することは第1には既知の
遺伝子調節メカニズムに基づいて行われる。調節領域の配列の相同性が遺伝子セ
ットを定義するために用いられる。いくつかの実施形態においては、共通のプロ
モーター配列を有する遺伝子が1つの遺伝子セットにグループ分けされる。
【0013】 好ましい実施形態においては、本発明のクラスター分析および統計学的分類法
は、同時変動、例えば個々に遺伝子の転写レベルを、2つ以上の細胞構成成分(例
えば2つ以上の遺伝子)の発現レベルの類似性の有用な尺度を提供する客観的、定
量的な「類似性」もしくは「距離」関数によって分析するものである。それゆえ
に、本発明は、細胞構成成分の同時変動、それは遺伝子転写産物のレベルの同時
変動を含むが、その変化の分析に特に有用な新規の類似性もしくは距離の関数を
提供する。本発明はまた、本発明の方法によって得られた細胞構成成分のセット
または遺伝子セットの有意差を評価するための客観的統計学的検定法、とりわけ
モンテカルロ法における検定法をも提供する。最後に、本発明のクラスター法は
細胞性構成成分および生物学的プロフィールの双方をそれらの類似性に従ってク
ラスター化することに対して同等に適用可能である。別の1態様においては、本
発明は表の形としたデータのセットの両方向での同時クラスター化のための方法
を提供する。好ましい実施形態においては、そのデータセットは、異なる条件、
摂動、もしくは条件の組み合わせに応答する複数の細胞構成成分のレベルもしく
はレベルの変化を示す数値の表である。
【0014】 本発明の別の1態様は、同時変動する細胞構成成分のセットに基づく生物学的
サンプルの状態(または生物学的応答)を表現するための方法を提供する。いくつ
かの実施形態においては、生物学的サンプル中の細胞構成成分の尺度を複数含ん
でいるプロフィールを、同時変動をベースとした細胞構成成分のセットの定義に
従って複数の細胞構成成分セット値を含んでいる1つの射影されたプロフィール
に変換する。いくつかの好ましい実施形態においては、その細胞構成成分セット
値はある細胞構成成分セット内の細胞構成成分の値の平均値である。他のいくつ
かの実施形態においては、細胞構成成分セット値はリニア射影プロセスから由来
するものである。この射影の操作によって、より小さくかつ生物学的により意味
のある座標のセット上でそのプロフィールが示され、各細胞構成成分セット全体
にわたって測定エラーを平均化することによって測定エラーの影響を低減し、そ
のプロフィールの生物学的な解釈を助けている。
【0015】 本発明の方法は、遺伝子発現プロフィールの分析に特に有用である。いくつか
の実施形態においては、多数の遺伝子の転写率を集めたものなどの遺伝子発現プ
ロフィールは射影された遺伝子発現プロフィールへ変換される。いくつかの実施
形態においては、その変換は各遺伝子セット内の遺伝子の転写率を平均すること
によって行われる。他のいくつかの実施形態においては、他の射影プロセスを用
いることができる。
【0016】 本発明のまた別の1態様においては、細胞構成成分セット値、とりわけ遺伝子
セットの発現値を比較する方法が提供される。いくつかの実施形態においては、
1つの生物学的システムの少なくとも10個の遺伝子、好ましくは100個を超える遺
伝子、さらにより好ましくは1000個を超える遺伝子の発現がモニターされる。薬
剤に対する既知の応答プロフィールを遺伝子セットに関して作るために、既知の
薬剤をこのシステムに適用することができる。薬剤候補品も、遺伝子セットに関
する薬剤候補品の応答プロフィールを得るためにこの生物学的システムを適用す
ることができる。次いで、その薬剤候補品の応答プロフィールを既知の薬剤応答
プロフィールと比較してその薬剤候補品が既知の薬剤と類似の応答を誘発するか
定めることができる。
【0017】 他のいくつかの実施形態においては、射影されたプロフィールを比較すること
は、類似性の客観的尺度を用いて行うことができる。いくつかの好ましい実施形
態においては、その客観的尺度はその2つの比較対象のプロフィールの射影を示
すベクトル間の一般化された角度である(正規ドット積「normalized dot produc
t」)。別のいくつかの実施形態においては、射影されたプロフィールは各遺伝子
セットの振幅の閾値を射影されたプロフィールに適用することによって分析され
る。もしも遺伝子セットの変化が閾値を超えるものである場合には、ある変化が
遺伝子セット内に存在するとされる。
【0018】 本発明の方法は測定された細胞構成成分の応答の類似性に従って生物学的応答
プロフィールをグループ分けするためにも用いることができる。それゆえに、別
の実施形態においては、本発明は、上述のクラスター分析もしくは他の統計学的
分類法を用いて、細胞構成成分(例えば遺伝子)を同時変動するセット(例えば遺
伝子セット)に分類するために、細胞構成成分の応答の類似性の程度に従って生
物学的応答のグループ分け(すなわち応答プロフィール)の方法を提供する。その
ような方法はまた、例えば生物学的システムの種々の摂動に対する応答の構造の
検出を増強するためにも用いることができる。さらにまた、本発明は生物学的応
答プロフィールデータの「2次元」分析法をも提供する。そのような方法は単に
、(1)応答プロフィールデータ中の同時変動の程度にしたがって細胞構成成分(例
えば遺伝子)をグループ分けすること、および(2)細胞構成成分の応答の類似性に
従って応答プロフィールをグループ分けすることのみからなるものである。
【0019】 本発明のクラスター化法は特に例えば、特定の細胞構成成分もしくは特定の細
胞構成成分のグループに影響を及ぼす摂動(例えば、薬剤、薬剤候補品、もしく
は遺伝的突然変異)の同定および/または特徴を調べるために有用である。例えば
、このクラスター化法は、細胞構成成分(例えば遺伝子およびタンパク質)および
/もしくは同時変動する遺伝子セットなどの細胞構成成分であってそれらの発現
の変化もしくは量的変化が特定の生物学的影響、例えば特定の疾病状態もしくは
1種以上の薬剤の影響に伴うものであるようなものの同定に用いることができる
。さらに、本発明のクラスター化法は例えば、特定の生物学的応答もしくは経路
に関与する遺伝子もしくは遺伝子転写産物などの細胞構成成分を同定するために
も用いることができる。本発明はさらに、特定の生物学的応答もしくは経路に伴
う、遺伝子もしくは遺伝子転写産物などの細胞構成成分を、上述のクラスター分
析法を用いて同定するための方法を提供する。本発明はさらに、生物学的な「摂
動」、例えば薬剤、薬剤候補物、もしくは遺伝的突然変異などの生物学的システ
ムを摂動させ、特定の細胞構成成分もしくは特定の細胞構成成分のグループに影
響を及ぼすものを、上述のクラスター分析法を用いて同定するための方法を提供
する。本発明の方法によって同定された細胞構成成分および摂動は既知のものも
それ以前には未知のものもありうる。本発明は例えば、以前には対象とする特定
の生物学的影響に伴うものであることが知られていなかった、新規の遺伝子およ
び薬剤もしくは薬剤候補品ならびに以前から知られていた遺伝子および薬剤およ
び/もしくは薬剤候補品を同定するための方法を提供する。
【0020】 本発明の方法はまた、測定された生物学的プロフィールから(すなわち複数の
細胞構成成分の測定値からなる測定プロフィールから)1個以上のアーティファク
トを除去するためにも用いることができる。本発明は、各アーティファクトのパ
ターンが特定のアーティファクトと対応しているような測定された生物学的プロ
フィールから1つ以上のアーティファクトパターンを差し引くことによって、そ
のようなアーティファクトを測定された生物学的プロフィールから除去するため
の方法を提供する。
【0021】 本発明の方法は、クラスター分析および射影操作を実行することのできるコン
ピューターシステムを用いて実施されることが好ましい。いくつかの実施形態に
おいては、コンピューターシステムはコンピューターで判読可能なプログラムコ
ードを具体化させた、コンピューターに使用可能なメディアを含んでいる。その
コンピューターコードは、データベースから基礎となる遺伝子セットの定義を検
索し、遺伝子発現プロフィールを射影された発現プロフィールへその検索された
定義に従って変換することを実行するために用いられる。
【0022】 5. 詳細な説明 本節は本発明およびその適用の詳細な説明を示す。この説明はいくつかの典型
的なものによって、より詳細にかつ特異的に、本発明の一般的方法について行う
ものである。これらの実施例は非限定的で、関連して変更しうる事項は当業者に
は明白なものであろう。
【0023】 単純化するために本開示では、遺伝子発現プロフィール、転写率、転写レベル
、その他をしばしば言及しているとはいえ、本発明の方法がどのような生物学的
応答プロフィールの分析にも有用であることは当業者には理解されることであろ
う。とりわけ、当業者は本発明の方法が他の細胞構成成分、例えば限定はされな
いがタンパク質の量もしくはタンパク質の活性レベルの測定を含む生物学的プロ
フィールに同様に適用可能であることが判ることであろう。
【0024】 5.1. 緒言 細胞もしくはその他の生物学的サンプルの状態は、下記の第5.1.1節中に定義
されているとおりの細胞構成成分(何らかの測定可能な生物学的変数)によって示
される。細胞構成成分の1グループは特定の摂動に応答して同時に変化しうる。
それゆえ、本発明の1態様では同時変動する細胞構成成分のグループ分けのため
の方法を提供する。同時変動する細胞構成成分の各グループは細胞構成成分セッ
トと呼ばれる。本発明は生物学的サンプルの状態は細胞構成成分セットを用いる
ことによって個々の細胞構成成分を用いるよりも有利に示すことができるとの本
発明者らの発見を、部分的には前提としている。生物学的サンプルの応答は、細
胞構成成分そのものよりもむしろ同時変動する細胞構成成分セットの応答を調べ
ることによってよりよく分析することができるということも本発明者らの発見で
ある。
【0025】 本発明のいくつかの好ましい特異的実施形態においては、遺伝子はその発現の
調節の状態に従って基本遺伝子セットにグループ分けされる。ある遺伝子セット
内の個々の遺伝子の転写率は組み合わされ、射影プロセスによってその遺伝子セ
ットの単一の遺伝子発現値が得られる。遺伝子セットの発現値は個々の遺伝子の
転写率よりむしろ、生物学的応答の比較および検出のための基礎として非常に感
度の増強されたものが用いられる。
【0026】 本節ではまず生物学的状態および生物学的応答の細胞構成成分という形での提
示についての背景を示す。次いで、本発明の図式的で非限定的な概説を示し、本
発明の方法に従って生物学的状態および生物学的応答の提示について紹介する。
下記の節は本発明の特異的で非限定的な実施形態をより詳細に示す。
【0027】 5.1.1. 生物学的状態の定義 本明細書で用いられる場合、「生物学的サンプル」という用語は、いかなる細
胞、組織、臓器または多細胞生物をも含むものと広範に定義される。生物学的サ
ンプルは、例えば、細胞または組織培養物から in vitro で誘導することができ
る。その代わりに、生物学的サンプルは生きている生物から、または単細胞生物
の集団から誘導してもよい。
【0028】 生物学的サンプルの状態は、その細胞構成要素の内容物、活性または構造によ
って測定することができる。生物学的サンプルの状態は、本明細書で用いられる
場合、限定されるものではないが薬剤の作用または他の摂動の特性決定を含む意
図する目的のためにその細胞または生物を特性決定するのに十分である細胞構成
要素の集合の状態から採用される。また、「細胞構成要素」という用語は、この
開示においては、あらゆる種類の測定可能な生物学的変数を包含するように広範
に定義もされる。これらの構成要素の状態に関してなされる測定および/または
観察は、それらの量(すなわち、生物学的サンプル中の量もしくは濃度)、また
はそれらの活性、またはそれらの改変状態(例えば、リン酸化)、または生物学
的サンプルの生物学に関連する他の測定のものであり得る。様々な実施形態にお
いて、本発明は細胞構成要素の種々の集合に関してそのような測定および/また
は観察をなすことを含む。細胞構成要素の種々の集団は、本明細書では、生物学
的サンプルの生物学的状態の態様とも呼ばれる。
【0029】 本発明において有用に測定される生物学的サンプル(例えば、細胞もしくは細
胞培養物)の生物学的状態の一態様はその転写状態である。生物学的サンプルの
転写状態には、所定の条件のセットの下での細胞内の構成RNA種、特にはmRNA種
の性質および存在量が含まれる。好ましくは、生物学的サンプル中の全ての構成
RNA種の実質的な画分を測定するが、少なくとも目的の薬剤の作用または他の摂
動を特性決定するのに十分な画分を測定する。生物学的サンプルの転写状態は、
例えば、幾つかの既存の遺伝子発現技術のいずれかによってcDNA存在量を測定す
ることにより都合よく決定することができる。本発明の特に好ましい実施形態の
1つでは、多数の遺伝子のmRNAまたは転写産物レベルを測定するためにDNAアレ
イを用いる。
【0030】 本発明において有用に測定される生物学的サンプルの生物学的状態の他の態様
はその翻訳状態である。生物学的サンプルの翻訳状態には、所定の条件セット下
での生物学的サンプル中の構成タンパク質種の性質および存在量が含まれる。好
ましくは生物学的サンプル中の全ての構成タンパク質種の実質的な画分を測定す
るが、少なくとも目的の薬剤の作用を特性決定するのに十分な画分を測定する。
当業者には公知のように、転写状態はしばしば翻訳状態を代表するものである。
【0031】 生物学的サンプルの生物学的状態の他の態様も本発明において有用である。例
えば、生物学的サンプルの活性状態には、その用語が本明細書で用いられる場合
、所定の条件セット下での生物学的サンプル中の構成タンパク質種(および場合
によっては触媒的に活性な核酸種)の活性が含まれる。当業者には公知のように
、翻訳状態はしばしば活性状態を代表するものである。
【0032】 本発明は、関連性がある場合には、生物学的サンプルの生物学的状態の異なる
態様の測定を組み合わせた生物学的サンプルの生物学的状態の「混合」態様にも
適用可能である。例えば、混合態様の1つにおいては、特定のRNA種の存在量お
よび特定のタンパク質種の存在量を他の特定のタンパク質種の活性の測定と組み
合わせる。さらに、測定可能である生物学的サンプルの生物学的状態の他の態様
にも本発明を適用可能であることが以下の記載から理解されるだろう。
【0033】 生物学的サンプル(例えば、細胞もしくは細胞培養物)の生物学的状態は幾つ
かの細胞構成要素のプロフィールで表される。このような細胞構成要素のプロフ
ィールはベクトルSで表すことができる。
【0034】
【数1】 式中、Sは第i番目の細胞構成要素のレベル、例えば、遺伝子iの転写レベル
、あるいはタンパク質iの存在量もしくは活性レベルである。
【0035】 幾つかの実施形態においては、細胞構成要素を連続変数として測定する。例え
ば、転写速度は、典型的には、時間単位当たりに合成される分子数として測定す
る。また、転写速度は対照速度のパーセンテージとして測定することもできる。
しかしながら、幾つかの他の態様においては、細胞構成要素をカテゴリ的変数と
して測定することができる。例えば、転写速度を「オン」または「オフ」のいず
れかとして測定することができ、ここで値「オン」は所定の閾値を上回る転写速
度を示し、値「オフ」はその閾値を下回る転写速度を示す。
【0036】 5.1.2. 生物学的応答の表示 摂動、例えば、薬剤の適用に対する生物学的サンプルの応答は、その生物学的
サンプルの生物学的状態の変化を観察することによって測定することができる。
応答プロフィールは細胞構成要素の変化の集合である。本発明においては、摂動
mに対する生物学的サンプル(例えば、細胞もしくは細胞培養物)の応答プロフ
ィールをベクトルv(m)と定義する:
【数2】 式中、v は摂動mの下での細胞構成要素iの応答の振幅である。本発明の
幾つかの特に好ましい実施形態においては、薬剤、薬剤候補もしくはあらゆる他
の摂動の適用に対する生物学的応答を、少なくとも2つの遺伝子、好ましくは10
を上回る遺伝子、より好ましくは100を上回る遺伝子、および最も好ましくは1,0
00を上回る遺伝子の転写産物レベルの誘導された変化で測定する。
【0037】 本発明の幾つかの実施形態においては、この応答は単に摂動の前後での生物学
的変数の差である。幾つかの好ましい実施形態においては、この応答は摂動が適
用される前後での細胞構成要素の比と定義される。他の実施形態においては、こ
の応答は摂動後の時間の関数、すなわち、v(m)=v(m)(t)であり得る
。例えば、v(m)(t)は摂動の前と摂動後の時間tとの細胞構成要素の差ま
たは比であり得る。
【0038】 幾つかの好ましい実施形態においては、遺伝子iの応答が、閾値の振幅、また
は測定誤差挙動の知識から決定される信頼水準を下回る場合、v をゼロに設
定する。このような実施形態においては、測定される応答が閾値を下回る細胞構
成要素には応答値ゼロが与えられ、これに対して、測定される応答が閾値を上回
る細胞構成要素はそれらの測定応答値を保持する。この応答ベクトルの切捨ては
、小さい応答のほとんどが測定誤差で大きく占められるものと予想される場合、
良好な方策である。切捨ての後、応答ベクトルv(m)は、同様の摂動の存在に
関する「一致ディテクタ(matched detector)」(例えば、Van Trees, 1968, De
tection, Estimation, and Modulation Theory Vol.I, Wiley & Sonsを参照)に
も近づく。切捨てのレベルが検出の目的および測定誤差に基づいて設定できるこ
とは当業者に明らかである。例えば、幾つかの実施形態においては、転写レベル
の変化が2倍、より好ましくは4倍未満である遺伝子には値ゼロが与えられる。
【0039】 幾つかの好ましい実施形態においては、摂動を幾つかの強度レベルで適用する
。例えば、異なる量の薬剤を生物学的サンプルに適用してその応答を観察するこ
とができる。このような実施形態においては、摂動強度uの単パラメータ化「モ
デル」関数によって各々を近似化することにより摂動応答を内挿することができ
る。転写状態データの近似に適する例示的モデル関数はHill関数であり、これは
調整可能パラメータa、u、およびnを有する。
【0040】
【数3】 これらの調整可能パラメータは、その摂動応答の細胞構成要素の各々について独
立に選択される。好ましくは、調整可能パラメータは、各摂動強度でのモデル関
数(例えば、Hill関数、式3)と対応する実験データとの差の平方の合計が最小
になるように細胞構成要素の各々について選択する。この好ましいパラメータ調
整法は最小二乗フィットとして当該技術分野において公知である。他の可能性の
あるモデル関数は、様々な公知クラスの多項式による多項式フィッティングに基
づく。モデルフィッティングおよび生物学的応答のより詳細な説明は、Friendお
よびStoughton、Methods of Determining Protein Activity Levels Using Gene
Expression Profiles、米国仮出願第60/984,742号(1998年5月8日出願に開示さ
れ、これは全ての目的のために参照により本明細書に組み込まれる)に開示され
ている。
【0041】 5.1.3. 発明の概要 本発明は生物学的状態および生物学的応答の増強された検出、分類およびパタ
ーン認識のための方法を提供する。本発明者らの発見は、生物学的状態および応
答の測定、すなわち、細胞構成要素および細胞構成要素の変化を同時変化するセ
ットに分類できるということである。このような同時変化するセットに関する生
物学的状態および応答の表示は生物学的状態および応答のプロフィールの表示を
上回る多くの利点を提供する。
【0042】 本発明の一態様では、同時変化する細胞構成要素のセットを定義する方法が提
供される。図1は本発明の本態様の例示実施形態の模式図である。まず、生物学
的サンプル(または生物学的サンプルの集団)に様々な摂動を施す(101)。生
物学的サンプルは、異なる摂動の下で連続的に繰り返して試験してもよいし、ま
たは多くの生物学的サンプルを用い、それらの生物学的サンプルの各々を1つの
摂動について試験してもよい。特定のタイプの摂動、例えば、薬剤に対して、異
なる用量の摂動を適用することができる。
【0043】 幾つかの特に好ましい実施形態においては、種々の化学化合物、突然変異、温
度変化等を摂動として用いて大きなデータ・セットを作成する。ほとんどの実施
形態においては、少なくとも5つの異なる摂動、好ましくは10を上回る異なる摂
動、より好ましくは50を上回る異なる撹拌、最も好ましくは100を上回る異なる
撹拌を用いる。
【0044】 本発明の好ましい実施形態においては、本明細書でクラスター分析に用いられ
る生物学的サンプルは同じタイプのものであり、かつ目的の種と同じ種に由来す
るものである。例えば、ヒト腎細胞の分析に有用である細胞構成要素セットを定
義するにはヒト腎細胞を試験する。幾つかの他の好ましい実施形態においては、
本明細書でクラスター分析に用いられる生物学的サンプルは同じタイプのもので
はないか、または同じ種に由来するものではない。例えば、酵母細胞を用いてヒ
ト組織分析に有用である特定の酵母細胞構成要素セットを定義することができる
【0045】 摂動を施した生物学的サンプルはそれらの細胞構成要素(レベル、活性、また
は構造変化等)についてモニターする(102)。これらの生物学的サンプルを、
本明細書では場合により、トレーニング(training)サンプルと呼び、得られた
データをトレーニング・データと呼ぶ。「監視する」という用語は、本明細書で
用いられる場合、連続測定に加えて最終点測定を含むことが意図されている。幾
つかの実施形態においては、生物学的サンプルの細胞構成要素を連続的に測定す
る。他の実施形態においては、撹拌の前後の細胞構成要素を測定して比較する。
さらに別の実施形態においては、細胞構成要素を摂動を行わずに生物学的サンプ
ルの対照群において測定し、かつ幾つかの実験群の細胞構成要素を測定して対照
群のものと比較する。摂動に応答して生じる細胞構成要素の変化を検出する他の
実験設計も本発明の方法に適することは当業者には明らかである。
【0046】 様々な摂動に対する細胞構成要素の応答を分析して同時変化するセットを作成
する(103)。このデータを、まず、下記第5.2節に記載される方法に従ってクラ
スター分析することによってグループ分けし、摂動に対する細胞構成要素の応答
の類似性を表すクラスター樹を作成する(104)。セット(枝)の数が、好まし
くは、研究する細胞構成要素に関与する既知経路の数と一致するようにカットオ
フ値を設定する(105)。経路の数が不明である幾つかの実施形態においては、
細胞構成要素を真に異なる枝(すなわち、セット)の最大数にクラスター化する
【0047】 細胞構成要素のセットは、当該技術分野から得られる、絶えず増加する生物学
的経路および調節経路に関する知識を利用することによって洗練させることがで
きる(106)。逆に、本発明のクラスター分析法は複雑な生物学的経路の解読に
有用である。
【0048】 本発明の別の態様においては、生物学的サンプルの生物学的状態および生物学
的応答を細胞構成要素セットの組み合わせ値で表す。図2に示される例示的な一
態様においては、生物学的サンプル(201)の細胞構成要素(202)を3つの予め
定義される細胞構成要素セット(203)、(204)および(205)にグループ分け
する。細胞構成要素セット内での細胞構成要素(202)の測定を組み合わせてセ
ット値(206)、(207)および(208)を生成する。この細胞構成要素値からセ
ット値に変換する工程を「射影(projection)」と呼ぶ。この射影操作は、プロ
フィールをより小さくかつ生物学的により重要な座標セットに表示し、測定誤差
の効果を各々のセット全体にわたって平均化することによって低下させ、そのプ
ロフィールの生物学的解釈を補助する。
【0049】 セット値を使用することで個々の細胞構成要素値を組み合わせることによる情
報の損失が必ずしも生じるというわけではない。セット内の細胞構成要素は同時
変化するため、個々の細胞構成要素が組み合わせセット値よりも提供する情報は
少しも多くない。ほとんどの実施形態において、この工程では、プロフィールの
定量的記述が例えばメンバーが100のリストから実質的により短いリスト、例え
ば10に変化し、これは、合計してプロフィール全体を厳密に表すのに必要な個々
の応答パターン(遺伝子セットのいずれか1つにおける協調変化)の各々の振幅
を表す。
【0050】 しかしながら、細胞構成要素値からセット値への変換は、測定誤差およびラン
ダム変動を大幅に減少させ、したがってパターンの検出を高めることにより、多
くの利点をもたらす。
【0051】 本発明の別の態様は、薬剤の発見、診断、遺伝子解析および他の用途における
細胞構成要素セットへのプロフィールの簡素化された記述、すなわち、「射影」
の使用方法を提供する。幾つかの好ましい実施形態における細胞構成要素セット
、特には遺伝子セットに関して表される応答のプロフィールは高い精度で比較す
ることができる。本発明の幾つかの実施形態においては、未知の摂動、例えば、
薬剤候補に対する生物学的サンプルの遺伝子セット応答プロフィールを、幾つか
の既知摂動を用いて作成した遺伝子セットプロフィールと比較する。未知摂動の
生物学的性質、例えば、その薬理学的活性を、その応答プロフィールと既知プロ
フィールとの類似性を調べることによって決定することができる。幾つかの実施
形態においては、類似性の客観的基準を用いる。特に好ましい実施形態の1つに
おいては、比較する二つのプロフィールの射影を表すベクトル間の一般化角度(
generalized angle)(「正規化内積(normalized dot product)」が客観的基
準である。幾つかの他の実施形態においては、射影されたプロフィールの遺伝子
セットの各々に関連する振幅を閾値でマスクしてその遺伝子セットの変化の有無
を示すことができる。これは、別々に検出されたその遺伝子セットに由来する個
々の細胞構成要素に基づくものよりも高感度の、その遺伝子セットの変化のディ
テクタである。また、これはその遺伝子セットの変化の振幅のより正確な定量的
モニターでもある。したがって、特定の生物学的摂動の存在をより高感度に検出
することができ、異なる化合物または摂動の作用機構の間の類似性がより効率的
に発見される。
【0052】 5.2. 具体的な実施形態:基本遺伝子セットの定義 本節においては、本発明の好ましい実施形態を詳細に説明する。基本遺伝子セ
ットを本発明の例示的実施形態として用いてはいるが、本発明が遺伝子セットお
よび遺伝子発現に限定されるものではなく、多くのタイプの細胞構成要素を分析
するのに有用であることは当業者には明らかである。
【0053】 本発明の特定の態様の1つは、同時調節された遺伝子を遺伝子セットにクラス
ター化するための方法を提供する。本説では、同時調節された遺伝子をクラスタ
ー化するための方法のより詳細な考察を提供する。
【0054】 5.2.1 同時調節された遺伝子および遺伝子セット 特定の遺伝子は群をなしてそれらの発現を増加または減少させる傾向がある。
遺伝子は、それらが同様の調節配列パターン、すなわち、転写因子結合部位を有
する場合、一緒にそれらの転写速度を増加または減少させる傾向がある。これが
特定のシグナル伝達入力に対する協調応答の機構である(例えば、Madhaniおよ
びFink, 1998, The riddle of MAP kinase signaling specificity, Transactio
ns in Genetics 14:151-155;ArnoneおよびDavidson, 1997, The hardwiring of
development: organization and function of genomic regulatory systems, D
evelopment 124:1851-1864を参照)。必要なタンパク質または細胞構造の異なる
成分を生成する別々の遺伝子は同時変化する傾向がある。重複遺伝子(例えば、
Wagner, 1996, Genetic redundancy caused by gene duplications and its evo
lution in networks of transcriptional regulators, Biol. Cybern. 74:557-5
67を参照)も、突然変異が調節領域における機能的相違につながらない程度まで
同時変化する傾向がある。さらに、調節配列はモジュラーであるため(例えば、
Yuhら, 1998, Genomic cis-regulatory logic: experimental and computationa
l analysis of a seaurchin gene, Science 279:1896-1902を参照)、2つの遺
伝子が共通して有するモジュールが多いほどそれらの転写速度が同時変化するも
のと予想される条件の多様性が大きくなる。コアクチベーターも関与するため、
モジュール間の分離も重要な決定因子である。したがって、要約すると、あらゆ
る有限の条件セットについて、遺伝子が全て独立に変化するわけではなく、かつ
同時変化する遺伝子およびタンパク質の簡素化サブセットが存在することが期待
される。これらの同時変化する遺伝子セットは、有限の条件セット内での全ての
プロフィール変化を説明する、数学的な意味での完全な原理を形成する。本発明
の一態様では、遺伝子を同時変化する遺伝子の群に分類する。これらの群、すな
わち遺伝子セットの応答を分析することで、検出感度および分類精度の増大が可
能となる。
【0055】 5.2.2. クラスター分析による遺伝子セットの分類 本発明の多くの用途に対して、多種多様な条件にわたって同時調節される基本
遺伝子セットを見出すことが望ましい。これにより、本発明の方法が、期待され
る特性が十分に線引きされていない大きなクラスのプロフィールに対して十分に
機能するようになる。このような基本 遺伝子セットを同定するための好ましい
実施形態はクラスター化アルゴリズムを含む(クラスター化アルゴリズムの概説
は、例えば、Fukunaga, 1990, Statistical Pattern Recongnition,第2版, Aca
demic Press, San Diego;Everitt, 1974, Cluster Analysis, London: Heinema
nn Educ. Books;Hartigan, 1975, Clustering Algorithms, New York: Wiley;
Sneath and Sokal, 1973, Numerical Taxonomy, Freeman;Anderberg, 1973, Cl
uster Analysis for Applications, Academic Press: New Yorkを参照)。
【0056】 クラスター分析を用いる実施形態の幾つかにおいては、生物学的サンプルに多
種多様な摂動を施しながら、多数の遺伝子の発現をモニターする(本発明に有用
な摂動の詳細な考察については、下記第5.8.節を参照)。遺伝子発現の測定を含
むデータの表がクラスター分析に用いられる。多種多様な条件にわたって同時変
化する遺伝子を含む基本遺伝子セットを得るためには、少なくとも10、好ましく
は50を超え、最も好ましくは100を超える摂動または条件を用いる。クラスター
分析はm×k次元を有するデータの表に対して行い、ここでmは条件または摂動
の合計数であり、かつkは測定する遺伝子の数である。
【0057】 多くのクラスター化アルゴリズムがクラスター化分析に有用である。クラスタ
ー化アルゴリズムは、クラスターを形成する場合に、対象間の相違点または距離
を用いる。幾つかの実施形態においては、用いられる距離は多次元空間における
ユークリッド距離:
【数4】 であり、式中I(x,y)は遺伝子Xと遺伝子Yとの(または、あらゆる他の細胞
構成要素XとYとの)距離であり;XおよびYは摂動iの下での遺伝子発現
応答である。ユークリッド距離を平方してさらに遠隔の対象に徐々に大きくなる
重みをかけることができる。その代わりに、距離基準は、例えば遺伝子XとYと
の間の、マンハッタン距離であってもよく、これは:
【数5】 によって与えられる。ここでもやはり、XおよびYは摂動iの下での遺伝子
発現応答である。他の幾つかの距離の定義は、チェビシェフ距離、パワー距離お
よび不一致率である。次元のデータが自然のままでカテゴリー的である場合、I
(x,y)=(X≠Yの数)/iとして定義される不一致率が本発明の方法に
特に有用である。細胞応答に関連して特に有用である、他の有用な距離定義はI
=1−rであり、式中rは応答ベクトルX、Y間の相関係数であって、正規化内
積X・Y/|X||Y|とも呼ばれる。具体的には、内積X・Yは式:
【数6】 によって定義され、かつ|X|=(X・X)1/2、|Y|=(Y・Y)1/2 である。
【0058】 最も好ましくは、距離基準を、例えば、同時変化するおよび/または同時調節
される細胞構成要素(同時変化するまたは同時調節される遺伝子など)を同定す
るために、問題となっている生物学的問題点に適合させる。例えば、特に好まし
い実施形態において、距離は、遺伝子XおよびYの加重内積を含む相関係数を有
するI=1−rを基準とする。具体的には、この好ましい実施形態において、r η は好ましくは以下に示す式:
【数7】 によって定義される。式中、σl (X)およびσl (Y)は、実験iにおける遺伝子Xお
よびYの測定とそれぞれ関連する標準誤差である。
【0059】 上記正規および加重内積の相関係数は、値+1(2つの応答ベクトルが完全に
相関し、本質的に同一であることを示す)と−1(2つの応答ベクトルが「相関
していない」または「同一方向を向いていない」(すなわち反対を向いている)
ことを示す)との間に拘束される。これらの相関係数は、細胞構成要素セットま
たはクラスターが同じ兆候の応答を有する細胞構成要素を求める本発明の実施形
態に特に好ましい。
【0060】 他の実施形態において、同じ生物学的応答または経路を同時調節するかまたは
それに関与しているが、類似しかつ非相関の応答を含む細胞構成要素セットまた
はクラスターを同定することが好ましい。例えば、図10は、シグナルが、G1
、G2およびG3と同定されるいくつかの遺伝子をアップレギュレートした転写
因子を活性化するカスケードを示す。図10に示す例においては、G3の産物は
いくつかの異なる遺伝子、例えばG4、G5およびG6のリプレッサーエレメン
トである。したがって、同じ細胞構成要素セットまたはクラスターの一部として
6つの遺伝子G1〜G6の全てを同定しうることが好ましい。そのような実施形
態においては、上述の正規化または加重内積のいずれかの絶対値、すなわち|r
|を相関係数として使用することが好ましい。
【0061】 さらに他の実施形態においては、同時調節されるおよび/または同時変化する
細胞構成要素(遺伝子など)の間の関係はさらに複雑であり、多数の生物学的経
路(例えばシグナル伝達経路)が同じ細胞構成要素に集まり、異なる結果を出す
ような例がある。そのような実施形態においては、同時変化するおよび/または
同時調節される細胞構成要素(兆候とは無関係のもの)を同定することができる
、相関係数r=r(変化)を用いることが好ましい。以下の式8に特定される相
関係数は、そのような実施形態に特に有用である:
【数8】 種々のクラスター連関法則が本発明の方法に有用である。単一連関法、最近接
点法は、2つの最も近い対象物間の距離を測定する。それとは反対に、完全連関
法は、異なるクラスターにある2つの対象物間の最大距離で距離を測定する。こ
の方法は、遺伝子または他の細胞構成要素が天然に別個の「凝集(clump)」を
形成する場合には特に有用である。あるいは、非加重ペア群の平均が、2つの異
なるクラスターにおける対象物ペア全ての間の平均距離として距離を定義する。
この方法もまた、天然に別個の「凝集」を形成する遺伝子または他の細胞構成要
素をクラスター化するのに非常に有用である。最後に、加重ペア群平均法も利用
可能である。この方法は、それぞれのクラスターのサイズを重みとして使用する
ことを除けば非加重ペア群平均法と同じである。この方法は、クラスターのサイ
ズが非常に可変すると疑われる実施形態に特に有用である(SneathおよびSokal
、1973, Numerical taxonomy, San Francisco: W. H. Freeman & Co.)。他のク
ラスター連関法則、例えば非加重および加重ペア群セントロイドおよびウオード
法もまた本発明のいくつかの実施形態に有用である。例えば、Ward, 1963, J. A
m. Stat Assn. 58: 236;Hartigan, 1975, Clustering algorithms, New York:
Wileyを参照のこと。
【0062】 特に好ましい一つの実施形態において、クラスター分析はhclustの慣例手順(
例えば、ソフトウェアパッケージS-Plus, MathSoft, Inc.,Cambridge, MAからの
「hclust」の慣例手順を参照されたい)を用いて行う。S-Plusのhclustアルゴリ
ズムにより出力されたクラスター化「ツリー」の例を図6に示す(以下の実施例
1、第6.1節もまた参照されたい)。この場合のデータセットは18の実験を含むが
、それらには、ヒトの免疫抑制に類似した、酵母S.セレビシエ(S.cerevisiae)
の生化学的経路に関連した、異なる薬剤処理および遺伝的変異が含まれる。測定
されたmRNAレベルの6000を超えるセットを、最初に、少なくとも1つの実験にお
いて少なくとも4倍の応答振幅を有する遺伝子のみを選択して48まで減少させた
。この最初の下方選択により、大部分の実験において大部分の遺伝子の小さな応
答よりも優勢であった測定誤差の複雑化作用が著しく減少した。続いて、「hclu
st」を用いたクラスター化を得られた18×48データ表について行い、図6に示し
たクラスター化ツリーを得た。クラスター化セットにおける実験の回数および多
様性(diversity)が多い場合には、有意の応答を有する測定された細胞構成要素
の分別(測定誤差レベルを十分に上回るもの)も多くなり、最終的には細胞構成要
素セットのほとんど全てが最初の下方選択で維持され、クラスター化ツリーに表
示される。そして、ツリーから誘導される遺伝子セットは、細胞構成要素のセッ
トをより完全にカバーする。
【0063】 クラスター化セットにおける摂動の多様性が大きくなるにつれて、明瞭に区別
し得る遺伝子セットはより小さく、より多くなる。しかしながら、非常に多数の
実験セットさえも上回る、統一性を保有する小さな遺伝子セットが存在するとい
うことが本発明により見出された。これらの遺伝子セットを「削減不能(irreduc
ible)遺伝子セット」と称する。本発明の実施形態のいくつかは、多数の多様な
摂動を適用し、かかる削減不能遺伝子セットを得るものである。例えば、図6の
左側の遺伝子セット1は、はるかに多くの摂動条件セットに対してクラスター化
を行った場合にも見られるものである。前述の18を含む、365の酵母の条件のデ
ータセットを、クラスター分析のために使用した。摂動条件には、異なる濃度で
の薬剤処理、処理後の異なる測定時間、種々の遺伝子中の遺伝的変異に対する応
答、薬剤処理と変異との組合せ、ならびに増殖条件の変化(温度、密度、および
カルシウム濃度など)が含まれる。大部分の摂動条件が18の実験セットにおいて
使用した免疫抑制剤には何の影響も及ぼさなかったが、遺伝子セットはその統一
性を維持していた。遺伝子セット2および3もまた部分的統一性を維持していた
【0064】 遺伝子セットは、ツリー中の多数のより小さな分枝、または少数のより大きな
分枝に基づいて、異なるレベルでツリーを横断してカットすることにより定義さ
れ得る(図6の破線の例を参照されたい)。カットのレベルの選択は、予測される
個別の応答経路の数に一致するように行い得る。経路の数についての、入手し得
る以前の情報が少ないかまたは皆無である場合には、ツリーを、実際に異なる数
の分枝へ分割しなければならない。「実際に異なる」とは、個別の分枝間の距離
の最小値によって定義される。図6において、この距離は2つの分枝を結合して
いる水平結合子の垂直座標である。典型的な値は0.2〜0.4の範囲にあるが(0が
完全な相関状態にあり、1は相関が全くないことを示す)、より質の悪いデータ
、またはトレーニングセットにおけるより回数の少ない実験については値は大き
くなるであろうし、良質なデータおよびトレーニングセットにおいてより多く行
った実験については、値は小さくなるであろう。
【0065】 好ましくは、「実際に異なる」とは、ツリー中の各分枝に関する統計的有意性
の客観的な試験とともに定義され得る。本発明の一態様においては、実験のセッ
トを横断する各細胞構成要素の応答に関する実験の見出しを、モンテカルロ法で
無作為化することにより、客観的試験を定義した。
【0066】 実施形態のいくつかにおいては、客観的試験を以下の方法で定義する: pkiを、実験iにおける構成要素kの応答とする。Π(i)を実験のインデックスの
無作為並べ替えとする。次いで、多数(約100〜1000)の異なる無作為並べ替えの
各々について、pkΠ(i)をたてる。元のツリーの各分枝について、各並べ替えに
関して: (1)並べ替えていない元のデータに対して用いたのと同じアルゴリズム(こ
の場合は「hclust」)を用いて階層的クラスター化を行う; (2)1つのクラスターから2つのクラスターへ移動する際の、クラスター中
心に関しての総分散における分別の改善fを計算する;
【数9】 式中、Dkは、帰属するクラスターの中心に関しての構成要素kの距離基準(平均
)の二乗である。上付(superscript)の1または2は、それが全分枝の中心に関
するものであるのか、または2つのサブクラスターのうちの好適なクラスターの
中心に関するものであるのかを示す。このクラスター化法において使用する距離
関数Dの定義には、かなりの自由度がある。これらの例においては、D=1-rであり
、rは、実験セットを横断する1つの構成要素の応答間の、別の応答に対しての
(または平均クラスター応答に対しての)相関係数である。
【0067】 モンテカルロ法から得られた分別の改善(fractional improvement)の分布は、
特定の分枝が有意ではないという無意味な仮説の下での分布の推定である。その
後、置換していないデータによる分枝に関する現実の分別の改善は、有意性を規
定するその無意味な仮説から得られる累積的確立分布と比較する。標準偏差は、
その無意味の仮説の分布に対する通常の対数モデルフィッティングにより導かれ
る。
【0068】 図6に示す分枝に付記した数値は、各分枝の標準偏差における有意性である。
例えば、約2より大きな数値は、その分枝が95%の信頼水準で有意であることを
示す。
【0069】 例えば、図6に示す水平カットを用いると、その分岐のうち該カットより下方
にあり、2つ以上のメンバーを有する分岐だけが、遺伝子セットとして認定され
、図6に示すように3つの遺伝子セットが得られる。これら3つの遺伝子セットは
、カルシニューリンタンパク質、PDR遺伝子、およびGcn4転写因子を含む経路を
反映する。従って、クラスター解析により規定される遺伝子セットは、根底に生
物学的な有意性を有している。
【0070】 さらに詳しく述べると、好ましくは客観的統計学的検定を用いてあらゆるクラ
スター化法またはアルゴリズムのグループ化決定の統計学的信頼性を判定する。
好ましくは、同様の検定を、階層的および非階層的クラスター化法の双方に用い
る。更に好ましくは、用いる統計的検定は、以下のステップ:(a)本発明のクラ
スター化法の一つにより決定されるクラスターのコンパクト性の測定値を得るス
テップ、および(b)得られたコンパクト性の測定値を、クラスターの数を増加さ
せてその中で再グループ化された細胞構成要素のコンパクト性の仮の測定値と比
較するステップ、を含む。例えば、hclustなどの階層的クラスター化アルゴリズ
ムを用いる実施形態では、このコンパクト性の仮の測定値は、クラスター化ツリ
ーにおける最も下位のものに次いで下位にある分枝で(例えば、図11のレベル
2ではなくレベル1で)選択されるクラスターに関するコンパクト性の測定値を
意味する。あるいは、非階層的クラスター化法またはアルゴリズムを用いる実施
形態においては、例えば、N個のクラスターを形成するためには、このコンパク
ト性の仮の測定値が同様の方法でN+1個のクラスターに対して得られるコンパク
ト性であることが好ましい。
【0071】 クラスターのコンパクト性は、例えば、「クラスターの平均値」からのクラス
ターのエレメントの距離の二乗の平均として、またより好ましくは、クラスター
の平均値からのエレメントの距離の二乗の平均値の逆数として、定量的に定義さ
れる。特定のクラスターのクラスター平均値は、クラスターの全てのエレメント
の応答ベクトルの平均値として一般に定義される。しかし、特定の実施形態(ク
ラスターの平均値に定義が疑わしい場合など)では、例えば、正規化または加重
内積の絶対値を用いて、クラスター化アルゴリズムの距離関数(即ち、I=1-|r|)
を評価する。より一般的には、上記の平均値の定義は、応答ベクトルが反対方向
を向き、上記に定義するクラスター平均値がゼロになりうる実施形態では疑問が
ある。従って、このような実施形態では、クラスターのコンパクト性の異なる定
義を選択することが好ましく、例えば限定はしないが、クラスター内のエレメン
トの全てのペア間の距離の二乗の平均値などがある。あるいは、クラスターのコ
ンパクト性は、クラスターの各エレメント(例えば、細胞構成要素)からそのクラ
スターの他のエレメントまでの平均距離(またはより好ましくは、平均距離の逆
数)を意味すると定義できる。
【0072】 好ましくは、クラスターのコンパクト性を仮のコンパクト性と比較する上記(b
)のステップは、クラスターの数を増やして、その中で変化したコンパクト性に
対する非パラメトリック統計的分布を作成することを意味する。より好ましくは
、このような分布は、現実のデータを模倣するモデルを用いて作成され、固有の
クラスター化構造(つまり「無意味な仮説」モデル)は含まない。例えば、この
ような分布は以下のステップ:(a)各細胞構成要素Xに対する摂動実験インデック
スiを無作為化するステップ、および(b)例えばNからN+1へのクラスター数の増加
(非階層的クラスター化法)、またはクラスターが定義される分枝レベルの増加(
階層的方法)などにより、各分布に対して生じるコンパクト性の変化を算出する
ステップ、により作成できる。
【0073】 このようなプロセスは、摂動ベクトルが二次元であり(即ち、2つの摂動実験
があり、i=1,2)、かつ長さ|X|=2を有する場合のクラスター化法の非階層
的な実施形態を例示として図12に示している。従って、これらの応答ベクトル
は、二次元空間の点として図12に示されている。この例では、2つの明らかなク
ラスターが区別できる。これら2つのクラスターは図12Aに示されており、円形
のクラスターとダンベル形のクラスターである。クラスター中心は、三角印(▲)
で示している。当業者には明らかなように、図12の摂動ベクトルの分布はまた
3つのクラスターに分けられ、図12Bにそれらの対応する中心と共に示している
。やはり、当業者には明らかであろうが、図12Bに示す2つの新しいクラスター
のそれぞれは、図12Aの1つのダンベル形のクラスターよりコンパクトである。
しかし、このようなコンパクト性の増加は、統計学的には有意ではなく、従って
、現実のまたは特定の細胞構成要素セットを示さないかもしれない。特に、N個
のクラスターのセットのコンパクト性はそのクラスター中心から各エレメントの
距離を二乗した平均値の逆数、即ち、1/D(N) 平均値として、この例では定義でき
る。一般には、D(N+1) 平均値<D(N) 平均値である。更なる「真の」細胞構成要素
セットがあるかどうかには関係しない。従って、本発明の統計学的方法は、クラ
スターの数がN=2からN+1=3まで増加する場合、この例において生じるコンパクト
性の増加の統計的有意性を評価するために用いてもよい。
【0074】 例示的実施形態としては、この増加するコンパクト性は、次式:
【数10】 によって定義されるパラメータEから導かれる。
【0075】 しかし、本発明の統計的方法においても使用しうるその他の定義は、当業者に
は明らかである。一般的に、Eがクラスターのコンパクト性の増大に単調に関係
する場合、Eの正確な定義は重要ではない。
【0076】 本発明の統計的方法は、Eの有意性を分析するための方法を提供する。具体的
にはこれらの方法は、コンパクト性(すなわち実際の実験データについてはE0
の実際の増加を、無作為に並べ替えたデータから決定したE値の経験的分布(例
えば、上記式10により)に対して比較することによって、Eを分析するための経
験的分布法を提供する。図12に示した2次元の例において、このような変換は、
第1に、各応答ベクトル内の摂動インデックスi=1,2を無作為に、同じ確率で交
換することを含む。より具体的には、細分割されている各クラスターにおけるベ
クトルの座標表示(すなわちインデックス)は、例えば、図12Cに示すように、
最初に座標軸をクラスター中心に変換することにより、クラスター中心付近を「
反映」している。このような操作の結果は、2次元の例について図12Dに示す。
第2に、無作為に並べ替えたデータは、本発明のクラスタールゴリズムによって
再評価する。最も好ましくは、最初のクラスターを決定したのと同じクラスター
ルゴリズムによって再評価し、新しいクラスターを、並び替えたデータについて
決定し、E値はこの新たなクラスターについて評価する(すなわち、1以上の新
たなクラスターを分割するために行う)。上記ステップ1および2をいくつかの
モンテカルロ試験に対して繰り返し、E値の分布を作成する。モンテカルロ試験
の回数は、好ましくは約50〜1000、より好ましくは約50〜100である。最後に、
コンパクト性(すなわちE0)の実際の増大を、このE値の経験的分布と比較する
。例えば、M回のモンテカルロシミュレーション(χはE0より大きなE値を有する
)を実施すると、クラスター数の信頼水準は1-χ/Mにより評価しうる。特に、M=
100でχ=4であるとき、クラスター数の増加において現実の有意性が存在しない
信頼水準は1-4/100=96%である。
【0077】 上記の方法は、階層的クラスターおよび/または複数のエレメント(例えば、
2つ以上細胞構成要素)を含んでなる実施形態に対し、同様に適用できる。例え
ば、クラスターツリーを図11に示す。このクラスター化ツリーは有意な応答を示
した185の細胞構成要素を含む34の摂動応答プロフィールに対してhclustアルゴ
リズムを使用して得られた。このツリーのレベル2の枝によって定義されるクラ
スターを用いて、100回のモンテカルロシミュレーションを実施して34の実験的
インデックスを無作為化し、コンパクト性Eの向上についての経験的分布を、該
ツリー内の各分岐について作成した。各枝におけるコンパクト性E0の実際の向上
を、これに対応する分布と比較した。これらの比較は、図11における各枝の数字
で示す。具体的には、これらの数値は、該分布における標準偏差の数値を示し、
E0はEの平均値をこの数値分上回る。示した有意性は、独立して決定した該枝の
生物学的有意性と、よく一致する。例えば、図7に数5(下部のラベル)で示し
た主要な枝は、カルシニューリンタンパク質を介して制御される遺伝子を含み、
一方、数7でラベルされた枝は主にGcn4転写因子によって制御される遺伝子を含
む。
【0078】 さらに、本発明のモンテカルロ法を例示目的で上述したが、摂動インデックス
iの並べ替えに関して、この方法は、細胞構成要素インデックスに独立の生物学
的応答データの任意のインデックスを並べ替えることにより使用しうることは、
当業者であれば用意に理解するだろう。例えば、いくつかの実施形態においては
細胞構成要素Xについての応答プロフィールデータは時間の関数(例えば、摂動
インデックスに加えて又はそのかわりに時間のインデックスtを有するX(t))で
ありうる。このような実施形態においては、本発明のモンテカルロ法はまた、時
間インデックスtを並べ替えることによって使用しうる。
【0079】 本発明のクラスター分析法の別の態様は、以下の節に記載するプロフィール射
影(profile projection)において使用するための基底ベクトルの定義を提供する
【0080】 基底ベクトルVのセットはκ×nの次元を有し、κは遺伝子の数、nは遺伝子セ
ットの数を表す。
【0081】
【数11】 V(n) κは基底ベクトルnにおける遺伝子インデックスκの振幅の寄与である。
いくつかの実施形態においては、遺伝子κが遺伝子セットnのメンバーであれば
V(n) κ=1となり、遺伝子κが遺伝子セットnのメンバーでないならば、V(n) κ=0
となる。いくつかの実施形態において、遺伝子セットnを定義するために使用し
たトレーニングデータセットにわたって、V(n) κは遺伝子セットnにおける遺伝
子κの応答に比例する。
【0082】 いくつかの好ましい実施形態においては、エレメントV(n) κは、遺伝子セット
n内の遺伝子の数の平方根で除することにより、各基底ベクトルV(n)が単位長さ
を有するように正規化する。これにより、直交するだけでなく(クラスターツリ
ーをカットすることにより派生する遺伝子セットをバラバラにする)、正規直交
(単位長さ)の基底ベクトルが生じる。この正規化の選択によって、プロフィー
ルにおける無作為測定誤差が、振幅が各nに匹敵するように、V(n) κ上に射影す
る。正規化は、大きな遺伝子セットが、類似性演算の結果を支配することを防止
する。
【0083】 5.2.3. 調節機構に基づく遺伝子セットの分類 遺伝子セットは、遺伝子調節の機構に基づいて定義することもできる。その調
節領域が同じ転写因子結合部位を有している遺伝子は、より同時調節(co-regul
ated)されやすい。幾つかの好ましい実施態様では、目的とする遺伝子の調節領
域は、複合アラインメント分析を用いて比較され、可能な共有転写因子結合部位
が解読される(Stormo及びHartzell, 1989, 「非整列DNA断片由来のタンパク質
結合部位の同定(Identifying protein binding sites from unaligned DNA fra
gments)」, Proc Natl Acad Sci 86:1183-1187;Hertz及びStormo, 1995, 「非
整列DNA中の共通パターン及びタンパク質配列の同定:ペナライジングギャップ
の偏りの大きな統計的基礎(Identification of consensus patterns in unalig
ned DNA and protein sequences: a large-deviation statistical basis for p
enalizing gaps)」, Proc of 3rd Intl Conf on Bioinformatics and Genome R
esearch, Lim及びCantor編集, World Scientific Publishing Co., Ltd. Singap
ore, pp.201-216)。例えば、下記の実施例3が示すように、20個の遺伝子中のGe
n4に応答する共通プロモーター配列は、それらの20個の遺伝子が多種多様な摂動
(perturbations)に亘って同時調節される原因となりうる。
【0084】 遺伝子の同時調節は、同じ転写因子に対する結合部位を有するものに限定され
ない。同時調節される(共変動する)遺伝子は、上流の遺伝子の産物が下流の遺
伝子の活性を調節する、上流/下流関係にあってもよい。多種類の遺伝子調節ネ
ットワークが存在することは当業者には周知である。また、当業者であれば、本
発明の方法が、任意の特定種類の遺伝子調節機構に限定されないことを理解する
。2つの遺伝子が摂動に応答してそれらの活性変化によって同時調節されること
が、調節機構に由来する可能性があるならば、その2つの遺伝子は、ある遺伝子
セット中にクラスター化されているかもしれない。
【0085】 目的とする遺伝子の調節の完全な理解が不十分であるため、クラスター分析と
調節機構の知識(acknowledge)を組み合わせて、より明確化された遺伝子セッ
トを誘導することがしばしば好ましい。例えば、幾つかの実施態様では、クラス
ター分析によって同定された統計的に有意な遺伝子セットを生物学的に有意な遺
伝子セット(例えば、調節機構研究で同定されたもの)と比較する。幾つかの好
ましい実施態様では、目的の遺伝子調節が部分的に知られている場合、K−手段
クラスター化(K-means clustering)を用いて、遺伝子セットをクラスター化す
ることができる。K−手段クラスター化は、多数の遺伝子セットが調節機構の理
解によって予め決定されている場合に特に有用である。一般に、K−手段クラス
ター化は、多数の所望のクラスターを確実に製造することを強制される(constr
ained)。従って、プロモーター配列の比較が、測定された遺伝子が3つの遺伝子
セット中に入るはずであることを示すなら、K−手段クラスター化を用いてクラ
スター間で可能な最大の区別(greatest possible distinction)をもった3つの
遺伝子セットを確実に生産することができる。
【0086】 5.2.4. 遺伝子セット及び遺伝子セット定義データベースの精緻化(refinement
上記のように見出された遺伝子セットは、共通調節配列パターンの検索、強調
節についての文献証拠、配列相同性、既知の共有機能などを含む裏付け情報の任
意の幾つかの供給源によって精緻化(refined)されうる。
【0087】 データベースは、遺伝子セットの精緻化に特に有用である。幾つかの実施態様
では、遺伝子セットのクラスター分析の生データを含むデータベースが、遺伝子
セット定義の継続的な更新に使われる。図3は、動的な遺伝子セットデータベー
スの1つの実施態様を示す。摂動実験(301)からのデータを、摂動データベー
ス管理システム(308)のデータテーブル(302)にインプットする。基準ベクト
ル(basis vectors)の形態での、遺伝子セット定義は、クラスター分析(303)
及び生物学的経路定義(305, 306)を用いた摂動データベースの更新データに基
づいて継続的に生成される。得られる遺伝子セット定義データベース(304)は
、更新された遺伝子セット定義を含む。
【0088】 遺伝子セット定義は、生物学的経路データベースの精緻化に用いられる。遺伝
子セット定義テーブルは、ユーザー提出射影要求(user-submitted projection
requests)によってアクセスできる。ユーザー(313)は、発現プロフィール(3
11)を提出することによってデータベース管理システムにアクセスできる。デー
タベース管理システムは、発現プロフィールを射影発現プロフィール中に射影す
る(310)(提示工程の検討に関する、下記セクション5.3を参照されたい)。ユ
ーザー提出発現プロフィールは、摂動データテーブル(302)に任意に加えられ
る。
【0089】 この動的なデータベースは、最初の、そして限定された摂動データのセットを
有する有用な遺伝子セット定義を提供するという意味で絶えず生産的である。動
的に更新されるデータベースは、その遺伝子セット定義を継続的に精緻化し、よ
り多くの摂動データが利用可能になるにつれて、より有用な遺伝子セット定義を
提供する。
【0090】 動的遺伝子セット定義データベースの幾つかの実施態様では、摂動データ及び
遺伝子セット定義データは、デジタルのコンピューター貯蔵媒体の一連のリレー
ショナルテーブルに貯蔵される。好ましくは、データベースは、複数ユーザーに
リモートアクセスを可能にするクライアント/サーバー実行を有する分散(dist
ributed)システム環境中で実行される。アクセス制御及び使用計算法(usage a
ccounting)は、データベースシステムの幾つかの実施態様で実行される。リレ
ーショナルデータベース管理システム及びクライアント/サーバー環境は、当業
界でよく報告されている(Nath, 1995, The Guide to SOL Server, 第2版, Addi
son-Wesley Publishing Co.)。
【0091】 5.3. 基準遺伝子セットに基づく遺伝子発現プロフィールの表示(representati
on) 本発明の1つの局面は、遺伝子の発現値を遺伝子セットの発現値に変換する方
法を提供する。この工程は、射影(projection)と呼ばれる。幾つかの実施態様
では、射影は以下の通りである:
【数12】 式中、pは発現プロフィールであり、Pは射影されたプロフィールであり、Piは遺
伝子セットiの発現値であり、Vは基準ベクトルの予め定義されたセットである。
基準ベクトルは、式7で次のように予め定義されている(前記セクション5.2.2.
):
【数13】 式中、V(n) kは基準ベクトルnの細胞構成成分インデックスkの振幅である。
【0092】 1つの好ましい実施態様では、遺伝子セット発現値は、単に遺伝子セット内の
遺伝子の発現値の平均である。幾つかの他の実施態様では、高度に発現された遺
伝子が遺伝子セット値を左右しないように、平均に重きがおかれている(weight
ed)。遺伝子セットの発現値の集合(collection)が射影プロフィールである。
【0093】 5.4. 射影プロフィールの利用 射影プロフィール、すなわち生物学的状態又は遺伝子セットによって発現され
た生物学的応答は、多くの利点を提供する。このセクションでは、射影プロフィ
ールを利用する分析方法を提供する本発明のもう1つの局面を検討する。
【0094】 5.4.1. 射影プロフィールの利点 射影プロフィールを使用する1つの利点は、射影プロフィールが測定誤差の害
を被りにくいことである。各細胞構成成分に関するデータ中の独立した測定誤差
を想定した場合、射影プロフィール要素の分数の標準誤差(fractional standar
d error)は、個々の細胞構成成分に対する平均分数標準誤差のおよそMn -1/2
である(ここで、Mnは第n番目の遺伝子セット中の細胞構成成分の数である)。
このように、細胞構成成分の平均上方又は下方調節が、x標準偏差で有意であれ
ば、そのときは、射影プロフィール要素は、Mn 1/2 x標準偏差で有意であろう。
これは、平均値である信号対雑音比に対する標準的な結果であり;加算平均は、
検出対誤り検出の確率における途方もなく大きな差をつくる(Van Trees, 1968,
Detection, Estimation, and Modulation Theory Vol. I, Wiley & Sonsを参照
されたい)。
【0095】 射影プロフィールのもう一つの利点は、データセットの低減されたサイズであ
る。例えば、48個の遺伝子データセットは、3つの遺伝子セットによって示され
(実施例2)、194個の遺伝子データセットは、9個の遺伝子セットによって示さ
れる(実施例3)。このデータサイズの低減はプロフィールの分析を非常に容易
にする。
【0096】 射影プロフィールのさらにもう1つの利点は、射影プロフィールが根本的な生
物学を捕らえる(capture)傾向があることである。例えば、図6は、48個の遺伝
子のクラスター化ツリーを示す。それぞれカルシニューリンタンパク質、PDR遺
伝子、及びGen4転写因子に関係する3つの経路に対応する3つの遺伝子セットが同
定されている(下記実施例1)。
【0097】 5.4.2. プロフィール比較及び分類 基準遺伝子セットが一旦選択されれば、射影プロフィールPiは、iによってイ
ンデックス化された(indexed)プロフィールの任意のセットについて得ること
ができる。Pi間の類似性は、2つの理由で、元のプロフィールpi間よりも明瞭に
見られる。第1に、外来(extraneous)遺伝子の測定誤差は、排除されているか
又は平均化されており(averaged out)、第2に、基準遺伝子セットは、プロフ
ィールpiの生物学を捕らえる傾向にあり、それ故、それらの個々の応答成分に対
する検出器と合致している。プロフィールの分類及びクラスター化の両者は、目
的の類似性測定基準(これをSと呼ぶ)に基づいており、ここで、1つの有用な
定義は、
【数14】 である。
【0098】 この定義は、ベクトルPi及びPjの間の一般化された角度コサインである。それ
は、Pi及びPjの間の従来の相関計数の射影バージョンである。プロフィールpi
、Sijが最大である他のプロフィールpjに最も類似しているように思われる。新
規なプロフィールは、既知の生物学的有意さのプロフィール(既知薬物に対する
応答パターン又は特定の生物学的経路での摂動など)とのそれらの類似性に従っ
て分類できる。新規なプロフィールのセットは、距離測定基準
【数15】 (ここで、このクラスター化は、応答測定のセット全体の元のより大きな空間で
のクラスター化と類似しているが、正に述べたところの測定誤差を低減する効果
及び適切な生物学の捕獲の促進という利点を有している)を用いてクラスター化
できる。
【0099】 任意に観察された類似性Sijの統計的有意さは、相関性なしという帰無仮説下
に生成された経験的確率分布を用いて評価できる。この分布は、元のプロフィー
ルpにおける構成要素インデックスの多くの異なるランダム置換に対する射影、
上記式(9)及び(10)、を行うことによって生成される。
【0100】 すなわち、順序づけられたセットpkをpn(k)で置換する(ここで、II(k)は、〜
100〜1000の異なるランダム置換に対する順列である)。偶然に上昇した類似性
の確率Sijは、そのときは、未置換(unpermuted)データを用いて観察される類
似性を超える類似性Sij(置換された)に対するこれらの順列の分数である。
【0101】 5.4.3. 具体的な薬物発見利用 本発明の1つの局面は、薬物発見方法を提供する。1つの実施態様では、遺伝
子セットは、クラスター分析を用いて定義される。遺伝子セット内の遺伝子は、
対象となる条件下で潜在的に同時調節されるものとして示される。同時調節され
る遺伝子は、潜在的に調節経路に関係するものとしてさらに探索される。調節経
路に関係する遺伝子の同定は、新規な薬物の設計及びスクリーニングのための有
用な情報を提供する。
【0102】 本発明の幾つかの実施態様は、遺伝子セット定義及び射影を使用して、薬物作
用経路を同定する。1つの実施態様では、薬物の適用に応答して非常に多数の遺
伝子の発現の変化が測定される。発現変化プロフィールは、遺伝子セット発現変
化プロフィール中に射影される。幾つかの場合には、各遺伝子セットは、明確な
生物学的目的を有する1つの特定の経路を示す。遺伝子セットの変化を試験する
ことによって、作用経路を解読することができる。幾つかの他の場合には、発現
変化プロフィールは、多くの異なる経路を摂動することによって得られる射影プ
ロフィールからなるデータベースと比較される。射影プロフィールが既知の摂動
から誘導される射影プロフィールに類似しているならば、その薬物の作用経路は
既知の摂動と類似することが示される。薬物作用経路の同定は、薬物発見に有用
である。参照によって予め組み入れられた、Stoughton及びFriend, 薬物作用経
路の同定方法(Methods for Identifying pathways of Drug Action), 米国特
許出願第09/074,983号を参照されたい。
【0103】 本発明の幾つかの実施態様では、薬物候補をそれらの治療活性でスクリーニン
グする(薬物スクリーニング方法の検討についての、すべての目的について参照
によって予め組み入れられた、Friend及びHartwell, 薬物スクリーニング方法(
Drug Screening Method), 1998年8月20日提出の米国仮出願第60/056,109号を参
照されたい)。1つの実施態様では、所望の薬物活性は、1つの特定の遺伝子調
節経路に影響を与えることである。この実施態様では、薬物候補は、調節経路に
対応する遺伝子セットに影響を与えるそれらの能力についてスクリーニングされ
る。もう1つの実施態様では、新規な薬物は、現行の薬物と置換することが望ま
れる。この実施態様では、薬物候補の射影プロフィールは、現行の薬物のそれと
比較されて、どの薬物候補が現行の薬物に類似の活性を有しているかが決定され
る。
【0104】 幾つかの実施態様では、本発明の方法は、経路の樹枝状分岐及び反応速度論を
解読するために使われる。レセプターがリガンドによって引き金を引かれる(又
はブロックされる)と、下流の経路の励起(excitation)は、レセプターとリガ
ンドとの相互作用の正確で一時的なプロフィール及び分子ドメインに依存して異
なりうる。異なるリガンドの相違する効果の簡単な例は、アゴニスト、部分的ア
ゴニスト、否定的(negative)アンタゴニスト、及びアンタゴニストの間で生じ
、共有結合対非共有結合及びレセプター上の異なる分子ドメインの活性化に応答
して生じると期待される表現型の違いである。Ross, 薬力学:薬物作用の機構及
び薬物濃度と効果の関係(Pharmacodynamics: Mechanisms of Drug Action and
the Relationship between Drug Concentration and Effect), 治療学の薬理学
的基礎(The Pharmacological Basis of Therapeutics), (Gilmanら編集), mcG
raw Hill, New York, 1996を参照されたい。図4Aは経路カスケードの2つの異な
る可能な応答を説明するものである。
【0105】 本発明の幾つかの実施態様では、Gタンパク質結合レセプター(GPCR)又は他
のレセプターに対するリガンドは、本発明の射影方法を用いて研究され、応答遺
伝子に関するレセプターの相互作用への観察される一時的応答を単純化すること
ができる。幾つかの特定の好ましい実施態様では、遺伝子セット及び関係する一
時的プロフィールを得る(discovered)。多数の遺伝子の一時的応答のプロフィ
ールは、予め定義された遺伝子セット上に射影され、一時的応答の射影プロフィ
ールを得る。この射影工程は、異なる一時的応答がより正確に検出され、識別さ
れるように、観察される応答を単純化する。
【0106】 図4Bは、幾つかの時点に渡る遺伝子の一時的応答プロフィールによる遺伝子の
クラスター化の例を示す。この実験は、酵母α交配フェロモンを用いた酵母交配
経路(前記と同じ株、方法等)の活性化であった。対照(模擬処理)基準線に対
する比率で表された(ratioed)全ての酵母遺伝子に対する発現応答は、処理の
直後、処理の15分後、30、45、60、90、及び120分後に測定した。この一連の時
間の実験は、クラスター化分析のための実験設定を提供した。各線は、1つの実
験を示す。星印を有する線は、クラスター化操作において重要性の低かった(gi
ven low weight)実験を示す。3つの主要なクラスターグループを、体系的に識
別可能な一時的挙動を示す図4Bで説明する。第1グループ(早期)は、STE12転
写因子に応答し、第2グループ(順応性)はそれ自身連続した処理によって疲労
する(応答の減少を示す)STE2及びSTE12などの主要信号経路のメンバーを含み
、第3グループ(細胞周期)は、交配応答によって加えられる(inflicted)周
期摂動と関係している。
【0107】 そのインデックスが構成成分及び時点に渡る増大した基準ベクトルを定義する
ことができる。これらの基準ベクトル上への射影は、特定遺伝子グループ中の応
答及び特定の一時的プロフィールの振幅を見つけだす。従って、例えば、一連の
時間の発現プロフィールを、その要素が第3グループに含まれる遺伝子に対して
のみゼロでなく、そのゼロでない振幅が、第3グループの一時的な応答の平均に
従う時間インデックスに渡って変動する、増大した基準ベクトル上に射影するこ
とによって、図4Bの第3グループで示されるそれらなどの応答を効率的に検出す
ることができる。
【0108】 5.4.4. 具体的診断利用 本発明の1つの局面は、ヒト、動物及び植物の疾患を診断する方法を提供する
。それらの方法はまた、疾患の進行及び治療の効果をモニターするのに有用であ
る。
【0109】 本発明の1つの実施態様では、患者の病変組織からの生検などの患者の細胞サ
ンプルを、多数の遺伝子の発現についてアッセイする。遺伝子発現プロフィール
は、遺伝子セットの定義に従って遺伝子セット発現値のプロフィール上に射影さ
れる。次いで、射影プロフィールを参照(reference)射影プロフィールを含む
参照データベースと比較する。患者の射影プロフィールが、データベースの癌プ
ロフィールと最もよく一致するなら、その患者の病変組織は、癌性であると診断
される。同様に、別の疾患又は障害のプロフィールと最もよく一致する場合は、
該他の疾患又は障害の診断がなされる。
【0110】 もう1つの実施態様では、組織サンプルは、患者の腫瘍から得られる。その組
織サンプルを、目的の多数の遺伝子の発現についてアッセイする。遺伝子発現プ
ロフィールを、遺伝子セットの定義に従って遺伝子セット発現プロフィール上に
射影する。射影プロフィールを、同じ腫瘍から以前に得た射影プロフィールと比
較して、遺伝子セットの発現の変化を同定する。参照ライブラリーを用いて、遺
伝子セットの変化が腫瘍進行を示しているか否かを判定する。同様の方法を用い
て、他の疾患及び障害を段階づける(stage)。治療を受けている患者から得た
プロフィール中の遺伝子セット発現値の変化を使用し、例えば、治療前の射影プ
ロフィールを治療後のそれと比較することによって治療の有効性をモニターする
ことができる。
【0111】 5.4.5. クラスター分析による応答プロフィール分類 本発明の方法は、それらの同時変動(co-variation)の程度(例えば、同時調
節による)による、遺伝子などの、細胞構成成分のグループ分けには単純に限定
されない。特に、細胞構成成分の同時変動を分析するための上記のクラスター分
析及び他の統計的分類法はまた、生物学的応答プロフィールの分析及び該プロフ
ィールをそれらの生物学的応答の類似性に従ってグループ化又はクラスター化す
るためにも使用できる。従って、例えば、上記セクション5.2.2.は、細胞構成成
分「ベクトル(vectors)」X={Xi}(ここで、iは応答プロフィールインデック
スである)を分析するための方法を記載したが、セクション5.2.2.で記載した方
法及び式は、応答プロフィールベクトルv(m)={vi (m)}(ここで、mは応答プロフ
ィールインデックスであり、iは細胞構成成分インデックスである)を分析する
ためにも使用できる。
【0112】 このような分析は、例えば、上記セクション5.2.2.に記載のような「hclust」
を含む、正確に同一のクラスター化アルゴリズムを用いて、及び正確に同一の距
離測定基準を用いて行うことができる。例えば、上記セクション5.2.2.は、細胞
構成成分ベクトルX及びYの比較のための、距離測定基準l=l−r(ここで、rは正
規化ドット積X・Y||X||Y|である)の使用を記載している。当業者には容易に明ら
かなように、同一の距離測定基準も、r=v(m)・v(n)||v(m)||v(n)|を評価するこ
とによって、応答プロフィールベクトルv(m)及びv(n)を評価するためにも使用で
きる。他の距離測定基準及び有意性検定を含む、上記セクション5.2.2.に記載さ
れたクラスター化方法の他の局面の類似性の利用もまた、当業者には明らかであ
り、本発明において使用できる。
【0113】 このように、本発明の分析方法は、「二次元」クラスター分析の方法を含む。
このような二次元クラスター分析法は、単に、(1)細胞構成成分を生物学的プロ
フィールにおいて同時変動するセット中にクラスター化し、(2)生物学的プロフ
ィールを類似の細胞構成成分に影響を与える(好ましくは同様の方法で)セット
中にクラスター化することを含む。2つのクラスター化工程は、任意の順序で、
上記方法に従って行うことができる。
【0114】 このような二次元クラスター化技術は、上記したように、遺伝子のセット及び
特に興味ある摂動を同定するのに有用である。例えば、本発明の二次元クラスタ
ー化技術を用いて、細胞構成成分のセット(すなわち、発現又は発生量(abunda
nce)のレベルの変化)及び/又は目的とする特定の生物学的効果(例えば、薬
物効果又は特定の疾患若しくは疾患状態)と関係する実験を発見する(identify
)ことができる。本発明の二次元クラスター化技術は、例えば、細胞構成成分の
セット及び/又は目的とする特定の生物学的経路と関係する実験を同定するため
にも使用できる。
【0115】 さらにまた、上記の二次元クラスター化技術は、発現レベル又は目的とする特
定の細胞構成成分の発生量における変化を引き起こす摂動を同定するため、又は
特に、目的とする細胞構成成分(例えば、特定の遺伝子セット)のセットを同時
変動させるために使用することができる。例えば、本発明の1つの好ましい実施
態様では、そのような細胞構成成分のセット及び/又は摂動は、目的とする特定
の生物学的応答に対する共通プロフィールを決定するために用いられる。他の実
施態様では、そのような細胞構成成分のセット及び/又は実験の同定は、細胞構
成成分をグループ化するより正確な表示(indications)(例えば、目的とする
特定の生物学的経路又は応答に関係する遺伝子の同定)を与える。
【0116】 従って、本発明のもう1つの好ましい実施態様は、その変化(発現又は発生量
のレベルにおける)が、目的とする特定の生物学的効果(例えば、特定の生物学
的経路、1種以上の薬物の効果、特定の疾患若しくは疾患状態、あるいは特定の
治療又は治療法(例えば、特定の薬物治療又は薬物治療法))と関連及び/又は
関係している、細胞構成成分、特に遺伝子(例えば、新規な遺伝子)又は遺伝子
セットを同定するための方法を提供する。そのような細胞構成成分は、上記のク
ラスター分析方法に従って同定される。このような細胞構成成分(例えば、遺伝
子)は、これまで知られていない細胞構成成分、又は目的とする生物学的効果と
関連していることはこれまで知られていない既知の細胞構成成分である。
【0117】 例えば、疾患又は疾患状態と関連している細胞構成成分を同定する特定の実施
態様を考えた場合、前記の二次元クラスター化方法を用いて、特定の疾患又は疾
患状態と関連している摂動によってクラスター化する生物学的プロフィールを同
定し、該プロフィール内で確実に変化(例えば、発現又は発生量のレベルにおい
て)する細胞構成成分及び/又は細胞構成成分セット(例えば、遺伝子セット)
を同定するために試験することができる。そのような細胞構成成分は、特定疾患
又は疾患状態のマーカー(例えば、遺伝子及び遺伝子セットの場合には遺伝子マ
ーカー)として有用である。特に、例えば、患者から得られた生物学的サンプル
中で観察されるそのようなマーカー(例えば、発現又は発生量のそれらのレベル
)における変化は、従って、その患者の特定の疾患又は疾患状態を診断するため
に使用できる。(例えば、疾患又は疾患状態の)マーカーとして特に有用であり
、それ故本発明において好ましいそれらの細胞構成成分は、目的とする特定の生
物学的効果(例えば、特定の疾患又は疾患状態)に関連している摂動において変
化(例えば、発現又は発生量のレベルにおける)するが、他の摂動;すなわち、
目的とする特定の生物学的効果と関連しない摂動においては変化しない細胞構成
成分である。
【0118】 さらに、本発明は、細胞構成成分セット及び/又は応答プロフィール(共通プ
ロフィールなど)のクラスターを反復精緻化するための方法を提供する。特に、
細胞構成成分の各セットにおいて支配的な特徴及び/又は本発明のクラスター分
析方法によって同定されたプロフィールは、例えば、それらの要素をゼロ又はそ
のセットの平均データ値に設定することによって、無効にする(blanked out)
ことができる。支配的な特徴の無効化は、ユーザーによって、例えば、手動で特
徴を選択し無効にするか、又は自動的に、例えば、その応答振幅が選択された閾
値を超える要素を自動的に無効にすることによって行うことができる。次いで、
本発明のクラスター分析方法を、細胞構成成分及び/又はプロフィールデータに
再度適用する。そのような反復精緻化方法は、例えば、他の潜在的に興味ある、
しかしよりわずかな細胞構成成分及び/又は支配的な特徴のために同定されてい
なかった実験関連性を発見する(identify)ために用いることができる。
【0119】 より一般的には、そして当業者には明らかであるように、本発明のクラスター
化方法は、生物学的(又は他の)データの任意のN次元整列(ここで、Nは任意の
正の整数である)の各次元をクラスター化するために使用できる。例えば、幾つ
かの実施態様では、生物学的データは、t時間後の摂動mに応答する細胞構成成分
iの変化を記述する値v(m) i(t)の行列(例えば、テーブル)を含むことができる
。本発明のクラスター化方法は、そのような実施態様において、(1)細胞構成成
分インデックスi、(2)摂動応答インデックスm、及び(3)時間インデックスtをク
ラスター化するために使用できる。他の実施態様もまた、当業者には明らかであ
る。
【0120】5.4.6アーティファクトプロフィールの除去 上述の第5.2サブセクションに記載された方法をはじめとする本発明の射影法
を用いて、生物学的プロフィールデータから所望されていない応答成分(例えば
、「アーティファクト」)を除去してもよい。かかるプロフィールデータを得る
際にはしばしば、事実上、測定プロセスのアーティファクトであり、かつ測定さ
れる実際の生物学的状態または応答(摂動応答など)の一部ではない細胞構成要
素の測定パターン(例えば、測定される遺伝子発現パターン)をもたらす1以上
の制御不十分な変化量が存在する。生物学的プロフィールデータにおいてアーテ
ィファクトをもたらし得る変化量の例には、限定されるものではないが、全RNA
および/またはハイブリダイゼーション試薬濃度とともに、細胞培養密度ならび
に温度およびハイブリダイゼーション温度が挙げられる。
【0121】 例えば、Di Risi et al. (1997, Science 278: 680-686)では、マイクロアレ
イを用いた嫌気性増殖から好気性増殖までの変化(すなわち「ジオーキシーシフ
ト」)の間のS. セレビシエ(S. cerevisiae)cDNAレベルの測定を記載している
。しかしながら、名目上同一の2つの細胞培養物のうち一方が意図的ではなく他
方よりもさらジオーキシーシフトに進行していた場合、それらの発現率は、この
シフトと関連する転写変化を反映するであろう。かかるアーティファクトは調べ
ている真の転写応答の測定を混乱させる可能性がある。これらのアーティファク
トをデータにおけるそれらのパターンを外すかまたは抑えることにより「射影外
(project out)」してもよい。
【0122】 好ましい実施形態では、データにおけるアーティファクトパターンは公知であ
る。一般にアーティファクトパターンは遺伝子のいずれの知識の供給源およびか
かるアーティファクトと関連した応答の相対的な大きさからも求められる。例え
ば、アーティファクトパターンは推定される原因となる変化量の意図的摂動を伴
う実験から導くことができる。もう1つの実施形態では、アーティファクトパタ
ーンをアーティファクトが自然発生する対照試験のクラスタリング解析により求
める。
【0123】 かかる好ましい実施形態では、例えば、アーティファクトnのプロフィールへ
の寄与についての最良スケーリング係数αnを求めることにより、知られている
アーティファクトの寄与について解き、測定された生物学的プロフィールp={pi }から減ずることができる。好ましくは、測定プロフィールと概算したアーティ
ファクトの寄与との、目的の関数の違いを最小限にするαn値を求めることによ
り係数αnが見出される。例えば、係数αnは最小二乗法により求められる。
【0124】
【数16】 (式中、An,iは細胞構成要素iの測定におけるアーティファクトnの大きさであり
、wiは細胞構成要素iの測定値の相対的な確実性または有意性(すなわちpi)に
よって使用者により選択される任意の重量因子である) 次に、アーティファクトが効率的に除去される「除去された」プロフィールp( clean) が次式
【数17】 (式中、係数αnは、例えば上述の数式16から求められる) により得られる。
【0125】 他の実施形態では、プロフィールpを異なる厳密さのアーティファクトサインA s ={As,i}のライブラリーと比較する。かかる実施形態では、「除去された」プ
ロフィールをこのライブラリーに対するパターンマッチングにより求め、プロフ
ィールpと最大の類似性を有する特定の鋳型を決定する。かかる実施形態では、
除去されたプロフィールはpk (clean)=pi-As,i(式中、サインAsは、例えば次式
【数18】 を解くことにより求められる)により得られる。
【0126】5.4.7射影されたタイトレート曲線 多くの場合、複数の格付けされたレベルの特定の摂動への暴露に対する生物学
的系の応答を測定することが望ましい。例えば、薬剤の発見プロセス中に、格付
けされたレベルの特定の薬剤または薬剤候補への暴露に対する生物学的系の応答
を測定する、例えば薬剤または薬剤候補の治療効果および/または毒性効果を求
めることがよく必要となるかまたは望ましい。他の例では、生物学的系に対する
効果、例えば特定の遺伝子または遺伝子産物の格付けされた発現を、下記第5.8.
1サブセクションに記載される方法などによって測定することが望ましい。例え
ば、図13はMarton et al., 1998, Nature Medecine 4: 1293-1301に記載される
ように、異なる濃度の薬剤FK506に対するS. セレビシエの最大応答遺伝子の転写
応答を示している。
【0127】 また本発明の方法を用いて、かかる遺伝子セットなどの同時に変化する細胞構
成要素セットに対する「タイトレート応答」を射影し得る。典型的には、かかる
「タイトレート応答」には、格付けされたレベルにおける特定の摂動への暴露(
図13に示されるように、格付けされたレベルの薬剤FK506への暴露)に対する複
数の生物学的応答が含まれる。よって射影されたタイトレート応答は、上述の第
5.2および5.3サブセクションに記載されるいずれかの方法により各々のレベルの
摂動において(例えば、各々の濃度の薬剤において)得られた生物学的応答プロ
フィールを射影することによりにより得られる。例えば、図15は図13の射影され
たタイトレート応答曲線を示している。この特定の例では、例えば上述の第5.3
サブセクションに記載されるように、射影には各々の基礎遺伝子セットの長さが
均一であるように標準化により各遺伝子セットの応答の平均をとることが含まれ
る。
【0128】 好ましい実施形態では、例えば摂動のいくつかのモデル関数へのフィッティン
グにより射影されたタイトレート応答に補間する。例えば、図14では射影された
タイトレート応答曲線を上述の数式3で示された形のHill関数にフィッティング
した。しかしながら、当技術分野で公知なその他のモデル関数を用いてもよい。
また、射影されたタイトレート応答曲線をスプラインフィッティング(ここでは
、各々の射影されたタイトレート応答曲線を数式
【数19】 により与えられるような、測定データ値を掛けた適当なスプライン補間関数Sの
積の和により手を加える)により補間してもよい。変数”u”とは、射影された
タイトレート応答Pを測定する摂動の任意値(例えば、薬剤暴露レベルまたは濃
度)をいう。変数”ul”とは、応答プロフィールを実際に測定した摂動の離散値
をいう。一般に、Sは射影されたタイトレート応答関数で推測される構造の幅の
特徴を有する限定されたサポートの、スムースな関数または少なくとも断片的に
連続する関数であってよい。典型的な幅は、補間される射影タイトレート応答関
数がその漸近値の10%ないし90%で現れる区域にあるよう選択され得る。典型的な
S関数には線形補間法およびガウス補間法が挙げられる。
【0129】 図13の曲線の混乱と比べ、ある遺伝子セットは他の遺伝子セットが応答するの
と異なる臨界濃度のFK506(数式3で得られるu0)において、さらに異なるべき乗
法則べき指数(数式3のn)で応答することは図14に示される射影された遺伝子セ
ットタイトレート応答から明らかである。図15は各遺伝子セットに対して導かれ
た2つのHill係数の値(数式3のu0およびn)近くでのキ・スクエアー(chi-squared
plotted)曲線を示している。プロットにより、図14における明らかな視覚的相違
が統計的に有意であることが示される。とりわけ、Hill係数はその鋭さ(すなわ
ち、べき乗法則べき指数n、縦軸)およびその臨界濃度(すなわち、u0、横軸)
の双方において識別される。よって各遺伝子セットは、例えばそれらのタイトレ
ート応答の様式により識別され得る。
【0130】 推測されるように、タイトレート応答プロフィールの異なる遺伝子セットは生
物学的にも重要である。例えば、S. セレビシエの遺伝子欠失株においてFK506を
用いる試験および遺伝子調節配列領域の解析を支援することで、図14においてS.
セレビシエのFK506に対するタイトレート応答が確認された遺伝子セットが生物
学的同一性を有することが示される(Marton et al.,上記参照)。これらの同一
性は図14の注釈により示される。よって異なる遺伝子セットのタイトレート挙動
もまた異なる生物学的経路を示す。例えば、図14の「GCN4依存性」とされる曲線
はその応答が転写因子タンパク質Gcn4(Marton et al.,上記参照)によって媒介
される遺伝子セットの応答であり、「GCN4非依存性」とされる図14のより緩やか
な応答はカルシニューリンまたはGcn4タンパク質が存在するか否かにはかかわら
ず、FK506に対して応答する遺伝子セットのものである。
【0131】 その他の例では、時間に対する生物学的サンプルの状態を測定することが望ま
しい。多くの場合、特に時間経過によって起こる、例えば特定の生物学的プロセ
スまたは作用と関連した、サンプルの生物学的状態変化を監視することが望まし
い。かかる生物学的プロセスには、限定されるものではないが、減数分裂、有糸
分裂、および細胞分化が挙げられる。また時間経過によって起こるサンプルの生
物学的状態変化には1種以上の薬剤への暴露などの特定の摂動に対する応答の変
化、または環境の変化が挙げられる。時間に対するサンプルの生物学的状態変化
の監視には、注目する生物学的プロセスまたは作用が起こる時間帯での複数の測
定が単に含まれる。本発明の方法を用いて、遺伝子セットなどの同時に変化する
細胞構成要素セットに対するこのような生物学的状態の「時期的測定」を射影し
得る。特に、当業者には明らかであるように、かかる時期的測定についてはタイ
トレート応答の測定に関する上述の方法により調べてもよい。
【0132】5.4.8.マイクロアレイにおける遺伝子セットの使用 本発明の遺伝子セットはまたマイクロアレイの設計および製造にも有用である
。特に、当業者は本発明の方法を用いて、ゲノムの全ての遺伝子に対するもので
はなく、遺伝子セットの全ての遺伝子に対するものでもない特異的な個別のプロ
ーブを含有するマイクロアレイ用プローブを容易に選択および調製することがで
きる。かかる実施形態では、マイクロアレイは、各々が所望の数の遺伝子セット
の単一遺伝子セット内で発現産物(例えば、それから誘導されたmRNA、またはcD
NAもしくはcRNA)とハイブリダイズする1または2以上の個別のプローブを含有し
ている。よって例えば細胞または生物体の全ゲノムにおける全てまたは大部分の
遺伝子の発現の変化を、代用物の使用により、およびゲノムの全てまたは大部分
の遺伝子の代表である遺伝子セットの群の発現を調べることによる単一マイクロ
アレイにおいて監視できる。かかるマイクロアレイは、例えば下記第5.7サブセ
クションに記載されるように選択されたプローブを用いて調製してよく、従って
本発明の一部となる。
【0133】 例えば、好ましい実施形態では、注目する生物学的サンプル(例えば、細胞ま
たは生物体)の遺伝子セットは上述のサブセクションに記載されるように同定さ
れる。一般に、同定されかつそれに対するプローブマイクロアレイ中のが明らか
である遺伝子セット数は約50〜1,000である。しかしながら、好ましくは対応す
るマイクロアレイ中のプローブが明らかである遺伝子セット数は500未満、さら
に好ましくは100〜500、いっそうさらに好ましくは100〜200であろう。次いで同
定された各遺伝子セットから代表的遺伝子を選択し、各代表的遺伝子のヌクレオ
チド配列とハイブリダイズするプローブを調製する。好ましくは10個を超えない
代表的遺伝子が各遺伝子セットから選択される。しかしながら、さらに好ましく
は、対応するマイクロアレイ上のプローブが明らかである各遺伝子セットから選
択される代表的遺伝子数は5個未満、4個未満、3個未満または2個未満である。実
際には、最も好ましくは、たった1個の代表的遺伝子だけが、対応する1以上のマ
イクロアレイ上のプローブが明らかである各遺伝子セットから選択される。少な
くとも1つの遺伝子セットでは、および好ましくは大部分または全ての遺伝子セ
ットでは、対応するマイクロアレイ上のプローブが明らかである代表的遺伝子数
は、遺伝子セットにおける全遺伝子数より少ない。ある好ましい実施形態では、
対応するマイクロアレイ上のプローブが明らかである少なくとも1個の代表的遺
伝子が細胞または生物体で同定される全ての遺伝子セットから選択される。その
他の実施形態では、対応するマイクロアレイ上のプローブが明らかである代表的
遺伝子は、注目する1以上の特定の生物学的状態に関連する遺伝子セットからし
か選択されない。例えば、ある実施形態では、代表的遺伝子は特定の疾患または
病状に関連する遺伝子セットから選択される。その他の実施形態では、代表的遺
伝子は、例えばその発現における変化が薬剤または治療効果に関連している遺伝
子セットまたはその発現における変化が薬剤耐性または治療的減退に関連してい
る遺伝子セットなど、その発現における変化が特定の薬剤または特定の治療に関
連している遺伝子セットから選択される。よって、例えばある実施形態では、対
応するプローブがマイクロアレイ上に存在する遺伝子セットの総数は1,000未満
、500未満、200未満、100未満、50未満、30未満、20未満、または10未満である
【0134】5.5.コンピュータインプリメンテーション 前述のサブセクションで記載した解析法を好ましくは、以下のコンピュータシ
ステムの使用により、そして以下のプログラムおよび方法に従いインプリメンテ
ーションすることができる。図5は本発明の解析法のインプリメンテーションに
適するコンピュータシステムの例を示している。コンピュータシステム501は内
部コンポーネントを含んでなり、かつ外部コンポーネントと接続されているよう
に示されている。このコンピュータシステムの内部コンポーネントには主記憶装
置503と相互接続したプロセッサー素子502が含まれる。例えば、コンピュータシ
ステム501は、32MB以上の主記憶装置を有し、200MHz以上のクロックレートを有
するIntel Pentium(登録商標)をベースとしたプロセッサーである。
【0135】 外部コンポーネントには大容量記憶装置504が含まれる。この大容量記憶装置
は1以上のハードディスク(典型的にはプロセッサーおよび記憶装置とともにひ
とつにまとめられている)であってよい。典型的には、かかるハードディスクは
1GB以上の記憶容量である。その他の外部コンポーネントにはモニターであって
よいユーザーインターフェース装置505、「マウス」であってよい入力装置506、
またはその他の図画入力装置(示さず)、および/またはキーボードが挙げられ
る。また印刷装置508をコンピュータ501に取り付けてもよい。
【0136】 典型的にはコンピュータシステム501を他のローカルコンピュータシステムへ
のイーサネットリンクの一部、リモートコンピュータシステム、またはインター
ネットなどの幅広い通信網であってよいネットワークリンク507とも連結してい
る。このネットワークリンクによりコンピュータシステム501はデータおよび処
理作業を他のコンピュータシステムと共有することが可能になる。
【0137】 このシステムの操作中に当技術分野では標準であり、かつ本発明には専門性の
あるいくつかのソフトウェアコンポーネントを記憶装置へロードする。これらの
ソフトウェアコンポーネントが共同でコンピュータシステムを本発明の方法によ
り機能させる。典型的にはこれらのソフトウェアコンポーネントは大容量記憶装
置504に記憶させている。ソフトウェアコンポーネント510はコンピュータシステ
ム501およびそのネットワーク相互接続の管理を担うオペレーティングシステム
に相当する。このオペレーティングシステムは、例えばウインドウズ95、ウイン
ドウズ98、またはウインドウズNTなどのMicrosoft ウインドウズ系であってよ
い。ソフトウェアコンポーネント511はこのシステムに好都合に存在する本発明
に特別な方法のプログラムのインプリメンテーションを支援する共通言語および
機能に相当する。多数の高レベルまたは低レベルのコンピュータ言語を用いて本
発明の解析法をプログラムに組み込むことができる。指令は実行時のインタプリ
タ型でもコンパイラ型でもよい。好ましい言語にはC/C++、FORTRONおよびJAVA(
登録商標)が挙げられる。最も好ましくは本発明の方法を数理ソフトウェアパッ
ケージでプログラムを作成する。このパッケージにより用いるアルゴリズムをは
じめとする式の記号入力および処理のための高レベルの仕様が可能になり、その
結果、個々の式またはアルゴリズムの手順をプログラムする必要性がユーザーか
らなくなる。かかるパッケージにはMathworks(Natick, MA)のMatlab、Wolfram R
esearch(Champaign, IL)のMathematica、またはMath Soft(Cambridge, MA)のS-P
lusが挙げられる。よってソフトウェアコンポーネント512は処理言語または記号
パッケージでプログラムを作成した本発明の解析法に相当する。好ましい実施形
態では、コンポーネントシステムは摂動応答曲線のデータベース513も含む。
【0138】 インプリメンテーション例では、本発明の方法を実行するためにまずユーザー
が発現プロフィールデータをコンピュータシステム501へロードする。ユーザー
はこれらのデータをモニター505およびキーボード506から、またはネットワーク
接続507により接続した他のコンピュータシステムから、またはCD-ROMまたはフ
ロッピーディスク(示さず)などの取り外し可能な記憶媒体で、またはネットワ
ーク(507)を通して、直接入れることができる。次に、ユーザーは同時に変化す
る遺伝子の遺伝子セットへのクラスタリングのステップを達成する発現プロフィ
ール解析ソフトウェア512を実行する。
【0139】 もう1つのインプリメンテーション例では、まずユーザーが発現プロフィール
データをコンピュータシステムへロードする。遺伝子セットプロフィール定義を
記憶媒体(504)またはリモートコンピュータ、好ましくはダイナミックな遺伝子
セットデータベースシステムから、ネットワーク (507)を通して記憶装置にロー
ドする。次に、ユーザーは発現プロフィールを射影発現プロフィールへと変換す
るステップを行う射影ソフトウェアを実行する。
【0140】 さらにもう1つのインプリメンテーション例では、まずユーザーが射影された
プロフィールを記憶装置へロードする。次いでユーザーは参照プロフィールの記
憶装置へのロードを行う。次に、ユーザーはプロフィールを客観的に比較するス
テップを行う比較ソフトウェアを実行する。
【0141】 本発明はまた射影されたプロフィールの遺伝子セットの定義、射影および解析
用ソフトウェアを提供する。ソフトウェアの1つの実施形態は本発明のクラスタ
ー解析を実行し得るモジュールを含む。モジュールは (a)摂動試験データ表を受
信し、(b)遺伝子セット選択の基準を受信し、(c)摂動データをクラスター化ツリ
ーへクラスター化し、さらに(d)クラスター化ツリーおよび遺伝子セット選択の
基準に基づき遺伝子セットを定義するステップを実行するコンピュータシステム
のプロセッサーを起動することができる。
【0142】 ソフトウェアのもう1つの実施形態は(a)遺伝子セット定義を受信し、(b)発現
プロフィールを受信し、さらに(c)遺伝子セット定義および発現プロフィールに
基づき射影プロフィールを算出するステップを実行するコンピュータシステムの
プロセッサーを起動することにより射影操作を実行し得るモジュールを含む。
【0143】 ソフトウェアのさらにもう1つの実施形態は(a)生物学的サンプルの射影プロフ
ィールを受信し、(b)参照プロフィールを受信し、さらに(c)2つのプロフィール
間の類似性について客観的な測定値を算出するステップを実行するコンピュータ
システムのプロセッサーを起動することにより比較操作を実行し得るモジュール
を含む。
【0144】 本発明の解析法をインプリメンテーションするための別のコンピュータシステ
ムおよびソフトウェアについては当業者には明らかであり、添付の特許請求の範
囲に包含されるものである。特に当業者には容易に理解される本発明の方法をイ
ンプリメンテーションするための別のプログラム構造は添付の特許請求の範囲に
包含されるものである。
【0145】5.6.解析キットインプリメンテーション 好ましい実施形態では、生物学的サンプルの応答または状態を求めるキットの
使用により本発明の方法をインプリメンテーションすることができる。かかるキ
ットは下記サブセクションに記載されるものなどのマイクロアレイを含んでいる
。かかるキットに含まれるマイクロアレイは、プローブが固相の既知の位置でハ
イブリダイズまたは結合する固相(例えば表面)を含んでなる。好ましくはこの
プローブはそれから誘導されたRNA種とまたはDNA種とハイブリダイズし得る周知
の異なる配列の核酸からなる。特に本発明のキットに含まれるプローブは、その
活性がキットで求められる特定のタンパク質に対する摂動に応じて増加または減
少することがわかっているRNA種由来の核酸配列と特異的にハイブリダイズし得
る核酸である。本発明のキットに含まれるプローブは、好ましくはその活性がキ
ットで求められる特定のタンパク質に対する摂動に応じて増加しないRNA種とハ
イブリダイズする核酸を実質的に排除する。
【0146】 好ましい実施形態においては、本発明のキットは、遺伝子セットのデータベー
ス(上記のデータベースなど)、またはリモートネットワークコンピュータから
上記のデータベースを使用するためのアクセスの承認を含む。
【0147】 好ましいもう1つの実施形態では、本発明のキットは上述のサブセクションに
記載されるものなどのコンピュータシステムの記憶装置にロードし得る発現プロ
フィール射影および解析ソフトウェアをさらに含んでおり、図5に示されている
。本発明のキットに含まれる発現プロフィール解析ソフトウェアは上述の発現プ
ロフィール解析ソフトウェア512と本質的に同一である。
【0148】 本発明の解析法をインプリメンテーションする別のキットについては当業者に
は明らかであり、添付の特許請求の範囲に包含されるものである。特に当業者に
は容易に理解される本発明の方法をインプリメンテーションするための別のプロ
グラム構造は添付の特許請求の範囲に包含されるものである5.7. 生物学的応答の測定方法 本発明は、多様な摂動に対する生物学的系の応答を測定する能力を利用する。
本セクションでは、生物学的応答を測定するためのいくつかの代表的な方法を供
する。当業者であれば、本発明が下記の、生物学的系の応答を測定するための特
定の方法に限定されないことを理解するであろう。
【0149】5.7.1. DNAアレイを用いた転写物アッセイ 本発明は特に、遺伝子発現プロフィールの分析に有用である。本発明の一つの
態様においては、遺伝子発現の相関に基づき共に制御される遺伝子セットの同定
のための方法が提供される。本発明の実施形態のあるものでは、遺伝子の転写速
度の測定に基づいている。
【0150】 次のサブセクションに記載した、核酸および核酸模倣プローブのアレイへのハ
イブリダイゼーション技法により、または続いてのサブセクションに記載した他
の遺伝子発現技術により、転写速度を測定できる。しかしながら、測定の結果は
、転写物の絶対量もしくは相対量または応答データである。かかるデータには、
通常は(RNA分解速度に差がない場合)DNA発現比を反映するものである、RNA存在
量比を示す数値が含まれる。
【0151】 本発明の他の様々な実施形態では、翻訳状態、活性状態、または混合局面等の
転写状態以外の生物学的状態の局面を測定することができる。
【0152】 好ましくは、転写状態の測定は、転写物アレイとのハイブリダイゼーションに
より実施されるが、これについて、このサブセクションで説明する。これ以外の
いくつかの転写状態測定方法も、同サブセクションで後に説明する。
【0153】 好ましい実施形態では、本発明は、「転写物アレイ」(ここではマイクロアレ
イとも呼ぶ)を用いる。転写物アレイを用いて、生物学的サンプルの転写状態を
分析することができ、特に、対象の薬物の段階的レベルに、もしくは、対象の生
物学的経路に対する段階的摂動に暴露した生物学的サンプルの転写状態を測定す
ることができる。
【0154】 ある実施形態では、細胞に存在するmRNA転写物を表示する検出可能に標識
したポリヌクレオチド(例えば、全細胞mRNAから合成した蛍光標識cDNA
)を、マイクロアレイにハイブリダイズすることにより、転写物アレイを作製す
る。マイクロアレイは、細胞または生物のゲノム中の遺伝子の多く、好ましくは
、これら遺伝子の大部分またはほぼ全部の産物に対する結合(例えば、ハイブリ
ダイゼーション)部位の定序アレイを有する表面である。マイクロアレイは、多
くの方法で作製することができるが、そのいくつかを以下に説明する。どのよう
に作製したとしても、マイクロアレイは、共通した特定の特性を有する。すなわ
ち、アレイは、再現性で、所定アレイの多数のコピーを生成させ、容易に、相互
に比較させることができる。好ましくは、マイクロアレイは結合(例えば、核酸
ハイブリダイゼーション)条件の下で安定な材料から作製される。マイクロアレ
イは好ましくは小さく、例えば、約5cm2〜約25cm2の間、より好ましくは約12cm 2 〜約13cm2の間である。しかしながら、より大きなアレイおよびより小さなアレ
イもともに考慮されており、例えば、非常に多数の異なるプローブを同時に評価
するために好ましいものであり得る。
【0155】 好ましくは、マイクロアレイにおける所定の結合部位、または、結合部位の特
有のセットは、細胞または生物に由来する単一の遺伝子または遺伝子転写物(特
定のmRNAまたはそれらに由来する特定のcDNAなど)と特異的に結合(ハイブリダ
イズなど)することになる。しかしながら、上述の通り、他の関連した配列また
は類似の配列もまた、通常、所与の結合部位に交差ハイブリダイズするであろう
【0156】 本発明の方法および組成物において用いるマイクロアレイは、1以上の試験プ
ローブを含有し、各プローブは検出すべきRNAまたはDNAの部分配列(subsequence
)に相補的なポリヌクレオチド配列を有する。各プローブは好ましくは、異なる
核酸配列を有し、アレイの固体表面上の各プローブの位置が好ましくは分かって
いる。実際に、マイクロアレイは好ましくはアドレス指定し得る(addressable)
アレイであり、より好ましくは位置によりアドレス指定し得るアレイである。よ
り詳細には、アレイの各プローブは好ましくは、固体表面上のすでに分かってい
る所定の位置に、各プローブの素性(すなわち配列)がアレイ(支持体または表
面)上の位置により決定できるように配置される。
【0157】 好ましくは、マイクロアレイ上のプローブの密度は、1cm2あたり約100種また
はそれ以上の異なる(すなわち同一でない)プローブとする。より好ましくは、
本発明の方法において用いるマイクロアレイは、1cm2あたり少なくとも550種の
プローブ、1cm2あたり少なくとも1,000種のプローブ、1cm2あたり少なくとも1
,500種のプローブ、または1cm2あたり少なくとも2,000種のプローブを有する。
特に好ましい実施形態においてはマイクロアレイは高密度アレイであり、好まし
くは1cm2あたり少なくとも約2,500種の異なるプローブの濃度を有する。従って
、本発明で使用するマイクロアレイは好ましくは、少なくとも2,500、少なくと
も5,000、少なくとも10,000、少なくとも15,000、少なくとも20,000、少なくと
も25,000、少なくとも50,000、または少なくとも55,000の異なる(すなわち、同
一ではない)プローブを含有する。
【0158】 ある実施形態では、該マイクロアレイは、遺伝子にコードされた産物(すなわ
ちmRNAまたはこれに由来するcDNA)に対する個別の結合部位を各位置が提示する
アレイ(すなわちマトリックス)である。例えば、多くの実施形態において、本
発明のマイクロアレイは、生物のゲノム内遺伝子の50%未満によりコードされる
産物に対する結合部位を含み得る。あるいは、本発明のマイクロアレイは、ある
生物のゲノム内遺伝子の少なくとも50%、少なくとも75%、少なくとも85%、少な
くとも90%、少なくとも95%、少なくとも99%または100%によりコードされる産物
に対する結合部位、あるいは前記割合のゲノム内遺伝子を含む遺伝子セットの代
表的な遺伝子に対する結合部位を有し得る。別の実施形態においては、本発明の
マイクロアレイは、ある生物の細胞により発現される遺伝子の50%未満、少なく
とも50%、少なくとも75%、少なくとも85%、少なくとも90%、少なくとも95%、少
なくとも99%または100%によりコードされる産物に対する結合部位、あるいは前
記割合のゲノム内遺伝子を含む遺伝子セットの代表的な遺伝子に対する結合部位
を有し得る。結合部位は、特定のRNAが特異的にハイブリダイズし得るDNAまたは
DNA類似体であり得る。該DNAまたは該DNA類似体は、例えば、合成オリゴマー、
全長cDNA、全長より短いcDNAまたは遺伝子断片であり得る。
【0159】 好ましくは、本発明において用いるマイクロアレイは対象薬物の作用に関連す
るかまたは対象とする生物学的経路の中の1以上に対する遺伝子の結合部位(す
なわちプローブ)をもっている。「遺伝子」は、好ましくは少なくとも50、75ま
たは99個のアミノ酸残基の配列をコードするオープンリーディングフレーム(ORF
)として同定され、該ORFからはメッセンジャーRNAが生物において転写されるか
、または多細胞生物の特定の細胞において転写される。ゲノム中の遺伝子数は、
その細胞または生物によって発現されるmRNAの数により、またはゲノムの十分に
特性づけされた部分のエキストラポレーション(extraporation)によって見積も
ることができる。対象生物のゲノムが配列決定されている場合には、ORFの数を
知ることができ、DNA配列の解析によりmRNAコード領域を同定することができる
。例えば、サッカロミセス・セレビシエ(Saccharomyces cerevisiae)のゲノム
は完全に配列決定されており、アミノ酸残基の長さが99個より長い約6275個のOR
Fをもつと報告されている。これらのORF解析によれば、タンパク質産物をコード
する可能性のある5885個のORFがあることがわかっている(Goffeau et al., 1996
, Science 274:546-567)。一方、ヒトゲノムは約105個の遺伝子をもつとされて
いる。
【0160】 細胞のRNAに相補的なcDNAを作製し、適切なハイブリダイゼーション条
件下でマイクロアレイにハイブリダイズする場合には、あらゆる特定遺伝子に対
応するアレイ中の部位とのハイブリダイゼーションのレベルが、その遺伝子から
転写されたmRNAの細胞における優勢を表すことは理解されよう。例えば、全
細胞mRNAに相補的な、検出可能に標識した(例えば、発蛍光団を用いて)c
DNAをマイクロアレイにハイブリダイズする場合には、該細胞中で転写されて
いない遺伝子に対応するアレイ上の部位(すなわち、該遺伝子の産物を特異的に
結合することが可能な)は、シグナル(例えば、蛍光シグナル)をほとんど、も
しくは全く持たず、また、コードされたmRNAが優勢な遺伝子は、比較的強い
シグナルを持つことになる。
【0161】 好ましい実施形態では、2つの異なる細胞に由来するcDNAを、マイクロア
レイの結合部位にハイブリダイズさせる。薬物応答の場合には、1つの生物学的
サンプルを薬物に暴露し、同じタイプの別の生物学的サンプルを同薬物に暴露し
ないでおく。経路の応答の場合には、1つの細胞を経路の摂動に暴露し、同じタ
イプの別の細胞を経路の摂動に暴露しないでおく。両細胞の各々に由来するcD
NAをそれぞれ違うように標識し、これらを識別できるようにする。ある実施形
態では、例えば、薬物で処理した(もしくは、経路摂動に暴露した)細胞に由来
するcDNAは、フルオレセイン標識dNTPを用いて合成し、また、薬物に暴露し
ていない第2の細胞由来のcDNAは、ローダミン標識dNTPを用いて合成する。
両cDNAを混合し、マイクロアレイにハイブリダイズする場合には、該マイク
ロアレイの各部位について、各cDNAセットからのシグナルの相対強度を測定
すると共に、特定mRNAの存在量の相対差を測定する。
【0162】 以上説明した実施例では、薬物処理した(または、経路を摂動した)細胞に由
来するcDNAは、発蛍光団を刺激すると、緑色の蛍光を発するのに対し、処理
していない細胞に由来するcDNAは、赤色の蛍光を発する。その結果、薬物処
理が影響しない場合、細胞中の特定mRNAの相対存在量に、直接または間接的
に、何の作用も及ぼさない場合には、このmRNAは、両細胞において均等に優
勢となり、逆転写と同時に、赤色標識および緑色標識cDNAは、均等に優勢と
なる。マイクロアレイにハイブリダイズされると、その種のRNAに対する結合
部位は、両発蛍光団に特有の波長を発する(また、組合わさって、茶色を帯びる
)。対照的に、薬物で処理した細胞を、細胞におけるmRNAの優勢を直接また
は間接的に増加する治療を施すと、赤色蛍光に対する緑色の比は高くなる。薬物
が、mRNAの優勢を減じる場合には、この比は低下する。
【0163】 2色蛍光標識および検出手順を使用して、遺伝子発現の変化を測定することは
、例えば、Shenaらの、1995、「相補性DNAマイクロアレイを用いた遺伝子発
現パターンの定量的監視(Quantitative monitoring of gene expression patte
rns with a complementary DNA microarray)」、Science 270:467〜470に記載
されている。この文献は、あらゆる目的のために、その全文を参照として、本明
細書に組み込むものとする。2つの異なる発蛍光団で標識したcDNAを使用す
る利点は、2つの細胞状態における各アレイ遺伝子に対応するmRNAレベルを
、制御下で、直接、かつ本質的に比較できること、また、実験条件(例えば、ハ
イブリダイゼーション条件)の些細な違いによる変動が、後に行う分析に影響し
ないことである。しかし、単一細胞からのcDNAを使用して、例えば、薬物処
理した細胞、もしくは経路を摂動させた細胞と、非処理の細胞における特定mR
NAの絶対量を比較することも可能であることに留意されたい。
【0164】5.7.1.1. マイクロアレイのための核酸の調製 上記したように、特定のコグネイトcDNAが特異的にハイブリダイズする「結合
部位」は、通常、その結合部位に付着している核酸または核酸類似体である。1
実施形態において、マイクロアレイの結合部位は、生物ゲノムにおける各遺伝子
の少なくとも1部に相当するDNAポリヌクレオチドである。これらのDNAは、ゲノ
ムDNAやcDNA(例えば、RT-PCRによる)またはクローニングされた配列から遺伝子
セグメントのポリメラーゼ連鎖反応(PCR)増幅によって得ることができる。遺伝
子またはcDNAの公知配列に基づいてPCRプライマーを選択すると、非反復断片(す
なわち、10塩基より多い隣接する同一配列をマイクロアレイの他の断片と共有し
ない断片)の増幅が起こる。必要な特異性および最適な増幅特性をもつプライマ
ーをデザインするには、コンピュータープログラムが有用である。例えば、Olig
o version 5.0 (National Biosciences)を参照されたい。非常に長い遺伝子に対
応する結合部位の場合、その遺伝子の3'末端近くのセグメントを増幅するのが望
ましいことがある。そうすると、オリゴdTをプライマーとして得られるcDNAプロ
ーブをマイクロアレイにハイブリダイズさせる場合に、全長よりも短いプローブ
が効率的に結合する。マイクロアレイ上の各遺伝子断片は約50 bpから約50,000
bpまで、約50 bpから約2,000 bpまでの長さが典型的であるが、より典型的には
約100 bpから約1,000 bp、通常は約300 bpから約800 bpの長さである。PCR法は
周知であり、例えば、Innis et al.編、1990, PCR Protocols: A Guide to Meth
ods and Applications, Academic Press Inc. San Diego, CAに記載されている
。これらの文献は事実上その全文を参照により組み込むものとする。核酸の単離
および増幅にコンピューター制御ロボットシステムが有用であることは明らかで
ある。
【0165】 本発明の方法および組成物において使用するマイクロアレイ用のポリヌクレオ
チドプローブを作るための好ましい他の方法は、例えば、N-フォスフォネートま
たはフォスフォロアミダイト化学を用いる合成ポリヌクレオチドまたはオリゴヌ
クレオチドの合成によるものである(Froehler et al., 1986, Nucleic Acid Res
14:5399-5407; McBride et al., 1983, Tetrahedron Lett. 24:245-248)。合成
配列は長さ約4〜約500塩基、長さ約15〜約500塩基が典型的であり、さらに典型
的には4〜約200塩基、より好ましくは長さ約15〜約150塩基であり、さらに好ま
しくは約20〜約50塩基である。より短いオリゴヌクレオチドプローブを使用する
いくつかの実施形態においては、長さが40塩基より短い合成核酸配列が好ましく
、より好ましくは長さが15〜30塩基である。より長いオリゴヌクレオチドプロー
ブを使用するいくつかの実施形態においては、長さが40〜80塩基の合成核酸配列
が好ましく、より好ましくは長さが40〜70塩基、さらにより好ましくは長さが50
〜60塩基である。いくつかの実施形態において、合成核酸には、限定するもので
はないがイノシンのような非天然塩基が含まれる。上記したように、ハイブリダ
イゼーションの結合部位として核酸類似体を使ってもよい。適当な核酸類似体の
例としてはペプチド核酸がある(例えば、Egholm et al., 1993, Nature 365:566
-568;米国特許第5,539,083号を参照されたい)。
【0166】 その他の実施形態において、結合(ハイブリダイゼーション)部位は遺伝子のプ
ラスミドもしくはファージクローン、cDNA(例えば、発現配列タグ)またはそれ
らのインサートから作られる(Nguyen et al., 1995, cDNAクローンアレイの定量
ハイブリダイゼーションにより測定したマウス胸腺の差次的遺伝子発現、Genomi
cs 29:207-209)。さらに他の実施形態によれば、結合部位のポリヌクレオチドは
RNAである。
【0167】5.7.1.2. 固体表面への核酸付着 ガラス、プラスティック(例えば、ポリプロピレン、ナイロン)、ポリアクリル
アミド、ニトロセルロースもしくはその他の材料で作られた固体支持体に核酸ま
たはその類似体を付着させる。核酸を表面に付着させる好ましい方法は、Schena
et al., 1995, Quantitative monitoring of gene expression patterns with
a complementary DNA microarray, Science 270:467-470に概説されているよう
に、ガラス板に印刷する方法である。この方法は、cDNAのマイクロアレイを作る
のに特に有用である。DeRisi et al., 1996, Use of a cDNA microarray to ana
lyze gene expression patterns in human cancer, Nature Genetics 14:457-46
0;Shalon et al., 1996, A DNA microarray system for analyzing complex DN
A samples using two-color fluorescent probe hybridization, Genome Res. 6
:639-645;およびSchena et al., 1995, Parallel human genome analysis; mic
roarray-based expression of 1000 genes, Proc. Natl. Acad. Sci. USA 93:1
0539-11286も参照されたい。
【0168】 マイクロアレイを作る第2の好ましい実施形態は、高密度オリゴヌクレオチド
アレイを作る方法である。in situ合成用写真リソグラフィー手法(Fodor et al.
, 1991, Light-directed spatially addressable parallel chemical synthesis
, Science 251:767-773; Pease et al., 1994, Light-directed oligonucleotid
e arrays for rapid DNA sequence analysis, Proc. Natl. Acad. Sci. USA 91
:5022-5026; Lockhart et al., 1996, Expression monitoring by hybridizatio
n to high-density oligonucleotide arrays, Nature Biotech 14:1675;米国特
許第5,578,832号、第5,556,752号および第5,510,270号参照。これらはいずれも
事実上その全文を参照により組み込むものとする)または所定のオリゴヌクレオ
チド類を迅速に合成して堆積させるその他の方法(Blanchardら、1996, High-Den
sity oligonucleotide arrays, Biosensors & Bioelectronics 11:687-90)を用
いて、表面上の所定位置で所定の配列に相補性のオリゴヌクレオチド数千個を含
むアレイを作る方法は公知である。これらの方法を使用する場合、公知の配列を
もつオリゴヌクレオチド(例えば、20量体)が誘導体化(derivatized)ガラススラ
イドのような表面に直接合成される。通常、得られたアレイは、各標的転写物に
対して複数のプローブを有する。オリゴヌクレオチドプローブは選択的にスプラ
イシングされた(alternatively spliced)mRNAを検出するように、または多様な
タイプの対照として機能するように選択することができる。
【0169】 他の好ましいマイクロアレイ製造法は、インクジェット印刷法により固相上に
直接オリゴヌクレオチドを合成することであるが、この方法は例えば、1998年1
月16日に出願されたBlanchardによる米国特許出願第09/008,120号、発明の名称
「溶媒微少滴を用いる化学合成」に記載されている。本文献はその全文を参照に
より本明細書に組み込むものとする。
【0170】 例えばマスキング(Maskos and Southern, 1992, Nuc. Acids Res. 20:1679-16
84)によりマイクロアレイを作るその他の方法も使用することができる。原理的
には、例えば、ハイブリダイゼーション用ナイロンメンブラン上のドットブロッ
トについては、どのタイプのアレイも使用することができる(Sambrookら, Molec
ular Cloning - A Laboratory Manual (第2版),第1〜3巻, Cold Spring Harbor
Laboratory, Cold Spring Harbor, New York, 1989)が、当業者に認識されてい
るように、ハイブリダイゼーション量が少ないので、非常に小さいアレイが好ま
しい。
【0171】 特定の好ましい実施形態において、本発明で使用するマイクロアレイをオリゴ
ヌクレオチド合成用のインクジェットプリント装置によって、例えば、Blanchar
d(1998年9月24日公開の国際特許公開番号WO98/41531号;Blanchardら、1996,
Biosensors and Bioelectronics 11: 687-690;Blanchard, 1998, Synthetic DN
A Arrays in Genetic Engineering, Vol. 20, J.K. Setlow編, Plenum Press, N
ew York, pages 111-123)に記載の方法およびシステムを用いて製造する。具体
的に説明すると、かかるマイクロアレイ中のオリゴヌクレオチドプローブは、「
微小滴(microdroplet)」の高表面張力溶媒(炭酸プロピレンなど)のアレイに
おいてプローブ配列それぞれに個々のヌクレオチドを連続配置することにより合
成するのが好ましい。その微小滴は少量(例えば、100pLまたはそれ以下、より
好ましくは50pLまたはそれ以下)であり、マイクロアレイ上で(例えば疎水性ド
メインによって)互いに分離させて、アレイエレメント(すなわち種々のプロー
ブ)の位置を明確にする円状表面張力ウエルを形成させる。
【0172】 5.7.1.3. 標的ポリヌクレオチド分子 総RNAおよびポリ(A)+RNAの製造方法は周知であり、一般に上記Sambrookらに記
載されている。1実施形態によれば、グアニジニウムチオシアネート溶解のあとC
sCl遠心分離を用いて、本発明の目的の各種細胞からRNAを抽出する(Chirgwinら,
1979, Biochemistry 18:5294-5299)。オリゴdTセルロースによる選択でポリ(A)
+RNAを選択する(上記Sambrookら参照)。目的の細胞には野生型細胞、薬物暴露野
生型細胞、改変細胞および薬物暴露改変細胞が含まれる。
【0173】 オリゴdTプライマーまたはランダムプライマー逆転写によりmRNAから標識cDNA
を作る。これらはともに当分野に周知の方法である(例えば、KlugおよびBerger,
1987, Methods Enzymol. 152:316-325参照)。逆転写は、検出可能な標識を結合
したdNTP、最も好ましくは蛍光標識したdNTPの存在下で行いうる。あるいは、標
識dNTPの存在下において、単離されたmRNAは、2本鎖cDNAのin vitro転写により
合成された標識アンチセンスRNAに変換することができる(Lockhartら, 1996, Ex
pression monitoring by hybridization to high-density oligoncleotide arra
ys, Nature Biotech. 14:1675、これは事実上その全文を参照により組み込むも
のとする)。その他の実施形態によれば、cDNAまたはRNAプローブは検出可能な標
識の不在下で合成することができ、その後、例えば、ビオチニル化dNTPもしくは
rNTPを導入するかまたは何らかの類似手段(例えば、ビオチンのソラレン誘導体
とRNAとを光架橋する)により、次いで、標識ストレプトアビジン(例えば、フィ
コエリスリン結合ストレプトアビジン)またはその同等物を添加して標識を行っ
てもよい。
【0174】 蛍光標識したプローブを用いる場合、適当な蛍光発光団が多数知られており、
フルオレセイン、リサミン、フィコエリスリン、ローダミン(Perkin Elmer Cetu
s)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、FluorX (Amersham)などがある(例えば
、Kricka, 1992, Nonisotopic DNA Probe Techniques, Academic Press San Die
go, CA参照)。蛍光発光団の対として別々の異なる発光スペクトルをもつように
選択すれば容易に識別できることが理解されよう。
【0175】 他の実施形態においては、蛍光標識以外の標識が使用される。例えば、放射性
標識または異なる発光スペクトルをもつ放射性標識の対を使用することができる
(Zhaoら, 1995, High density cDNA filter analysis: a novel approach for l
arge-scale, quantitative analysis of gene expression, Gene 156:207; Piet
uら, 1996, Novel gene transcripts preferentially expressed in human musc
les revealed by quantitative hybridization of a high density cDNA array,
Genome Res. 6:492)。しかしながら、放射性粒子が散乱し、従って広い間隔の
結合部位が必要であるため、放射性アイソトープを使用する実施形態はそれほど
好ましいものではない。
【0176】 1実施形態において、標識cDNAは、0.5 mM dGTP、dATP、dCTP、さらに0.1 mM d
TTPおよび蛍光デオキシリボヌクレオチド(例えば、0.1 mM ローダミン110 UTP (
Perkin Elmer Cetus)または0.1 mM Cy3 dUTP (Amersham))を含有する混合物を42
℃で60分間、逆転写酵素(例えば、SuperScriptTM II, LTI Inc.)とともにインキ
ュベーションすることによって合成する。
【0177】 5.7.1.4. マイクロアレイへのハイブリダイゼーション 核酸ハイブリダイゼーションおよび洗浄条件は、プローブが特定のアレイ部位
と「特異的に結合する」かまたは「特異的にハイブリダイズする」ように選ぶ。
すなわち、プローブは相補性核酸配列をもつ配列アレイ部位とハイブリダイズし
、2本鎖を作り、またはこれと結合する。本明細書で用いられるように、1個のポ
リヌクレオチド配列は、ポリヌクレオチドの短い方が25塩基以下である場合には
、標準の塩基対則を用いるとミスマッチがないとき、またはポリヌクレオチドの
短い方が25塩基より長い場合には、5%以下のミスマッチしかないときに、もう一
方の配列と相補性であるとされる。好ましくは、ポリヌクレオチド類は完全に相
補性である(ミスマッチなし)。ネガティブコントロールを含むハイブリダイゼー
ションアッセイを行うことにより、特定のハイブリダイゼーション条件では特異
的なハイブリダイゼーションが生じることを容易に示すことができる(例えば、
上記Shalonらおよび上記Cheeら参照)。
【0178】 最適なハイブリダイゼーション条件は標識されたプローブおよび固定化された
ポリヌクレオチドもしくはオリゴヌクレオチドの長さ(例えば、オリゴマー対200
塩基より大きいポリヌクレオチド)およびタイプ(例えば、RNA、DNA、PNA)に依存
する。核酸の特異的な(すなわち、ストリンジェントな)ハイブリダイゼーション
条件の一般的なパラメーターは上記Sambrookら、およびAusubelら, 1987, Curre
nt Protocols in Molecular Biology, Greene Publishing and Wiley-Interscie
nce, New Yorkに記載されている。SchenaらのcDNAマイクロアレイを使用する場
合、ハイブリダイゼーション条件は、5 x SSC+0.2% SDS中、65℃で4時間のハイ
ブリダイゼーションを行った後、低いストリンジェンシーの洗浄緩衝液(1 x SSC
+0.2% SDS)中、25℃で洗浄し、次いで高いストリンジェンシーの洗浄緩衝液(0.
1 x SSC+0.2% SDS)中、25℃で10分間洗浄するのが典型的である(Shenaら, 1996
, Proc. Natl. Acad. Sci. USA, 93:10614)。有用なハイブリダイゼーション条
件は、例えば、Tijessen, 1993, Hybridization With Nucleic Acid Probes, El
sevier Science Publishers B. V.ならびにKricka, 1992, Nonisotopic DNA Pro
be Techniques, Academic Press San Diego, CAにも記載されている。
【0179】 5.7.1.5. シグナル検出およびデータ解析 蛍光標識プローブを使用する場合、転写アレイの各部位における蛍光発光は走
査型共焦点レーザー顕微鏡により検出するのが好ましい。1実施形態によれば、
適当な励起線を用いて、使用された2つの蛍光発光団それぞれについて別々の走
査を行う。あるいはまた、2つの蛍光発光団に特異的な波長において同時に試料
を発光させ、その2つの蛍光発光団からの発光を同時に分析できるようなレーザ
ーを使用することができる(例えば、Shalonら, 1996, A DNA microarray system
for analyzing complex DNA samples using two-color fluorescent probe hyb
ridization, Genome Research 6:639-645 ■ これは事実上その全文を参照によ
り本明細書に組み込むものとする)。好ましい実施形態によれば、コンピュータ
ー制御X-Yステージと顕微鏡対物レンズを備えたレーザー蛍光スキャナーにより
アレイを走査する。2つの蛍光発光団を、マルチライン、混合ガスレーザーで順
次励起し、その発光を波長により分けて2つの光マルチプライヤー管で検出する
。蛍光レーザー走査装置はSchenaら, 1996, Genome Res. 6:639-645および本書
に引用された他の文献に記載されている。あるいはまた、Fergusonら, 1996, Na
ture Biotech. 14:1681-1684に記載された光ファイバー束を使用して、多数の部
位で同時にmRNA存在量レベルをモニターしてもよい。
【0180】 シグナルを記録し、そして好ましい実施形態においては、例えば、デジタルボ
ードに12ビットアナログを用いてコンピューター解析を行う。1実施形態によれ
ば、グラフィックプログラム(例えば、Hijaak Graphics Suite)を用いて走査イ
メージの斑点を除いた後、各部位の各波長において平均的なハイブリダイゼーシ
ョンのスプレッドシートを作るイメージ格子プログラムにより解析する。必要で
あれば、2つの蛍光チャンネル間の「混線」(またはオーバラップ)について実験
的に決定した補正をおこなってもよい。転写アレイ上にある特定のハイブリダイ
ゼーション部位については、2つの蛍光発光団の発光比を計算することができる
。発光比はコグネイト遺伝子の絶対発現レベルとは独立しているが、その発現が
薬剤投与、遺伝子欠失あるいはその他のテスト条件により有意に変わる遺伝子に
とっては有用である。
【0181】 本発明の方法によれば、2個の生物学的サンプルにおけるmRNAの相対存在量は
、摂動としてその大きさを決定し(すなわち、存在量はテストしたmRNAの2つのソ
ースにおいて異なる)、または摂動されないとして(すなわち、相対存在量が同じ
)スコアリングする。種々の実施形態において、少なくとも約25%のファクターを
もつ2つのRNAソース間の差(一方のソースからのRNAはそのソースにおいて他のソ
ースよりも25%多く発現する)、さらに通常約50%、さらに大抵の場合約2(2倍多い
)、3(3倍多い)または5(5倍多い)のファクターをもつ2つのRNAソース間の差があ
れば、摂動としてスコアリングされる。
【0182】 好ましくは、ポジティブもしくはネガティブとして摂動を同定する他、摂動の
大きさを測定するのが有利である。これは、上記したように、示差標識に使用し
た2つの蛍光発光団の発光比を測定するか、あるいは当業者に自明の類似方法に
よって行うことができる。
【0183】 5.7.2. 経路応答および遺伝子セット 本発明の1実施形態において、特定の経路に対する摂動の遺伝子発現応答を観
察することによって遺伝子セットを決定する。本発明の1実施形態において、目
的の生物学的サンプルの転写状態を反映する転写アレイは、異なる目的のサンプ
ルのmRNAにそれぞれ対応する(すなわち相補的な)2個の標識プローブ混合物をマ
イクロアレイにハイブリダイズさせることによって作る。本発明によれば、2つ
のサンプルは同じ型、すなわち、同じ種および株であるが、少数(例えば、1、2
、3または5個、好ましくは1個)の遺伝子座において遺伝的に違っていてもよい。
あるいは、これら細胞は同質遺伝子型(isogeneic)であり、両者は環境歴にお
いて異なる(例えば、薬物暴露対非暴露)。発現が高度に相関している遺伝子は、
遺伝子セットに属する可能性がある。
【0184】 本発明の1態様において、多量の摂動に対する応答の遺伝子発現変化を用いて
、定義する遺伝子セットのためにクラスタリングツリーを作成する。好ましくは
。摂動が種々の経路を標的化する必要がある。経路摂動に対する発現応答を測定
するために、生物学的サンプルを目的の経路に対する段階的な摂動に付す。摂動
に暴露したサンプルおよび摂動に暴露していないサンプルを用いて転写アレイを
構築し、それを測定することにより、摂動への暴露に起因して変化した発現を有
するmRNAおよび変化の度合いを判定する。これによって摂動−応答関係が得られ
る。
【0185】 段階的な薬物暴露および段階的な摂動制御パラメーターのレベル濃度は個々の
遺伝子応答におけるシャープネスと構造により支配される。応答の最も急な部分
が急であればあるほど、応答を適切に分離するのに必要なレベルは密になる。こ
の代表的な密度の概略を図2の例に示す。図2において、100倍幅の濃度にわた
ってメトトレキセートに6回暴露すれば、遺伝子発現応答を分離するには正に十
分であった。しかしながら、この経路をより精細に表示するにはそれ以上の暴露
が好ましい。
【0186】 さらに、実験誤差を減らすためには、個々の遺伝子またはアレイスポット位置
に独特のバイアスを抑える2色識別ハイブリダイゼーション実験において蛍光標
識を逆にすることが好ましい。換言すれば、まず最初に、測定対象である2個の
細胞から得られたmRNAについて1つの標識(例えば、摂動される細胞を第1のフル
オロクロムで標識し、摂動されない細胞を第2のフルオロクロムで標識する)で遺
伝子発現を測定し、次に逆標識(例えば、摂動される細胞を第2のフルオロクロム
で標識し、摂動されない細胞を第1のフルオロクロムで標識する)の細胞2個から
の遺伝子発現を測定するのが好ましい。暴露レベルと摂動制御パラメーターレベ
ルについて複数回測定すればさらに実験誤差を制御することができる。適当なサ
ンプリングについては、誤差の平均化および応答機能の構造ロス間の応答データ
を補間するのに使用する溝機能Sの幅を選択する際に交換を行ってもよい。
【0187】 5.7.3. 段階的な摂動応答データの測定 段階的な応答データを測定するために、細胞を、段階的レベルの薬物、目的の
薬物候補、または段階的強度の他の摂動に暴露する。細胞をin vitroで増殖され
る場合には、通常、細胞用の栄養培地に化合物を加える。酵母の場合、初期対数
期に該酵母を収穫することが好ましいが、これは、この初期対数期には発現パタ
ーンが比較的収穫時期に影響を受けないからである。複数のレベルの薬物または
他の化合物を添加する。薬物の特定の特徴に従って特定のレベルを使用するが、
通常、約1ng/ml〜100 mg/mlの間であろう。ある場合には、DMSOなどの溶媒に薬
物を可溶化してもよい。
【0188】 薬物に暴露した細胞もしくは薬物に暴露していない細胞を用いて転写物アレイ
を構築し、このアレイを測定して、薬物への暴露によって発現が変化したmRNAを
見つけ出す。これによって薬物応答が得られる。
【0189】 経路応答の測定と同様に薬物応答についても、二色示差ハイブリダイゼーショ
ンの場合、逆標識(reversed labeling)を用いて測定することも好ましい。ま
た、使用した薬物暴露のレベルによって(例えば、約10レベルの薬物暴露を用い
ることによる)薬物応答の迅速に変化する領域の解析が十分に得られることが好
ましい。
【0190】 5.7.4. 転写状態の他の測定法 細胞の転写状態は当業界で公知の他の遺伝子発現技術によって測定可能である
。そのような技術のいくつか、例えば二重制限酵素消化と同調性(phasing)プラ
イマーとを組合わせる方法(例えばZabeauらによって1992年9月24日に出願され
た欧州特許出願公開第0 534 858A1号明細書参照)、あるいは、特定のmRNA末端
に最も近接する部位をもつ制限断片を選択する方法(例えばPrasharら, 1996, P
roc. Natl. Acad. Sci. USA 93:659-663参照)によって、電気泳動分析のための
ある程度複雑な制限断片のプールが作られる。他の方法はcDNAプールを統計的
にサンプリングするものであり、このようなサンプリングは例えば複数のcDNA
の各々における十分な塩基(例えば20〜50塩基)を配列決定して各cDNAを同定す
ることによるか、あるいは、特定のmRNA末端に関する公知の位置に形成される
短いタグ(例えば9〜10塩基)を配列決定することによる(例えばVelculescu, 199
5, Science 270:484-487参照)。
【0191】 5.7.5. 生物学的状態の他の状況の測定 本発明の種々の実施形態において、転写状態以外の生物学的状態の他の状況、
例えば翻訳状態、活性状態または混在する生物学的状態(即ち混合状況)、を測
定して、薬物応答および経路応答を得ることができる。これらの具体例の詳細は
この節に記載する。
【0192】 5.7.5.1. 翻訳状態の測定に基く実施形態 翻訳状態の測定はいくつかの方法に準じて行うことができる。例えばタンパク
質の全ゲノムモニタリング(即ち「プロテオーム(proteome)」、Goffeauら, 前
掲)は、マイクロアレイを構築することによって行うことができ、マイクロアレ
イの結合部位には、細胞ゲノムによってコードされる複数のタンパク質種に特異
的な固定化された抗体(好ましくはモノクローナル抗体)が含まれる。好ましくは
、抗体は、コードされるタンパク質の実質的部分(substantial fraction)、ある
いは少なくとも目的の薬物の作用と関連する該タンパク質、に対して存在する。
モノクローナル抗体を作製する方法はよく知られている(例えばHarlowおよびLa
ne, 1988, Antibodies: A Laboratory Manual, Cold Spring Harbor, New York
参照;この文献はその全体についてあらゆる目的で本明細書に取り入れるものと
する。)。好適な実施形態において、モノクローナル抗体は、細胞のゲノム配列
に基いて設計された合成ペプチド断片に対する抗体である。そのような抗体アレ
イを用いて、細胞からのタンパク質を該アレイと接触させ、それらの結合を当業
界で公知のアッセイ法でアッセイする。
【0193】 あるいは、二次元ゲル電気泳動システムによってタンパク質を分離してもよい
。二次元ゲル電気泳動は当業界でよく知られており、典型的には、一次元に沿う
等電点電気泳動とそれに続く二次元に沿うSDS-PAGE電気泳動を含む。例えばHame
sら, 1990, Gel Electrophoresis of Proteins: A Practical Approach, IRL Pr
ess, New York; Shevchenkoら, 1996, Proc. Nat’l, Acad. Sci. USA 93:1440-
1445; Saglioccoら, 1996, Yeast 12:1519-1533; Lander, 1996, Science 274:5
36-539参照。得られた電気泳動図は種々の方法、即ちマススペクトル法、ポリク
ローナルおよびモノクローナル抗体を使用するウエスタンブロッティング法やイ
ムノブロット分析、ならびに内部およびN末端ミクロシーケンシングなどの方法
によって分析可能である。これらの方法を用いて所与の生理学的条件下で産生さ
れるあらゆるタンパク質の実質的部分を同定することができる。生理学的条件下
の例としては、薬物に暴露された細胞(例えば酵母)中、あるいは、特定遺伝子の
例えば欠失もしくは過剰発現によって改変された細胞中が挙げられる。
【0194】 5.7.5.2. 生物学的状態の他の状況に基づく実施形態 本発明の方法を、遺伝子発現プロフィールを含む実施形態により説明したが、
本発明の方法は、モニターしうるいずれの細胞構成要素にも適用可能である。
【0195】 特に、摂動(薬物作用など)の特性決定に関連したタンパク質活性を測定可能
な場合には、本発明の実施形態をかかる測定に基づいて行いうる。活性測定は、
特性決定すべき特定の活性に適切な任意の機能的、生化学的、または物理的手段
により実施しうる。その活性が化学的転移に関与している場合には、細胞性タン
パク質と天然基質とを接触させて、転移速度を測定しうる。活性が多重結合ユニ
ットとの会合、例えば活性化DNA結合複合体とDNAとの会合に関与している場合に
は、会合タンパク質または会合の2次生成物の量、例えば転写されたmRNA量を測
定してもよい。また、例えば細胞周期制御におけるような機能的活性のみが知ら
れている場合には、機能の性能を観察しうる。しかしながらいかに公知であり、
測定されようとも、タンパク質活性の変化によって本発明の上述の方法により分
析される応答データが得られる。
【0196】 他のおよび非限定的実施形態において、応答データは、細胞の生物学的状態の
混在する態様から得られる。応答データは、例えば、特定のmRNA存在量の変化、
特定のタンパク質存在量の変化、および特定のタンパク質活性の変化から作成し
うる。
【0197】 5.8 細胞状態の精査方法 本発明の1態様は、同時に変化する細胞構成要素の分析方法を提供する。本発
明の方法はまた、細胞状態を精査するために設計された摂動に対する生物学的サ
ンプルの応答の分析にも有用である。本節において、細胞状態の精査方法をある
程度説明する。
【0198】 種々のレベルの細胞における細胞状態の標的化摂動のための方法は、広く知ら
れるようになり、当技術分野で利用されている。特定の細胞構成要素(例えば、
遺伝子発現、RNA濃度、タンパク質存在量、タンパク質活性など)を特異的に標
的化および制御可能な改変する(例えば、段階的な増大または活性化により、あ
るいは段階的な低減または阻害による)ことができる前記方法はいずれも、細胞
状態の摂動の実施に使用しうる。細胞構成要素の制御可能な改変は、結果として
、改変された細胞構成要素に起因する細胞状態を制御可能に摂動する。好ましい
改変方法は、多数の細胞構成要素、最も好ましくはかかる細胞構成要素の実質的
な画分のそれぞれを、個々に標的化することができる。
【0199】 以下に記載の方法は、細胞構成要素を改変し、それにより上述の本発明の方法
のステップにおいて使用する細胞状態応答を生成する細胞状態の摂動を引き起こ
すために使用しうる方法の例である。本発明は、細胞状態、特に細胞状態の原因
となる細胞構成要素に対して制御可能な摂動を生じさせるための他の方法にも利
用可能である。
【0200】 細胞状態の摂動は、ゲノムまたは発現された配列情報が入手可能であるか、特
定遺伝子の発現の制御可能な改変を可能にする方法が利用可能な任意の生物に由
来する細胞型の細胞で行うことが好ましい。ゲノムの配列決定は、数種の真核生
物(ヒト、線虫、アラビドプシス属、ハエなど)で現在行われており、登録され
ている。好ましい実施形態において、本発明は酵母を用いて行うが、サッカロミ
セス・セレビシエ(Saccharomyces cerevicie)を用いるのが最も好ましく、な
ぜなら、S.セレビシエ株のゲノム全体が配列決定されているためである。さら
に、酵母遺伝子の制御可能な改変発現のための十分に確立されている方法を利用
可能である。好ましい酵母株は、S.セレビシエ株であり、S228C株または実質
的に同種同系のその誘導体などの酵母のゲノム配列は既知である(例えば、Natu
re 369, 371-8 (1994);P.N.A.S. 92: 3809-13 (1995);E.M.B.O.J. 13: 5795-5
809 (1994);Science 265: 2077-2082 (1994);E.M.B.O.J. 15: 2031-49 (1996)
を参照のこと。これらは全て本明細書に組み入れる。)。しかしながら他の株も
同様に使用可能である。酵母株は、American Type Culture Collection, Manass
as, Virginiaより入手可能である。酵母の遺伝子操作のための標準技法は、C. K
aiser, S. MichaelisおよびA. Mitchell, 1994, Methods in Yeast Genetics: A
Cold Spring Harbor Laboratory Course Manual, Cold Spring Harbor Laborat
ory Press, New York;ならびにShermanら、1986, Methods in Yeast Genetics:
A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor,
New York(いずれも全ての目的のためにその全文を参照により本明細書に組み
入れる)に記載されている。
【0201】 以下に記載の例示的方法には、タイトレート可能な発現系の使用、トランスフ
ェクションもしくはウイルス形質導入系の使用、RNA存在量もしくは活性に対す
る直接的改変、タンパク質存在量の直接的改変、ならびに特定の既知作用を有す
る薬物(または、一般的には化学的部分)の使用を含むタンパク質活性の直接的
改変が含まれる。
【0202】 5.8.1. タイトレート可能な発現系 酵母サッカロミセス・セレビシエ(Saccharomyces cerevisiae)の出芽で使用
するのに利用可能な、複数の公知のタイトレート可能もしくは同等に制御可能な
発現系はいずれも本発明に適合可能である(Mumbergら、1994, Regulatable pro
moter of Saccharomyces cerevisiae; comparison of transcriptional activit
y and their use for heterologous expression, Nucl. Acids Res. 22: 5767-5
768)。通常、遺伝子発現は、染色体上で制御しようとする遺伝子のプロモータ
ーを制御可能な異種プロモーターと交換する転写制御により制御可能である。酵
母で最も一般的に使用されている制御可能なプロモーターは、GAL1プロモーター
である(Johnstonら、1984, Sequences that regulate the divergent GAL1-GAL
10 promoter in Saccharomyces cerevisiae, Mol. Cell. Biol. 8: 1440-1448)
。GAL1プロモーターは、増殖培地中のグルコースの存在により強く抑制され、そ
してグルコースの存在量およびガラクトースの存在が低減することにより段階的
に高レベルの発現へと変換する。GAL1プロモーターは、通常、目的の遺伝子に対
して5〜100倍の発現制御を可能とする。
【0203】 他の頻繁に使用されるプロモーター系には、増殖培地中のメチオニンの不在に
より誘導されるMET25プロモーター(Kerjanら、1986, Nucleotide sequence of
the Saccharomyces cerevisiae MET25 gene, Nucl. Acids Res. 14: 7861-7871
)、ならびに、銅により誘導されるCUP1プロモーター(Mascorro-Gallardoら、1
996, Construction of a CUP1 promoter-based vector to modulate gene expre
ssion in Saccharomyces cerevisiae, Gene 172: 169-170)が含まれる。これら
のプロモーター系は全て、遺伝子発現が増殖培地中で制御する部分の存在量が徐
々に増大する変化によって徐々に増大して制御されうる点で制御可能である。
【0204】 上に挙げた発現系の不利な点の一つは、プロモーター活性を制御する(炭素源
の変化、特定のアミノ酸の除去などにより影響される)ことにより、他の遺伝子
の発現レベルを独立して変える細胞生理学における別の変化が引き起こされるこ
とが多いというものである。近年開発された酵母のための系であるTet系はこの
問題を大幅に軽減する(Gariら、1997, A set of vectors with a tetracycline-
regulatable promoter system for modulated gene expression in Saccharomyc
es cerevisiae, Yeast 13:837-848)。この哺乳動物発現系から採用されたTetプ
ロモーター(Gossenら、1995, Transcriptional activation by tetracyclines i
n mammalian cells, Proc. Nat. Acad. Sci. USA 89:5547-5551)は、抗生物質で
あるテトラサイクリン、または構造的に関連した化合物であるドキシサイクリン
の濃度に応じてモジュレートされる。そして、ドキシサイクリンの不在下では、
プロモーターは高レベルの発現を誘導し、ドキシサイクリンのレベルを上げて添
加すると、それにつれてプロモーター活性の抑制の度合が増加する。中程度のレ
ベルの遺伝子発現は、定常状態において中程度のレベルの薬剤を添加することに
よりなされる。さらに、プロモーター活性の抑制を最大とするドキシサイクリン
のレベルによっては(10μg/ml)、野生型酵母細胞の増殖速度は有意に影響されな
い(Gariら、1997, A set of vectors with a tetracycline-regulatable promot
er system for modulated gene expression in Saccharomyces cerevisiae, Yea
st 13:837-848)。
【0205】 哺乳動物細胞においては、遺伝子の発現をタイトレート(titrating)するため
のいくつかの手段を利用できる(Spencer, 1996, Creating conditional mutatio
ns in mammals, Trends Genet. 12:181-187)。上述の通り、Tet系は、そのオリ
ジナルの型である「フォワード」系(ドキシサイクリンの添加により転写が抑制
される)、およびより新しい「リバース」系(ドキシサイクリンの添加により転
写が刺激される)の双方において広く使用されている(Gossenら、1995, Proc. N
atl. Acad. Sci. USA 89:5547-5551;Hoffmannら、1997, Nucl. Acids. Res. 25:
1078-1079;Hoffmannら、1996, Proc. Natl. Acad. Sci. USA 83:5185-5190;Paul
usら、1996, Journal of Virology 70:62-67)。哺乳動物細胞において一般に使
用される他の制御可能なプロモーター系には、Evansおよび共同研究者により開
発されたエクジソン誘導系(Noら、1996, Ecdysone-inducible gene expression
in mammalian cella and transgenic mice, Proc. Natl. Acad. Sci. USA 93:33
46-3351)がある。この系では、発現は、培養細胞に添加したムリステロン(muris
terone)のレベルにより制御する。最後に、発現は、Schreiber、Crabtree、およ
び共同研究者によって開発された「化学誘導性二量体化」(CID)系(Belshawら
、1996, Controlling protein association and subcellular localization wit
h a synthetic ligand that induces heterodimerization of proteins, Proc.
Nat. Acad. Sci. USA 93;4604-4607; Spencer, 1996, Creating conditional mu
tations in mammals, Trends Genet. 12:181-187)および酵母における類似の系
を使用してモジュレートできる。この系においては、目的の遺伝子をCID-応答性
プロモーターの制御下におき、2種の異なるハイブリッドタンパク質(一方は、
FK506に結合するFKBP12に融合されたDNA結合性ドメインを含み、他方のハイブリ
ッドタンパク質は同様にFKBP12に融合された転写活性化ドメインを含む)を発現
する細胞中へトランスフェクトする。CID誘導分子は、FK1012(FK506のホモ二量
体型であり、DNA結合ハイブリッドタンパク質と転写活性化ハイブリッドタンパ
ク質の双方に同時に結合できる)である。FK1012を段階的に存在させると、制御
される遺伝子の転写が段階的レベルで活性化される。
【0206】 上記の各哺乳動物発現系においては、当業者に広く知られている通り、目的の
遺伝子は制御し得るプロモーターの制御下におかれ、この構築物を抗生物質耐性
遺伝子とともに有するプラスミドを用いて哺乳動物の培養細胞をトランスフェク
トする。一般に、プラスミドDNAはゲノム中に組み込まれ、薬物耐性コロニーを
選択し、制御される遺伝子の適切な発現に関してスクリーニングする。あるいは
、制御される遺伝子を、プラスミド複製に必要なエプスタイン−バーウイルスの
構成部分を含むpCEP4(Invitrogen, Inc.)などのエピソームプラスミド中に挿入
してもよい。
【0207】 好適な実施形態においては、上記の発現系などのタイトレーション可能な(tit
ratable)発現系を、対応する内因性遺伝子および/または遺伝子活性を欠失して
いる細胞または生物(内因性遺伝子が破壊または欠失されている生物など)中へ
導入して使用する。このような「ノックアウト」を作製するための方法は当業者
によく知られている。例えば、Pettittら、1996, Development 122:4149-4157;S
pradlingら、1995, Proc.Natl. Acad. Sci. USA, 92:10824-10830;Ramirez-Soli
sら、1993, Methods Enzymol. 225:855-878;およびThomasら、1987, Cell 51:50
3-512を参照されたい。
【0208】5.8.2. 哺乳動物細胞のためのトランスフェクション系 標的遺伝子のトランスフェクションまたはウイルス形質導入により、哺乳動物
細胞で、生物学的細胞状態における制御し得る摂動を導入できる。標的遺伝子の
トランスフェクションまたは形質導入を、天然には目的の標的遺伝子を発現しな
い細胞に対して行い得ることが好ましい。このような非発現細胞を、標的遺伝子
を通常発現しない組織から誘導できる。また標的遺伝子は、細胞内において特異
的に変異させ得る。目的の標的遺伝子を、pcDNA3.1 +/- system(Invitrogen, In
c.)などの多数の哺乳動物発現プラスミドまたはレトロウイルスベクターの1つ
にクローン化し、非発現宿主細胞中に導入できる。標的遺伝子を発現する、トラ
ンスフェクトまたは形質導入された細胞は、発現ベクターにコードされた薬物耐
性マーカーに関して選択し、単離し得る。遺伝子の転写レベルは、トランスフェ
クションの用量に単純に関連する。この方法において、標的遺伝子のレベルを変
化させる影響を試験できる。
【0209】 この方法を用いる具体的な例としては、src-ファミリータンパク質チロシンキ
ナーゼであるlck(T細胞受容体活性化細胞状態の鍵となる成分)を標的とした薬
物の探索がある(Andersonら、1994, Involvement of the protein tyrosine kin
ase p56(lck) in T cell signaling and thymocyte development, Adv. Immunol
. 56:171-178)。この酵素の阻害剤は、潜在的な免疫抑制剤として関心が持たれ
ている(Hanke, 1996, Discovery of a Novel, Potent, and src family-selecti
ve tyrosine kinase inhibitor, J. Biol Chem 271:695-701)。lckキナーゼを発
現しないJurkat T細胞系の特定の変異体(JcaM1)は入手し得る(Strausら、1992,
Genetic evidence for the involvement of the lck tyrosine kinase in signa
l transduction through the T cell antigen receptor, Cell 70:585-593)。従
って、トランスフェクションまたは形質導入によりlck遺伝子をJCaM1中に導入す
ることにより、lckキナーゼにより制御されるT細胞活性化細胞状態の特定の摂動
が可能となる。トランスフェクションまたは形質導入の効率、およびその結果と
しての摂動レベルは用量に関連する。本方法は一般に、摂動される遺伝子を通常
は発現しない細胞において、遺伝子発現またはタンパク質存在量の摂動を提供す
るために有用である。
【0210】 5.8.3. RNAの存在量または活性を改変する方法 RNAの存在量または活性を改変する方法は、現在3つの分類、リボザイム、アン
チセンス種、およびRNAアプタマーに属する(Goodら, 1997, Gene Therapy 4:45-
54)。制御可能な応用または細胞のこれらの物質への暴露によってRNA存在量の制
御可能な摂動が可能になる。
【0211】 リボザイムはRNA開裂反応を触媒することができるRNAである(Cech, 1967, Sci
ence 236:1532-1539; 1990年10月4日に公開されたPCT国際公開WO 90/11364; Sar
verら, 1990, Science 247:1222-1225)。「ヘアピン」および「ハンマーヘッド
」RNAリボザイムを特定の標的mRNAを特異的に開裂するように設計することがで
きる。高度に配列特異的な方法でその他のRNA分子を開裂することができ、ほと
んど全種類のRNAを標的化することができるリボザイム活性を有する短いRNA分子
を設計するための規則が確立されている(Haseloffら, 1988, Nature 334:585-59
1; Koizumiら, 1988, FEBS Lett., 228:228-230; Koizumiら, 1988, FEBS Lett.
, 239:285-288)。リボザイム法には細胞をかかる小さいRNAリボザイム分子に暴
露すること、細胞中で発現を誘発することなどが含まれる(GrassiおよびMarini,
1996, Annals of Medicine 28:499-510; Gibson, 1996, Cancer and Metastasi
s Reviews 15:287-299)。
【0212】 リボザイムをin vivoにおいてmRNAの開裂に触媒的に有効であるために十分な
数で通常に発現させることができ、それによって細胞中でmRNAの存在量を改変す
ることができる(Cottonら, 1989, in vivoにおけるRNAのリボザイムを媒介した
分解, The EMBO J. 8:3861-3866)。特に、前の規則に従い設計され、および例え
ば標準ホスホルアミダイト化学によって合成されたリボザイムコードDNA配列は
、tRNAをコードする遺伝子のアンチコドンステムおよびループ中で制限酵素部位
に結合することができ、次いでそれを当技術分野において決まった方法によって
対象細胞中で形質転換して発現させる。好ましくは、誘発可能なプロモーター(
例えば、グルココルチコイドまたはテトラサイクリン応答性要素)もまたこの構
築物に導入され、その結果リボザイム発現を選択的に制御することができる。tD
NA遺伝子(すなわち、tRNAをコードする遺伝子)は、それらの大きさが小さいこ
と、転写速度が速いこと、および異なる種類の組織の至る所で発現することから
本願において有用である。それゆえリボザイムを通常ほとんどいかなるmRNA配列
も切断するように設計することができ、細胞を通常かかるリボザイム配列をコー
ドするDNAで形質転換することができ、その結果、制御可能でかつ触媒的に有効
な量のリボザイムが発現する。従って、細胞中のほとんどいかなるDNA種の存在
量も摂動することができる。
【0213】 別の実施形態において、標的RNA(好ましくはmRNA)種の活性、特異的にその
翻訳速度をアンチセンス核酸の制御可能な適用によって制御しながら阻害するこ
とができる。本明細書において「アンチセンス」核酸とは、コードおよび/また
は非コード領域と相補性のある領域によって標的RNA、例えばその翻訳開始領域
の配列特異的(例えば、非ポリA)部分とハイブリダイズすることができる核酸
をいう。本発明のアンチセンス核酸は二本鎖または一本鎖のRNAもしくはDNAまた
はそれらの変異体もしくは誘導体であってもよく、それらを直接制御可能な方法
で細胞に投与することができ、あるいはそれを標的RNAの翻訳を摂動するに十分
な制御可能な量での外因性の導入された配列の転写によって細胞内で産生するこ
とができる。
【0214】 好ましくは、アンチセンス核酸は、少なくとも6個のヌクレオチドから成り、
好ましくは、オリゴヌクレオチド(6〜約200のオリゴヌクレオチド)である。特
定の態様では、このオリゴヌクレオチドは、少なくとも10のヌクレオチド、少な
くとも15のヌクレオチド、少なくとも100のヌクレオチド、少なくとも200のヌク
レオチドである。このオリゴヌクレオチドは、DNAもしくはRNA、あるいは、その
キメラ混合体または誘導体もしくは修飾体、一本鎖または二本鎖のいずれでもよ
い。オリゴヌクレオチドは、塩基成分、糖成分、もしくは燐酸エステルバックボ
ーンで修飾することができる。また、このオリゴヌクレオチドは、ペプチド等の
他の付属基、または、細胞膜を介した輸送を促進する薬剤(例えば、Letsinger
ら、1989、Proc. Natl. Acad. Sci. U.S.A. 86:6553〜6556;Lemaitreら、1987
、Proc. Natl. Acad. Sci. 84:648〜652;1988年12月15日に公開されたPCT公開
番号WO88/09810号を参照)、ハイブリダーゼーション開始切断剤(例えば、Krol
ら、1988、BioTechniques 6:958〜976)あるいは、インターカレート剤(例え
ば、Zon、1988、Pharm. Res. 5:539〜549参照)を含んでもよい。
【0215】 本発明の好ましい態様では、好ましくは、一本鎖DNAとして、アンチセンスオ
リゴヌクレオチドが提供される。このオリゴヌクレオチドは、一般に当業者には
公知の構築物を用いて、その構造上のあらゆる位置で修飾することができる。
【0216】 アンチセンスオリゴヌクレオチドは、限定するものではないが、5-フルオロウ
ラシル、5-ブロモウラシル、5-クロロウラシル、5-ヨードウラシル、ヒポキサン
チン、キサンチン、4-アセチルシトシン、5-(カルボキシヒドロキシルメチル)
ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメ
チルアミノメチルウラシル、ジヒドロウラシル、β-D-ガラクトシルクエオシン
、イノシン、N6-イソペンテニルアデニン、1-メチルグアニン、1-メチルイノシ
ン、2,2-ジメチルグアニン、2-メチルアデニン、2-メチルグアニン、3-メチルシ
トシン、5-メチルシトシン、N6-アデニン、7-メチルグアニン、5-メチルアミノ
メチルウラシル、5-メトキシアミノメチル-2-チオウラシル、β-D-マンノシルク
エオシン、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、2-メ
チルチオ-N6-イソペンテニルアデニン、ウラシル-5-オキシ酢酸(v)、ワイブ
トキソシン(wybutoxosine)、プソイドウラシル、クエオシン、2-チオシトシン、
5-メチル-2-チオウラシル、2-チオウラシル、4-チオウラシル、5-メチルウラシ
ル、ウラシル-5-オキシ酢酸メチルエステル、ウラシル-5-オキシ酢酸(v)、5-
メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、
(acp3)w、ならびに2,6-ジアミノプリンを含む群より選択される少なくとも1つ
の修飾塩基成分を含む。
【0217】 別の実施形態では、上記オリゴヌクレオチドは、限定するものではないが、ア
ラビノース、2-フルオロアラビノース、キシルロース、ならびにヘキソースを含
む群から選択される少なくとも1つの修飾糖成分を含む。
【0218】 さらに別の実施形態では、上記オリゴヌクレオチドは、ホスホロチオネート、
ホスホロジチオネート、ホスホルアミドチオネート、ホスホルアミデート、ホス
ホルジアミデート、メチルホスホネート、アルキルホスホトリエステル、ホルム
アセタールもしくはその類似体から成る群より選択される少なくとも1つの修飾
リン酸エステル骨格を含む。
【0219】 さらに別の実施形態では、上記オリゴヌクレオチドは、2-α-アノマーオリゴ
ヌクレオチドである。α-アノマーオリゴヌクレオチドは、相補的RNAと特定の二
本鎖ハイブリッドを形成するが、ここでは、通常のβ-ユニットとは反対に、鎖
は互いに平行に延びる(Gautierら、1987、Nucl. Acids Res. 15:6625から6641
)。
【0220】 オリゴヌクレオチドは、別の分子、例えば、ペプチド、ハイブリダイゼーショ
ン開始架橋剤、輸送剤、ハイブリダイゼーション開始切断剤等の他の分子と共役
させてもよい。
【0221】 本発明のアンチセンス核酸は、標的RNA種の少なくとも一部と相補的な配列を
含む。しかし、絶対相補性は、好ましくはあるが、必要ではない。ここで述べる
「RNA種の少なくとも一部と相補的な」配列とは、RNAとハイブリダイズして、安
定した二重らせんを形成するのに十分な相補性を有する配列を意味する。従って
、二本鎖アンチセンス核酸の場合には、二重らせんDNAの一本鎖を試験するか、
あるいは、三重らせん形成を検定することができる。ハイブリダイズする能力は
、相補性の程度と、アンチセンス核酸の長さの両方に左右される。一般に、ハイ
ブリダイズする核酸が長いほど、それに含まれる標的RNAとの塩基ミスマッチが
多くなるため、さらに安定した二重らせん(もしくは、場合に応じて、三重らせ
ん)が形成される。当業者であれば、ハイブリダイズされた複合体の融点を測定
する標準的方法を用いて、許容可能なミスマッチの程度を決定することができる
だろう。標的RNAの翻訳抑制に有効となるアンチセンス核酸の量は、標準的アッ
セイ方法により測定することができる。
【0222】 本発明のオリゴヌクレオチドは、当業者には公知の標準的方法、例えば、自動
DNA合成装置(Biosearch、Applied Biosystems等から市販されているもの等 の使用により、合成することができる。例として、Steinらの方法により、ホス
ホロチオネートオリゴヌクレオチドを合成することができ(1988、Nucl. Acids
Res. 16:3209)、また、制御された有孔ガラスポリマー支持体の使用により、
メチルホスホネートオリゴヌクレオチドを調製することができる(Sarinら、198
8、Proc. Natl. Acad. Sci. U.S.A. 85:7448〜7451)。別の形態では、オリゴ
ヌクレオチドは、2’-0-メチルリボヌクレオチド(Inoueら、1987、Nucl. Acids
Res. 15:6131〜6148)、またはキメラRNA-DNA類似体(Inoueら、1987、FEBS L
ett. 215:327〜330)である。
【0223】 合成されたアンチセンスオリゴヌクレオチドを、制御可能に細胞に投与するこ
とができる。例えば、アンチセンスオリゴヌクレオチドが、細胞に摂取される制
御レベルで、これらオリゴヌクレオチドを細胞の増殖環境におくことができる。
このアンチセンスオリゴヌクレオチドの摂取は、当業者には公知の方法を用いて
、補助することができる。
【0224】 別の実施形態では、本発明のアンチセンス核酸は、外因性配列からの転写によ
り、細胞内に制御下で発現させる。例えば、ベクターをin vivoに導入して、該
ベクターが細胞により吸収されるようにすることができる。この細胞内で、ベク
ターまたはその一部が転写され、本発明のアンチセンス核酸(RNA)を生成する
。このようなベクターは、アンチセンス核酸をコードする配列を含む。このよう
なベクターは、転写されてアンチセンスRNAを生成できる限り、エピソームのま
までいるか、あるいは、染色体的に統合されることができる。このベクターは、
当業者には標準的な組換えDNA技術により構築することができる。ベクターは、
哺乳動物細胞での複製および発現に使用される、プラスミド、ウイルス、その他
、当業者には公知のものである。上記アンチセンスRNAをコードする配列の発現
は、関心のある細胞内で作用する当業者には公知のあらゆるプロモーターによっ
て行うことができる。このようなプロモーターは、誘導性または構成性のいずれ
でもよい。最も好ましくは、アンチセンスオリゴヌクレオチドの制御された発現
を達成するために、外因性成分の投与によって、制御可能または誘導可能なもの
である。このような制御可能なプロモーターは、Tetプロモーターを含む。哺乳
動物細胞用の次に好ましい使用可能なプロモーターには、限定するものではない
が、SV40初期プロモーター領域(BernoistおよびChambon、1981、Nature 290:3
04〜310)、ラウスニワトリ肉腫ウイルスの3’長末端リピートに含まれるプロモ
ーター(Yamamotoら、1980、Cell 22:787〜797)、ヘルペスチミジンキナーゼ
プロモーター(Wagnerら、1981、Proc. Natl. Acad. Sci. U.S.A. 78:1441〜1
445)、メタロチネイン遺伝子の調節配列(Brinsterら、1982、Nature 296:39
〜42)等が含まれる。
【0225】 従って、アンチセンス核酸は、慣例的手順により、実質的にあらゆるmRNA配列
を標的とするように設計することができる。また、慣例的手順により、このよう
なアンチセンス配列をコードする核酸で、細胞を形質転換するか、あるいは、該
核酸に暴露することにより、有効かつ、制御可能な量のアンチセンス核酸を発現
させることが可能である。従って、細胞における実質的にあらゆるRNA種の翻訳
を制御可能に摂動することができる。
【0226】 最後に、さらに別の形態では、RNAアプタマーを細胞に導入する、もしくは発
現させることができる。RNAアプタマーは、タンパク質の翻訳を特異的に阻害す
ることができるTatおよびRev RNA(Goodら、1997、Gene Therapy 4:45〜54)等
、タンパク質用の特異的RNAリガンドである。
【0227】 5.8.4. タンパク質存在量の改変方法 タンパク質存在量の改変方法には、中でも、タンパク質分解速度を改変するも
の、ならびに、抗体(天然標的タンパク質種の活性の存在量に影響を及ぼすタン
パク質に結合する)を用いたものが含まれる。あるタンパク質種の分解速度の増
加(または減少)により、その種の存在量が減少(または増加)する。温度上昇
および/または特定薬剤への暴露に応答する標的タンパク質の分解速度の制御可
能な増加方法は、当業者には公知であり、本発明で使用することができる。例え
ば、ある方法では、熱誘導性または薬剤誘導性N末端デグロン(degron)を用いる
が、これは、より高い温度(例えば、37℃)での急速なタンパク質分解を促進す
る分解シグナルを露出し、また、より低い温度(例えば、23℃)では隠れて、急
速な分解を阻止するN末端タンパク質断片である(Dohmenら、1994、Science 26
3:1273〜1276)。このようなデグロンの例として、N末端ValがArgによって置
換され、位置66のProがLeuで置換されたマウスジヒドロ葉酸還元酵素の変異型で
ある、Arg-DHFRtsがある。この方法によれば、例えば、標的タンパク質、Pの遺
伝子を、当業者には公知の標準的遺伝子ターゲッティング方法(Lodishら、1995
、Molecular Biology of the Cell、W.H. Freeman and Co.、New York、特に第8
章)により、融合タンパク質Ub-Arg-DHFRts-P(“Ub”はユビキチンを示す)を
コードする遺伝子で置換する。N末端ユビキチンは、N末端デグロンを露出する
翻訳の後、速やかに切断される。より低い温度では、Arg-DHFRts内部のリシンが
露出されず、融合タンパク質のユビキチン化が起こらず、分解は遅速であるため
、活性標的タンパク質レベルは高い。より高い温度で(メトトリキセートの不在
下で)は、Arg-DHFRts内部のリシンが露出され、融合タンパク質のユビキチン化
が起こり、分解は高速であるため、活性標的タンパク質レベルは低い。分解の熱
活性化は、露出メトトリキセートにより制御可能に阻止される。この方法は、薬
剤や温度変化等の他の誘導因子に応答性の他のN末端デグロン)にも適用可能で
ある。
【0228】 標的タンパク質の存在量、そしてまた、直接的もしくは間接的にそれらの活性
量を、(中和)抗体により低下させることもできる。このような抗体に、制御暴
露を施すことにより、制御可能にタンパク質存在量/活性を改変もしくは摂動す
ることができる。例えば、タンパク質表面上の適切なエピトープに対する抗体は
、存在量を減少させ、これによって、低下した活性もしくは最小限活性の複合体
へと、活性型を凝集させることにより、標的タンパク質の野生型活性型の活性を
間接的に低下させる。あるいは、例えば、活性部位と直接相互作用する、あるい
は、活性部位への基質の接近を阻害することにより、抗体が、タンパク質活性を
直接低下させることも可能である。反対に、場合によっては、(活性化)抗体も
、タンパク質およびその活性部位と相互作用して、活性を高めることができる。
いずれの場合も、抗体(以下に記載する各種の)を特定のタンパク質種に対して
提示し(以下に記載する方法によって)、その作用を選別することができる。抗
体の作用を検定し、標的タンパク質種の濃度および/または活性を高める、もし
くは低下させる適切な抗体を選択することができる。このようなアッセイは、抗
体を細胞へと導入し(以下参照)、当業者には公知の標準的手段(免疫検定等)
により、標的タンパク質の野生型の量または活性の濃度を検定することから成る
。野生型の正味活性は、標的タンパク質の既知活性に適した検定手段により検定
することができる。
【0229】 抗体は、様々な方法で細胞に導入することができる。このような方法には、例
えば、細胞への抗体の微量注射(Morganら、1988、Immunology Today 9:84〜86
)、または、所望の抗体を細胞にコードするハイブリドーマmRNAの形質転換(Bu
rkeら、1984、Cell 36:847〜858)が含まれる。さらに別の方法では、組換え抗
体を操作し、非常に多様な種類の非リンパ系細胞に異所発現させることにより、
標的タンパク質に結合させると共に、標的タンパク質の活性を阻害することがで
きる(Bioccaら、1995、Trends in Cell Biology 5:248〜252)。抗体の発現は
、好ましくは、Tetプロモーター等の制御可能なプロモーターの制御下で行う。
第1のステップは、標的タンパク質に対して適切な特異性を有する特定のモノク
ローナル抗体の選択である(以下参照)。次に、選択した抗体の可変領域をコー
ドする配列を様々な操作抗体フォーマット中にクローン化することができる。こ
のような抗体フォーマットには、例えば、全抗体、Fabフラグメント、Fvフラグ
メント、一本鎖Fvフラグメント(ペプチドリンカーにより統合されたVHおよびVL
領域)(”ScFV” フラグメント)、ダイアボディ(diabodies)(異なる特異性
を有する2つの会合したScFvフラグメント)等(Haydenら、1997、Current Opin
ion in Immunology 9:210〜212)が含まれる。各種フォーマットの細胞内発現
した抗体は、様々な既知の細胞内リーダー配列(Bradburyら、1995、Antibody E
ngineering(vol. 2)(Borrebaeck ed.)、pp.295〜361、IRL Press)との融合
体としてそれらを発現させることにより、細胞コンパートメント(例えば、細胞
質、核、ミトコンドリア等)にターゲッティングすることができる。特に、ScFv
フォーマットは、細胞質ターゲッティングに特に適していると思われる。
【0230】 抗体のタイプには、ポリクローナル、モノクローナル、キメラ型、一本鎖、Fa
bフラグメント、ならびにFab発現ライブラリーが含まれるが、これらに限定され
るわけではない。当業者には公知の各種方法を用いて、標的タンパク質に対する
ポリクローナル抗体を生成することができる。抗体の生成のために、様々な宿主
動物を標的タンパク質の注射により免疫することができる。このような宿主動物
には、ウサギ、マウス、ラット等が含まれるが、これらに限定されない。宿主の
種に応じて、各種アジュバントを用いて、免疫応答を高めることができる。この
ようなアジュバントとして、限定するものではないが、フロイントアジュバント
(完全および不完全)、水酸化アルミニウム等のミネラルゲル、リゾレシチン等
の界面活性物質、プルロニックポリオール、ポリアニオン、ペプチド、油性エマ
ルション、ジニトロフェノール、ならびに、カルメット・ゲラン菌(BCG)およ
びコリネバクテリウム・パルバム(Coryneobacterium parvum)が含まれる。
【0231】 標的タンパク質に向けられるモノクローナル抗体を調製するには、培養中の連
続的細胞系による抗体分子を生成するあらゆる方法を用いることができる。この
ような方法には、限定するものではないが、次のものが含まれる:Kohlerおよび
Milsteinにより最初に開発されたハイブリドーマ法(1975、Nature 256:495〜4
97)、トリーマ法、ヒトB細胞ハイブリドーマ法(Kozborら、1983、Immunology
Today 4:72)、ならびにヒトモノクローナル抗体を生成するEBVハイブリドーマ
法(Coleら、1985、in Monoclonal Antibodies and Cancer Therapy、Alan R. L
iss, Inc.、pp. 77〜96)。本発明の別の形態では、最近の技術(PCT/US90/0254
5)を用いて、モノクローナル抗体を無菌動物に生成することができる。本発明
によれば、ヒト抗体を使用してもよく、これらは、ヒトハイブリドーマを用いて
(Coteら、1983、Proc. Natl. Acad. Sci. USA 80:2026〜2030)、あるいは、E
BVウイルスでヒトB細胞をin vitroで形質転換する(Coleら、1985、in Monoclo
nal Antibodies and Cancer Therapy、Alan R. Liss、Inc.、pp. 77〜96)こと
により、取得することができる。実際に、本発明によれば、標的タンパク質に特
異的なマウス抗体分子由来の遺伝子を、適切な生物活性を有するヒト抗体分子と
一緒に、スプライシングすることにより、「キメラ抗体」を生成するために開発
された方法(Morrisonら、1984、Proc. Natl. Acad. Sci. USA 81:6851〜6855
;Neubergerら、1984、Nature 312:604〜608;Takedaら、1985、Nature 314:4
52〜454)を使用することができる。尚、このような抗体は、本発明の範囲に含
まれる。
【0232】 さらに、モノクローナル抗体が有利である場合には、ファージ展示方法(Mark
sら、1992、J. Biol. Chem. 267:16007〜16010)を用いて、大きな抗体ライブ
ラリーから、該モノクローナル抗体を選択することも可能である。この方法を用
いることにより、1012までの異なる抗体のライブラリーをfd繊維状ファージの表
面に発現させて、モノクローナル抗体の選択に利用可能な抗体の「単一ポット(
pot)」in vitro免疫系が形成されている(Griffithsら、1994、EMBO J. 13:32
45〜3260)。このようなライブラリーからの抗体の選択は、当業者には公知の方
法によって実施することができる。このような方法には、上記ファージを固定化
した標的タンパク質に接触させ、該標的に結合させたファージをクローン化した
後、抗体可変領域をコードする配列を、所望の抗体フォーマットを発現する適切
なベクター中にサブクローン化する方法が含まれる。
【0233】 本発明によれば、一本鎖抗体の生成のために記載された方法(米国特許第4,94
6,778号)に基づいて、標的タンパク質に特異的な一本鎖抗体を生成することが
できる。本発明の別の形態は、Fab発現ライブラリーの構築のために記載された
方法(Huseら、1989、Science 246:1275〜1281)を用いて、標的タンパク質に
対する所望の特異性を有するモノクローナルFabフラグメントの高速かつ容易な
特定を可能にする。
【0234】 当業者には公知の方法によって、標的タンパク質のイディオタイプを含む抗体
フラグメントを生成することができる。例えば、このようなフラグメントは、抗
体分子のペプシン消化により構成することができるF(ab’)2フラグメント:該F(
ab’)2フラグメントのジスルフィド架橋を減少することにより生成することがで
きるFab’フラグメント;パパインおよび還元剤で抗体分子を処理することによ
り生成することができるFabフラグメント;ならびに、Fvフラグメントを含むが
、これらに限定されるわけではない。
【0235】 抗体の生成では、所望の抗体のスクリーニングは、当業者には公知の方法、例
えば、ELISA(固相酵素免疫検定法)により、達成することができる。標的タン
パク質に特異的な抗体を選択するために、標的タンパク質に結合する抗体につい
て、生成されたハイブリドーマ、または、ファージ展示抗体ライブラリーを検定
することができる。
【0236】 5.8.5. タンパク質活性の改変方法 タンパク質活性を直接改変する方法には、中でも、前記のように、ドミナント
ネガティブ突然変異、特定の薬剤(本発明の意味で用いる)または一般的には化
学成分、ならびに、抗体の使用が含まれる。
【0237】 ドミナント・ネガティブ突然変異は、外因性遺伝子もしくは突然変異外因性遺
伝子に対する突然変異であり、これら遺伝子が細胞中で発現すると、標的とする
タンパク質種の活性を破壊する。標的とするタンパク質種の構造および活性に応
じて、該標的の活性を破壊するドミナント・ネガティブ突然変異を構築する適切
な戦略の選択を導く一般原則が存在する(Hershkowitz、1987、Nature 329:219
〜222)。活性単量体型の場合には、不活性型の過剰発現により、標的タンパク
質の正味活性を大幅に低下させるのに十分な天然基質またはリガンドの競合を引
き起こすことができる。このような過剰発現は、例えば、活性の増加したプロモ
ーター、好ましくは、制御もしくは誘導プロモーターを、突然変異遺伝子と会合
させることにより達成することができる。あるいは、活性部位残基への変更を実
施して、標的リガンドとの、実質的に不可逆の会合を起こすことも可能である。
これは、所定のチロシン・キナーゼで、活性部位セリン残基を注意深く置換する
ことにより達成することができる(Perlmetterら、1996、Current Opinion in I
mmunology 8:285〜290)。
【0238】 多量体活性型の場合には、複数の戦略が、ドミナント・ネガティブ突然変異体
の選択を導くことができる。多量体活性は、多量体会合ドメインに結合して、多
量体の形成を阻害する外因性タンパク質断片をコードする遺伝子の発現により、
制御可能に低下させることができる。あるいは、特定タイプの不活性タンパク質
単位の制御可能な過剰発現が、不活性多量体中の野生型活性単位を拘束し、これ
によって、多量体の活性を低下させることができる(Nockaら、1990、The EMBO
J. 9:1805〜1813)。例えば、二量体DNA結合タンパク質の場合には、DNA結合単
位からDNA結合ドメインを欠失させる、あるいは、活性化単位から活性化ドメイ
ンを欠失させることができる。また、この場合、DNA結合ドメイン単位を、該ド
メインが活性化単位との会合を起こすことなく、発現させることもできる。これ
によって、発現の活性化の可能性なしに、DNA結合部位が拘束される。特定タイ
プの単位が、立体配座の変更を通常に経る場合には、硬質(rigid)単位の発現
が、得られる複合体を不活性化する。さらに別の例では、細胞の機動、有糸分裂
過程、細胞のアーキテクチャー等、細胞の作用機構に関与するタンパク質が、典
型的には、二、三のタイプの多数のサブユニットの会合から構成される。これら
の構造は、構造欠陥を有する少数の単量体単位の含有による破壊に対して、非常
に感受性が高いことが多い。このような突然変異単量体は、関連するタンパク質
活性を破壊し、細胞中に発現させることができる。
【0239】 ドミナント・ネガティブ突然変異以外にも、当業者には公知の突然変異誘発お
よびスクリーニング方法で、温度(または、その他の外的要因)に対して感受性
の高い突然変異標的タンパク質をみいだすことができる。
【0240】 また、当業者には、標的タンパク質と結合する抗体、および該タンパク質を阻
害する抗体の発現を、別のドミナント・ネガティブ戦略として使用できることが
理解されよう。
【0241】 最後に、外因性薬剤またはリガンドへの暴露により、所定標的タンパク質の活
性を、制御可能に改変できる。好ましい形態では、細胞中のただ1つの標的タン
パク質と相互作用し、その標的タンパク質だけの活性を変える薬剤が知られてい
る。この薬剤の量を変えながら、これに細胞を段階的に暴露することによって、
上記タンパク質に起因する細胞状態の段階的摂動を実施する。この改変は、活性
の減少または増加のどちらでもよい。次に好ましいのは、個別の、識別可能な、
かつ非重複作用を有する数種(例えば、2〜5)の標的タンパク質だけの活性を
改変する薬剤が知られており、使用されている。このような薬剤に対する段階的
暴露により、上記タンパク質に起因する複数の細胞状態に、段階的摂動を実施す
る。
【0242】6.実施例 以下の実施例は前述の発明を例示して示すものであるが、その記載により限定さ
れない。
【0243】6.1実施例1:同時制御により遺伝子セットのクラスター形成 本実施例は本発明のクラスタリングの1つの実施形態を例示する。
【0244】6.1.1.材料と方法 転写測定 : 酵母細胞(Saccharomyces cerevisiae, Strain YPH499、SikorskiおよびHieter
,1989、A system of shuttle vectors and yeast host strains designated for
efficient manipulation of DNA in Saccharomyces cerevisiae、Genetics、12
2:19-27)をYAPD中で30℃にてOD600が1.0(+0.2)になるまで増殖させ、標準的手法
によりフェノール/クロロホルム、および0.1%SDS中で細胞を破壊して総RNAを調
製した(Ausubelら、1995、Current Protocols in Molecular Biology、Greene P
ublishing and Wiley-Interscience社、New York、13章)。ポリ(A)+RNAを、実質
的には、Sambrookら(Molecular Cloning A Laboratory Manual(第2版)第1巻、C
old Spring Harbor Laboratory, Cold Spring Harbor, New York、1989)の記載
に従い、オリゴ-dTセルロース(New England Biolabs)でのアフィニティークロマ
トグラフィーにより選択した。cDNAの第1鎖の合成は、2μgのポリ(A)+RNAおよ
びSuperScriptTMII逆転写酵素(Gibco−BRL)を用いて、製造元の指示に以下の変
更を加えて実施した。デオキシリボヌクレオチドは以下の濃度;dA、dG、および
dCは、各500μM、dTは、100μM、およびCy3-dUTPまたはCy5-dUTP(Amersham)のい
ずれかを100μM、とした。cDNA合成反応を、2ユニットのRNAse Hを加えてRNAを
分解した後、42℃〜44℃で90分間実施し、そのcDNA生成物を、製造元の推奨す
る方法に従って、MICROCON-30微量濃縮器(Amicon)を用いて遠心透析を連続して
2回行うことにより精製した。
【0245】 S. cerevisiae ゲノム内の99アミノ酸より大きなポリペプチドをコードする各
ORFに対応するの配列中の二本鎖DNAポリヌクレオチド(例えば Goffeauら、1996
、Science 274: 546-567などの公開された酵母ゲノム配列に基づく)は、酵母ゲ
ノムDNAのポリメラーゼ連鎖反応(PCR)増幅により作製する。2種のPCRプライマー
は、以下の2つの基準:(i)増幅される断片が300〜800bpであること、および(ii
)共通の配列の10個以上の連続的なヌクレオチドの部分を含有する断片でないこ
と、に従い、それぞれのORF内で選択する。コンピュータープログラムを用いて
、PCRプライマーを設計する。増幅は、96ウェルマイクロタイタープレート内で
行う。得られるDNA断片を、顕微鏡用スライドガラス上に、Shalonら(1996、Geno
me Research 6:639-645)の方法を用いてプリントする。
【0246】 蛍光標識したcDNA(2〜6μg)は、キャリアーとして1μg/μlのltRNAを加えた4X
SSCに再懸濁し、0.45μMフィルター(Millipore、Bedford、MA)を用いてろ過する
。SDSを0.3%まで加えた後、100℃で2分間加熱する。プローブを冷却後すぐに、
実施例6.2の記載のとおりに作製したマイクロアレイに、65℃で4時間ハイブリ
ダイズさせる。ハイブリダイズしていないプローブを、室温で1〜2分間0.1%SDS
を加えた1XSSCで洗浄して除去する。マイクロアレイを前述の蛍光レーザー走査
装置(Schenaら、1995、Science 270:467-470; Shcena ら、1995、Proc.Natl.Aca
d.Sci.USA 93;10539-11286)で読み取り、その結果(摂動の位置も含めて)を記録
する。
【0247】 摂動:本実施例は、異なる薬剤処理およびヒトにおける免疫抑制に相同の酵母
(S.cerevisaie)の生化学的経路に関連する遺伝子の突然変異を含む18種の実験を
含む。2種の薬剤、FK506およびシクロスポリンは50μg/mlまたは1μg/mlの濃度
で、種々の遺伝子の欠失と組み合わせて用いた。遺伝子CNA1およびCNA2は、カル
シニューリンの触媒サブユニットをコードする。Cardenasら、1994、薬剤の発見
および設計における展望の中の、T細胞モデルとしての酵母(Yeast as model T c
ells, in Perspectives in Drug Discovery and Design)、2:103-126を参照のこ
と。18種の異なる実験条件を表1に記載する:
【表1】 クラスター解析:測定したmRNAレベルの6000以上のセットを、まず18種の実験う
ち少なくとも1種では、最低でも4倍の応答較差を有する遺伝子だけを選択するこ
とにより、48セットまで減らした。該最初の選択で、ほとんどの実験で大部分の
遺伝子の小さな応答を支配していた(domonate)測定誤差の影響が大幅に減少した
【0248】 得られた18(実験)X48(遺伝子)のデータテーブルについて、hclustの通常の作
業を用いてクラスタリングを行った。コード「hclust」は、WindowsNTワークス
テーション上でS-plus4.0を用いて実施した。ディスタンスは、1 -rとした(この
場合のrは相関係数(基準化したドット積)である)。各分枝点の統計学的有意性は
、本明細書中に前述したモンテカルロ法(Monte Carlo procedure)を用いて算出
した。置換した(permuted)データの100個の認識結果を、それぞれの二分岐(bifu
cation)に対する(圧縮した)実証的な改善(empirical improvement)スコアを導く
ために、クラスタリングした。そして、置換していないデータに対するスコアは
標準偏差で表し、図6のツリーに値を表記する。
【0249】6.1.2.結果および考察 図6は、18X48のデータテーブルを操作した「hclust」アルゴリズムから導か
れたクラスタリングしたツリーを示す。48個の遺伝子は、種々の分枝にクラスタ
リングした。2つの分枝の結合する水平の連結枝の垂直方向の座標は、分枝間の
距離を示す。典型的な値は0.2〜0.4の範囲内にあり、この場合、0が完全な相関
であり、1は相関が全くないということである。分枝に付した番号は、統計学的
有意性である。約2より大きな数値は、その分岐が95%の信頼水準で有意である
ことを示す。
【0250】 図6の水平な線は、遺伝子セットを定義するためのカットオフレベルである。
このレベルは、任意に設定する。これらの分枝のうち2または2以下のメンバーを
有する分枝は更なる解析において無視した。3つ以上のメンバーを有する3つの
遺伝子セットは、このカットオフレベルで規定された。分枝に注記して示した有
意値(標準偏差において)は記載のとおりに導かれ、3つの分枝は真に異なってい
ることを示す。該クラスターがカルシニューリンタンパク質、PDR遺伝子、およ
びGcn4転写因子を含む経路に対応し、クラスター解析は、対応する遺伝子制御経
路を有する遺伝子セットを作製できることを示す。Martonら著、薬剤標的の確証
およびDNAマイクロアレイを用いる二次的な薬剤標的の影響の特定(Drug Target
validation and identification of secondary drug target effects using DNA
microarrays)Nature Medicine、4:1293-1301参照のこと。
【0251】6.2実施例2:遺伝子セットの平均的応答を用いる応答パターンの検出の増強
本実施例は、遺伝子セットを平均化することにより特定の応答パターンの検出
の増強を示す。
【0252】 図6のクラスター解析結果における3番の遺伝子セットは、Gcn4転写因子によ
り制御される遺伝子を含む。これは、文献により、および各遺伝子に対する5’
制御領域の多重配列アラインメント解析により立証されている(StormoおよびHar
tzell、1989、Identifying protein binding sites from unaligned DNA fragme
nts、Proc. Natl. Acad. Sci. 86:1183-1187; Herts およびStormo、1995、Iden
tification of consensus patterns in unaligned DNA and protein sequences:
a large-deviation statistical basis for penalizing gaps,Proc of 3rd Int
l Conf on Bioinformatics and Genome Research, Lim and Cantor, eds., Worl
d Scientific Publishing Co., Ltd. Singapore, pp. 201-216)。遺伝子セット
3中の32個の遺伝子のうちの20個は、Gcn4に適応する共通のプロモーター配列を
有していた。これらの20個を用いて、遺伝子セットを規定した。高濃度ではこの
経路に影響することが知られている薬剤FK506の一連のタイトレートに対する応
答プロフィールを、この遺伝子セットに射影(project)した。得られた射影した
応答を表2の「遺伝子セット」の欄に示す。表2には、個々の遺伝子の応答も(Log
10(発現比)の標準偏差で)示している。NaNは、データが得られなかったことを示
す。「遺伝子セット」の応答は1.6 μg/mlで極めて有意となり(>3 標準偏差)
、この濃度およびこれより高濃度においては、個々の遺伝子の応答より極度に有
意である。
【0253】
【表2】 6.3.実施例3:薬剤活性の分類の改善 上記の実施例1で述べた18種の実験データセットに、免疫抑制剤FK506とシク
ロスポリンA、およびそれらの薬剤の活性に関係する遺伝子の突然変異;並びに
免疫抑制に関係のない薬剤である、ヒドロキシ尿素、3-アミノトリアゾールおよ
びメトトレキセートを含む種々の摂動を用いてさらに16種の実験を組み合わせた
。その実験条件を表3に記載する:
【表3】 クラスター解析を組み合わせたデータセットを用いて行った。遺伝子の第1下
方選択は、閾値を2倍以上のアップレギュレーションまたはダウンレギュレーシ
ョンかつ99%以上の信頼水準と正確に規定して、34種の実験のうち4種以上におい
て有意な応答性を有する遺伝子を求めることにより行った。本選択により、194
個の遺伝子を得た。厳密さのより低い閾値では、より多くの遺伝子が得られ、デ
ータに測定誤差の混入する率が高くなり、遺伝子セットの生物学的な同定が混乱
するであろう;しかし、最終的な結果は、この閾値に対してあまり敏感ではない
【0254】 S-Plusの「hclust」法を用いて、図7に示すクラスタリングツリーを得た。図
7に示すように、カットレベルD=0.4では、16個の遺伝子セットがある。これら1
6個のセットのうち、2個以下の遺伝子からなるものが7つある。これらの小さな
クラスターを切り捨てると、図7に1〜9の番号を付して示す9つの大きなクラス
ターが残った。その結果得られるカットレベルより上にある二分岐点の全てが有
意であり(2標準偏差以上-各注記の数値を参照のこと)、クラスターは真に異なる
ものである。
【0255】 非免疫抑制剤の応答データをその解析に組み合せても、やはりここでも免疫抑
制剤の経路により規定される遺伝子セットが規定されることは注目に値する。
【0256】 遺伝子セット2は、図6の遺伝子セット1から得られるカルシニューリン依存
性遺伝子を含み、遺伝子セット4は図6の遺伝子セット3から得られるGcn4-依
存性遺伝子を含む。
【0257】 16μg/mlのFK506に対する応答を得て、その応答プロフィールを「未知」プロ
フィールとして用いた。該応答プロフィールを、34種の実験のクラスター解析を
用いて規定された遺伝子セットに射影した。クラスタリングセットからの個々の
実験から得た34種のプロフィールもベース上に射影した。
【0258】 射影した16μg/mlのFK506に対するプロフィールを、クラスタリングセットか
らの34種の射影した各プロフィールと比較した。これらの比較のうち5つを図8A
〜8Eに示し、詳しい考察は後述する。
【0259】 未知の射影したプロフィールと、34種のトレーニング実験のそれぞれのプロフ
ィールとの相関は、等式10(上記、5.4.2.節)を用いて算出し、図9に円(-○-)
で表記している。
【0260】 比較のために、射影せずに算出した相関係数(-△-)、および、射影はしない
が信頼水準が95%以上でアップレギュレーションまたはダウンレギュレーション
を示した遺伝子に限定し、2つのプロフィールの一方または他方の2つの少なくと
も1つの因子により算出した相関係数(-◇-)も表記する。
【0261】 概して、射影した相関係数は射影していない相関係数に沿っているが、より大
きな値を示す。より大きな値になるのは、遺伝子セットに射影する際に起こる測
定誤差の平均化の結果である。これらの個々の測定誤差は、射影していない相関
係数を小さく偏らせる傾向があり、この偏りが射影処理により減少する。
【0262】 射影したプロフィールの相関係数は、元のプロフィールの応答が極めて弱く、
ノイズが優勢である場合、大きな誤差を有する傾向がある。実験1、2、7、8を含
むより低い濃度の薬剤処理のいくつかの実験の場合に、このような傾向がある。
例えば実験2では、射影した相関係数はマイナス0.45であり、射影していない相
関はほぼ0である。これは、相関係数においてノイズが優勢となった結果である
。図8Aは、3.1mMのHUでの処理(斜線の棒)は極めて弱い射影したプロフィールを
有することを示す。
【0263】 図8Bにより、16μg/mlのFK506(未知)と図9の実験番号25の50μg/mlのFK506
の実験を比較するための射影したプロフィールの要素が得られる。射影したプロ
フィールは図9に示す高い相関値と高度に一致する。遺伝子セット7に最大の応
答があり、これは生物学的に、明らかに高濃度の薬剤で誘起されるアミノ酸枯渇
応答に対応する。遺伝子セット5における応答は、薬剤の一次的標的である、カ
ルシニューリンタンパク質により媒介されている。より低濃度の薬剤(図8C、
斜線の棒、1μg/mlのFK506)でもこの応答は存在するが、遺伝子セット7および他
の遺伝子セットでは該応答は大幅に減少する。この生物学的解釈は、薬剤活性の
分類に直接役立つ。より高濃度の薬剤は二次的経路(おそらくは望ましくない経
路)を誘起したと結論づけられる。図8Aに示す実験34からの図8Dの斜線のプ
ロフィールにより示されるように、これらの経路の一次的媒体の一つは転写因子
Gcn4であることがわかる。ここでは、遺伝子セット2、3、および7における活性
は、GCN4遺伝子の欠損により除去される。
【0264】 しかし、射影したプロフィールを用いるブラインド分類も改善される。射影し
た相関係数が、未知のものに次いで最も近いものはベストマッチ(best match)の
2行上の実験「-cph+/-FK506 50μg/ml」であることを示すことに注目されたい。
これは、遺伝子CPH1を遺伝的に欠損した細胞の薬剤による処理を示す。この遺伝
子は、FK506の活性に必須ではなく、応答が大きく変化するはずはない。従って
、射影したプロフィールは、未知である16μg/mlのFK506との高い類似性を正確
に示す。しかし、射影していない相関係数は、ベストマッチの6行上の実験「-cn
a+/-FK506 50μg/ml」が、ベストマッチに次いで2番目であることを示す。この
実験は、一次的標的であるカルシニューリンを遺伝的に欠損した細胞の薬剤によ
る処理を含む。この場合、カルシニューリンにより媒介される遺伝子セット5に
おける応答は消失した(図8E参照)が、他の応答は残っている。この重大な生物
学的な差は、図8Eの射影した要素、および射影した相関係数に反映されるが、
射影していない相関係数には反映されない。従って、生物学的類似性に関する結
果は、このように本発明の方法を用いて射影した相関係数に基づく場合の方が、
射影しない方法に基づく場合より信頼性が高くなるであろう。
【0265】6.4.実施例4:生物学的応答プロフィールの分類の改善 実施例3(上記、6.3節)に記載の34種の実験データセットについて、二次元
クラスター解析による解析も行った。特に、まず、上記実施例3に記載の遺伝子
セットを同定するために該データセットを用いてクラスター解析を実施した。次
に、S-Plusの「hclust」法を再び用いて、今回は生物学的応答の類似性について
生物学的応答プロフィールを編成した。
【0266】 その解析の結果を図16に示す。図16Aは、34種の実験(縦軸)で測定された
換算した遺伝子転写の数量(横軸)のグレースケールでの表示を示す。従って、図
16Aの各行は、特定の摂動(例えば、特定の薬剤への暴露など)に関する遺伝子
転写の応答を表す。該グレースケールは、図16の上部に示すグレースケールの
バーに示すように、測定された発現比率の対数を示している。具体的には、黒色
は、転写のアップレギュレーション(+1)を示し、白色はダウンレギュレーション
(-1)を、および、中間のグレースケール(0)は発現に変化がないことを示す。図
16Bは、上記実験3に記載の遺伝子セットにおける遺伝子転写(即ち、図16A
の列)の共レギュレーションのツリーを示している。そして、図16Cに示して
いる表示を作製するために、この共レギュレーションのツリーに示されている列
のインデックス順を用いて、図16Aの列を並び替えた。さらに、同様のクラス
タリングアルゴリズムを図16Cの列に(即ち、応答プロフィールに)適用して
、列のインデックスを図16Dを作製するために同じようにして並び替えた。
【0267】 図16Aと16Dを比較すると、並び替えた後に、大規模な構造が容易に明ら
かになる。図16Dの縦方向の縞から遺伝子セットが容易に特定できるだけでな
く、特定の遺伝子セットの活性化に関係する実験のセットも図16Dの横方向の
縞から特定される。図17は、図16Dのさらに詳しい見解を示しており、図1
6Dの並び替えた型式に実験の指示および数例の遺伝子セットの指示を詳細に記
載している。例えば、図17に示された「CNA」の縦の列はカルシニューリン依
存性の遺伝子セットであり、薬剤の中間の標的またはカルシニューリン自身が突
然変異により削除された細胞以外の細胞で免疫抑制剤を含む全ての実験において
影響を受ける(つまり、転写が抑制される)遺伝子セットである。大きな横方向の
縞に寄与する実験は全て、主にGcn4依存性である遺伝子セットの組合せを活性化
する。このことは、これらの実験をGcn4が欠損した実験を示す図17の上の2つ
の行と比較すると、顕著である。
【0268】6.5.実施例5:人工的プロフィールの射影 実施例1(上記6.1.1節)に記載の逆転写法により、実験の2つのセットを実施し
て、YJL107c遺伝子の欠損の影響を測定した。2つの実験のうち1つでは、該方法
におけるRNA濃度は(意図的には)ほとんど制御されず、従って人工物が混入した
応答プロフィールデータができる。2つのプロフィール間の相関は、等式7によ
り算定し、図18に示している。星印(*)は、2つの実験のいずれかにおいて、90
%以上の信頼水準でアップレギュレートまたはダウンレギュレートを受ける転写
産物を示している。2つの実験間の相関係数は0.82である。
【0269】 逆転写法においてRNA濃度をほとんど制御しないことの影響を解析するために
、RNA濃度を意図的に変化させた場合のS. cerevisiaeにおける転写レベルを測定
することにより、人工的なテンプレートを作製した。これにより、「摂動」が実
際には逆転写手法においてRNA濃度の変化である場合の応答プロフィールが得ら
れた。このテンプレートは、図19に、遺伝子発現比率と平均発現レベルの対比
としてプロットしている。その転写産物の中の、90%の信頼水準でアップレギュ
レーションまたはダウンレギュレートションを受けた転写産物は、名前を付記し
、1標準偏差の誤差棒を付している。
【0270】 混入のあるYJL107c欠損実験に対応する応答プロフィールを、この人工的テン
プレートを用いて整理した。具体的には、最善のスケーリング相関(scaling coe
fficients)は、等式16の最小自乗法により算定され、「整理した」応答プロフ
ィールは、等式17によるこれらの相関を用いて作製された。「整理した」YJL1
07c欠損の実験と対応する「混入のない」実験との相関を図20に示す。相関は
、0.87まで改善される。明らかな人工物のない場合、通常、無作為な測定誤差の
他の原因により、名目上繰り返して測定したプロフィール間での相関を約0.90に
まで制限される。従って、0.82から0.87までの改善は、あらゆる人工的に差引き
する技術を用いて現実に改善可能な最大量に近いことを示す。
【0271】7.引用文献 本明細書中で引用した全ての参考文献は、それぞれの刊行物または特許または
特許出願があらゆる目的のためにその全文が引用により組み入れられると明確か
つ個別に示されているのと同程度に、それらの全文をあらゆる目的のために引用
により本明細書に組み入れるものとする。
【0272】 当業者であれば理解するように、本発明の精神および範囲から逸脱することな
しに本発明の多くの変更および改変を行うことが可能である。本明細書中に記載
されている具体的な実施形態は単に例示のために示されているにすぎず、本発明
は添付の請求の範囲の条項、ならびにそのような請求の範囲の権利が与えられる
等価物の全範囲によってのみ限定されるものである。
【図面の簡単な説明】
【図1】 図1はクラスター分析の1実施形態を示す。
【図2】 図2は射影プロセスを示す。
【図3】 図3は典型的な遺伝子セットデータベース管理システムを示す。
【図4】 図4Aはレセプター活性化に対して起こりうる2種類の異なる応答を示す。 図4Bは明確に異なる一時的な作用様式を有する酵母遺伝子の3つの主要なクラ
スターを示す。
【図5】 図5は本発明の実施形態に有用なコンピューターシステムを示す。
【図6】 図6は18回の実験の表を48のmRNAレベルで操作した"hclust"アルゴリズムから
由来するクラスターツリーを示す。
【図7】 図7は34回の実験から由来するクラスターツリーを示す。
【図8】 図8A-Eは射影されたプロフィールの個々のエレメントの振幅を示す。
【図9】 図9はFK506(16μg/mL)治療のプロフィールを基礎の遺伝子セットを作成するた
めに用いた34回の実験の各々のプロフィールとの相関性を調べた結果を示す。
【図10】 図10はアップレギュレートされた遺伝子(G1、G2、およびG3)のグループとダウ
ンレギュレートされた遺伝子(G4、G5、およびG6)を含んでいる典型的なシグナル
伝達カスケードを示す。
【図11】 図11はhclustアルゴリズムによって得られた、発現レベルが測定された185個
の遺伝子の34個の摂動応答プロフィール中のクラスター(すなわち遺伝子セット)
を同定するためのクラスターツリーを示す。
【図12】 図12はクラスターの再分割の有意差を指定するためのモンテカルロ法の典型的
な2次元の実施形態を示す。
【図13】 図13は薬剤FK506の異なる濃度に対してのS.cerevisiaeの最も大きな応答を示
した遺伝子の転写応答を示す。
【図14】 図14は図13のタイトレート曲線を射影することによって得られた射影されたタ
イトレート曲線を示す。
【図15】 図15は図14の遺伝子セットの各々から由来する2つのHill関数nおよびuの値
に基づいたχ二乗プロットを示す。
【図16】 図16A-Dは本発明の方法の典型的な適用を示す:図16Aは、34回の異なる摂動実
験(縦軸)で測定されたS.cerevisiaeの185種の遺伝子転写産物のグレースケール
ディスプレイである(横軸);図16Bは"hclust"アルゴリズムを用いた、図16Aの遺
伝子転写産物のクラスター化によって得られた同時調節ツリーを示す;図16Cは
同じ実験データだが転写産物(横軸)を図16Bで定義した遺伝子セットに従って再
並べかえしたものを示している;図16Dは同じ実験データだが実験インデックス(
縦軸)も応答プロフィールの類似性に従って再並べかえを行ったものを示してい
る。
【図17】 図17は図16に示したものと同じデータだが遺伝子転写産物(横軸)および実験(
縦軸)を類似性に従って並べたものである;個々の遺伝子セットは偽カラーイメ
ージの上方に同定される。各遺伝子セットがそれらに伴う生物学的経路および/
または応答はそのカラーイメージの下方に示されている。縦軸の標識は各実験を
要約したものである。
【図18】 図18はS.cerevisiaeのYJL107遺伝子の欠失の影響を測定する、混合のない(と
信じられる)実験の発現プロフィールと、アーティファクト(逆転写の際のRNA濃
度の調節が十分でなかったもの)で意図的でなく混合させた同一の実験との関連
性を示す。
【図19】 図19は遺伝子発現比率対平均発現レベルをプロットしたプロフィールを示し、
これはハイブリダイゼーションサンプルの調製時の逆転写中のRNA濃度の調節が
十分でなかったことに対応している。
【図20】 図20はS.cerevisiaeのYJL107遺伝子の欠失の影響を測定する、混合のない(と
信じられる)実験の発現プロフィールと、アーティファクト(逆転写の際のRNA濃
度の調節が十分でなかったもの)で意図的でなく混合させた同一の実験との関連
性を示すもので、そこでは混合させた実験からのデータは図19の応答プロフィー
ルをアーティファクトの「鋳型」として用いて「清浄化」している。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G01N 33/50 G06F 17/16 K 5B075 G06F 17/10 17/18 Z 17/16 17/30 170F 17/18 C12N 15/00 ZCCA // G06F 17/30 170 F (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AL,AM,AT,AU,AZ, BA,BB,BG,BR,BY,CA,CH,CN,C R,CU,CZ,DE,DK,EE,ES,FI,GB ,GD,GE,GH,GM,HR,HU,ID,IL, IN,IS,JP,KE,KG,KP,KR,KZ,L C,LK,LR,LS,LT,LU,LV,MA,MD ,MG,MK,MN,MW,MX,NO,NZ,PL, PT,RO,RU,SD,SE,SG,SI,SK,S L,TJ,TM,TR,TT,UA,UG,US,UZ ,VN,YU,ZA,ZW (72)発明者 ストートン,ローランド アメリカ合衆国 92103 カリフォルニア 州 サン ディエゴ,ウェスト スプルー ス ストリート 425 (72)発明者 へ,ユドン アメリカ合衆国 98034 ワシントン州 カークランド,11410 エヌ.イー.124番 ストリート 148 Fターム(参考) 2G045 AA35 CB01 DA13 FB02 JA03 4B024 AA11 AA20 CA01 CA04 CA09 CA12 HA14 4B029 AA07 AA23 BB20 CC03 CC08 FA15 4B063 QA05 QQ05 QQ20 QR32 QR56 QS34 QS36 QX02 5B056 BB11 BB37 BB42 BB91 HH00 5B075 ND20 ND40 NR12 UU19

Claims (77)

    【特許請求の範囲】
  1. 【請求項1】 生物学的サンプルの分析方法であって、前記生物学的サンプ
    ル中に含まれる細胞構成成分の複数の測定結果からなる初期プロフィールを、同
    時変動性の基本細胞構成成分セットの定義に従って、複数の細胞構成成分セット
    値を含む射影プロフィールへ変換することを含んでなり、ここで、前記定義は、
    複数の異なる摂動下における前記細胞構成成分の同時変動に基づくものであり、
    前記変換は、前記初期プロフィールを前記基本細胞構成成分セットへ射影するこ
    とを含んでなるものである、前記方法。
  2. 【請求項2】 複数の異なる摂動が、少なくとも5つの異なる摂動からなる
    、請求項1記載の方法。
  3. 【請求項3】 複数の異なる摂動が、10を超える異なる摂動からなる、請求
    項2記載の方法。
  4. 【請求項4】 複数の異なる摂動が、50を超える異なる摂動からなる、請求
    項3記載の方法。
  5. 【請求項5】 複数の異なる摂動が、100を超える異なる摂動からなる、請
    求項4記載の方法。
  6. 【請求項6】 前記生物学的サンプルの状態を、前記射影プロフィールによ
    って表す工程をさらに含んでなる、請求項1記載の方法。
  7. 【請求項7】 前記射影プロフィールを参照射影プロフィールと比較する工
    程、および前記射影プロフィールと前記参照プロフィールとの類似度または相違
    度を示す工程をさらに含んでなる、請求項1記載の方法。
  8. 【請求項8】 前記定義が、複数の異なる摂動下における前記細胞構成成分
    の同時変動に基づくものである、請求項1記載の方法。
  9. 【請求項9】 前記定義が、前記複数の摂動下における前記細胞構成成分の
    クラスター分析によって取得した類似度ツリーによって定められる、請求項8記
    載の方法。
  10. 【請求項10】 前記細胞構成成分セットを、前記類似度ツリーのブランチ
    とする、請求項9記載の方法。
  11. 【請求項11】 前記ブランチを、前記ツリーに切断レベルを適用すること
    によって選択し、該切断レベルは、前記細胞構成成分で表される生物学的経路の
    予想数によって決定される、請求項10記載の方法。
  12. 【請求項12】 前記ブランチ間の識別によって、95%の信頼度で統計学的
    有意性を達成する、請求項10記載の方法。
  13. 【請求項13】 前記統計学的有意性を、前記摂動のインデックスをモンテ
    カルロ法によってランダム化した検定によって評価する、請求項12記載の方法。
  14. 【請求項14】 モンテカルロ法によるランダム化を利用した検定が、 (a)前記細胞構成成分のクラスター分析における実際のフラクショナル・イン
    プルーブメント(fractional improvement)を求め、 (b)各細胞構成成分に対して各摂動をモンテカルロ法によってランダム化する
    ことにより置換細胞構成成分を作製し、 (c)置換細胞構成成分にクラスター分析を行い、 (d)置換細胞構成成分のクラスター分析におけるフラクショナル・インプルー
    ブメントを求め、 (e)置換細胞構成成分を作製する前記工程と置換細胞構成成分にクラスター分
    析を行う前記工程を繰り返して、フラクショナル・インプルーブメントの分布を
    取得する ことを含んでなり、実際のフラクショナル・インプルーブメントをフラクショナ
    ル・インプルーブメントの分布と比較することによって統計学的有意性を求める
    、請求項13記載の方法。
  15. 【請求項15】 1以上の摂動に対する生物学的応答の時間インデックスを
    モンテカルロ法によってランダム化した検定によって、前記統計学的有意性を評
    価する、請求項12記載の方法。
  16. 【請求項16】 定義された前記細胞構成成分セットを、前記細胞構成成分
    間の生物学的な関係に基づいてさらに精緻化する、請求項10、11または12記載の
    方法。
  17. 【請求項17】 前記定義が、 (式中、V(n) kは、n番目の細胞構成成分セットに対するk番目の細胞構成成分の寄
    与を表す) である、請求項1記載の方法。
  18. 【請求項18】 前記変換工程が、演算: (式中、Piはi番目の細胞構成成分セット値であり、ベクトルpは細胞構成成分の
    プロフィールである) の実行を含む、請求項17記載の方法。
  19. 【請求項19】 前記細胞構成成分セット値の各々が、対応の細胞構成成分
    セット内における前記細胞構成成分のレベルの平均値である、請求項1記載の方
    法。
  20. 【請求項20】 前記細胞構成成分セット値の各々が、対応の細胞構成成分
    セット内における前記細胞構成成分のレベルの加重平均である、請求項1記載の
    方法。
  21. 【請求項21】 前記複数の測定結果を単一ベクトルサイズへ正規化する、
    請求項1記載の方法。
  22. 【請求項22】 前記細胞構成成分の測定結果が、前記生物学的サンプルの
    摂動に対する応答の測定結果である、請求項1記載の方法。
  23. 【請求項23】 生物学的サンプルの分析方法であって、 (a)前記生物学的サンプル中に含まれる細胞構成成分の複数の測定結果からな
    る初期プロフィールを、同時変動性の基本細胞構成成分セットの定義に従って、
    複数の細胞構成成分セット値を含む射影プロフィールへ変換し、ここで、前記変
    換は、前記初期プロフィールを前記基本細胞構成成分セットへ射影することを含
    んでなるものであり、 (b)前記射影プロフィールを参照プロフィールと比較し、 (c)前記射影プロフィールと前記参照プロフィールとの類似度または相違度を
    示す ことを含んでなる前記方法。
  24. 【請求項24】 前記定義が、前記細胞構成成分の同時調節から誘導したも
    のである、請求項23記載の方法。
  25. 【請求項25】 前記定義が、複数の異なる摂動下における前記細胞構成成
    分の同時変動に基づくものである、請求項23記載の方法。
  26. 【請求項26】 前記定義が、 (式中、V(n) kは、n番目の細胞構成成分セットに対するk番目の細胞構成成分の寄
    与を表す) である、請求項23記載の方法。
  27. 【請求項27】 前記変換工程が、演算: (式中、Piはi番目の細胞構成成分セット値であり、ベクトルpは細胞構成成分の
    プロフィールである) の実行を含む、請求項26記載の方法。
  28. 【請求項28】 前記細胞構成成分セット値の各々が、対応の細胞構成成分
    セット内における前記細胞構成成分のレベルの平均値である、請求項23記載の方
    法。
  29. 【請求項29】 前記細胞構成成分セット値の各々が、対応の細胞構成成分
    セット内における前記細胞構成成分のレベルの加重平均である、請求項23記載の
    方法。
  30. 【請求項30】 前記複数の測定結果を単位ベクトルサイズへ正規化する、
    請求項23記載の方法。
  31. 【請求項31】 前記細胞構成成分の測定結果が、前記生物学的サンプルの
    摂動に対する応答の測定結果である、請求項23記載の方法。
  32. 【請求項32】 生物学的サンプルの分析方法であって、前記生物学的サン
    プル中に含まれる細胞構成成分の複数の測定結果からなる初期プロフィールを、
    同時変動性の基本細胞構成成分セットの定義に従って、複数の細胞構成成分セッ
    ト値を含む射影プロフィールへ変換することを含んでなり、ここで、前記定義は
    、式 (式中、V(n) kは、n番目の細胞構成成分セットに対するk番目の細胞構成成分の寄
    与を表す) によって与えられ、前記変換は、前記初期プロフィールを前記基本細胞構成成分
    セットへ射影することを含んでなるものである、前記方法。
  33. 【請求項33】 前記変換工程が、演算: (式中、Piはi番目の細胞構成成分セット値であり、ベクトルpは細胞構成成分の
    プロフィールである) の実行を含む、請求項32記載の方法。
  34. 【請求項34】 生物学的サンプルの分析方法であって、前記生物学的サン
    プル中に含まれる細胞構成成分の複数の測定結果からなる初期プロフィールを、
    同時変動性の基本細胞構成成分セットの定義に従って、複数の細胞構成成分セッ
    ト値を含む射影プロフィールへ変換することを含んでなり、前記細胞構成成分セ
    ット値の各々は、対応の細胞構成成分セット内における前記細胞構成成分のレベ
    ルの加重平均であり、ここで、前記変換は、前記初期プロフィールを前記基本細
    胞構成成分セットへ射影することを含んでなるものである、前記方法。
  35. 【請求項35】 生物学的サンプルの分析方法であって、生物学的サンプル
    中に含まれる細胞構成成分の複数の測定結果からなる初期プロフィールを、同時
    変動性の基本細胞構成成分セットの定義に従って、複数の細胞構成成分セット値
    を含む射影プロフィールへ変換することを含んでなり、前記複数の測定結果は、
    単位ベクトルサイズへ正規化されるものであり、ここで、前記変換は、前記初期
    プロフィールを前記基本細胞構成成分セットへ射影することを含んでなるもので
    ある、前記方法。
  36. 【請求項36】 生物学的応答プロフィールを該応答の類似度に応じて分類
    する方法であって、前記応答プロフィール中の測定された複数の細胞構成成分の
    類似度に基づいて、類似応答プロフィールセットを規定することを含んでなる前
    記方法。
  37. 【請求項37】 前記応答プロフィール中の測定された複数の細胞構成成分
    の類似度をクラスター分析によって分析することで得られるクラスター化ツリー
    を形成する工程をさらに含んでなる、請求項36記載の方法。
  38. 【請求項38】 前記生物学的応答プロフィールのグループを、前記クラス
    ター化ツリーのブランチとする、請求項37記載の方法。
  39. 【請求項39】 生物学的応答プロフィールのグループの統計学的有意性を
    求めることをさらに含んでなる、請求項36記載の方法。
  40. 【請求項40】 生物学的応答プロフィールのグループの統計学的有意性を
    、客観的な統計的検定によって求める、請求項39記載の方法。
  41. 【請求項41】 客観的な統計的検定が、 (a)生物学的応答プロフィールのクラスター分析における実際のフラクショナ
    ル・インプルーブメントを求め、 (b)各応答プロフィールに対して各細胞構成成分をモンテカルロ法によってラ
    ンダム化することにより置換応答プロフィールを作製し、 (c)置換応答プロフィールにクラスター分析を行い、 (d)置換応答プロフィールのクラスター分析におけるフラクショナル・インプ
    ルーブメントを求め、 (e)置換応答プロフィールを作製する前記工程と置換応答プロフィールにクラ
    スター分析を行う前記工程を繰り返して、フラクショナル・インプルーブメント
    の分布を取得する ことを含んでなり、実際のフラクショナル・インプルーブメントをフラクショナ
    ル・インプルーブメントの分布と比較することによって統計学的有意性を求める
    、請求項40記載の方法。
  42. 【請求項42】 生物学的サンプルの分析方法であって、 (a)生物学的サンプル由来の細胞構成成分を、生物学的サンプルより取得した
    生物学的プロフィールにおいて同時に変動する細胞構成成分のセットへ分類し、 (b)生物学的サンプルより取得した生物学的プロフィールを、類似の細胞構成
    成分をもたらす生物学的プロフィールのセットへ分類する ことを含んでなる前記方法。
  43. 【請求項43】 特定の生物学的作用に関与する1以上の細胞構成成分を、
    前記細胞構成成分のセットから同定する、請求項42記載の方法。
  44. 【請求項44】 特定の生物学的作用に関与する1以上の生物学的プロフィ
    ールを、前記生物学的プロフィールのセットから同定する、請求項42記載の方法
  45. 【請求項45】 特定の生物学的作用が生物学的経路である、請求項43また
    は44記載の方法。
  46. 【請求項46】 特定の生物学的作用が疾患または疾患状態である、請求項
    43または44記載の方法。
  47. 【請求項47】 特定の生物学的作用が、1種以上の薬剤による治療効果で
    ある、請求項43または44記載の方法。
  48. 【請求項48】 生物学的サンプル由来の細胞構成成分が複数の遺伝子を含
    むものであり、特定の生物学的作用に関与する1以上の遺伝子が同定される、請
    求項43記載の方法。
  49. 【請求項49】 同定される1以上の遺伝子が既知遺伝子からなる、請求項
    46記載の方法。
  50. 【請求項50】 同定される1以上の遺伝子が、従来知られていない遺伝子
    からなる、請求項46記載の方法。
  51. 【請求項51】 特定の生物学的作用に関与する1以上の摂動を、前記生物
    学的プロフィールのセットから同定する、請求項42記載の方法。
  52. 【請求項52】 1以上の摂動が薬剤または薬剤候補からなる、請求項49記
    載の方法。
  53. 【請求項53】 1以上の摂動が遺伝子突然変異からなる、請求項50記載の
    方法。
  54. 【請求項54】 薬剤または薬剤候補が、既知の薬剤または薬剤候補である
    、請求項50記載の方法。
  55. 【請求項55】 遺伝子突然変異が、既知の遺伝子突然変異である、請求項
    51記載の方法。
  56. 【請求項56】 薬剤または薬剤候補が、従来知られていない薬剤または薬
    剤候補である、請求項50記載の方法。
  57. 【請求項57】 遺伝子突然変異が、従来知られていない遺伝子突然変異で
    ある、請求項51記載の方法。
  58. 【請求項58】 N次元データアレイの分析方法であって、Nは正の整数で
    あり、N次元データアレイの各要素はN個のインデックスを有するものであり、
    各インデックスを、N次元データアレイ内で同時に変動するデータのセットへ分
    類することを含んでなる前記方法。
  59. 【請求項59】 前記の各セットを、前記インデックスにそれぞれクラスタ
    ー分析を行って取得した類似度ツリーによって規定する、請求項56記載の方法。
  60. 【請求項60】 細胞構成成分の複数の測定結果を含む測定された生物学的
    プロフィールから1以上のアーティファクトを除去する方法であって、1以上の
    アーティファクトのパターンを、測定された生物学的プロフィールから差し引く
    ことを含んでなり、ここで、前記1以上のアーティファクトパターンはそれぞれ
    特定のアーティファクトに対応するものである、前記方法。
  61. 【請求項61】 遺伝子に関する知見と、1以上のアーティファクトパター
    ンの各々に対応する特定のアーティファクトに関与する応答の相対振幅から、1
    以上のアーティファクトパターンの各々を取得する、請求項58記載の方法。
  62. 【請求項62】 1以上のアーティファクトパターンの各々に対応する特定
    のアーティファクトを生じると考えられる変数の摂動を用いた実験によって、1
    以上のアーティファクトパターンの各々を取得する、請求項58記載の方法。
  63. 【請求項63】 対照の生物学的プロフィールにクラスター分析を行うこと
    により1以上のアーティファクトパターンの各々を取得し、ここで、対照となる
    該生物学的プロフィールは、1以上のアーティファクトパターンの各々に対応す
    るアーティファクトが発生する実験において測定された細胞構成成分の複数の測
    定結果を含むものである、請求項58記載の方法。
  64. 【請求項64】 1以上のアーティファクトパターンを基準化係数によって
    基準化し、1以上のアーティファクトパターンがそれぞれ特定の基準化係数を有
    する、請求項58記載の方法。
  65. 【請求項65】 1以上の基準化アーティファクトパターンの和と測定プロ
    フィールとの差に関する目的関数の値を最小にする特定の基準化係数の値をそれ
    ぞれ求めることを含んでなる方法によって、基準化係数を決定する、請求項62記
    載の方法。
  66. 【請求項66】 目的関数が最小2乗法によって最小化される、請求項63記
    載の方法。
  67. 【請求項67】 1以上のアーティファクトパターンをそれぞれアーティフ
    ァクトサイン(signature)のライブラリーから選択し、該アーティファクトサイ
    ンは、1以上のアーティファクトの各々に対する重大度のレベルに対応するもの
    である、請求項58記載の方法。
  68. 【請求項68】 1以上のアーティファクトサインの和と測定プロフィール
    との差に関する目的関数の値を最小にするアーティファクトサインを求めること
    を含んでなる方法によって、アーティファクトサインを選択する、請求項65記載
    の方法。
  69. 【請求項69】 複数の異なる摂動が、特定の摂動に対して複数の段階的な
    レベルで接触させることからなる、請求項1記載の方法。
  70. 【請求項70】 特定の摂動が薬剤または薬剤候補である、請求項67記載の
    方法。
  71. 【請求項71】 前記定義が、一定の期間にわたる細胞構成成分の同時変動
    に基づくものである、請求項1記載の方法。
  72. 【請求項72】 ポリヌクレオチドプローブのアレイであって、少なくとも
    1つの表面を有する支持体と複数の異なるポリヌクレオチドプローブを含んでな
    り、ここで、異なるポリヌクレオチドプローブがそれぞれ (a)支持体の表面に、異なる位置で結合しており、 (b)異なるヌクレオチド配列からなり、 (c)複数の遺伝子セットのうち、1つの遺伝子セット内の特定の遺伝子の発現
    産物にハイブリダイズするものであり、ここで (i)前記複数の遺伝子セットは、生物学的サンプル由来の遺伝子を、生物学的
    サンプルより取得した生物学的プロフィールにおいて同時に変動する遺伝子のセ
    ットへ分類することを含んでなる方法によって得られるものであり、 (ii)各遺伝子セットに対して、前記遺伝子セット内の異なる特定の遺伝子の発
    現産物にハイブリダイズする異なるポリヌクレオチドプローブの数が、該遺伝子
    セットに含まれる遺伝子の総数未満である、前記アレイ。
  73. 【請求項73】 複数の異なるポリヌクレオチドプローブが、50〜1,000の
    異なる遺伝子セットに由来する遺伝子の発現産物にハイブリダイズする、請求項
    72記載のアレイ。
  74. 【請求項74】 複数の異なるポリヌクレオチドプローブが、100〜500の異
    なる遺伝子セットに由来する遺伝子の発現産物にハイブリダイズする、請求項73
    記載のアレイ。
  75. 【請求項75】 複数の異なるポリヌクレオチドプローブが、100〜200の異
    なる遺伝子セットに由来する遺伝子の発現産物にハイブリダイズする、請求項74
    記載のアレイ。
  76. 【請求項76】 特定の遺伝子を異なる遺伝子セットからそれぞれ選択する
    、請求項72記載のアレイ。
  77. 【請求項77】 複数の異なるポリヌクレオチドプローブが、いずれかの遺
    伝子セットに由来する10未満の特定の遺伝子の発現産物にハイブリダイズする、
    請求項72記載のアレイ。
JP2000578488A 1998-10-27 1999-10-27 同時調節された遺伝子セットを使用して遺伝子発現パターンの検出および分類を向上させる方法 Pending JP2002528095A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US09/179,569 US6203987B1 (en) 1998-10-27 1998-10-27 Methods for using co-regulated genesets to enhance detection and classification of gene expression patterns
US09/220,275 US6950752B1 (en) 1998-10-27 1998-12-23 Methods for removing artifact from biological profiles
US09/179,569 1998-12-23
US09/220,275 1998-12-23
PCT/US1999/025025 WO2000024936A1 (en) 1998-10-27 1999-10-27 Methods for using co-regulated genesets to enhance detection and classification of gene expression patterns

Publications (1)

Publication Number Publication Date
JP2002528095A true JP2002528095A (ja) 2002-09-03

Family

ID=26875445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000578488A Pending JP2002528095A (ja) 1998-10-27 1999-10-27 同時調節された遺伝子セットを使用して遺伝子発現パターンの検出および分類を向上させる方法

Country Status (11)

Country Link
EP (1) EP1124992A4 (ja)
JP (1) JP2002528095A (ja)
KR (1) KR20010081098A (ja)
AU (1) AU773456B2 (ja)
BR (1) BR9914913A (ja)
CA (1) CA2348837A1 (ja)
HU (1) HUP0104050A2 (ja)
IL (1) IL142840A0 (ja)
IS (1) IS5929A (ja)
NO (1) NO20012036L (ja)
PL (1) PL347495A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009520278A (ja) * 2005-12-16 2009-05-21 ネクストバイオ 科学情報知識管理のためのシステムおよび方法
JP2011248789A (ja) * 2010-05-30 2011-12-08 World Fusion Co Ltd 発現データ予測システム
JP2012514994A (ja) * 2009-01-19 2012-07-05 システミック・スコットランド・リミテッド 非コードrna発現アッセイを用いた方法
US9141913B2 (en) 2005-12-16 2015-09-22 Nextbio Categorization and filtering of scientific data
US9183349B2 (en) 2005-12-16 2015-11-10 Nextbio Sequence-centric scientific information management
WO2015198620A1 (ja) * 2014-06-23 2015-12-30 オリンパス株式会社 組織地図作成方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036754B (zh) * 2020-06-30 2022-09-16 上海即科智能技术集团有限公司 基于区块链的金融大数据风控系统
CN117933579B (zh) * 2024-03-25 2024-06-25 中国农业科学院草原研究所 一种高效人工草地综合管理方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009520278A (ja) * 2005-12-16 2009-05-21 ネクストバイオ 科学情報知識管理のためのシステムおよび方法
US8275737B2 (en) 2005-12-16 2012-09-25 Nextbio System and method for scientific information knowledge management
US9141913B2 (en) 2005-12-16 2015-09-22 Nextbio Categorization and filtering of scientific data
US9183349B2 (en) 2005-12-16 2015-11-10 Nextbio Sequence-centric scientific information management
US9633166B2 (en) 2005-12-16 2017-04-25 Nextbio Sequence-centric scientific information management
US10127353B2 (en) 2005-12-16 2018-11-13 Nextbio Method and systems for querying sequence-centric scientific information
US10275711B2 (en) 2005-12-16 2019-04-30 Nextbio System and method for scientific information knowledge management
JP2012514994A (ja) * 2009-01-19 2012-07-05 システミック・スコットランド・リミテッド 非コードrna発現アッセイを用いた方法
JP2011248789A (ja) * 2010-05-30 2011-12-08 World Fusion Co Ltd 発現データ予測システム
WO2015198620A1 (ja) * 2014-06-23 2015-12-30 オリンパス株式会社 組織地図作成方法

Also Published As

Publication number Publication date
HUP0104050A2 (hu) 2002-03-28
CA2348837A1 (en) 2000-05-04
EP1124992A4 (en) 2006-09-06
PL347495A1 (en) 2002-04-08
AU1451700A (en) 2000-05-15
NO20012036L (no) 2001-06-25
KR20010081098A (ko) 2001-08-27
EP1124992A1 (en) 2001-08-22
NO20012036D0 (no) 2001-04-25
IL142840A0 (en) 2002-03-10
IS5929A (is) 2001-04-27
AU773456B2 (en) 2004-05-27
BR9914913A (pt) 2001-10-16

Similar Documents

Publication Publication Date Title
US6468476B1 (en) Methods for using-co-regulated genesets to enhance detection and classification of gene expression patterns
US6203987B1 (en) Methods for using co-regulated genesets to enhance detection and classification of gene expression patterns
US6950752B1 (en) Methods for removing artifact from biological profiles
US6801859B1 (en) Methods of characterizing drug activities using consensus profiles
US6370478B1 (en) Methods for drug interaction prediction using biological response profiles
US6859735B1 (en) Computer systems for identifying pathways of drug action
US6165709A (en) Methods for drug target screening
US8412460B2 (en) Methods and systems for characterizing a cellular constituent using response profiles
JP2002518021A (ja) 生物学的ネットワークモデルのテスト方法
KR20010052326A (ko) 유전자 발현 프로파일을 이용하여 단백질 활성 수준을결정하는 방법
WO2003004677A2 (en) Methods for generating differential profiles by combining data obtained in separate measurements
US20040091933A1 (en) Methods for genetic interpretation and prediction of phenotype
WO2002044411A1 (en) Use of profiling for detecting aneuploidy
JP2002528095A (ja) 同時調節された遺伝子セットを使用して遺伝子発現パターンの検出および分類を向上させる方法
WO2000039337A1 (en) Methods for robust discrimination of profiles
US20020146694A1 (en) Functionating genomes with cross-species coregulation
WO2002002741A2 (en) Methods for genetic interpretation and prediction of phenotype