JP2002514804A - 遺伝子発現分析のための数値化方法、システムおよび装置 - Google Patents

遺伝子発現分析のための数値化方法、システムおよび装置

Info

Publication number
JP2002514804A
JP2002514804A JP2000548511A JP2000548511A JP2002514804A JP 2002514804 A JP2002514804 A JP 2002514804A JP 2000548511 A JP2000548511 A JP 2000548511A JP 2000548511 A JP2000548511 A JP 2000548511A JP 2002514804 A JP2002514804 A JP 2002514804A
Authority
JP
Japan
Prior art keywords
gene expression
gene
expression
relevance
quantifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000548511A
Other languages
English (en)
Inventor
シェラー,ステュワート
Original Assignee
ロゼッタ インファーマティクス, インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ロゼッタ インファーマティクス, インコーポレーテッド filed Critical ロゼッタ インファーマティクス, インコーポレーテッド
Publication of JP2002514804A publication Critical patent/JP2002514804A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 本発明は、第1および第2遺伝子発現プロフィールの関連性を数値化する方法、および複数の遺伝子発現プロフィールと予め選択しておいた1つの遺伝子発現プロフィールとの関連性に順位をつける方法を提供する。この方法は、細胞に対する医薬製剤の作用における関連性といった、細胞に対する環境条件の関連性の数値化に有用であることが示される。この方法は、予め選択しておいた環境条件と細胞の特定の遺伝子突然変異との関連性を数値化する際にも有用であり、複数の遺伝子突然変異の関連性を数値化するのにも有用である。また、この方法を実行するためのシステムや装置も提供する。さらに、遺伝子発現分析に有用な遺伝子のサブセットを選択するための数値化方法、システムおよび装置を提供する。

Description

【発明の詳細な説明】
【0001】発明の分野 本発明は、製薬開発に適用できる生物情報科学的(bioinformatic)方法に関す
る。特に、本発明は、遺伝子発現プロフィールの数値化分析、比較、格納、およ
び視覚化表示のための方法、システムおよび装置に関する。さらに、本発明は、
発現分析のために有用な遺伝子サブセットを選択するための数値化方法、数値化
システム、および数値化装置に関する。
【0002】発明の背景 従来の薬物発見の試みでは、まず、公知の生化学的経路にある酵素等の特定の
薬物標的を選択する。次に、選択した標的に特異的な1つ以上のin vitroまたは
in vivoアッセイを開発しなければならない。標的を選択し、特異的なアッセイ
を開発して初めて化学化合物を所望の活性についてスクリーニングすることがで
きる。専用アッセイで選択した標的に対して所望の活性を有する化合物を同定す
れば、これら初期段階の先導化合物は、より好ましい治療的、薬物動態的、およ
び臨床的特性を有する誘導体を開発するための構造的基盤(predicates)として働
く。これらの誘導体の生物学的活性は、先導化合物を同定したものと同じ専用ア
ッセイを用いて評価されることが多い。
【0003】 従来の薬物開発パラダイムにおける上記各ステップは、前臨床検査において有
望視された薬物が、臨床治験においては不成功に終わるという危険性を負ってい
る。
【0004】 第一に、薬物標的の選択には、薬物が意図する疾患または病理経過と臨床的に
関連する生物学的経路の知識が必要条件となる。臨床検査を開始してから、選択
された標的が、生理学的に不適切であることが判明するかもしれない。例えば、
標的は多数の関連した生物学的経路または無関連の生物学的経路に関わるかもし
れない。専用in vitroアッセイは、このような平行したまたは交差した生物学的
経路に対する薬物候補の作用を同定できないかもしれない。その結果、標的のin
vitro活性に好ましい作用を及ぼす薬物が、in vivo投与した際に、許容不可能
な毒性を有していたり、望ましくない副作用を呈することが判明するかもしれな
い。
【0005】 第二に、in vitroアッセイ法は、それ自体の感度が不十分だったり、特異性が
不十分だったり、あるいはその両方ともが不十分かもしれない。先導化合物の誘
導体の開発において同じアッセイを使用すると、これらの問題は一層ひどくなる
かもしれない。
【0006】 従って、製薬技術分野において、改善された薬物開発戦略が必要とされている
。特に、最初の適切な標的の選択にあまり依存しない薬物開発スキームが必要と
されている。また、前臨床薬物開発の間、選択された標的が一部を構成する生物
学的経路から単離することを回避した薬物開発戦略が必要とされている。さらに
、目的の病理学的状態、疾患、または障害に関連する生物学的経路および新規標
的を同定する薬物開発方法が必要とされている。
【0007】 遺伝子発現測定における最近の技術的進歩は、原核細胞または真核細胞で転写
された全ての遺伝子さもなくば多くの遺伝子の発現の同時測定を可能にした。こ
のように遺伝子発現プロフィールが作成できることで原材料が提供され、そこか
ら新規薬物開発戦略が成り立つ。例えば、Ashbyら、米国特許第5,549,588号を参
照のこと。
【0008】 今日のほとんどの遺伝子発現プロフィールは、宿主細胞から核酸発現生成物を
単離し、該生成物を(例えば、蛍光標識または放射性核種標識によって)標識し、
個別の配列を有し且つ表面に固定化されたDNAを有するユニットを含む空間的に
指定可能なマトリクスに該標識核酸をハイブリダイズさせることによって作成さ
れている。例えば、Lashkariら, Proc. Natl. Acad. Sci. USA, 94, pp. 13057-
62 (1997);DeRisiら, Science, 278, pp. 680-86 (1997);Wodickaら, Nature
Biotechnology, 15, pp. 1359-67 (1997);およびPietuら, Genome Research, 6
, pp. 492-503 (1996)を参照のこと。
【0009】 固定化DNAマトリクスを作成する由来となった宿主によって発現されうる遺伝
子全体を表すマトリクスエレメントを選択する。例えば、走査レーザ、走査共焦
点蛍光顕微鏡、または燐光画像処理器(PhosphorImager)により記録した、マトリ
クスの種々のDNAエレメントに対する特異的ハイブリダイゼーションは、それぞ
れの遺伝子の発現を示す。それぞれの遺伝子の識別は、マトリクスのエレメント
の空間位置において符号化されている。データが、獲得され、二値化され、電子
的に格納される。データは共に、選択された細胞培養物により発現された遺伝子
のサブセットを識別する。
【0010】 Ashbyら、米国特許第5,549,588号(本明細書において参考として援用する)は、
遺伝子発現プロフィールを作成するための代替的なアプローチを開示している。
Ashbyは、「ゲノムリポーターマトリクス」を開示している。この開示の一実施形
態において、空間的に指定可能なマトリクスの各エレメントは、特異的な核酸配
列ではなく、1つ以上の同一細胞(または細胞のクローン)からなる。各マトリク
ス位置における細胞は、異なる転写調節エレメント由来の共通のリポーター遺伝
子の発現を指示する組換え構築物を含む。転写調節エレメントは、任意の数の潜
在的真核生物または原核生物から得られる。選択された生物の遺伝子発現レパー
トリの代表的なサンプリングを得るために、十分な数のマトリクスエレメント、
従って十分な数の転写調節エレメントが含まれる。
【0011】 遺伝子発現を測定するために、Ashbyらは、リポーターに適し、かつリポータ
ーにより指示される検出器で走査することでマトリクスを直接読み取る。一実施
形態では、リポーターは、緑色蛍光タンパク質などの蛍光シグナルを生成するタ
ンパク質をコードするために、蛍光検出器で走査される。別の実施形態では、リ
ポーターは、測光的に検出可能なシグナルを生成する酵素をコードするために、
光度計で走査される。スキャナで記録されるシグナルは、それぞれの転写調節エ
レメントによって作動可能に制御された発現を示す。この識別は、マトリクスの
エレメントの空間位置において符号化されている。
【0012】 本明細書において集合的に「発現マトリクス」と称する、遺伝子発現プロフィー
ルを生成するための上記各技術プラットホームは、所定の条件下での細胞中の遺
伝子の同時発現について大量の情報を生成する。そのような遺伝子発現プロフィ
ールは、全体的に、選択された環境条件項目下での細胞の全体的な遺伝子発現状
態を捉えている。
【0013】 従来の技術は、このような遺伝子発現プロフィールの定性的比較(異なる条件下
で異なる発現レベルを示す遺伝子のサブセットの同定など)に重点を置いてきた
。あるいはまた、従来の技術は、大量かつ多次元のデータセットの数値化比較を
行うことができないデータ操作に重点を置いてきた。例えば、Ashbyら(前掲);L
ashkariら(前掲);DeRisiら(前掲);Rineら, WO98/06874;およびSeilhamerら,
WO95/20681を参照のこと(本明細書においてこれらの各文献を参考として援用す
る)。
【0014】 上記定性分析法のいずれも、遺伝子発現プロフィール全体の関連性についての
再生可能な演算を行うことができない。従って、定量的遺伝子発現プロフィール
を作成し、その情報から、様々な環境条件下(例えば、異なる化合物で処理する
など)での選択細胞中の遺伝子発現の関連性を定量的に比較することが有利とな
る。
【0015】 従って、第1および第2の遺伝子発現プロフィールの関連性を数値化する方法
が必要とされている。さらに、予め選択された単一の遺伝子発現プロフィールに
対する、複数の遺伝子発現プロフィールの関連性に順位をつけることができる方
法が必要とされている。さらに、格納データセット(即ち、これまでの実験から
得た遺伝子発現プロフィールデータ)を、新規の関連性比較において問合せおよ
び分析することが可能な数値化方法および数値化装置が必要とされている。
【0016】 遺伝子発現測定における最近の技術的進歩は、原核細胞または真核細胞で転写
された全ての遺伝子さもなくば多くの遺伝子の発現の同時測定を可能にしたが、
技術的考察ではしばしば、全ての発現可能遺伝子よりも少ない数の遺伝子がアッ
セイされると示されている。例えば、薬物候補のサンプルの供給量は限られてい
るかもしれなく、これは特にコンビナトリアル化学により少量で生成される場合
にいえる。分かりやすく言うと、所与の細胞型の可能性のある遺伝子全てに対す
る薬物の作用を検査するには薬物量が少な過ぎるかもしれない。あるいはまた、
それぞれの薬物候補を、細胞の発現可能遺伝子のそれぞれにわたってアッセイす
るには費用がかかり過ぎるかもしれない。
【0017】 これらの問題は、アッセイするゲノムがより複雑となる場合に一層ひどくなる
。つまり、Saccharomyces cerevisiae等の酵母細胞の発現可能遺伝子のそれぞれ
に対する薬物またはその他の環境薬物の作用を評価するためには、約6000の遺伝
子の発現の測定が必要となる。C.elegans等の線虫の遺伝子発現に対する類似ア
ッセイを行うためには、約20000の遺伝子の発現の測定が必要となる。ヒト細胞
の発現可能遺伝子それぞれに対する薬物またはその他の環境薬物の作用を評価す
るためには、約100000の遺伝子の測定を必要とする。
【0018】 さらに、全ての遺伝子が同等に有用であるわけではない。遺伝子によっては、
発現における動的範囲が、環境条件に拘らず、有意な情報を得るには不十分かも
しれない。その他の遺伝子は、協調的に、つまり協働的に発現が変化するかもし
れず、この場合集めた情報が重複する。
【0019】 発現分析のために有用な遺伝子サブセットを選択するための一つのアプローチ
は、公知または推測される機能によって遺伝子を個々に選択することである。な
かでも、Farrら、米国特許第5,811,231号および欧州特許第EP 0680517 B1号は、
特に細胞に対して毒性である化合物を同定し、特徴決定するために「ストレス遺
伝子(stress genes)」の選択を開示している。
【0020】 しかし、このようなアプローチは、遺伝子の機能についての予備知識を必要と
する。さらに、このような方向付けられた選択による偏りは、これまでに推測さ
れなかった関係を同定する可能性を低めるだろう。本明細書で提示する方法等、
推測されなかった関係を同定するのに有用な方法においては、このような方向付
けられた予備選択は特に望ましくない。
【0021】 別のアプローチでは、選択されるサブセットが全体を代表するものであると期
待して、サブセットを完全にランダムに選択する。この場合の問題は明らかに、
このように選択されたサブセットが、実際には、1つ以上の環境的条件下での細
胞状態を表すのに有用でないかもしれないことである。
【0022】 さらに別のアプローチでは、共通の機能によってではなく、予め選択された環
境条件に対する共通の応答性によって同定された遺伝子を選択する。Whitneyら,
Nat. Biotechnol., 16:1329-33(1998)。後者の方法は、純粋に方向付けられた
アプローチと純粋にランダムなアプローチとの間で、両方の短所をそれぞれある
程度もつ。
【0023】 従って、当該分野において、発現分析のための有用な遺伝子サブセットを選択
できる方法が必要とされている。
【0024】発明の概要 本発明は、遺伝子発現プロフィールの数値化分析を行う方法、システムおよび
装置を提供することにより、当該技術分野におけるこれらの問題点および他の問
題点を解決するものである。実験に基づく実施例から、このような分析によって
各種薬物療法の関連性(relatedness)の数値化と順位づけが可能となることが実
証され、その結果、基準薬剤の分子標的を予め同定したり、専用のアッセイを開
発したりしなくても、基準薬剤と同一の分子標的に作用する化学薬剤を同定する
ことができ、基準薬剤と同一の生理学的経路の別の箇所に作用する化学薬剤を同
定することができ、また、基準薬剤の作用機序や、基準薬剤と比較した化学薬剤
の作用機序が解明される。このような分析は、他の細胞表現型(例えば、他の環
境条件に起因する表現型、突然変異等の遺伝子型の摂動に起因する表現型)の比
較にも同様に適用される。
【0025】 従って第1の態様では、本発明は、第1および第2遺伝子発現プロフィールの
関連性を数値化する方法を提供する。この第1の方法には、(a)第1および第2
遺伝子発現プロフィールを通常代表する各遺伝子に対してそれぞれ第1および第
2遺伝子発現信号を発生させ、(b)第1および第2遺伝子発現信号の各対に対し
て相対発現スコアを設定し、(c)これらの対ごとに設定した相対発現スコアから
合成スコアを計算する工程が含まれ、この合成スコアによって2つの遺伝子発現
プロフィールの関連性を数値化する。
【0026】 別の態様では、本発明は、第1および第2遺伝子発現プロフィールの関連性を
数値化する第2の方法を提供する。この第2の方法は特に、温和な条件下で取得
した遺伝子発現プロフィールの比較に適したものである。この第2の方法には、
(a)第1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対してそ
れぞれ第1および第2遺伝子発現信号を発生させ、(b)通常代表とされる遺伝子
に対する第1および第2遺伝子発現信号対のセットに線形回帰を行う工程が含ま
れ、このような回帰の相関係数によって2つの遺伝子発現プロフィールの関連性
を数値化する。
【0027】 第3の態様では、本発明は、複数の遺伝子発現プロフィールと予め選択してお
いた1つの遺伝子発現プロフィールとの関連性に順位をつける方法を提供する。
この方法には、(a)複数の遺伝子発現プロフィールの各々と予め選択しておいた
遺伝子発現プロフィールとの関連性を対ごとに数値化し、(b)前記対ごとに測定
した数値に順位をつける工程が含まれる。本発明のこの態様の好適な実施形態で
は、関連性の対ごとの数値化は、本明細書に新たに記載する2つの方法の一方に
従って行う。
【0028】 前記方法の一連の実施形態では、本発明は、細胞に対する第1および第2環境
条件の関連性を数値化する方法を提供する。この方法には、(a)第1および第2
環境条件の各々の下で前記細胞または遺伝子型が同一の細胞から遺伝子発現プロ
フィールを取得し、(b)第1および第2遺伝子発現プロフィールの関連性を数値
化する工程が含まれる。好適な実施形態では、第1および第2環境条件には、そ
れぞれ、医薬製剤等の化合物への曝露が含まれる。
【0029】 本発明はさらに、細胞に対する複数の環境条件と予め選択しておいた1つの環
境条件との関連性に順位をつける方法を提供する。この方法には、(a)前記細胞
または遺伝子型が同一の細胞から、複数の環境条件の各々および予め選択してお
いた環境条件について遺伝子発現プロフィールを取得し、(b)複数の遺伝子発現
プロフィールの各々と予め選択しておいた遺伝子発現プロフィールとの関連性を
対ごとに数値化し、(c)対ごとに測定した数値に順位をつける工程が含まれる。
好適な実施形態では、前記環境条件には化合物への曝露が含まれる。
【0030】 別の一連の実施形態では、本発明は、予め選択しておいた環境条件と細胞の特
定の遺伝子突然変異との関連性を数値化する方法を提供する。この方法には、(a
)特定の突然変異を有する細胞から第1遺伝子発現プロフィールを取得し、予め
選択しておいた環境条件下で野生型の細胞から第2遺伝子発現プロフィールを取
得し、(b)前記第1および第2遺伝子発現プロフィールの関連性を数値化する工程
が含まれる。
【0031】 本発明はさらに、複数の環境条件の各々と細胞の特定の遺伝子突然変異との関
連性に順位をつける方法を提供する。この方法には、(a)複数の環境条件の各々
の条件下で野生型の細胞から第1遺伝子発現プロフィールのセットを取得し、特
定の突然変異を有する細胞から第2遺伝子発現プロフィールを取得し、(b)第1
遺伝子発現プロフィールの各々と第2遺伝子発現プロフィールとの関連性を対ご
とに数値化し、(c)対ごとに測定した数値に順位をつける工程が含まれる。好適
な実施形態では、前記環境条件には化合物への曝露が含まれ、対ごとの数値化は
本明細書に新たに記載する2つの方法の一方に従って行う。
【0032】 別の一連の実施形態では、本発明は、細胞の第1遺伝子突然変異と細胞の第2
遺伝子突然変異との関連性を数値化する方法を提供する。この方法には、(a)第
1遺伝子突然変異を有する細胞から第1遺伝子発現プロフィールを取得し、第2
遺伝子突然変異を有する細胞から第2遺伝子発現プロフィールを取得し、(b)第
1および第2遺伝子発現プロフィールの関連性を数値化する工程が含まれる。本
発明はさらに、複数の遺伝子突然変異の各々と予め選択しておいた細胞の遺伝子
突然変異との関連性に順位をつける方法を提供する。この方法には、(a)複数の
遺伝子突然変異の1つをそれぞれ有する細胞から第1遺伝子発現プロフィールの
セットを取得し、予め選択しておいた突然変異を有する細胞から第2遺伝子発現
プロフィールを取得し、(b)第1遺伝子発現プロフィールの各々と第2遺伝子発
現プロフィールとの関連性を対ごとに数値化し、(c)対ごとに測定した数値に順
位をつける工程が含まれる。
【0033】 好適な実施形態では、環境条件には細胞を化合物へ曝露させることが含まれ、
前記細胞は酵母細胞、好ましくはSaccharomyces cerevisiaeであり、遺伝子発現
プロフィールはゲノムリポーターマトリックスから取得する。しかしながら、こ
の方法は、あらゆる環境条件、原核細胞だけでなくヒト細胞等の真核細胞、およ
び他のタイプの発現マトリクスから取得される遺伝子発現プロフィールにも広く
適用することができる。
【0034】 別の態様では、本発明は、前記数値化方法を実施するためのコンピュータシス
テム等のシステムを提供する。
【0035】 従って、このような態様の一つでは、本発明は、第1および第2遺伝子発現プ
ロフィールの関連性を数値化するシステムを提供する。このシステムには、(a)
第1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対してそれぞ
れ第1および第2遺伝子発現信号を発生させる手段、(b)第1および第2遺伝子
発現信号の各対に対して相対発現スコアを設定する手段、並びに(c)対ごとの相
対発現スコアから合成スコアを計算する手段が含まれ、この合成スコアが2つの
遺伝子発現プロフィールの関連性を数値化するように機能する。
【0036】 関連する態様では、本発明は、第1および第2遺伝子発現プロフィールの関連
性を数値化するシステムを提供する。このシステムには、(a)第1および第2遺
伝子発現プロフィールを通常代表する各遺伝子に対してそれぞれ第1および第2
遺伝子発現信号を発生させる手段、(b)通常代表とされる遺伝子に対する第1お
よび第2遺伝子発現信号対のセットに線形回帰を行う手段が含まれ、このような
回帰の相関係数によって2つの遺伝子発現プロフィールの関連性を数値化する。
【0037】 さらに別の関連する態様では、本発明は、複数の遺伝子発現プロフィールと予
め選択しておいた1つの遺伝子発現プロフィールとの関連性に順位をつけるシス
テムを提供する。このシステムには、(a)複数の遺伝子発現プロフィールの各々
と予め選択しておいた遺伝子発現プロフィールとの関連性を対ごとに数値化する
手段、(b)対ごとに測定した数値に順位をつける手段が含まれる。
【0038】 本発明はまた、第1および第2遺伝子発現プロフィールの関連性を数値化する
コンピュータシステムを提供する。このシステムには、デジタルマイクロプロセ
ッサ等のプロセッサが含まれ、以下のようにプログラムされている: (a)第1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対して
それぞれ第1および第2遺伝子発現信号を発生させ、 (b)第1および第2遺伝子発現信号の各対に対して相対発現スコアを設定し、 (c)対ごとの相対発現スコアから合成スコアを計算し、この合成スコアによっ
て2つの遺伝子発現プロフィールの関連性を数値化する。
【0039】 同様に、本発明は、第1および第2遺伝子発現プロフィールの関連性を数値化
するコンピュータシステムを提供する。このシステムには、デジタルマイクロプ
ロセッサ等のプロセッサが含まれ、以下のようにプログラムされている:(a)第
1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対してそれぞれ
第1および第2遺伝子発現信号を発生させ、(b)通常代表とされる遺伝子に対す
る第1および第2遺伝子発現信号対のセットに線形回帰を行い、このような回帰
の相関係数によって2つの遺伝子発現プロフィールの関連性を数値化する。
【0040】 本発明はさらに、複数の遺伝子発現プロフィールと予め選択しておいた1つの
遺伝子発現プロフィールとの関連性に順位をつけるコンピュータシステムを提供
する。このシステムには、デジタルマイクロプロセッサ等のプロセッサが含まれ
、以下のようにプログラムされている:(a)複数の遺伝子発現プロフィールの各
々と予め選択しておいた遺伝子発現プロフィールとの関連性を対ごとに数値化し
、 (b)これらの対ごとに測定した数値に順位をつける。また、入力手段と表示
手段を備えたプログラム可能なデジタルコンピュータを含んでなる装置も提供さ
れ、このコンピュータは、入力発現データ上で本明細書に記載の計算方法を実施
可能であり、かつ付属の表示手段上で数値化結果を報告可能なものである。
【0041】 さらに別の態様では、本発明は、命令を記憶するためのコンピュータで読取可
能な記憶媒体を提供する。前記記憶媒体は、コンピュータによって実行されると
、第1および第2遺伝子発現プロフィールの関連性を数値化する方法や、複数の
遺伝子発現プロフィールと予め選択しておいた1つの遺伝子発現プロフィールと
の関連性に順位をつける方法といった、本明細書に記載の新規な方法の各々をコ
ンピュータに実行させるものである。
【0042】 さらなる態様では、本発明は、本発明の方法に適合したデータ構造を含む、コ
ンピュータで読取可能な記憶媒体を提供する。このような態様の一つでは、本発
明は、第1および第2遺伝子発現プロフィールの関連を数値で表すデータを記憶
するように構成されたデータ構造を含む、コンピュータで読取可能な記憶媒体を
提供する。前記データ構造は、発現プロフィールの各々に対する識別子とスカラ
ーとを含んでなり、前記スカラーは、第1遺伝子発現プロフィールと第2遺伝子
発現プロフィールとを数値として関連づけるものである。本発明はさらに、複数
の遺伝子発現プロフィールと予め選択しておいた1つの遺伝子発現プロフィール
との関連性に順位をつけるデータを記憶するように構成されたデータ構造を含む
、コンピュータで読取可能な記憶媒体を提供する。この記憶媒体には、(a)スカ
ラーの順位づけされたリスト、ここで、各スカラーは、複数の遺伝子発現プロフ
ィールの各々と予め選択しておいた遺伝子発現プロフィールとの関連性を対ごと
に数値化するものである、および(b)各スカラーと個々の遺伝子発現プロフィー
ルとを関連付ける識別子が含まれる。
【0043】 遺伝子発現の測定における最近の技術進歩によって、原核細胞または真核細胞
中で転写された遺伝子のうち全部ではないが多くの遺伝子の発現が同時に測定で
きるようにはなったものの、技術上の理由から、発現可能な全ての遺伝子よりも
少数の遺伝子のアッセイで済まさなければならない場合が多い。例えば、薬剤候
補のサンプルは、特にコンビナトリアル化学によって少量しか製造されない場合
には供給に限りがあり、単純に薬剤の量が少なすぎて、所定の細胞型の可能な全
ての遺伝子に対してその作用を試験できない場合もある。また、コストがかかり
すぎて、各候補薬剤を細胞の発現可能な各遺伝子についてアッセイすることがで
きない場合もある。
【0044】 従って、別の態様では、本発明は、発現分析にとって有用な遺伝子のサブセッ
トを選択する方法を提供する。本発明は、細胞の表現型をタイピングする方法を
提供する。この方法は、発現分析を行うのに細胞に含まれる発現可能な遺伝子の
20%以下を選択することを含んでなり、その際、選択した遺伝子を同時発現させ
ることによって細胞の表現型が十分に確定されるため、前記細胞の表現型を別の
細胞の表現型に数値として関連づけることが可能となる。これらの方法では、好
ましくは細胞に含まれる発現可能な遺伝子の約20%以下を選択し、より好ましく
は細胞に含まれる発現可能な遺伝子の約15%以下を選択し、より一層好ましくは
細胞に含まれる発現可能な遺伝子の約10%以下を選択し、最適には細胞に含まれ
る発現可能な遺伝子の約5%以下を選択し、最も好適な実施形態では、細胞に含
まれる発現可能な遺伝子の約1%〜5%、さらには1%〜2%を選択する。この
ような選択を実行するアルゴリズム、並びに前記方法を実行するコンピュータ、
システム、ネットワーク、および他のデバイスも提供する。
【0045】 実施形態の一つでは、本発明のこの態様の方法には、発現が相関し合う各遺伝
子群から、最大発現範囲を有する遺伝子を選択することが含まれる。好適な実施
形態では、複数の遺伝子発現プロフィールを通常代表する遺伝子のセットから選
択を行い、個々の範囲および個々の相関を複数の遺伝子発現プロフィールにおけ
る発現データから計算する。
【0046】 関連する態様では、本発明は、発現分析に有用な遺伝子のサブセットを選択す
るシステムを提供する。このシステムには、発現が相関し合う各遺伝子群から、
最大発現範囲を有する遺伝子を選択する手段が含まれる。好適な実施形態では、
複数の遺伝子発現プロフィールを通常代表する遺伝子のセットから選択を行い、
個々の範囲および個々の相関を複数の遺伝子発現プロフィールにおける発現デー
タから計算する。
【0047】 本発明はまた、発現分析に有用な遺伝子のサブセットを選択するコンピュータ
システムを提供する。このコンピュータシステムには、デジタルマイクロプロセ
ッサ等のプロセッサが含まれ、発現が相関し合う各遺伝子群から、最大発現範囲
を有する遺伝子を選択するようにプログラムされている。また、本発明は、命令
を記憶するためのコンピュータで読取可能な記憶媒体を提供する。前記記憶媒体
は、コンピュータによって実行されると、発現分析に有用な遺伝子のサブセット
を選択する方法をコンピュータに実行させるものであり、前記方法は、発現が相
関し合う各遺伝子群から、最大発現範囲を有する遺伝子を選択することを含んで
なるものである。また、本発明は、発現分析に有用な遺伝子のサブセットを識別
するデータを記憶するように構成されたデータ構造を含む、コンピュータで読取
可能な記憶媒体を提供する。前記データ構造は、遺伝子識別子のセット(任意に
、遺伝子機能の説明を含む)を含んでなる。
【0048】詳細な説明 本明細書に記載する本発明が十分に理解されるように、以下に詳細な説明を行
う。説明には、下記の用語を使用する。
【0049】 本明細書で用いる「遺伝子発現マトリクス」という用語は、複数の遺伝子の同
時発現に関するデータを取得するためのデバイスを意味し、次の文献に記載され
ているものが含まれる:Lashkariら、Proc. Natl. Acad. Sci. USA、94、pp. 13
057〜62(1997);DeRisiら、Science、278、pp. 680〜86(1997);Wodickaら
、Nature Biotechnology、15、pp. 1359〜67(1997);Pietuら、Genome Resear
ch、6、pp. 492〜503(1996);Ashbyら、米国特許第5,549,588号。「ゲノムレ
ポーターマトリクス」は、特に、Ashbyらの遺伝子発現マトリクスを指す。
【0050】 「遺伝子発現プロフィール」という用語は、どのように構築されたか、また、
電子媒体その他に永久的もしくは一時的に保存されているかに拘わらず、データ
セットを意味する。このセットの各要素は、典型的には、遺伝子発現マトリクス
から取得される、細胞の個別かつ同定可能なオープンリーディングフレームの同
時発現の測度(measure)を表す。
【0051】 第1の形態では、本発明は、第1および第2遺伝子発現プロフィールの関連性
を数値化する方法であって、(a)該第1および第2遺伝子発現プロフィールに共
通して表示される各遺伝子について、第1および第2遺伝子発現信号をそれぞれ
発生させ;(b)第1および第2遺伝子発現信号の各対について相対発現スコアを
定式化し;次に、(c)対毎の相対発現スコアから、合成スコアを算出することを
含んでなり、その際、該合成スコアが、上記2つの遺伝子発現プロフィールの関
連性を数値化する、工程を含む上記方法を提供する。
【0052】 また、第1および第2遺伝子発現プロフィールの関連性を数値化する第2の方
法であって、(a)第1および第2遺伝子発現プロフィールに共通して表示される
各遺伝子について、第1および第2遺伝子発現信号をそれぞれ発生させ;次に、
共通して表示された上記遺伝子についての、第1および第2遺伝子発現信号対の
セットに線形回帰を実施することを含んでなり;その際、この回帰の相関係数が
、上記2つの発現プロフィールの関連性を数値化する、ことを特徴とする上記方
法も提供する。
【0053】 さらに、本発明は、複数の遺伝子発現プロフィールと、予め選択しておいた1
つの遺伝子発現プロフィールとの関連性に順位をつける方法であって、(a)前記
2つの方法のいずれかを用いて、予め選択した遺伝子発現プロフィールに対する
、複数の遺伝子発現プロフィールの各々の関連性を対毎に数値化し、次に、(b)
これらの対毎に測定した量に順位をつけることを含んでなる、上記方法を提供す
る。この方法に関して、本発明の好ましい実施形態では、対毎に行う関連性の数
値化は、ここに新たに記載する2つの方法のうちの一つに従って、実施する。
【0054】 これら方法の各々は、図面を参照しながら、以下に行う詳細な説明から、さら
によく理解されるであろう。
【0055】初期発現データからの個別遺伝子発現信号の発生 図1は、遺伝子発現プロフィールの定量分析に適した遺伝子発現信号が、初め
遺伝子発現マトリクスから最初に取得した信号から得られるプロセスを示すフロ
ーチャートであり、図1Aは、初期信号プロセシングの概要を表し、図1Bは、
環境適合制御に従って、後に行う任意の補正を示す図である。
【0056】 四角(116)で囲んだ初期データ取得工程は、図示したように、逐次的に実施
してもよいし、あるいは、同時に実施してもよい。デジタル化(101)は、信号
取得デバイスそのものによって、もしくは個別のアナログ・デジタル変換器によ
って実施してもよいし、あるいは、直接デジタル形式で発現データを取得するこ
とにより、省くこともできる。
【0057】 後のデータ操作工程(図1A、1B、5および6に示したものを含む)の各々
は、コンピュータ科学技術の当分野で周知の方法を用いて、プログラムできるデ
ジタル・コンピュータで達成することができる。あるいは、これら工程のいくつ
かは、当業者には周知のアナログ電気回路を用いて達成してもよい。また、これ
ら工程は、工程の時間的順序が観測されるものであれば、単一の計算デバイス、
一連の計算デバイス、もしくは、全域並列分散型多重計算デバイス(distribute
d in parallel across multiple computing devices)で実施することもできる
。このプロセスは、図示したように、連続的に実施してもよいし、あるいは、例
えば、後の処理のために確認される工程で、中間値を保存しながら、不連続的に
、実施することができる。
【0058】 デジタルコンピュータのプログラミングに関しては、図1、5、6、9および
10で示した工程を、当分野で周知の、より高水準の言語のいずれかにコード化す
ることができる。このような言語として、FORTRAN、BASIC、Pascal、C、C+、C+
+、Java(商標)等があるが、これらに限定されるわけではない。図に示し、か
つ、本明細書中の実施例に表示した結果は、C言語にプログラミングしたデジタ
ル・コンピュータを用いて得られたものである。あるいは、図1、5、6、9お
よび10で示した工程をアセンブリ言語に直接コード化してもよい。また、これら
工程の多くは、サブルーチン、マクロ、または、その他、JMP(登録商標)(SAS I
nstitute)もしくはUNISTAT(登録商標)統計パッケージ(Unistat, Ltd.)等の市
販されている統計分析プログラム、あるいは、Mathematica(商標)(Wolfram R
esearch, Inc.)等の数学機能を備えたプログラムに含まれるものを用いて達成
することも可能である。プログラミング言語の選択は、当業者が、十分にその技
術で実施することができる。
【0059】 図1に示すように、発現データは、まず、特定の遺伝子発現マトリクスに適し
た形態および方式で、初期発現信号として取得される(100)。例えば、Ashbyら
の発現マトリクスでは、走査レーザにより、蛍光データを取得することができる
。初期発現信号は、発現マトリクスの物理的位置の各々について個別に取得され
、マトリクス要素とも呼ばれる。これらの初期発現信号は、選択した環境条件下
で、マトリクスにおいて個別にアッセイされた遺伝子各々の発現レベルを表示す
る。
【0060】 また、初期バックグラウンド信号は、典型的に、遺伝子発現マトリクス上の1
つ以上の対照位置から、ほとんどの場合、同時に取得される。このようなバック
グラウンド対照の特性は、物理的マトリクスの種類に応じて異なる。例えば、蛍
光標識もしくは放射線標識した核酸のハイブリダイゼーションを測定するマトリ
クスは、このような対照として、核酸を全く含まないマトリクス上の1つ以上の
位置、または、既知ORFに相補的ではない核酸を含有するマトリクス上の1つ以
上の位置、あるいはその両方からの測定値を含み得る。同様に、形質転換した細
胞内の組換えレポーターからの発現を測定するマトリクス(例えば、Ashbyら、
前掲参照)は、このような対照として、組換えレポーター構築物を欠失した細胞
を含有するマトリクス;レポーター遺伝子を発現することができない組換え構築
物を含む細胞を含有するマトリクス;レポーター構築物は含むが、必要な基質を
欠失した細胞を含有するマトリクス等の上の1つ以上の位置からの測定値を含ん
でもよい。
【0061】 バックグラウンド対照要素は、典型的には各マトリクスに含まれるが、バック
グラウンド測定値は、個別の物理的マトリクスから取得することもできるし、あ
るいは、類似したマトリクスから事前に保存したデータ値を参照することにより
、記録から取得することさえできる。このような対照の種類と数の選択は、十分
、当業者の能力の範囲にある。
【0062】 典型的には例えば蛍光の強度を表示するアナログ信号として取得された初期発
現信号および初期バックグラウンド信号は、次に、デジタル化され(101)、そ
れぞれ、初期信号値および初期バックグラウンド値として、電子的に保存される
。あらゆる好適な表、マトリクス、もしくは表計算フォーマットを用いて、これ
らのデータを保存することができ、これらを集合的に、遺伝子発現プロフィール
と呼ぶ。これらのデータは、ランダムアクセスメモリ中の値等の非持久データと
して保存してもよい。あるいは、磁気、光、もしくは光磁気記憶媒体等に、より
永久的にデータを保存することもできる。
【0063】 発現マトリクスの各個別要素についての初期信号値が、対応する多次元データ
マトリクス中のその位置、データそのものの各成分に対するヘッダ情報の追加、
あるいは、当業者には公知のその他の適切な手段のいずれを用いても、それぞれ
個別に同定されることは認識されよう。例えば、単一の物理的マトリクス要素の
蛍光強度は、多重フィールドを備えた単一レコードにより表示することができる
が、これらフィールドの1つ以上が、信号の物理的起点、データ取得の日付と時
間、実験実行の識別子等を同定する。
【0064】 さらに、初期発現信号のダイナミックレンジは、発現マトリクスのフォーマッ
ト、特に、発現レポーターのダイナミックレンジおよび取得デバイスの感度レン
ジが課す物理的範囲によって設定されることは理解されよう。また、アナログ信
号は、8ビット、16ビット、32ビット等、変動する深度のデジタルデータによる
初期信号値として表示され得ること、そして、データ深度が大きいほど、コード
化され得る識別強度は細かくなるが、それらデータの記憶要件も大きくなること
が理解されるだろう。従って、データ深度の選択は、当業者にはよく理解される
経験による要件に基づいて為されることになる。さらにまた、初期デジタル化は
、1つのデータ深度を用いて実施し、後の分析を、これより浅い深度のデータで
行い得ることも理解されよう。後者の場合、簡単な線形変換を用いて、データ深
度を小さくすることも可能である。
【0065】 好ましい手法では、浮動小数点数を使用する。
【0066】 多くのマトリクス位置からの初期発現信号は低い(すなわち、バックグラウン
ドと同じか、これを下回る)可能性があるため、必ずしも必要ではないが、好ま
しくはバックグラウンド補正(118)を実施することができる。このような補正
を行うためのいくつかの方法が、当分野で知られている。ある手法では、測定さ
れた(もしくは記録上の)バックグラウンド値を、入力の元の値とは関係なく、
各初期信号値に加える。別の手法では、測定バックグラウンド値の1/2を各入力
値に加える。
【0067】 これらの公知の手法のいずれか、もしくは、その他の適した手法を使用するこ
ともできるが、次の手法が好ましい。各初期信号値を、初期バックグラウンド値
を比較する(102)。信号値が、バックグラウンド値と等しいか、これより大き
ければ、補正は行わず、変数Signalは、初期信号値を割り当てる(106)。これ
に対し、初期信号値がバックグラウンド値より小さい場合には、Signalには、バ
ックグラウンド値を割り当てる(104)。
【0068】 この好ましい手法は、バックグラウンド補正の従来の手法のいずれよりも保存
性が高い。第1信号値であるAが0、第2信号値であるBがバックグラウンド値
(BKG)に等しいと仮定する。BKGを各信号値に加える第1の手法では、Aの値は
BKGに等しくなり、Bの値は、BKGの2倍になる。従って、Bを人為的に、Aの値
の2倍に設定する。BKGの1/2を各信号値に加える第2の手法では、AはBKGの1/2
になり、BはBKGの1.5倍になる。従って、Bの値を人為的に、Aの値の3倍に設
定する。好ましい手法では、AだけをBKGに合わせて調整し、BはBKGのままとす
ることから、補正後のBの値はAより大きくならない。
【0069】 バックグラウンド補正のためのこのような保存的手法を使用することにより、
できる限り多くの取得された遺伝子発現信号を用いて、1つ以上の遺伝子発現プ
ロフィールを数値的に関係させる合成スコアを生成するという本発明の目的が促
進される。
【0070】 従来の方法は、典型的に、遺伝子毎の発現レベルの変化を報告することにより
、細胞遺伝子発現の変化を評価してきた。このような遺伝子を多数同時に測定す
る場合にも、変化は、多次元データセットとして報告されていた。例えば、Lash
kariら、前掲を参照。しかしながら、いずれか1つの遺伝子の発現の変化、ある
いは、個別遺伝子のセットの発現の変化を見ると、測定誤差の存在のために、ご
くわずかしか変化しない発現信号の比較に、この方法を使用することができなく
なる。
【0071】 例えば、選択した多数の標準誤差を超えない発現レベルの変化は、無視するこ
ともまれではなかった。例えば、2倍、もしくは5倍、あるいは10倍より小さい
個別遺伝子の発現の変化を無視するのは異例のことではない。
【0072】 しかし、本発明は、このような無視される多くのデータが、それでもなお遺伝
子発現の真の変化を報告するものであり、従って、遺伝子発現プロフィールの比
較に有用な情報を寄与することができると認識する。例えば、図2、3および4
は、散乱プロットであり、プロットされた点の各々が、2つの同定された条件下
での、個別遺伝子の相対発現を報告している。これらの図について、以下にさら
に詳しく説明する。本発明の目的のために、認識すべき点は、スケールが対数で
あり、これらの図の水平および鉛直軸に記した目盛りマークは、1自然対数(e 1 、e2、e3、等)の間隔で設定されている。容易にわかるように、データの多
くは、両軸上の各方向の最初の目盛りマークによって画定される正方形内にある
。すなわち、このような変化と標準測定誤差とを識別することができないために
、1自然対数(約2.7倍)より小さい変化が無視されるとすると、上記正方形内
のデータのすべては、分析から排除されることになる。2自然対数(e2、すな
わち7.4倍)より小さい変化が無視されるとすると、各方向の第2目盛りマーク
により画定される正方形内の全データが、分析から排除されることになる。その
結果、図から明らかなように、有用なデータのほとんどが失われてしまう。
【0073】 本発明は、これらデータの使用を可能にする。1つの遺伝子の発現の小さな変
化の有意性は、標準誤差のサイズのために、測定できないかもしれないが、変化
の集合(collection)の有意性は実際に測定できる場合が多い。従来の方法が、
有意性の尺度として、標準誤差に注目したのに対し、本発明は、平均値の標準誤
差に注目する。概して、2つの異なる環境条件間と同様に、遺伝子発現の変化の
集合は、以下に詳しく説明するように、強力に相関する可能性がある。
【0074】 従って、バックグラウンド補正工程(141)を通じて、できる限り多くのデー
タを確保しておくために、前述した通り、バックグラウンドの保存的補正を使用
するのが好ましい。
【0075】 各マトリクス要素に対するSignalは、好ましくは、バックグラウンドに合わせ
て調整されているが、次に、正規化する(108)ことにより、分散を制御する。
この正規化は、他の同一の実験同士、すなわち、単一の発現マトリクスでのデー
タ取得実行同士、または複製(duplicate)マトリクスからの個別データ取得同
士と同様に行う。
【0076】 発現信号を正規化する有用性は、遺伝子発現マトリクスを用いた遺伝子発現の
高度な並列測定を可能にした進歩以前に、当業者にはよく認識されていた。従っ
て、例えば、ノーザンブロット分析による、個別遺伝子発現の測定は、同じブロ
ットに同時にもしくは逐次プロービングされる、アクチン等の構成ハウスキーピ
ング遺伝子のそれと、発現を比較することにより正規化されることが多かった。
このようにして、不均等なゲルローディングにより導入される変動性や、mRN
A純度の変動等は、制御することができた。
【0077】 従来の手法における制限は、対照基準として選択された個別遺伝子そのものの
発現が変動する可能性があることである。この問題は、本発明において、「ハウ
スキーピング遺伝子」のそれを含む細胞の遺伝子発現全体を測定したいという要
望、ならびに、先験的に作用を予測できない薬物の存在下で、遺伝子発現の変化
を測定したいという要望により、いっそう大きくなった。
【0078】 信号を正規化して、実験間の変動性を制御するためのいくつかの方法が存在す
る。ある手法では、すべての遺伝子全域にわたるメジアン信号が一定であると仮
定し、別の手法では、信号の二乗平均平方根に正規化し、また別の手法では、信
号値の平均対数に正規化する。平均対数に正規化する後者の方法は、大きさが平
均信号値から最も遠い信号であるアウトライアーを効果的に弱める。
【0079】 本発明で好ましい方法は、すべての遺伝子全域にわたり平均信号が一定である
と仮定するものである。従って、正規化は、108(図1A)で示すように、全信
号の和で各信号を割ることにより達成される。
【0080】 しかし、平均遺伝子発現信号が、一定であるという仮定は、細胞の発現遺伝子
のわずかな百分率だけを評価する場合には、有効ではないかもしれない。従って
、遺伝子発現プロフィールの初期生成のため、後の定量分析のため、もしくは初
期取得および後の分析の両方のために、遺伝子の小さなサブセットを選択する場
合には、正規化工程を任意で省いてもよい。従って、以下の実施例5に記載され
る定量分析の間、正規化工程(108)を96遺伝子サブセットの分析から省いた。
この正規化工程を省いたのは、一定の平均発現の仮定が有効でないと判明する可
能性があるためである。
【0081】 数値化遺伝子発現プロフィール分析のための個別信号値を用意する最終工程11
0として、各信号値の対数を用いる。すなわち、Signalは、Signal値の対数とし
て割り当てる。自然対数が好ましいが、log10を使用してもよい。
【0082】 信号値の対数を用いて、比較分析を実施することには、3つの利点がある。第
1に、対数値への変換によって、発現レベルの同値倍変化を、この変化が発現の
増加または減少のいずれであっても、同等に評価することができる。
【0083】 例えば、初期値1からの10倍減少および10倍増加を考慮する。0.1単位への10
倍減少は、0.9単位の絶対減少である。10単位への10倍増加は、9.0単位の絶対増
加である。増加の絶対値、9.0は、0.9単位の絶対10倍減少よりも、はるかに大き
い遺伝子発現の変化に見える。これに対し、各値のlog10を求めると、三つの値
について、−1、0、および+1の値が得られ、増加および減少が同等に有意に
みえる。
【0084】 対数値を算出するもう一つの利点は、付随的ではあるが、発現プロフィールの
データセットの品質を直接評価できることである。すべての遺伝子について算出
した対数比は、2つの複製プロフィールを比較する場合、ランダム測定誤差から
の正規分布に従い、ゼロ前後に分布すると思われる。従って、標準統計測度によ
り、異なる実験同士と同様に、測定値の再現性の度合いを数値化することができ
る。
【0085】 対数値を用いる第3の利点は、対数目盛り上に値をプロットすることが、図2
〜4(以下参照)に示すように、データの視覚的表示に利点をもたらすことであ
る。
【0086】 工程(110)で終わる図1Aのプロセスによって生じたSignalは、図5および
6に概略を示した遺伝子発現プロフィールの定量分析での使用に適している。し
かし、図1Bに示したように、一連の追加工程を実施するのが好ましい。
【0087】 薬剤は、有機溶剤等の各種溶剤中で調製することができる。これらの溶剤は、
それ自体が、遺伝子発現に様々に影響する。従って、細胞の培地に薬剤を導入し
たことによって生じる遺伝子発現プロフィールの変化には、(1)薬剤が引き起こ
した変化と、(2)溶剤が引き起こした変化とが含まれる。図4および表7(以下
参照)に示すように、培地そのものも変化に貢献する可能性がある。さらに、ア
ッセイされる細胞同士のように、菌株もしくは細胞タイプの相違も存在する場合
がある。
【0088】 これらの環境による作用を制御し、従って、被検薬剤の作用に起因する可能性
のある遺伝子発現の変化だけに、後のプロフィール比較の的を絞るために、図1
Bに詳細を示すように、溶剤適合、培地適合、ならびに、好ましくは、菌株適合
対照から、信号を差し引く必要がある。
【0089】 最初に、適合させた対照発現マトリクスから、初期発現信号および初期バック
グラウンド信号を取得する。例えば、アクチノマイシンD(表1および2、後述
)の溶液中のメタノールの存在により引き起こされる遺伝子発現プロフィールへ
の作用に対する対照として、他の同一の発現マトリクス(ゲノムレポーターマト
リクス等)を同じ濃度のメタノールだけで処理し、そこから初期発現信号および
初期バックグラウンド信号を取得する。
【0090】 次に、図1Bに示した各遺伝子について、環境的に適合させた対照のための補
正を個別に実施する。
【0091】 まず、実験マトリクスから取得した遺伝子のSignal 130から、適合対照マトリ
クスからの遺伝子の信号(Signalmc 132)を引く。
【0092】 次に、正規化が行われる前の事前のバックグラウンド補正118によって導入さ
れた人工的(artifact)補正を、2つの決定クエリ(136および140)に取り組ま
せなければならない。これらのクエリは、逐次的にどんな順序で行ってもよいが
、より典型的には、単一の命令行で達成することができる。
【0093】 補正されたSignal 134がゼロより小さい場合、すなわち、Signalmc 132が、実
験Signal 130を超える場合には、正規化の前のバックグラウンド補正(104)の
間、Signalmcが、人為的かつ人工的に増加され、Signalmcの真の値は、実際、Si
gnal 130より小さいか、これに等しくなる可能性がある。従って、第1の決定ク
エリ136は、補正されたSignal 134が、ゼロより小さいかどうかと、Signalmc
、工程(102)で、そのバックグラウンドより小さかったかどうかを尋ねる。第
1決定クエリ(136)が、真と回答すれば、補正されたSignalは、ゼロに設定さ
れる(138)。すなわち、補正されたSignalが実であるかを決定することができ
ないため、値をゼロに設定することにより、このSignalを後の分析から排除する
のである。
【0094】 同様に、補正されたSignal 134がゼロより大きい、すなわち、実験Signal 130
が、適合された対照Signalmc 132を超える場合には、正規化の前のバックグラウ
ンド補正104の間、実験Signal 130が、人為的かつ人工的に増加され、Signal 13
0の真の値は、実際、Signalmcより小さいか、これに等しくなる可能性がある。
従って、第2決定クエリ140が、真と回答すれば、補正されたSignalは、ゼロに
設定される(142)。
【0095】 図2、3、および4は、図1Aおよび図1Bに示した工程等で、前述のように
処理した遺伝子発現データの散乱プロットである。
【0096】 図2〜4のデータは、ゲノムレポーターマトリクスが発生した初期発現信号か
ら得られたものである(詳細は、以下の実施例を参照)。図2は、構造および機
能が密接に関連することが知られている2つの化学療法剤:ダウノルビシンとド
キソルビシンの一方を用いて、個別に処理したマトリクスから得られたデータを
プロットした図である。図3は、構造および機能が異なる2つの薬剤:化学療法
剤であるドキソルビシンと、抗菌剤であるミコナゾールの一方を用いて個別に処
理したマトリクスから得られたデータをプロットした図である。図4は、構造は
異なるが、機能が関連する2つの薬剤:マイコフェノール酸とダウノルビシン(
いずれもDNA合成を阻害する)の一方を用いて個別に処理したマトリクスから
得られたデータをプロットした図である。
【0097】 図2、3および4のグラフにプロットされた点の各々は、特定遺伝子の発現を
表示し、X座標は、1つの薬剤(図2ではドキソルビシン、図3ではドキソルビ
シン、図4ではダウノルビシン)の存在下で得られた信号から算出した値を、ま
たY座標は第2の薬剤(図2ではダウノルビシン、図3ではミコナゾール、図4
ではマイコフェノール酸)の存在下で得られた信号から算出した値をそれぞれ記
す。
【0098】 図2、3および4の目視検査は、薬剤発見を容易にするための発現プロフィー
ル分析の有用性を示すと共に、これらの図に表示された関連性(非関連性)の極
値で、前述のように処理されたデータの臨時の(casual)定量分析でさえ有用で
あると判明したことを明らかにした。
【0099】 例えば、図2では、臨時の検査から、2つの薬剤が、ほとんどの酵母遺伝子の
発現に、同一でなければ、同様に影響することが容易にわかる。すなわち、発現
がダウノルビシンにより増加した各遺伝子は、ドキソルビシンによっても同等に
増加され、発現が、ダウノルビシンの処理により減少した各遺伝子は、ドキソル
ビシンの処理により同等に抑制され、また、発現が、ダウノルビシンの処理によ
り影響を受けなかった遺伝子は、ドキソルビシンによっても同様に影響されない
。その結果、データの点のほとんどが、原点を通る線上に位置する。
【0100】 対照的に、互いに関連のない薬剤である、ドキソルビシンとミコナゾールを用
いて生成された遺伝子発現プロフィールから同様に記したデータは、はるかに異
なるパターンを形成する(図3)。図3に示すように、遺伝子の発現が、両薬剤
により増加するものもあれば(右上4分円内の点)、薬剤それぞれの処理により
減少するものもあり(左下4分円内の点)、また、薬剤により反対の影響を受け
る遺伝子発現もある(左上および右下4分円内の点)。
【0101】 図4は、異なる作用機構によってではあるが、両薬剤がDNA合成に影響する
ことが知られる中間のケースを示す。
【0102】 このように、薬剤関連性の数値化評価が可能になる。図2に示すものに類似し
た散乱分布を生成するこれらの薬剤(もしくはその他の環境条件)は、作用が密
接に関連している。図3に示したものに類似した分布を生成するものは、作用に
関連はない、また図4に示したものに類似した分布を生成するものは、いくらか
関連があるものの、異なる作用機構を有する。
【0103】 効力が既知のリード化合物を仮定すると、誘導体および類似体を選別すること
により、専用の生化学的アッセイに頼ることなく、類似した活性を有するものを
同定することが可能になる。実際には、リード化合物の作用機構を知る必要さえ
ない。しかし、このような分析の可能性は、関連性のパターンを認識する能力に
よって制限される。問題は、図2および3に示す極値では最小限であるが、図4
に示すような中間ケースではより明白になる。本発明は、遺伝子発現プロフィー
ルの関連性の再現可能な数値化評価を提供することにより、この問題に取り組む
。本発明は、さらに、2つ以上の化合物の分析を可能にし、遺伝子発現プロフィ
ール関連性の格付け順位を賦与することができる。
【0104】A合成スコアの生成により、遺伝子発現プロフィールの関連性を数値化する方法 本発明は、第1および第2遺伝子発現プロフィールの関連性を数値化する方法
であって、(a)該第1および第2遺伝子発現プロフィールの各々について、第1
および第2遺伝子発現信号を生成し;(b)第1および第2遺伝子信号の各対につ
いて、相対発現スコアを定式化した後;(c)上記対毎の相対発現スコアから、合
成スコアを算出することを含んでなり、その際、該合成スコアが、2つの遺伝子
発現プロフィールの関連性を数値化する、ことを特徴とする上記方法を提供する
【0105】 この方法の第1工程については、図1Aおよび1Bを参照にしてすでに説明し
た。以下に、第2および第3工程について、図5を参照にして説明する。
【0106】 概略的には、2つの遺伝子発現プロフィールに、共通して表示された各遺伝子
について、相対発現スコア(524)を個別に定式化する(528)。その後、このよ
うな個別遺伝子相対発現スコアすべての集合から、合成スコアを算出する(526
)。この合成スコアは、2つの遺伝子発現プロフィールの関連性を数値化する上
で役立つ。
【0107】 図5に詳細を示したように、第1条件下の遺伝子に対する信号、Signal(500
)を入力する。この信号は、図1に記載した通りに、処理されている。前述した
ように、この処理は、図1Bに示した通り、環境適合対照の減算により、補正さ
れているのが好ましいが、この補正が必ずしも必要なわけではない。第2条件下
の同じ遺伝子に対する信号、Signal 2(502)は、同様に、図1に示した通りに
処理されており、差し引かれて、相対発現スコア(504)をもたらす。この信号
値入力は、対数値(110)であるため、その差は、発現比を表す。
【0108】 しかし、正規化の前の早期バックグラウンド補正(118)により導入された人
工補正)は、適合対照信号の減算後に既述したように、この地点で扱わなければ
ならない。
【0109】 この人工補正は、2つの決定クエリ(506および510)を用いて実施する。これ
らのクエリは、逐次的に、どんな順序で行ってもよいが、典型的には、単一の命
令行で達成することができる。
【0110】 相対発現スコアである、Score(504)が、ゼロより小さい(すなわち、Signal
2がSignal 1を超える)場合、Signal 2は、正規化の前のバックグラウンド補正
の間、人為的かつ人工的に増加され(104)、Signal 2の真の値が、Signal 1と
等しいか、これより小さくなる可能性がある。従って、第1の決定クエリ(506
)は、相対発現スコア(504)が、ゼロより小さいか、ならびに、Signal 2が、
工程(102)で、そのバックグラウンドより小さかったかである。第1決定クエ
リ(506)が真と回答した場合には、相対発現スコアは、ゼロに設定される(508
)。すなわち、相対スコアが、実であるかどうかを決定するのは不可能であるた
め、この値をゼロに設定することにより、該スコアが、合成スコア526に貢献し
ないようにする。
【0111】 同様に、相対発現スコア(504)が、ゼロより大きい(すなわち、Signal 1がS
ignal 2を超える)場合、Signal 1は、正規化の前のバックグラウンド補正の間
、人為的かつ人工的に増加され(104)、Signal 1の真の値が、Signal 2と等し
いか、これより小さくなる可能性がある。従って、第2のクエリ(510)が真と
回答した場合には、相対発現スコアは、このときも、ゼロに設定され(518)、
この相対スコアが、合成スコアに貢献しないようにする。
【0112】 次に、遺伝子毎の閾値比較を実施する(522)。各発現マトリクス法は、それ
自身の検出閾値を有しており、この閾値を下回ると、高い信頼度で、信号を測定
することはできない。例えば、Lashkariら(前掲)のオリゴヌクレオチド・ハイ
ブリダイゼーション・プラットフォームは、Ashbyら(前掲)の細胞ゲノムレポ
ーターマトリクスとは異なる閾値を有する。
【0113】 このような閾値は、経験に基づいて決定する。単純な手法では、非処理プラッ
トフォームの取得、または同じ薬剤により同様に処理した細胞からのプラットフ
ォームの取得のいずれかに関わらず、同一実験を2回実施する。すべての遺伝子
について算出した対数比は、2つの複製プロフィールを比較すると、ランダム測
定誤差のために、正規分布に従って、ゼロ前後に分布する(ただし、妥当な信号
雑音比があるものとする。信号が低ければ、バックグラウンド補正が分布を歪ま
せる)と考えられる。この分布の標準偏差は、適切な閾値を設定する指針を提供
する。
【0114】 従って、バックグラウンド人工補正のために補正された(514)、相対発現ス
コアの絶対値が、経験に基づいて設定された閾値(516)より小さい場合には、
割り当てられるScoreは、ゼロの値であり(518)、その後、このスコアが、合成
スコア(526)に貢献することはない。現在のところ、Ashbyらのゲノムレポータ
ーマトリクスから取得されるデータについて好ましい閾値は、0.7である。当業
者であれば、前述の統計法を用いて、経験的閾値を確立することができよう。さ
らに、技術が変化し、また、データを取得する者も、既存のデータ取得技術にさ
らに熟達していくことから、この経験的閾値も変化してゆくと思われる。以下に
示す実施例1〜4では、事前に収集したデータを用いて、1.0の閾値を適用した
【0115】 また、四角(522)で囲んだ工程によって、第1および第2遺伝子発現プロフ
ィール同士と同様に、遺伝子の発現における変化の方向を考慮する必要もなくな
ることに留意すべきである。これは、もちろん、必然的に、ユーザ規定の閾値を
超えなかったために、ゼロに設定されたScore(518)の場合である。残りのスコ
アについては、Scoreに、負ではないスコアの絶対値(520)を割り当てることに
より、指向性は排除される。従って、2つの処理の関連性を測定する際、遺伝子
の抑制の情報内容は、遺伝子の活性化のそれと同等に扱われる。すなわち、相対
変化の大きさだけが用いられる。
【0116】 従って、相対発現スコアがゼロに設定されるアルゴリズムには2つの段階があ
り、このようにして、データが、合成発現プロフィールスコアに貢献するのが防
止されることがわかる。四角(514)で共に囲まれる工程506、508、510および51
2では、バックグラウンド補正および正規化のために、相対スコアの方向が実で
あるかを正確に知ることができない場合、スコアはゼロに設定される。四角(52
2)で共に囲まれる工程516、518および520では、人工的ではないが、統計的にゼ
ロとは識別できない可能性がある場合、スコアはゼロに設定される。
【0117】 遺伝子毎に続行してゆくと、最終操作(524)が、生物の様々な遺伝子によっ
て現れる遺伝子発現の、異なるダイナミックレンジを補正する。例えば、条件の
変化がどんなに厳しくても、遺伝子発現の2倍変化だけを可能にする遺伝子もあ
れば、遺伝子発現の200倍変化を可能にする遺伝子もある。このようなダイナミ
ックレンジの大きい遺伝子が、比較分析を過度に歪めるのを防ぐために、事前の
全実験を通して、その遺伝子に観測された記録上最大発現の平方根の対数で、各
相対スコアを割る。524に示すように、工程(108)から出力された記録上最大信
号の対数平方根で、各相対発現スコアを割る。すなわち、その遺伝子について、
観測された記録上最大の正規化信号の対数平方根(対数の1/2)で、各相対発現
スコアを割るのである。当業者には理解されるように、各遺伝子の値は、発現マ
トリクス技術(配列のサイズ等)と、予め収集したデータの両方に左右され、場
合によっては、さらに実験を実施するほど変化することもある。
【0118】 工程(524)で、様々な遺伝子のダイナミックレンジを補正する別の実施形態
もある。
【0119】 ある実施形態では、工程(108)から出力された記録上最大の信号の対数平方
根(すなわち、最大の正規化信号)で、各相対発現スコアを割るが、この場合、
正規化を達成するために選択した値(工程(108)の「ΣSignals」)が、最初の
手法とは異なる。この手法については、以下の実施例5で例示し、詳しく説明す
る。
【0120】 さらに別の実施形態では、工程108に入力された記録上最大の信号の対数平方
根で、各相対発現スコアを割る。すなわち、その遺伝子について、観測された記
録上最大の正規化信号の対数平方根(対数の1/2)で、各相対発現スコアを割る
のである。これは、特に、正規化が不適切であることが判明した状況で、好まし
いと考えられる。
【0121】 あるいは、対数平方根で割るのではなく、最大対数信号の絶対値(magnitude
)(正規化もしくは非正規化されたいずれのものでも)で割ることもできる。本
発明の方法で最大信号の平方根を選択する理由は、所定タイプの誤差が、信号の
平方根に従って変動するためである。平方根補正の対数は、さらに有用な発現プ
ロフィール比較をもたらすことがわかった。
【0122】 別の手法では、発現が最も変動する遺伝子が、生物学的により重要である、あ
るいは、少なくとも、環境条件の関連性を評価する上で、より有意であるという
仮定のもとに、補正を全く行わない。
【0123】 また別の形態では、実施する分析に対し、経験に基づいて決定した有意性に応
じて、様々な遺伝子をそれぞれ別様に処理する。例えば、遺伝子の大部分を前述
の通り処理し、事前の実験すべてを通して、その遺伝子に観測された記録上最大
の発現の平方根の対数で割る。これに対し、予め決定しておいた特定遺伝子のサ
ブセットは、この工程で、別様に処理し、後の分析でのその有意性を増加もしく
は低下させる。
【0124】 第1および第2遺伝子発現プロフィールに共通して表示された遺伝子の各々に
ついては、四角(528)で全体を囲んだ、前述の工程に従う。原核生物、または
、酵母等の微小な真核生物における遺伝子発現を測定するマトリクス等のいくつ
かの発現マトリクスについては、全部、もしくはほぼ全部のオープンリーディン
グフレームをこのように比較することができる。哺乳動物細胞を用いた他のプラ
ットフォームについては、多数、恐らく全数の遺伝子が評価されるだろう。明ら
かに、第1および第2環境条件同士と同様に、共通して測定された遺伝子だけを
使用して、相対遺伝子発現スコアを生成することができる。
【0125】 合成スコアとも呼ばれる最終のスカラ測度は、スコア値に、2つの条件の遺伝
子発現プロフィールの関連性を表すもので、総和により算出される(526)。得
られた数が小さいほど、2つの比較される条件下での遺伝子発現プロフィールは
、密接に関連するが、このとき、完全な同一性では、ゼロの値が得られる。
【0126】 これ以上の補正は必要ないが、スコアに使用可能に(usably)貢献した遺伝子
の百分率について、上記総和を任意で補正することが好ましい。
【0127】 使用不可能ということが判明した、すなわち、ゼロへの相対Scoreの割当て(5
08および512)によって、四角(514)で囲まれた工程で除去される遺伝子の百分
率は、合成スコアに影響を及ぼす。従って、使用不可能な遺伝子の任意の補正(
526)では、相対発現Scoreの単純な総和に、遺伝子数を使用可能な遺伝子で割っ
て得られる比を掛ける。
【0128】 以下の実施例1〜4に示す分析を、864個のレポーターを用いて、マトリクス
から取得した遺伝子プロフィールについて実施した。図5には示していないが、
工程(526)から得たスコアは、任意で正規化することにより、遺伝子1000個毎
の相対発現スコアを表すことができ、サイズの異なるマトリクスからの比較を可
能にする。この正規化を達成するために、さらに、相対プロフィールスコア(52
6)に、使用したマトリクス中の遺伝子の総数で1000を割って得られる比を掛け
る。
【0129】 上記の方法によって、2つの遺伝子発現プロフィールの関連性に数値的に順位
をつけることができる。得られた合成スコアが低いほど、プロフィール同士の関
連性は高い。関連性が高いほど、これら遺伝子発現プロフィールが得られた2つ
の異なる条件下での、細胞の全体的遺伝子発現状態が、強く関連している。
【0130】 このように、細胞の全体的遺伝子発現に対する2つの環境条件の関連性を数値
的に評価することができる。この環境条件は、例えば、以下の実施例4でさらに
詳しく示すように、異なる培地でのインキュベーションでもよい。あるいは、2
つの異なる環境条件は、医薬製剤候補等の2つの異なる化学薬品による処理を含
んでもよい。このとき、合成スコアによって報告されるその遺伝子発現プロフィ
ールの関連性が、薬剤の作用の関連性を示すのである。本発明のこの実施形態は
、実施例1〜3に示す。
【0131】 また、この方法を数値的に用いて、予め選択しておいた環境条件と、細胞の規
定遺伝子突然変異を関連づけることも可能であり、この方法は、(a)突然変異を
有する細胞から第1遺伝子発現プロフィールを取得し、予め選択しておいた環境
条件下で野生型細胞から第2遺伝子発現プロフィールを取得した後;(b)第1お
よび第2遺伝子発現プロフィールの関連性を数値化する工程を含んでなる。
【0132】 本発明のこの形態の好ましい態様では、発現データが野生型細胞から取得され
る環境条件が、選択した化学化合物への暴露を含む。規定突然変異で開始する場
合、この手法によって、遺伝子の突然変異をその作用で模倣する薬剤候補を数値
的に同定することができる。反対に、重要な医薬製剤の遺伝子発現プロフィール
で開始する場合には、薬剤の作用を模倣する突然変異を、その遺伝子発現プロフ
ィールと、薬剤の存在下で得られたプロフィールとの数値的関連性によって同定
することができる。その結果、薬剤の作用を直接および間接的に被るすべての標
的の同定によって、薬剤作用の機構が解明される。さらに、2つの突然変異は、
不在の別の薬剤の各々から得られる遺伝子発現プロフィールと数値的に関連づけ
ることにより決定することができる。
【0133】 遺伝子の突然変異の分析に、本発明の数値化方法を応用する場合、細胞は、好
ましくは、酵母細胞で、さらに好ましくは、ビール酵母菌である。酵母は、この
目的、ならびに、遺伝子の突然変異の関連性が評価されるその他の用途において
、特に好ましい。その理由は、(1)ビール酵母菌の全ゲノムは配列決定されてお
り、(2)ターゲッティングされた欠失または挿入が、相同的組換えにより容易に
実施でき、また(3)酵母およびヒト間と同様に、多くの基本代謝経路が高度に保
存されているためである。例えば、Lashkariらの記載を参照されたい。しかし、
この方法は、他の原核生物もしくは真核生物の細胞で突然変異を同定するいずれ
の場合でも、さらに広範に適用することができる。
【0134】 以上述べた説明は、特に、第1および第2遺伝子発現プロフィールを数値的に
関連づける方法に関するが、本発明はまた、複数の遺伝子発現プロフィールの関
連性に順位をつける方法も提供する。
【0135】 複数の遺伝子発現プロフィールの関連性に順位をつける順位付けを達成するた
めに、一連の合成スコアを算出し、その各々を用いて、共通の指標、すなわち、
基準、プロフィールとの関連性を測定する。その後、この合成スコアに順位をつ
けるが、スコアが低いほど、指標プロフィールとの関連性が大きいことを意味す
る。このように順位をつけた順位付けを以下の表に示した。
【0136】 従って、本発明は、複数の環境条件と、1細胞に関して予め選択しておいた1
つの環境条件との関連性に順位をつける方法であって、(a)該細胞、もしくは、
遺伝子型が同一の細胞から、上記複数の環境条件の各々と、上記予め選択してお
いた環境条件について遺伝子発現プロフィールを取得し;(b)上記複数の遺伝子
発現プロフィールの各々と、上記予め選択しておいた遺伝子発現プロフィールと
の関連性を対毎に数値化し;(c)これら対毎に測定された数量に順位をつけるこ
とを含んでなる、上記方法を提供する。好ましい実施形態では、上記環境条件の
1つ以上が、化学化合物に対する細胞の暴露を含む。
【0137】 同様に、本発明は、複数の環境条件の各々と、1細胞の規定遺伝子突然変異と
の関連性に順位をつける方法であって、(a)上記複数の環境条件の各々の下で、
野生型細胞から、第1遺伝子発現プロフィールのセットを、また、上記規定突然
変異を有する細胞から、第2遺伝子発現プロフィールを取得し;(b)上記第1遺
伝子発現プロフィールの各々と、上記第2遺伝子発現プロフィールとの関連性を
対毎に数値化し;(c)これら対毎に測定された数量に順位をつけることを含んで
なる、上記方法も提供する。
【0138】 同様に、本発明は、複数の遺伝子突然変異の各々と、1細胞の規定もしくは予
め選択しておいた細胞の突然変異との関連性に順位をつける方法であって、(a)
各々が、上記複数の遺伝子突然変異の1つを有する細胞から、第1遺伝子発現プ
ロフィールのセットを、また、上記予め選択した突然変異を有する細胞から、第
2遺伝子発現プロフィールを取得し;(b)上記第1遺伝子発現プロフィールの各
々と、上記第2遺伝子発現プロフィールとの関連性を対毎に数値化し;(c)これ
ら対毎に測定された数量に順位をつけることを含んでなる、上記方法をも提供す
る。
【0139】 線形回帰による遺伝子発現プロフィールの関連性の数値化方法 合成スコアー(composite score)、ひいては図5の手順により与えられる関連
性の順位付けがアウトライナー(outlier)、すなわち発現が2つの測定条件間の
ように実質的に変化する遺伝子、により実質的に加重化(weighted)される。これ
は種々の遺伝子の発現の動的範囲についての補正、524、ならびに図5中のボッ
クス522により境界を画された、工程516、518、および520からの結果にもかかわ
らず真実であり、この場合、データ包含に関する閾値要件の適用が測定条件間の
ような発現の変化が小さい遺伝子による寄与を低減する。このようなバイアス(b
ias)の利点はそれが表現型変化に最も実質的に寄与する遺伝子の順位付けに焦点
を合わせることである。
【0140】 図6は遺伝子発現プロフィールを定量的に関連付ける代替法、すなわち、この
ような変化の大きさではなく、その代わりに個々の遺伝子発現の変化の方向のコ
モナリティーに関する関連性の順位付けを加重化する方法を示す。図6に示され
た方法は図5に示された方法に対して幾つかの利点、特に小さい濃度の医薬製剤
を使用して得られた遺伝子発現プロフィールを正確に関連付ける能力を提示し、
今では温和な治療条件、たとえば低濃度の薬物のもとに得られたプロフィールの
関連性を数値化するのに好ましい。しかしながら、図5の方法は、一層苛酷な治
療条件、たとえば高濃度の薬物による治療のもとに得られた遺伝子発現プロフィ
ールの関連性を数値化するのに依然として好ましい。図5に示されたアルゴリズ
ムまたは図6に示されたアルゴリズムの使用間でのような選択は結果の比較後に
経験的になされてもよく、このような選択は当業界の技術の範囲内にある。
【0141】 この代替法の詳細を説明する前に、2つの方法間の概念上の相違が図2の撒布
プロット(scatter plot)を考慮することにより最も良く視覚化し得る。上記のよ
うに、図2は2種の密接に関連する抗腫瘍化学療法薬で個々に処理された酵母細
胞中の異なる遺伝子の相対的遺伝子発現を撒布プロットとして示す。先に説明し
たように、処理は密接に関連することが見られ、それぞれが個々の遺伝子発現の
方向および大きさの両方に均等に影響する。その結果、点の殆どが起点を通る線
の上にほぼ存在する。理想的な条件(バックグラウンド、ノイズ、およびその他
の変化のいずれも不在)が一連の発現点(これらの全てが起点を通る線の上に正
確に存在する)を理論上生じるようであることが理解されるであろう。
【0142】 図5中の工程516、518、および520で適用された閾値(ボックス522により境界
を画される)は、図2中で、信頼区間に若干類似の、データから描かれた回帰線
から等距離の同じ傾斜の2つの平行な線として概念化し得る。工程516で経験的
に適用された閾値が低い程、閾値線がデータ回帰線に一層近接してあると考えら
れ、また外部にあるデータ点の数が大きい。工程516で経験的に適用された閾値
が高い程、閾値線がデータ回帰線から一層離れていると考えられ、また外部にあ
るデータ点の数が少ない。閾値線の外部にあるこれらの点のみが発現プロフィー
ルスコアーに寄与するので(工程518を520と比較のこと)、図5に示された方法
は、存在するこのような点が回帰線からの距離により実質的に影響される。
【0143】 対照的に、図6に示された方法は、データ点が治療の同一性を意味する理想的
に完全な回帰線に適合する程度に焦点を合わせる。直接回帰線の上にあるこれら
の点は、分析において最も有意でないということではなく、スコアーに実質的に
寄与する。遺伝子発現の変化の大きさを求めるのではなく、この方法はその代わ
りに遺伝子発現の変化の方向に焦点を合わせる。この方法は、実施例3に以下に
示されるように、比較される種々の薬物治療の濃度に感受性が低いことが立証す
る。
【0144】 図6は2つの遺伝子発現プロフィールの関連性を数値化するこの第2アプロー
チを図示する。
【0145】 図1に従って処理されたような、第1(シグナル1 600)および第2(シグナ
ル2 601)遺伝子発現プロフィールを通常代表するそれぞれの遺伝子に対する遺
伝子発現シグナルをインプットされる。シグナルは、図1Bに示されたアルゴリズ
ムに従って(条件を)一致させた対照について更に補正された。
【0146】 次に、操作610、611(図5に示された先のアルゴリズムにおいて工程524とし
て行われた操作に似ている)が生物の種々の遺伝子により証明された遺伝子発現
の異種の動的範囲について補正する。
【0147】 工程524に関して上記されたのと同じ動的範囲について調節するための別法が
ここでも同様に適用される。すなわち、シグナル600、601が工程108から履歴的
にアウトプットされた最高(正規化(normalization))シグナルの対数(log)平方
根により割られてもよく;工程108から履歴的にインプットされた最高シグナル
の対数平方根により割られてもよく;工程108に履歴的にインプットされた最高
(非正規化)シグナルの対数平方根により割られてもよく;対数平方根ではなく
、最高シグナル(正規化または非正規化)の対数(log)により割られてもよく;
動的範囲について補正を全くしないで、未変化のままであってもよく;または実
験的に選択された値を使用して個々に調整されてもよい。以下の実施例5に例示
され、更に説明される、更なる別法は遺伝子の更に大きい組から選択された正規
化に使用された値を用いて、最高正規化値の対数平方根により割ることにより分
析における遺伝子の全ての動的範囲を調整する。
【0148】 次に、第1(シグナル1 610)および第2(シグナル2 611)発現シグナルが
関連付けられて620、それぞれの遺伝子について、2次元座標を与える。対にさ
れたデータの収集に関する線形回帰625(2つの遺伝子発現プロフィールを通常
代表する全ての遺伝子の発現を表す)がその後に2つの遺伝子発現プロフィール
の関連性の定量的測定を与えるスコアー626を与え、大きい数値ほど関連性の一
層近い程度を示す。相関関係係数それ自体は、その任意の倍数(multiple)であっ
てもよいように、スコアーとして使用し得る。以下の実施例に示されたスコアー
は更に相関関係係数に100を掛けることにより導かれた。
【0149】 こうして、第1アルゴリズム(図5)を、それぞれの遺伝子に関する第1およ
び第2発現シグナルを単一スカラー値504(第1および第2発現プロフィールの
間の発現の比を表す)に壊して、その後にこれらの値を加算して合成スコアーを
得、本アルゴリズムが最終工程までこれらの値を別の座標として保持する。
【0150】 それぞれの通常代表された遺伝子に関する第1および第2シグナルが線形回帰
の目的のために関連付けられることを可能にするあらゆるデータ構造、たとえば
、単一2次元マトリックス、ベクトルの組、等が使用されてもよいことが理解さ
れるであろう。更に、2次元データによる最良に適合する理論線へのデータの適
合の近似性を報告するあらゆる統計方法が本発明に従って工程625および626にお
ける相対プロフィールスコアーの計算に使用し得ることが理解されるであろう。
当業者はこのようなデータ構造および統計方法を同定することができるとともに
このような計算をデジタルコンピュータでコードすることができる。このような
適合の近似性が本明細書に新たに記載される遺伝子発現プロフィールの関連性の
、信頼できる、再現できる、かつ容易な数値化を可能にすることは発見である。
【0151】 図6に記載されない、付加的な工程が必要により本方法に加えられてもよい。
【0152】 シグナル1 600およびシグナル2 601は506および510に示された照会と同じ照
会にかけられてもよい。すなわち、先のバックグラウンド補正および正規化が2
つの条件の間の発現の変化の方向の確定測定を潜在的に排除するか否かという質
問が課せられてもよい。そうである場合、すなわち、506または510で示された照
会が真実と返答する場合、遺伝子に関するシグナルが必要により線形回帰から省
かれてもよい。
【0153】 図6に記載された方法が、図5に示された方法と同様に、細胞の全体の遺伝子
発現に関する2つの環境条件の関連性を定量的に評価し;細胞の特定の遺伝子突
然変異についての予め選択された環境条件の関連性を定量的に評価し;また2つ
の異なる突然変異の関連性を定量化するのに使用し得る。更に、図6に示された
アルゴリズムおよび方法が、図5に示されたものと同様に、複数の遺伝子発現プ
ロフィール(異種の環境条件下で得られ、種々の突然変異を有する細胞から得ら
れ、またはこれらの組み合わせから得られた)の関連性に順位をつけるのに使用
し得る。
【0154】 上記のように、第1および第2遺伝子発現プロフィールを通常代表するそれぞ
れの遺伝子が遺伝子発現プロフィールに提示されたその他の遺伝子と同等に処理
され、図5に示されたアルゴリズムまたは図6に示されたアルゴリズムが適用さ
れる。しかしながら、1種以上の予め選択された遺伝子の発現の変化を差別的に
加重化して、分析におけるそれらの重みを増加または減少することが可能であり
、しばしば推奨されるであろう。このような重み付けは、たとえば、工程524ま
たは工程610、611でシグナルを調節することにより行われてもよい。
【0155】 データ格納(保存) 図5に記載された方法または図6に記載された方法を使用する、本発明のそれ
ぞれの実施形態について、データが図1、5、または6に記載されたプロセスに
おける中間点のいずれかまたは全てで任意の個々の遺伝子発現プロフィールにつ
いて格納し得る。任意の単一発現マトリックスから得られたデータが、たとえば
、工程101で得られたような生の係数化データとして、工程108で得られたような
バックグラウンド調整され、正規化(標準化)されたシグナルとして、工程110
で得られたようなバックグラウンド調節され、正規化(標準化)されたシグナル
の対数として、または工程112で得られたような(条件を)一致させた対照につ
いて充分に補正されたシグナルとして格納されてもよい。
【0156】 関連性の新しい比較--すなわち、図5のアルゴリズムに従う合成スコアーの新
しい計算または図6のアルゴリズムに従う相対的プロフィールスコアーの計算--
が先に得られ、格納されたデータを使用して行われてもよいことが理解されるで
あろう。こうして、付加的な実験が行われ、付加的なプロフィールデータが本明
細書に記載された種々の遺伝子発現マトリックスプラットフォームから得られる
につれて、更に多くのデータが記載された分析に利用可能になる。特に、多くの
薬物が全体の遺伝子発現に関するそれらの効果について試験されるにつれて、次
第に増える包括的データベースが確立され、それから比較がなし得る。
【0157】 それぞれが比較の目的に繰り返して参考にし得る特有の細胞状態を表す、遺伝
子発現プロフィールの格納は非生物物体の特有の状態を同定するスペクトル--NM
Rスペクトル、IRスペクトル、質量スペクトル、等--の編集に似ており、標準と
の比較が未知の化学構造の同定を可能にする。遺伝子発現プロフィールの比較が
同様の様式で使用し得る。逆に、本明細書に記載された方法および装置により与
えられる関連性の定量的評価が当業者により良く理解されているような変更によ
りこのようなその他のスペクトルに適用されてもよい。
【0158】 薬物発見および遺伝子発現プロフィールの数値化分析に関するその他の使用 本明細書に提供された数値化方法、システム、および装置は新薬発見アプロー
チを可能にする。遺伝子発現プロフィールの関連性を数値化することにより、化
合物が既知のメカニズムの薬物、既知の効力の薬物についての類似性について、
または特定の突然変異、条件、障害もしくは症状についての類似性について試験
し得る。
【0159】 薬物による標的細胞の処理は、その薬品により乱される主要な生物学的プロセ
スが何であろうとも、最終的に標的細胞中の遺伝子発現のパターンの変化をもた
らす。同様に作用する薬物は変化の同様のパターンを生じさせる。作用の類似性
が大きい程、遺伝子発現プロフィールの変化の類似性が大きい。その結果として
、遺伝子発現プロフィールの関連性を数値化する能力は細胞の遺伝子発現に対す
る同様の全体的な影響を及ぼす薬物;参考として、同様の作用のメカニズムを有
する薬物、の同定を可能にし得る。
【0160】 第1薬物の作用のメカニズムが知られている場合、標的細胞の遺伝子発現プロ
フィールの同様の変化に影響するその他の化合物の同定は生物学的作用の同様の
メカニズムを共有する付加的な化合物を同定し得る。第1薬物のメカニズムが知
られていないが、その薬物が所定の障害を治療するのに有効であることが知られ
ている場合、標的細胞の遺伝子発現プロフィールの同様の変化に影響する薬物の
同定は、同様に未知のメカニズムの薬物にもかかわらず、その病的状態を治療す
るのに同様に有効である薬物を同定し得る。
【0161】 こうして、遺伝子発現プロフィールの関連性を数値化することができることは
単離された製薬標的を同定し、専用のアッセイを開発し、次に専用のアッセイで
化合物をそれらの活性についてスクリーニングする現在の必要を省くかもしれな
い。
【0162】 更に、遺伝子発現プロフィールの関連性を数値化する能力は、薬物開発のその
後のステージにおける努力を促進して有望な薬物候補の作用の特異性を狭くし、
焦点を合わすことを可能にする。たとえば、先導化合物の薬理学的に有効な誘導
体が、上記のように、先導候補の遺伝子発現プロフィールとそれらの遺伝子発現
プロフィールとの定量的関連性に基づいて同定し得る。
【0163】 以下の実験的実施例は本発明の数値化方法のこれらの適用の幾つかを示す。
【0164】 実施例1では、アクチノマイシンDとの薬物の関連性を、その他の医薬製剤へ
の暴露後に得られた複数の遺伝子発現プロフィールと、アクチノマイシンDの存
在下で得られた遺伝子発現プロフィールとの定量的比較により評価した。上記ア
ルゴリズムのいずれかを使用して、種々の濃度のダウナルビシン、5-FUDR、ドキ
ソルビシン、5-FU、ヒドロキシ尿素およびミコフェノール酸を細胞(ここではS.
cerevisiae細胞)の全体の遺伝子発現に対する定量的に同様の作用を生じさせ
るものとして同定した。これらの製剤の全てが、アクチノマイシンDと同様に、
核酸合成に影響することが知られている。
【0165】 こうして、アクチノマイシンD単独の作用のメカニズムが知られたならば、そ
のデータはダウナルビシン、ドキソルビシン、ヌクレオチド類似体5-FUDRおよび
5-FU、ならびにミコフェノール酸をアクチノマイシンDの既知のメカニズムと同
様の作用のメカニズムを有する薬物として明示するであろう。アクチノマイシン
Dが核酸合成に干渉することを知れば、そのデータはダウナルビシン、ドキソル
ビシン、ヌクレオチド類似体5-FUDRおよび5-FU、ならびにミコフェノール酸がま
た核酸合成に影響し、それ故、癌の治療の化学療法製剤として有益であり得るこ
と、または病原体、特にウイルス病原体の生活環を中断するのに実用性を有し得
ることを示す。
【0166】 逆に、基準薬物ではなく、これらの製剤の全てのメカニズムが知られたならば
、これらのデータはアクチノマイシンDが核酸合成に干渉することを示し、その
メカニズムに有益な識見を与えるであろう。
【0167】 これらの識見は専用の核酸合成抑制アッセイを必要としなかったし、また薬物
についての分子標的の従来の同定を必要としなかったことが注目されるべきであ
る。そしてその結果として、同様の全体効果を有するが、異種の分子標的を有す
る薬物が同定された。
【0168】 実施例2および3は2種の濃度のうちの1つのダウナルビシンと複数の薬物と
の、全体の遺伝子発現の変化により測定された関連性を同様に評価し、再度、作
用の関連性が予め選択された基準薬物の構造またはメカニズムを知らないでも測
定し得ることを実証する。実施例4は本明細書に示された方法が全体の環境条件
の細胞に対する効果を数値化により関連付けるのに広く使用し得ることを実証す
る。
【0169】 遺伝子発現プロファイリングに有益な遺伝子サブセットの選択方法 実施例1−4に示された分析で数値化比較される遺伝子発現プロフィールのそ
れぞれが800以上の異なるS. cerevisiae遺伝子の発現の同時のレベルに関するデ
ータを含む。これらの800の遺伝子は生物の発現可能な遺伝子のサブセットに相
当し、数で6000をわずかに超えると推定される。こうして、その結果は細胞の全
体の遺伝子発現の一部のみが、うまくいった本明細書に記載された方法の使用に
ついて、アッセイされる必要があることを実証する。評価される遺伝子の%が増
加するにつれて、定量分析が次第にしっかりしたものになり、かつ有用になるが
、全てよりも少ない遺伝子の発現がこれらの分析で使用し得ることが明らかであ
る。
【0170】 しばしば、遺伝子発現データの取得を技術的に考慮することによって、全てよ
りも少ない発現可能な遺伝子をアッセイすべきことが指示されるであろう。たと
えば、特にコンビナトリアル化学により少量で生成される場合に、薬物候補のサ
ンプルが供給を制限しているかもしれない。単に製剤があまりにも少なくて、所
定の細胞型の全ての可能な遺伝子に対するそれの効果の試験を可能にしないかも
しれない。また、細胞のそれぞれの発現可能な遺伝子の一つ一つについてそれぞ
れの候補製剤をアッセイすることはあまりにも高価であるかもしれない。
【0171】 これらの問題はアッセイされるゲノムが更に複雑になる場合に増強される。こ
うして、C. elegansの如き線虫類の発現可能な遺伝子のそれぞれに関する薬物ま
たはその他の環境製剤の効果を評価することはほぼ20,000の遺伝子の発現の測定
を必要とするであろう。ヒト細胞の発現可能な遺伝子のそれぞれに関する薬物ま
たはその他の環境製剤の効果を評価することは約100,000の遺伝子の測定を必要
とするであろう。
【0172】 更に、全ての遺伝子が同等に有益であるとは限らない。その幾つかは発現に不
十分な動的範囲を有して、どのような環境条件であろうとも有意な情報を与える
かもしれない。その他の遺伝子では協調的、または協働的に発現が変化して、収
集された情報が重複するかもしれない。
【0173】 発現分析のために遺伝子の有益なサブセットを選択する1つのアプローチは既
知の機能または推定機能により遺伝子を個々に選択することである。こうして、
Farrらの米国特許第5,811,231号および欧州特許EP 0680517 B1は、とりわけ、細
胞に毒性である化合物を特に同定し、特性決定するための“ストレス遺伝子”の
選択を開示している。
【0174】 しかしながら、このようなアプローチは遺伝子の機能の先立つ知識を必要とす
る。更に、このような誘導された選択により課せられたバイアスがこれまで推定
されていない関係を同定する可能性を減少するであろう。このような推定されて
いない関係の同定に有益な方法、たとえば、本明細書に提供された方法では、こ
のような誘導された予備的選択が特に不利であろう。
【0175】 別のアプローチは、こうして選択されたサブセットが全体の代表と判明するこ
とを希望して、サブセットを全くランダムに選択することである。問題は、明ら
かに、こうして選択されたサブセットが実際に1つ以上の環境条件下で細胞の状
態を記載するのに有益ではないと判明するかもしれないことである。
【0176】 更に別のアプローチは普通の機能ではなく、予め選択された環境条件に対する
普通の応答性により同定された遺伝子を選択することであろう(Whitneyら, Nat
. Biotechnol., 16:1329-33 (1998))。純粋に誘導され、純粋にランダムなアプ
ローチの間のいずれかに入ると、この後者の手順は、或る程度、両方の欠点を受
ける。
【0177】 図7および8は、以下に更に充分に記載される、遺伝子発現分析に有益な遺伝
子サブセットの選択の新規別法の結果を数値化により示す。この新規アプローチ
はそれらの発現の多様性−サイズ、方向、またはコモナリティーではない−につ
いての発現分析のための遺伝子の選択に基礎を置く。
【0178】 図7は1532の別のS. cerevisiae遺伝子発現リポーターを含むゲノムリポータ
ーマトリックスから誘導された、図1に従って処理された、遺伝子発現シグナル
の撒布プロットであり、それぞれのマトリックスが構造および機能の点で密接に
関連することが知られている2種の製剤:10μg/mlロバスタチン(X軸)および
20μg/mlメバスタチン(Y軸)のうちの1つで個々に処理された。先に図2に関
して説明したように、2種の製剤が殆どの酵母遺伝子の発現に同一ではないとし
ても同様に影響することがその図の即席の検査から容易に明らかである。発現が
ロバスタチンにより増大されるそれぞれの遺伝子がメバスタチンにより同等に増
加される。発現がロバスタチンによる処理により減少されるそれぞれの遺伝子が
メバスタチンによる処理により同等に抑制され、発現がロバスタチンによる処理
により影響されない遺伝子がメバスタチンにより同様に影響されない。その結果
はデータ点の殆どが起点を通る線の上にあることである。
【0179】 図8は図7に示された1532の遺伝子発現シグナルから選ばれた96の遺伝子サブ
セットからの遺伝子発現シグナルをプロットする。図7に示された遺伝子の16の
うちの1のみが図8中のディスプレイに選択されるが、2つの薬物処理の強い相
関関係が依然として見られるかもしれない。選択されたサブセットの96遺伝子が
、下記の実施例5に示される、表9にリストされる。既知の機能に関して選択さ
れないが、サブセットに保持された遺伝子が種々の機能を有することが認められ
る(その表にリストされる遺伝子機能はスタンフォード大学Saccharomycesゲノ
ムデータベースhttp://genome-www.stanford.edu/Saccharomycesから得られる)
【0180】 図8に示された遺伝子のサブセットは2つの基本的なアルゴリズム工程を含む
プロセスで図7に示されたものから選択された。第1工程では、図7に示された
遺伝子のそれぞれが発現のその最高の履歴的動的範囲に従って選別された。第2
工程では、反復プロセスは発現が強く相関付けられる遺伝子のそれぞれのグルー
プの最初のもの以外の全てを選別されたリストから排除した。結果は初期の組に
見られる遺伝子応答の多様性の選択されたサブセットの保持であり、相関関係付
けられた遺伝子のそれぞれのグループが最大の動的応答を有するその1つの遺伝
子により保持されたサブセット中で代表される。
【0181】 その原理は発現データが既に得られた大きい数の遺伝子からの遺伝子のサブセ
ットの選択により図8中に例示されるが、そのアプローチは遺伝子発現マトリッ
クスそれ自体からの小さいが有益な数の遺伝子発現シグナルの予見的取得を指令
するのに最大の実用性がある。
【0182】 実施例1−4はS. cerevisiaeにより潜在的に発現可能な6000の遺伝子のうち
の864−すなわち、その細胞により潜在的に発現可能な遺伝子の合計数の丁度約1
4.4%−の発現の測定が細胞表現型の定量的定義づけ、ひいては細胞状態の関連
性の定量的測定を可能にすることを実証する。実施例5はその発現が細胞表現型
の定量的定義づけ、ひいては細胞状態の関連性の定量的測定を可能にするように
十分に有益である潜在的に発現可能な遺伝子の更に小さいサブセット−6000のう
ちの丁度96、すなわち潜在的に発現可能な遺伝子の約1.6%−を選択することが
可能であることを実証する。
【0183】 こうして、本発明の重要な態様は発現分析のために細胞の発現可能な遺伝子の
20%以下を選択することを含んでなる、細胞のフェノタイピング方法を提供する
ことであり、選択された遺伝子の同時発現は細胞の表現型が別の細胞の表現型に
定量的に関連付けられることを可能にするように細胞の表現型を充分に特定する
。これらの方法では、細胞の潜在的に発現可能な遺伝子の好ましくは約20%以下
、更に好ましくは細胞の発現可能な遺伝子の約15%以下、更に好ましくは細胞の
発現可能な遺伝子の約10%以下、最適には細胞の発現可能な遺伝子の約5%以下
、最も好ましい実施形態では、細胞の発現可能な遺伝子の約1%−5%、更には
1−2%が選択される。このような選択を行うためのアルゴリズム、ならびにそ
の方法を行うためのコンピュータ、システム、ネットワーク、およびその他の装
置がまた提供される。
【0184】 発現分析のために発現可能な遺伝子の有益なサブセットを選択するためのアル
ゴリズムにおける2つの基本的な工程は特に図9および10を参照することにより
良く理解されるかもしれない。
【0185】 アルゴリズムにおける2つの主要な工程の最初の工程はそれらの発現の動的範
囲に従って遺伝子に順位をつける。履歴的データが使用されることが好ましい。
それぞれの遺伝子について、電子工学的に格納された遺伝子発現プロフィールの
データベース中のシグナル108の最大値及び最小値が適当に定式化された照会(
または一連の照会)900により測定される。
【0186】 上記のように、遺伝子発現データは図1、5、または6に記載されたプロセス
中の中間点のいずれかまたは全てで格納されてもよい。図9に示されたアルゴリ
ズム工程の目的のために、工程108からアウトプットされたようなシグナルが使
用される。工程108からアウトプットされたようなシグナル値がデータベース中
に存在しない場合、これらの値は或る場合にはこうして格納された値から再構築
されてもよい。たとえば、工程110からアウトプットされたシグナル値が格納さ
れる場合、シグナルはそれが工程108からアウトプットされたかのように逆(reve
rsing)工程110、すなわち、指数化により計算されてもよい。
【0187】 発現の範囲は最大シグナル対最小シグナルの比として計算される902(指定範
囲=シグナルmax/シグナルmin)。動的範囲のその他の測定、たとえば、“シグ
ナルmax−シグナルmin”が使用されてもよいが、その比が現在のところ好ましい
【0188】 次に、閾値が工程902で得られた範囲を実験により証明される値と比較するこ
とにより適用される904。範囲が閾値を越える場合、遺伝子がその後の使用のた
めに保持される。範囲が閾値を越えない場合、遺伝子が更なる分析から捨てられ
る。工程906に示されるように、その廃棄は範囲を0値にセットすることにより
容易に達成し得る。図8に示され、実施例5に例示された選択について、10の閾
値がセットされた。すなわち、データベースに格納された履歴的遺伝子発現プロ
フィールの組にわたる遺伝子発現レベルの少なくとも10倍の変化を示すこれらの
遺伝子のみが選択されたサブセット中に保持された。
【0189】 アルゴリズム中のこの工程における範囲閾値の選択が経験的要求により決定さ
れ、当業界の技術の範囲内にある。典型的には、10倍の閾値が適当に減少された
サイズの有益なサブセットを与えるであろう。
【0190】 しかしながら、閾値を1程度に低くセットし、すなわち、カットオフを完全に
排除することが可能である。その結果、一定に保持される全てのその他の因子は
遺伝子の極めて大きいサブセットの選択であろう。更に、この工程でセットされ
る閾値は全数に制限される必要がないことが理解されるであろう。
【0191】 こうして、閾値は1程度に低くセットされてもよく、または好ましくは1より
大きくてもよい。通常、閾値は2以上、更に好ましくは3以上、更に好ましくは
4、5、6、7、8、もしくは9、またはそれ以上(その順序で)、最も好まし
くは少なくとも10にセットされるであろう。
【0192】 閾値はまた10より大きくてもよく、100程度に高い範囲であってもよく、好ま
しくは50以下、更に好ましくは25以下、最も好ましくは10-20であってもよい。
【0193】 発現の範囲が実験閾値を越える遺伝子がその後に発現範囲に従って選別される
【0194】 図10は第2の基本的アルゴリズム工程の第2の反復プロセスを図示する。
【0195】 左から右へと進んで、図10はアルゴリズムの第2工程の2つの完全な反復を概
説する。左には最大動的範囲から最小動的範囲へと順位をつけられた、工程908
からアウトプットされたような、遺伝子のリストが示される。不適な動的範囲の
ために工程906で捨てられた遺伝子は示されていない。
【0196】 そのプロセスの第1反復では、リスト中の第1遺伝子(“遺伝子1”)がイン
デックス遺伝子、または基準遺伝子として利用できる。その後、そのリスト中の
それぞれの遺伝子を採りだして、遺伝子の発現が格納された遺伝子発現プロフィ
ールの組にわたってインデックス遺伝子の発現と相関付けられる程度が計算され
る。相関関係(r2)が実験でセットされた値を超える場合、その遺伝子がその組か
ら捨てられる。
【0197】 この工程の効果は発現がインデックス遺伝子、“遺伝子1”の発現と強く相関
付けられる全ての遺伝子を除去することである。高度の相関関係はこれらの捨て
られた遺伝子の発現が寄与した情報がインデックス遺伝子の発現値に固有の情報
過多の大きな測定中にあることを意味する。図10の下部に示されるように、イン
デックス遺伝子(“遺伝子1”)が有益な遺伝子サブセット中に保持される。図
10の中央に例示されるように、それと高度に相関付けられた遺伝子(“遺伝子3
”および“遺伝子4”)が捨てられる。リストが最大発現範囲から最小発現範囲
へと順位をつけられるので、相関付けられたグループから保持された単一遺伝子
は発現の最大動的範囲を有する遺伝子である。
【0198】 そのプロセスの第2反復では、遺伝子1の後に保持された遺伝子のうちの最初
の遺伝子(図10中で“遺伝子2”により例示される)がインデックス遺伝子、ま
たは基準遺伝子になる。それがまたその図の下部に示されるように保持されるで
あろう。
【0199】 その後、リスト中に保持されたそれぞれの遺伝子を採りだして、遺伝子の発現
が格納された遺伝子発現プロフィールの組にわたってインデックス遺伝子(今で
は“遺伝子2”)の発現と相関付けられる程度が計算される。相関関係(r2)が実
験でセットされた値を超える場合、その遺伝子がその組から捨てられる。次に保
持された(相関付けられていない)遺伝子(ここでは“遺伝子6”により例示さ
れる)がその後に次の反復のインデックス遺伝子になる。
【0200】 リストが使い果たされるまで、そのプロセスが反復される。
【0201】 発現がインデックス遺伝子の発現と相関関係付けられる遺伝子を除去する反復
工程を行う際に、相関関係は工程140からアウトプットされたような(すなわち
、ボックス141からアウトプットされたような)遺伝子発現シグナルについて行
われることが好ましい。最終のサブセット中に保持された遺伝子の数が遺伝子発
現プロフィールのデータベースに対しデータ寄与する遺伝子の合計数により、工
程904で適用された範囲閾値により、また図10に図示された反復プロセス中に適
用された相関関係閾値により測定されるであろう。2つの閾値が実験的に調整さ
れて遺伝子のあらゆる選択された数を含む有益なサブセットが生じてもよい。
【0202】 こうして、実施例5に以下に示される分析では、範囲閾値および相関関係閾値
が範囲閾値を10にセットし、また相関関係閾値を0.675にセットすることにより
実験的に調節されて96の遺伝子−通常のマイクロタイタープレートのウェルの数
に等しい−を含むサブセットを得た。
【0203】 所望のサイズのサブセットが図9および10に示されたアルゴリズムに従って一
旦同定されると、定量分析が、図5および6に示されたアルゴリズムに従って、
遺伝子の丁度そのサブセットを使用して行われてもよい。分析が、実施例5のよ
うに、更に包括的な遺伝子発現プロフィールから選択することにより行われても
よく、または、更に有益には、リポーターマトリックス中の遺伝子の同定された
サブセットを使用して遺伝子発現プロフィールを予見的に得ることにより行われ
てもよい。
【0204】 実施例5は格納された遺伝子発現プロフィールの本発明者らのデータベースで
入手できる1532の遺伝子からの96の遺伝子のサブセットの選択を示す。表8およ
び10−表8は1532の遺伝子を使用して関連性に順位をつけ、また表10は記載され
たアプローチを使用して選択された丁度96の遺伝子に基づく同じプロフィールの
関連性に順位をつける−は96の遺伝子サブセットが遺伝子発現プロフィールの関
連性の定量的順位付けを可能にするのに充分な多様性を保持することを実証する
。両方の表中のデータは、実際に次に最も密接に関連するようなステロール生合
成経路のその他の工程に影響する薬物により、ロバスタチンと最も密接に関連す
るようなHMG-CoA還元酵素インヒビターを同定する。
【0205】 実施例5における遺伝子発現の定量分析が図6(すなわち、図1A、1Bおよび6
)のアルゴリズムを使用して96の遺伝子サブセットについて行われたが、図5(
すなわち、図1A、1B、および5)に示されたアルゴリズムもまた使用されてもよ
い。更に、図8−これはインデックスプロフィール(ランク0で現れる)からの
96の遺伝子についての発現データ対ランク2(1%エタノール中の20μg/mlメバ
スタチン)で現れるプロフィールからのデータをプロットする−はこうして選択
されたサブセットがまた遺伝子発現プロフィールの定量分析に使用し得ることを
実証する。
【0206】 以下の実施例は説明のために示されるものであり、限定のために示されるもの
ではない。
【0207】実施例1 薬物と80μg/mlアクチノマイシンDとの関連性 複製ゲノムレポーターマトリックスを、参照により本明細書に組み入れられる
Ashbyらに従って調製した。簡単に説明すると、そのような各マトリックスに対
して、別個の酵母プロモーターからの蛍光レポーターをそれぞれ駆動する組換え
構築物を、個々にサッカロミセス・セレビシエ(Saccharomyces cerevisiae)の
同一株バックグラウンドの別々の培養物中に形質転換した。形質転換した培養物
に選択を適用して、レポーターを維持しかつ非形質転換細胞による汚染を除去し
た。この形質転換した酵母培養物をそれぞれ分離し、別々の空間的にアドレス可
能なマトリックスのウエル内に維持した。
【0208】 使ったマトリックスは864個の隔離構築物を含有し、800個を越える遺伝子の発
現レベルの同時測定を可能にした。各マトリックスを、表1および表2の欄に規
定した、特定の環境条件に曝した。遺伝子発現プロフィールを、Ashbyらが記載
したように、各マトリックスから取得し、デジタル化し、そして電子工学的に保
存した。
【0209】 その後、各遺伝子発現プロフィールと80μg/mlアクチノマイシンDの存在下で
生じた遺伝子発現プロフィールとの関連性を、実質的に図1A、1Bおよび5に記載
した方法(表1)、または図1A、1Bおよび6に記載した方法(表2)に従い、対
ごとに(pairwise)数値化した。その後、対ごとの関連性の尺度を順序付けして
、次の結果を得た:
【表1】
【表2】 表1および表2は、本明細書に記載したそれぞれの方法が、遺伝子発現プロフ
ィールの関連性を数値化し、そうすることによって薬物処置の関連性を同定する
ことが可能であることを示す。
【0210】 従って、表1に記載したように、図1A、1B、および5のアルゴリズムは、60μ
g/mlアクチノマイシンDを用いる処置を、80μg/mlアクチノマイシンDに暴露する
参照、または指標、条件に最も密接に関係する処置として同定する。40μg/mlア
クチノマイシンDおよび50μg/mlアクチノマイシンDを用いる処置がこれに続く。
【0211】 様々な濃度のダウナルビシン、5-FUDR、ドキソルビシン、5-FU、ヒドロキシ尿
素およびミコフェノール酸がこれに続く。これらの作用剤は全て、アクチノマイ
シンDと同様、核酸合成に影響を与えることが公知である。関係がそれほど密接
でないのは、本質的に異なる活性の作用剤を用いる処置:ランク26および27の酵
母α因子を用いる処置、その次にHMG-CoAレダクターゼの阻害剤であるメバスタ
チンが続く。ランク31に薬物を全く含まない環境に適合させた対照を用いる処置
により生成するプロフィールがあり、それより下のランクに抗真菌剤ミコナゾー
ルおよびグリセオフルビンを用いる処置、およびカルシウムチャネル遮断剤ベラ
パミルを用いる処置が続く。
【0212】 従って、もしアクチノマイシンDによる作用機構だけが知られていると、該デ
ータは明らかに、ダウナルビシン、ドキソルビシン、ヌクレオチド類似体5-FUDR
および5-FU、ならびにミコフェノール酸が、知られているアクチノマイシンDの
機構に類似した作用機構をもつ薬物であることを意味するであろう。アクチノマ
イシンDが核酸合成を妨害することを知れば、該データは、ダウナルビシン、ド
キソルビシン、ヌクレオチド類似体5-FUDRおよび5-FU、ならびにミコフェノール
酸も、核酸合成に影響を与え、そして、それ故に、癌治療の化学療法剤として有
用でありうること、または病原体、特にウイルス病原体の生活環を妨害するのに
有益でありうることを示す。
【0213】 逆に、参照薬物以外のこれら作用剤全ての該機構が知られていれば、これらの
データはアクチノマイシンDが核酸合成を妨害することを示し、その機構に価値
ある洞察を提供するであろう。
【0214】 これらの洞察は専門的な核酸合成阻害アッセイ、または先立っての薬物に対す
る分子標的の同定を必要としないことに注目すべきである。そして、その結果、
類似のグローバルな効果をもつが分子の標的が本質的に異なる薬物が同定されて
いる。
【0215】 表2は、図1A、1B、および6の方法およびアルゴリズムを使い、電子的に保存
された遺伝子発現プロフィールデータの同じセットに応用して作製した遺伝子発
現プロフィールの関連性の数値化ランキングを表す。
【0216】 ここに見られるように、核酸合成に影響を与える作用剤は、再び、80μg/mlア
クチノマイシンDを用いる処置と最も密接に関係するとしてランクされている。
注目すべきは、アクチノマイシンDの減少濃度のランク順序である。
【0217】実施例2 薬物と50μg/mlダウナルビシンとの関連性 遺伝子発現プロフィールを、実施例1およびAshbyらの記載のように取得して
保存した。
【0218】 その後、各遺伝子発現プロフィールと50μg/mlダウナルビシンの存在下で生じ
た遺伝子発現プロフィールとの関連性を、実質的に図1A、1Bおよび5に記載した
方法に従い(表3)、または図1A、1Bおよび6に記載した方法に従い(表4)、
対ごとに数値化した。その後、対ごとの関連性の尺度を順序付けして、次の結果
を得た:
【表3】
【表4】 表3に記載したデータ(図5に記載した方法を使い生じた)は、作用がダウナ
ルビシンと密接に関係している作用剤として、次の薬物:ドキソルビシン、アク
チノマイシンD、5-FU、および5-FUDRを同定し、これらの作用剤の公知の活性と
一致する。表4に記載したデータ(図6に記載した方法を使い生じた)は、対照
的に、カルシウムチャネル遮断剤のベラパミルについてあまり明瞭ではなく、密
接に関連するように思われる。
【0219】 従って、ここでより高い薬物濃度により表される、より厳しい処置においては
、図5に示した方法が図6に示した方法より好ましい。以下の実施例3は、図6
に示した方法が薬物のより低い濃度で好ましいであろうことを示す。
【0220】 本実施例のデータから注目すべきことは、複製遺伝子発現プロフィール、すな
わち同一の条件による別の実験で得られた遺伝子発現プロフィールはお互いに密
接してランク付けされたデータを示し、この分析の再現性を示すことである。
【0221】実施例3 薬物と12.5μg/mlダウナルビシンとの関連性 遺伝子発現プロフィールを、実施例1およびAshbyらが記載したように取得し
て、保存した。
【0222】 その後、各遺伝子発現プロフィールと12.5μg/mlダウナルビシンの存在下で生
じた遺伝子発現プロフィールとの関連性を、実質的に図1A、1Bおよび5に記載し
た方法に従い(表5)、または図1A、1Bおよび6に記載した方法に従い(表6)
、対ごとに数値化した。その後、対ごとの関連性の尺度を順序付けして、次の結
果を得た:
【表5】
【表6】 表5および表6に報じた結果は、低薬物濃度における遺伝子発現プロフィール
の関連性を数値化するための第2の方法の実質的な利点を示す。
【0223】 表5に示したように、図5に記載した第1の方法は、遺伝子発現プロフィール
とわずか12.5μg/mlのダウナルビシンの存在下で生じた遺伝子発現プロフィール
との関連性を正確に数値化できず、5%生理食塩水および1000μg/mlジルチアゼム
(カルシウムチャネル遮断剤)を5-FUの前にランク付けし、5-FU自体は嫌気性増
殖およびベラパミルのすぐ前にランク付けられている。
【0224】 著しく対照的に、図6に記載した方法によって分析された同じ遺伝子発現プロ
フィールデータ(表6)は、12.5μg/mlダウナルビシンを用いる処置に最も密接
に関係する処置として、様々な濃度のドキソルビシン(構造と機能がダウナルビ
シンに密接に関連することが知られている)を用いる処置をランク付けしている
【0225】実施例4 グローバルな環境条件の関連性 複製ゲノムレポーターマトリックスを、実施例1およびAshbyらの記載のよう
に、864個の様々な酵母オープンリーディングフレームの同時発現をレポートす
る864個の別々のエレメントを用いて調製した。遺伝子発現プロフィールを、そ
れぞれのマトリックスに対して以下に示した条件下で取得し、デジタル化して保
存した。その後、各遺伝子発現プロフィールと酵母最少培地中における細胞のイ
ンキュベーションにより生じた遺伝子発現プロフィールとの関連性を、実質的に
図1A、1Bおよび5に記載した方法に従い、対ごとに数値化した。その後、対ごと
の関連性の尺度を順序付けし、表7に記載した以下の結果を得た。
【0226】
【表7】 表7に示すように、本発明で提供される数値化法により、個々の薬物を用いた
異なる処置で行うことができるように、ここでは栄養培地の変化により表現した
グローバルな環境条件の関連性を順序付けることができる。
【0227】 さらに、これらのデータは、培地の変化が実質的にグローバルな遺伝子発現に
影響を与えうることを確認し、図1Bに記載したように、環境的に適合した対照に
対する校正を含むことの重要性を確認する。
【0228】実施例5 遺伝子発現プロフィールの数値化分析のための情報サブセットの選択 複製ゲノムレポーターマトリックスを、参照により本明細書に組み入れられる
Ashbyらの方法によって調製した。この実施例で提示される分析に使ったマトリ
ックスは、1532個の別々の構築物を含有し、サッカロミセス・セレビシエ(S. c
erevisiae)により発現される遺伝子の約4分の1にあたる1500個を超える遺伝
子の発現レベルの同時測定が可能である。各マトリックスを、表8および10それ
ぞれの個々の項目に規定された、特定の環境条件に曝した。遺伝子発現プロフィ
ールを、Ashbyらの記載したように各マトリックスから取得し、デジタル化して
電子的に保存した。
【0229】 その後、各遺伝子発現プロフィールと10μg/mlロバスタチン(Lovastatin)
の存在下で生じた遺伝子発現プロフィールとの関連性を、2つの小さい相違をも
つ実質的に図1A、1Bおよび6に記載された方法によって、対ごとに数値化した。
【0230】 第1に、一定平均発現の仮定は、このような小さいパーセントの細胞遺伝子に
応用する場合には有効性がないので、正規化ステップ108を96遺伝子サブセット
の分析から省いた。
【0231】 第2に、本質的に異なるレポーターの動的範囲に対する校正は、ステップ610
および611で最大正規化信号の対数平方根により各遺伝子を除することにより実
施した;しかし、正規化を実施するために使った値は、各事例において1532個の
遺伝子サブセットに対して適当な値であった。
【0232】 その後、対ごとの関連性の尺度を順序付けして、次の結果を得た。
【0233】
【表8】 表8は、図1A、1B、および6のアルゴリズムを1532個の別個の遺伝子レポータ
ーを含有する遺伝子発現プロフィールへ応用することにより、薬物と10μg/ml
ロバスタチン(HMG-CoAレダクターゼ阻害剤)との関連性の数値化が可能になる
ことを示す(前記の実施例1〜4に報じた結果と一致する)。
【0234】 従って、他の同クラスの薬物(メバスタチン、フルバスタチン、シムバスタチ
ンおよびアトルバスタチン)がロバスタチンに最も密接に関係していることを示
す。ステロール生合成経路の他の工程に影響を与える薬物、例えばエコナゾール
、クロトリマゾール、およびフルコナゾールが、順序付けした表において次に現
れる。プロゲストロン、ニフェジピンおよびツニカマイシンのような実質的に異
なる構造または作用様式をもつ薬物はその後に続く。さらに関係の低いプロフィ
ールスコアをもつ多様な他の作用剤は示されてない。
【0235】 その後、表8を作製するために使った遺伝子発現プロフィールのデータベース
を検索(query)しかつ図9および図10に模式化したアルゴリズムで処理した。
このアルゴリズムは、遺伝子発現プロフィールにおける1532個の遺伝子のサブセ
ットを同定するように設計され、遺伝子数の減少にも関わらず、遺伝子発現レパ
ートリーを十分に代表して遺伝子発現プロフィールの関連性の数値化を可能にす
る。96個の遺伝子(標準マイクロタイタープレートのウエル数に等しい)をもつ
サブセットを達成する目的で、範囲閾値を実験的に10に、および相関閾値を0.67
5に設定した。アルゴリズムは、C言語でコードしたアルゴリズムステップを用い
たデジタル計算機で実行した。
【0236】 このように同定した遺伝子のサブセットを以下の表9に掲げた。本発明により
選択された遺伝子について表に掲げた機能は、スタンフォード(Stanford)大学
のサッカロミセス(Saccharomyces)ゲノムデータベースに現在報じられている
機能である(http://genome-www.stanford.edu/Saccharomyces)。
【0237】
【表9】 表9に見られるように、このサブセットは遺伝子機能に関係なく選択され、異
なった機能をもつ遺伝子の多様なコレクションを包含する。
【0238】 前記データベースの各遺伝子発現プロフィールと10μg/mlロバスタチンの存在
下で生じた遺伝子発現プロフィールとの関連性を、その後、実質的に図1A、1Bお
よび6に記載された方法により、表9に挙げた96個の遺伝子からの発現データだ
けを使って、対ごとに数値化した。その後、対ごとの関連性の尺度を順序付けし
て、次の結果を得た。
【0239】
【表10】 表10は、遺伝子発現プロフィールの数値化分析を可能にする遺伝子の情報サブ
セットを選択しうることを確証する。1532個の利用可能な遺伝子全てのデータを
使う表8に報じた分析のように、表9に挙げた96個の遺伝子だけを使う表10に報
じた分析は、HMG-CoAレダクターゼ薬物を、ロバスタチンに最も関係すると同定
し、同じ生合成経路の随所に作用する薬物は次に最も密接に関係して現れ、標的
および効果に全く無関係である薬物は最も少なく関係して示される。
【0240】 この実証は、発現データをデータベースで利用できる1532個の遺伝子中から96
個の遺伝子を選択して実施したが、この情報サブセットの同定によりこれらの同
定されたレポーターだけから得た情報的遺伝子発現データのその後のおよび将来
の取得を行うことが可能になり、このようにして取得したデータは遺伝子発現プ
ロフィールの数値化分析を可能にするであろうという確信がある。
【0241】 本明細書に記載した全ての特許、特許刊行物、および他の刊行された参照文献
は、あたかもそれぞれが個別に特定的に本明細書に参照により組み入れられるが
ごとく、その全文が本明細書に参照により組み入れられる。
【0242】 本発明の好ましい説明のための実施形態を記載したが、本発明から逸脱するこ
となくその内容に様々な変更と修正をなしうることは当業者には明白であろうし
、そして、添付された特許請求の範囲は、本発明の真の精神と範囲内に入るこの
ような変更と修正の全てを包含することを意図する。
【図面の簡単な説明】
本発明の上記および他の目的ならびに利点は、添付の図面と共に上記の詳細な
説明を考察することにより明らかとなる。
【図1】 図1は、遺伝子発現プロファイルの定量分析に適した遺伝子発現シグナルを、
遺伝子発現マトリクスから最初に取得したシグナルから誘導するプロセスを説明
するフローチャートである。図1Aは、初期シグナル処理を図式化したものである
。図1Bは、環境的に一致したコントロール(対照)による任意の後続の補正を説明
したものである。
【図2】 図2は、図1に従って処理された遺伝子発現シグナルの撒布プロットである。
このシグナルは、構造および機能において密接に関連することが知られている2
種の化学療法剤(50μg/mlのダウナルビシンおよび50μg/mlのドキソルビシン)の
うちの1つでそれぞれ処理したゲノムリポーターマトリクスから誘導されたもの
である(実施例2を参照)。
【図3】 図3は、異なる構造および異なる機能を有する2種の薬剤(50μg/mlのドキソル
ビシンおよび0.08μg/mlのミコナゾール)のうちの1つでそれぞれ処理したマトリ
クスから誘導された遺伝子発現シグナルをプロットしたものである。
【図4】 図4は、異なる構造を有するが類似した機能を有する2種の薬剤(9μg/mlのミ
コフェノール酸および50μg/mlのダウナルビシン)のうちの1つでそれぞれ処理し
たマトリクスから誘導された遺伝子発現シグナルをプロットしたものである。
【図5】 図5は、図1に図式化されたプロセスに従って調製された個々の遺伝子発現シ
グナルのセットを、遺伝子発現プロファイルの関連性をランク付けするために定
量的に用い得る値にまで減少させるための第1のプロセスを説明するフローチャ
ートである。
【図6】 図6は、図1に図式化されたプロセスに従って調製された個々の遺伝子発現シ
グナルのセットを、遺伝子発現プロファイルの関連性をランク付けするために定
量的に用い得る値にまで減少させるための第2のプロセスを説明するフローチャ
ートである。
【図7】 図7は、実質的に図1に従って処理された遺伝子発現シグナルの撒布プロット
である。このシグナルは、1532個の異なる遺伝子発現リポーターを含む遺伝子リ
ポーターマトリクスから誘導されたものである。各マトリクスは、構造および機
能において密接に関連することが知られている2種の薬剤(10μg/mlのロバスタチ
ン(X軸)および20μg/mlのメバスタチン(Y軸))のうちの1つでそれぞれ処理したも
のである。
【図8】 図8は、図7に示された1532個の遺伝子発現シグナルのうちの96個の遺伝子の
サブセットに由来する遺伝子発現シグナルの撒布プロットである。このサブセッ
トは、図9および図10に図表化されたアルゴリズムに従って選択されたもので
ある。
【図9】 図9は、遺伝子発現プロファイルの定量分析のための情報の有益な遺伝子サブ
セットを選択するためのアルゴリズムにおける2つの主要な工程のうちの第1の
工程を図式化するフローチャートである。
【図10】 図10は、遺伝子発現プロファイルの定量分析のための情報の有益な遺伝子サ
ブセットを選択するためのアルゴリズムにおける2つの主要な工程のうちの第2
の工程の2回の完全な繰り返し(反復)を図式化したものである。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,UG,ZW),E A(AM,AZ,BY,KG,KZ,MD,RU,TJ ,TM),AE,AL,AM,AT,AU,AZ,BA ,BB,BG,BR,BY,CA,CH,CN,CU, CZ,DE,DK,EE,ES,FI,GB,GD,G E,GH,GM,HR,HU,ID,IL,IN,IS ,JP,KE,KG,KP,KR,KZ,LC,LK, LR,LS,LT,LU,LV,MD,MG,MK,M N,MW,MX,NO,NZ,PL,PT,RO,RU ,SD,SE,SG,SI,SK,SL,TJ,TM, TR,TT,UA,UG,UZ,VN,YU,ZA,Z W Fターム(参考) 4B024 AA11 BA80 CA04 DA12 EA04 FA02 GA11 HA11 4B063 QA01 QA17 QQ42 QR33 QR60 QR76 QR80 QS05 QS39 5B075 ND20 PQ02 PQ14 PR06 QM08 UU19

Claims (65)

    【特許請求の範囲】
  1. 【請求項1】 第1および第2遺伝子発現プロフィールの関連性を数値化す
    る方法であって、 (a)前記第1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対
    して第1および第2遺伝子発現信号を発生させ、 (b)前記第1および第2遺伝子発現信号の各対に対して相対発現スコアを設定
    し、 (c)前記対ごとの相対発現スコアから合成スコアを計算する 工程を含んでなり、前記合成スコアによって2つの遺伝子発現プロフィールの関
    連性を数値化する前記方法。
  2. 【請求項2】 遺伝子発現信号を発生させる前記工程が、 (a1)前記遺伝子の各々について取得した初期発現信号の大きさを、各遺伝子の
    個々の遺伝子発現プロフィールについて取得した初期バックグラウンド信号の大
    きさと比較し、 (a2)個々の初期バックグラウンド信号よりも小さい前記初期遺伝子発現信号の
    大きさをそれぞれ調整する 工程を含んでなる、請求項1記載の方法。
  3. 【請求項3】 遺伝子発現信号を発生させる前記工程が、 (a3)前記初期発現信号と調整後の初期発現信号の大きさを、個々の遺伝子発現
    プロフィールに対する前記信号の全てにわたって正規化する 後続の工程をさらに含んでなる、請求項2記載の方法。
  4. 【請求項4】 遺伝子発現信号を発生させる前記工程が、 (a4)前記遺伝子発現信号の各々の値として、前記正規化信号の対数を割り当て
    る 後続の工程をさらに含んでなる、請求項3記載の方法。
  5. 【請求項5】 遺伝子発現信号を発生させる前記工程が、 (a5)前記正規化対数信号の各々について、条件を一致させた対照から、前記遺
    伝子に対して取得した遺伝子発現信号に同様の処理を行ったものを差し引く 後続の工程をさらに含んでなる、請求項4記載の方法。
  6. 【請求項6】 相対発現スコアを設定する前記工程が、 (b1)前記第1および第2遺伝子発現信号の各対について、信号間の比率を計算
    し、 (b2) バックグラウンド信号の調整と正規化に係わる先行の工程によって方向
    が変わる可能性のある前記計算比率を、さらなる処理からそれぞれ除外する 工程を含んでなる、請求項1記載の方法。
  7. 【請求項7】 相対発現スコアを設定する前記工程が、 (b3)前記計算比率の絶対値の大きさを、閾値定数の大きさと比較し、 (b4)絶対値が前記閾値定数を超えない前記計算比率を、さらなる処理からそれ
    ぞれ除外する 後続の工程をさらに含んでなる、請求項6記載の方法。
  8. 【請求項8】 相対発現スコアを設定する前記工程が、 (b5)前記相対発現スコアの各々を、前記発現スコアの遺伝子でこれまでに観察
    された最大発現信号について個別に正規化する 後続の工程をさらに含んでなる、請求項7記載の方法。
  9. 【請求項9】 相対発現スコアを設定する前記工程が、 (b3)前記相対発現スコアの各々を、前記発現スコアの遺伝子でこれまでに観察
    された最大発現信号について個別に正規化する 後続の工程をさらに含んでなる、請求項6記載の方法。
  10. 【請求項10】 合成スコアを計算する前記工程が、 (c1)事前に除外しなかった前記相対発現スコアを全て累積し、 (c2)事前に除外した遺伝子の割合に対して調整する 工程を含んでなる、請求項1〜9のいずれか一項に記載の方法。
  11. 【請求項11】 第1および第2遺伝子発現プロフィールの関連性を数値化
    する方法であって、 (a)前記第1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対
    して第1および第2遺伝子発現信号を発生させ、 (b)通常代表とされる前記遺伝子に対する第1および第2遺伝子発現信号対の
    セットに線形回帰を行う 工程を含んでなり、このような回帰の相関係数によって2つの遺伝子発現プロフ
    ィールの関連性を数値化する前記方法。
  12. 【請求項12】 遺伝子発現信号を発生させる前記工程が、 (a1)前記遺伝子の各々について取得した初期発現信号の大きさを、各遺伝子の
    個々の遺伝子発現プロフィールについて取得した初期バックグラウンド信号の大
    きさと比較し、 (a2) 個々の初期バックグラウンド信号よりも小さい前記初期遺伝子発現信号
    の大きさをそれぞれ調整する 工程を含んでなる、請求項11記載の方法。
  13. 【請求項13】 遺伝子発現信号を発生させる前記工程が、 (a3)前記初期発現信号と調整後の初期発現信号の大きさを、個々の遺伝子発現
    プロフィールに対する前記信号の全てにわたって正規化する 後続の工程をさらに含んでなる、請求項12記載の方法。
  14. 【請求項14】 遺伝子発現信号を発生させる前記工程が、 (a4)前記遺伝子発現信号の各々の値として、前記正規化信号の対数を割り当て
    る 後続の工程をさらに含んでなる、請求項13記載の方法。
  15. 【請求項15】 遺伝子発現信号を発生させる前記工程が、 (a5)前記正規化対数信号の各々について、条件を一致させた対照から、前記遺
    伝子に対して取得した遺伝子発現信号に同様の処理を行ったものを差し引く 後続の工程をさらに含んでなる、請求項14記載の方法。
  16. 【請求項16】 前記第1および第2遺伝子発現信号が、自然対数で2未満
    の大きさを有する信号を含む、請求項11記載の方法。
  17. 【請求項17】 前記第1および第2遺伝子発現信号の大きさが、自然対数
    で1未満の大きさを有する信号を含む、請求項16記載の方法。
  18. 【請求項18】 複数の遺伝子発現プロフィールと予め選択しておいた1つ
    の遺伝子発現プロフィールとの関連性に順位をつける方法であって、 (a)前記複数の遺伝子発現プロフィールの各々と予め選択しておいた前記遺伝
    子発現プロフィールとの関連性を対ごとに数値化し、 (b)前記対ごとに測定した数値に順位をつける 工程を含んでなる前記方法。
  19. 【請求項19】 細胞に対する第1および第2環境条件の関連性を数値化す
    る方法であって、 (a)前記第1および第2環境条件の各々の下で前記細胞または遺伝子型が同一
    の細胞から遺伝子発現プロフィールを取得し、 (b)前記第1および第2遺伝子発現プロフィールの関連性を数値化する 工程を含んでなる前記方法。
  20. 【請求項20】 遺伝子発現プロフィールの関連性を数値化する前記工程を
    、請求項1〜9のいずれか一項に記載の方法に従って行う、請求項19記載の方
    法。
  21. 【請求項21】 遺伝子発現プロフィールの関連性を数値化する前記工程を
    、請求項11〜17のいずれか一項に記載の方法に従って行う、請求項19記載
    の方法。
  22. 【請求項22】 前記第1および第2環境条件が、前記細胞を第1および第
    2の化合物へ曝露させることを含んでなる、請求項19記載の方法。
  23. 【請求項23】 細胞に対する複数の環境条件と予め選択しておいた1つの
    環境条件との関連性に順位をつける方法であって、 (a)前記細胞または遺伝子型が同一の細胞から、複数の環境条件の各々および
    予め選択しておいた前記環境条件について遺伝子発現プロフィールを取得し、 (b)前記複数の遺伝子発現プロフィールの各々と予め選択しておいた前記遺伝
    子発現プロフィールとの関連性を対ごとに数値化し、 (c)前記対ごとに測定した数値に順位をつける 工程を含んでなる前記方法。
  24. 【請求項24】 遺伝子発現プロフィールの関連性を数値化する前記工程を
    、請求項1記載の方法に従って行う、請求項23記載の方法。
  25. 【請求項25】 遺伝子発現プロフィールの関連性を数値化する前記工程を
    、請求項11記載の方法に従って行う、請求項23記載の方法。
  26. 【請求項26】 前記環境条件の各々が、前記細胞を化合物へ曝露させるこ
    とを含んでなる、請求項23記載の方法。
  27. 【請求項27】 予め選択しておいた環境条件と細胞の特定の遺伝子突然変
    異との関連性を数値化する方法であって、 (a)前記特定の突然変異を有する細胞から第1遺伝子発現プロフィールを取得
    し、予め選択しておいた前記環境条件下で野生型の細胞から第2遺伝子発現プロ
    フィールを取得し、 (b)前記第1および第2遺伝子発現プロフィールの関連性を数値化する 工程を含んでなる前記方法。
  28. 【請求項28】 遺伝子発現プロフィールの関連性を数値化する前記工程を
    、請求項1記載の方法に従って行う、請求項27記載の方法。
  29. 【請求項29】 遺伝子発現プロフィールの関連性を数値化する前記工程を
    、請求項11記載の方法に従って行う、請求項27記載の方法。
  30. 【請求項30】 予め選択しておいた前記環境条件が、前記細胞を化合物へ
    曝露させることを含んでなる、請求項27記載の方法。
  31. 【請求項31】 複数の環境条件の各々と細胞の特定の遺伝子突然変異との
    関連性に順位をつける方法であって、 (a)前記複数の環境条件の各々の条件下で野生型の細胞から第1遺伝子発現プ
    ロフィールのセットを取得し、前記特定の突然変異を有する細胞から第2遺伝子
    発現プロフィールを取得し、 (b)前記第1遺伝子発現プロフィールの各々と前記第2遺伝子発現プロフィー
    ルとの関連性を対ごとに数値化し、 (c)前記対ごとに測定した数値に順位をつける 工程を含んでなる前記方法。
  32. 【請求項32】 遺伝子発現プロフィールの関連性を数値化する前記工程を
    、請求項1記載の方法に従って行う、請求項31記載の方法。
  33. 【請求項33】 遺伝子発現プロフィールの関連性を数値化する前記工程を
    、請求項11記載の方法に従って行う、請求項31記載の方法。
  34. 【請求項34】 前記環境条件が、前記細胞を化合物へ曝露させることを含
    んでなる、請求項31記載の方法。
  35. 【請求項35】 細胞の第1遺伝子突然変異と細胞の第2遺伝子突然変異と
    の関連性を数値化する方法であって、 (a)前記第1遺伝子突然変異を有する細胞から第1遺伝子発現プロフィールを
    取得し、前記第2遺伝子突然変異を有する細胞から第2遺伝子発現プロフィール
    を取得し、 (b)前記第1および第2遺伝子発現プロフィールの関連性を数値化する 工程を含んでなる前記方法。
  36. 【請求項36】 遺伝子発現プロフィールの関連性を数値化する前記工程を
    、請求項1記載の方法に従って行う、請求項35記載の方法。
  37. 【請求項37】 遺伝子発現プロフィールの関連性を数値化する前記工程を
    、請求項11記載の方法に従って行う、請求項35記載の方法。
  38. 【請求項38】 複数の遺伝子突然変異の各々と予め選択しておいた細胞の
    遺伝子突然変異との関連性に順位をつける方法であって、 (a)前記複数の遺伝子突然変異の1つをそれぞれ有する細胞から第1遺伝子発
    現プロフィールのセットを取得し、予め選択しておいた前記突然変異を有する細
    胞から第2遺伝子発現プロフィールを取得し、 (b)前記第1遺伝子発現プロフィールの各々と前記第2遺伝子発現プロフィー
    ルとの関連性を対ごとに数値化し、 (c)前記対ごとに測定した数値に順位をつける 工程を含んでなる前記方法。
  39. 【請求項39】 第1および第2遺伝子発現プロフィールの関連性を数値化
    するシステムであって、 (a)前記第1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対
    して第1および第2遺伝子発現信号を発生させる手段、 (b)前記第1および第2遺伝子発現信号の各対に対して相対発現スコアを設定
    する手段、並びに (c)前記対ごとの相対発現スコアから合成スコアを計算する手段 を含んでなり、前記合成スコアによって2つの遺伝子発現プロフィールの関連性
    を数値化する前記システム。
  40. 【請求項40】 第1および第2遺伝子発現プロフィールの関連性を数値化
    するシステムであって、 (a)前記第1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対
    して第1および第2遺伝子発現信号を発生させる手段、 (b)通常代表とされる前記遺伝子に対する第1および第2遺伝子発現信号対の
    セットに線形回帰を行う手段 を含んでなり、このような回帰の相関係数によって2つの遺伝子発現プロフィー
    ルの関連性を数値化する前記システム。
  41. 【請求項41】 複数の遺伝子発現プロフィールと予め選択しておいた1つ
    の遺伝子発現プロフィールとの関連性に順位をつけるシステムであって、 (a)前記複数の遺伝子発現プロフィールの各々と予め選択しておいた前記遺伝
    子発現プロフィールとの関連性を対ごとに数値化する手段、 (b)前記対ごとに測定した数値に順位をつける手段 を含んでなる前記システム。
  42. 【請求項42】 第1および第2遺伝子発現プロフィールの関連性を数値化
    するコンピュータシステムであって、 (a)前記第1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対
    して第1および第2遺伝子発現信号を発生させ、 (b)前記第1および第2遺伝子発現信号の各対に対して相対発現スコアを設定
    し、 (c)前記対ごとの相対発現スコアから合成スコアを計算する ようにプログラムされたプロセッサを含んでなり、前記合成スコアによって2つ
    の遺伝子発現プロフィールの関連性を数値化する前記システム。
  43. 【請求項43】 第1および第2遺伝子発現プロフィールの関連性を数値化
    するコンピュータシステムであって、 (a)前記第1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対
    して第1および第2遺伝子発現信号を発生させ、 (b)通常代表とされる前記遺伝子に対する第1および第2遺伝子発現信号対の
    セットに線形回帰を行う ようにプログラムされたプロセッサを含んでなり、このような回帰の相関係数に
    よって2つの遺伝子発現プロフィールの関連性を数値化する前記システム。
  44. 【請求項44】 複数の遺伝子発現プロフィールと予め選択しておいた1つ
    の遺伝子発現プロフィールとの関連性に順位をつけるコンピュータシステムであ
    って、 (a)前記複数の遺伝子発現プロフィールの各々と予め選択しておいた前記遺伝
    子発現プロフィールとの関連性を対ごとに数値化し、 (b)前記対ごとに測定した数値に順位をつける ようにプログラムされたプロセッサを含んでなる前記システム。
  45. 【請求項45】 命令を記憶するためのコンピュータで読取可能な記憶媒体
    であって、コンピュータによって実行されると、第1および第2遺伝子発現プロ
    フィールの関連性を数値化する方法をコンピュータに実行させるものであり、こ
    こで前記方法は、 (a)前記第1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対
    して第1および第2遺伝子発現信号を発生させ、 (b)前記第1および第2遺伝子発現信号の各対に対して相対発現スコアを設定
    し、 (c)前記対ごとの相対発現スコアから合成スコアを計算する ことを含んでなり、前記合成スコアによって2つの遺伝子発現プロフィールの関
    連性を数値化するものである、前記記憶媒体。
  46. 【請求項46】 命令を記憶するためのコンピュータで読取可能な記憶媒体
    であって、コンピュータによって実行されると、第1および第2遺伝子発現プロ
    フィールの関連性を数値化する方法をコンピュータに実行させるものであり、こ
    こで前記方法は、 (a)前記第1および第2遺伝子発現プロフィールを通常代表する各遺伝子に対
    して第1および第2遺伝子発現信号を発生させ、 (b)通常代表とされる前記遺伝子に対する第1および第2遺伝子発現信号対の
    セットに線形回帰を行う ことを含んでなり、このような回帰の相関係数によって2つの遺伝子発現プロフ
    ィールの関連性を数値化するものである、前記記憶媒体。
  47. 【請求項47】 命令を記憶するためのコンピュータで読取可能な記憶媒体
    であって、コンピュータによって実行されると、複数の遺伝子発現プロフィール
    と予め選択しておいた1つの遺伝子発現プロフィールとの関連性に順位をつける
    方法をコンピュータに実行させるものであり、ここで前記方法は、 (a)前記複数の遺伝子発現プロフィールの各々と予め選択しておいた前記遺伝
    子発現プロフィールとの関連性を対ごとに数値化し、 (b)前記対ごとに測定した数値に順位をつける 工程を含んでなるものである、前記記憶媒体。
  48. 【請求項48】 第1および第2遺伝子発現プロフィールの関連を数値で表
    すデータを記憶するように構成されたデータ構造を含む、コンピュータで読取可
    能な記憶媒体であって、前記データ構造は、前記発現プロフィールの各々に対す
    る識別子とスカラーとを含んでなり、前記スカラーは、前記第1遺伝子発現プロ
    フィールと前記第2遺伝子発現プロフィールとを数値として関連づけるものであ
    る、前記記憶媒体。
  49. 【請求項49】 複数の遺伝子発現プロフィールと予め選択しておいた1つ
    の遺伝子発現プロフィールとの関連性に順位をつけるデータを記憶するように構
    成されたデータ構造を含む、コンピュータで読取可能な記憶媒体であって、 (a)スカラーの順位づけされたリスト、ここで、各スカラーは、前記複数の遺
    伝子発現プロフィールの各々と予め選択しておいた前記遺伝子発現プロフィール
    との関連性を対ごとに数値化するものである、および (b)各スカラーと個々の遺伝子発現プロフィールとを関連付ける識別子 を含んでなる、前記記憶媒体。
  50. 【請求項50】 発現分析に有用な遺伝子のサブセットを選択する方法であ
    って、発現が相関し合う各遺伝子群から、最大発現範囲を有する遺伝子を選択す
    ることを含んでなる前記方法。
  51. 【請求項51】 複数の遺伝子発現プロフィールを通常代表する遺伝子のセ
    ットから前記選択を行う、請求項50記載の方法。
  52. 【請求項52】 前記範囲の各々および前記相関の各々を、前記複数の遺伝
    子発現プロフィールにおける発現データから計算する、請求項51記載の方法。
  53. 【請求項53】 前記範囲を、最大発現と最小発現との比率として計算する
    、請求項52記載の方法。
  54. 【請求項54】 前記選択工程が、 (a)前記複数の遺伝子発現プロフィールを通常代表する遺伝子のセットを、発
    現範囲が最大のものから最小のものへ順位づけ、 (b)前記複数の遺伝子発現プロフィールにおける発現が相関し合う各遺伝子群
    から、最大発現範囲を有する遺伝子を選択する サブ工程を含んでなる、請求項52記載の方法。
  55. 【請求項55】 選択を行う前記サブ工程が、 (b1)前記サブセットについて、選択されずに順位づけされたセットに残ってい
    る第1遺伝子を選択し、 (b2)前記複数の遺伝子発現プロフィールから、前記順位づけされたセット中の
    各遺伝子の発現と選択した遺伝子の発現との相関を計算し、 (b3)前記順位づけされたセットから、閾値を超える相関を有する遺伝子を全て
    除外する 工程を繰り返すものである、請求項53記載の方法。
  56. 【請求項56】 順位づけを行う前記工程が、閾値未満の範囲を有する遺伝
    子を全て除外する前段階の工程をさらに含んでなる、請求項53記載の方法。
  57. 【請求項57】 発現分析に有用な遺伝子のサブセットを選択するシステム
    であって、発現が相関し合う各遺伝子群から、最大発現範囲を有する遺伝子を選
    択する手段を含んでなる前記システム。
  58. 【請求項58】 発現分析に有用な遺伝子のサブセットを選択するコンピュ
    ータシステムであって、発現が相関し合う各遺伝子群から、最大発現範囲を有す
    る遺伝子を選択するようにプログラムされたプロセッサを含んでなる前記システ
    ム。
  59. 【請求項59】 命令を記憶するためのコンピュータで読取可能な記憶媒体
    であって、コンピュータによって実行されると、発現分析に有用な遺伝子のサブ
    セットを選択する方法をコンピュータに実行させるものであり、ここで前記方法
    は、発現が相関し合う各遺伝子群から、最大発現範囲を有する遺伝子を選択する
    ことを含んでなるものである、前記記憶媒体。
  60. 【請求項60】 発現分析に有用な遺伝子のサブセットを識別するデータを
    記憶するように構成されたデータ構造を含む、コンピュータで読取可能な記憶媒
    体であって、遺伝子機能の説明を任意に含む遺伝子識別子のセットを含んでなる
    、前記記憶媒体。
  61. 【請求項61】 細胞の表現型をタイピングする方法であって、発現分析を
    行うのに細胞に含まれる発現可能な遺伝子の20%以下を選択することを含んでな
    り、前記選択した遺伝子を同時発現させることによって前記細胞の表現型が十分
    に確定されるため、前記表現型を別の細胞の表現型に数値として関連づけること
    が可能となる前記方法。
  62. 【請求項62】 前記細胞に含まれる発現可能な遺伝子の10%以下を選択す
    る、請求項61記載の方法。
  63. 【請求項63】 前記細胞に含まれる発現可能な遺伝子の5%以下を選択す
    る、請求項62記載の方法。
  64. 【請求項64】 前記細胞に含まれる発現可能な遺伝子の2%以下を選択す
    る、請求項63記載の方法。
  65. 【請求項65】 前記細胞に含まれる発現可能な遺伝子の1%以下を選択す
    る、請求項64記載の方法。
JP2000548511A 1998-05-12 1999-05-11 遺伝子発現分析のための数値化方法、システムおよび装置 Pending JP2002514804A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US7666898A 1998-05-12 1998-05-12
US29265799A 1999-04-15 1999-04-15
US09/076,668 1999-04-15
US09/292,657 1999-04-15
PCT/US1999/010387 WO1999058720A1 (en) 1998-05-12 1999-05-11 Quantitative methods, systems and apparatuses for gene expression analysis

Publications (1)

Publication Number Publication Date
JP2002514804A true JP2002514804A (ja) 2002-05-21

Family

ID=26758353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000548511A Pending JP2002514804A (ja) 1998-05-12 1999-05-11 遺伝子発現分析のための数値化方法、システムおよび装置

Country Status (8)

Country Link
EP (1) EP1076722A1 (ja)
JP (1) JP2002514804A (ja)
KR (1) KR20010052341A (ja)
CN (1) CN1309722A (ja)
AU (1) AU750975B2 (ja)
CA (1) CA2331510A1 (ja)
IL (1) IL139567A0 (ja)
WO (1) WO1999058720A1 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6203987B1 (en) 1998-10-27 2001-03-20 Rosetta Inpharmatics, Inc. Methods for using co-regulated genesets to enhance detection and classification of gene expression patterns
US6468476B1 (en) 1998-10-27 2002-10-22 Rosetta Inpharmatics, Inc. Methods for using-co-regulated genesets to enhance detection and classification of gene expression patterns
US6950752B1 (en) 1998-10-27 2005-09-27 Rosetta Inpharmatics Llc Methods for removing artifact from biological profiles
US6453241B1 (en) 1998-12-23 2002-09-17 Rosetta Inpharmatics, Inc. Method and system for analyzing biological response signal data
US6801859B1 (en) 1998-12-23 2004-10-05 Rosetta Inpharmatics Llc Methods of characterizing drug activities using consensus profiles
US6370478B1 (en) 1998-12-28 2002-04-09 Rosetta Inpharmatics, Inc. Methods for drug interaction prediction using biological response profiles
US6960439B2 (en) 1999-06-28 2005-11-01 Source Precision Medicine, Inc. Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
US6692916B2 (en) 1999-06-28 2004-02-17 Source Precision Medicine, Inc. Systems and methods for characterizing a biological condition or agent using precision gene expression profiles
WO2001029268A2 (en) * 1999-10-18 2001-04-26 Curagen Corporation Method for identifying interacting gene products
US6635423B2 (en) 2000-01-14 2003-10-21 Integriderm, Inc. Informative nucleic acid arrays and methods for making same
EP1263988A2 (en) * 2000-03-09 2002-12-11 Yale University Phytomics: a genomic-based approach to herbal compositions
US7363165B2 (en) 2000-05-04 2008-04-22 The Board Of Trustees Of The Leland Stanford Junior University Significance analysis of microarrays
US7054755B2 (en) 2000-10-12 2006-05-30 Iconix Pharmaceuticals, Inc. Interactive correlation of compound information and genomic information
US6691042B2 (en) 2001-07-02 2004-02-10 Rosetta Inpharmatics Llc Methods for generating differential profiles by combining data obtained in separate measurements
GB0117631D0 (en) * 2001-07-19 2001-09-12 Syngenta Ltd Improvements in or relating to organic compounds
JP5236856B2 (ja) 2001-11-09 2013-07-17 ライフ テクノロジーズ コーポレーション 遺伝子発現プロファイルを用いる病気の同定、観測及び治療及び生物学的状態の同定
WO2003091450A1 (en) * 2002-04-24 2003-11-06 Azign Bioscience A/S Method for evaluating a therapeutic potential of a chemical entity
FR2840323B1 (fr) * 2002-05-31 2006-07-07 Centre Nat Rech Scient Methode d'analyse des variations de transcription d'un ensemble de genes
US7588892B2 (en) 2004-07-19 2009-09-15 Entelos, Inc. Reagent sets and gene signatures for renal tubule injury
US7467118B2 (en) 2006-01-12 2008-12-16 Entelos Inc. Adjusted sparse linear programming method for classifying multi-dimensional biological data
KR100829867B1 (ko) * 2006-12-05 2008-05-16 한국전자통신연구원 유전자 발현 프로파일을 이용한 유전자 군집화 방법
KR100964181B1 (ko) * 2007-03-21 2010-06-17 한국전자통신연구원 유전자 어휘 분류체계를 이용한 유전자 발현 프로파일군집화 방법 및 그 장치
KR101394339B1 (ko) * 2012-03-06 2014-05-13 삼성에스디에스 주식회사 시드의 길이를 고려한 염기 서열 처리 시스템 및 방법
CN106575321A (zh) * 2014-01-14 2017-04-19 欧米希亚公司 用于基因组分析的方法和系统
CN108664769B (zh) * 2017-03-31 2021-09-21 中国科学院上海营养与健康研究所 基于癌症基因组和非特异性基因标签的药物重定位方法
CN107723343B (zh) * 2017-11-28 2021-03-23 宜昌美光硅谷生命科技股份有限公司 一种基因定量分析的方法
CN109935341B (zh) * 2019-04-09 2021-04-13 北京深度制耀科技有限公司 一种药物新适应症的预测方法及装置
CN113539366A (zh) * 2020-04-17 2021-10-22 中国科学院上海药物研究所 一种用于预测药物靶标的信息处理方法及装置
CN112687370B (zh) * 2020-12-28 2023-12-22 北京博奥晶方生物科技有限公司 一种电子药方生成方法、装置及电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2111289T5 (es) * 1993-01-21 2005-07-16 President And Fellows Of Harvard College Metodos y kits de diagnostico que emplean promotores de estres en mamiferos para determinar la toxicidad de un compuesto.
US5777888A (en) * 1995-08-09 1998-07-07 Regents Of The University Of California Systems for generating and analyzing stimulus-response output signal matrices
US5569588A (en) * 1995-08-09 1996-10-29 The Regents Of The University Of California Methods for drug screening
WO1997013877A1 (en) * 1995-10-12 1997-04-17 Lynx Therapeutics, Inc. Measurement of gene expression profiles in toxicity determination
US6156502A (en) * 1995-12-21 2000-12-05 Beattie; Kenneth Loren Arbitrary sequence oligonucleotide fingerprinting

Also Published As

Publication number Publication date
WO1999058720A1 (en) 1999-11-18
EP1076722A1 (en) 2001-02-21
AU4075199A (en) 1999-11-29
CA2331510A1 (en) 1999-11-18
CN1309722A (zh) 2001-08-22
KR20010052341A (ko) 2001-06-25
AU750975B2 (en) 2002-08-01
IL139567A0 (en) 2002-02-10

Similar Documents

Publication Publication Date Title
JP2002514804A (ja) 遺伝子発現分析のための数値化方法、システムおよび装置
AU724474B2 (en) Methods for drug screening
EP0862649B1 (en) Systems for generating and analyzing stimulus-response output signal matrices
Pavlinov et al. Next generation diversity-oriented synthesis: a paradigm shift from chemical diversity to biological diversity
Marton et al. Drug target validation and identification of secondary drug target effects using DNA microarrays
Knott et al. Genome-wide replication profiles indicate an expansive role for Rpd3L in regulating replication initiation timing or efficiency, and reveal genomic loci of Rpd3 function in Saccharomyces cerevisiae
Chesler et al. Genetic correlates of gene expression in recombinant inbred strains: a relational model system to explore neurobehavioral phenotypes
CA2356696C (en) Statistical combining of cell expression profiles
AU6159599A (en) Methods for identifying multiple primary targets of a drug
US6574568B2 (en) Systems for generating and analyzing stimulus-response output signal matrices
Bao et al. Identifying genes related to drug anticancer mechanisms using support vector machine
Sturgeon et al. Yeast as a tool to uncover the cellular targets of drugs
JP2023517903A (ja) 細菌の表現型形質をそのゲノムから予測するための分子技術
Mary-Huard et al. Spotting effect in microarray experiments
EP1524319A1 (en) Method of classifying chemical agents and identifying cellular targets thereof
US10174312B2 (en) Screening method for drug target gene using heterozygous deletion fission yeast strain
JP3669511B2 (ja) 刺激−応答出力信号マトリックスの生成および分析のためのシステム
JP2006141298A (ja) 細胞に対する被検物質の評価
Sletta et al. A new high resolution screening method for study of phenotype stress responses of Saccharomyces cerevisae mutants
Awofala Application of microarray technology in Drosophila ethanol behavioral research
Mao et al. A new strategy of cooperativity of biclustering and hierarchical clustering: A case of analyzing yeast genomic microarray datasets
Braam et al. Expression profiling in cardiovascular disease using microarrays
CA2343076A1 (en) Geometrical and hierarchical classification based on gene expression
Singh et al. Extraction of Differentially Expressed Genes in Microarray Data
Singh et al. EXTRACTION OF DIFFERENTIALLY EXPRESSED MICROARRAY GENES DATA IN