JP2002525079A

JP2002525079A - 遺伝子発現に基づく幾何的および階層的分類

Info

Publication number: JP2002525079A
Application number: JP2000570378A
Authority: JP
Inventors: ジョエルエス．ベイダー，
Original assignee: キュラジェンコーポレイション
Priority date: 1998-09-17
Filing date: 1999-09-17
Publication date: 2002-08-13
Also published as: EP1114187A1; AU6047299A; CA2343076A1; WO2000015851A1

Abstract

(57)【要約】本発明は、少なくとも２つの種類の細胞の間の関連性の程度の表現物を生成するための方法を提供する。

Description

【発明の詳細な説明】

【０００１】（発明の分野）本発明は、ソフトウェアアルゴリズムに基づく分析を用いる遺伝子発現のゲノ
ム分析に基づく細胞、細胞株、組織、器官、または発現配列間の関連性の程度の
表現物に関する。

【０００２】（関連出願）本出願は、米国出願番号（１９９９年９月１６日出願；表題「遺伝子
発現に基づく幾何的および階層的分類」）および米国仮出願番号第６０／１０１
，００９号（１９９８年９月１７日出願；表題「系統ゲノミクスおよび薬理ゲノ
ミクス」の両方に対して優先権の利益を主張し、これらはその全体が本明細書中
に参考として援用される。

【０００３】（発明の背景）近年において、ゲノミクスおよびプロテオミクスの急速な発達が、提供された
新規な情報を使用する適用の拡大に至っている。このような情報が使用されるよ
うになる重要な領域は、病理学的状態における遺伝子の示差的な発現に従うこの
ような状態の群分けおよび特徴付けにある。最終的な適用は、種々の病的状態の
処置に用いられる既知または候補の薬剤の治療効果の群分けおよび特徴づけにあ
る。種々の統計学的手順を用いるアルゴリズムは、このような分析から得られる
情報の発見的表示を作製するために使用されている。これらの表示は、特定の実
験結果を表現するために、要素が、例えば、偽カラーコード化によってコード化
される、大きな二次元のまたはより高い次元でさえあるアレイを備える。別の表
示は、実験データが、関連性の表現として分岐状または放射状のツリー構造を生
成するために使用されるアレイを備える。さらに、いくつかの異なる生物学的状
態にわたる同時発現のパターンに従って発現配列を群分けするために同様の方法
を使用することもまた可能である。

【０００４】例えば、酵母Ｓａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅおよび初代
ヒト線維芽細胞におけるゲノム広域発現のためのクラスター分析のシステムが、
Ｅｉｓｅｎら（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９５：１４８
６３−１４８６８（１９９８））により提示されている。酵母での作業において
、この生物由来の本質的にあらゆるＯＲＦを有するＤＮＡマイクロチップアレイ
が使用された。示差的な発現を、生理学的状態（ジオーキシンシフト（ｄｉａｕ
ｘｉｃｓｈｉｆｔ）、有糸分裂細胞分裂周期、胞子形成、ならびに温度および
減少ショック（ｒｅｄｕｃｉｎｇｓｈｏｃｋ）を含む）を変動させることによ
り研究した。ヒト線維芽細胞が、血清枯渇後の血清で刺激し、そして約８，６０
０の異なるヒト転写物を表現する９，８００のｃＤＮＡを有するマイクロアレイ
を用いて試験された。さらに、これらの実験におけるさらなる独立した変数は、
アッセイ点を採った時間である。種々の研究における示差遺伝子発現を反映する
データが、対形成平均連鎖クラスター分析（Ｓｏｋａｉら、Ｕｎｉｖ．Ｋａｎｓ
．Ｓｃｉ．Ｂｕｌｌ．３８：１４０９−１４３８（１９５８））を用いて分析さ
れた。この分析は、全ての要素を一つのツリーに集合する系統樹を計算するため
に使用された。

【０００５】４０の腫瘍サンプル由来の結腸線癌が、ヒトｃＤＮＡ由来の配列が結合された
ＡｆｆｙｍｅｔｒｉｘＤＮＡチップを用いて、２２の正常な結腸組織サンプル
と比較された（Ａｌｏｎら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ
９６：６７４５−６７５０（１９９９年６月））。３，２００の全長ヒトｃＤＮ
Ａおよび３，４００のＥＳＴが、配列の中央部に１つの塩基ミスマッチを含むこ
のような配列と同様に、２５ｂｐのフラグメントのセットにおいて表現される。
腫瘍組織サンプルおよび正常結腸サンプルの両方における遺伝子発現が、ハイブ
リダイゼーションによって評価された。遺伝子間の相関の統計学的有意性は、対
形成相関係数を算出することにより評価された。発現された遺伝子のクラスター
形成は、２分木でデータを組織化する確定的アニーリング（ｄｅｔｅｒｍｉｎｉ
ｓｔｉｃａｎｎｅａｌｉｎｇ）に基づくアルゴリズムを用いて評価された（Ｒ
ｏｓｅら、Ｐｈｙｓ．Ｒｅｖ．Ｌｅｔｔ．６５：９４５−９４８（１９９０）；
Ｒｏｓｅ、Ｐｒｏｃ．ＩＥＥＥ９６：２２１０−２２３９（１９９８））。デ
ータは、大きな二次元カラーコード化アレイとして提示されている。遺伝子が一
方の次元に沿って表示され、そして組織サンプルが他方に沿って表示されている
；人工カラー値は、第三の次元において発現の程度を示すために各アレイ点に割
り当てられている。クラスター形成分析は、種々のランダム化手順が適用される
場合に破壊されるアレイ内のカラー分布におけるパターンを明示する。データセ
ットにおける遺伝子のクラスター形成は、その発現が組織タイプにわたって相関
される遺伝子群を明示する。このアルゴリズムは、組織を別個のクラスターに分
ける。

【０００６】癌化学療法において実際に使用される化合物または使用のためにスクリーニン
グされる化合物の薬理学的効果は、ＮａｔｉｏｎａｌＣａｎｃｅｒＩｎｓｔ
ｉｔｕｔｅでクラスター分析によって分析された（Ｗｅｉｎｓｔｅｉｎら、Ｓｃ
ｉｅｎｃｅ２７５：３４３−３４９（１９９７））。６０，０００を超える化
合物が、６０のヒト癌細胞株のパネルに対してスクリーニングされた。所定の細
胞株における化合物の５０％の成長阻害濃度は、全ての細胞株にわたって分析し
た場合、薬物作用および薬物耐性の機構についての詳細な情報を提供した。活性
のパターンが、ＣＯＭＰＡＲＥアルゴリズムによってまず分析された（Ｐａｕｌ
ｌら、Ｊ．Ｎａｔｌ．ＣａｎｃｅｒＩｎｓｔ．８１：１０８８（１９８９）；
Ｊａｙａｒａｍ、Ｂｉｏｃｈｅｍ．Ｂｉｏｐｊｙｓ．Ｒｅｓ．Ｃｏｍｍｕｎ．１
８６：１６００（１９９２）；Ｐａｕｌｌら、ＣａｎｃｅｒＣｈｅｍｏｔｈｅ
ｒａｐｅｕｔｉｃＡｇｅｎｔｓ、Ｆｏｙｅ（編）、ＡｍｅｒｉｃａｎＣｈｅ
ｍｉｃａｌＳｏｃｉｅｔｙ、ＷａｓｈｉｎｇｔｏｎＤＣ、１９９３、１５７
４−１５８１；Ｂｏｙｄら、ＤｒｕｇＤｅｖ．Ｒｅｓ．３４：９１（１９９３
））。開発された手順は、３つのデータベース、つまり候補化合物についての構
造情報を特徴付けるＳデータベース、６０の細胞株に関連したＡデータベース、
および作用の分子標的に対する情報を含むＴデータベースに依存する。分析の結
果の一例において、標的に対する化合物を表示する三次元アレイ（偽カラーコー
ドが、アレイにおける各位置について第三の次元で相関係数を提供する）が開発
された。

【０００７】ゲノムに由来する属性の相関およびクラスター形成のために現在使用されてい
る手順の考慮の際に、特定の問題が生じる。ＤＮＡマイクロチップの使用は、そ
のチップに結合された捕捉プローブとして使用されるＤＮＡ配列フラグメントの
サンプリングに対して、いかなる分析をも固有に制限する。捕捉プローブの１つ
とハイブリダイズしないＤＮＡフラグメントの検出は可能ではなく、そのため、
陽性の結果が失われる可能性がある。さらに、変異生成または他の対立遺伝子多
型が、中程度または低いストリンジェンシーの条件下では捕捉プローブに結合し
ないかもしれず、そのためまた、陽性の結果に関する情報が失われるかもしれな
い。

【０００８】これらの理由のために、研究中の生物のゲノムへのより包括的な接近可能性に
基づくゲノム統計学的分析の方法の必要性がある。さらに、遺伝子の関連性のゲ
ノム分析において、および実際のまたは候補の薬剤への応答のゲノム分析におい
て得られた情報（問題のゲノムへの包括的な接近から収集された情報を含む）を
提示する様式についても、依然、必要性がある。本発明は、特定の研究において
独立した変数として出現する成分のクラスター形成分析における、多数の配列デ
ータベースから利用可能な部分ゲノム配列および全長ゲノム配列の、本発明にお
いてなされる使用のために、これらの必要性に取り組む。

【０００９】（発明の要旨）本発明は、データセットの少なくとも２つの種類間での幾何的および階層的分
類の新規な方法を提供する。データセットは、細胞、核酸配列、ポリペプチド配
列などを表現し得る。本発明はまた、記載された種類の細胞の核酸部分に関する
インプット情報を提供するために、標準的なＤＮＡマイクロチップアレイおよび
非ＤＮＡチップ技術の両方を利用することができる。次いで、データは、目視に
よって容易に判読可能な関連性の表現物を提供するために、種々の様式で処理さ
れる。本発明はさらに、細胞の少なくとも２つの種類間の相関であって、種類間
に存在する核酸の組成および量におけるいかなる変化も反映する相関の表現物を
生成するための新規な方法を提供する。

【００１０】この細胞種類は、種々の細胞集団間の差異を比較する際の使用のために、異な
る供給源由来であり得る。これらの差異としては、種差異、組織差異、疾患状態
差異、および薬物処置差異が挙げられるが、これらに限定されない。コンピュー
ターアルゴリズムは、選択された細胞種類間の差異を反映するインプットデータ
を分析し、そして意味のある様式でそれらを表現する。

【００１１】本発明より前では、インプット情報は、比較されるべき細胞種類の核酸を分析
するために、ＤＮＡチップ技術を用いることによってのみ得られた。これらの方
法についての欠点は、同定者配列が、既に知られ、そして単離されている必要が
あること、チップ技術が、チップ上に固定化される核酸の数に関連したサイズの
制限を有すること、およびこのチップは、一旦製造されると、核酸パラメーター
を拡大することが事実上不可能であることである。本発明は、インプット細胞種
類間の差異をアッセイするための、ＧｅｎｅＣａｌｌｉｎｇ^TM、非ＤＮＡチップ
技術の使用を提供する。予期されない結果は、ＧｅｎｅＣａｌｌｉｎｇ^TMが、上
記の共通点のない群の間の感度の高い比較を提供し得ることであり、それにより
、インプット核酸集団をアッセイする場合のＤＮＡチップ技術の使用に固有の制
限を回避する。

【００１２】本発明は、差分ベクトルの振幅を反映する距離を計算することにより、種類間
のフラグメントの存在および量における類似性または差異を反映する、関連性の
程度を生成するための新規な方法を提供する。関連性の表現物を生成するための
方法の顕著な実施態様において、この関連性の程度は、任意の２つの種類間の関
連性を反映するツリー構造を生成することにより提供される。ツリー構造のブラ
ンチは、差分ベクトルを反映し、そしてノードから分岐している。

【００１３】本発明はまた、データセットの種類間の相関の表現物を生成するための新規な
方法を提供する。相関の表現物を生成するための方法の顕著な実施態様において
、この相関は、正規直交固有ベクトルのセットに関連している。相関の表現物を
生成するための方法の別の顕著な実施態様において、この表現物は、クラスター
ダイアグラムまたは系統樹であり、そしてこの２つの種類の細胞間の差異に対す
る生化学的応答または生理的応答に関与する経路の関連性を反映するツリー構造
を含む。

【００１４】本発明はさらに、データセットの種類間の差異の幾何的表現物を提供すること
に関する。幾何的表現物は、例を限定しないが、主成分分析および主要因分析、
ならびにそれらから派生した次元を下げた表現物を包含する。この幾何的表現物
は、遺伝子、核酸、またはそれらのフラグメントの存在について分析する任意の
方法（核酸マイクロチップアレイ、および発現遺伝子または核酸フラグメントの
差分表示を含む）をも使用して、細胞の種類間で決定された差異に基づく。

【００１５】本発明は、表現物それ自体に加えて、データセットの種類間の関連性の程度の
表現物、相関、および差異の幾何的表現物を表示するための表示手段もまた提供
する。

【００１６】（詳細な説明）本発明は、細胞の任意の２個以上の異なる種類の細胞間の関連性の表現物を作
製するための方法に関する。この種類は、動物および植物生物に発生する細胞を
広く包含し、この細胞はさらに正常な細胞または疾患状態の細胞（腫瘍細胞を含
む）である。それらは、推定上の薬学的薬剤で処置された細胞をさらに含む。こ
の表現物は、細胞性供給源の各々に由来する核酸フラグメントに関するサイズお
よび配列の情報を提供する実験的データを使用して得られる。このフラグメント
は、幾つかの方法のいずれかで、各種類の細胞の核酸内容物から調製され得る。
例えば、特に重要な実施態様において、それらは特定の一対の制限エンドヌクレ
アーゼによって消化に供され得る；あるいは、別の重要な実施態様において、細
胞抽出物は、特別に設計されたプライマーオリゴヌクレオチドを使用して増幅に
供され得る。本発明はまた、そのように生成された核酸フラグメント間の同時発
現に関して、関連性の表現物を作製するための方法に関する。

【００１７】本発明はさらに、これらの方法によって提供される表現物、およびこのような
表現物が表示される表示手段に関する。制限エンドヌクレアーゼの使用または増
幅プライマーの適用のようなフラグメントを調製するための方法が、得られるフ
ラグメントの末端に関する配列情報を提供するために選択され、一方で、サイズ
決定がフラグメントの長さを提供する。これらのタイプの情報の特定の適用にお
いて、このサイズおよび配列の結果は、補正した長さおよび末端サブ配列を有す
る公知の完全核酸配列の１つまたはそれ以上の候補フラグメントの同一性を提供
するために、公知の核酸配列を提供するデータベースに対して必要に応じてスキ
ャンされ得る（米国特許第５，８７１，６９７号；Ｓｈｉｍｋｅｔら、１９９９
ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ１７：７９８−８０３）。この
データベースを探索する工程は、本発明の必要とされる特徴ではない。この理由
のために、本表現物および方法は、それらの現在公知のものよりも、サンプル間
のより包括的なおよび情報量の多いゲノムの変異物である。本発明の背景に記載
されるように、現在公知の手順は、与えられた手順のプローブ配列としてＤＮＡ
マイクロチップに適用されるそれらの核酸フラグメントに対するそれらの包括性
に制限される。公知のゲノム配列を有するモデル生物の狭く限定されたセットを
除いて、このようなプローブ配列の数は、配列データベースにおいて有用であり
本発明で使用される公知の核酸配列の数より相当少ない。さらに、完全に配列決
定されたゲノムの場合でさえ、遺伝子改変物は現存するＤＮＡマイクロチップで
は、適切にプローブ化されない。この相違は、本発明の重要な利点を特徴付ける
。

【００１８】本発明はさらに、細胞の種類間の相違の幾何的表現物を提供する工程に関する
。幾何的表現物は、非限定的例として、主成分分析および主因子分析、ならびに
それらに由来する減少した寸法の表現物を包括する。この幾何的表現物は、遺伝
子、核酸またはそれらのフラグメントの存在を分析するための任意の方法を使用
して細胞の種類間で決定される相違に基づく。この方法には、核酸マイクロチッ
プアレイおよび発現された遺伝子または核酸フラグメントの差次的表示を含む。

【００１９】本明細書中で使用される「サンプル」は、計画が固定されたままである場合に
全ての変数が研究される特定の実験条件に関する。非限定的例として、変数が細
胞の種類である場合、「サンプル」は特定の細胞のタイプをいい；変数が計画に
おいて使用される配列対である場合、「サンプル」は特定の配列対をいい；また
は変数が１セットの推定上の薬学的薬剤である場合、「サンプル」はこのセット
からの特定の薬剤をいう。本明細書中で使用される「表現物」は、本発明の方法
に従って得られる結果の画像を提供する任意の図解的、視覚的または等価な非言
語の表示をいう。より具体的には、本発明の「表現物」は、本発明の根底をなす
実験によって集められた定量的結果を変換することによって得られる。このよう
なデータの例には、非限定的な例として、細胞の種類および／または推定上の１
セットの治療学的薬剤にわたる差次的遺伝子発現、ならびに／あるいは実験的パ
ラメータの等価なタイプが挙げられる。

【００２０】重要な実施態様において、本発明の表現物は、コンピュータで実行されるアル
ゴニズムによって生成され、そしてコンピュータの操作において使用されるディ
スプレイスクリーンまたはモニタのような表示手段への表示に適している。この
表現物はまた、記憶モジュールへの記憶またはこのようなコンピュータのデータ
獲得に適している。それは、コンピュータから紙のような媒体または等価な物理
的媒体への印刷、および携帯記憶媒体（例えば、磁気媒体、ＣＤＲＯＭおよび
等価な記憶媒体が挙げられる）への記録になおさらに適している。本明細書中で
使用される「表示手段」として、この段落の上で同定された任意の物体および媒
体、ならびに視覚的検査のための計算処理の結果を表示するために適切な等価な
機器および物体が挙げられる。

【００２１】本明細書中で使用される「関連性の程度」は、同じタイプの要素の２つのメン
バ間の類似度または非類似度の本発明の方法に従う特徴であり；特に重要な実施
態様において、要素のタイプは細胞の種類であり得る。

【００２２】本明細書中で使用される「推定上の薬学的薬剤」は、治療学的薬剤であるため
の候補である化学的化合物、または少なくとも１つの化学的化合物を含有する組
成物に関する。任意のこのような治療学的薬剤は、疾患または症状に羅患する哺
乳動物を処置する際に使用され得る。治療学的薬剤によって哺乳動物を処置する
際に、疾患または症状の兆候および／または潜在する原因を減弱し、その兆候お
よび／または潜在する原因を改善し、その疾患または症状の治癒に寄与すること
が意図される。推定上の薬学的薬剤の非限定的な例には、化学的化合物ライブラ
リーから引き出される薬剤；天然源由来の単離物；特に推定上の薬剤として合成
された化合物；あるいは、組換えタンパク質、組換えタンパク質のフラグメント
、組換えポリペプチド、組換えポリペプチドのフラグメント、組換えペプチドま
たは核酸（例えば、アンチセンス薬剤を意図するオリゴヌクレオチドおよび遺伝
子治療学的薬剤としての投与を意図する組換え遺伝子）のような遺伝子工学およ
び組換え核酸技術の実践を使用して誘導されるかまたは得られる物質が挙げられ
る。

【００２３】本明細書中で使用される核酸の「フラグメント」は、１種類の細胞由来の遺伝
子またはｃＤＮＡ由来の核酸から発生する連続部分をいう。この連続部分は、各
末端またはその近傍に、本明細書中で開示される操作手順に従って規定される標
的サブ配列を含み、２つの標的サブ配列によって結合されるフラグメントの配列
内の全てのヌクレオチドを含む。２つの標的サブ配列間のヌクレオチドは、それ
ら自体サブ配列と一緒になって、本明細書中で使用されるフラグメントの「長さ
」を規定する。標的サブ配列は、例えば、細胞由来の核酸を特定の制限エンドヌ
クレアーゼの対、または特定のオリゴヌクレオチドプライマーの対と、等価な様
式で接触させる工程によって同定される。

【００２４】本発明で使用される情報は、差次的な遺伝子発現の結果を提供する実験から得
られ、ここでこの差分は、実験状態および基準状態に関する。通常、基準状態は
、正常な、あるいは混乱しないまたは非症状の種類の細胞をいう。実験状態は、
１種類の細胞に適用される特定のセットの状態に関し得、次いでその対応する基
準状態は、第２のクラスの細胞に適用される同じセットの状態に関する。実験状
態はまた、１つまたはそれ以上の推定上の治療学的薬剤の存在下の１種類の細胞
に関し、この場合、基準状態は任意の推定上の治療学的薬剤の非存在下の同じク
ラスの細胞に関する。実験状態はさらに、特定のセットの環境にある目的の１種
類の細胞から得られ得る。これには、所定の細胞のタイプの細胞、所定の組織由
来の細胞、および所定の器官由来の細胞が挙げられ、さらに、非癌性または癌性
であり得る細胞が挙げられる。本発明内に包含される細胞の種類には、非限定的
な例として、内皮細胞、中皮細胞、および上皮細胞が挙げられる。本発明内に含
まれる組織および器官には、非限定的な例として、肺、心臓、骨格筋、平滑筋、
脳、中枢神経系、末梢神経系、胃、肝臓、腎臓、生殖組織および器官、皮膚、な
らびに骨が挙げられる。癌細胞には、非限定的な例として、前立腺ガン、乳ガン
、大腸ガン、肺ガン、リンパ性または造血性ガン由来の細胞が挙げられ、これは
また、組織生検または国立がん研究所ヒト腫瘍細胞株パネルの細胞株から得られ
た細胞を含む。本発明に供される細胞はまた、植物、酵母、真菌、および他の分
類学的群から起源し得る。

【００２５】細胞の種類間（例えば、第１種類の細胞と第２種類の細胞との間）の関連性の
程度を評価する方法は、その２種類の細胞間の特定の遺伝子の発現の関連性の程
度を評価する際に見出される。本発明のより好ましい実施態様において、特定の
制限エンドヌクレアーゼの対による消化に対する細胞内に存在する核酸の感受率
の類似性および差違が、本発明の方法に従って、Ｒｏｔｈｂｅｒｇらの共有に係
る米国特許第５，８７１，６９７号およびＳｈｉｍｋｅｔｓら１９９９（Ｎａｔ
ｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ１７：７９８−８０３）（これらの両方と
も本明細書中において全体を通して参考として援用される）に詳細に開示される
手順によって決定された。

【００２６】簡潔に述べると、１種類の細胞の任意の実験状態の場合、好ましくは細胞由来
の、ｃＤＮＡの調製物の形態にある細胞の核酸内容物が、特定のエンドヌクレア
ーゼの対によって制限エンドヌクレアーゼ（「ＲＥ」）消化に供される。ＲＥ対
の各メンバーは、ヌクレアーゼ消化から生じる制限フラグメントが唯一のフラグ
メントである可能性を最適化するように選択される。この方法の重要な実施にお
いて、その制限ヌクレアーゼ消化は所定の実験状態にある種類の細胞から調製さ
れたｃＤＮＡについて実施される。この実施は、実験状態で発現される遺伝子の
強調をもたらし、これらの多くは所定の実験状態の特徴であり得、そしてより不
十分に発現され得るか、または異なる実験状態において有意に全く発現され得な
い。多数の特定のヌクレアーゼの対が使用され得る。あるいは、遺伝子の発現は
、特徴的様式で、所定の実験状態で抑制され得、そしてより高いレベルで（例え
ば、構成的なレベルで）異なる実験状態で発現され得る。非限定的な例として、
本発明を実施する際に使用され得る幾つかの制限ヌクレアーゼの対が米国特許第
５，８７１，６９７号に開示される。

【００２７】代替の実施態様において、関連性の程度は、増幅フラグメント長多型分析（「
ＡＦＬＰ」）によって得られ得る。簡潔に述べると、試験される種類の細胞の核
酸内容物の増幅は、プライマー依存型増幅手順に供され、ここでは、１セットの
プライマー対のいずれかが増幅を開始するために使用される。増幅手順は、例え
ば、Ｉｎｎｉｓら、ＰＣＲＰｒｏｔｏｃｏｌｓ，ａＧｕｉｄｅｔｏＭｅ
ｔｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ，ＡｃａｄｅｍｉｃＰｒｅｓ
ｓ，ＮｅｗＹｏｒｋ（１９８９），およびＩｎｎｉｓら．，ＰＣＲＳｔｒａ
ｔｅｇｉｅｓ，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＮｅｗＹｏｒｋ（１９９５）
にかなり詳細に記載される。各プライマー対のプライマーは、互いに異なり、増
幅プロセスの対象である異なるサブ配列を反映する。増幅は、分子生物学の分野
において公知のポリメラーゼ鎖反応を含む任意の手順によって実施される得る。
ＡＦＬＰにおいて、所定の実験状態に見出されるアンプリコンの長さは異なる実
験状態に見出される長さと異なる。これは、例えば、所定の実験状態が、増幅反
応に使用されるプライマーによって認識されるサブ配列に起こる変異から生じる
場合に、生じ得る。それはまた、その状態にある細胞の核酸の欠失またはその核
酸内への挿入から生じ得る。

【００２８】本発明の表現物を生成するために使用され得る実験手順および計算手順が、以
下に一般的に記載される。

【００２９】（測定）まず、遺伝子発現レベルは、実験的に決定される。これは、好ましい実施態様
において、制限エンドヌクレアーゼを使用して差次的発現の遺伝子プロトコル（
米国特許第５，８７１，６９７号）に従って実施され得る。各対の制限酵素およ
び各生物学的サンプルに対して、蛍光標識されたＤＮＡフラグメントのプールが
生成される。次いで、電気泳動が実施され、これらのフラグメントを大きさに基
づいて分離し、そしてＩ_srt（ｘ）で表される強度が検出される：ここで、ｓは
サンプル（すなわち、細胞の種類）を示し；ｒは制限酵素対、すなわち遺伝子フ
ラグメントを示し；ｔは試行（ｔｒｉａｌ）を示し、そしてｘは、電気泳動によ
って決定されるフラグメントの長さである。長さｘは、連続した指数（ｃｏｎｔ
ｉｎｕｏｕｓｉｎｄｅｘ）または都合の良い打切り（ｃｏｎｖｅｎｉｅｎｔ
ｄｉｓｃｒｅｔｉｚａｔｉｏｎ）のいずれかであり得る。例として、電気泳動図
の解像度は、０．１ヌクレオチド（「ｎｔ」）の打切りに設定され得る。通常、
これらの独立した試行が実施される。平均シグナルＩ_sr（ｘ）は、次いで、ｎ_t
回の試行を平均することによって得られる。

【００３０】Ｉ_st（ｘ）＝（１／ｎ_t）Σ_tＩ_srt（ｘ）Σ_j （Ｉ）次に、各制限酵素の対ｒに関する長さｘ（ここで、サンプルのいくつかは、測
定された強度において有意な差分を有する）が同定される。このような差分は、
細胞型に関して、または推定薬剤の存在対非存在に関して決定される。この
ような差分ｄをｄ番目とし、値Ｉ_sd＝Ｉ_sr（ｘ）が次いで集合される。有意な差
分を同定するためのいくつかの方法がいずれも使用され得、それらのいくつかは
本明細書中に概説される。例えば、重要な方法は、以下の計算ステップを包含す
る：１．平均Ｉ_r（ｘ）＝Σ_sＩ_sr（ｘ）が評価される。

【００３１】２．全ての位置、すなわち、長さ（ここで、少なくとも１つのサンプルにつ
いて、Ｉ_sr（ｘ）−Ｉ_r（ｘ）はある閾値よりも長い）がマークされる。

【００３２】３．Ｉ_sr（ｘ）−Ｉ_r（ｘ）の最大値（サンプルの状態と制限酵素対ｒにつ
いての平均との間の差分として決定される）が見出され、そして長さｘ（差分を
示す）がマークされる。

【００３３】４．ステップ３は、強度の差分の逐次的に減少する値に対して繰り返される
。このとき最も大きな差分をマークする長さｘが、以前に同定された差分の長さ
から距離ｗ内にあり、このときの差分はスキップされ、そして次に小さい差分が
考慮される。

【００３４】５．ステップ４は、もはや考慮される差分が存在しなくなるまで繰り返され
る。

【００３５】別の方法は、統計的基準と一致する差分を見出すステップを包含する。このよ
うな方法の特定の例は、以下の計算ステップを包含する：１．１セットのサンプルの種類を規定し、そして各サンプルを特例の種類ｃ
に対して割当てるステップ；２．各制限酵素対ｒおよび長さｘについて、測定値Ｉ_sr（ｘ）および細胞が
割当てられた種類ｃのセットについてのＦ統計を評価し、これによって、サンプ
ル種類間の任意の差分がランダム変数によって説明され得る、確率ｐ_r（ｘ）を
提供するステップ（例えば、Ｐ．Ｈｉｎｔｏｎ，ＳｔａｔｉｓｔｉｃｓＥｘｐ
ｌａｉｎｅｄ，Ｒｏｕｔｌｅｄｇｅ、１９９５を参照）；３．確率ｐ_r（ｘ）を最も小さいのも（最も有意）から最も大きいもの（最
も有意でない）まで序列するステップ；４．必要に応じて、ｐ_r（ｘ）の同一閾値でのリスト仕切り、その閾値より
も大きな差分はもはや有意とはみなされない（許容値はＰ_r（ｘ＝０．０１〜０
．０５である）ステップ；５．ｐ_r（ｘ）の最小値を見出し、そしてその長さｘを制限酵素対ｒに対す
る差分としてマークする、ステップ；６．ステップ４を繰り返し、そして、そのときの差分をマークする長さｘが
、以前差分の距離ｗ内にある領域に存在するか否かを決定し、この場合、このと
きの差分がスキップされ、そして次に小さい差分が考慮される、ステップ；なら
びに、７．もはや考慮される差分が存在しなくなるまで続けるステップ。

【００３６】これらの例示的な計算手順は、差分ｄにおけるサンプル中の細胞の種類に対す
る、強度Ｉ_sdの尺度のセットを提供する。

【００３７】（距離）階層型クラスター化について、距離Ｄ_ss'は、ベクトル空間におけるサンプル
ｓとサンプルｓ’との対の間の距離として規定され得る。Ｄ_ss'を計算するため
の種々の方法が利用できる。制限されないことが意図される、いくつかの例を以
下に提供する。

【００３８】スケールド（ｓｃａｌｅｄ）相関関係としてのＤ_ss'：１．μ_d＝（１／ｎ_s）Σ_sＩ_sdおよびσ_d＝［（１／ｎ_s）Σ_s（Ｉ_sd−μ_d）² ］^0.5を計算する。データがない場合（例えば、あるサンプルｓについてのＩ_sd
の測定値が存在しない）、このサンプルは和から排除され、そしてｎ_sは、１減
少される。。

【００３９】２．Ｊ_sd＝（Ｉ_sd−μ_d）／σ_dを計算する。Ｉ_sdに関するデータがない場合
、Ｊ_sdはＪ_sd＝０と規定される。

【００４０】３．μ_s＝（１／ｎ_d）Σ_dＪ_sdおよびσ_s＝［（１／ｎ）Σ_d（Ｊ_sd−μ_s）²
］^0.5を計算する。

【００４１】４．Ｋ_sd＝（Ｊ_sd−μ_s）／σ_sを計算する。

【００４２】５．共分散行列Ｓ_ss＝（１／ｎ_d）Σ_dＫ_ddＫ_s'dを計算する。

【００４３】６．相関行列Ｃ_ss'＝Ｓ_ss'／［Ｓ_ssＳ_ss'］^0.5を計算する。

【００４４】７．Ｄ_ss'＝［２−２Ｃ_ss’］^0.5を計算する。

【００４５】ユークリッド距離としてのＤ_ss'：Ｄ_ss'＝［Σ_s（Ｉ_sd−Ｉ_s'd）²］^0.5。

【００４６】ピヤソン距離としてのＤ_ss'：Ｄ_ss'＝［Σ_d（Ｉ_sd−Ｉ_s'd）²−σ_d ²］^0.5、
ここで、σ_dは、上記スケールド相関関係のステップ１に規定される。

【００４７】対（ｐａｉｒｗｉｓｅ）ピヤソン距離Ｄ_ss'：１．共分散行列Ｓ_ss'＝（１／ｎ_d）［Σ_dＩ_sdＩ_s'd−（Σ_dＩ_sd）（Σ_dＩ_s' _d ）／ｎ_d］を計算する。

【００４８】２．相関行列Ｃ_ss'＝Ｓ_ss'／［Ｓ_ssＳ_ss'］^0.5を計算する。

【００４９】３．Ｄ_ss'＝［２−２Ｃ_ss'］^0.5を計算する。

【００５０】マハラノビシュ距離Ｄ_ss'：１．共分散行列Ｓ_dd'＝（Σ_dＩ_sdＩ_sd'）−（Σ_dＩ_sd）（Σ_dＩ_s'd）／ｎ_s
を計算する。

【００５１】２．相関行列Ｃ_dd'＝Ｓ_dd'／［Ｓ_ddＳ_d'd'］^0.5およびその逆行列Ｃ^-1 _dd'を
計算する。

【００５２】３．Ｄ_ss'＝［Σ_dd'（Ｉ_sd−Ｉ_s'd）Ｃ^-1 _dd'（Ｉ_sd'−Ｉ_s'd'））］^0.5を計
算する。

【００５３】当該分野で公知の他の距離方法（例えば、スピアマン相関など）が本発明に使
用される得ることが意図される。当該分野で公知の他の方法が例えば、以下に見
出され得るが、これに制限する意図はない：Ｋ．Ｖ．Ｍａｒｄｉａ、Ｊ．Ｔ．Ｋ
ｅｎｔ、およびＪ．Ｍ．Ｂｉｄｄｙ、ＭＵＬＴＩＶＡＲＩＡＴＥＡＮＡＬＹＳ
ＩＳ，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＮｅｗＹｏｒｋ，１９７９。

【００５４】（階層型クラスター化）距離は、サンプルの階層型クラスター化を実施するために使用され得る。クラ
スター化のための一般的なアルゴリズムを以下に記載する。

【００５５】１．各サンプルｓがそれ自体の初期クラスターｃに割当てられる。

【００５６】２．クラスター対間の全ての距離を計算し、そして最小の距離を見出す。こ
れら２つのクラスターを１つのクラスターに合せ、そしてそのクラスターの数を
１減少させる。

【００５７】３．ステップ２を１つのクラスターのみが存在するまで繰り返す。

【００５８】このアルゴリズムを実行するために、クラスター対の間の距離を計算する方法
もまた必要である。周知の方法を使用する、このような計算のいくつかの制限さ
れない例が以下に示される。

【００５９】最も近い近傍、単一リンケージ：クラスターｃとｃ’との間の距離が最小距離
Ｄ_ss'（ここで、ｓは、クラスターｃにおけるサンプル全般にわたる範囲であり
、そしてｓ’は、クラスターｃ’における全サンプルにわたる範囲である）であ
る。

【００６０】平均リンケージとしても公知である、相加平均を使用した重みつきされていな
い対群法（ｕｎｗｅｉｇｈｔｅｄｐａｉｒｇｒｏｕｐｍｅｔｈｏｄｕｓ
ｉｎｇａｒｉｔｈｍｅｔｉｃａｖｅｒａｇｅｓ）（ＵＰＧＭＡ）：クラスタ
ーｃとクラスターｃ’との間の距離は、（Σ_ss'Ｄ_ss'／（ｎ_cｎ_c'））（ここで
、ｓはクラスターｃにおける全サンプルにわたる範囲であり、ｓ’は、クラスタ
ーｃ’における全サンプルにおける範囲であり、ｎ_cはクラスターｃにおける全
サンプル数であり、そしてｎ_c'はクラスターｃ’における全サンプル数である）
である。

【００６１】最も離れた近傍、完全リンケージ：クラスターｃとｃ’との間の距離が最大距
離Ｄ_ss'（ここで、ｓは、クラスターｃにおける全サンプルにわたる範囲であり
、そしてｓ’はクラスターｃ’における全サンプルにわたる範囲である）である
。

【００６２】他の距離ベース階層型クラスター化法が周知である。例えば、Ｗｅｎ−Ｈｓｉ
ｕｎｇＬｉ，ＭＯＬＥＣＵＬＡＲＥＶＯＬＵＴＩＯＮ，ＳｉｎａｕｅｒＡ
ｓｓｏｃ，１９９７を参照のこと。

【００６３】クラスター化を実施し、そして結果を表示するためのソフトウェアパッケージ
が利用可能である。例えば、クラスター化についてはＰｈｙｌｉｐ，ＪｏｅＦ
ｅｌｓｅｎｓｔｅｉｎ、ｈｔｔｐ：／／ｅｖｏｌｕｔｉｏｎ．ｇｅｎｅｔｉｃｓ．ｗａｓｈｉｎｇｔｏｎ．ｅｄｕ、および表示については、Ｔｒｅｅｖｉｅｗ，
ＲｏｄＰａｇｅ，ｈｔｔｐ：／／ｔａｘｉｏｎｏｍｙ．ｚｏｏｌｏｇｙ．ｇｌａ．ａｃ．ｕｋ／ｒｏｄ／ｔｒｅｅｖｉｅｗ．ｈｔｌｍを参照のこと。クラスタ
ー化に使用されるＰｈｙｌｉｐにおけるユニットに関するソースコードならびに
ウィンドウズ（登録商標）９５およびウィンドウズＮＴ用Ｔｒｅｅｖｉｅｗのダウンロードされた実行可能なファイル、ならびにＴｒｅｅｖｉｅｗ用マニュアルは、本願の権利者から入手可能である。

【００６４】（二次元クラスター化）サンプルをクラスター化するのではなく、距離をクラスター化することもまた
可能である。上記等式におけるサンプルおよび差分の役割を単純に交換する。さ
らに、サンプルおよび差分の両方のクラスター化を実施し、次いで、測定値Ｉ_sd を表示（ここで、サンプルおよび差分がともにクラスター順に表される）するこ
とが可能である。

【００６５】（主成分分析および主因子分析）主成分分析は、標準的なテキストに記載されている。例えば、Ｍａｒｄｉａ、
Ｋｅｎｔ，およびＢｉｂｂｙ。主成分分析を実施するために、「距離」の節にお
いて上記のように規定された相関行列Ｃ_ss'を用いて開始される。（あるいは、
共分散行列Ｓ_ss'が使用され得る）。以下のように規定される、固有値および固
有ベクトルが計算される：Ｃ_ss'ｇ_s'ｉ＝ａ_iｇ_si、ここで、ｉ番目の固有値はａ _i であり、そしてその固有ベクトルはｇ_siである。これらの固有値は、最も大き
な値から最も小さな値の順にされる：ａ₁≧ａ₂≧．．．≧ａ_s。サンプルの低次
元描写を得るために、多数の所望の次元ｋが選択される。次いで、ｋ次元空間に
おいて、サンプルｓは、点として表現される（ｇ_s1、ｇ_s2．．．、ｇ_sk）。ｋ次
元空間において近接するサンプルは、同様の発現プロフィールを有し、そして関
連があるとみなされ得る。

【００６６】主成分分析の開始点として相関行列Ｃ_ss'を使用する代わりに、以下のように
規定される多次元尺度構成からの内積行列を使用して主成分を計算することが可
能である：Ｂ＝ＨＣＨ（２）ここで、Ｃは相関行列であり、Ｈは、１−（１／ｎ）によって与えられる対角要
素（ｄｉａｇｏｎａｌｅｌｅｍｅｎｔ）および非対角要素−（１／ｎ）を有す
る中心化行列（ｃｅｎｔｅｒｉｎｇｍａｔｒｉｘ）であり、ここで、ｎは関連
項目数（ｉｔｅｍ）である。（例えば、Ｍａｒｄｉａ、Ｋｅｎｔ、およびＢｉｂ
ｂｙ、ＭｕｌｔｉｖａｒｉａｔｅＡｎａｌｙｓｉｓ，ならびにＡｒｋｉｎ，Ｓ
ｈｅｎおよびＲｏｓｓ，Ｓｃｉｅｎｃｅ２７７：１２７５（１９９７）を参照の
こと）。ｋ番目の主成分は、次いで、単位長さに正規化され、そして固有値λｋ
を減少させることによって序列されたｂのｋ番目の固有ベクトルである。そして
、ｋ番目の主因子は、λ_k ^1/2による固有ベクトルの尺度構成によって得らる。サ
ンプルｓのｋ番目の主因子への射影は、列ｓに関する因子の要素である。これら
の成分または因子は、１（最も有益な因子に対応する）からｎ（最も有益でない
因子に対応する）へと序列される。これらの成分または因子のいくつか（すべて
ではない）を使用することによって、これらのサンプルは、低次元の幾何空間に
おいて表され得る。さらに、表示において保持される情報量は、使用される成分
の固有値に関連し得る（Ｍａｒｄｉａ、Ｋｅｎｔ、およびＢｉｂｂｙを参照のこ
と）。

【００６７】主成分または主因子分析に適した、中心化された内積行列Ｂはまた、以下のような任意の距離行列Ｄ_ss'から得られ得る：Ｂ＝ＨＡＨ（３）ここで、Ａ_ss'＝−１／２（Ｄ_ss'）² （４）。

【００６８】主因子分析を実施するために、因子ｉをｈ_si＝ａ_i ^0.5ｇ_siと規定し、ここで、
上記のように、ａ_iは、ｉ番めの固有ベクトルｇ_siの固有値である。直交回転行
列Ｇ（ｉ＝ｋおよび０であるか、さもなくば、ｄｅｔ（Ｇ）＝＋１である場合、
Σ_jＧ_ijＧ_kjは、１である）が導入され、そして因子が回転され、サンプルに対
して回転された座標を得る。従って、サンプルの位置のｋ次元表現を得るために
、以下の操作が実施される。

【００６９】１．相関行列Ｃ_ss'または共分散行列Ｓ_ss'を計算する。ここで、ｓおよびｓ
’は個々のサンプルを示す。

【００７０】２．行列における固有値ａ_iおよび固有ベクトルｇ_siを計算する。ここで、
ａ₁≧ａ₂≧．．．≧ａ_sである。

【００７１】３．非回転因子ローディング（ｕｎｒｏｔａｔｅｄｆａｃｔｏｒｌｏａ
ｄｉｎｇ）ｈ_si＝ａ_i ^0.5ｇ_siが規定される。

【００７２】４．一番目の因子ローディングおよび直交回転行列Ｇが選択される。回転さ
れた空間におけるサンプルｓのｊ番目の成分は、Σ_j、ｈ_sj、Ｇ_j'jである。

【００７３】回転行列Ｇは、標準的な基準に従って最適化され得る。例えば、Ｍａｒｄｉａ
、Ｋｅｎｔ、およびＢｉｂｂｙ、Ｖａｒｉｍａｘ回転における、９節６、上記
を参照のこと。回転された軸は、サンプルについて観測された測定値に影響を与
える因子を表す。

【００７４】本発明の方法を実行する際に、これらの操作が、引き続いて、意図される表示
（すなわち、示されることが意図される関連性の性質）に従ういくつかの様式の
いずれかで組み合わされる。

【００７５】また、主要因子からの情報が、使用されて、相関関数からの実験的ノイズをフ
ィルタリングすることを助ける。例えば、カットオフ主要因子ｊ＜ｎを選択し、
次いで、ｊ次元主要因子空間におけるそれらの表現物に基づくサンプル間の距離
および相関を計算することが可能である。

【００７６】本発明において利用され得る計算手順の非制限的例として、適応され得る手順
の概略的概要が、図１に示される。実験結果は、測定値行列で配列された、実験
において得られたサンプル依存強度および選択依存強度を表現する。図１におい
て示される実行において、種々の規定されたヌクレオチドの長さを有する差分バ
ンドが、行列の列として配列され；これらは、サブ配列対のセットの異なるメン
バーを使用して選択される種々の実験において得られる。これらのサンプルは、
細胞、すなわち推定の薬学的薬剤のセットで処理した細胞、または類似のサンプ
ルセットの種類を表現し、そして行として配列される。

【００７７】測定値行列に配列される値は、次いで、相関分析に供され、直接的サンプル相
関または差分の相関を提供する。測定値行列はまた、サンプル間のベクトル距離
を提供する計算に供され；このようなサンプル距離はまた、サンプル相関結果か
ら得られ得る。距離ベクトルは、さらに、連鎖解析に供され、サンプルの段階的
クラスタリングを提供し得る。さらに、この相関サンプルは、主要成分分析に供
され、状態または差異に寄与する主要因子を提供し得る。

【００７８】主要成分分析が実施され得る様式の非制限的な例が、本明細書中で記載される
方法を使用して、図２において示される。上述の相関行列または中心（ｃｅｎｔ
ｅｒｅｄ）内積行列が、適切な操作に供され、それらの固有値および固有ベクト
ルに基づいて、主要成分および主要因子を提供する。有利に、固有状態の数にお
いて利用される次元の数の減少は、フィルタリング効果を提供し、計算されるベ
クトル距離におけるノイズを減少させ得る。

【００７９】本発明において提供される表現は、生物学分野および医学分野における遺伝学
の種々の適用における用途を見出す。関連性および相関の程度は、状態を比較さ
れた場合に区別される、酵素反応、代謝経路、および生理学的効果の迅速な概要
を提供する。病理学的状態が、例えば哺乳動物において、そして特にヒトにおい
て、通常の状態と比較される場合、区別される経路の表示は、この病理学的状態
の処置のための治療アプローチおよび／または治療薬剤の開発において有益であ
る。推定の薬学的薬剤がこの薬剤を省略する状態と比較される場合、または１つ
のこのような薬剤が別のものと比較される場合、この薬剤（単数または複数）に
よって誘導されるかまたは引き起こされる代謝反応に関連する重要な情報が提供
され、このことがこのような薬剤の最適な選択を導く。この情報はまた、新規の
薬学的薬剤の開発への導きを提供し得る。研究されるゲノムが植物ゲノム（例え
ば、重要な穀物植物の遺伝子）である場合、類似の原理が適用される。

【００８０】（核酸アッセイ）本発明は、少なくとも２つの種類の細胞間の関連性の程度の表現物を生じさせ
るための方法を提供する。この方法において、各種類における細胞は、所定の細
胞型の細胞、所定の組織由来の細胞、および所定の器官由来の細胞の中から選択
される。選択の細胞サンプルからの核酸の産生は、ＧｅｎｅＣａｌｌｉｎｇ^TM方
法論に記載される通りであり得る。米国特許第５，８７１，６９７号を参照のこ
と。この方法は、以下の工程を包含する：（ａ）複数対のヌクレオチドサブ配列
の対を規定する工程であって、各対は、第１サブ配列および第２サブ配列からな
る、工程；（ｂ）各種類の細胞の核酸を単離し、そして一方の末端で第１サブ配
列および他方の末端で第２サブ配列を有し、かつ第１サブ配列および第２サブ配
列によって分離された長さを有する核酸フラグメントの存在についてアッセイし
、そして各フラグメントがどの程度存在するかを定量する工程；ならびに（ｃ）
当該分野において公知であるソフトウエアアルゴリズムプログラムを使用して、
これらの種類の中のフラグメントの存在および量における類似性および差異を反
映する関連性の程度を決定する工程。

【００８１】この方法の１つの重要な実施態様、すなわち、上記の工程（ｂ）に記載される
ように、フラグメントの存在を決定し、そして存在する量を定量する工程は、以
下のような工程を包含するプロセスによって実施される。第１に、各種類の細胞
由来の核酸のサンプルを、複数の特定の対の制限エンドヌクレアーゼ（「ＲＥ」
）を用いて消化する。各サンプルを、１つのＲＥ対で処理し、ここで、この対の
１つのＲＥは、上記の工程（ａ）に記載される第１サブ配列を標的化し、そして
この対の第２ＰＥは第２サブ配列を標的化し、各消化は、特定の制限フラグメン
トを提供する。

【００８２】第２に、二本鎖アダプターＤＮＡ分子が、これらのフラグメントへハイブリダ
イズされる。各アダプターＤＮＡ分子は、以下を含む：（ｉ）より短い鎖であっ
て、好ましくは５’末端リン酸を有さず、第１部分および第２部分から構成され
、この第１部分は、５’末端で、所定の対のＲＥの１つによって生じた突出に相
補的である領域であり、そして第２部分は、このアダプターの反対のより長い鎖
にハイブリダイズ可能である、より短い鎖；ならびに（ｉｉ）より長い鎖であっ
て、好ましくは５’末端リン酸を有さず、その３’末端で、上述のより短い鎖の
第２部分へ相補的な第１部分、およびその第５’末端で、元のサンプル集団に存
在する任意の配列へハイブリダイズ可能でない独特な領域を含む任意の第２部分
からなる、より長い鎖。米国特許第５，８７１，６９７号を参照のこと。このよ
り長い鎖は、必要に応じて、蛍光色素２０８で標識されるが、複数の標識が同時
に識別されることが好ましくは可能となる任意のＤＮＡ標識系が、本発明におい
て使用可能である。例えば、Ａｕｓｕｂｅｌら、ＣＵＲＲＥＮＴＰＲＯＴＯＣ
ＯＬＳＩＮＭＯＬＥＣＵＬＡＲＢＩＯＬＯＧＹ，ＪｏｈｎＷｉｌｅｙ＆
Ｓｏｎｓ，ＮｅｗＹｏｒｋ，ＮＹ，１９９３を参照のこと。

【００８３】第３に、各連結されたフラグメントからの出力シグナルが、このように処理さ
れた各サンプル集団について検出される。各連結されたフラグメントは、出力シ
グナルを生じ、これらは、（ａ）特定の作業（ｒｕｎ）において使用されるＲＥ
対に対応する所定のサブ配列の存在；（ｂ）所定の作業において利用される２つ
のＲＥに対応する２つのサブ配列間の長さ；ならびに（ｃ）所定の作業において
このように生じた、各フラグメントの相対存在量の量を特徴付ける。

【００８４】必要に応じて、ヌクレオチド配列データベースは、各種類の細胞由来の核酸か
ら生じる１以上の出力シグナル（上述のパラメータで与えられる）を生じる、あ
るいは生じないと予想される配列について検索され得る。この分析方法は、以下
の工程を包含する：第１に、分析されるＤＮＡサンプルの代表的なＤＮＡ配列の
データベースを選択する工程；第２に、このデータベース、およびこの実験にお
いて産生されたＤＮＡフラグメントによって生じるシュミレーションされたシグ
ナルのデータベース中に含まれる、生成されるシュミレーションされたシグナル
パターンを誘導するための実験の記載を使用する工程；そして第３に、任意の特
定の検出されたシグナルについて、元のサンプルの配列がこのシグナルを生じさ
せると予想される模倣シグナルのパターンまたはデータベースを使用する工程。
さらに分析方法は、ユーザーインターフェースを使用し、そしてシグナルが複数
の配列から生じ得る場合にこのシグナルを実際に生じさせている配列の決定を可
能にするための容易さを提供し、そして、複数のサンプルにおける目的のシグナ
ルを迅速に決定するために統計学的相関を実施する。検索されたデータベースか
らの配列は、その配列が以下の（ａ）および（ｂ）の両方を有する場合に、１以
上の出力シグナルを生じさせると予想される：（ａ）この１以上の出力シグナル
によって示されるような標的ヌクレオチドサブ配列の発生間の同一の長さ、およ
び（ｂ）上記１以上の出力シグナルによって表現される同一の標的ヌクレオチド
サブ配列、またはこの１以上の出力シグナルによって表現される同一のセットの
標的ヌクレオチドサブ配列のメンバーである標的ヌクレオチドサブ配列。

【００８５】第１分析方法は、分析されるサンプルの代表であるＤＮＡ配列のデータベース
を選択する工程である。本発明の好ましい使用において、分析されるＤＮＡ配列
は、組織サンプル、典型的には診断または研究目的のために検査されるヒトサン
プルに由来する。この使用において、データベース選択は、全ての観察されるＤ
ＮＡ配列を包括的に記録する１以上の公的に利用可能なデータベースから開始す
る。このようなデータベースは、ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢ
ｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ（Ｂｅｔｈｅｓｄａ，Ｍｄ
．）からのＧｅｎＢａｎｋ、ＥｕｒｏｐｅａｎＢｉｏｉｎｆｏｒｍａｔｉｃｓ
Ｉｎｓｔｉｔｕｔｅ（ＨｉｎｘｔｏｎＨａｌｌ，ＵＫ）のＥＭＢＬＤａｔ
ａＬｉｂｉｒａｒｙ、およびＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＧｅ
ｎｏｍｅＲｅｓｅａｒｃｈ（ＳａｎｔａＦｅ，Ｎ．Ｍｅｘ．）からのデータ
ベースである。しかし、任意の由来の複数のＤＮＡ配列の任意のサンプルが、本
発明の方法によって分析され得るので、分析されるこのようなサンプルに存在す
るであろう配列についての項目を含む任意のデータベースが、このコンピュータ
方法のさらなる工程において使用可能である。

【００８６】第２分析方法は、サンプル中に存在するであろう配列の以前に選択されたデー
タベース、ならびにこの実験において産生されたＤＮＡフラグメントによって生
じるシグナルのパターンを誘導するための意図される実験の記載を使用する。こ
のパターンは、任意の簡便な様式で、コンピュータ実行に保存され得る。以下に
おいて、制限はされずに、それが情報のテーブルとして保存される場合に記載さ
れる。このテーブルは、個々の記録として、または任意の従来利用可能な関連の
データベースのようなデータベースシステムを使用することによって保存され得
る。あるいは、このパターンは、パターンを表現するメモリ内（ｉｎ−ｍｅｍｏ
ｒｙ）構造の画像として単に保存され得る。

【００８７】この方法の第２の重要な実施態様（すなわち、上記工程（ｂ）に記載されるよ
うな、フラグメントの存在およびそれらの量を決定すること）は、以下のような
工程を包含するプロセスによって実施される。第１に、選択されるヌクレオチド
サブ配列の各対について、オリゴヌクレオチドプライマーの対が提供され、この
対は、第１プライマーおよび第２プライマーからなり、ここで、第１プライマー
は、第１サブ配列に相補的であり、そして第２プライマーは第２サブ配列に相補
的である。第２に、第１サブ配列と第２サブ配列との間のヌクレオチド配列は、
この増幅をプライムするこのオリゴヌクレオチドプライマーを使用して増幅され
、それによって、このサブ配列対、各対において利用される上記２つのプライマ
ーに対応する２つのサブ配列間の長さ、および各アンプリコンが存在する程度の
量によって特徴付けられるアンプリコンを提供する。第３に、出力シグナルが、
各アンプリコンについて上記のように生成され、各出力シグナルは、（ａ）プラ
イマーの対のサブ配列、（ｂ）長さ、および（ｃ）量を特徴付ける。必要に応じ
て、ヌクレオチド配列データベースは、各種類の細胞からの核酸によって生じら
れる、１以上の出力シグナル（上述のパラメータによって与えら得る）を生じる
か、あるいは生じないと予想される配列について検索され得る。分析方法は上記
の通りである。

【００８８】本発明は、例えば、制限ではなく、インビトロ細胞集団または細胞株に、疾患
または他のプロセスのインビボ動物モデルに、ヒトサンプルに、実際の野生型出
現からおそらく引き出された精製された細胞集団に、そして混合された細胞集団
を含む組織サンプルに適用され得る。この細胞または組織供給源は、有利に、植
物、単細胞動物、多細胞動物、細菌、ウイルス、真菌、または酵母などであり得
る。この動物は、有利に、特定のゲノムまたは疾患状態または傾向を有するよう
に遺伝子操作されるかまたは育てられるマウスのような、研究において使用され
る実験室動物であり得る。

【００８９】本発明において使用される細胞は、疾患状態を有するか有すると疑われる、哺
乳動物、好ましくはヒトから得られ得る。１実施態様において、疾患状態は、悪
性疾患である。インビトロ細胞集団または細胞株は、種々の外来因子に暴露され
、このような因子の遺伝子発現における効果を決定し得る。好ましい実施態様に
おいて、外来因子は、推定の薬学的薬剤である。推定の薬学的薬剤とそのように
接触される細胞を、これらをアッセイする前に、これらの細胞の状態における変
化に影響を与えるに十分な薬剤の量で、または用量濃度の予め設定した上限以下
の薬剤の量で処理する。関連性の測定値および相関の程度は、推定の薬学的薬剤
とのそのように接触される細胞と、例えばそのように接触されない細胞との間で
実施され得る。

【００９０】（関連性方法論の程度）本発明は、第１の種類の細胞と、第２の種類の細胞との間の関連性の程度の表
現物を提供する。各種類中の細胞は、上記のように、所定の細胞型の細胞、所定
の組織からの細胞、および所定の器官からの細胞の中から選択される。関連性の
程度は、ヌクレオチドサブ配列の対であって、各対が、第１のサブ配列および第
２のサブ配列からなる複数の対の存在下で、この対の第１のサブ配列および第２
のサブ配列を分離するヌクレオチド長さ、および所定の長さを有する各対が細胞
の種類内にある程度の定量化に関して、類似性または差分を反映する。分析され
るべきフラグメントの入力情報は、上記のＮＵＣＬＥＩＣＡＣＩＤＡＳＳＡ
ＹＳのセクションに記載のような核酸分析および定量化の方法により得られる。

【００９１】関連性の測定値は、差分ベクトルの振幅を反映する距離を算出することにより
提供される。差分ベクトルは、第１のベクトルと第２のベクトルとの間の差異と
して規定される。ここで、第１のベクトルは、第１の種類の細胞について得られ
た各サブ配列対に対する定量化に由来する情報を反映し、そしてそれに対応して
、第２のベクトルは、第２の種類に由来する類似の情報を反映する。各ベクトル
の異なる要素は、異なるサブ配列対を用いて得たデータに関連する。

【００９２】表現物の実施態様では、関連性の程度は距離に関連する。この距離は、第１の
種類について得られた各サブ配列対に対する定量化に由来する情報を反映する第
１のベクトルと、第２の種類について得られた対応する情報を反映する第２のベ
クトルとの差異である、差分ベクトルの振幅を反映する。各ベクトルの差分要素
は、異なるサブ配列対を用いて得たデータに関連する。

【００９３】さらに顕著な実施態様では、表現物は、関連性の程度を反映するツリー構造を
含み、任意の２つの種類の間の関連性を反映するツリー構造を生成することによ
り提供される。ツリー構造のブランチは、差分ベクトルを反映し、そしてノード
から枝分かれする。

【００９４】関連性の程度の表現物の重要な実施態様では、表現物は、上記直前の段落に要
約された方法を含む本発明の方法を採用して得た。

【００９５】関連性の表現物のさらに顕著な実施態様では、少なくとも１つの種類にある細
胞は、上記のセクションＮＵＣＬＥＩＣＡＣＩＤＳＡＮＡＬＹＳＩＳに記載
のように得られる。

【００９６】（相関分析方法論）本発明はまた、第１の種類の細胞と、第２の種類の細胞との間の相関の表現物
を生成する方法を提供する。この相関は、種類内の核酸の性質および量における
変動を反映する。この方法では、各種類における細胞は、所定の細胞型の細胞、
所定の組織からの細胞、および所定の器官からの細胞の中から選択される。核酸
分析および定量化の方法は、上記のＮＵＣＬＥＩＣＡＣＩＤＡＳＳＡＹＳに
記載の通りである。

【００９７】シグナル出力の生成に際し、第１の種類の細胞と第２の種類の細胞との間で相
関し、そしてこの相関の表現物が調製される。本発明におけるフラグメントの定
量化は、所定の操作（ｒｕｎ）で用いられるＲＥ対に対応し、そして各フラグメ
ントの長さはそのように生成され；それによって、各種類の細胞中に存在する核
酸が、特定のサブ配列対および対間のヌクレオチド長さを有するフラグメントを
含む程度の定量化測定値を提供する。

【００９８】この相関を有する表現物を生成するための方法の顕著な実施態様では、上記の
ＤＩＳＴＡＮＣＥＳのセクションに記載のように、この相関は直交固有ベクトル
のセットに関連する。この固有ベクトルが構築される基底セットの要素は、２つ
の種類の細胞間で相関する特定の生化学的経路または生理学的経路を反映する。
これらの固有ベクトルの各々は、生化学的または生理学的差分に対応する経路の
寄与を反映するゼロより大きい整数である固有値と関連する。使用された固有値
の上限を規定した後、この上限より小さいかまたはこれに等しい固有値の各固有
ベクトルにおける基底セット要素の係数は、第１の種類の細胞と第２の種類の細
胞との間で相関した。

【００９９】この相関の表現物を生成するための方法の別の顕著な実施態様では、この表現
物は、クラスター図または系統樹であり、そして２つの種類の細胞間の差分に対
する生化学的応答または生理学的応答に関与する経路の関連性を反映するツリー
構造を含む。この表現物を得ることにおいて、距離が差分ベクトルの振幅を反映
する距離決定を提供する、相関行列が算出される。このベクトルは、種類間の差
分に対する２つの種類の１つの応答について得られた情報を各々が反映する、２
つのベクトル間の差分であり、そしてここでツリー構造のブランチが差分ベクト
ルを反映し、そしてこのブランチがノードから枝分かれする。

【０１００】相関の程度の表現物のさらなる顕著な実施態様では、少なくとも１つの種類内
の細胞は、上記のＮＵＣＬＥＩＣＡＣＩＤＳＡＮＡＬＹＳＩＳのセクション
に記載のように得た。

【０１０１】（表示手段）本発明はまた、第１の種類の細胞と第２の種類の細胞との間の関連性の程度の
表現物を表示する表示手段を提供する。各種類内の細胞は、上記のように、所定
の細胞型、所定の組織からの細胞、および所定の器官からの細胞の中から選択さ
れる。関連性の程度は、ヌクレオチドサブ配列の対であって、各対が、第１のサ
ブ配列および第２のサブ配列からなる複数の対の存在下で、この対の第１のサブ
配列および第２のサブ配列を分離するヌクレオチド長さ、および所定の長さを有
する各対が細胞の種類内にある程度の定量化に関して、類似性または差分を反映
する。

【０１０２】この表示手段の顕著な実施態様では、関連性の程度は距離に関連する。この距
離は、第１の種類について得られた各サブ配列対に対する定量化に由来する情報
を反映する第１のベクトルと、第２の種類について得られた対応する情報を反映
する第２のベクトルとの間の差分である差分ベクトルの振幅を反映する。各ベク
トルの差分要素は、異なるサブ配列対を用いて得られたデータに関連する。

【０１０３】表示手段のさらなる顕著な実施態様では、表現物は、任意の２つの種類の間の
関連性を反映するツリー構造を含み、ここで、ツリー構造のブランチは、差分ベ
クトルを反映し、そしてこのブランチはノードから枝分かれする。

【０１０４】関連性の程度の表現物を表示する表示手段の表現物の重要な実施態様では、こ
の表現物は、上記直前の段落に要約された方法を含む本発明の方法を採用して得
られる。

【０１０５】関連性の程度の表現物を表示する表示手段のさらなる顕著な実施態様では、少
なくとも１つの種類の細胞は、上記のセクションＮＵＣＬＥＩＣＡＣＩＤＳ
ＡＮＡＬＹＳＩＳに記載のように得た。

【０１０６】本発明は、第１の種類の細胞と第２の種類の細胞との間の相関の表現物を表示
する表示手段をさらに提供する。各種類内の細胞は、上記のように、所定の細胞
型、所定の組織からの細胞、および所定の器官からの細胞の中から選択される。
関連性の程度は、ヌクレオチドサブ配列の対であって、各対が、第１のサブ配列
および第２のサブ配列からなり、ヌクレオチド長さがこの対の第１のサブ配列お
よび第２のサブ配列を分離するヌクレオチド配列の存在下で、所定の長さを有す
る各対が細胞に存在する程度の定量化に関して、第１の種類と、第２の種類との
間の差分を反映する。

【０１０７】この表示手段の有益な実施態様では、相関は、直交固有ベクトルのセットに関
連する。この固有ベクトルが構築される基底セットの要素は、２つの種類の細胞
間で相関する特定の生化学的経路または生理学的経路を反映する。これらの固有
ベクトルの各々は、ゼロより大きい整数である固有値と関連する。用いられるべ
き固有値の上限を規定した後、この上限より小さいかまたはこれに等しい固有値
の各固有ベクトルにおける基底セット要素の係数は、第１の種類の細胞と第２の
種類の細胞との間で相関した生化学的または生理学的差分に対応する経路の寄与
を反映する。

【０１０８】この相関の表現物を表示する表示手段のさらなる有益な実施態様では、この表
現物は、クラスター図または系統樹であり、そして２つの種類の細胞間の差分に
対する生化学的応答または生理学的応答に関与する経路の関連性を反映するツリ
ー構造を含む。この表現物を得ることにおいて、距離が差分ベクトルの振幅を反
映する距離決定値を提供する、相関行列が算出される。このベクトルは、種類間
の差分に対する２つの種類の１つの応答について得られた情報を各々が反映する
、２つのベクトル間の差分である。このツリー構造のブランチが差分ベクトルを
反映し、そしてこのブランチがノードから枝分かれする。

【０１０９】相関の表現物を表示する表示手段の重要な実施態様では、表現物は、上記直前
の段落で要約された方法を含む本発明の方法を採用して得られる。

【０１１０】相関の表現物の重要な実施態様では、表現物は、上記直前の段落で要約された
方法を含む本発明の方法を採用して得られる。

【０１１１】相関の表現物を表示する表示手段のさらなる顕著な実施態様では、少なくとも
１つの種類の細胞は、上記のセクションＮＵＣＬＥＩＣＡＣＩＤＡＮＡＬＹ
ＳＩＳに記載のように得た。

【０１１２】（その他の局面）細胞の表現物を提供することに加えて、本明細書に記載の技法はまた、核酸フ
ラグメントまたは遺伝子の表現物を提供するために有用である。この分析の出発
点は、先に記載された行列Ｉ_sdであり、ここで、ｓはサンプル（またはサンプル
の群または別の型の細胞）を示し、そしてｄはこの種類内の特定遺伝子の発現レ
ベルの特定の測定値を示す。Ｉの列を基底にする表現物を生成するよりもむしろ
、各々は異なるサンプルまたはサンプルの群を示し、Ｉの行を基底にする表現物
であって、各々が異なる核酸を示す表現物を生成することが可能である。一連の
細胞に亘る核酸の相対アバンダンスに基づく、核酸の階層的表現物および幾何的
表現物を用いて、同時発現され、そして関連する生物学的機能を有するらしい遺
伝子を推断し得る。

【０１１３】（その他の実施態様）強度Ｉのデータ行列は、各列が特定の生物学的サンプルまたはサンプルの群に
対応し、そして各カラムが特定の核酸分子またはその量が生物学的状態の各々で
測定される分子の種類に対応する表現物としてより一般的に記載され得る。

【０１１４】核酸量の測定値を提供するための記載された差分表示方法に加えて、細胞内に
存在する核酸の測定値を得るためのその他の方法が利用可能である。これらは、
制限フラグメント長多形性、増幅フラグメント長多形性、ＥＳＴ配列決定、遺伝
子発現の連続分析、オリゴヌクレオチドプローブに対するハイブリダイゼーショ
ン、および当該分野で公知の他の方法を含む。ＴａｑＭａｎまたはＮｏｒｔｈｅ
ｒｎブロットによる定量化のような、その他の方法もまた用いられる。これらの
方法のすべては、本明細書で記載の方法に従って分析され得るデータセットを生
成する。各生物学的状態および核酸に対する測定値Ｉ_sdは、絶対濃度、標準に対
する濃度（比または数の差分）、またはその他の便利な尺度に対応し得る。

【０１１５】本発明の方法は、５、１０、２５、５０、１００、１０００、１０，０００、
１００，０００またはそれ以上のメンバーの範囲の集団の分析を含む。

【０１１６】（実施例）１０〜１４週齢の雄性ＳＤ（Ｓｐｒａｇｕｅ−Ｄａｗｌｅｙ）ラット（Ｈａｒ
ｌａｎＳｐｒａｇｕｅＤａｗｌｅｙ、Ｉｎｃ．、Ｉｎｄｉａｎａｐｏｌｉｓ
、Ｉｎｄｉａｎａ）を、胃管による強制栄養を行い、以下のレベルで滅菌水に溶
解した以下の薬物を用いて、３日間、１日１回投薬した：フェノバルビトール（ｐｈｅｎｏｂａｒｂｉｔｏｌ）３．８１ｍｇ／ｋｇ／
日ガバペンチン３４．２９ｍｇ／ｋｇ／日ビガバトリン１５０ｍｇ／ｋｇ／日パラアルデヒド７７．０８ｍｇ／ｋｇ／日これらの用量は、ラットとヒトとの間の代謝速度の差分について調整されたＥ
Ｄ１００（ヒトの有効用量の上限）に対応する。３匹のラットを、各薬物処理の
ために使用し、そして各薬物に対応するさらなる３匹のラットを、滅菌水で処理
して、コントロールとした。

【０１１７】ラットを最終用量の２４時間後に屠殺し、そしてその脳を収集した。ｍＲＮＡ
の収集、ｃＤＮＡの合成、および差分表示手順を、米国特許第５，８７１，６９
７号およびＳｈｉｍｋｅｔｓら１９９９（ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌ
ｏｇｙ１７：７９８〜８０３）に記載される方法に従って、行った。

【０１１８】以下の工程を続け、差分表示パターンを分析した：１．同一の薬物で処理した３匹の動物の各々について強度Ｉ_sr（ｘ）を、１つ
の平均Ｉ_ar（ｘ）に合わせた（下付き文字ａは、薬物を示す）。標準偏差ｓ_ar（
ｘ）もまた、薬物で処理した各動物からの測定値について計算した。

【０１１９】２．各薬物についての平均Ｉ_ar（ｘ）および標準偏差ｓ_ar（ｘ）を、滅菌水コ
ントロール処理についての平均Ｉ_cr（ｘ）および標準偏差ｓ_cr（ｘ）と比較した
。長さｘでの差分が、以下の場合に印をつけられた：ＡＢＳ（ｌｎ［Ｉ_ar（ｘ）／Ｉ_cr（ｘ）］≧ｌｎ（１．５）（５）ならびに以下を用いる両側ｔ検定について、有意性（ｓｉｇｎｉｆｉｃａｎｃ
ｅ）が、０．１５未満の場合ｔ＝［Ｉ_ar（ｘ）−Ｉ_cr（ｘ）］／［｛ｓ_ar（ｘ）²＋ｓ_cr（ｘ）²｝／２］^1/ ² （６）および無限大の自由度。次に、この手順に従って印をつけられる差分の強度を目
視によって検査し得、そして可視的に有意な差分が、保持され得る。

【０１２０】３．制限酵素対ｒおよび位置ｘによって規定された各々の差分ｄについて、強
度Ｉ_ar（ｘ）＝Ｉ_adを、各薬物処理について特定の処理がコントロールと比較し
て差分を有するか否か決定した。

【０１２１】この実施例において、最終的なデータ行列Ｉ_adは、８つの列を有する：４つの
薬物の各々についての１つの列、および水コントロールデータの４つの反復実験
の各々について１つの列。行列は、差分表示パターンにおいて検出された差分の
数と同数の列を有する。

【０１２２】サンプルの８つの種（４つの薬物、４つの水コントロール）のピヤソン相関係
数Ｃ_abを、発明の詳細な説明に提供される方法を使用して決定した。特定の差分
についてのデータ要素が、特定の処理について欠けている場合、その差分は、相
関係数に寄与しなかった。この係数を、対角の要素として示される薬物との標準
偏差とともに、以下の表１に示す。

【０１２３】

【表１】次に、対をなすピヤソン距離を、以前に記載されるように計算した。距離行列
を、以下の表２に示す。

【０１２４】

【表２】次にこの距離を最隣接クラスター化アルゴリズムへの入力として使用した。滅
菌Ｈ₂Ｏを外集団として使用して、生じるクラスターを図３に示した。図１Ａに
おける水平距離は、クラスター間の対をなすピヤソン距離と比例した。

【０１２５】相関行列Ｃ_abもまた、主因子（ｐｒｉｎｃｉｐｌｅｆａｃｔｏｒ）分析のた
めの開始点として用いた。第１に、主な成分を、多次元尺度構成からの内積行列
を使用して計算したＢ＝ＨＣＨ（２）ここで、Ｃは、相関行列であり、そしてＨは、中心化（ｃｅｎｔｅｒｉｎｇ）
行列である。次に、ｋ^th主成分は、単位長さに対して標準化されたＢのｋ^th固有
ベクトルであり、減少する固有値λ_kによって並べられ、そしてｋ^th主因子を、
固有ベクトルをλ_k ^1/2によって尺度構成することによって得られた。処置および
コントロールの、主因子に対する射影を、以下の表３に示す。

【０１２６】

【表３】成分を、１（最も有益）から８（最も有益でない）までに、並べる。負の固有
値が、欠けているデータを説明するために使用した方法から生じる。欠けている
データが、代替的な様式において扱われた場合（例えば、欠けている要素が、平
均値に設定した場合、または分析を、データが欠けていない差分に限定した場合
）、固有値は全て、負ではない。

【０１２７】図４において、主因子に対する射影によって、処理を表示する。因子１は、薬
物（負の値を有する）とコントロール（正の値を有する）を区別する。因子２は
、薬物の処置の間を区別する。

【０１２８】（等価物）上記の、本発明の特定の実施態様の詳細な説明から、細胞、細胞株、組織、器
官、または遺伝子発現のゲノム分析に基づいて発現された配列間の関連性の程度
を表現するための独特の方法が記載されたことが、明らかである。特定の実施態
様が本明細書において詳細に開示されたが、この開示は、説明目的の例示のみの
ためであり、上記の添付の特許請求の範囲について限定することを意図しない。
特に、種々の置換、変更、および改変が、特許請求の範囲によって規定される本
発明の趣旨および範囲から逸脱することなく、本発明に対してなされ得ることが
本発明者によって意図される。例えば、材料の供給源、その後の使用、または使
用されるソフトウェアアルゴリズムの選択は、本明細書において記載される実施
態様の知識を用いて、当業者にとって慣用的な事項であると考えられる。

【図面の簡単な説明】

【図１】図１は、サンプルについて見出される１セットのサブ配列が選択したフラグメ
ントから開始する本発明の種々の表現物を発生する工程に包含される主工程を例
示する概略的なフロー図である。

【図２】図２は、主な成分分析を実施する工程に包含される主工程を例示する概略的な
フロー図である。

【図３】図３は、アウトグループとしての滅菌水による４つの薬物の階層的クラスター
化を例示する。

【図４】図４は、主因子に対する薬物処置および制御のグラフである。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＳＤ，ＳＬ，ＳＺ，ＴＺ，ＵＧ，ＺＷ )，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＲ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＤＭ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＴＺ，ＵＡ，ＵＧ，ＵＳ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷＦターム(参考） 2G045 AA24 AA35 CB01 DA12 DA13 DA14 FB01 FB02 JA01 4B024 AA01 AA12 CA04 CA09 CA12 HA08 HA14 4B063 QA11 QQ43 QQ58 QR14 QR32 QR36 QR62 QS25 5B056 BB21 BB42 HH00

Claims

【特許請求の範囲】

【請求項１】少なくとも２つの種類の細胞の間の関連性の程度の表現物を
生成するための方法であって、各種類における該細胞は、所定の細胞型の細胞、
所定の組織由来の細胞および所定の器官に由来する細胞からなる群より選択され
、該方法は以下の工程：ａ）複数の対のヌクレオチドサブ配列を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる群より選択される、工程；ｂ）細胞の各種類の核酸において、一方の末端に該第一のサブ配列を、および
他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二の
配列によって分離された長さを有するフラグメントの存在、ならびに該フラグメ
ントの各々が存在する程度の量を決定する工程；ならびにｃ）該種類のなかで該フラグメントの該存在および量における類似性または差
分を反映する関連性の程度を決定する工程、を包含する、方法。
【請求項２】請求項１に記載の方法であって、前記工程ｂ）において記載
される前記フラグメントの前記存在および量を決定する工程が、以下の工程：ｉ）複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、該サンプルは、１対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程、二本鎖アダプターＤＮＡ分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターＤＮＡ分子は、（ａ）５’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
５’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および（ｂ）該より短い鎖の該第二
の部分に相補的な３’末端を有する、より長い鎖を含む、工程、および該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程；ｉｉ）該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、（
ａ）該制限エンドヌクレアーゼの対の該サブ配列、（ｂ）該ヌクレアーゼの各対
において使用される２つの制限エンドヌクレアーゼに対応する２つのサブ配列の
間の長さ、ならびに（ｃ）該対および該長さに対応する該フラグメントの量を特
徴付ける、工程；ならびに（ｉｉｉ）各種類の該細胞から該核酸によって生成される、１以上の該出力シ
グナルを生成すると予測される配列、または１以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（
ａ）該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出
力シグナルを生成すると予測されているか、または該１以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類（ｓｔｅｔ）のメンバーで
ある標的ヌクレオチドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、を包含するプロセスによって実施される、方法。
【請求項３】請求項１に記載の方法であって、前記工程ｂ）に記載される
前記フラグメントの存在および該フラグメントの量の決定が、以下の工程：ｉ）前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程；ｉｉ）該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該２つのプライマーに対応する該２つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程；およびｉｉｉ）各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、（ａ）各プライマーの対の該サブ配列、（ｂ）該長さ、
および（ｃ）該量、を特徴付ける、工程；ならびにｉｖ）各種類の該細胞から該核酸によって生成される、１以上の該出力シグナ
ルを生成すると予測される配列、または１以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（ａ）
該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力シ
グナルを生成すると予測されているか、または該１以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程、を包含するプロセスによって実施される、方法。
【請求項４】請求項１に記載の方法であって、前記工程ｃ）における関連
性の前記程度が、距離を計算することによって提供され、ここで、該距離は、前
記第一の種類について得られる各サブ配列ついについての前記量に由来する情報
を反映する第一ベクトルと、前記第二の種類について得られる各サブ配列対につ
いての前記量に由来する情報を反映する第二ベクトルとの間の差分である差分ベ
クトルの振幅を反映し、そして各ベクトルの異なる要素が異なる対を用いて得ら
れたデータに関連する、方法。
【請求項５】請求項１に記載の方法であって、前記工程ｃ）における関連
性の前記程度が、任意の２つの種類の間の関連性を反映するツリー構造を生成す
ることによって得られ、ここで、該ツリー構造のブランチが前記差分ベクトルを
反映し、そして該ブランチがノードから分岐する、方法。
【請求項６】少なくとも１つの種類の前記細胞が癌細胞である、請求項１
に記載の方法。
【請求項７】少なくとも１つの種類の前記細胞が推定薬学的薬剤と接触さ
れている、請求項１に記載の方法。
【請求項８】複数の種類の細胞の間の相関の表現物を生成するための方法
であって、該各種類における該細胞は、所定の細胞型の細胞、所定の組織由来の
細胞および所定の器官由来の細胞からなる群より選択され、該相関は、該種類に
存在する核酸の性質および量の変化を反映し、該方法は以下の工程：ａ）ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程；ｂ）該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第二のサブ配列および該第二
サブ配列によって分離される長さフラグメントの存在、ならびに各フラグメント
が存在する程度の量を決定し、それによって該種類の間の差分を規定する、工程
；ｃ）該種類の該細胞の間の相関を評価する工程；ならびにｄ）該相関の表現物を作成する工程、を包含する、方法。
【請求項９】請求項８に記載の方法であって、前記工程ｂ）において記載
される前記フラグメントの存在および量を決定する工程が、以下の工程：ｉ）複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、該サンプルは、１対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程二本鎖アダプターＤＮＡ分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターＤＮＡ分子は、（ａ）５’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
５’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および（ｂ）該より短い鎖の該第二
の部分に相補的な３’末端を有する、より長い鎖を含む、工程、および該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程；ｉｉ）該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、（
ａ）該制限エンドヌクレアーゼの対の該サブ配列、（ｂ）該ヌクレアーゼの各対
において使用される２つの制限エンドヌクレアーゼに対応する２つのサブ配列の
間の長さ、ならびに（ｃ）該対および該長さに対応する該フラグメントの量を特
徴付ける、工程；ならびに（ｉｉｉ）各種類の該細胞から該核酸によって生成される、１以上の該出力シ
グナルを生成すると予測される配列、または１以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（
ａ）該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出
力シグナルを生成すると予測されているか、または該１以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、を包含する、プロセスによって実施される、方法。
【請求項１０】請求項８に記載の方法であって、前記工程ｂ）に記載され
る、前記フラグメントの前記存在および前記フラグメントの量の決定が、以下：ｉ）前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程；ｉｉ）該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、増
幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配列
対、各対において使用される該２つのプライマーに対応する該２つのサブ配列の
間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる該
アンプリコンを提供する、工程；およびｉｉｉ）各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、（ａ）各プライマーの対の該サブ配列、（ｂ）該長さ、
および（ｃ）該量、を特徴付ける、工程；ならびにｉｖ）各種類の該細胞から該核酸によって生成される、１以上の該出力シグナ
ルを生成すると予測される配列、または１以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（ａ）
該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力シ
グナルを生成すると予測されているか、または該１以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程を包含するプロセスによって実施される、方法。
【請求項１１】請求項８に記載の方法であって、前記工程ｄ）における相
関が１セットの正規直交固有ベクトルに関連し、該固有ベクトルが構築される基
底セットの要素が、前記２種類の細胞の間で相関付けられた特定の生化学的経路
もしくは生理的経路を反映し、各固有ベクトルは、０を超える整数である固有値
を有し、その固有値が、使用される該固有値の上限である特定の整数以下である
該基底セット要素の係数が前記第一の種類の細胞と前記第二の種類の細胞との間
で相関付けられた生化学的差分または生理学的差分に対応する経路の寄与を反映
する、方法。
【請求項１２】請求項８に記載の方法であって、前記表現物がクラスター
図または系統樹であり、前記２種類の細胞の間の差分に対する生化学的応答もし
くは生理的応答に関与する経路の関連性を反映するツリー構造を包含し、ここで
、相関行列が距離の決定を提供し、該距離は、該差分に対する該２種類の一方の
応答について得られる情報を各々反映する２つのベクターの間の差分である差分
ベクトルの振幅を反映し、そして該ツリー構造のブランチが該差分ベクトルを反
映し、そして該ブランチがノードから分岐する、方法。
【請求項１３】前記少なくとも１つの種類における前記細胞が癌細胞であ
る、請求項８に記載の方法。
【請求項１４】請求項８に記載の方法であって、前記少なくとも１つの種
類における前記細胞が推定薬学的薬剤に接触されており、そして、該方法は以下
の工程：ａ）少なくとも１つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量を用いて処理する
工程；ｂ）ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程；ｃ）該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第二のサブ配列および該第二
サブ配列によって分離される長さフラグメントの存在、ならびに各フラグメント
が存在する程度の量を決定し、それによって該薬剤の効果を規定する、工程；ｄ）該第一の種類の細胞に対する該薬剤の効果と、別の種類の細胞に対する該
薬剤の効果との間の相関を評価する工程；ならびにｅ）該相関の表現物を作成する工程、を包含する、方法。
【請求項１５】少なくとも２種類の細胞の間の関連性の程度の表現物を表
示するための表示手段であって、各種類の該細胞が、所定の細胞型の細胞、所定
の組織由来の細胞および所定の器官由来の細胞からなる群より選択され、該関連
性の程度は、該細胞の種類の核酸において、ヌクレオチドサブ配列の対の存在に
おける類似性もしくは差分を反映し、該対は、第一のサブ配列、第二のサブ配列
、該対の該第一のサブ配列と該第二のサブ配列とを分離するヌクレオチド長さお
よび所定の長さを有する各対が該種類の細胞である程度の量からなる、表示手段
。
【請求項１６】請求項１５に記載の表示手段であって、前記関連の程度が
距離に関連し、該距離は、前記第一の種類について得られる各サブ配列について
の前記量に由来する情報を反映する第一ベクトルと、前記第二の種類について得
られる各サブ配列対についての前記量に由来する情報を反映する第二ベクトルと
の間の差分である差分ベクトルの振幅を反映し、そして各ベクトルの異なる要素
が異なる対を用いて得られたデータに関連する、表示手段。
【請求項１７】請求項１５に記載の手段であって、前記表現物が、任意の
２つの種類の間の関連性を反映するツリー構造を含み、ここで、該ツリー構造の
ブランチが前記差分ベクトルを反映し、そして該ブランチがノードから分岐する
、表示手段。
【請求項１８】請求項１５に記載の手段であって、前記関連性の程度が、
以下の工程：ａ）ヌクレオチドサブ配列の複数の対を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる、工程；ｂ）該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第二のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定する、工程；ならびにｃ）該種類の間の該フラグメントの存在および量における類似性もしくは差分
を反映する関連性の程度を決定する工程、を包含するプロセスによって得られる、表示手段。
【請求項１９】請求項１８に記載の表示手段であって、前記工程ｂ）にお
いて記載される前記フラグメントの前記存在および量を決定する工程が、以下の
工程：ｉ）複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、該サンプルは、１対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程二本鎖アダプターＤＮＡ分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターＤＮＡ分子は、（ａ）５’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
５’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および（ｂ）該より短い鎖の該第二
の部分に相補的な３’末端を有する、より長い鎖を含む、工程、および該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程；ｉｉ）該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、（
ａ）該制限エンドヌクレアーゼの対の該サブ配列、（ｂ）該ヌクレアーゼの各対
において使用される２つの制限エンドヌクレアーゼに対応する２つのサブ配列の
間の長さ、ならびに（ｃ）該対および該長さに対応する該フラグメントの量を特
徴付ける、工程；ならびに（ｉｉｉ）各種類の該細胞から該核酸によって生成される、１以上の該出力シ
グナルを生成すると予測される配列、または１以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（
ａ）該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出
力シグナルを生成すると予測されているか、または該１以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、を包含するプロセスによって実施される、手段。
【請求項２０】請求項１８に記載の手段であって、前記工程ｂ）に記載さ
れる前記フラグメントの存在および該フラグメントの量の決定が、以下の工程：ｉ）前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程；ｉｉ）該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、増
幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配列
対、各対において使用される該２つのプライマーに対応する該２つのサブ配列の
間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる該
アンプリコンを提供する、工程；およびｉｉｉ）各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、（ａ）各プライマーの対の該サブ配列、（ｂ）該長さ、
ならびに（ｃ）該量、を特徴付ける、工程；ならびにｉｖ）各種類の該細胞から該核酸によって生成される、１以上の該出力シグナ
ルを生成すると予測される配列、または１以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（ａ）
該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力シ
グナルを生成すると予測されているか、または該１以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程を包含するプロセスによって実施される、手段。
【請求項２１】少なくとも１つの種類の前記細胞が癌細胞である、請求項
１５に記載の手段。
【請求項２２】少なくとも１つの種類の前記細胞が推定薬学的薬剤と接触
されている、請求項１５に記載の手段。
【請求項２３】複数の種類の細胞の間の相関の表現物の表示するための表
示手段であって、該各種類における該細胞は、所定の細胞型の細胞、所定の組織
由来の細胞および所定の器官由来の細胞からなる群より選択され、該相関は、該
種類の細胞の核酸における一対のヌクレオチドサブ配列の存在下の差分を反映し
、各対は、第一のサブ配列、第二のサブ配列、該対の該第一のサブ配列と該第二
のサブ配列とを分離するヌクレオチド長さおよび所定の長さを有する各対が該種
類の細胞中にある程度の量からなる、表示手段。
【請求項２４】請求項２３に記載の表示手段であって、前記相関が、１セ
ットの正規直交固有ベクトルに関連し、該固有ベクトルが構築される基底セット
の要素が、前記２種類の細胞の間で相関付けられた特定の生化学的経路もしくは
生理的経路を反映し、各固有ベクトルは、０を超える整数である固有値を有し、
その固有値が、選択される該固有値の上限である特定の整数以下である該基底セ
ット要素の係数が前記第一の種類の細胞と前記第二の種類の細胞との間で相関付
けられた生化学的差分または生理学的差分に対応する経路の寄与を反映する、表
示手段。
【請求項２５】請求項２３に記載の手段であって、前記表現物がクラスタ
ー図または系統樹であり、前記２種類の細胞の間の生化学的差分もしくは生理的
差分に関与する経路の関連性を反映するツリー構造を包含し、ここで、相関行列
が距離の決定を提供し、該距離は、各々が該種類間の該差分について得られる情
報を各々反映する２つのベクターの間の差分である差分ベクトルの振幅を反映し
、そして該ツリー構造のブランチが該差分ベクトルを反映し、そして該ブランチ
がノードから分岐する、表示手段。
【請求項２６】請求項２３に記載の表示手段であって、前記相関が、以下
の工程：ａ）ヌクレオチドサブ配列の複数の対を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる、工程；ｂ）該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定し、それによって該種類の間の差分を規定す
る、工程；ｃ）該種類の差分を基に第一の種類の細胞と第二の種類との間の該相関を評価
する工程；ならびにｄ）該相関の表現物を作成する工程、を包含する方法によって得られる、表示手段。
【請求項２７】請求項２３に記載の手段であって、前記工程ｂ）において
記載される前記フラグメントの前記存在および量を決定する工程が、以下の工程
：ｉ）複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、各サンプルは、１対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、各消化は、特定の制
限フラグメントを提供する、工程二本鎖アダプターＤＮＡ分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターＤＮＡ分子は、（ａ）５’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
５’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および（ｂ）該より短い鎖の該第二
の部分に相補的な３’末端を有する、より長い鎖を含む、工程、および該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程；ｉｉ）該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、（
ａ）該制限エンドヌクレアーゼの対の該サブ配列、（ｂ）該ヌクレアーゼの各対
において使用される２つの制限エンドヌクレアーゼに対応する２つのサブ配列の
間の長さ、ならびに（ｃ）該対および該長さに対応する該フラグメントの量を特
徴付ける、工程；ならびに（ｉｉｉ）各種類の該細胞から該核酸によって生成される、１以上の該出力シ
グナルを生成すると予測される配列、または１以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（
ａ）該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出
力シグナルを生成すると予測されているか、または該１以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、を包含するプロセスによって実施される、手段。
【請求項２８】請求項２３に記載の手段であって、前記工程ｂ）に記載さ
れる前記フラグメントの存在および該フラグメントの量の決定が、以下の工程：ｉ）前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程；ｉｉ）該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該２つのプライマーに対応する該２つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程；およびｉｉｉ）各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、（ａ）該プライマーの対の該サブ配列、（ｂ）該長さ、
ならびに（ｃ）該量、を特徴付ける、工程；ならびにｉｖ）各種類の該細胞から該核酸によって生成される、１以上の該出力シグナ
ルを生成すると予測される配列、または１以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（ａ）
該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力シ
グナルを生成すると予測されているか、または該１以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程を包含するプロセスによって実施される、表示手段。
【請求項２９】少なくとも１つの種類の前記細胞が癌細胞である、請求項
２３に記載の表示手段。
【請求項３０】請求項２３に記載の表示手段であって、少なくとも１種類
の前記細胞が、推定薬学的薬剤と接触されており、そして前記相関は以下の工程
：ａ）少なくとも１つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量と接触させる工程
；ｂ）ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程；ｃ）該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定し、それによって該薬剤の効果を規定する、
工程；ｄ）該薬剤と接触させた少なくとも１つの種類の細胞における該薬剤の効果と
、別の種類の細胞に対する該薬剤の効果との間の相関を評価する工程；ならびにｅ）該相関の表現物を作成する工程、を包含する方法によって得られる、表示手段
【請求項３１】少なくとも２種類の細胞の間の関連性の程度の表現物であ
って、各種類の該細胞が、所定の細胞型の細胞、所定の組織由来の細胞および所
定の器官由来の細胞からなる群より選択され、該関連性の程度は、該細胞の種類
の核酸において、ヌクレオチドサブ配列の対の存在における類似性もしくは差分
を反映し、該対は、第一のサブ配列、第二のサブ配列、該対の該第一のサブ配列
と該第二のサブ配列とを分離するヌクレオチド長さおよび所定の長さを有する各
対が該種類の細胞である程度の量からなる、表現物。
【請求項３２】請求項３１に記載の表現物であって、前記関連の程度が距
離に関連し、該距離は、前記第一の種類について得られる各サブ配列ついについ
ての前記量に由来する情報を反映する第一ベクトルと、前記第二の種類について
得られる各サブ配列対についての前記量に由来する情報を反映する第二ベクトル
との間の差分である差分ベクトルの振幅を反映し、そして各ベクトルの異なる要
素が異なる対を用いて得られたデータに関連する、表現物。
【請求項３３】請求項３１に記載の表現物であって、該表現物が、任意の
２つの種類の間の関連性を反映するツリー構造を含み、ここで、該ツリー構造の
ブランチが前記差分ベクトルを反映し、そして該ブランチがノードから分岐する
、表現物。
【請求項３４】請求項３１に記載の表現物であって、前記関連性の程度が
、以下の工程：ａ）ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程；ｂ）該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定する、工程；ならびにｃ）該種類のなかの該フラグメントの存在および量における類似性もしくは差
分を反映する関連性の程度を決定する工程、を包含するプロセスによって得られる、表現物。
【請求項３５】請求項３４に記載の表現物であって、前記工程ｂ）におい
て記載される前記フラグメントの前記存在および量を決定する工程が、以下の工
程：ｉ）複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、該サンプルは、１対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、各消化は、特定の制
限フラグメントを提供する、工程二本鎖アダプターＤＮＡ分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターＤＮＡ分子は、５’末端ホスフェートを有さず、かつ（ａ
）より短い鎖は、第一部分および第二部分からなり、該第一の部分は、５’末端
に存在し、かつ該対の制限エンドヌクレアーゼの対の一方によって生成されるオ
ーバーハングに対して相補的であり、そして（ｂ）より長い鎖は、該より短い鎖
の該第二の部分に相補的な３’末端を有する、工程、および該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程；ｉｉ）該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、（
ａ）該制限エンドヌクレアーゼの対の該サブ配列、（ｂ）該ヌクレアーゼの各対
において使用される２つの制限エンドヌクレアーゼに対応する２つのサブ配列の
間の長さ、ならびに（ｃ）該対および該長さに対応する該フラグメントの量を特
徴付ける、工程；ならびに（ｉｉｉ）各種類の該細胞から該核酸によって生成される、１以上の該出力シ
グナルを生成すると予測される配列、または１以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（
ａ）該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出
力シグナルを生成すると予測されているか、または該１以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、を包含するプロセスによって実施される、表現物。
【請求項３６】請求項３４に記載の表現物であって、前記工程ｂ）に記載
される前記フラグメントの存在および該フラグメントの量の決定が、以下の工程
：ｉ）前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程；ｉｉ）該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該２つのプライマーに対応する該２つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程ｉｉｉ）各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、（ａ）各プライマーの対の該サブ配列、（ｂ）該長さ、
ならびに（ｃ）該量、を特徴付ける、工程；ならびにｉｖ）各種類の該細胞から該核酸によって生成される、１以上の該出力シグナ
ルを生成すると予測される配列、または１以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（ａ）
該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力シ
グナルを生成すると予測されているか、または該１以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程を包含するプロセスによって実施される、表現物。
【請求項３７】少なくとも１つの種類の前記細胞が癌細胞である、請求項
３１に記載の表現物。
【請求項３８】種類の前記細胞が推定薬学的薬剤と接触されている、請求
項３１に記載の表現物。【請求項３８】複数の種類の細胞の間の相関の表現物であって、該各種類
における該細胞は、所定の細胞型の細胞、所定の組織由来の細胞および所定の器
官由来の細胞からなる群より選択され、該相関は、該細胞の種類の核酸において
、ヌクレオチドサブ配列の対の存在における差分を反映し、該対は、第一のサブ
配列、第二のサブ配列、該対の該第一のサブ配列の対と該第二のサブ配列の対と
を分離するヌクレオチド長さおよび所定の長さを有する各対が該種類の間の細胞
に存在する程度の量からなる、表現物。
【請求項３９】請求項３８に記載の表現物であって、前記相関が、１セッ
トの正規直交固有ベクトルに関連し、該固有ベクトルが構築される基底セットの
要素が、前記２種類の細胞の間で相関付けられた特定の生化学的経路もしくは生
理的経路を反映し、各固有ベクトルは、０を超える整数である固有値を有し、そ
の固有値が、選択される該固有値の上限である特定の整数以下である各固有ベク
トルにおける該基底セット要素の係数が前記第一の種類の細胞と前記第二の種類
の細胞との間で相関付けられた生化学的差分または生理学的差分に対応する経路
の寄与を反映する、表現物。
【請求項４０】請求項３８に記載の表現物であって、該表現物がクラスタ
ー図または系統樹であり、前記２種類の細胞の間の生化学的差分もしくは生理的
差分に関与する経路の関連性を反映するツリー構造を包含し、ここで、相関行列
が距離の決定を提供し、該距離は、一方の種類から得られる情報を各々反映する
２つのベクターの間の差分である差分ベクトルの振幅を反映し、そして該ツリー
構造のブランチが該差分ベクトルを反映し、そして該ブランチがノードから分岐
する、表現物。
【請求項４１】請求項３８に記載の表現物であって、前記相関が、以下の
工程：ａ）ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程；ｂ）該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さフラグメントの存在、ならびに各フラグメント
が存在する程度の量を決定し、それによって該種類の間の差分を規定する、工程
；ｃ）該種類の差分に基づき該一方の種類の該細胞と該第二の種類の細胞との間
の相関を評価する工程；ならびにｄ）該相関の表現物を作成する工程、を包含する方法によって得られる、表現物。
【請求項４２】請求項４１に記載の表現物であって、前記工程ｂ）におい
て記載される前記フラグメントの前記存在および量を決定する工程が、以下の工
程：ｉ）複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、各サンプルは、１対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程二本鎖アダプターＤＮＡ分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターＤＮＡ分子は、（ａ）５’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
５’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および（ｂ）該より短い鎖の該第二
の部分に相補的な３’末端を有する、より長い鎖を含む、工程、、および該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程；ｉｉ）該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの
各々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、（
ａ）該制限エンドヌクレアーゼの対の該サブ配列、（ｂ）該ヌクレアーゼの各対
において使用される２つの制限エンドヌクレアーゼに対応する２つのサブ配列の
間の長さ、ならびに（ｃ）該対および該長さに対応する該フラグメントの量を特
徴付ける、工程；ならびに（ｉｉｉ）各種類の該細胞から該核酸によって生成される、１以上の該出力シ
グナルを生成すると予測される配列、または１以上の該出力シグナルを生成する
と推測される任意の配列の非存在を決定するためにヌクレオチド配列データベー
スを任意に検索する工程であって、該データベースは、各種類の細胞において存
在し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（
ａ）該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配
列の発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現さ
れるときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出
力シグナルを生成すると予測されているか、または該１以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、を包含するプロセスによって実施される、表現物。
【請求項４３】請求項４１に記載の表現物であって、前記工程ｂ）に記載
される前記フラグメントの存在および該フラグメントの量の決定が、以下の工程
：ｉ）前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第二
のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であって
、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第二
のプライマーが該第二のサブ配列に対して相補的である、工程；ｉｉ）該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該２つのプライマーに対応する該２つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程ｉｉｉ）各アンプリコンについての出力シグナルを生成する工程であって、該
出力シグナルの各々は、（ａ）各プライマーの対の該サブ配列、（ｂ）該長さ、
および（ｃ）該量、を特徴付ける、工程；ならびにｉｖ）各種類の該細胞から該核酸によって生成される、１以上の該出力シグナ
ルを生成すると予測される配列、または１以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（ａ）
該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および（ｂ）該１以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力シ
グナルを生成すると予測されているか、または該１以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程を包含するプロセスによって実施される、表現物。
【請求項４４】少なくとも１つの種類の前記細胞が癌細胞である、請求項
３８に記載の表現物。
【請求項４５】請求項３８に記載の表現物であって、少なくとも１種類の
前記細胞が、推定薬学的薬剤と接触されており、そして前記相関は以下の工程：ａ）少なくとも１つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量をと接触させる工
程；ｂ）ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程；ｃ）該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定し、それによって該薬剤の効果を規定する、
工程；ｄ）該薬剤と接触させた少なくとも１つの種類の細胞における該薬剤の効果と
、別の種類の細胞に対する該薬剤の効果との間の相関を評価する工程；ならびにｅ）該相関の表現物を作成する工程、を包含する方法によって得られる、表現物。
【請求項４６】複数の種類の細胞の間の幾何的表現物を作成するための方
法であって、各種類の該細胞が、所定の細胞型の細胞、所定の組織に由来する細
胞および所定の器官に由来する細胞からなる群より選択され、該表現物が、該種
類に存在する核酸の性質および量の変化を反映し、該方法は以下の工程：ａ）各種類の細胞の核酸において、核酸フラグメントの存在および量を評価し
、それによって該種類の間の差分を規定する工程；ｂ）該種類の該細胞の間の差分に基づいて幾何的分析を行う工程；ならびにｃ）該分析の結果の表現物を作成する工程、を包含する、方法。
【請求項４７】前記幾何的表現物が、主成分分析もしくは主因数分析によ
って得られた結果である、請求項４６に記載の方法。
【請求項４８】請求項４６に記載の方法であって、前記工程ａ）において
記載される核酸フラグメントの存在および量を評価する工程が、以下の工程：ｉ）該フラグメントについて特異的なオリゴヌクレオチドプローブのセットを
用いて該種類の該核酸をプローブする工程；およびｉｉ）各プローブが該核酸を結合する程度を決定し、それによって、該種類に
おける該核酸フラグメントの存在および量の評価が提供される、工程、を包含するプロセスによって実施される、方法。
【請求項４９】請求項４６に記載の方法であって、前記工程ａ）において
記載される核酸の存在および量を評価する工程が、以下の工程：ｉ）複数の対のヌクレオチドサブ配列を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる群より選択される、工程；およびｉｉ）細胞の各種類の該核酸において、一方の末端に該第一のサブ配列を、お
よび他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第
二の配列によって分離された長さを有するフラグメントの存在、ならびに該フラ
グメントの各々が存在する程度の量を決定し、それによって、該種類の間の差分
を規定する工程を包含するプロセスによって実施される、方法。
【請求項５０】請求項４９に記載の方法であって、前記工程ｉｉ）におい
て記載される前記フラグメントの前記存在および量を評価する工程が、以下の工
程：ａ）複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、各サンプルは、１対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程二本鎖アダプターＤＮＡ分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターＤＮＡ分子は、（ａ）５’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
５’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および（ｂ）該より短い鎖の該第二
の部分に相補的な３’末端を有する、より長い鎖を含む、工程、および該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程；ｂ）該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの各
々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、（１
）該制限エンドヌクレアーゼの対の該サブ配列、（２）該ヌクレアーゼの各対に
おいて使用される２つの制限エンドヌクレアーゼに対応する２つのサブ配列の間
の長さ、および（３）該対および該長さに対応する該フラグメントの量を特徴付
ける、工程；ならびに（ｃ）各種類の該細胞から該核酸によって生成される、１以上の該出力シグナ
ルを生成すると予測される配列、または１以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（１）
該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および（２）該１以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力シ
グナルを生成すると予測されているか、または該１以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、を包含するプロセスによって実施される、方法。
【請求項５１】請求項４９に記載の方法であって、前記工程ｉｉ）に記載
される前記フラグメントの存在および該フラグメントの量の決定が、以下の工程
：（ａ）前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第
二のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であっ
て、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第
二のプライマーが該第二のサブ配列に対して相補的である、工程；（ｂ）該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該２つのプライマーに対応する該２つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程；および（ｃ）各アンプリコンについての出力シグナルを生成する工程であって、該出
力シグナルの各々は、（１）各プライマーの対の該サブ配列、（２）該長さ、お
よび（３）該量、を特徴付ける、工程；ならびにｄ）各種類の該細胞から該核酸によって生成される、１以上の該出力シグナル
を生成すると予測される配列、または１以上の該出力シグナルを生成すると推測
される任意の配列の非存在を決定するためにヌクレオチド配列データベースを任
意に検索する工程であって、該データベースは、各種類の細胞において存在し得
る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（１）該
１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の発
生の間の同じ長さ、および（２）該１以上の出力シグナルによって表現されると
きに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力シグ
ナルを生成すると予測されているか、または該１以上の出力シグナルによって表
現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオチ
ドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程を包含するプロセスによって実施される、方法。
【請求項５２】前記幾何的分析の結果が、固有値、固有ベクトルおよび主
因数からなる群より選択される、請求項４６に記載の方法。
【請求項５３】請求項４６に記載の方法であって、前記工程ｃ）における
分析結果がが１セットの正規直交固有ベクトルに関連し、該固有ベクトルが構築
される基底セットの要素が、前記２種類の細胞の間で相関付けられた特定の生化
学的成分、生理的成分もしくは薬理学的成分を反映し、各固有ベクトルは、固有
値を有し、その固有値が、固有ベクトルにおける該基底セット要素の係数が前記
第一の種類の細胞と前記第二の種類の細胞との間の差分に対応する生化学的成分
、生理学的成分もしくは薬理学的成分の寄与を反映する、方法。
【請求項５４】前記少なくとも１つの種類における前記細胞が癌細胞であ
る、請求項４６に記載の方法。
【請求項５５】請求項４６に記載の方法であって、前記少なくとも１つの
種類における前記細胞が推定薬学的薬剤に接触されており、そして、該方法は以
下の工程：ａ）少なくとも１つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量を用いて処理する
工程；ｂ）ヌクレオチドサブ配列の複数の対を規定する工程であって、該対は、第一
のサブ配列および第二のサブ配列からなる、工程；ｃ）該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定し、それによって該薬剤の効果を規定する、
工程；ｄ）該第一の種類の細胞における該薬剤の効果と、別の種類の細胞に対する該
薬剤の効果との間の主成分分析を行う工程；ならびにｅ）該分析の結果の表現物を作成する工程、を包含する、方法。
【請求項５６】複数種類の細胞の間の幾何的表現物を表示するための表示
手段であって、各種類の該細胞が、所定の細胞型の細胞、所定の組織由来の細胞
および所定の器官由来の細胞からなる群より選択され、主成分の分析は、該種類
に存在する核酸の性質および存在の変化を反映し、該表現物は、以下の工程：ａ）各種類の細胞の核酸において、核酸フラグメントの存在および量を評価し
、それによって該種類の間の差分を規定する工程；ｂ）第一の種類の細胞と第二の種類の細胞との間の差分に基づいて主成分分析
を行う工程；ならびにｃ）該分析の結果の表現物を作成する工程、を包含する方法によって得られる、表示手段。
【請求項５７】前記幾何的表現物が、主成分分析または主因数分析によっ
て得られた結果である、請求項５６に記載の表示手段。
【請求項５８】請求項５６に記載の表示手段であって、前記工程ａ）にお
いて記載される核酸フラグメントの存在および量を評価する工程が、以下の工程
：ｉ）該フラグメントについて特異的なオリゴヌクレオチドプローブのセットを
用いて該種類の該核酸をプローブする工程；およびｉｉ）各プローブが該核酸を結合する程度を決定し、それによって、該種類に
おける該核酸フラグメントの存在および量の評価が提供される、工程、を包含する、表示手段。
【請求項５９】請求項５６に記載の表示手段であって、前記工程ａ）にお
いて記載される核酸フラグメントの存在および量を評価する工程が、以下の工程
：ｉ）複数の対のヌクレオチドサブ配列を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる群より選択される、工程；およびｉｉ）細胞の各種類の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
の配列によって分離された長さを有するフラグメントの存在、ならびに該フラグ
メントの各々が存在する程度の量を決定し、それによって、該種類の間の差分を
規定する工程を包含する、プロセスによって実施される、表示手段。
【請求項６０】請求項５９に記載の表示手段であって、前記工程ｉｉ）に
おいて記載される前記核酸フラグメントの前記存在および量を決定する工程が、
以下の工程：ａ）複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、該サンプルは、１対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、該消化は、特定の制
限フラグメントを提供する、工程二本鎖アダプターＤＮＡ分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターＤＮＡ分子は、５’末端ホスフェートを有さず、かつ（１
）より短い鎖は、第一部分および第二部分からなり、該第一の部分は、５’末端
に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成されるオーバ
ーハングに対して相補的であり、そして（２）より長い鎖は、該より短い鎖の該
第二の部分に相補的な３’末端を有する、工程、および該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程；ｂ）該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの各
々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、（１
）該制限エンドヌクレアーゼの対の該サブ配列、（２）該ヌクレアーゼの各対に
おいて使用される２つの制限エンドヌクレアーゼに対応する２つのサブ配列の間
の長さ、および（３）該対および該長さに対応する該フラグメントの量を特徴付
ける、工程；ならびに（ｃ）各種類の該細胞由来の該核酸によって生成される、１以上の該出力シグ
ナルを生成すると予測される配列、または１以上の該出力シグナルを生成すると
推測される任意の配列の非存在を決定するためにヌクレオチド配列データベース
を任意に検索する工程であって、該データベースは、各種類の細胞において存在
し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（１
）該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列
の発生の間の同じ長さ、および（２）該１以上の出力シグナルによって表現され
るときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力
シグナルを生成すると予測されている配列、または該１以上の出力シグナルによ
って表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌク
レオチドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、を包含するプロセスによって実施される、表示手段。
【請求項６１】請求項５９に記載の表示手段であって、前記工程ｉｉ）に
記載される前記核酸フラグメントの存在および量を評価する工程が、以下の工程
：（ａ）前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第
二のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であっ
て、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第
二のプライマーが該第二のサブ配列に対して相補的である、工程；（ｂ）該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該２つのプライマーに対応する該２つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程（ｃ）各アンプリコンについての出力シグナルを生成する工程であって、該出
力シグナルの各々は、（１）各プライマーの対の該サブ配列、（２）該長さ、お
よび（３）該量、を特徴付ける、工程；ならびにｄ）各種類の該細胞由来の該核酸によって生成される、１以上の該出力シグナ
ルを生成すると予測される配列、または１以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（１）
該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および（２）該１以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力シ
グナルを生成すると予測されている配列、または該１以上の出力シグナルによっ
て表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレ
オチドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程を包含するプロセスによって実施される、表示手段。
【請求項６２】前記表示手段の結果が、固有値、固有ベクトルおよび主因
数からなる群より選択される、請求項５６に記載の表示手段。
【請求項６３】請求項５６に記載の表示手段であって、前記工程ｃ）にお
ける分析結果がが１セットの正規直交固有ベクトルに関連し、該固有ベクトルが
構築される基底セットの要素が、前記２種類の細胞の間で相関付けられた特定の
生化学的経路、生理的経路もしくは薬理学的経路を反映し、各固有ベクトルは、
固有値を有し、その固有値が、各固有ベクトルにおける該基底セット要素の係数
が前記第一の種類の細胞と前記第二の種類の細胞との間で相関付けられた生化学
的差分、生理学的差分または薬理学的差分に対応する経路の寄与を反映する、表
示手段。
【請求項６４】前記少なくとも１つの種類における前記細胞が癌細胞であ
る、請求項５６に記載の表示手段。
【請求項６５】請求項５６に記載の表示手段であって、前記少なくとも１
つの種類における前記細胞が推定薬学的薬剤に接触されており、そして、該表現
物は、以下の工程：ａ）少なくとも１つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量を用いて処理する
工程；ｂ）ヌクレオチドサブ配列の複数の対を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる、工程；ｃ）該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
サブ配列によって分離される長さを有するフラグメントの存在、ならびに各フラ
グメントが存在する程度の量を決定し、それによって該薬剤の効果を規定する、
工程；ｄ）該第一の種類の細胞における該薬剤の効果と、別の種類の細胞に対する該
薬剤の効果との間の主成分分析を行う工程；ならびにｅ）該分析の結果の表現物を作成する工程、を包含する、方法によって得られる、表示手段。
【請求項６６】少なくとも２種類の細胞の間の幾何的表現物であって、各
種類の該細胞が、所定の細胞型の細胞、所定の組織由来の細胞および所定の器官
由来の細胞からなる群より選択され、主成分の分析は、該種類に存在する核酸の
性質および量の変化を反映し、該表現物は、以下の工程：ａ）各種類の細胞の核酸において、核酸フラグメントの存在および量を評価し
、それによって該種類の間の差分を規定する工程；ｂ）第一の種類の細胞と第二の種類の細胞との間の差分に基づいて主成分分析
を行う工程；ならびにｃ）該分析の結果の表現物を作成する工程、を包含する方法によって得られる、幾何的表現物。
【請求項６７】前記幾何的表現物が、主成分分析または主因数分析によっ
て得られた結果である、請求項６６に記載の幾何的表現物。
【請求項６８】請求項６６に記載の幾何的表現物であって、前記工程ａ）
において記載される核酸フラグメントの存在および量を評価する工程が、以下の
工程：ｉ）該フラグメントについて特異的なオリゴヌクレオチドプローブのセットを
用いて該各種類の該核酸をプローブする工程；およびｉｉ）各プローブが該核酸を結合する程度を決定し、それによって、該種類に
おける該核酸フラグメントの存在および量の評価が提供される、工程、を包含する、表現物。
【請求項６９】請求項６６に記載の表現物であって、前記工程ａ）におい
て記載される核酸フラグメントの存在および量を評価する工程が、以下の工程：ｉ）複数の対のヌクレオチドサブ配列を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列を含む、工程；およびｉｉ）細胞の各種類の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第一のサブ配列および該第二
の配列によって分離された長さを有するフラグメントの存在、ならびに該フラグ
メントの各々が存在する程度の量を決定し、それによって、該種類の間の差分を
規定する工程を包含する、プロセスによって実施される、表現物。
【請求項７０】請求項６９に記載の表現物であって、前記工程ｉｉ）にお
いて記載される前記核酸フラグメントの前記存在および量を決定する工程が、以
下の工程：ａ）複数の特定の対の制限エンドヌクレアーゼを用いて、前記各種類の細胞由
来の核酸のサンプルを消化する工程であって、各サンプルは、１対によって処理
され、該対の一方のヌクレアーゼは、前記第一のサブ配列を標的化し、そして該
対の第二のヌクレアーゼは前記第二のサブ配列を標的化し、各消化は、特定の制
限フラグメントを提供する、工程二本鎖アダプターＤＮＡ分子を該フラグメントにハイブリダイズさせる工程で
あって、各アダプターＤＮＡ分子は、（ａ）５’末端ホスフェートを有さず、か
つ、第一部分および第二部分からなる、より短い鎖であって、該第一の部分は、
５’末端に存在し、かつ該対の制限エンドヌクレアーゼの一方によって生成され
るオーバーハングに対して相補的である鎖、および（ｂ）該より短い鎖の該第二
の部分に相補的な３’末端を有する、より長い鎖を含む、工程、および該フラグメントに対して該より長い鎖を連結させて連結フラグメントを生成す
る工程であって、該連結フラグメントの各々は、出力シグナルを生成し得る、工
程；ｂ）該制限エンドヌクレアーゼの対の各々について、該連結フラグメントの各
々からの出力シグナルを生成する工程であって、該出力シグナルの各々が、（１
）該制限エンドヌクレアーゼの対の該サブ配列、（２）該ヌクレアーゼの各対に
おいて使用される２つの制限エンドヌクレアーゼに対応する２つのサブ配列の間
の長さ、および（３）該対および該長さに対応する該フラグメントの量を特徴付
ける、工程；ならびに（ｃ）各種類の該細胞由来の該核酸によって生成される、１以上の該出力シグ
ナルを生成すると予測される配列、または１以上の該出力シグナルを生成すると
推測される任意の配列の非存在を決定するためにヌクレオチド配列データベース
を任意に検索する工程であって、該データベースは、各種類の細胞において存在
し得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（１
）該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列
の発生の間の同じ長さ、および（２）該１以上の出力シグナルによって表現され
るときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力
シグナルを生成すると予測されているか、または該１以上の出力シグナルによっ
て表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレ
オチドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを有するフラグメントを含む程度の量
的尺度を提供する、工程、を包含するプロセスによって実施される、表現物。
【請求項７１】請求項６９に記載の表現物であって、前記工程ｉｉ）に記
載される前記核酸フラグメントの存在および量を評価する工程が、以下の工程：（ａ）前記ヌクレオチドサブ配列の各対について、第一のプライマーおよび第
二のプライマーからなるオリゴヌクレオチドプライマー対を提供する工程であっ
て、該第一のプライマーが該第一のサブ配列に対して相補的であり、そして該第
二のプライマーが該第二のサブ配列に対して相補的である、工程；（ｂ）該第一のサブ配列と該第二のサブ配列との間のヌクレオチド配列を、該
増幅をプライムする該オリゴヌクレオチドプライマーを用いて増幅し、該サブ配
列対、各対において使用される該２つのプライマーに対応する該２つのサブ配列
の間の長さ、および各アンプリコンが存在する程度の量によって特徴付けられる
該アンプリコンを提供する、工程（ｃ）各アンプリコンについての出力シグナルを生成する工程であって、該出
力シグナルの各々は、（１）各プライマーの対の該サブ配列、（２）該長さ、お
よび（３）該量、を特徴付ける、工程；ならびにｄ）各種類の該細胞由来の該核酸によって生成される、１以上の該出力シグナ
ルを生成すると予測される配列、または１以上の該出力シグナルを生成すると推
測される任意の配列の非存在を決定するためにヌクレオチド配列データベースを
任意に検索する工程であって、該データベースは、各種類の細胞において存在し
得る複数の核酸の公知のヌクレオチド配列、該データベース由来の配列が（１）
該１以上の出力シグナルによって表現されるときに標的ヌクレオチドサブ配列の
発生の間の同じ長さ、および（２）該１以上の出力シグナルによって表現される
ときに同じ標的ヌクレオチドサブ配列の両方を有する場合に該１つ以上の出力シ
グナルを生成すると予測されているか、または該１以上の出力シグナルによって
表現される標的ヌクレオチドサブ配列の同じ種類のメンバーである標的ヌクレオ
チドサブ配列を包含し、それによって、該各種類の該細胞において存在する該核酸が該特異的なサブ配
列対および該対の間の該ヌクレオチド長さを含む程度の量的尺度を提供する、工
程を包含するプロセスによって実施される、幾何的表現物。
【請求項７２】前記幾何的分析の結果が、固有値、固有ベクトルおよび主
因数からなる群より選択される、請求項６６に記載の表現物。
【請求項７３】請求項６６に記載の表現物であって、前記工程ｃ）におけ
る分析結果が１セットの正規直交固有ベクトルに関連し、該固有ベクトルが構築
される基底セットの要素が、前記２種類の細胞の間で相関付けられた特定の生化
学的経路、生理学的経路もしくは薬理学的経路を反映し、各固有ベクトルは、固
有値を有し、その固有値が、各固有ベクトルにおける該基底セット要素の係数が
前記第一の種類の細胞と前記第二の種類の細胞との間で相関付けられた生化学的
差分、生理学的差分もしくは薬理学的差分に対応する経路の寄与を反映する、表
現物。
【請求項７４】前記少なくとも１つの種類における前記細胞が癌細胞であ
る、請求項６６に記載の表現物。
【請求項７５】請求項６６に記載の表現物であって、前記少なくとも１つ
の種類における前記細胞が推定薬学的薬剤に接触されており、そして、該表現物
は、以下の工程：ａ）少なくとも１つの種類の細胞を、それら細胞の状態における変化をもたら
すに充分な薬剤量、または投与濃度の所定の上限以下の薬剤量を用いて処理する
工程；ｂ）ヌクレオチドサブ配列の複数の対を規定する工程であって、各対は、第一
のサブ配列および第二のサブ配列からなる、工程；ｃ）該各種類の細胞の核酸において、一方の末端に該第一のサブ配列を、およ
び他方の末端に該第二のサブ配列を有し、かつ、該第二のサブ配列および該第二
サブ配列によって分離される長さフラグメントの存在、ならびに各フラグメント
が存在する程度の量を決定し、それによって該薬剤の効果を規定する、工程；ｄ）該第一の種類の細胞における該薬剤の効果と、別の種類の細胞に対する該
薬剤の効果との間の主成分分析を行う工程；ならびにｅ）該分析の結果の表現物を作成する工程、を包含する、方法によって得られる、表現物。
【請求項７６】複数の種類の細胞またはその成分を階層的に分類するため
の方法であって、該方法は、以下の工程：ａ）各種類の細胞に存在する核酸の量における相対的な差分を測定して、示差
的核酸表示の測定値を提供する工程；ｂ）該測定値を、ベクトル空間において、該種類の細胞の間の距離へと変換す
る工程；およびｃ）該ベクトル距離に基づいて、該種類の間の階層的分類を生成する工程、を包含する、方法。
【請求項７７】前記分類が、細胞の種類について実施され、１つの種類に
おける該細胞は、所定の細胞型の細胞、所定の組織由来の細胞および所定の器官
由来の細胞、特定の病的状態を示す細胞、または推定薬学的薬剤と接触された細
胞であり得る、請求項７６に記載の方法。
【請求項７８】前記分類が、前記種類における前記細胞の成分に対して実
施され、該成分は、遺伝子、核酸、またはそのフラグメントを包含する、請求項
７６に記載の方法。
【請求項７９】前記測定する工程が、核酸フラグメントの示差的表示、オ
リゴヌクレオチドプローブ、発現配列タグ（ＥＳＴ）から得られた配列を用いる
核酸の存在についてのプロービング、制限フラグメント長多型性の評価、および
増幅フラグメント長多型性の評価からなる群より選択される手順によって実施さ
れる、請求項７６に記載の方法。
【請求項８０】前記階層的分類の生成が、相関行列の主成分分析、相関行
列の主因数分析、中心（ｃｅｎｔｅｒｅｄ）内積行列の主成分分析、および中内
積行列の主因数分析からなる群より選択される、手順によって実施される、請求
項７６に記載の方法。
【請求項８１】さらに、次元を減じた幾何的表現物から前記種類の間の距
離計量を得る工程を包含する、請求項８０に記載の方法。
【請求項８２】請求項７６〜８１のいずれか１項に記載される方法によっ
て得られる分類の結果を表示する、表示手段。
【請求項８３】複数の種類の細胞またはその成分を幾何的に表現するため
の方法であって、該方法は以下の工程：ａ）各種類の細胞に存在する核酸の量における相対的な差分を測定して、示差
的核酸表示の測定値を提供する工程；およびｂ）該示差的表示測定値に基づく種類のなかでの、幾何的表示物を生成する工
程、を包含する、方法。
【請求項８４】請求項８３に記載の方法であって、前記分類が細胞の種類
について行われ、１つの種類における該細胞は、所定の細胞型の細胞、所定の組
織由来の細胞および所定の器官由来の細胞、特定の病的状態を示す細胞、または
推定薬学的薬剤と接触された細胞であり得る、方法。
【請求項８５】前記分類が、前記種類における前記細胞の成分に対して実
施され、該成分は、遺伝子、核酸、またはそのフラグメントを包含する、請求項
８３に記載の方法。
【請求項８６】前記測定する工程が、核酸フラグメントの示差的表示、オ
リゴヌクレオチドプローブ、発現配列タグ（ＥＳＴ）から得られた配列を用いる
核酸の存在についてのプロービング、制限フラグメント長多型性の評価、および
増幅フラグメント長多型性の評価からなる群より選択される手順によって実施さ
れる、請求項８３に記載の方法。
【請求項８７】前記階層的分類の生成が、相関行列の主成分分析、相関行
列の主因数分析、中心内積行列の主成分分析、および中内積行列の主因数分析か
らなる群より選択される、手順により実施される、請求項８３に記載の方法。
【請求項８８】さらに、次元を減じた幾何的表現物から前記種類の間の距
離計量を得る工程を包含する、請求項８７に記載の方法。
【請求項８９】請求項８３〜８８のいずれか１項に記載される方法によっ
て得られる幾何学的表現物の結果を表示する、表示手段。
【請求項９０】集団の２以上のメンバーの階層的関連性を提示する方法で
あって、該方法は以下の工程：該集団における各メンバーのデータセットを提供する工程；該データセットの階層的分類を生成する工程；および該分類を表示し、それによって該集団のメンバーの階層的関連性を提示する工
程、を包含する、方法。
【請求項９１】前記集団が細胞集団である，請求項９０に記載の方法。
【請求項９２】前記集団が核酸配列の集団である、請求項９０に記載の方
法。
【請求項９３】前記集団がポリペプチド配列の集団である、請求項９０に
記載の方法。
【請求項９４】前記集団の任意の２以上のメンバーの前記階層的分類が、
アルゴリズムと組み合わせた距離方法を用いて計算される、請求項９０に記載の
方法。
【請求項９５】前記距離方法が、ピアソン相関距離、ユークリッド距離、
マンハッタン距離、マハロノビシュ（Ｍａｈａｌａｎｏｂｉｓ）距離、対（ｐａ
ｉｒｗｉｓｅ）ピアソン距離、またはスペアマン（Ｓｐｅａｒｍａｎ）距離であ
る、請求項９４に記載の方法。
【請求項９６】前記アルゴリズムが、単一連鎖（ｓｉｎｇｌｅｌｉｎｋ
ａｇｅ）、平均連鎖、または完全連鎖である、請求項９５に記載の方法。
【請求項９７】前記データセットが、示差的表示、遺伝子発現の連続分析
、発現タグ配列分析、制限フラグメント長多型性、および増幅フラグメント長多
型性、またはノーザンブロットハイブリダイゼーション分析である、請求項９０
に記載の方法。
【請求項９８】集団の２以上のメンバーの幾何的関連性を提示する方法で
あって、該方法は以下の工程：該集団における各メンバーのデータセットを提供する工程；該データセットの幾何的分類を生成する工程；および該分類を表示し、それによって該集団のメンバーの幾何的関連性を提示する工
程、を包含する、方法。
【請求項９９】前記集団が細胞集団である，請求項９８に記載の方法。
【請求項１００】前記集団が核酸配列の集団である、請求項９８に記載の
方法。
【請求項１０１】前記集団がポリペプチド配列の集団である、請求項９８
に記載の方法。
【請求項１０２】前記幾何的分類が、アルゴリズムを用いて行列を分析す
ることによって生成される、請求項９８に記載の方法。
【請求項１０３】前記行列が相関行列を含む、請求項１０２に記載の方法
。
【請求項１０４】前記相関行列が、ピアソン相関行列、スペアマン相関行
列、または対ピアソン相関行列である、請求項１０３に記載の方法。
【請求項１０５】前記行列が中心内積距離行列を含む、請求項１０２に記
載の方法。
【請求項１０６】前記内積距離行列が階層的分類分析によって計算された
距離を用いて決定される、請求項１０５に記載の方法。
【請求項１０７】前記アルゴリズムが主成分分析を含む、請求項１０２に
記載の方法。
【請求項１０８】前記アルゴリズムが主因数分析を含む、請求項１０２に
記載の方法。
【請求項１０９】前記アルゴリズムが主因数分析を含む、請求項１０７に
記載の方法。
【請求項１１０】前記幾何的分類がさらに、階層的分類を用いて分析され
る、請求項１０２に記載の方法。
【請求項１１１】前記集団が、５、１０、２５、５０、１００、１０００
、１０，０００、１００，０００または１００，０００を超えるメンバーを含む
、請求項９０に記載の方法。
【請求項１１２】前記集団が、５、１０、２５、５０、１００、１０００
、１０，０００、１００，０００または１００，０００を超えるメンバーを含む
、請求項９８に記載の方法。