JP2001514488A

JP2001514488A - 遺伝子の量的発現を分析する方法

Info

Publication number: JP2001514488A
Application number: JP53460798A
Authority: JP
Inventors: ドミニクジー．スパイネラ; フレイドンジー．サジャディ
Original assignee: Chugai Pharmaceutical Co Ltd
Current assignee: Chugai Pharmaceutical Co Ltd
Priority date: 1997-01-15
Filing date: 1998-01-15
Publication date: 2001-09-11
Also published as: AU5923498A; WO1998031838A1; EP0970242A1; US5968784A

Abstract

(57)【要約】本発明は、ｍＲＮＡ集団中で遺伝子発現パターンを同定するための新規な方法を提供するものである。当該方法は、目的生物の細胞又は組織を含め、様々な細胞又は組織間で示差的遺伝子発現を判定するのに有用である。本発明は、さらに、ｍＲＮＡ集団中での遺伝子発現頻度を判定する方法を提供し、従って様々な細胞又は組織間での遺伝子発現頻度を比較する方法も提供するものである。さらに本発明は、本発明の方法に基づいて同定された標識配列に対応する遺伝子を単離する方法も提供する。さらに、本発明に基づいて同定された配列を用いて疾患の存在を診断してもよい。

Description

【発明の詳細な説明】遺伝子の量的発現を分析する方法発明の分野本発明は、細胞及び組織における遺伝子発現パターンを同定する新規な方法、目的の生物の細胞又は組織を含めた、細胞及び組織中の遺伝子発現の頻度を判定する方法、及び、遺伝子発現パターンを同定するために用いられるベクタ、に関するものである。目的の生物には、ヒト、動物及び植物が含まれる。本発明はさらに、本発明の方法に基づいて同定された標識配列に対応する遺伝子を単離する方法も提供するものである。本発明はさらに、示差的遺伝子発現に関連する疾患を診断する方法、及び遺伝子発現に対する薬物の作用を判定する方法にも関連するものである。発明の背景ヒトゲノムは約100,000の遺伝子を含んでいるが、いずれの細胞においてもこれらの遺伝子のごく一部しか発現しない。このように、各細胞種において、いずれの時点でもヒト遺伝子のごく一部しか発現しないのである。各遺伝子は精確なタイミングで精確な量、発現する。自動ＤＮＡシークエンサにより、生物のゲノムの配列を容易に決定できるようになつた。Haemophius influenzae,Mycoplasma genitalium，及びCaenorhabditi s elegansのゲノムの配列は公開されており、例えばヒトなど、より高等な生物のゲノムの配列が得られるようになってきている。(Fleischmann，R.D．et al． (1995)Science 269:496;Fraser，C.M．et al．(1995)Science270;397;Hodgkin， J．et al．(1995)Science 270:410)。しかしながら、この技術から得られる情報は、いつの時点、どの細胞でこれらの遺伝子のうちのどれが発現するかという疑問に答えるものではない。この情報は、細胞がどのように互いに分化していくか、細胞がどのように老化するかを判断するのに、そして数多くの疾患の原因及び影響を判断するのに、重要である。ある一つの細胞系譜にある典型的なほ乳類細胞は、そのゲノム中に持つ100,00 0余りの生殖系細胞のうちのほぼ20,000から30,000を発現させる。ほとんどすべての細胞は、多くの同じ遺伝子を普遍的に発現するが、このような遺伝子は「ハウスキーピング」遺伝子と呼ばれる。ハウスキーピング遺伝子の例には、解糖に関連する酵素、又は、細胞構造に関連するたんぱく質をコードする遺伝子がある。しかしながら、細胞を互いに分化させるのは普遍的に発現しない遺伝子である。細胞が分化した細胞に成熟する際には、特定の非構成的に発現する遺伝子が別々の段階でオンオフする。このように、細胞間での遺伝子発現パターンの違いが、例えば神経細胞を血液細胞とは異なったものにしているのである。さらに、非構成的に発現する遺伝子産物の細胞内濃度は、環境シグナルに応答して遺伝子発現が誘起又は抑制されることで、調節を受ける場合がある。このように、ある細胞種内での遺伝子産物の相対的濃度が、その細胞の状態の指標である場合がある。たった一個の細胞内においても、発現量はある一個の遺伝子と隣のものとでは大きく違うことがある。典型的な細胞では、20,000から30,000の別々の配列が転写されたものである、おそらくは200,000個のｍＲＮＡ分子が細胞質中に存在する。写しであるこれらの配列のうちで、一個の細胞あたり数千以上のコピーが存在するといった状態で豊富に存在するのはごく僅かであるかも知れない。例えば、抗体分泌形質細胞中の全ｍＲＮＡのうち最大７０％は免疫グロブリンｍＲＮＡである。その他の遺伝子、典型的にはアクチン又はグルコース-6-ホスフェートデヒドロゲナーゼなどのハウスキーピング遺伝子、は、細胞一個あたりおよそ10 0から1,000個のコピーといった中程度の量が存在する。しかしながら、遺伝子転写物のうちの９０％を越えるものが、細胞一個あたり10から15個未満のコピーが存在するといった程度であり、その存在量は低い。疾患又は異常状態にある個人のものなど、異常な細胞状態下では、個々の細胞内での遺伝子発現のパターンは、正常な、非疾患状態にあるときに見られる発現パターンに比較すると変化している場合がある。遺伝子発現の変化は、例えば腫瘍細胞での場合など、疾患又はその他の異常の結果であったり、又は原因であったりする。いくつかの疾患は特定の遺伝子における突然変異が原因であり、従ってゲノム配列を調べれば検出可能であると理解してよい場合がある一方で、多くの疾患及び異常が遺伝子発現量の機能不全に関するものであり、このような場合はゲノムの配列決定では検出できず、その細胞の遺伝子発現パターンを同定するしか、検出方法はない。従って、生物における特定の細胞種の機能を理解したり、又は疾患の進行を理解するには、これらの特定の細胞種内での個々の遺伝子の発現状態を、その生物の発生上の異なる段階で理解することが必要である。これらの疑問に答えようと研究者たちが試みてきた方法の一つは、多種の細胞からたんぱく質を単離して、これらのたんぱく質の各々についてその存在度を比較する方法である。ある方法では、たんぱく質を細胞から精製し、その存在度を比較する。しかしながら、この方法は別々のたんぱく質を精製する、等しく効率的な方法を考案するのが難しいといった限界がある。またこの方法は公知のたんぱく質に限られる。別の方法では、二次元ゲル電気泳動法を用いてたんぱく質の発現が比較されるが、細胞中のたんぱく質をすべて分離する上で、そしてごく微量しか生成されないたんぱく質を検出する上での難しさに直面する場合がある。（Kahn，P．(1995)Science 270:369を参照されたい。）ｍＲＮＡ集団でペプチドの発現を判定するその他の方法は、ｍＲＮＡのプールから生成されたペプチド集団をプローブするのに抗体を利用するものである。このように、ｍＲＮＡ分子のコードするポリペプチドに対応する合成ポリペプチドの「ライブラリ」を作製し、個々の抗体でプローブするのである。この方法では微量の発現が検出されないことがあるため、ｍＲＮＡから生じるポリペプチドを一度にすべて検出する方法とはならない。さらに、この方法は入手の可能な抗体に限られる。この方法は、例えば１９９３年９月７日に発行された米国特許第5, 242,798号、及び１９９０年２月１３日に発行された米国特許第4,900,811号に説かれている。その上、これらのたんぱく質検出方法のすべてにおいて、特定のたんぱく質の違いが判定されても、そのたんぱく質の発現に関係のある遺伝子を判定するには、依然そのたんぱく質を部分的に配列決定してクローンしなければならない。あるいはその代わりに、そのたんぱく質を配列決定して「プロテオーム」データベースに比較しなければならない(Kahn,P．(1995)Science 270:369)。さらに、細胞から精製されたたんぱく質を見ることで遺伝子発現パターンを判定することは、遺伝子発現の二次的及び三次的結果、即ちｍＲＮＡのたんぱく質への翻訳、及び翻訳後修飾、を見る方法であり、一次的結果、即ちＤＮＡ配列のｍＲＮＡへの転写を見る方法ではない。さらに、たんぱく質の発現量を検出することは、そのたんぱく質が翻訳後に劣化する可能性や、たんぱく質発現の差が実際には遺伝子発現の差によるものではない可能性を考慮に入れていない。研究者たちはさらに、個々のｍＲＮＡの発現の変化を検出することにも焦点を当ててきた。その方法の一つに差引きハイブリダイゼーションがあるが、この方法は発現量のごく微量なＲＮＡを検出する充分な解決策を持たない。Lee，S.W． et al.(1991)Proc.Natl.Acad.Sci.USA 88:2825。別の方法には、ｃＤＮＡを二つのｍＲＮＡ集団から作製し、二つの別々の色でラベルし、ｃＤＮＡライブラリを予め固定した顕微鏡スライドにこれらをハイブリダイズした後、試料が蛍光するかどうかを判定することで示差的ハイブリダイゼーションを同定するといったマイクロアレイ・ハイブリダイゼーション・アッセイが含まれる。(例えばNowak,R． (1995)Science 270:368;Schena et al．(1995)Science 270:467を参照されたい) 。最近では、細胞中で特定のｍＲＮＡに特異的であると共に、特定のｍＲＮＡの発現を同定するには充分である、各ｍＲＮＡ中で「標識」と呼ばれる短い特定の配列に研究者は注目している。これらの標識は、ゲノム・マーカーを同定かつマッピングするのに用いられてきた配列標識部位(ＳＴＳ)に見られる配列と類似である(Olson et al.(1989)Science 245:1434)。このような方法の一つでは、無作為に選択されたｃＤＮＡクローンを特定の組織のｍＲＮＡから作製する。ｃＤＮＡを作製するこの集団固定法を行なうと、「発現した配列標識」のデータベースが得られる(Adams,M.D.et al.(1991)Science，255:1651;Adams,M.D.(1992)Natur e 355:632-634)。別の方法は、ポリメラーゼ連鎖反応（ＰＣＲ）を利用して標識を規定し、示差的に発現した遺伝子を検出しようとする試みに着目するものである。多くのグループが、様々な組織中の遺伝子発現を比較するのに利用できると思われる、ｍＲＮＡ配列標識のデータベースを確立しようと、このＰＣＲ法を用いてきた(Willi ams,J.G.K．(1990)Nucl．Acids Res．18:6531;Wclsh，J.，et al．(1990)Nucl． Acids Res．18:7213;Woodward,S.R.(1992)Mamm.Genome 3:73;Nadcau,J.H.(1992) Mamm.Genome 3:55)。この方法はさらに、ｍＲＮＡディファレンシャル・ディスプレイと呼ばれるプロセスでｍＲＮＡ集団を比較するのにも適合されている。この方法ではＰＣＲ合成の産物をゲル電気泳動にかけ、二つ又はそれ以上のｍＲＮＡ集団から生じたバンドを比較する。ある一つのｍＲＮＡ集団からとった一つのゲルのオートラジオグラフに存在していて別のものに存在しないバンドは、ある特定のｍＲＮＡがある一つの集団にあって別のものにないことに相当し、従って、ある遺伝子が示差的に発現したことを示すものである。二つの異なる種類の細胞を由来とするメッヤンジャーＲＮＡを、10個のヌクレオチドから成る任意のオリゴヌクレオチド配列（ランダム１０-mer）を５‘プライマとして、そしてpolyAの尾に相補の一組の１２個のオリゴヌクレオチドから成るものを３’「アンカープライマ」として用いることで比較する。次にこれらのプライマを用い、放射性デオキシリボヌクレオチドを加えて、ｍＲＮＡの配列を部分的に増幅する。こうして増幅された配列を、各配列決定ゲルが５０から１００のｍＲＮＡの配列を有するよう、配列決定ゲル上で分離する。この配列決定ゲルを次に相互に比較して増幅された部分のうちのどれが示差的に発現しているかを判定する(Liang，P．et al.(1992)Science 257:967 ;See also Welsh,J.et al．(1992)Nucl.Acid Res.20:4965;Liang,P.et al.(1993 )Nucl.Acids Res.3269)。ｍＲＮＡの発現を検出するのにＰＣＲを利用することに基づいたもう一つの方法は、poly Aの連なりにハイブリダイズする１２個のアンカープライマと、ｍＲＮＡに対応するｃＤＮＡ配列内の４個のヌクレオチド配列で切断するもの、及び、各アンカープライマのうちの単一の部位を認識する別の制限エンドヌクレアーゼ、という二つの制限エンドヌクレアーゼとを利用することに依拠するものである。次に、１２個のプールの各々のなかのｍＲＮＡを由来とするｃＤＮＡを、ベクタのプロモータから下流に挿入し、このｃＤＮＡインサートを含有するベクタを増幅すべく、これを用いてホスト細胞を形質転換させる。その後「ｃＲＮＡ」アンチセンス転写物をプロモータで誘起して作製した後、これらをＰＣＲを用いて増幅する。このＰＣＲ反応は、１６の異なるサブプールにおいて、１６又はそれ以上の別々のプライマを用いて行われる。このように１２個の異なるアンカープライマでは、１９２個のサブプールが一つのｍＲＮＡ試料当り必要である。このＰＣＲ産物を次に配列決定ゲルで分離する（１９９５年５月１８日公開、WO95 /13369号）。遺伝子発現の連続分析（又はSAGE）と呼ばれる、遺伝子発現を分析するもう一つの方法は、発現した遺伝子の配列分析のために二量化させた標識（「ジ標識」と呼ばれる）と、ジ標識の連結とを用いるものである(Velculescu，V.E．et al ．(1995)Science 270:484;米国特許第5,695,937号)。この方法では、ｍＲＮＡのｃＤＮＡコピーを、通常ビオチニル化されたpoly dTプライマを用いて作製する。次にこのｃＤＮＡコピーを二本鎖に作製し、一般的には各ｃＤＮＡ中に存在する四つの塩基対配列を認識する「アンカー酵素」で切断する。次にビオチニル化したｃＤＮＡをストレプトアビジン・ビーズに結合させて配列の残りを取り除く。その結果、メッセンジャーＲＮＡの３‘端の一部分がストレプトアビジン・ビーズに結合したｃＤＮＡコピーが出来上がる。ストレプトアビジン・ビーズに結合したこのｃＤＮＡの集団は通常半分に分割される。この半分の部分のそれぞれを、次に、「タギング酵素」と呼ばれる、認識部位とは異なる部位でＤＮＡを切断することで、ｍＲＮＡ配列のｃＤＮＡコピー内の一部位で切断を起こさせるような制限エンドヌクレアーゼ（例えばII型の制限エンドヌクレアーゼ）のための制限エンドヌクレアーゼ認識部位を含有する二つのオリゴヌクレオチド・リンカーのうちの一方に結紮する。ｃＤＮＡ配列の末端は、「尾対尾」の態様で対にして相互に結紮し、一つのオリゴヌクレオチドリンカーを５’端に、そしてもう一つのオリゴヌクレオチドリンカーを３‘端に含んだ「ジ標識」集団を作製する。これらジ標識は、一般にはリンカーに対して特異的なプライマを用いてＰＣＲ増幅される。ＰＣＲ増幅された領域をアンカー酵素で切断して相互に連結することで、アンカー酵素認識部位の配列を途中に持つ一連のジ標識にする。連結させたジ標識は直接配列決定しても、又はベクタにクローンしてから配列決定してもよく、その後このジ標識の配列を公知の配列に比較して発現した遺伝子を同定する。ＰＣＲを利用する方法は再現性に問題があり、またＰＣＲプライマの作製及びアニーリングを含めたその他の複雑なステップを、遺伝子発現パターンを検出する方法に用いる必要がある。さらにこれらのＰＣＲを基にした方法は必ずしも遺伝子発現の頻度の違いを検出するものではない。増幅後のＰＣＲ産物の存在度は、開始材料となるテンプレートの存在度に加え、数多くの因子の影響を受ける。「増幅効率」における配列特異的な違いから、開始テンプレートに実際に差がなくとも、ＰＣＲ産物に人為的な量の差が生じることはよく知られている。さらに、同じテンプレート標本を繰返し増幅する場合でも、その産物に６倍といった大きな差が出ることがあることが報告されている (Gilliand et al.in:PCR Protocols.Academic Prcss,pp 60-69(1990))。従って、増幅で生じた産物の性質から開始テンプレートの存在度を推測しようとするＰＣＲを基にした方法のいずれにも、緊縮同時増幅対照が必要である。上に引用した「SAGE」技術において、たまたま増幅度の高い配列（例えばＡＴリッチな配列）を有するｃＤＮＡ標識はすべて、ＰＣＲステップ後では過剰に表れ、「難しい」配列（例えばＧＣリッチなパリンドローム配列）を有するものは低く表れることとなる。開始テンプレートの存在度を判定する際にSAGEを利用したことで生じる信頼性という問題は、「ジ標識」を利用するとそのすべてを補正できなくなる。反復的に単離されるジ標識をすべて除外しても、過剰に表れる標識配列のすべてを無くすことはできない。「増幅度」が人為的に高められるのは、標識のうちのたった一個が原因である場合があり、このような場合では個々の構成員を含んだジ標識はいずれも過剰に表れることとなるであろう。さらにこの除外法では、表れ方が人為的に低くなった配列に関しては何ら効果がでない。このように、遺伝子発現を検出する、遺伝子を同定する、そして個々の細胞又は組織で遺伝子発現パターンを同定する簡単かつ再現可能な方法や、これらの細胞又は組織における遺伝子発現の頻度を判定する方法が求められている。発明の概要本発明は、細胞集団中で発現した遺伝子のすべてに標識を付け、かつ同定する方法を提供するものである。この方法により、ひいてはコピー数の少ないｍＲＮＡでも検出することができる。本方法を用いれば、細胞間で遺伝子発現プロフィールを比較することにより、その発現が病理学的表現型に関連した個々の遺伝子を同定することができる。本発明はさらに、高処理量のＤＮＡ配列決定と、このようなＤＮＡ配列決定分析を支援する関連する情報系とを用いることで、合理的な長さ及び時間で全体的な遺伝子発現プロフィールの制作を可能とするものである。このように、本発明は、全体的な遺伝子発現プロフィールを得て目的の遺伝子を同定すべく、当業者に公知の情報系で用いるのに充分なデータを容易にかつ高速で得る方法を提供する。本発明はｍＲＮＡ集団中で遺伝子発現パターンを同定する方法を利用する。本発明の方法の好適な利用法は、二つ又はそれ以上の細胞又は組織間で示差的な遺伝子発現パターンを同定するための利用である。このように、本発明の方法を利用すると、ある細胞種、組織、又は目的の生物で、別の細胞種、組織、又は目的生物とは異なる量、発現した一つの遺伝子又は複数の遺伝子を同定することができる。さらに本発明の方法を用いることで、同じ細胞種又は組織種の、異なる発生段階において示差的遺伝子発現を同定したり、及び罹患した又は異常な細胞の遺伝子発現パターンの変化を同定することができる。さらに、本発明を用いることで、環境条件の変化又は薬物による治療の結果起きた遺伝子発現パターンの変化を検出することができる。これらの方法の別々の三つの実施例を以下に説明することとする。本発明の一態様では、一ｍＲＮＡ集団中で遺伝子発現パターンを同定する方法が提供される。当該方法には、二本鎖ｃＤＮＡを、一つのｍＲＮＡ集団から、プライマ、例えばオリゴdT配列の５‘端で、「プライミング」制限エンドヌクレアーゼの切断部位に連結したオリゴdT配列など、を用いて作製するステップと、この二本鎖ｃＤＮＡを、プライマ内ではなくｃＤＮＡ配列内の部位で切断する第一制限エンドヌクレアーゼで切断してｃＤＮＡインサートを得るステップとが含まれる。このｃＤＮＡインサートをクローニングベクタ内の挿入部位に挿入してＤＮＡコンストラクトを得るが、このとき各クローニングベクタは、このＤＮＡコンストラクトを第二制限エンドヌクレアーゼで消化させるとｃＤＮＡインサート内の部位でこのＤＮＡコンストラクトが切断されるよう挿入部位の５’側にある第二制限エンドヌクレアーゼ認識配列と、第二制限エンドヌクレアーゼ認識配列の５‘側に又はこれに重複して第三制限エンドヌクレアーゼ認識配列とを含んでいる。ＤＮＡコンストラクトを、例えば適したホスト細胞、例えばE.coli、内で増幅して単離する。単離後、増幅されたＤＮＡコンストラクトを第二及び第三制限エンドヌクレアーゼで消化して標識を得る。こうして標識のヌクレオチド配列を得ると、このｍＲＮＡ集団中で遺伝子発現パターンが同定される。好適な態様では、標識を結紮することで少なくとも約１０個の標識、より好ましくは少なくとも約４０個の標識から成る結紮された標識アレイを得て、この結紮された標識アレイをシークエンシング・ベクタ内に挿入し、この結紮された標識アレイの配列を決定することにより、標識のヌクレオチド配列を得る。ある一つの実施例では、第一制限エンドヌクレアーゼは四個の塩基から成る配列を認識し、第二制限エンドヌクレアーゼはII型の制限エンドヌクレアーゼであり、そして第三制限エンドヌクレアーゼの認識配列は第二制限エンドヌクレアーゼ切断部位の５‘側の約１０から４０ヌクレオチドに位置する。別の実施例では、第一制限エンドヌクレアーゼは四個の塩基から成る配列を認識し、第二制限エンドヌクレアーゼは II型の制限エンドヌクレアーゼであり、そして第三制限エンドヌクレアーゼの認識配列は第二制限エンドヌクレアーゼ認識配列に重複するものである。一実施例では、二本鎖ｃＤＮＡの集団は、二本鎖ｃＤＮＡをプライミング制限エンドヌクレアーゼで消化して、ｃＤＮＡがプライミング制限エンドヌクレアーゼで消化されるときに二本鎖ｃＤＮＡの３’端に導入されるプライミング制限エンドヌクレアーゼ切断配列を含むｃＤＮＡインサートを得ることで、作製する。このプライミング制限エンドヌクレアーゼは、７つ以上の塩基から構成される配列を認識することができるが、好ましくはこれは８つの塩基のパリンドローム配列を認識するとよい。最も好ましくは、プライミング制限エンドヌクレアーゼがNotIであるとよい。さらに、第一制限エンドヌクレアーゼが、各ｃＤＮＡ内の一配列を認識する確率が高いものであるとよい。このように、本発明の好適な態様では、第一制限エンドヌクレアーゼが、６個未満の塩基から構成される一配列を認識する。より好ましくは、第一制限エンドヌクレアーゼが、４つの塩基から構成される一配列を認識するとよい。好適な制限エンドヌクレアーゼはMboIである。さらに、第二制限エンドヌクレアーゼでベクタを消化したときに、コピーされたｍＲＮＡに対応する配列内の部位でｃＤＮＡインサートが切断されるよう、第二制限エンドヌクレアーゼがＤＮＡをそのエンドヌクレアーゼの認識部位の下流にある部位で切断することも好ましい。好ましくは、第二制限エンドヌクレアーゼがII型の制限エンドヌクレアーゼであるとよい。より好ましくは、第二制限エンドヌクレアーゼが、ＤＮＡを認識配列に対して３‘側の１０から１４塩基で切断するものであるとよい。より好ましくは、この第二制限エンドヌクレアーゼがII型の制限エンドヌクレアーゼであるとよい。最も好ましくは、この第二制限エンドヌクレアーゼがBsgIであるとよい。別の好適な態様では、第三制限エンドヌクレアーゼの認識配列が、第二制限エンドヌクレアーゼ切断配列の５‘側の約２０から４０、より好ましくは約１０から１５ヌクレオチド内にある。シークエンシング・ベクタ内に挿入可能な標識の数を最大にするには、第二制限エンドヌクレアーゼ切断配列から比較的短い距離に切断部位があることが好ましい。好ましくは、第三制限エンドヌクレアーゼの認識配列が、この第三制限エンドヌクレアーゼの切断部位の５’側の約１０から１５ヌクレオチド内にあるとよい。ある一つの実施例では、第三制限エンドヌクレアーゼの認識配列が、第二制限エンドヌクレアーゼの認識配列と重複する。好ましくは、第三制限エンドヌクレアーゼの認識配列が、第二制限エンドヌクレアーゼの認識配列内にあるとよい。さらに、第三制限エンドヌクレアーゼでＤＮＡを切断すると平滑末端ができることも好ましい。好ましくは、第二制限エンドヌクレアーゼがBsgIであり、第三制限エンドヌクレアーゼがPmlIであるとよい。より好適な実施例では、第三制限部位がII部位であり、ただしこのときの切断部位が第二制限切断部位の５‘側のすぐ隣に位置しているとよい。最も好ましくは、第三制限部位がFokIであるとよい。ある好適な態様では、ある一つのｍＲＮＡ集団中で遺伝子発現パターンを同定する方法が提供される。当該方法には、二本鎖ｃＤＮＡを、ｍＲＮＡ集団から、オリゴdT配列の５‘端でNotI切断部位に連結したオリゴdT配列を含むプライマを用いて作製するステップと、この二本鎖ｃＤＮＡをNotI及びMboIで切断してｃＤＮＡインサートを得るステップとが含まれる。このｃＤＮＡ断片をクローニングベクタの挿入部位に挿入してＤＮＡコンストラクトを得るが、このクローニングベクタはさらに、（ｉ）このＤＮＡコンストラクトをBsgIで消化すると、このＤＮＡコンストラクトがｃＤＮＡインサート内の一部位で切断されるよう、挿入部位に向かって５’側にあるBsgI認識配列と、BsgI認識配列の５‘側に位置するFo kI認識配列とを含む。ｃＤＮＡインサートを含んだＤＮＡコンストラクトは適したホストで増幅されてから単離される。単離後、増幅されたＤＮＡコンストラクトをBsgI及びFokIで消化して標識を得る。この標識をＴ４ＤＮＡポリメラーゼで処理して平滑末端を得た後、ＤＮＡリガーゼを用いて結紮して、少なくとも約３０から６０個の標識から成る結紮された標識アレイを得る。結紮された標識アレイをシークエンシング・ベクタに挿入して配列決定する。結紮された標識アレイ内の個々の標識の配列を公知の遺伝子配列に比較することで、当該ｍＲＮＡ集団中の遺伝子発現パターンを同定する。好適な態様では、標識は５‘及び３’に平滑末端を有する。好ましくは、制限酵素消化後に、標識を例えばＴ４ＤＮＡポリメラーゼなどのＤＮＡポリメラーゼで処理して平滑な５‘及び３’末端を有する標識を得る。標識の配列決定を容易にするには、標識が相互にＤＮＡリガーゼを用いて結紮されていることが好ましい。本発明は、ｍＲＮＡ集団中の遺伝子発現パターンを同定するのに用いられる、例えば本発明の方法に利用される、ＤＮＡベクタを提供する。好ましくは、当該ＤＮＡベクタが、挿入部位と、この挿入部位の５‘側に位置する制限エンドヌクレアーゼ認識配列、配列Ａであって、ただしこのとき、配列Ａを認識するこの制限エンドヌクレアーゼが、配列Ａの３’側に位置する切断部位、配列Ｂを有する、配列Ａと、この配列Ａの５‘側にある又は重複する、制限エンドヌクレアーゼ認識配列、配列Ｃとを含むとよい。配列Ａは、ここに説明した本方法で用いられる第二制限エンドヌクレアーゼ認識配列と同じでもよい。配列Ｃは、ここに説明された本方法で用いられる第三制限エンドヌクレアーゼ認識配列と同じでもよい。ベクタの挿入部位は好ましくは、ｃＤＮＡインサートの両端と適合性があるものであるとよい。これら配列は、さらに、ｃＤＮＡインサートを得るのに用いたプライミング及び第一制限エンドヌクレアーゼと適合性のある両端を有する制限エンドヌクレアーゼにより認識されてもよいが、その場合はこれらエンドヌクレアーゼを使用し、ｃＤＮＡインサートを挿入した場合にも第一制限エンドヌクレアーゼ部位にある切断部位の一体性が維持されることが条件である。両端のうち一方だけに適合性があるのであれば、両端のうちに一方で平滑末端結紮を用いてｃＤＮＡインサートを挿入することができる。このように、好適な態様では、挿入部位は二つの末端を有するが、このとき第一の末端は第一挿入制限エンドヌクレアーゼ切断部位に適合性があり、第二の末端は第二挿入制限エンドヌクレアーゼ切断部位に適合性があるものである。第一挿入制限エンドヌクレアーゼ切断部位は好ましくは第一制限エンドヌクレアーゼ切断部位と適合性があるとよい。第二挿入制限エンドヌクレアーゼ切断部位は好ましくは第二制限ヌクレアーゼ切断部位に適合性があるとよい。ある一つの好適な実施例では、ベクタは、切断部位である配列Ｂが配列Ａの３’側に来るよう、II型制限エンドヌクレアーゼにより認識される配列Ａと、配列Ａの５‘側にある又はこれに重複する制限エンドヌクレアーゼ認識配列である配列Ｃと、配列Ａの３’側及び配列Ｂの５‘側に位置する制限エンドヌクレアーゼ切断部位である配列Ｄであって、６個未満の塩基を認識する制限エンドヌクレアーゼにより切断することの可能な配列Ｄと、７個以上の塩基を認識する制限エンドヌクレアーゼで切断可能な制限エンドヌクレアーゼ切断部位である配列Ｅとを含む。最も好ましくは、ＤＮＡベクタが、図１に示されたベクタであるとよい。別の好適な実施例では、本発明は、挿入部位にＤＮＡインサートを含む、ここに説かれたＤＮＡベクタを含むＤＮＡコンストラクトを提供するものである。ある一つの実施例では、本発明のＤＮＡベクタは、さらに、配列ＢがｃＤＮＡインサート内にあるような、挿入部位に挿入されたｃＤＮＡインサートを含む。別の実施例では、本発明は遺伝子を単離する方法を提供するものである。当該方法は、二本鎖ｃＤＮＡを第一制限エンドヌクレアーゼで切断してｃＤＮＡインサートを得るステップを含む。次にこのｃＤＮＡインサートをクローニングベクタの挿入部位に挿入してＤＮＡコンストラクトを得る。クローニングベクタは、典型的には、そのＤＮＡコンストラクトを第二制限エンドヌクレアーゼで消化すると、このＤＮＡコンストラクトがｃＤＮＡインサート内の部位で切断されるよう、挿入部位の５‘側にある第二制限エンドヌクレアーゼ認識配列と、この第二制限エンドヌクレアーゼ認識配列の５’側にある又はこれに重複する第三制限エンドヌクレアーゼ認識配列とを含む。ＤＮＡコンストラクトを増幅し、単離した後、第二及び第三制限エンドヌクレアーゼで消化して標識を得る。単離しようとする遺伝子の配列の一部分を含んだ標識を同定し、この遺伝子を単離する。好適な態様では、単離しようとする遺伝子は、標識のヌクレオチド配列と、何らかのソース、例えばGenBankなどの配列データベースなどから得ることのできる既知のヌクレオチド配列とを比較することにより判定される。本発明の別の態様では、ある一つのｍＲＮＡ集団中で遺伝子発現パターンを同定する方法が提供される。当該方法は、二本鎖ｃＤＮＡを、ｍＲＮＡ集団から、プライマ、例えば、「プライミング」制限エンドヌクレアーゼの切断部位に、そのオリゴdT配列の５‘端で連結されたオリゴdT配列など、を用いて作製するステップと、この二本鎖ｃＤＮＡを、プライマ内ではなくｃＤＮＡ配列内の一部位で切断する第一制限エンドヌクレアーゼで切断することでｃＤＮＡインサートを得るステップとを含む。このｃＤＮＡインサートをクローニング・ベクタの挿入部位に挿入してＤＮＡコンストラクトを得るが、このクローニング・ベクタには、このＤＮＡコンストラクトを第二制限エンドヌクレアーゼで消化するとこのＤＮＡコンストラクトが該ｃＤＮＡインサート内の部位で切断されるよう、その挿入部位の５’ 側に第二制限エンドヌクレアーゼ認識配列が含まれている。ＤＮＡコンストラクトを、例えば適したホスト細胞、例えばE.coli、内で増幅し、単離した後、第二制限エンドヌクレアーゼで消化して、３‘端上側張出し配列を有する直鎖化したＤＮＡ分子を得る。この直鎖化したＤＮＡ分子をアダプタ配列にアニールする。アダプタ配列には、第一制限エンドヌクレアーゼ認識配列と、この直鎖化したＤＮＡ分子の３’端の上側張出し配列に適合性のある３‘端下側張出し配列とを含む二本鎖オリゴデオキシヌクレオチド配列が含まれる。このアダプタをこの直鎖化したＤＮＡ分子にアニールすると、第一制限エンドヌクレアーゼ制限部位を両側に持つ結紮産物が生まれる。この結紮産物を第一制限エンドヌクレアーゼで消化して標識を得る。この標識のヌクレオチド配列を得て、当該ｍＲＮＡ集団中の遺伝子発現パターンを同定する。この第二の実施例の好適な態様の概要を図３に示す。好適な態様では、標識のヌクレオチド配列は、この標識を結紮することで、少なくとも約１０個の標識から成る結紮された標識アレイを得て、この結紮された標識アレイをシークエンシング・ベクタ内に挿入し、この結紮された標識アレイの配列決定を行なうことにより、得られる。好適な実施例においては、アダプタは約１０から約１５塩基対長であり、例えば２個の塩基対長の変性配列を、３‘ 端の下側張出し部として含み、直鎖化したＤＮＡ分子が、例えば２個の塩基対長の変性配列を３’端の上側張出し部として含む。本発明はさらに、ある一つのｍＲＮＡ集団中で遺伝子発現パターンを同定する方法を提供するものである。当該方法には、第一生体試料から得られたｍＲＮＡの第一集団から、二本鎖ｃＤＮＡの集団を、ビオチンなどの親和捕獲ラベルに共有結合により連結させたオリゴdT配列などのプライマを用いて作製するステップと、この二本鎖ｃＤＮＡを、プライマ内ではなくｃＤＮＡ内の一部位で切断するパンクチュエーティング（原語：punctuating）制限エンドヌクレアーゼで切断することで、親和捕獲ラベルに連結したｃＤＮＡインサートの集団を得るステップとが含まれる。このｃＤＮＡインサートは、この親和捕獲ラベルを親和捕獲器、例えばストレプトアビジンに共有結合させた磁気ビーズ、などで捕獲することで、捕獲され、こうしてｃＤＮＡインサートの集団を得る。次に、捕獲されたｃＤＮＡインサートを、第一ベクタ挿入部位に適合性のある５‘端上側張出し配列と、第二制限エンドヌクレアーゼ認識配列と、パンクチュエーティング制限エンドヌクレアーゼ部位に適合性のある５’端下側配列とを含む二本鎖オリゴデオキシヌクレオチド配列を含む第一アダプタにアニール及び結紮し、こうして第一結紮産物を得る。この第一結紮産物を、例えばII型制限エンドヌクレアーゼなどの第二制限エンドヌクレアーゼで切断すると、この結紮産物が親和捕獲ラベルから分離されて解放されるが、このとき、この解放された結紮産物は、ｃＤＮＡ配列に隣り合ったパンクチュエーティングエンドヌクレアーゼ制限部位と３‘端上側張出し配列とを含むこととなる。この解放された結紮産物を、第二ベクタの挿入部位に適合性のある５’端の下側張出し配列と、解放された結紮産物の３‘端上側張出し配列に適合性のある３’端下側張出し配列とを含む二本鎖オリゴデオキシヌクレオチド配列を含む第二アダプタにアニール及び結紮する。このアニーリング・ステップの結果、第一ベクタ挿入部位に適合性のある５‘端配列と、パンクチュエーティング・エンドヌクレアーゼ制限部位を両側に持つｃＤＮＡ配列と、第二ベクタ挿入部位に適合性のある３’端配列とを含む第二結紮産物が生まれる。次にこの第二結紮産物を、クローニングベクタの第一ベクタ挿入部位と第二ベクタ挿入部位とに挿入して、ＤＮＡコンストラクトを得る。ＤＮＡコンストラクトを、例えば適したホスト細胞、例えばE.coli内で増幅し、単離し、パンクチュエーティング制限エンドヌクレアーゼで消化して標識を得る。この標識のヌクレオチド配列を得ることで、第一生体試料中の遺伝子発現を同定する。好適な態様では、標識のヌクレオチド配列は、これら標識を結紮して、少なくとも約１０個の標識、より好ましくは少なくとも約４０個の標識から成る結紮された標識アレイであって、この標識アレイうちの各標識はパンクチュエーティング制限エンドヌクレアーゼ認識部位に隣り合うものである、標識アレイを得るステップと、この結紮された標識アレイをシークエンシング・ベクタに挿入するステップと、この結紮された標識アレイを配列決定するステップと、この標識アレイの配列を、既知の遺伝子配列に比較するステップとにより得られる。好ましくは、当該方法が、さらに標識にハイブリダイズする遺伝子配列を単離するステップを含む。ある好適な実施例では、第二制限エンドヌクレアーゼ切断部位は、その認識配列の３ ‘側の約１６ヌクレオチドに位置している。ある一つの実施例では、第一アダプタは、パンクチュエーティング制限エンドヌクレアーゼ部位に適合性のある配列の５’端側に位置した第二制限エンドヌクレアーゼ認識部位を含む。別の実施例では、解放された結紮産物は、３‘端に２個のヌクレオチド長の上側張出し部を含み、第二アダプタが、２個のヌクレオチド分の変性配列を含む３’端端下側張出し部を含む。別の実施例では、第一ベクタ挿入部位に適合性のある５‘端上側張出し配列が、少なくとも８個の塩基から成る制限エンドヌクレアーゼ認識配列、例えばNotI認識配列を含み、第二ベクタ挿入部位に適合性のある５’端下側張出し配列がEcoRI認識配列である。さらに別の実施例では、第一ベクタ挿入部位に適合性のある５‘端の上側張出し配列がEcoRI認識配列を含み、第二ベクタ挿入部位に適合性のある５’端の下側張出し配列がNotI認識配列である。ある一つの好適な実施例では、第一アダプタが約１５から約２５個の塩基対長であり、第二アダプタが、例えば２個の塩基対長の変性配列を５‘端の下側張出しインサート空間として含む。好ましくは、第一アダプタの第二制限エンドヌクレアーゼ認識部位が、パンクチュエーティング・エンドヌクレアーゼ制限部位に適合性のある配列の５’側に位置しているとよい。別の実施例では、解放された結紮産物を、各々が異なる変性配列を有する１６個の別々のアダプタの混合物にアニールする。好ましくは、解放された結紮産物の３‘端の上側張出し部が２個の塩基対長であるとよい。好適な実施例では、結紮された標識アレイが、少なくとも約３０個の標識、好ましくは少なくとも約５０個の標識、より好ましくは少なくとも約１００個の標識、そして最も好ましくは少なくとも約２００個の標識を含む。ある一つの実施例では、当該クローニングベクタには、パンクチュエーティング・エンドヌクレアーゼ制限部位がない。ある好適な実施例では、当該方法はさらに、ある一つの標識のヌクレオチド配列を含むオリゴヌクレオチド・プローブを作製するステップと、ｃＤＮＡライブラリをこのオリゴヌクレオチド・プローブでプローブして、この標識を含む遺伝子の発現の頻度を判定するステップとを含む。別の実施例では、当該方法はさらに、第二生体試料から得たｍＲＮＡの第二集団を用いて該第三実施例の方法を繰り返すステップと、第一ｍＲＮＡ集団の遺伝子発現と第二ｍＲＮＡ集団の遺伝子発現とを比較することで第一生体試料と第二生体試料の間の遺伝子発現の差を判定するステップとを含む。好ましくは、当該方法が、さらに、第一ｍＲＮＡ集団で第一レベルで発現しており、かつ第二ｍＲＮＡ集団で第二レベルで発現している遺伝子を同定するステップと、この遺伝子をｃＤＮＡライブラリから単離するステップとを含む。ある好適な実施例では、第一生体試料は正常な非罹病生物を由来とする細胞又は組織であり、第二生体試料は疾患又は異常を有する生物を由来とする細胞又は組織である。別の好適な実施例では、第一生体試料は発生の第一段階にある生物を由来とする細胞又は組織であり、第二生体試料は発生の第二段階にある生物を由来とする細胞又は組織である。ある好適な態様では、ある一つのｍＲＮＡ集団中で遺伝子発現パターンを同定する方法が提供される。当該方法は、第一生体試料を由来とする第一ｍＲＮＡ集団から、二本鎖ｃＤＮＡの集団を、３‘端でビオチン・ラベルに共有結合した５ ’オリゴdT配列を含むプライマを用いて作製するステップと、この二本鎖ｃＤＮＡをSau3A制限エンドヌクレアーゼで切断して、ビオチン・ラベルに連結したｃＤＮＡインサート集団を得るステップとを含む。ストレプトアビジンに共有結合させた磁気ビーズでビオチン・ラベルを捕獲することでこのｃＤＮＡインサートを捕獲し、捕獲されたｃＤＮＡインサートの一集団を得る。次に捕獲されたｃＤＮＡインサートを、NotI挿入部位に適合性のある５‘端上側張出し配列と、BsgI 制限エンドヌクレアーゼ認識配列と、Sau3A制限部位に適合性のある５’端下側張出し配列とを含む二本鎖オリゴデオキシヌクレオチド配列を含む第一アダプタにアニール及び結紮することで、第一結紮産物を得る。この第一結紮産物をBsgI で切断すると、この結紮産物がビオチン・ラベルから分離して解放されるが、この解放された結紮産物は、ｃＤＮＡ配列に隣り合ったSau3A制限部位と３‘端上側張出し配列とを含むこととなる。この解放された結紮産物を、EcoRI挿入部位に適合性のある５’端下側配列と、解放された結紮産物の３‘端上側張出し配列に適合性のある３’端下側張出し変性配列とを含む二本鎖オリゴデオキシヌクレオチド配列を含む第二アダプタにアニール及び結紮する。このアニーリングステップの結果、NotI挿入部位に適合性のある５‘側配列と、Sau3A制限部位を両側に持つｃＤＮＡ配列と、Eco RI挿入部位に適合性のある３’側配列とを含む第二結紮産物が生まれる。次に、この第二結紮産物をNotI挿入部位及びEcoRI挿入部位でクローニング・ベクタに挿入してＤＮＡコンストラクトを得る。このＤＮＡコンストラクトを、例えばE. coliなどの適したホスト細胞で増幅し、単離し、Sau3Aで消化して標識を得るが、これらの標識を次に結紮して、約３０から６０個の標識から成る結紮された標識アレイを得る。これら標識のヌクレオチド配列を得ることで、第一生体試料中の遺伝子発現を同定する。関連する態様では、本発明は、本発明の方法での利用など、ある一つのｍＲＮＡ集団中で遺伝子発現パターンを同定するのに用いるＤＮＡベクタを提供するものである。このＤＮＡベクタには挿入部位が含まれるがパンクチュエーティング・エンドヌクレアーゼ制限部位が欠けており、好ましくはさらに、Sau3A制限部位など、少なくとも一つのパンクチュエーティング・エンドヌクレアーゼ制限部位を含むｃＤＮＡインサートが含まれるとよい。好ましくは、挿入部位が二つの末端を持ち、このときの第一の末端が第一挿入制限エンドヌクレアーゼ切断部位と適合性があり、第二の末端が第二挿入制限エンドヌクレアーゼ切断部位と適合性があるとよい。好ましくは、第一挿入制限エンドヌクレアーゼ切断部位が少なくとも８個の塩基を含むとよく、例えばこの切断部位がNotI切断部位であるとよく、また第二制限エンドヌクレアーゼ切断部位が、少なくとも８個の塩基を含むとよく、例えばこの切断部位がEcoRI切断部位であるとよい。その他の好適な実施例では、本発明は、例えばここで説明するTALESTBベクタなどのＤＮＡベクタ、さらにNotI及びEcoRI挿入部位の間のＤＮＡインサートを含むＤＮＡコンストラクトを提供するものである。本発明はある一つのｍＲＮＡ集団中の遺伝子の発現頻度を判定する方法を提供する。当該方法は、本発明のｃＤＮＡインサートを含むＤＮＡコンストラクトを作製してｃＤＮＡライブラリを得るステップを含む。当該方法はさらに、本発明の方法に基づいて同定された標識配列を含むオリゴヌクレオチド・プローブを作製するステップと、ｃＤＮＡライブラリを、標識配列を含んだこのオリゴヌクレオチド・プローブでプローブすることで、この標識配列を含む遺伝子の発現頻度を判定するステップとを含む。その他の実施例には、第一ｍＲＮＡ集団において第二ｍＲＮＡ集団に比較して異なるレベルで発現している遺伝子を単離する方法が含まれる。これらの方法には、本発明に基づき、第一ｍＲＮＡ集団から遺伝子発現パターンを同定するステップと、第二の別のｍＲＮＡ集団から遺伝子発現パターンを同定するステップとが含まれる。このようにして得た遺伝子発現パターンを比較することで、ｍＲＮＡ集団同士の間で遺伝子発現の差を検出する。第一ｍＲＮＡ集団において第二ｍＲＮＡ集団に比較して異なるレベルで発現している遺伝子を同定かつ単離してもよい。別の実施例は、二つ又はそれ以上のｍＲＮＡ集団の間での遺伝子発現の差を検出する方法である。当該方法には、本発明の方法に基づき、第一ｍＲＮＡ集団から、そして少なくとも一つの別のｍＲＮＡ集団から、遺伝子発現パターンを同定するステップが含まれる。このようにして得られた遺伝子発現パターンを比較することで、ｍＲＮＡ集団間の遺伝子発現の差を検出する。好適な態様では、第一ｍＲＮＡ集団が正常細胞又は組織から得られ、別のｍＲＮＡ集団は疾患又は異常を有する目的生物から得られた細胞又は組織から得られる。別の好適な態様では、ｍＲＮＡ集団は異なる発生段階にある細胞又は組織から得られる。さらに別の好適な態様では、ｍＲＮＡ集団は、同じ目的生物の別々の組織又は臓器を由来とする細胞から得られるか、又は、当該ｍＲＮＡ集団が異なる目的生物から得られる。また別の実施例では、目的生物における疾患の存在を検出する方法が提供される。これらの方法は、本発明に基づき、疾患又は異常を有する目的生物の細胞又は組織とは異なる発現を正常細胞又は組織でしている遺伝子を同定するステップと、その遺伝子の標識配列を単離するステップとを含む。第一目的生物から得られたｍＲＮＡ集団と、第二正常又は罹病目的生物から得られたｍＲＮＡ集団とを、この標識配列でプローブすれば、その遺伝子の発現レベルを判定することができる。第一目的生物における遺伝子の発現レベルを、第二目的生物におけるその遺伝子の発現レベルに比較して、第一目的生物における疾患の存在を検出する。さらに別の態様では、薬物の細胞又は組織に対する作用をスクリーニングする方法が提供される。本発明の当該方法を用いると、薬物で処置した細胞及び組織と、薬物で処置していない細胞及び組織とで、ｍＲＮＡの遺伝子発現パターンを比較することができる。細胞又は組織は正常な目的生物から得てもよく、または薬物の副作用を調べてもよい。あるいはその代わりに、細胞又は組織を特定の疾患に罹病した目的生物から得て、この薬物が罹病細胞中の遺伝子発現プロフィールを変化させることができるかどうかを判定してもよい。もう一つの好適な態様では、本発明は異なった発現をしている遺伝子を単離する方法を提供するものである。当該方法には、本発明の方法に基づき、第一細胞種又は組織と第二細胞種又は組織とから得られた結紮された標識アレイのヌクレオチド配列を得るステップと、この第一及び第二細胞種又は組織の個々の標識配列の発現頻度を比較するステップとが含まれる。第二細胞種又は組織に比較して異なる発現をしている第一細胞種又は組織中の標識配列を同定すると、異なる発現をしている標識配列に対応する遺伝子を同定することができる。好適な態様では、異なる発現をした標識配列についてＲＮＡ又はＤＮＡ配列のデータベースを検索することにより、当該遺伝子が同定される。あるいはその代わりに、異なる発現をした標識配列を含むプローブでｃＤＮＡライブラリをプローブすることにより、当該遺伝子が同定される。さらに別の実施例では、本発明は、例えばｍＲＮＡ集団中で遺伝子発現パターンを同定する、又は異なる発現をしている遺伝子を単離するなど、ここで説明した方法に用いるキットを提供するものである。ある好適な実施例では、ｍＲＮＡ集団中で遺伝子発現パターンを同定するのに用いるキットには、ＤＮＡベクタ、例えばここで説明するTALESTベクタと、約７から４０個のＴ残基を含むプライマと、配列Ａを認識すると共に配列ＢでＤＮＡを切断する第一制限エンドヌクレアーゼと、配列Ｃを認識する第二制限エンドヌクレアーゼとが含まれる。別の実施例では、ある一つのｍＲＮＡ集団中で遺伝子発現パターンを同定するのに用いるキットには、ここで説明するTALESTBベクタなど、例えばNotI挿入部位、EcoRI挿入部位、及び一つ又はそれより少ないSau3A制限エンドヌクレアーゼ認識部位を含むＤＮＡベクタなどのＤＮＡベクタと、約７から４０個のＴ残基を含むプライマと、第二制限エンドヌクレアーゼ、例えば・型制限エンドヌクレアーゼ、の認識配列、例えばNotI挿入部位などの第一ベクタの挿入部位に適合性のある５‘端上側張出し配列、及びSau3A制限部位などのパンクチュエーティング・エンドヌクレアーゼ制限部位に適合性のある５’端下側張出し配列、を含む二本鎖オリゴデオキシヌクレオチド配列を含む第一アダプタと、変性配列などの３‘端下側張出し配列、及びEcoRI挿入部位などの第二ベクタ挿入部位に適合性のある５’端下側張出し配列を含む二本鎖オリゴデオキシヌクレオチド配列を含む第二アダプタとが含まれる。図面の簡単な説明図１は、本発明の第一（TALEST）実施例に用いることのできるTALESTベクタを示す。図２Ａ及び２Ｂは、本発明の第一（TALEST）実施例の概略図を示す。図３は、本発明の第二（TALESTA）実施例の概略図を示す。図４は、TALEST法の概略図を示す。図５は、本発明の第三（TALESTB）実施例の概略図を示す。図６は、本発明のもう一つの実施例の概略図を示す。発明の詳細な説明本発明は、ｍＲＮＡ集団中で遺伝子発現パターンを同定するための新規な方法を提供するものである。当該方法は、目的生物の細胞又は組織を含めた様々な細胞又は組織間で示差的遺伝子発現を判定するのに有用である。本発明はさらに、ｍＲＮＡ集団中で遺伝子発現の頻度を判定する方法を提供することで、多種の細胞又は組織間で遺伝子発現頻度を比較する方法を提供するものでもある。本発明はさらに、本発明の方法に基づいて同定された標識配列に対応する遺伝子を単離する方法も提供する。さらに、本発明に基づいて同定された配列を用いて疾患の存在を診断してもよい。ある特定の細胞系譜の遺伝子発現パターンをよく理解するには、どの遺伝子がその細胞で発現するかだけでなく、それらが発現する頻度又は割合を知ることが必要である。本発明の方法は、細胞及び組織における遺伝子発現パターンを同定する新規な方法と、アッセイの再現可能性に限界を与える場合のあるＰＣＲ又はその他の方法を利用する必要のない、容易かつ再現可能な態様で細胞及び組織内の遺伝子発現の頻度を判定する方法とを提供するものである。さらに、本発明の方法は、膨大な種類のｍＲＮＡ配列に対応する数多くのオリゴヌクレオチド・プライマをその研究者が合成できるかといった制限を受けない。本発明の方法に基づいてＲＮＡ配列標識を得ることで、遺伝子発現の頻度を、単にその標識が作製される過程で作製されたｃＤＮＡライブラリ中のｃＤＮＡ発現頻度を分析することにより、判定することができる。本発明の少なくとも三つの様々な実施例を以下の項で詳細に説明することとする。 TALESTの実施例第一又はTALEST（tandem arrayed ligation of expressed sequence tags）の実施例には、ある一つのｍＲＮＡ集団中で遺伝子発現パターンを同定する方法が含まれる。当該方法は、二本鎖ｃＤＮＡをｍＲＮＡ集団からプライマを用いて作製するステップと、この二本鎖ｃＤＮＡを、このプライマ内ではなくｃＤＮＡ配列内の部位で切断する第一制限エンドヌクレアーゼで切断することで、ｃＤＮＡインサートの集団を得るステップとを含む。ｃＤＮＡインサートを、クローニング・ベクタの挿入部位に挿入してＤＮＡコンストラクトを得るが、このときのクローニング・ベクタには、このＤＮＡコンストラクトを第二制限エンドヌクレアーゼで消化すると、このＤＮＡコンストラクトが該ｃＤＮＡインサート内の部位で切断されるよう、この挿入部位の５‘側にある第二制限エンドヌクレアーゼ認識配列と、第二制限エンドヌクレアーゼ認識配列の５’側にある又はこれに重複する第三制限エンドヌクレアーゼ認識配列とが含まれる。ＤＮＡコンストラクトを増幅し、単離し、第二及び第三制限エンドヌクレアーゼで消化して標識を得る。この標識のヌクレオチド配列を得ることで、当該ｍＲＮＡ集団における遺伝子発現パターンを同定する。ここで、「遺伝子」とは、ヒト染色体など、染色体中に見られる一単位の遺伝物質を言う。各遺伝子は、直鎖状のデオキシリボヌクレオチドから構成されるが、このデオキシリボヌクレオチドはこの鎖を形成するヌクレオチドの配列により呼ぶことができる。このように、「配列」は、当該鎖を成すヌクレオチドの順のリストと、そのヌクレオチドの配列を有する鎖の両方を指すべく用いられる。（「配列」という術語は同じようにリボヌクレオチドから成る直鎖であるＲＮＡ鎖に言及する場合にも用いられる。）遺伝子には、ＲＮＡ分子に転写されることのできる配列である、調節及び制御配列が含まれ、また未知の機能を持った配列が含まれていてもよい。ＲＮＡ産物（ＤＮＡからの転写の産物）のなかには、ポリペプチドに翻訳される複数のリボヌクレオチド配列（又は一つの配列）や、翻訳されないリボヌクレオチド配列を当初は含んでいるメッセンジャーＲＮＡ（ｍＲＮＡ）がある。翻訳されない配列には、制御配列、イントロン、及び、未知の機能を持つ配列がある。同じ遺伝子についても、別々の個人間、又は正常細胞とがん細胞との間で、その遺伝子のアイデンティティには変わりはないまま、そのヌクレオチド配列に僅かな相違がある場合があることを、認識されねばならない。ここでは、「遺伝子発現パターン」という術語は、ＲＮＡ分子を形成すべく転写又は「発現」する特定の組織又は細胞種の一組の遺伝子を意味する。特定の細胞系又は組織でどの遺伝子が発現するかは、組織又は細胞種、その細胞、組織、又は目的生物の発生上の段階、及び、その細胞が正常か、又はがん細胞などの形質転換した細胞か、などの因子に左右されることであろう。例えば、遺伝子は、特定の目的生物の発生上の胚又は胎児段階で発現し、その目的生物が成熟するにつれて発現しなくなる場合がある。あるいは、遺伝子が成人の肝臓組織で発現するが大脳組織では発現しない場合がある。発現に影響を与える因子のこのリスト及び例はすべてではなく、単に実例を挙げることを目的としたものである。好ましくは、ｃＤＮＡ合成を開始させるのに用いるプライマが、オリゴdT配列の５‘端で「プライミング」制限エンドヌクレアーゼの切断部位に連結されたオリゴdT配列から構成されるとよい。このオリゴdT配列は、好ましくは、約７から４０個のＴ残基長であるとよく、より好ましくはこのオリゴdT配列が約１５から３０個のＴ残基長であるとよい。最も好ましくは、オリゴdT配列が約１９個のＴ残基長であるとよい。本発明の方法を用いて同定できるｍＲＮＡの数を最大にするには、プライミング制限エンドヌクレアーゼは数少ない配列を認識しなければならない。このように、好適なプライミング制限エンドヌクレアーゼは、７個異常の塩基から成る配列を認識するとよいが、当業者には公知である。プライミング制限エンドヌクレアーゼは、好ましくは、８個の塩基のパリンドローム配列を認識するものであるとよい。より好ましくは、プライミング制限エンドヌクレアーゼが、少なくとも一つのCGジヌクレオチドを含む一配列を認識するとよい。最も好ましくは、プライミング制限エンドヌクレアーゼがNotIであるとよい。ここでは、「第一制限エンドヌクレアーゼ」という術語は、ＤＮＡ中で６個未満の塩基対から成る一配列を認識する制限エンドヌクレアーゼを言うが、好ましくは、ＤＮＡ中で４個の塩基対の配列を認識するとよい。第一制限エンドヌクレアーゼの例には、MboI，Sau3A，MspI，AluI，BstUI，DpnII，HaeIII，HhaI，HinPI ，MseI，NlaIII,RmaI，及びTaqIがあるが、これらに限定されることはない。ここでは、「ｃＤＮＡインサート」という術語は、ベクタに挿入することの可能なｃＤＮＡ配列を言う。典型的には、ｃＤＮＡインサートは約２５０、３００又は３５０塩基対長である。好ましくは、ｃＤＮＡインサートがpoly Aの尾を含むとよい。ここでは、「ベクタ」は、その物質のＤＮＡに組み込むことで、本発明のＤＮＡをその物質に挿入することのできる物質を意味する。このように、ベクタのクラスの例は、プラスミド、コスミド、及びウィルス（例えばバクテリオファージ）としてもよい。典型的には、当該物質は、本発明のＤＮＡをホスト細胞（例えばバクテリウム、酵母、より高等な真核細胞）中に送り込むために用いられる。ベクタは、所望のインサートの大きさや、ベクタの提案される用途に基づいて選択してよい。（例えばｃＤＮＡライブラリで）特定のＤＮＡ配列を保存したり、又は特定のＤＮＡ配列の多数のコピーを作製するにはクローニング・ベクタを利用することができる。ＲＮＡの転写又は、翻訳してコードされたポリペプチドを産生させるには、発現ベクタを利用できる。細胞のトランスフェクション後、インサートＤＮＡを含むそのベクタＤＮＡの全部又は一部をホスト細胞の染色体に組み込んでも、又はそのベクタを染色体外のままにしておいてもよい。当業者であれば、ｃＤＮＡインサート又は断片を含むベクタ（即ちＤＮＡコンストラクト）を、当業において公知の何らかの方法を用いて増幅することができる。好ましくは、当該コンストラクトを、例えば、しかしこれに限らず、E.coli などのホスト細胞内で、まずE.coliを当該コンストラクトで形質転換し、この形質転換させた細胞を成長させ、そして成長した細胞から、この増幅されたベクタを単離するといった手順により増幅する。ここで用いられる場合の「第二制限エンドヌクレアーゼ」という術語は、それ自体の認識配列の下流又は３‘側で切断する制限エンドヌクレアーゼを言う。好適な第二制限エンドヌクレアーゼは・型制限エンドヌクレアーゼである。本発明の方法に利用可能なII型制限エンドヌクレアーゼの例には、BsgI，FokI，AccBSI ,AccIII,AciI,AclWI,AlwI,Alw26I,AlwXI,Asp26HI,Asp27HI,Asp35HI,Asp36HI,Asp 40HI,Asp50HI,AsuHPI,BacI,BbsI,BbvI,BbvII,Bbv16II,Bce83I,BcefI,BcgI,Bco5I ,Bco116I BcoKI,BinI,Bli736I,BpiI,BpmI,Bpu10I,BpuAI,Bsal,BsaMI,Bsc9II,Bsc AI,BscCI,BseII,Bsc3DI,BscNI,BscRI,BscZI,BsiI,BsmI,BsmAI,BsmBI,BsmFI,Bsp2 4I,Bsp423I,BspBS3II,BspIS4I,BspKT5I,BspLU11III,BspMI,BspPI,BspST5I,BspTS 514I,BsrI,BsrBI,BsrDI,BsrSI,BssSI,Bst11I,Bst7lI,Bst2BI,BstBS32I,BstD102I ,BstF5I,BstTS5I,Bsu6I,CjeI,CjePI,Eam1104I,EarI,Eco31I,Eco57I,EcoA4I,EcoO 44I,Esp3I,FauI,GdiII,GsuI,HgaI,HphI,Ksp632I,MboII,MlyI,MmeI,MnI,Mval269I ,PhaI,PieI,RlcAI,SapI,SfaNI,SimI,StsI,TaqII,TspII,TspRI,Tth111II，及びVp aK32Iがある。「第三制限エンドヌクレアーゼ」とは、ここで用いられる場合、それ自体の認識配列の３‘側で切断する制限エンドヌクレアーゼを言う。好適な第三制限エンドヌクレアーゼはII型制限エンドヌクレアーゼである。ここで用いられる「単離する」という術語は、ＤＮＡコンストラクトを、増幅に用いた試薬から分離させる方法を言う。好ましくは、当該ＤＮＡコンストラクトが、増幅緩衝液、プライマ、細胞物質、培養媒質、又はゲル材料を概ね含まないとよい。「標識」という術語は、あるｃＤＮＡ配列を特徴的に定義すべく充分な数の塩基対を含んだヌクレオチド配列を言う。典型的には、ある標識がある一つの真核生物のｃＤＮＡ配列を特徴的に表すには、その標識は少なくとも約８個の塩基対長を含む。ある好適な実施例では、標識は少なくとも約１０、１２又は１４塩基対長である。本発明の標識が得られたら、それらを結紮して標識アレイ、例えば少なくとも二つの標識を連ねて結紮したもの、を作製することが好ましい。好ましくは、標識アレイが少なくとも１０個、より好ましくは少なくとも２０個、さらにより好ましくは少なくとも３０個、またさらに好ましくは少なくとも４０個、そしてさらに好ましくは少なくとも５０個又はそれ以上の、例えば１００個、１５０個、２００個又はそれ以上、の標識を含むとよい。標識アレイ中の標識を配列決定するには、アレイをシークエンシング・ベクタに挿入し、配列決定することができる。本発明はさらに、TALEST実施例で用いるＤＮＡベクタ及びキットを提供する。好適なＤＮＡベクタには、挿入部位と、この挿入部位の５‘側に位置した制限エンドヌクレアーゼ認識配列（配列Ａ）であって、この制限エンドヌクレアーゼが配列Ａの３’側に位置する切断部位（配列Ｂ）を有する、制限エンドヌクレアーゼ認識配列（配列Ａ）と、この配列Ａの５’側にある又はこれに重複する制限エンドヌクレアーゼ認識配列（配列Ｃ）とを含む。配列Ａは、ここで説明した本発明の方法に用いられる第二制限エンドヌクレアーゼ認識配列と同じでもよい。配列Ｃは、ここで説明した本方法で用いられる第三制限エンドヌクレアーゼ認識配列と同じでもよい。ｍＲＮＡ集団中で遺伝子発現パターンを同定するのに用いる好適なキットは、ここで説明されたTALESTベクタなどのＤＮＡベクタと、約７個から４０個のＴ残基を含むプライマと、配列Ａを認識すると共に配列ＢでＤＮＡを切断する第一制限エンドヌクレアーゼと、配列Ｃを認識する第二制限エンドヌクレアーゼとを含む。本発明の第一又はTALEST実施例の概観を図２及び４に示す。図２及び４に示し、ここに説明した概観は特定の制限エンドヌクレアーゼ及び規定されたベクタを用いて本発明の詳細な説明を行なうものであるが、当業者であれば、その他の制限エンドヌクレアーゼも選択可能であることはよく知られ、また、その他の分子生物学的方法、例えばSambrook J.et al.,“Molecular Cloning:A laboratory M anual",Second Ed．(Coldspring Harbor Laboratory Press，Cold Spring Harbo r，New York，1989，Volume 1,Chapter 7)、を用いても、本発明は実施可能であり、本発明はここに提供された詳細な実施例に限定されない。まず、ポリアデニル化ｍＲＮＡを標準的な手法を用いて当該の細胞集団から単離する。次に、希少切断酵素部位（例えばNotI）をその５‘端に有するオリゴdT 配列でこのｍＲＮＡをプライミングすることにより、逆転写酵素を用いてこのｍＲＮＡをｃＤＮＡに変換する。ｃＤＮＡ合成を開始させるのに用いることのできる適したプライマの配列は、NotIエンドヌクレアーゼ認識配列に連結したオリゴ dT配列を含む5'TTTTTTTTTTTTTTTTTTTCGCCGGGCGCATG 3'(配列同定番号NO:3)である。最初の鎖のｃＤＮＡをRNAase H及びDNAポリメラーゼ１を用いて二本鎖ｃＤＮＡに変換する。次にこの二本鎖ｃＤＮＡを二つのことなる制限酵素（例えばNo tI及びMboI）で消化する。二つの制限酵素を用いることにより、このｃＤＮＡを、図１に示すTALESTベクタに直接クローンすることができる。 TALESTベクタは、NotI認識部位と、BamHIエンドヌクレアーゼで切断されたときに、MboIエンドヌクレアーゼで消化させたＤＮＡに適合性のある端部を生じる BamHI認識部位とを含む。MboIは、真核生物のＤＮＡでは２５６個の塩基対ごとに平均して一回現れる４塩基認識配列（GATC）を有する。このように、クローン可能なNotI/MboIｃＤＮＡ断片の平均の大きさは、クローンされたpoly Aの尾の部分を含め約３００塩基対である。ｃＤＮＡをTALESTベクタにクローンすると、細胞中で発現した遺伝子のほとんどすべてを表すｃＤＮＡライブラリが形成される。ライブラリは、ライブラリ中の各ｃＤＮＡの５‘末端が常にMboI認識配列、即ちGATC配列で始まるように定方向で作製されるが、この認識配列は、その遺伝子中で最も３‘側に見つかるMboI部位由来である。次に、このプラスミドをホスト細胞内に形質転換させ、このバクテリアを成長させることで、このライブラリを増幅する。 TALESTベクタは、各ｃＤＮＡで最初にあるGAT配列のすぐ５‘側に位置するBsg I制限エンドヌクレアーゼ部位を有する。BsgIは、規定された配列（GTGCAG）を認識するがＤＮＡの切断はこの認識配列から下流（３’側）のほぼ１６塩基目で行なうII型制限エンドヌクレアーゼである。このようにTALESTベクタをBsgIで切断すると、センス鎖上でGATC開始配列から下流の１２塩基目で、挿入されたｃＤＮＡを切断し、アンチセンス鎖では１０塩基目で切断することで、この環状プラスミドが直線形となる。BsgIは３‘の「上側張出し」を残すため、センス鎖上で対になっていない二つの塩基を、T4ＤＮＡポリメラーゼを用いて取り除き、平滑末端とする。 BsgI部位から上流の９個の塩基は第二II型制限部位、FokIである。この酵素は、５個の塩基配列GGATGを認識するが、切断するのはセンス鎖上では９塩基下流( ３‘)であり、アンチセンス鎖では１３塩基下流である。その結果得られる断片にT4ＤＮＡポリメラーゼ処理を行なうと、平滑末端を有する配列 GGATCNNNNNNNNNN(配列同定番号NO:4)という１５塩基の「標識」が生成される。選択に応じ、PmlIを第二制限部位として用いてもよい。この部位は、その認識配列（CACGTG）がBsgIのそれと重複し、またＤＮＡのセンス鎖及びアンチセンス鎖の両方を同じ場所で切断して平滑末端を生むため、便利である。BsgIで線形になったプラスミドをPmIIで消化すると、平滑末端を持つ配列GTGCAGGATCNNNNNNNN NN(配列同定番号NO:5)という２０塩基の断片が切り取られるが、このときの最初の６個の塩基はTALESTベクタを由来とするものであり、続く１４個(GATCNNNNNNN NNN(配列同定番号NO:6))はｃＤＮＡを由来とするものである。増幅されたｃＤＮＡライブラリ全体をBsgI及びFokIで消化すると、２０個の塩基対の断片が切り取られるが、この断片は、それぞれ最後の１０個の塩基が異なり、またそれぞれが単一の発現した遺伝子の独特のマーカーとなる「標識」の混合物を構成している。１０個の塩基が未知の配列で並んでいると、可能性として４¹⁰即ち１，０４８，５７６通りの異なる標識配列があることになる。この数は、全組織におけるヒトゲノムで発現する遺伝子の数の約４倍を越える。標識を互いに混合し、一個の分子中、約３０から６０個、好ましくは約４０から５０個の標識から成る縦列アレイを作製すべく、ＤＮＡリガーゼで酵素処理する。次に、このアレイをシークエンシング・ベクタにクローンし、自動ＤＮＡ配列分析にかける。アレイが分析されるとき、個々の標識が認識されるが、それはなぜなら、これらは、結紮中に、ランダム・センス又はアンチセンスあるいは標識の方向に応じて、規定されたパンクチュエーション配列GGATC（MboI認識配列を含む）又はその逆相補体により、各々から分離されるからである。各標識は、最初のｃＤＮＡのうちの最も３‘側のMboI部位を由来とする規定の GGATC配列で始まり、研究対照の細胞集団中で発現した遺伝子のうちの一つの独特のマーカーとなる、未知の配列の１０個の塩基をさらに有している。GGATC開始配列が存在することで、実質的には、５個の塩基という、同定のための情報がさらに提供されており、またこの情報を、標識された遺伝子中の特定の部位に位置を限定することができる。このように、実際には１５個の塩基が、ｃＤＮＡにコピーされた各ｍＲＮＡについて知られ、本方法で分析される。 TALESTA実施例第二の即ちTALESTA実施例は、ある一つのｍＲＮＡ集団中で遺伝子発現パターンを同定するもう一つの方法を含む。当該方法は、二本鎖ｃＤＮＡを、ｍＲＮＡ集団から、「プライミング」制限エンドヌクレアーゼの切断部位にオリゴdT配列の５‘端で連結されたオリゴdT配列などのプライマを用いて作製するステップと、この二本鎖ｃＤＮＡを、プライマ内ではなくこのｃＤＮＡ内の一部位で切断する第一制限エンドヌクレアーゼで切断することで、ｃＤＮＡインサートの集団を得るステップとを含む。ｃＤＮＡインサートをクローニング・ベクタの挿入部位に挿入してＤＮＡコンストラクトを得るが、このときこのクローニング・ベクタは、このＤＮＡコンストラクトを第二制限エンドヌクレアーゼで消化するとＤＮＡコンストラクトがｃＤＮΛインサート内の一部位で切断されるよう、挿入部位の５’側に第二制限エンドヌクレアーゼ認識配列を含む。ＤＮＡコンストラクトを、例えば適したホスト細胞、例えばE.coli、などの中で増幅し、単離した後、第二制限エンドヌクレアーゼで消化して、３‘端上側張出し配列を有する直鎖状のＤＮＡ分子を得る。この直鎖状ＤＮＡ分子をアダプタ配列にアニール及び結紮する。アダプタ配列は、第一制限エンドヌクレアーゼ認識配列と、直鎖状のＤＮＡ分子の３’端上側張出し配列に適合性のある３‘端下側張出し配列とを含む二本鎖オリゴデオキシヌクレオチド配列を含む。このアダプタをアニール及び結紮すると、第一制限エンドヌクレアーゼ制限部位を両側に持つｃＤＮＡを含む直鎖状のＤＮＡ分子結紮産物が生まれる。この結紮産物を第一制限エンドヌクレアーゼで消化して標識を得る。この標識のヌクレオチド配列を得ると、当該ｍＲＮＡ集団中で遺伝子発現パターンが同定される。ここでは、「アダプタ」という術語は二本鎖のオリゴデオキシヌクレオチド配列を言うが、このときこの上側の鎖の配列は５‘から３’方向に、そして下側の鎖の配列は３‘から５’方向に、相互に並んでいる。ここで、「３‘端下側張出し部」という術語は、アダプタの下側の鎖の３’端に位置する一本鎖配列を言う。ここで、「３‘端上側張出し部」という術語は、アダプタの上側の鎖の３’端に位置する一本鎖配列を言う。本発明はさらに、TALESTA実施例で用いられるＤＮＡベクタ及びキットを提供するものである。ある一つのｍＲＮＡ集団中で遺伝子発現パターンを同定するのに用いるのに好適なキットには、消化すると変性上側張出し部を残すことのできる、変性配列に隣り合った（３‘端で）パンクチュエーティング制限エンドヌクレアーゼ認識配列を含むＤＮＡベクタなどのＤＮＡベクタが含まれる。本発明の第二又はTALESTA実施例の概観を図３に示す。図３で提供した、かつここで説明した概観は、特定の制限エンドヌクレアーゼと、規定されたベクタを用いて本発明を詳細に説明したものだが、当業者であれば、その他の制限エンドヌクレアーゼも選択でき、またSambrook J．et al.，“Molecular Cloning:A la boratory Manual"，Sccond Ed．(Coldspring Harbor Laboratory Press，Cold S pring Harbor，New York,1989,Volume 1,Chapter 7)に説かれたようなその他の分子生物学的方法を用いても本発明を実施できることは公知であり、本発明はここで提供された詳細な実施例に限定されるものではない。まず、標準的手法を用いてポリアデニル化ｍＲＮＡを目的の細胞集団から単離する。次に、親和捕獲ラベル（例えばビオチン）をその５‘端に持つオリゴdT配列でこのｍＲＮＡをプライミングすることにより、逆転写酵素を用いてこのｍＲＮＡをｃＤＮＡに変換する。標準的手法によりＲＮＡａｓｅＨ及びＤＮＡポリメラーゼＩを用いて、この一番目の鎖のｃＤＮＡを二本鎖ｃＤＮＡに変換する。その後、この二本鎖ｃＤＮＡを、４個の塩基対認識配列を有するパンクチュエーティング制限エンドヌクレアーゼで切断する。「パンクチュエーティング制限エンドヌクレアーゼ」とは、そのエンドヌクレアーゼでｃＤＮＡを切断すると、各々の標識配列の５’端に認識配列が来るため、この標識配列を連結させると、この認識配列が標識配列の各端部に来ることで、連結されたｃＤＮＡ配列同士の間のパンクチュエーティング配列となるものを言う。親和捕獲ラベルを含んだ３‘ 端断片を親和捕獲器（例えば磁気ビーズに結合させたストレプトアビジン）を用いて精製する。次に、この捕獲されたｃＤＮＡ断片を、II型制限エンドヌクレアーゼ認識配列、パンクチュエーティング・エンドヌクレアーゼ制限部位に適合性のある５’端上側張出し配列を含む二本鎖オリゴデオキシヌクレオチド配列を含むアダプタにアニールして、第一結紮産物を形成する。次に、この第一結紮産物を、II型制限エンドヌクレアーゼで切断してこの結紮産物を親和捕獲器から解放するが、このとき、この解放された結紮産物は、ｃＤＮＡインサート由来の配列に隣り合ったパンクチュエーティング・エンドヌクレアーゼ認識配列を含み、このｃＤＮＡ由来の配列は、１又は２個の塩基の変性３‘端上側張出し配列を含む。その後、解放された結紮産物を標準的技術を用いて結紮して変性クローニング・ベクタにすると、この結紮産物の５’端側制限エンドヌクレアーゼ認識配列が、ベクタの制限消化により生まれた上側張出し部と適合するものになり、３‘端側部位が、この親和捕獲器から当該断片を切り離すのに用いた同じII型制限エンドヌクレアーゼでこの変性ベクタを消化することにより導入された上側張出し部と適合性あるものとなる。変性ベクタはさらに、変性上側張出し部にすぐ隣接した（３’側）パンクチュエーティング制限エンドヌクレアーゼ認識配列を含有する。次にＤＮＡコンストラクトをコンピテント・バクテリアに形質転換して標準的技術により増幅し、標識ライブラリを作製する。増幅後、ベクタＤＮＡをパンクチュエーティング制限エンドヌクレアーゼで消化して標識を解放する。 TALESTB実施例第三又はTALESTB実施例は、ある一つのｍＲＮＡ集団中で遺伝子発現パターンを同定するさらにもう一つの方法を含むものである。当該方法は、二本鎖ｃＤＮＡを、ｍＲＮＡ集団から、親和捕獲ラベルを有するプライマを用いて作製するステップと、この二本鎖ｃＤＮＡを、４個の塩基対認識配列を有するパンクチュエーティング・エンドヌクレアーゼで切断することでｃＤＮＡインサートを得るステップとを含む。親和捕獲ラベルを有する３‘端ｃＤＮＡインサートを親和捕獲器に捕獲させて、捕獲されたｃＤＮＡインサートを得る。この捕獲されたｃＤＮＡインサートを、第二制限エンドヌクレアーゼ（例えばII型制限エンドヌクレアーゼ）と、認識配列と、第一ベクタ挿入部位に適合性のある５’端上側張出し配列と、パンクチュエーティング・エンドヌクレアーゼ制限部位に適合性のある５‘端下側張出し配列とを含む二本鎖オリゴデオキシヌクレオチド配列を含む第一アダプタにアニールすることで、第一結紮産物を得る。この第一結紮産物を第二制限エンドヌクレアーゼ（例えばII型制限エンドヌクレアーゼ）で切断して、この結紮産物を親和捕獲器から解放するが、このときこの解放された結紮産物は、ｃＤＮＡインサート由来の配列に隣り合ったパンクチュエーティング・エンドヌクレアーゼ制限部位を含み、このｃＤＮＡ由来の配列は、３’端上側張出し配列を含む。解放された結紮産物を、第二アダプタ、例えばこの結紮産物の３‘端上側張出し配列に適合性のある３’端下側張出し配列と、第二ベクタ挿入部位に適合性のある５‘端下側張出し配列と、を含む二本鎖オリゴデオキシヌクレオチド配列など、でアニールすることで、第二結紮産物を得る。第二結紮産物には、両側にパンクチュエーティング・エンドヌクレアーゼ制限部位を持つｃＤＮＡ由来の配列と、この産物の５’端にある第一ベクタ挿入部位と、この産物の３‘端にある第二ベクタ挿入部位とが含まれる。この第二結紮産物をクローニング・ベクタの挿入部位に挿入して、ＤＮＡコンストラクトを得る。このＤＮＡコンストラクトを増幅し、単離し、パンクチュエーティング・エンドヌクレアーゼで消化して標識を得る。この標識のヌクレオチド配列を得ることで、当該ｍＲＮＡ集団中で遺伝子発現パターンを同定する。ここで、「親和捕獲ラベル」という術語は、あるプライマに結びつける又はその中に含めることのできる成分であって、捕獲成分、例えば親和捕獲器と相互作用(例えば結合)することのできるものを言う。このような成分の例には、たんぱく質、例えば抗体、抗原、酵素、コエンザイム、例えばビオチン、などがあるが、これらに限らない。ここで、「パンクチュエーティング・エンドヌクレアーゼ」という術語は、ＤＮＡを少なくとも一回で切断する能力のある制限エンドヌクレアーゼを言う。典型的には、パンクチュエーティング酵素は真核生物のＤＮＡの４個の塩基対の認識配列を認識する。好ましくは、パンクチュエーティング・エンドヌクレアーゼがＤＮＡをおよそ２５６塩基対ごとに切断するとよい。ある好適な実施例では、パンクチュエーティング・エンドヌクレアーゼはここで説明した第一制限エンドヌクレアーゼと同じである。本発明の方法において有用なパンクチュエーティング・エンドヌクレアーゼの例にはSau3A，MspI，MboI，AluI，BstUI，DpnII，HaeIII，HhaI，HinPI ,MseI,NlaIII，RmaI，及びTaqIがあるが、これらに限定されるものではない。ここで、「親和捕獲器」という術語は、親和捕獲ラベルと相互作用する（例えば結合する成分を言う。親和捕獲器には、さらに、捕獲成分に共有結合させた固体の担体、例えば不溶性のマトリックス、例えば磁気ビーズ、を含めることができる。このような成分の例には、たんぱく質、例えば抗体、抗原、酵素がある。親和捕獲ラベルがビオチンである場合、好適なたんぱく質捕獲成分はストレプトアビジンである。ここで、「隣り合った」という文言は、あるヌクレオチド又はアミノ酸配列（又はその一部分）の、別のヌクレオチド又はアミノ酸配列（又はその一部分）に対する物理的位置を言う。典型的には、ある配列が、別の配列の約８、１０、１２、１４又は１５塩基対又はアミノ酸内にあれば、もう一方の配列に隣り合っていることになる。ここで、「５‘端下側張出し」という術語は、アダプタの下側の鎖の５’端に位置する一本鎖の配列を言う。ここで、「５‘端上側張出し」という術語は、アダプタの上側の鎖の５’端に位置する一本鎖の配列を言う。ここで、「適合性のある」という文言は、ある一つの配列の少なくとも一部分、例えば上側張出し又は下側張出し配列、が、例えば別の上側張出し又は下側張出し配列などの所定の配列に対して相補であることを意味する。例えば、第一ＤＮＡ分子の３‘端上側張出し配列は、第二ＤＮＡ分子の３’端下側張出し配列に対して適合性がある。本開示では、「相補」という術語は分子生物学における通常の意味を有する。二つのヌクレオチド配列又は鎖は、それらが通常の対合規則に基づいて塩基対を形成できれば(Watson-Crick又はHoogstein)相補である。このことは、それらの鎖が必ずしもすべてのヌクレオチドにおいて塩基対であることを要件としない。二つの配列は、一つ又は少ない数の（例えば、２５塩基から成る直鎖では最大５まで）ヌクレオチドの削除、付加、又は置換、あるいはこのような変更の組合せなどにより生じるものなど、低レベル（例えば約１から３％）の塩基のミス対合があってもやはり相補と考えてよい。本発明はさらに、TALESTB実施例で用いられるＤＮＡベクタ及びキットを提供する。例えばここで説明したTALESTBベクタなど、好適なＤＮＡベクタは挿入部位を含み、パンクチュエーティング・エンドヌクレアーゼ認識部位を欠いたものである。ある一つのｍＲＮＡ集団中で遺伝子発現パターンを同定するために用いるのに好適なキットは、例えばここで説明したTALESTBベクタなどのＤＮＡベクタと、約７から４０個のＴ残基を含むプライマと、パンクチュエーティング・エンドヌクレアーゼと、二本鎖オリゴデオキシヌクレオチド配列を含む第一アダプタであって、第二制限エンドヌクレアーゼ（例えばII型制限エンドヌクレアーゼ）、認識配列、第一ベクタの挿入部位に適合性のある５‘端上側張出し配列、及び、パンクチュエーティング・エンドヌクレアーゼ制限部位に適合性のある５’ 端下側張出し配列を含む第一アダプタと、二本鎖オリゴデオキシヌクレオチド配列を含む第二アダプタであって、３‘端下側張出し配列、及び、第二ベクタ挿入部位に適合性のある５’端下側張出し配列、を含む第二アダプタとを含む。本発明の第三又はTALESTB実施例の概観を図５に示し、以下に説明する。ここで説明する第三実施例の概観は、特定の制限エンドヌクレアーゼと、規定されたベクタを用いて本発明を詳細に説明したものだが、当業者であれば、その他の制限エンドヌクレアーゼも選択でき、またSambrook J．et al.，“Molecular Clo ning:A laboratory Manual",Second Ed.(Coldspring Harbor Laboratory Press, Cold Spring Harbor，New York，1989,Volume 1,Chaptcr 7)に説かれたようなその他の分子生物学的方法を用いても本発明を実施できることは公知であり、本発明はここで提供された詳細な実施例に限定されるものではない。本発明の第三実施例を行なうには、標準的手法を用いてポリアデニル化ｍＲＮＡを目的の細胞集団から単離する。次に、ビオチン基をその５“端に持つオリゴ dT配列でこのｍＲＮＡをプライミングすることにより、逆転写酵素を用いてこのｍＲＮＡをｃＤＮＡに変換する。標準的手法によりＲＮＡａｓｅＨ及びＤＮＡP olＩを用いて、この一番目の鎖のｃＤＮＡを二本鎖ｃＤＮＡに変換する。その後、この二本鎖ｃＤＮＡを、制限酵素、例えばSau3A、で消化する。この酵素の持つ４個の塩基の認識配列（GATC）は、真核生物のＤＮＡでは平均で２５６個の塩基対毎に一回あるものであり、平均的ｃＤＮＡを数回切断することとなる。次に、最も３’側の断片（各ｃＤＮＡの最も３“側のSau3A部位と、poly Aの尾との間の配列を表す）を、ストレプトアビジンに共有結合した磁気ビーズで親和捕獲法により捕獲し、その他のSau3A制限断片はすべて洗い流し、部分的に二本鎖となった以下の配列（配列同定番号NO:7及び配列同定番号NO:8から成る、このときＮはＡ、Ｔ、Ｃ又はＧのいずれでもよい）の突出断片を残す：次のステップは、この（磁気ビーズ上で）固相のｃＤＮＡを、部分的に二本鎖配列（配列同定番号NO:9及び配列同定番号NO:10から成る）：を有する合成二本鎖オリゴヌクレオチド第一アダプタにアニールすることである。ただしこのとき、下側の鎖の上側張出し「CTAG」配列は固相のｃＤＮＡ分子上の上側張出し「GATC」配列にアニールすることとなる。このアダプタ配列は、アニールされたｃＤＮＡでGATC配列のすぐ５‘側に位置するBsgI制限部位（GTGC AG）を含む。BsgIは、上に示した規定された配列を認識するが、この認識配列から１６塩基ほど「下流」（３’端側）でＤＮＡを切断するII型制限酵素である。固相ｃＤＮＡをBsgIで切断すると、部分的に二本鎖となったオリゴマー配列（配列同定番号NO:11及び配列同定番号NO:12から成る）が磁気ビーズから解放され、アダプタ分子と、以下に示す２個の塩基の３‘端「上側張出し部」を残したもう一つのｃＤＮＡ由来のアンチセンス鎖とから構成される規定された配列ができる。このオリゴマーの５‘端は、NotI制限部位に適合性のある、対になっていない「GGCC」配列を含んでいる。次にこの断片を、配列：の１６個の変性オリゴヌクレオチドから構成される第二の部分的に二本鎖になったアダプタ配列（配列同定番号NO:13及び配列同定番号NO:14）に溶液相でアニール及び結紮する。変性「NN」配列が存在することで、このアダプタは、第一結紮産物にアニールして、第二の部分的に二本鎖となった以下の結紮産物（配列同定番号NO:15及び配列同定番号NO:16から成る）を生じさせることができる。こうして、新しい断片は、両側にSau3A部位（GATC）部位を持つ、各ｃＤＮＡを由来とする１２塩基の未知の配列と、それぞれNotI及びEcoRIで消化したベクタに適合性のある両端とから構成される。当業者であれば、第一及び第二アダプタ上のベクタ挿入部位に適合性のある配列は互換可能である、即ち、上述したように第一アダプタがNotI挿入部位に適合性のある配列を有し、第二アダプタがEc oRI挿入部位に適合性のある配列を有していても、あるいは図５に示すようにその逆でもよいことは理解されよう。これらのインサートをこのような切断ベクタにクローンすると、新しいｃＤＮＡ「標識」ライブラリが形成されるが、このとき各ｍＲＮＡ種は規定される１２塩基の配列を生じる。このライブラリをTALEST Bプラスミド・ベクタにクローンし、適したE.coliホストに形質転換する。次に、プラスミドＤＮＡを標準的手法で単離し、Sau3Aで消化して、部分的に二本鎖となった「標識」配列（配列同定番号NO:17及び配列同定番号NO:18から成る）：を解放するが、このとき、１２個の「Ｎ」はｃＤＮＡインサートを由来とする未知の配列を表す。これらの標識を、プラスミドの主鎖内のSau3A部位を由来とするその他の小型の制限断片から分離するために、これら部位のうちのいくつかをTALESTBベクタ内で位置指定突然変異誘発により破壊した。TALEST標識をゲル電気泳動法により単離し、相互に混合し、一個の分子中、５０から６０個の標識から成る縦列アレイを作製すべく、ＤＮＡリガーゼで酵素処理する。次に、このアレイをシークエンシング・ベクタ内にクローンし、自動ＤＮＡ配列分析にかける。アレイを分析すると、個々の標識が認識されるが、それはなぜなら、これらは、もとのｃＤＮＡの最も３‘側にあるSau3A部位を由来とする規定されたGATCパンクチュエーション配列により、互いから切り離されているからである。各標識はこれまでのところ未知の配列の塩基をさらに１２個有しているが、研究対象となった細胞集団中での発現遺伝子の一つの独特のマーカーとなっている。標識をアレイの中にセンス又はアンチセンス方向のいずれで結紮してもよい。しかしながら、未知の配列の塩基が１２個あると、可能性として４¹²即ち１６，７７７，２１６通りの異なる標識の配列があることになる。この数は、（全組織中で）ヒトゲノムで発現する遺伝子の数よりも二桁大きい大きさである。従って、ある一つの標識配列が一つの遺伝子にそのセンス方向でマッチし、異なる遺伝子にそのアンチセンス方向でマッチするといったことは、実際上あり得ない。さらに、GA TC開始配列が存在することで、実際的には、同定情報となる４個の塩基がさらに提供され、またこの情報の位置が、標識遺伝子内の特定の部位に限定される。しかしながら、個々の標識の頻度分布を生み出すには、センス及びアンチセンスの両方の方向で標識が同一であるとみなすことが重要である。これを達成するためにソフトウェア・プログラムが作成された。このソフトウェア・プログラムは自動ＤＮＡ配列ファイルをスキャンして、規定された長さのランダムな配列(例えば、制限エンドヌクレアーゼBsgIを用いてTALEST実施例を行なう場合に生まれる１２個の塩基対)が介在する対になった制限エンドヌクレアーゼ配列（例えばパンクチュエーティング制限エンドヌクレアーゼ配列、例えばGATC）を探すものである。このソフトウェアは次に、この配列を、対になった各々の制限エンドヌクレアーゼ配列同士の間にある塩基対部分から構成された個々の標識にパースする。同じ標識配列が複数存在するときに、一緒にパースして標識の頻度分布を作成する。一つの標識はセンス又はアンチセンスのいずれの方向でも結紮して標識アレイにできるため、このソフトウェアは、方向に関係なく標識を同一のものとして得点する方法を確立しなければならない。これは、このソフトウェアが同定する標識配列すべてがその逆相補配列に比較され、そしてアルファベットで前に来る配列のみを頻度分布に入力するといった決まりを確立することで達成される。このソフトウェアはさらに、別々の細胞又は組織から作成した標識の頻度分布を比較し、ユーザが指定したレベルと異なる頻度のものを強調するようなものとしてもよい。当業者には公知である自動化された高処理量のＤＮＡシークエンサにより、標識の同時配列決定が可能である。このように、本方法は、高処理量のＤＮＡシークエンサを用いて容易かつ迅速に分析することのできる標識を容易かつ迅速に作製する方法を提供するものである。さらに、本発明はｃＤＮＡライブラリの初期作製を含むため、このライブラリを目的の標識に対応するオリゴヌクレオチドでプローブすれば、その標識で同定される遺伝子の発現頻度を判定することができる。例えば、ある標識が腫瘍ｃＤＮＡプールでは三回現れるのに正常細胞プールでは全く現れない場合、両方のｃＤＮＡライブラリを標識でプローブしてそれらの正確な頻度を確認してもよいであろう。その後、完全長遺伝子を単離し、当業者に公知のクローニング法を用いて同定してもよいであろう。 TALESTB実施例（図５にダイアグラムで図示）に関連するもう一つの実施例を図６に概略的に示す。この実施例では、アダプタを一個だけ使用し、TALESTB実施例で用いたのと同じステップを用いて、予め親和捕獲器で捕獲されたｃＤＮＡ断片を単離する。つまり、ｃＤＮＡ集団を、ｍＲＮＡのプレパラートから、親和捕獲ラベル（例えばビオチン）に共有結合させたプライマを用いて作製し、次にこのｃＤＮＡを、ｃＤＮＡ配列内でのみ切断するパンクチュエーティング・制限エンドヌクレアーゼ（例えばMboI又はSau3A）で切断する。次に３‘端ｃＤＮＡ断片を、親和捕獲器（例えば磁気ビーズに結合させたストレプトアビジン）を用いて捕獲し、捕獲されなかった断片を洗い落とす。次に、捕獲されたｃＤＮＡインサートを、このｃＤＮＡインサートの末端に適合性のある一端（即ちパンクチュエーティング制限エンドヌクレアーゼ部位に適合性のある）と、II型制限エンドヌクレアーゼ認識配列（例えばBsgIの認識配列）と、EcoRI制限部位に適合性のある一端とを有する二本鎖オリゴデオキシヌクレオチド配列であるアダプタにアニール及び結紮する。その後、このｃＤＮＡを・型制限エンドヌクレアーゼ（例えば図６に示すようにBsgI）を用いて親和捕獲器から切り離し、このｃＤＮＡ断片を単離する。本方法のこの時点では、図５に示したように第二アダプタを提供する代わりに、結紮されたアダプタの一端に適合性のある制限エンドヌクレアーゼアクセプタ部位（例えばEcoRI部位）と、ｃＤＮＡ分子の他端に適合性のある部位（即ちBsg I酵素の制限部位にアニール可能な下側張出し配列）とを有するベクタが提供される。好ましくは、BsgIによるｃＤＮＡの切断で生じる可能性のあるｃＤＮＡ端部のすべてを受け入れるには、当該ベクタは、図６に「NN」で示すような２塩基の変性３‘端下側張出し部を有する、１６倍変性組のプラスミド・ベクタであるとよい。このｃＤＮＡ及びベクタをアニールし、結紮してコンストラクトを作製し、このコンストラクトを適したホスト細胞（例えばE.coli）内に導入し、当業者に公知の標準的技術を用いて増幅する。増幅されたプラスミドを単離し、パンクチュエーティング・制限エンドヌクレアーゼ（例えばSau3A）で消化することでｃＤＮＡ標識配列を解放し、その後このｃＤＮＡ標識配列を単離し、結紮して、一アレイ当り、通常少なくとも１０個の標識及び好ましくは約４０から６０個の標識から成る標識アレイを作製する。次に、標準的技術を用いてこの標識アレイを適したベクタ（例えばBamHIで切断してパンクチュエーティング制限エンドヌクレアーゼ部位に適合性のある末端にしたプラスミドなど）内にクローンし、そこでこの標識アレイの配列を決定する。図６に示すように、標識アレイのヌクレオチド配列は、パンクチュエーティング制限エンドヌクレアーゼ配列（図６で GATCで示される）と、それに続くｃＤＮＡ配列と、それに続く別のパンクチュエーティング制限エンドヌクレアーゼ配列と、それに続くｃＤＮＡ配列と、等々、と最後のフランキングベクタ配列とを含む。このように、ｍＲＮＡ集団中で遺伝子発現パターンは、発現した遺伝子をそれぞれが表す標識配列を同定することにより、その同定が可能である。その他の実施例本発明の三つの実施例は、以下に説明する別の方法において有用である。例えば、本発明の方法を用いると、ある一つのｍＲＮＡ集団中で遺伝子発現の頻度を判定することができる。当該方法は、本発明のｃＤＮＡインサートを含むＤＮＡコンストラクトを作製してｃＤＮＡライブラリを得るステップを含む。当該方法は、さらに、目的の標識配列を含むオリゴヌクレオチド・プローブを、好ましくは本発明の方法を用いて作製することで、示差的に発現した遺伝子を同定するステップと、このｃＤＮＡライブラリを、当該標識配列を含むオリゴヌクレオチド・プローブでプローブすることにより、この標識配列を含む遺伝子の発現頻度を判定するステップとを含む。「オリゴヌクレオチド・プローブ」という術語は、目的の分子に特異的に結合する核酸を言う。「プロービング」という術語は、ここでは例えば標識を含むヌクレオチド配列などのヌクレオチド配列を用いてＲＮＡ又はＤＮＡのプールにハイブリダイズする方法を言う。プールＲＮＡ又はＤＮＡは細胞又は組織中のその自然環境から単離してもよく、あるいはプールを細胞又は組織内でin situでアッセイしてもよい。上記及び本出願を通じて用いられる「ハイブリダイズする」とは分子静物画での通常の意味を持つ。これはヌクレオチド・ポリマー同士の塩基対形成という相互作用を言うものである。塩基対が存在するとは、通常の塩基対合の法則に基づき、二つのヌクレオチド配列の各々において、ある一定の割合のヌクレオチド（少なくとも８０％）が他方のものに対して相補であることを意味する。安定的なハイブリダイゼーションを得るために相補でなければならないヌクレオチドの割合の正確な数値は、ヌクレオチドの配列、溶液の塩濃度、温度及びｐＨを含む数多くの因子に応じて様々であろう。「緊縮条件」下でのハイブリダイゼーションに言及する場合、「緊縮」とはいかなる核酸配列についても経験的な用語であると理解されねばならない。しかしながら、この用語は、二つの配列の間で塩基対が正確にマッチしている、又は塩基のミスマッチのパーセンテージが小さい（５から１０％）ようなＤＮＡ配列であれば、検出及び単離が可能なように充分安定な、塩基対を基にしたハイブリッド分子が形成されるハイブリダイゼーション条件の性質を示すものである。一方、塩基のミスマッチが多量にある二つの配列は同じ条件下ではこのような安定したハイブリッドを形成しないであろう。当業者であれば、条件の緊縮性を調節すべく様々な因子を変更してもよいことは既知であり、またどのようにこのような因子を変更して所望の結果を得るかも理解されていることであろう。これらの因子の例には、温度、ナトリウムイオン濃度、及び、塩化テトラメチルアンモニウム又は塩化テトラエチルアンモニウム濃度である。当業者であれば、ある一式の条件の緊縮度は、例えばその分子のＧ＋Ｃ含有量、短い方の分子の長さ、及び分子におけるミスマッチの位置など、当該ＤＮＡ又はＲＮＡの特徴に左右されるであろうことは認識されよう。しかしながら、当業者であればさらに、溶解温度（Ｔ_M ）の推定を可能とする公式があることも公知であろう。ＤＮＡについては、オリゴヌクレオチドプローブのためのこのような公式の一例は、ナトリウムイオン濃度、Ｇ＋Ｃ含有量、及びプローブの長さに関する変数に基づく関数である。(Sam brook et al.，Molecular Cloning(1989)at 11.46)。同様の公式がＲＮＡ：ＲＮＡハイブリッド及びＲＮＡ：ＤＮＡハイブリッドについても入手可能である（Id .at 9.51.）。加えて、当業者であれば、溶解温度に対するミスマッチの影響を推定できること、そしてこの溶解温度は、パーフェクト・マッチ又はミスマッチのＤＮＡについて経験的に判定可能であることは公知であろう。従って、当業者であれば、「緊縮条件」はごく通常の技術を用いれば請求の範囲に挙げられたＤＮＡ配列について容易に判断可能であることを認識されよう。本発明では、「緊縮条件」は、好ましくは少なくとも８０％の塩基対合を、より好ましくは少なくとも９０％又は９５％の塩基対合を、さらにより好ましくは少なくとも９７％の塩基対合を、そして最も好ましくは少なくとも９８％の塩基対合を要するものでなければならない。当業者であれば、ハイブリダイゼーション条件は、温度、塩濃度、及び、ハイブリダイゼーション及び洗浄溶液のホルムアルデヒド含有量を変えることで変更可能であることは認識されよう。さらに、可能性としてあり得るミスマッチの量に関して、又はより高い又はより低い程度の緊縮性を提供すべく、条件の許容量を設定してもよい。さらに、緊縮度の適切なレベルを経験的に判定することで、計算されたＴ_Mを開始推定値として用いた特定のハイブリダイゼーションを提供することができる。例えば、Ｔｍとミスマッチの程度との間の対応性を、当業者に公知の方法や、例えばSambrook et al.,Molccular Cloning(1989)at 11.47,11.5 5-57に説明された方法に基づき、計算してもよい。本発明の方法を用いると、さらに二つ又はそれ以上のｍＲＮＡ集団の間で遺伝子発現の差を検出することができる。当該方法は、本発明の方法に基づき、第一ｍＲＮＡ集団と、少なくとももう一つの別のｍＲＮＡ集団とから遺伝子発現パターンを同定するステップを含む。次に、このようにして得られた遺伝子発現パターンを比較して、このｍＲＮＡ集団間での遺伝子発現の差を検出することができる。好適な態様では、第一ｍＲＮＡ集団を正常な細胞又は組織から得、別のｍＲＮＡ集団を疾患又は異常を有する目的生物の細胞又は組織から得る。別の好適な態様では、ｍＲＮＡ集団を異なる発生段階の細胞又は組織から得る。さらに別の好適な態様では、ｍＲＮＡ集団を同じ目的生物の異なる組織又は臓器を由来とする細胞から得る。別の好適な態様では、ｍＲＮＡ集団を異なる目的生物から得る。本発明の目的のために、「目的生物」という術語は、ＲＮＡを得ることのできるあらゆる生物を含む。当業者であれば、この術語は、例えば動物、植物、その他の真核細胞及びバクテリアを含むことを認識されよう。本発明はさらに、目的生物中で疾患の存在を検出する方法を提供するものである。当該方法は、本発明の方法に基づき、正常細胞又は組織と、疾患又は異常を有する目的生物から得た細胞又は組織とで異なる発現をしている遺伝子を同定するステップと、この遺伝子の標識配列を単離するステップとを含む。第一目的生物から得たｍＲＮＡ集団と、第二正常又は罹病目的生物から得たｍＲＮＡ集団とを、この標識配列でプローブすることで、この遺伝子の発現レベルを判定することができる。次に、第一目的生物におけるこの遺伝子の発現レベルを、第二目的生物中のこの遺伝子の発現レベルと比較すれば、第一目的生物における疾患の存在を検出することができる。さらに別の実施例では、本発明の方法を用いて遺伝子を単離することができる。ある遺伝子を単離するには、単離しようとするこの遺伝子の配列の一部分を含む標識を同定し、標準的技術、例えばこの標識配列をプローブとして用いて、ｃＤＮＡライブラリから完全長クローンを同定する方法、などにより、この遺伝子を単離する。単離しようとする遺伝子の配列の「一部分」とは、この部分が言及する鎖の配列のうちの連続したサブセットと同じヌクレオチド配列を有する線形の鎖を言う。ある好適な実施例では、本発明の方法を用いて、第一ｍＲＮＡ集団において第二ｍＲＮＡ集団と比較したときに異なるレベルで発現している、示差的に発現した一遺伝子又は複数の遺伝子を単離することができる。示差的に発現した遺伝子を単離するには、結紮された標識アレイのヌクレオチド配列を、第一細胞種又は組織と第二細胞種又は組織とから、本発明の方法に基づいて得る。次に、第一及び第二細胞種又は組織の個々の標識配列の発現頻度を比較する。こうして、第一細胞種又は組織において、第二細胞種又は組織と比較したときに示差的に発現している標識配列を同定し、単離することができる。こうして、示差的に発現している標識配列に対応する遺伝子を同定することができる。「対応する」という術語は、ある一つの核酸分子の少なくとも一部分が第二の核酸分子に相補か又は相同のいずれかであることを意味する。従って、ｍＲＮＡ分子を逆転写の鋳型として用いてｃＤＮＡ分子を生成した場合、このｃＤＮＡ分子はこのｍＲＮＡ分子に対応するものであろう。同様に、ゲノム配列の複数の部分がｃＤＮＡ配列に相同又は相補である場合、その遺伝子のゲノム配列はそのｃＤＮＡ配列に対応するものであろう。第一のｍＲＮＡ集団において第二のｍＲＮＡ集団に比較して異なるレベルで発現している遺伝子を単離するには、第一ｍＲＮＡ集団から採った遺伝子発現パターンと、第二のもう一つのｍＲＮＡ集団から採った遺伝子発現パターンとを、ここで説明する方法に基づいて同定する。次に、これらの遺伝子発現パターンを比較してｍＲＮＡ集団間での遺伝子発現の差を検出することができる。こうして、第一ｍＲＮＡ集団において第二ｍＲＮＡ集団と比較したときに異なるレベルで発現している遺伝子を同定し、単離することができる。本発明をさらに以下の実施例により描写するが、これらの実施例は限定的なものと捉えられてはならない。本出願全体を通じて引用された全文献、特許出願、特許、及び公開済の特許出願の内容を参考文献としてここに編入することとする。実施例実施例１、２、４、５及び６に説明する方法は、ここで説明する方法の三つの実施例の各々において用いることができるものである。実施例３では、ここで説明する三つの実施例の各々の標識を作製する方法が説かれている。実施例１−ｍＲＮＡの単離ＲＮＡの抽出法は当業において公知であり、例えばSambrook J.,et al.,“Mol ecular Cloning:A Laboratory Manual"，Sccond Ed．(Coldspring Harbor Labor atory Prcss，Cold Spring Harbor,New York,1989,Volume 1,Chaptcr 7)に説かれている。その他の単離抽出法も公知である。単離は特に塩化グアニジウム又はグアニジウムイソチオシアネートなどのカオトロピック剤の存在下で行われるが、その他の洗剤及び抽出剤も代わりに用いることができる。メッヤンジャーＲＮＡは、オリゴ(dT)セルロース・カラム又はその他、ｍＲＮＡ分子のポリアデニル化３‘端部分に結合することのできるクロマトグラフィ媒質を用いたクロマトグラフィにより、全抽出ＲＮＡから単離することが好ましいが、必ずしも必要ではない。簡単に説明すると、細胞をＲＮＡ抽出緩衝液[0.14Ｍ NaCl，15mM MgCl₂，10mM TrisHCl(pH8.6)，0.5％ NP-40，１mM DTT，1000単位/ml Nascインヒビタ(Pharma cia)]中にVortexミキサを３０秒間用いて溶解させた後、氷上に５分間放置する。12,000ｇで９０秒間遠心分離して核及びその他の細胞組織片を沈殿させ、上清をプロティナーゼＫで除たんぱくした後、フェノール抽出する。イソプロパノールでＲＮＡを沈殿させ、７０％のエタノールですすぐ。最後に、poly A＋画分をオリゴdTカラム分画により採集する(Aviv，D．P.，et al.，Proc．Natl．Acad． Sci．USA69,1408-1412(1972))。実施例２−二本鎖ｃＤＮＡの作製次に、二本鎖ｃＤＮＡをこのｍＲＮＡ集団から、図３に示した配列のＤＮＡプライマを用いて作製する。アンカー・プライマはＴ残基の連なり（約７から４０個の残基）と、７個以上の塩基を認識する制限酵素で切断するための部位とが含まれるが、この切断部位は、NotIなど、Ｔ残基の連なりの５‘端側部位に位置している。ｃＤＮＡの反応を当業者に公知の条件下で行なわせる。このような技術は例えば Volume 2 of J．Sambrook et al.,"Molecular Cloning:A Laboratory Manual.， Second Ed."に説かれている。これらの方法では、この方法を行なう一つの方法はトリ骨髄芽球症ウィルスの逆転写酵素を用いる方法である。二番目のｃＤＮＡ鎖合成は、ＲＮＡaseＨ／ＤＮＡポリメラーゼＩセルフ・プライミング法を用いて行なってよい。簡単に説明すると、それぞれ２マイクログラムの細胞質Poly A＋ＲＮＡ及びベクタ・プライマＤＮＡを、0.3M Na-アセテートを含有する70％エタノール中に同時沈殿させ、そのペレットを12Flの蒸留水に溶解させた。最初の鎖の合成には、７６℃で１０分間熱変性させた後、４Flの5X 反応緩衝液(250mM Tris-HCl(pH8.3),375mM KCl,15mM MgCl₂)、２Flの0.1MDTT、1 F1の各10mMのdATP,dCTP,dGTP及びdTTPを試料に３７℃で加えた。200単位の逆転写酵素MMLV-H-RT(BRL)を加えて反応を開始させ、３７℃で３０分間インキュベートした後、この反応チューブを氷上に移動させて反応を停止させた。二番目の鎖の合成には、上述の反応混合液に、92Flの蒸留水、32Flの5XE.coli反応緩衝液(1 00mM Tris-HCl(pH7.5)，20mM MgCl₂,，50mM(NH₄)₂SO₄，500mM KCl，250g/mlのBS A,750M βNAD)、３Flの各10mMのdATP,dCTP,dGTP及びdTTP、15単位のE.coliリガーゼ(Pharmacia)、40単位のE.coliポリメラーゼ(Pharmacia)及び15単位のRNase H(Pharmacia)を加えた後、16℃で２時間インキュベートした。この反応混合液を１５分間、６５℃に加熱した。このｃＤＮＡ試料を次にMboI及びNotIで切断する。次にｃＤＮＡベクタ試料を図２で示したTALESTベクタに挿入する。TALESTベクタも同様にBamH1及びNotIで当業者に公知の方法を用いて消化されたものである。簡単に説明すると、ブランクのｃＤＮＡインサートとブランクのベクタを含有する試料を１mlまでlx E．coli 反応緩衝液で希釈し、100単位のE.coliリガーゼを加える。その結果得られる混合液を１６℃で一晩インキュベートする。ｃＤＮＡの挿入後、ベクタ混合液を用いてE.coliコンピテント細胞を形質転換させる。クローニングに適したホスト細胞は、例えばSambrooketal.,“Molccular Cloning:A Laboratory Manual"に説かれている。ホスト細胞を成長させて、生成されたベクタの数を増加又は増幅させる。適したE.coli株はDH5又はMC1061である。実施例３−標識の作製 TALEST実施例では、TALESTベクタは成長させたホスト細胞から当業者に公知の方法、例えば「ミニプレツプ（原語：miniprep）」について説いたJ.Sambrook e t al.，"Molecular Cloning:A Laboratory Manual.,Sccond Ed."などを用いて単離される。次にベクタをBsgIで切断すると、このプラスミドはセンス鎖上でMboI 開始配列から１２塩基下流、そしてアンチセンス鎖では１０塩基下流の部位で線形になる。そこでT4 DNAポリメラーゼを用いてベクタの平滑末端を作る。次にベクタをPm1Iで切断すると、配列GTGCAGGATCNNNNNNNNNNを持つ、２０塩基の平滑末端で終わる断片が生まれる。これらの標識をベクタの残りから、例えば上掲した Sambrook et al.の説いたようにポリアクリルアミドゲル電気泳動法により分離する。 TALESTA実施例では、二本鎖のｃＤＮＡを制限エンドヌクレアーゼSau3Aで切断して制限断片を作製し、オリゴdT−ビオチン成分を含有する最も３‘端側の断片を、ストレプトアビジン磁気ビーズを用いて捕獲する。この断片は、以下に示すように部分的に二本鎖となった配列(配列同定番号NO:7及び配列同定番号NO:8から成る)を有する。捕獲された断片は、まだ磁気ビーズに固定されているが、これを、部分的に二本鎖となった配列（配列同定番号NO:19及び配列同定番号NO:20から成る）：を有する５‘端アダプタにアニールして、二本鎖配列（配列同定番号NO:21及び配列同定番号NO:22から成る）：を有する結紮された複合体を作製する。固相結合したｃＤＮＡを・型制限エンドヌクレアーゼBsgIで消化すると、ｃＤＮＡインサートが５‘端から規定された距離で切断され、部分的に二本鎖となった配列（配列同定番号NO:23及び配列同定番号NO:24から成る）：を有する断片が解放される。次に、この解放された断片を１６倍変性ベクタの、配列：を有するクローニング部位にクローンする。この断片をベクタに結紮し、コンピテントE.coli内に形質転換させ、プラスミドＤＮＡを作製する。次にプラスミドＤＮＡを制限エンドヌクレアーゼSau3Aで消化して、部分的に二本鎖となった配列（配列同定番号NO:17及び配列同定番号N O:18から成る）：を有する標識を解放する。 TALESTB実施例では、二本鎖ｃＤＮＡを制限エンドヌクレアーゼSau3Aで切断して制限断片を作製し、オリゴdT−ビオチン成分を含有する最も３‘端側の断片をストレプトアビジン磁気ビーズを用いて捕獲する。この断片は部分的に二本鎖となった配列（配列同定番号NO:7及び配列同定番号NO:8から成る）：を有する。捕獲された断片は、まだ磁気ビーズに固定されているが、これを、部分的に二本鎖となった配列（配列同定番号NO:19及び配列同定番号NO:20から成る）を有する５‘端アダプタにアニールして、を有する結紮された複合体を作製する。固相結合したｃＤＮＡをII型制限エンドヌクレアーゼBsgIで消化すると、ｃＤＮＡインサートが５‘端から規定された距離で切断され、部分的に二本鎖となった配列（配列同定番号NO:23及び配列同定番号NO:24から成る）：を有する断片が解放される。次に、この解放された断片を、部分的に二本鎖をなった配列(配列同定番号NO: 13及び配列同定番号NO:14から成る)：を有する１６倍変性第二アダプタに結紮して、部分的に二本鎖になった配列（配列同定番号NO:25及び配列同定番号NO:26から成る）：を有する結紮された断片を作製する。次にこの断片を、以下のクローニング部位：が生じるよう、予め制限エンドヌクレアーゼEcoRI及びNotIで消化したクローニング・ベクタ内に結紮する。その結果得られる組換えベクタを、次にコンピテントE.coli内に形質転換させてプラスミドＤＮＡを作製する。このプラスミドＤＮＡを次に制限エンドヌクレアーゼSau3Aで消化して、部分的に二本鎖となった配列（配列同定番号NO:17及び配列同定番号NO:18から成る）：を有する標識を解放する。実施例４−標識の配列決定実施例３で作製した標識を互いに混合し、一個の分子中３０から４０個の標識から成る縦列アレイを作製するためにＤＮＡリガーゼで酵素処理する。３０から４０個の標識長を単離するために、約４２０から５６０個のヌクレオチド長のＤＮＡ配列を例えば上述のSambrook et al.,に説かれたようなアガロース・ゲル電気泳動法により単離する。次にこの３０から４０個の標識のアレイをシークエンシング・ベクタ内にクローンする。適したシークエンシング・ベクタは当業者に公知である。適したシークエンシング・ベクタの一例はpUCl9である。こうして、この標識を含有するシークエンシング・ベクタを自動ＤＮＡ配列分析にかける。実施例５−ｃＤＮＡライブラリを標識配列でプローブすることによる、遺伝子発現頻度の判定ある特定の配列の標識が、個々の標識の収集中に多く又は少なく現れているようであれば、その標識を単離した遺伝子の実際の頻度を、その親ｃＤＮＡライブラリをプローブすることにより判定してよい。当業者に公知の標準的方法を用いてこの親ｃＤＮＡライブラリをプローブしてもよい。例えば、プラスミドの単離又は標識作製のためにバクテリア・コロニーを単離する前に、このコロニーを含有するプレートに、ニトロセルロース又はナイロンの膜を被せて複製コピーを作製してもよい。あるいはその代わりに、同じ組織源から新しいｃＤＮＡライブラリをプラスミド又はファージ・ベクタ中に作製し、上述したようにフィルタに晒してもよい。次に、このフィルタを、目的の標識と同じ配列を有する合成オリゴヌクレオチド・プローブに暴露する。プローブは、まず、J.Sambrook et al.,“ Molecular Cloning:A Laboratory Manual.，Sccond Ed．及びその他のソースで説かれたような標準的技術を用いて³²Ｐでラベルする。次にフィルタを洗浄してＸ線フィルムに感光する。プローブにハイブリダイズしているコロニー又はプラークの数を計数し、スクリーンされたライブラリ中のコロニーの総数でその数を除算すると、このライブラリを得た組織中における転写の広がりの頻度を推定できる。実施例６−示差的に発現した遺伝子のクローニング本発明の方法を用いて示差的に発現した遺伝子を単離してもよい。特に、相対的に過剰に発現した遺伝子を同定かつ単離してもよい。関連する組織（例えば腫瘍と、それが発生した正常組織）を由来とする別々のライブラリ中の標識頻度を比較することにより、それら組織の一方で過剰に又は不足して発現しており、いずれかの組織の病理学的又はその他の表現型に関係する可能性のある遺伝子に対応する標識を同定することが可能である。これらの「示差的に発現した」遺伝子をより充分に特徴づけるには、ヒトＲＮＡ又はｃＤＮＡ配列の適宜フィルタされたデータベースでその標識配列を検索することができる。あるいは、その標識配列を、実施例５で説明したようにハイブリダイゼーション用のプローブとして用いてｃＤＮＡライブラリから完全長のクローンを同定してもよい。こうして、これらのクローンを配列決定し、標準的な手法を用いて既知の遺伝子に対するホモロジーを調べてもよい。等価物当業者であれば、ごく通常の実験を用いるのみで、ここに説明した本発明の具体的な実施例に対する等価物を数多く認識され、又は確認できることであろう。このような等価物は以下の請求の範囲の包含するところとして意図されている。配列表

───────────────────────────────────────────────────── フロントページの続き (72)発明者サジャディフレイドンジー. アメリカ合衆国 92024 カリフォルニア州エンシニタス、プラムツリードライブ 1548

Claims

【特許請求の範囲】１．ｍＲＮＡの一集団中で遺伝子発現パターンを同定する方法であって、（ａ）プライマを用いてｍＲＮＡの一集団から二本鎖ｃＤＮＡの一集団を作製するステップと、（ｂ）ｃＤＮＡインサートの一集団を得るために、前記二本鎖ｃＤＮＡを、前記プライマ内ではなく前記ｃＤＮＡ内の一部位で切断する第一制限エンドヌクレアーゼで切断するステップと、（ｃ）ＤＮＡコンストラクトを得るために、前記ｃＤＮＡインサートをクローニング・ベクタの挿入部位に挿入するステップであって、各クローニング・ベクタが、前記挿入部位の５‘端側に位置する第二制限エンドヌクレアーゼ認識配列と、前記第二エンドヌクレアーゼ認識配列の５’端側に位置する又は重複する第三制限エンドヌクレアーゼ認識配列とを含む、ステップと、（ｄ）前記ＤＮＡコンストラクトをホスト細胞内で増幅するステップと、（ｅ）増幅されたＤＮＡコンストラクトを単離するステップと、（ｆ）前記増幅されたＤＮＡコンストラクトを第二制限エンドヌクレアーゼで消化することで、前記ＤＮＡコンストラクトを前記第二制限エンドヌクレアーゼで消化した結果、前記ＤＮＡコンストラクトが前記ｃＤＮＡインサート内の部位で切断されるステップと、（ｇ）標識を得るために、前記増幅されたＤＮＡコンストラクトを第三制限エンドヌクレアーゼで消化するステップと、（ｈ）前記ｍＲＮＡ集団中で遺伝子発現パターンを同定するために、前記標識のヌクレオチド配列を得るステップとを含む、方法。２．前記得るステップが、少なくとも約１０個の標識を含む結紮された標識アレイを得るために、前記標識を結紮するステップと、前記結紮された標識アレイをベクタに挿入するステップと、前記結紮された標識アレイを配列決定するステップとを含む、請求項１に記載の方法。３．前記第一制限エンドヌクレアーゼが４個の塩基から成る配列を認識し、前記第二制限エンドヌクレアーゼがII型制限エンドヌクレアーゼであり、及び前記第三制限エンドヌクレアーゼ認識配列が、前記第二制限エンドヌクレアーゼ切断部位の５‘端側の約１０から４０ヌクレオチドに位置する、請求項１に記載の方法。４．前記第一制限エンドヌクレアーゼが４個の塩基から成る配列を認識し、前記第二制限エンドヌクレアーゼがII型制限エンドヌクレアーゼであり、及び前記第三制限エンドヌクレアーゼ認識配列が前記第二制限エンドヌクレアーゼ認識配列に重複する、請求項１に記載の方法。５．ステップ（ａ）が、オリゴdT配列の５‘端に連結したプライミング制限エンドヌクレアーゼ切断配列を含むプライマを用い、さらに、前記ｃＤＮＡを前記プライミング制限エンドヌクレアーゼで消化したときに、前記プライミング制限エンドヌクレアーゼ切断配列を前記二本鎖ｃＤＮＡの３’端に導入させて含むｃＤＮＡインサートを得るために、前記二本鎖ｃＤＮＡをプライミング制限エンドヌクレアーゼで消化するステップをさらに含む、請求項１に記載の方法。６．前記結紮された標識アレイが少なくとも約４０個の標識を含む、請求項２に記載の方法。７．ｍＲＮＡの一集団中で遺伝子発現パターンを同定する方法であって、（ａ）二本鎖ｃＤＮＡの一集団を、第一生体試料から得られたｍＲＮＡの第一集団から、親和捕獲ラベルに共有結合したプライマを用いて作製するステップと、（ｂ）前記親和捕獲ラベルに連結したｃＤＮＡインサートの一集団を得るために、前記二本鎖ｃＤＮＡを、前記プライマ内でなく前記ｃＤＮＡ内の一部位で切断するパンクチュエーティング制限エンドヌクレアーゼで切断するステップと、（ｃ）捕獲されたｃＤＮＡインサートの一集団を得るために、前記親和捕獲ラベルを親和捕獲器で捕獲することにより前記ｃＤＮＡインサートを捕獲するステップと、（ｄ）第一結紮産物を得るために、捕獲されたｃＤＮＡインサートを第一アダプタにアニールすると共に、前記ｃＤＮＡインサート及び前記第一アダプタを結紮するステップであって、前記第一アダプタが、第一ベクタ挿入部位に適合性のある５‘端上側張出し配列と、第二制限エンドヌクレアーゼ認識配列と、パンクチュエーティング制限エンドヌクレアーゼ部位に適合性のある５’端下側張出し配列とを含む二本鎖オリゴデオキシヌクレオチド配列を含む、ステップと、（ｅ）前記親和捕獲ラベルから分離した解放された結紮産物を生成するために、前記第一結紮産物を第二制限エンドヌクレアーゼで切断するステップであって、前記解放された結紮産物が、ｃＤＮＡ配列に隣り合ったパンクチュエーティング・エンドヌクレアーゼ制限部位と３‘端上側張出し配列とを含む、ステップと、（ｆ）第二結紮産物を得るために、前記解放された結紮産物を第二アダプタにアニールすると共に、前記解放された結紮産物及び前記第二アダプタを結紮するステップであって、前記第二アダプタが、第二ベクタ挿入部位に適合性のある５ ‘端下側張出し配列と、前記解放された結紮産物の前記３’端上側張出し配列に適合性のある３‘端下側張出し配列とを含む二本鎖オリゴデオキシヌクレオチド配列を含み、及び、前記第二結紮産物が、第一ベクタ挿入部位に適合性のある５ ’端配列と、パンクチュエーティング・エンドヌクレアーゼ認識部位を両側に持つｃＤＮＡ配列と、第二ベクタ挿入部位に適合性のある３‘端配列とを含む、ステップと、（ｇ）ＤＮＡコンストラクトを得るために、前記第二結紮産物をクローニング・ベクタ内の第一ベクタ挿入部位及び第二ベクタ挿入部位に挿入するステップと、（ｈ）前記ＤＮＡコンストラクトをホスト細胞内で増幅するステップと、（ｉ）増幅されたＤＮＡコンストラクトを単離するステップと、（Ｊ）標識を得るために、前記増幅されたＤＮＡコンストラクトを前記パンクチュエーティング制限エンドヌクレアーゼで消化するステップと、（ｋ）前記第一生体試料中の遺伝子発現を同定するために、前記標識のヌクレオチド配列を得るステップとを含む、方法。８．ステップ（ｋ）が少なくとも１０個の標識を含む結紮された標識アレイを得るために、前記標識を結紮するステップであって、前記標識アレイ中の各々の標識がパンクチュエーティング制限エンドヌクレアーゼ認識部位に隣り合う、ステップと、前記結紮された標識アレイをベクタ内に挿入するステップと、前記結紮された標識アレイを配列決定するステップと、前記標識アレイの配列を既知の遺伝子の配列に比較するステップとを含む、請求項７に記載の方法。９．標識にハイブリダイズする遺伝子配列を単離するステップをさらに含む、請求項７に記載の方法。１０．ステップ（ａ）が、ビオチンを含む親和捕獲ラベルを用い、ステップ（ｃ）が、ストレプトアビジンに共有結合した磁気ビーズを含む親和捕獲器を用いる、請求項７に記載の方法。１１．ステップ（ｅ）が、前記第一結紮産物部位を、その認識配列の３‘側の約１６ヌクレオチドの位置にある一部位で切断する第二制限エンドヌクレアーゼを用いる、請求項７に記載の方法。１２．ステップ（ｄ）が、前記パンクチュエーティング制限エンドヌクレアーゼ部位に適合性のある配列の５‘側に位置する前記第二制限エンドヌクレアーゼ認識部位を含む前記第一アダプタを用いる、請求項７に記載の方法。１３．ステップ（ｅ）が、２ヌクレオチド長の３‘端上側張出し部を含む前記解放された結紮産物を生成し、ステップ（ｆ）が、変性配列の２個のヌクレオチドを含む３’端下側張出し配列を含む前記第二アダプタを用いる、請求項７に記載の方法。１４．前記結紮するステップが、少なくとも約４０個の標識から成る結紮された標識アレイを生成する、請求項８に記載の方法。１５．ステップ（ｅ）が、前記第一結紮産物を、II型制限エンドヌクレアーゼである第二制限エンドヌクレアーゼで切断する、請求項７に記載の方法。１６．ステップ（ａ）が、３‘端でビオチンラベルに共有結合した５’端オリゴdT配列を含む前記プライマを用い、ステップ（ｂ）がSau3Aで切断し、ステップ（ｃ）がストレプトアビジンに共有結合した磁気ビーズを含む前記親和捕獲器を用い、ステップ（ｄ）が、NotI挿入部位に適合性のある５‘端上側張出し配列と、BsgI制限エンドヌクレアーゼ認識配列と、Sau3A制限部位に適合性のある５ ’端下側張出し配列とを含む前記第一アダプタを用い、ステップ（ｅ）が、ｃＤＮＡ配列に隣り合ったSau3A制限部位を含む解放された結紮産物を生成するために、前記第一結紮産物をBsgIで切断し、ステップ（ｆ）が、EcoRI挿入部位に適合性のある５‘端下側張出し配列と、３’端下側張出し変性配列とを含む前記第二アダプタを用い、ステップ（ｆ）が、NotI挿入部位と、Sau3A制限部位を両側に持つｃＤＮＡ配列と、EcoRI挿入部位とを含む前記第二結紮産物を生成し、ステップ（ｇ）が、前記第二結紮産物を前記クローニング・ベクタのNotI及びEcoR I部位に挿入し、ステップ（ｊ）が、標識を得るために、前記増幅されたＤＮＡコンストラクトをSau3Aで消化し、及び前記の結紮するステップが約３０から６０個の標識から成る結紮された標識アレイを得る、請求項８に記載の方法。１７．標識のヌクレオチド配列を含むオリゴヌクレオチド・プローブを作製するステップと、前記標識を含む遺伝子の発現頻度を判定するために、ｃＤＮＡライブラリを前記オリゴヌクレオチド・プローブでプローブするステップとをさらに含む、請求項７に記載の方法。１８．第二生体試料から採ったｍＲＮＡの第二集団を用いてステップ（ａ）から（ｋ）までを繰り返すステップと、前記第一生体試料と前記第二生体試料との間の遺伝子発現の差を判定するために、ｍＲＮＡの前記第一集団の遺伝子発現と、ｍＲＮＡの前記第二集団の遺伝子発現とを比較するステップとをさらに含む、請求項７に記載の方法。１９．ｍＲＮＡの前記第一集団で第一レベルで発現し、ｍＲＮＡの前記第二集団で第二レベルで発現している遺伝子を同定するステップと、ｃＤＮＡライブラリから前記遺伝子を単離するステップとをさらに含む、請求項１８に記載の方法。２０．前記第一生体試料が正常な非罹病生物から得られた細胞又は組織であり、前記第二生体試料が、疾患又は異常を有する生物から得られた細胞又は組織である、請求項１８又は１９に記載の方法。２１．前記第一生体試料が発生の第一段階にある生物から得られた細胞又は組織であり、前記第二生体試料が発生の第二段階にある生物から得られた細胞又は組織である、請求項１８又は１９に記載の方法。２２．請求項７に記載の方法に基づいてｍＲＮＡの一集団において遺伝子発現パターンを同定するためのキットであって、 NotI挿入部位、EcoRI挿入部位、及び、一つ又はそれより少ないSau3A制限エンドヌクレアーゼ認識部位を含むＤＮＡベクタと、約７から約４０個のＴ残基を含むプライマと、 NotI挿入部位に適合性のある５‘端上側張出し配列と、II型制限エンドヌクレアーゼ認識配列と、Sau3A制限部位に適合性のある５’端下側張出し配列とを含む二本鎖オリゴヌクレオチド配列を含む第一アダプタと、 EcoRI挿入部位に適合性のある５‘端下側張出し配列と、３’端下側張出し変性配列とを含む二本鎖オリゴヌクレオチド配列を含む第二アダプタとを含む、キット。２３．ｍＲＮＡの一集団中で遺伝子発現パターンを同定する方法であって、ａ）二本鎖ｃＤＮＡの一集団を、生体試料から得られたｍＲＮＡの一集団から、親和捕獲ラベルに共有結合したプライマを用いて作製するステップと、ｂ）前記親和捕獲ラベルに連結したｃＤＮＡインサートの一集団を得るために、前記プライマ内ではなく前記ｃＤＮＡ内の一部位で切断するパンクチュエーティング制限エンドヌクレアーゼで前記二本鎖ｃＤＮＡを切断するステップと、ｃ）捕獲されたｃＤＮＡインサートの一集団を得るために、前記親和捕獲ラベルを親和捕獲器で捕獲することにより前記ｃＤＮＡインサートを捕獲するステップと、ｄ）第一結紮産物を得るために、捕獲されたｃＤＮＡインサートをアダプタにアニールすると共に、前記ｃＤＮＡインサート及び前記アダプタを結紮するステップであって、前記アダプタが、第一ベクタ挿入部位に適合性のある５‘端上側張出し配列と、II型制限エンドヌクレアーゼ認識配列と、パンクチュエーティング制限エンドヌクレアーゼ部位に適合性のある５’端下側張出し配列とを含む二本鎖オリゴデオキシヌクレオチド配列を含む、ステップと、（ｅ）前記親和捕獲ラベルから分離した解放された結紮産物を生成するために、前記第一結紮産物をII型制限エンドヌクレアーゼで切断するステップであって、前記解放された結紮産物が、ｃＤＮＡ配列に隣り合ったパンクチュエーティング・エンドヌクレアーゼ制限部位と、２個のヌクレオチドから成る３‘端上側張出し配列とを含む、ステップと、（ｆ）結紮されたアダプタの一端に適合性のある制限エンドヌクレアーゼアクセプタ部位と、２個の変性ヌクレオチドから成る３‘端下側張出し配列とを含むベクタを提供するステップと、（ｇ）ＤＮＡコンストラクトを作製するために、前記ステップｆ）のベクタをステップｅ）の前記解放された結紮産物にアニールするステップと、（ｈ）前記ＤＮＡコンストラクトをホスト細胞内で増幅するステップと、（ｉ）ｃＤＮＡ標識配列を解放するために、前記ホスト細胞から前記ＤＮＡコンストラクトを単離すると共に、前記単離されたＤＮＡコンストラクトを前記パンクチュエーティング制限エンドヌクレアーゼで消化するステップと、（ｊ）標識を生成するために、解放されたｃＤＮＡ標識配列を単離及び結紮するステップと、（ｋ）ＤＮＡ配列決定のために標識アレイをベクタ内にクローンするステップとを含む方法。