【発明の詳細な説明】
遺伝子の量的発現を分析する方法発明の分野
本発明は、細胞及び組織における遺伝子発現パターンを同定する新規な方法、
目的の生物の細胞又は組織を含めた、細胞及び組織中の遺伝子発現の頻度を判定
する方法、及び、遺伝子発現パターンを同定するために用いられるベクタ、に関
するものである。目的の生物には、ヒト、動物及び植物が含まれる。本発明はさ
らに、本発明の方法に基づいて同定された標識配列に対応する遺伝子を単離する
方法も提供するものである。本発明はさらに、示差的遺伝子発現に関連する疾患
を診断する方法、及び遺伝子発現に対する薬物の作用を判定する方法にも関連す
るものである。発明の背景
ヒトゲノムは約100,000の遺伝子を含んでいるが、いずれの細胞においてもこ
れらの遺伝子のごく一部しか発現しない。このように、各細胞種において、いず
れの時点でもヒト遺伝子のごく一部しか発現しないのである。各遺伝子は精確な
タイミングで精確な量、発現する。
自動DNAシークエンサにより、生物のゲノムの配列を容易に決定できるよう
になつた。Haemophius influenzae,Mycoplasma genitalium,及びCaenorhabditi
s elegansのゲノムの配列は公開されており、例えばヒトなど、より高等な生物
のゲノムの配列が得られるようになってきている。(Fleischmann,R.D.et al.
(1995)Science 269:496;Fraser,C.M.et al.(1995)Science270;397;Hodgkin,
J.et al.(1995)Science 270:410)。しかしながら、この技術から得られる情報
は、いつの時点、どの細胞でこれらの遺伝子のうちのどれが発現するかという疑
問に答えるものではない。この情報は、細胞がどのように互いに分化していくか
、細胞がどのように老化するかを判断するのに、そして数多くの疾患の原因及び
影響を判断するのに、重要である。
ある一つの細胞系譜にある典型的なほ乳類細胞は、そのゲノム中に持つ100,00
0余りの生殖系細胞のうちのほぼ20,000から30,000を発現させる。ほとんどすべ
ての細胞は、多くの同じ遺伝子を普遍的に発現するが、このような遺伝子は「ハ
ウスキーピング」遺伝子と呼ばれる。ハウスキーピング遺伝子の例には、解糖に
関連す
る酵素、又は、細胞構造に関連するたんぱく質をコードする遺伝子がある。しか
しながら、細胞を互いに分化させるのは普遍的に発現しない遺伝子である。細胞
が分化した細胞に成熟する際には、特定の非構成的に発現する遺伝子が別々の段
階でオンオフする。このように、細胞間での遺伝子発現パターンの違いが、例え
ば神経細胞を血液細胞とは異なったものにしているのである。
さらに、非構成的に発現する遺伝子産物の細胞内濃度は、環境シグナルに応答
して遺伝子発現が誘起又は抑制されることで、調節を受ける場合がある。このよ
うに、ある細胞種内での遺伝子産物の相対的濃度が、その細胞の状態の指標であ
る場合がある。
たった一個の細胞内においても、発現量はある一個の遺伝子と隣のものとでは
大きく違うことがある。典型的な細胞では、20,000から30,000の別々の配列が転
写されたものである、おそらくは200,000個のmRNA分子が細胞質中に存在す
る。写しであるこれらの配列のうちで、一個の細胞あたり数千以上のコピーが存
在するといった状態で豊富に存在するのはごく僅かであるかも知れない。例えば
、抗体分泌形質細胞中の全mRNAのうち最大70%は免疫グロブリンmRNA
である。その他の遺伝子、典型的にはアクチン又はグルコース-6-ホスフェート
デヒドロゲナーゼなどのハウスキーピング遺伝子、は、細胞一個あたりおよそ10
0から1,000個のコピーといった中程度の量が存在する。しかしながら、遺伝子転
写物のうちの90%を越えるものが、細胞一個あたり10から15個未満のコピーが
存在するといった程度であり、その存在量は低い。
疾患又は異常状態にある個人のものなど、異常な細胞状態下では、個々の細胞
内での遺伝子発現のパターンは、正常な、非疾患状態にあるときに見られる発現
パターンに比較すると変化している場合がある。遺伝子発現の変化は、例えば腫
瘍細胞での場合など、疾患又はその他の異常の結果であったり、又は原因であっ
たりする。いくつかの疾患は特定の遺伝子における突然変異が原因であり、従っ
てゲノム配列を調べれば検出可能であると理解してよい場合がある一方で、多く
の疾患及び異常が遺伝子発現量の機能不全に関するものであり、このような場合
はゲノムの配列決定では検出できず、その細胞の遺伝子発現パターンを同定する
しか、検出方法はない。従って、生物における特定の細胞種の機能を理解したり
、又は疾患の進行を理
解するには、これらの特定の細胞種内での個々の遺伝子の発現状態を、その生物
の発生上の異なる段階で理解することが必要である。
これらの疑問に答えようと研究者たちが試みてきた方法の一つは、多種の細胞
からたんぱく質を単離して、これらのたんぱく質の各々についてその存在度を比
較する方法である。ある方法では、たんぱく質を細胞から精製し、その存在度を
比較する。しかしながら、この方法は別々のたんぱく質を精製する、等しく効率
的な方法を考案するのが難しいといった限界がある。またこの方法は公知のたん
ぱく質に限られる。別の方法では、二次元ゲル電気泳動法を用いてたんぱく質の
発現が比較されるが、細胞中のたんぱく質をすべて分離する上で、そしてごく微
量しか生成されないたんぱく質を検出する上での難しさに直面する場合がある。
(Kahn,P.(1995)Science 270:369を参照されたい。)
mRNA集団でペプチドの発現を判定するその他の方法は、mRNAのプール
から生成されたペプチド集団をプローブするのに抗体を利用するものである。こ
のように、mRNA分子のコードするポリペプチドに対応する合成ポリペプチド
の「ライブラリ」を作製し、個々の抗体でプローブするのである。この方法では
微量の発現が検出されないことがあるため、mRNAから生じるポリペプチドを
一度にすべて検出する方法とはならない。さらに、この方法は入手の可能な抗体
に限られる。この方法は、例えば1993年9月7日に発行された米国特許第5,
242,798号、及び1990年2月13日に発行された米国特許第4,900,811号に説
かれている。
その上、これらのたんぱく質検出方法のすべてにおいて、特定のたんぱく質の
違いが判定されても、そのたんぱく質の発現に関係のある遺伝子を判定するには
、依然そのたんぱく質を部分的に配列決定してクローンしなければならない。あ
るいはその代わりに、そのたんぱく質を配列決定して「プロテオーム」データベ
ースに比較しなければならない(Kahn,P.(1995)Science 270:369)。さらに、細
胞から精製されたたんぱく質を見ることで遺伝子発現パターンを判定することは
、遺伝子発現の二次的及び三次的結果、即ちmRNAのたんぱく質への翻訳、及
び翻訳後修飾、を見る方法であり、一次的結果、即ちDNA配列のmRNAへの
転写を見る方法ではない。さらに、たんぱく質の発現量を検出することは、その
たんぱく質が翻訳後に
劣化する可能性や、たんぱく質発現の差が実際には遺伝子発現の差によるもので
はない可能性を考慮に入れていない。
研究者たちはさらに、個々のmRNAの発現の変化を検出することにも焦点を
当ててきた。その方法の一つに差引きハイブリダイゼーションがあるが、この方
法は発現量のごく微量なRNAを検出する充分な解決策を持たない。Lee,S.W.
et al.(1991)Proc.Natl.Acad.Sci.USA 88:2825。別の方法には、cDNAを二つ
のmRNA集団から作製し、二つの別々の色でラベルし、cDNAライブラリを
予め固定した顕微鏡スライドにこれらをハイブリダイズした後、試料が蛍光する
かどうかを判定することで示差的ハイブリダイゼーションを同定するといったマ
イクロアレイ・ハイブリダイゼーション・アッセイが含まれる。(例えばNowak,R.
(1995)Science 270:368;Schena et al.(1995)Science 270:467を参照されたい)
。最近では、細胞中で特定のmRNAに特異的であると共に、特定のmRNAの
発現を同定するには充分である、各mRNA中で「標識」と呼ばれる短い特定の
配列に研究者は注目している。これらの標識は、ゲノム・マーカーを同定かつマ
ッピングするのに用いられてきた配列標識部位(STS)に見られる配列と類似で
ある(Olson et al.(1989)Science 245:1434)。このような方法の一つでは、無作
為に選択されたcDNAクローンを特定の組織のmRNAから作製する。cDN
Aを作製するこの集団固定法を行なうと、「発現した配列標識」のデータベース
が得られる(Adams,M.D.et al.(1991)Science,255:1651;Adams,M.D.(1992)Natur
e 355:632-634)。
別の方法は、ポリメラーゼ連鎖反応(PCR)を利用して標識を規定し、示差
的に発現した遺伝子を検出しようとする試みに着目するものである。多くのグル
ープが、様々な組織中の遺伝子発現を比較するのに利用できると思われる、mR
NA配列標識のデータベースを確立しようと、このPCR法を用いてきた(Willi
ams,J.G.K.(1990)Nucl.Acids Res.18:6531;Wclsh,J.,et al.(1990)Nucl.
Acids Res.18:7213;Woodward,S.R.(1992)Mamm.Genome 3:73;Nadcau,J.H.(1992)
Mamm.Genome 3:55)。この方法はさらに、mRNAディファレンシャル・ディス
プレイと呼ばれるプロセスでmRNA集団を比較するのにも適合されている。こ
の方法ではPCR合成の産物をゲル電気泳動にかけ、二つ又はそれ以上のmRN
A集団から生じたバンドを比較する。ある一つのmRNA集団からとった一つの
ゲルのオートラジオグラフに存
在していて別のものに存在しないバンドは、ある特定のmRNAがある一つの集
団にあって別のものにないことに相当し、従って、ある遺伝子が示差的に発現し
たことを示すものである。二つの異なる種類の細胞を由来とするメッヤンジャー
RNAを、10個のヌクレオチドから成る任意のオリゴヌクレオチド配列(ランダ
ム10-mer)を5‘プライマとして、そしてpolyAの尾に相補の一組の12個の
オリゴヌクレオチドから成るものを3’「アンカープライマ」として用いること
で比較する。次にこれらのプライマを用い、放射性デオキシリボヌクレオチドを
加えて、mRNAの配列を部分的に増幅する。こうして増幅された配列を、各配
列決定ゲルが50から100のmRNAの配列を有するよう、配列決定ゲル上で
分離する。この配列決定ゲルを次に相互に比較して増幅された部分のうちのどれ
が示差的に発現しているかを判定する(Liang,P.et al.(1992)Science 257:967
;See also Welsh,J.et al.(1992)Nucl.Acid Res.20:4965;Liang,P.et al.(1993
)Nucl.Acids Res.3269)。
mRNAの発現を検出するのにPCRを利用することに基づいたもう一つの方
法は、poly Aの連なりにハイブリダイズする12個のアンカープライマと、mR
NAに対応するcDNA配列内の4個のヌクレオチド配列で切断するもの、及び
、各アンカープライマのうちの単一の部位を認識する別の制限エンドヌクレアー
ゼ、という二つの制限エンドヌクレアーゼとを利用することに依拠するものであ
る。次に、12個のプールの各々のなかのmRNAを由来とするcDNAを、ベ
クタのプロモータから下流に挿入し、このcDNAインサートを含有するベクタ
を増幅すべく、これを用いてホスト細胞を形質転換させる。その後「cRNA」
アンチセンス転写物をプロモータで誘起して作製した後、これらをPCRを用い
て増幅する。このPCR反応は、16の異なるサブプールにおいて、16又はそ
れ以上の別々のプライマを用いて行われる。このように12個の異なるアンカー
プライマでは、192個のサブプールが一つのmRNA試料当り必要である。こ
のPCR産物を次に配列決定ゲルで分離する(1995年5月18日公開、WO95
/13369号)。
遺伝子発現の連続分析(又はSAGE)と呼ばれる、遺伝子発現を分析するもう一
つの方法は、発現した遺伝子の配列分析のために二量化させた標識(「ジ標識」
と呼ばれる)と、ジ標識の連結とを用いるものである(Velculescu,V.E.et al
.(1995)Science 270:484;米国特許第5,695,937号)。この方法では、mRNAの
cDNAコピ
ーを、通常ビオチニル化されたpoly dTプライマを用いて作製する。次にこのc
DNAコピーを二本鎖に作製し、一般的には各cDNA中に存在する四つの塩基
対配列を認識する「アンカー酵素」で切断する。次にビオチニル化したcDNA
をストレプトアビジン・ビーズに結合させて配列の残りを取り除く。その結果、
メッセンジャーRNAの3‘端の一部分がストレプトアビジン・ビーズに結合し
たcDNAコピーが出来上がる。ストレプトアビジン・ビーズに結合したこのc
DNAの集団は通常半分に分割される。この半分の部分のそれぞれを、次に、「
タギング酵素」と呼ばれる、認識部位とは異なる部位でDNAを切断することで
、mRNA配列のcDNAコピー内の一部位で切断を起こさせるような制限エン
ドヌクレアーゼ(例えばII型の制限エンドヌクレアーゼ)のための制限エンドヌ
クレアーゼ認識部位を含有する二つのオリゴヌクレオチド・リンカーのうちの一
方に結紮する。cDNA配列の末端は、「尾対尾」の態様で対にして相互に結紮
し、一つのオリゴヌクレオチドリンカーを5’端に、そしてもう一つのオリゴヌ
クレオチドリンカーを3‘端に含んだ「ジ標識」集団を作製する。これらジ標識
は、一般にはリンカーに対して特異的なプライマを用いてPCR増幅される。P
CR増幅された領域をアンカー酵素で切断して相互に連結することで、アンカー
酵素認識部位の配列を途中に持つ一連のジ標識にする。連結させたジ標識は直接
配列決定しても、又はベクタにクローンしてから配列決定してもよく、その後こ
のジ標識の配列を公知の配列に比較して発現した遺伝子を同定する。
PCRを利用する方法は再現性に問題があり、またPCRプライマの作製及び
アニーリングを含めたその他の複雑なステップを、遺伝子発現パターンを検出す
る方法に用いる必要がある。さらにこれらのPCRを基にした方法は必ずしも遺
伝子発現の頻度の違いを検出するものではない。
増幅後のPCR産物の存在度は、開始材料となるテンプレートの存在度に加え
、数多くの因子の影響を受ける。「増幅効率」における配列特異的な違いから、
開始テンプレートに実際に差がなくとも、PCR産物に人為的な量の差が生じる
ことはよく知られている。さらに、同じテンプレート標本を繰返し増幅する場合
でも、その産物に6倍といった大きな差が出ることがあることが報告されている
(Gilliand et al.in:PCR Protocols.Academic Prcss,pp 60-69(1990))。従って
、増幅で生じた産
物の性質から開始テンプレートの存在度を推測しようとするPCRを基にした方
法のいずれにも、緊縮同時増幅対照が必要である。上に引用した「SAGE」技術に
おいて、たまたま増幅度の高い配列(例えばATリッチな配列)を有するcDN
A標識はすべて、PCRステップ後では過剰に表れ、「難しい」配列(例えばG
Cリッチなパリンドローム配列)を有するものは低く表れることとなる。開始テ
ンプレートの存在度を判定する際にSAGEを利用したことで生じる信頼性という問
題は、「ジ標識」を利用するとそのすべてを補正できなくなる。反復的に単離さ
れるジ標識をすべて除外しても、過剰に表れる標識配列のすべてを無くすことは
できない。「増幅度」が人為的に高められるのは、標識のうちのたった一個が原
因である場合があり、このような場合では個々の構成員を含んだジ標識はいずれ
も過剰に表れることとなるであろう。さらにこの除外法では、表れ方が人為的に
低くなった配列に関しては何ら効果がでない。
このように、遺伝子発現を検出する、遺伝子を同定する、そして個々の細胞又
は組織で遺伝子発現パターンを同定する簡単かつ再現可能な方法や、これらの細
胞又は組織における遺伝子発現の頻度を判定する方法が求められている。発明の概要
本発明は、細胞集団中で発現した遺伝子のすべてに標識を付け、かつ同定する
方法を提供するものである。この方法により、ひいてはコピー数の少ないmRN
Aでも検出することができる。本方法を用いれば、細胞間で遺伝子発現プロフィ
ールを比較することにより、その発現が病理学的表現型に関連した個々の遺伝子
を同定することができる。本発明はさらに、高処理量のDNA配列決定と、この
ようなDNA配列決定分析を支援する関連する情報系とを用いることで、合理的
な長さ及び時間で全体的な遺伝子発現プロフィールの制作を可能とするものであ
る。このように、本発明は、全体的な遺伝子発現プロフィールを得て目的の遺伝
子を同定すべく、当業者に公知の情報系で用いるのに充分なデータを容易にかつ
高速で得る方法を提供する。
本発明はmRNA集団中で遺伝子発現パターンを同定する方法を利用する。本
発明の方法の好適な利用法は、二つ又はそれ以上の細胞又は組織間で示差的な遺
伝子
発現パターンを同定するための利用である。このように、本発明の方法を利用す
ると、ある細胞種、組織、又は目的の生物で、別の細胞種、組織、又は目的生物
とは異なる量、発現した一つの遺伝子又は複数の遺伝子を同定することができる
。さらに本発明の方法を用いることで、同じ細胞種又は組織種の、異なる発生段
階において示差的遺伝子発現を同定したり、及び罹患した又は異常な細胞の遺伝
子発現パターンの変化を同定することができる。さらに、本発明を用いることで
、環境条件の変化又は薬物による治療の結果起きた遺伝子発現パターンの変化を
検出することができる。これらの方法の別々の三つの実施例を以下に説明するこ
ととする。
本発明の一態様では、一mRNA集団中で遺伝子発現パターンを同定する方法
が提供される。当該方法には、二本鎖cDNAを、一つのmRNA集団から、プ
ライマ、例えばオリゴdT配列の5‘端で、「プライミング」制限エンドヌクレア
ーゼの切断部位に連結したオリゴdT配列など、を用いて作製するステップと、こ
の二本鎖cDNAを、プライマ内ではなくcDNA配列内の部位で切断する第一
制限エンドヌクレアーゼで切断してcDNAインサートを得るステップとが含ま
れる。このcDNAインサートをクローニングベクタ内の挿入部位に挿入してD
NAコンストラクトを得るが、このとき各クローニングベクタは、このDNAコ
ンストラクトを第二制限エンドヌクレアーゼで消化させるとcDNAインサート
内の部位でこのDNAコンストラクトが切断されるよう挿入部位の5’側にある
第二制限エンドヌクレアーゼ認識配列と、第二制限エンドヌクレアーゼ認識配列
の5‘側に又はこれに重複して第三制限エンドヌクレアーゼ認識配列とを含んで
いる。DNAコンストラクトを、例えば適したホスト細胞、例えばE.coli、内で
増幅して単離する。単離後、増幅されたDNAコンストラクトを第二及び第三制
限エンドヌクレアーゼで消化して標識を得る。こうして標識のヌクレオチド配列
を得ると、このmRNA集団中で遺伝子発現パターンが同定される。
好適な態様では、標識を結紮することで少なくとも約10個の標識、より好ま
しくは少なくとも約40個の標識から成る結紮された標識アレイを得て、この結
紮された標識アレイをシークエンシング・ベクタ内に挿入し、この結紮された標
識アレイの配列を決定することにより、標識のヌクレオチド配列を得る。ある一
つの実施例では、第一制限エンドヌクレアーゼは四個の塩基から成る配列を認識
し、第二制
限エンドヌクレアーゼはII型の制限エンドヌクレアーゼであり、そして第三制限
エンドヌクレアーゼの認識配列は第二制限エンドヌクレアーゼ切断部位の5‘側
の約10から40ヌクレオチドに位置する。別の実施例では、第一制限エンドヌ
クレアーゼは四個の塩基から成る配列を認識し、第二制限エンドヌクレアーゼは
II型の制限エンドヌクレアーゼであり、そして第三制限エンドヌクレアーゼの認
識配列は第二制限エンドヌクレアーゼ認識配列に重複するものである。一実施例
では、二本鎖cDNAの集団は、二本鎖cDNAをプライミング制限エンドヌク
レアーゼで消化して、cDNAがプライミング制限エンドヌクレアーゼで消化さ
れるときに二本鎖cDNAの3’端に導入されるプライミング制限エンドヌクレ
アーゼ切断配列を含むcDNAインサートを得ることで、作製する。このプライ
ミング制限エンドヌクレアーゼは、7つ以上の塩基から構成される配列を認識す
ることができるが、好ましくはこれは8つの塩基のパリンドローム配列を認識す
るとよい。最も好ましくは、プライミング制限エンドヌクレアーゼがNotIである
とよい。さらに、第一制限エンドヌクレアーゼが、各cDNA内の一配列を認識
する確率が高いものであるとよい。このように、本発明の好適な態様では、第一
制限エンドヌクレアーゼが、6個未満の塩基から構成される一配列を認識する。
より好ましくは、第一制限エンドヌクレアーゼが、4つの塩基から構成される一
配列を認識するとよい。好適な制限エンドヌクレアーゼはMboIである。さらに、
第二制限エンドヌクレアーゼでベクタを消化したときに、コピーされたmRNA
に対応する配列内の部位でcDNAインサートが切断されるよう、第二制限エン
ドヌクレアーゼがDNAをそのエンドヌクレアーゼの認識部位の下流にある部位
で切断することも好ましい。好ましくは、第二制限エンドヌクレアーゼがII型の
制限エンドヌクレアーゼであるとよい。より好ましくは、第二制限エンドヌクレ
アーゼが、DNAを認識配列に対して3‘側の10から14塩基で切断するもの
であるとよい。より好ましくは、この第二制限エンドヌクレアーゼがII型の制限
エンドヌクレアーゼであるとよい。最も好ましくは、この第二制限エンドヌクレ
アーゼがBsgIであるとよい。別の好適な態様では、第三制限エンドヌクレアーゼ
の認識配列が、第二制限エンドヌクレアーゼ切断配列の5‘側の約20から40
、より好ましくは約10から15ヌクレオチド内にある。シークエンシング・ベ
クタ内に挿入可能な標識の数を最大にするには、第二制限エ
ンドヌクレアーゼ切断配列から比較的短い距離に切断部位があることが好ましい
。好ましくは、第三制限エンドヌクレアーゼの認識配列が、この第三制限エンド
ヌクレアーゼの切断部位の5’側の約10から15ヌクレオチド内にあるとよい
。ある一つの実施例では、第三制限エンドヌクレアーゼの認識配列が、第二制限
エンドヌクレアーゼの認識配列と重複する。好ましくは、第三制限エンドヌクレ
アーゼの認識配列が、第二制限エンドヌクレアーゼの認識配列内にあるとよい。
さらに、第三制限エンドヌクレアーゼでDNAを切断すると平滑末端ができるこ
とも好ましい。好ましくは、第二制限エンドヌクレアーゼがBsgIであり、第三制
限エンドヌクレアーゼがPmlIであるとよい。より好適な実施例では、第三制限部
位がII部位であり、ただしこのときの切断部位が第二制限切断部位の5‘側のす
ぐ隣に位置しているとよい。最も好ましくは、第三制限部位がFokIであるとよい
。
ある好適な態様では、ある一つのmRNA集団中で遺伝子発現パターンを同定
する方法が提供される。当該方法には、二本鎖cDNAを、mRNA集団から、
オリゴdT配列の5‘端でNotI切断部位に連結したオリゴdT配列を含むプライマを
用いて作製するステップと、この二本鎖cDNAをNotI及びMboIで切断してcD
NAインサートを得るステップとが含まれる。このcDNA断片をクローニング
ベクタの挿入部位に挿入してDNAコンストラクトを得るが、このクローニング
ベクタはさらに、(i)このDNAコンストラクトをBsgIで消化すると、このD
NAコンストラクトがcDNAインサート内の一部位で切断されるよう、挿入部
位に向かって5’側にあるBsgI認識配列と、BsgI認識配列の5‘側に位置するFo
kI認識配列とを含む。cDNAインサートを含んだDNAコンストラクトは適し
たホストで増幅されてから単離される。単離後、増幅されたDNAコンストラク
トをBsgI及びFokIで消化して標識を得る。この標識をT4DNAポリメラーゼで
処理して平滑末端を得た後、DNAリガーゼを用いて結紮して、少なくとも約3
0から60個の標識から成る結紮された標識アレイを得る。結紮された標識アレ
イをシークエンシング・ベクタに挿入して配列決定する。結紮された標識アレイ
内の個々の標識の配列を公知の遺伝子配列に比較することで、当該mRNA集団
中の遺伝子発現パターンを同定する。
好適な態様では、標識は5‘及び3’に平滑末端を有する。好ましくは、制限
酵素消化後に、標識を例えばT4DNAポリメラーゼなどのDNAポリメラーゼ
で処理して平滑な5‘及び3’末端を有する標識を得る。標識の配列決定を容易
にするには、標識が相互にDNAリガーゼを用いて結紮されていることが好まし
い。本発明は、mRNA集団中の遺伝子発現パターンを同定するのに用いられる
、例えば本発明の方法に利用される、DNAベクタを提供する。好ましくは、当
該DNAベクタが、挿入部位と、この挿入部位の5‘側に位置する制限エンドヌ
クレアーゼ認識配列、配列Aであって、ただしこのとき、配列Aを認識するこの
制限エンドヌクレアーゼが、配列Aの3’側に位置する切断部位、配列Bを有す
る、配列Aと、この配列Aの5‘側にある又は重複する、制限エンドヌクレアー
ゼ認識配列、配列Cとを含むとよい。配列Aは、ここに説明した本方法で用いら
れる第二制限エンドヌクレアーゼ認識配列と同じでもよい。配列Cは、ここに説
明された本方法で用いられる第三制限エンドヌクレアーゼ認識配列と同じでもよ
い。ベクタの挿入部位は好ましくは、cDNAインサートの両端と適合性がある
ものであるとよい。これら配列は、さらに、cDNAインサートを得るのに用い
たプライミング及び第一制限エンドヌクレアーゼと適合性のある両端を有する制
限エンドヌクレアーゼにより認識されてもよいが、その場合はこれらエンドヌク
レアーゼを使用し、cDNAインサートを挿入した場合にも第一制限エンドヌク
レアーゼ部位にある切断部位の一体性が維持されることが条件である。両端のう
ち一方だけに適合性があるのであれば、両端のうちに一方で平滑末端結紮を用い
てcDNAインサートを挿入することができる。このように、好適な態様では、
挿入部位は二つの末端を有するが、このとき第一の末端は第一挿入制限エンドヌ
クレアーゼ切断部位に適合性があり、第二の末端は第二挿入制限エンドヌクレア
ーゼ切断部位に適合性があるものである。第一挿入制限エンドヌクレアーゼ切断
部位は好ましくは第一制限エンドヌクレアーゼ切断部位と適合性があるとよい。
第二挿入制限エンドヌクレアーゼ切断部位は好ましくは第二制限ヌクレアーゼ切
断部位に適合性があるとよい。ある一つの好適な実施例では、ベクタは、切断部
位である配列Bが配列Aの3’側に来るよう、II型制限エンドヌクレアーゼによ
り認識される配列Aと、配列Aの5‘側にある又はこれに重複する制限エンドヌ
クレアーゼ認識配列である配列Cと、配列Aの3’側及
び配列Bの5‘側に位置する制限エンドヌクレアーゼ切断部位である配列Dであ
って、6個未満の塩基を認識する制限エンドヌクレアーゼにより切断することの
可能な配列Dと、7個以上の塩基を認識する制限エンドヌクレアーゼで切断可能
な制限エンドヌクレアーゼ切断部位である配列Eとを含む。最も好ましくは、D
NAベクタが、図1に示されたベクタであるとよい。別の好適な実施例では、本
発明は、挿入部位にDNAインサートを含む、ここに説かれたDNAベクタを含
むDNAコンストラクトを提供するものである。ある一つの実施例では、本発明
のDNAベクタは、さらに、配列BがcDNAインサート内にあるような、挿入
部位に挿入されたcDNAインサートを含む。
別の実施例では、本発明は遺伝子を単離する方法を提供するものである。当該
方法は、二本鎖cDNAを第一制限エンドヌクレアーゼで切断してcDNAイン
サートを得るステップを含む。次にこのcDNAインサートをクローニングベク
タの挿入部位に挿入してDNAコンストラクトを得る。クローニングベクタは、
典型的には、そのDNAコンストラクトを第二制限エンドヌクレアーゼで消化す
ると、このDNAコンストラクトがcDNAインサート内の部位で切断されるよ
う、挿入部位の5‘側にある第二制限エンドヌクレアーゼ認識配列と、この第二
制限エンドヌクレアーゼ認識配列の5’側にある又はこれに重複する第三制限エ
ンドヌクレアーゼ認識配列とを含む。DNAコンストラクトを増幅し、単離した
後、第二及び第三制限エンドヌクレアーゼで消化して標識を得る。単離しようと
する遺伝子の配列の一部分を含んだ標識を同定し、この遺伝子を単離する。好適
な態様では、単離しようとする遺伝子は、標識のヌクレオチド配列と、何らかの
ソース、例えばGenBankなどの配列データベースなどから得ることのできる既知
のヌクレオチド配列とを比較することにより判定される。
本発明の別の態様では、ある一つのmRNA集団中で遺伝子発現パターンを同
定する方法が提供される。当該方法は、二本鎖cDNAを、mRNA集団から、
プライマ、例えば、「プライミング」制限エンドヌクレアーゼの切断部位に、そ
のオリゴdT配列の5‘端で連結されたオリゴdT配列など、を用いて作製するステ
ップと、この二本鎖cDNAを、プライマ内ではなくcDNA配列内の一部位で
切断する第一制限エンドヌクレアーゼで切断することでcDNAインサートを得
るステップ
とを含む。このcDNAインサートをクローニング・ベクタの挿入部位に挿入し
てDNAコンストラクトを得るが、このクローニング・ベクタには、このDNA
コンストラクトを第二制限エンドヌクレアーゼで消化するとこのDNAコンスト
ラクトが該cDNAインサート内の部位で切断されるよう、その挿入部位の5’
側に第二制限エンドヌクレアーゼ認識配列が含まれている。DNAコンストラク
トを、例えば適したホスト細胞、例えばE.coli、内で増幅し、単離した後、第二
制限エンドヌクレアーゼで消化して、3‘端上側張出し配列を有する直鎖化した
DNA分子を得る。この直鎖化したDNA分子をアダプタ配列にアニールする。
アダプタ配列には、第一制限エンドヌクレアーゼ認識配列と、この直鎖化したD
NA分子の3’端の上側張出し配列に適合性のある3‘端下側張出し配列とを含
む二本鎖オリゴデオキシヌクレオチド配列が含まれる。このアダプタをこの直鎖
化したDNA分子にアニールすると、第一制限エンドヌクレアーゼ制限部位を両
側に持つ結紮産物が生まれる。この結紮産物を第一制限エンドヌクレアーゼで消
化して標識を得る。この標識のヌクレオチド配列を得て、当該mRNA集団中の
遺伝子発現パターンを同定する。この第二の実施例の好適な態様の概要を図3に
示す。
好適な態様では、標識のヌクレオチド配列は、この標識を結紮することで、少
なくとも約10個の標識から成る結紮された標識アレイを得て、この結紮された
標識アレイをシークエンシング・ベクタ内に挿入し、この結紮された標識アレイ
の配列決定を行なうことにより、得られる。好適な実施例においては、アダプタ
は約10から約15塩基対長であり、例えば2個の塩基対長の変性配列を、3‘
端の下側張出し部として含み、直鎖化したDNA分子が、例えば2個の塩基対長
の変性配列を3’端の上側張出し部として含む。
本発明はさらに、ある一つのmRNA集団中で遺伝子発現パターンを同定する
方法を提供するものである。当該方法には、第一生体試料から得られたmRNA
の第一集団から、二本鎖cDNAの集団を、ビオチンなどの親和捕獲ラベルに共
有結合により連結させたオリゴdT配列などのプライマを用いて作製するステップ
と、この二本鎖cDNAを、プライマ内ではなくcDNA内の一部位で切断する
パンクチュエーティング(原語:punctuating)制限エンドヌクレアーゼで切断
することで、親和捕獲ラベルに連結したcDNAインサートの集団を得るステッ
プとが含まれ
る。このcDNAインサートは、この親和捕獲ラベルを親和捕獲器、例えばスト
レプトアビジンに共有結合させた磁気ビーズ、などで捕獲することで、捕獲され
、こうしてcDNAインサートの集団を得る。次に、捕獲されたcDNAインサ
ートを、第一ベクタ挿入部位に適合性のある5‘端上側張出し配列と、第二制限
エンドヌクレアーゼ認識配列と、パンクチュエーティング制限エンドヌクレアー
ゼ部位に適合性のある5’端下側配列とを含む二本鎖オリゴデオキシヌクレオチ
ド配列を含む第一アダプタにアニール及び結紮し、こうして第一結紮産物を得る
。この第一結紮産物を、例えばII型制限エンドヌクレアーゼなどの第二制限エン
ドヌクレアーゼで切断すると、この結紮産物が親和捕獲ラベルから分離されて解
放されるが、このとき、この解放された結紮産物は、cDNA配列に隣り合った
パンクチュエーティングエンドヌクレアーゼ制限部位と3‘端上側張出し配列と
を含むこととなる。この解放された結紮産物を、第二ベクタの挿入部位に適合性
のある5’端の下側張出し配列と、解放された結紮産物の3‘端上側張出し配列
に適合性のある3’端下側張出し配列とを含む二本鎖オリゴデオキシヌクレオチ
ド配列を含む第二アダプタにアニール及び結紮する。このアニーリング・ステッ
プの結果、第一ベクタ挿入部位に適合性のある5‘端配列と、パンクチュエーテ
ィング・エンドヌクレアーゼ制限部位を両側に持つcDNA配列と、第二ベクタ
挿入部位に適合性のある3’端配列とを含む第二結紮産物が生まれる。次にこの
第二結紮産物を、クローニングベクタの第一ベクタ挿入部位と第二ベクタ挿入部
位とに挿入して、DNAコンストラクトを得る。DNAコンストラクトを、例え
ば適したホスト細胞、例えばE.coli内で増幅し、単離し、パンクチュエーティン
グ制限エンドヌクレアーゼで消化して標識を得る。この標識のヌクレオチド配列
を得ることで、第一生体試料中の遺伝子発現を同定する。
好適な態様では、標識のヌクレオチド配列は、これら標識を結紮して、少なく
とも約10個の標識、より好ましくは少なくとも約40個の標識から成る結紮さ
れた標識アレイであって、この標識アレイうちの各標識はパンクチュエーティン
グ制限エンドヌクレアーゼ認識部位に隣り合うものである、標識アレイを得るス
テップと、この結紮された標識アレイをシークエンシング・ベクタに挿入するス
テップと、この結紮された標識アレイを配列決定するステップと、この標識アレ
イの配列を、既
知の遺伝子配列に比較するステップとにより得られる。好ましくは、当該方法が
、さらに標識にハイブリダイズする遺伝子配列を単離するステップを含む。ある
好適な実施例では、第二制限エンドヌクレアーゼ切断部位は、その認識配列の3
‘側の約16ヌクレオチドに位置している。ある一つの実施例では、第一アダプ
タは、パンクチュエーティング制限エンドヌクレアーゼ部位に適合性のある配列
の5’端側に位置した第二制限エンドヌクレアーゼ認識部位を含む。別の実施例
では、解放された結紮産物は、3‘端に2個のヌクレオチド長の上側張出し部を
含み、第二アダプタが、2個のヌクレオチド分の変性配列を含む3’端端下側張
出し部を含む。別の実施例では、第一ベクタ挿入部位に適合性のある5‘端上側
張出し配列が、少なくとも8個の塩基から成る制限エンドヌクレアーゼ認識配列
、例えばNotI認識配列を含み、第二ベクタ挿入部位に適合性のある5’端下側張
出し配列がEcoRI認識配列である。さらに別の実施例では、第一ベクタ挿入部位
に適合性のある5‘端の上側張出し配列がEcoRI認識配列を含み、第二ベクタ挿
入部位に適合性のある5’端の下側張出し配列がNotI認識配列である。ある一つ
の好適な実施例では、第一アダプタが約15から約25個の塩基対長であり、第
二アダプタが、例えば2個の塩基対長の変性配列を5‘端の下側張出しインサー
ト空間として含む。好ましくは、第一アダプタの第二制限エンドヌクレアーゼ認
識部位が、パンクチュエーティング・エンドヌクレアーゼ制限部位に適合性のあ
る配列の5’側に位置しているとよい。別の実施例では、解放された結紮産物を
、各々が異なる変性配列を有する16個の別々のアダプタの混合物にアニールす
る。好ましくは、解放された結紮産物の3‘端の上側張出し部が2個の塩基対長
であるとよい。好適な実施例では、結紮された標識アレイが、少なくとも約30
個の標識、好ましくは少なくとも約50個の標識、より好ましくは少なくとも約
100個の標識、そして最も好ましくは少なくとも約200個の標識を含む。あ
る一つの実施例では、当該クローニングベクタには、パンクチュエーティング・
エンドヌクレアーゼ制限部位がない。
ある好適な実施例では、当該方法はさらに、ある一つの標識のヌクレオチド配
列を含むオリゴヌクレオチド・プローブを作製するステップと、cDNAライブ
ラリをこのオリゴヌクレオチド・プローブでプローブして、この標識を含む遺伝
子の発現の頻度を判定するステップとを含む。別の実施例では、当該方法はさら
に、第二
生体試料から得たmRNAの第二集団を用いて該第三実施例の方法を繰り返すス
テップと、第一mRNA集団の遺伝子発現と第二mRNA集団の遺伝子発現とを
比較することで第一生体試料と第二生体試料の間の遺伝子発現の差を判定するス
テップとを含む。好ましくは、当該方法が、さらに、第一mRNA集団で第一レ
ベルで発現しており、かつ第二mRNA集団で第二レベルで発現している遺伝子
を同定するステップと、この遺伝子をcDNAライブラリから単離するステップ
とを含む。ある好適な実施例では、第一生体試料は正常な非罹病生物を由来とす
る細胞又は組織であり、第二生体試料は疾患又は異常を有する生物を由来とする
細胞又は組織である。別の好適な実施例では、第一生体試料は発生の第一段階に
ある生物を由来とする細胞又は組織であり、第二生体試料は発生の第二段階にあ
る生物を由来とする細胞又は組織である。
ある好適な態様では、ある一つのmRNA集団中で遺伝子発現パターンを同定
する方法が提供される。当該方法は、第一生体試料を由来とする第一mRNA集
団から、二本鎖cDNAの集団を、3‘端でビオチン・ラベルに共有結合した5
’オリゴdT配列を含むプライマを用いて作製するステップと、この二本鎖cDN
AをSau3A制限エンドヌクレアーゼで切断して、ビオチン・ラベルに連結したc
DNAインサート集団を得るステップとを含む。ストレプトアビジンに共有結合
させた磁気ビーズでビオチン・ラベルを捕獲することでこのcDNAインサート
を捕獲し、捕獲されたcDNAインサートの一集団を得る。次に捕獲されたcD
NAインサートを、NotI挿入部位に適合性のある5‘端上側張出し配列と、BsgI
制限エンドヌクレアーゼ認識配列と、Sau3A制限部位に適合性のある5’端下側
張出し配列とを含む二本鎖オリゴデオキシヌクレオチド配列を含む第一アダプタ
にアニール及び結紮することで、第一結紮産物を得る。この第一結紮産物をBsgI
で切断すると、この結紮産物がビオチン・ラベルから分離して解放されるが、こ
の解放された結紮産物は、cDNA配列に隣り合ったSau3A制限部位と3‘端上
側張出し配列とを含むこととなる。この解放された結紮産物を、EcoRI挿入部位
に適合性のある5’端下側配列と、解放された結紮産物の3‘端上側張出し配列
に適合性のある3’端下側張出し変性配列とを含む二本鎖オリゴデオキシヌクレ
オチド配列を含む第二アダプタにアニール及び結紮する。このアニーリングステ
ップの結果、NotI挿入部位
に適合性のある5‘側配列と、Sau3A制限部位を両側に持つcDNA配列と、Eco
RI挿入部位に適合性のある3’側配列とを含む第二結紮産物が生まれる。次に、
この第二結紮産物をNotI挿入部位及びEcoRI挿入部位でクローニング・ベクタに
挿入してDNAコンストラクトを得る。このDNAコンストラクトを、例えばE.
coliなどの適したホスト細胞で増幅し、単離し、Sau3Aで消化して標識を得るが
、これらの標識を次に結紮して、約30から60個の標識から成る結紮された標
識アレイを得る。これら標識のヌクレオチド配列を得ることで、第一生体試料中
の遺伝子発現を同定する。
関連する態様では、本発明は、本発明の方法での利用など、ある一つのmRN
A集団中で遺伝子発現パターンを同定するのに用いるDNAベクタを提供するも
のである。このDNAベクタには挿入部位が含まれるがパンクチュエーティング
・エンドヌクレアーゼ制限部位が欠けており、好ましくはさらに、Sau3A制限部
位など、少なくとも一つのパンクチュエーティング・エンドヌクレアーゼ制限部
位を含むcDNAインサートが含まれるとよい。好ましくは、挿入部位が二つの
末端を持ち、このときの第一の末端が第一挿入制限エンドヌクレアーゼ切断部位
と適合性があり、第二の末端が第二挿入制限エンドヌクレアーゼ切断部位と適合
性があるとよい。好ましくは、第一挿入制限エンドヌクレアーゼ切断部位が少な
くとも8個の塩基を含むとよく、例えばこの切断部位がNotI切断部位であるとよ
く、また第二制限エンドヌクレアーゼ切断部位が、少なくとも8個の塩基を含む
とよく、例えばこの切断部位がEcoRI切断部位であるとよい。その他の好適な実
施例では、本発明は、例えばここで説明するTALESTBベクタなどのDNAベクタ
、さらにNotI及びEcoRI挿入部位の間のDNAインサートを含むDNAコンスト
ラクトを提供するものである。
本発明はある一つのmRNA集団中の遺伝子の発現頻度を判定する方法を提供
する。当該方法は、本発明のcDNAインサートを含むDNAコンストラクトを
作製してcDNAライブラリを得るステップを含む。当該方法はさらに、本発明
の方法に基づいて同定された標識配列を含むオリゴヌクレオチド・プローブを作
製するステップと、cDNAライブラリを、標識配列を含んだこのオリゴヌクレ
オチド・プローブでプローブすることで、この標識配列を含む遺伝子の発現頻度
を判定する
ステップとを含む。その他の実施例には、第一mRNA集団において第二mRN
A集団に比較して異なるレベルで発現している遺伝子を単離する方法が含まれる
。これらの方法には、本発明に基づき、第一mRNA集団から遺伝子発現パター
ンを同定するステップと、第二の別のmRNA集団から遺伝子発現パターンを同
定するステップとが含まれる。このようにして得た遺伝子発現パターンを比較す
ることで、mRNA集団同士の間で遺伝子発現の差を検出する。第一mRNA集
団において第二mRNA集団に比較して異なるレベルで発現している遺伝子を同
定かつ単離してもよい。別の実施例は、二つ又はそれ以上のmRNA集団の間で
の遺伝子発現の差を検出する方法である。当該方法には、本発明の方法に基づき
、第一mRNA集団から、そして少なくとも一つの別のmRNA集団から、遺伝
子発現パターンを同定するステップが含まれる。このようにして得られた遺伝子
発現パターンを比較することで、mRNA集団間の遺伝子発現の差を検出する。
好適な態様では、第一mRNA集団が正常細胞又は組織から得られ、別のmRN
A集団は疾患又は異常を有する目的生物から得られた細胞又は組織から得られる
。別の好適な態様では、mRNA集団は異なる発生段階にある細胞又は組織から
得られる。さらに別の好適な態様では、mRNA集団は、同じ目的生物の別々の
組織又は臓器を由来とする細胞から得られるか、又は、当該mRNA集団が異な
る目的生物から得られる。また別の実施例では、目的生物における疾患の存在を
検出する方法が提供される。これらの方法は、本発明に基づき、疾患又は異常を
有する目的生物の細胞又は組織とは異なる発現を正常細胞又は組織でしている遺
伝子を同定するステップと、その遺伝子の標識配列を単離するステップとを含む
。第一目的生物から得られたmRNA集団と、第二正常又は罹病目的生物から得
られたmRNA集団とを、この標識配列でプローブすれば、その遺伝子の発現レ
ベルを判定することができる。第一目的生物における遺伝子の発現レベルを、第
二目的生物におけるその遺伝子の発現レベルに比較して、第一目的生物における
疾患の存在を検出する。さらに別の態様では、薬物の細胞又は組織に対する作用
をスクリーニングする方法が提供される。本発明の当該方法を用いると、薬物で
処置した細胞及び組織と、薬物で処置していない細胞及び組織とで、mRNAの
遺伝子発現パターンを比較することができる。細胞又は組織は正常な目的生物か
ら得てもよく、または薬物の副作用を調べてもよい。あるいはそ
の代わりに、細胞又は組織を特定の疾患に罹病した目的生物から得て、この薬物
が罹病細胞中の遺伝子発現プロフィールを変化させることができるかどうかを判
定してもよい。
もう一つの好適な態様では、本発明は異なった発現をしている遺伝子を単離す
る方法を提供するものである。当該方法には、本発明の方法に基づき、第一細胞
種又は組織と第二細胞種又は組織とから得られた結紮された標識アレイのヌクレ
オチド配列を得るステップと、この第一及び第二細胞種又は組織の個々の標識配
列の発現頻度を比較するステップとが含まれる。第二細胞種又は組織に比較して
異なる発現をしている第一細胞種又は組織中の標識配列を同定すると、異なる発
現をしている標識配列に対応する遺伝子を同定することができる。好適な態様で
は、異なる発現をした標識配列についてRNA又はDNA配列のデータベースを
検索することにより、当該遺伝子が同定される。あるいはその代わりに、異なる
発現をした標識配列を含むプローブでcDNAライブラリをプローブすることに
より、当該遺伝子が同定される。
さらに別の実施例では、本発明は、例えばmRNA集団中で遺伝子発現パター
ンを同定する、又は異なる発現をしている遺伝子を単離するなど、ここで説明し
た方法に用いるキットを提供するものである。ある好適な実施例では、mRNA
集団中で遺伝子発現パターンを同定するのに用いるキットには、DNAベクタ、
例えばここで説明するTALESTベクタと、約7から40個のT残基を含むプライマ
と、配列Aを認識すると共に配列BでDNAを切断する第一制限エンドヌクレア
ーゼと、配列Cを認識する第二制限エンドヌクレアーゼとが含まれる。別の実施
例では、ある一つのmRNA集団中で遺伝子発現パターンを同定するのに用いる
キットには、ここで説明するTALESTBベクタなど、例えばNotI挿入部位、EcoRI挿
入部位、及び一つ又はそれより少ないSau3A制限エンドヌクレアーゼ認識部位を
含むDNAベクタなどのDNAベクタと、約7から40個のT残基を含むプライ
マと、第二制限エンドヌクレアーゼ、例えば・型制限エンドヌクレアーゼ、の認
識配列、例えばNotI挿入部位などの第一ベクタの挿入部位に適合性のある5‘端
上側張出し配列、及びSau3A制限部位などのパンクチュエーティング・エンドヌ
クレアーゼ制限部位に適合性のある5’端下側張出し配列、を含む二本鎖オリゴ
デオキシヌクレオチド配列
を含む第一アダプタと、変性配列などの3‘端下側張出し配列、及びEcoRI挿入
部位などの第二ベクタ挿入部位に適合性のある5’端下側張出し配列を含む二本
鎖オリゴデオキシヌクレオチド配列を含む第二アダプタとが含まれる。図面の簡単な説明
図1は、本発明の第一(TALEST)実施例に用いることのできるTALESTベクタを
示す。
図2A及び2Bは、本発明の第一(TALEST)実施例の概略図を示す。
図3は、本発明の第二(TALESTA)実施例の概略図を示す。
図4は、TALEST法の概略図を示す。
図5は、本発明の第三(TALESTB)実施例の概略図を示す。
図6は、本発明のもう一つの実施例の概略図を示す。発明の詳細な説明
本発明は、mRNA集団中で遺伝子発現パターンを同定するための新規な方法
を提供するものである。当該方法は、目的生物の細胞又は組織を含めた様々な細
胞又は組織間で示差的遺伝子発現を判定するのに有用である。本発明はさらに、
mRNA集団中で遺伝子発現の頻度を判定する方法を提供することで、多種の細
胞又は組織間で遺伝子発現頻度を比較する方法を提供するものでもある。本発明
はさらに、本発明の方法に基づいて同定された標識配列に対応する遺伝子を単離
する方法も提供する。さらに、本発明に基づいて同定された配列を用いて疾患の
存在を診断してもよい。
ある特定の細胞系譜の遺伝子発現パターンをよく理解するには、どの遺伝子が
その細胞で発現するかだけでなく、それらが発現する頻度又は割合を知ることが
必要である。本発明の方法は、細胞及び組織における遺伝子発現パターンを同定
する新規な方法と、アッセイの再現可能性に限界を与える場合のあるPCR又は
その他の方法を利用する必要のない、容易かつ再現可能な態様で細胞及び組織内
の遺伝子発現の頻度を判定する方法とを提供するものである。さらに、本発明の
方法は、膨大な種類のmRNA配列に対応する数多くのオリゴヌクレオチド・プ
ライマをその研
究者が合成できるかといった制限を受けない。本発明の方法に基づいてRNA配
列標識を得ることで、遺伝子発現の頻度を、単にその標識が作製される過程で作
製されたcDNAライブラリ中のcDNA発現頻度を分析することにより、判定
することができる。
本発明の少なくとも三つの様々な実施例を以下の項で詳細に説明することとす
る。
TALESTの実施例
第一又はTALEST(tandem arrayed ligation of expressed sequence tags)の
実施例には、ある一つのmRNA集団中で遺伝子発現パターンを同定する方法が
含まれる。当該方法は、二本鎖cDNAをmRNA集団からプライマを用いて作
製するステップと、この二本鎖cDNAを、このプライマ内ではなくcDNA配
列内の部位で切断する第一制限エンドヌクレアーゼで切断することで、cDNA
インサートの集団を得るステップとを含む。cDNAインサートを、クローニン
グ・ベクタの挿入部位に挿入してDNAコンストラクトを得るが、このときのク
ローニング・ベクタには、このDNAコンストラクトを第二制限エンドヌクレア
ーゼで消化すると、このDNAコンストラクトが該cDNAインサート内の部位
で切断されるよう、この挿入部位の5‘側にある第二制限エンドヌクレアーゼ認
識配列と、第二制限エンドヌクレアーゼ認識配列の5’側にある又はこれに重複
する第三制限エンドヌクレアーゼ認識配列とが含まれる。DNAコンストラクト
を増幅し、単離し、第二及び第三制限エンドヌクレアーゼで消化して標識を得る
。この標識のヌクレオチド配列を得ることで、当該mRNA集団における遺伝子
発現パターンを同定する。
ここで、「遺伝子」とは、ヒト染色体など、染色体中に見られる一単位の遺伝
物質を言う。各遺伝子は、直鎖状のデオキシリボヌクレオチドから構成されるが
、このデオキシリボヌクレオチドはこの鎖を形成するヌクレオチドの配列により
呼ぶことができる。このように、「配列」は、当該鎖を成すヌクレオチドの順の
リストと、そのヌクレオチドの配列を有する鎖の両方を指すべく用いられる。(
「配列」という術語は同じようにリボヌクレオチドから成る直鎖であるRNA鎖
に言及す
る場合にも用いられる。)遺伝子には、RNA分子に転写されることのできる配
列である、調節及び制御配列が含まれ、また未知の機能を持った配列が含まれて
いてもよい。RNA産物(DNAからの転写の産物)のなかには、ポリペプチド
に翻訳される複数のリボヌクレオチド配列(又は一つの配列)や、翻訳されない
リボヌクレオチド配列を当初は含んでいるメッセンジャーRNA(mRNA)が
ある。翻訳されない配列には、制御配列、イントロン、及び、未知の機能を持つ
配列がある。同じ遺伝子についても、別々の個人間、又は正常細胞とがん細胞と
の間で、その遺伝子のアイデンティティには変わりはないまま、そのヌクレオチ
ド配列に僅かな相違がある場合があることを、認識されねばならない。
ここでは、「遺伝子発現パターン」という術語は、RNA分子を形成すべく転
写又は「発現」する特定の組織又は細胞種の一組の遺伝子を意味する。特定の細
胞系又は組織でどの遺伝子が発現するかは、組織又は細胞種、その細胞、組織、
又は目的生物の発生上の段階、及び、その細胞が正常か、又はがん細胞などの形
質転換した細胞か、などの因子に左右されることであろう。例えば、遺伝子は、
特定の目的生物の発生上の胚又は胎児段階で発現し、その目的生物が成熟するに
つれて発現しなくなる場合がある。あるいは、遺伝子が成人の肝臓組織で発現す
るが大脳組織では発現しない場合がある。発現に影響を与える因子のこのリスト
及び例はすべてではなく、単に実例を挙げることを目的としたものである。
好ましくは、cDNA合成を開始させるのに用いるプライマが、オリゴdT配列
の5‘端で「プライミング」制限エンドヌクレアーゼの切断部位に連結されたオ
リゴdT配列から構成されるとよい。このオリゴdT配列は、好ましくは、約7から
40個のT残基長であるとよく、より好ましくはこのオリゴdT配列が約15から
30個のT残基長であるとよい。最も好ましくは、オリゴdT配列が約19個のT
残基長であるとよい。本発明の方法を用いて同定できるmRNAの数を最大にす
るには、プライミング制限エンドヌクレアーゼは数少ない配列を認識しなければ
ならない。このように、好適なプライミング制限エンドヌクレアーゼは、7個異
常の塩基から成る配列を認識するとよいが、当業者には公知である。プライミン
グ制限エンドヌクレアーゼは、好ましくは、8個の塩基のパリンドローム配列を
認識するものであるとよい。より好ましくは、プライミング制限エンドヌクレア
ーゼが、少なく
とも一つのCGジヌクレオチドを含む一配列を認識するとよい。最も好ましくは、
プライミング制限エンドヌクレアーゼがNotIであるとよい。
ここでは、「第一制限エンドヌクレアーゼ」という術語は、DNA中で6個未満
の塩基対から成る一配列を認識する制限エンドヌクレアーゼを言うが、好ましく
は、DNA中で4個の塩基対の配列を認識するとよい。第一制限エンドヌクレア
ーゼの例には、MboI,Sau3A,MspI,AluI,BstUI,DpnII,HaeIII,HhaI,HinPI
,MseI,NlaIII,RmaI,及びTaqIがあるが、これらに限定されることはない。
ここでは、「cDNAインサート」という術語は、ベクタに挿入することの可
能なcDNA配列を言う。典型的には、cDNAインサートは約250、300
又は350塩基対長である。好ましくは、cDNAインサートがpoly Aの尾を含
むとよい。
ここでは、「ベクタ」は、その物質のDNAに組み込むことで、本発明のDN
Aをその物質に挿入することのできる物質を意味する。このように、ベクタのク
ラスの例は、プラスミド、コスミド、及びウィルス(例えばバクテリオファージ
)としてもよい。典型的には、当該物質は、本発明のDNAをホスト細胞(例え
ばバクテリウム、酵母、より高等な真核細胞)中に送り込むために用いられる。
ベクタは、所望のインサートの大きさや、ベクタの提案される用途に基づいて選
択してよい。(例えばcDNAライブラリで)特定のDNA配列を保存したり、
又は特定のDNA配列の多数のコピーを作製するにはクローニング・ベクタを利
用することができる。RNAの転写又は、翻訳してコードされたポリペプチドを
産生させるには、発現ベクタを利用できる。細胞のトランスフェクション後、イ
ンサートDNAを含むそのベクタDNAの全部又は一部をホスト細胞の染色体に
組み込んでも、又はそのベクタを染色体外のままにしておいてもよい。
当業者であれば、cDNAインサート又は断片を含むベクタ(即ちDNAコン
ストラクト)を、当業において公知の何らかの方法を用いて増幅することができ
る。好ましくは、当該コンストラクトを、例えば、しかしこれに限らず、E.coli
などのホスト細胞内で、まずE.coliを当該コンストラクトで形質転換し、この形
質転換させた細胞を成長させ、そして成長した細胞から、この増幅されたベクタ
を単離するといった手順により増幅する。
ここで用いられる場合の「第二制限エンドヌクレアーゼ」という術語は、それ
自体の認識配列の下流又は3‘側で切断する制限エンドヌクレアーゼを言う。好
適な第二制限エンドヌクレアーゼは・型制限エンドヌクレアーゼである。本発明
の方法に利用可能なII型制限エンドヌクレアーゼの例には、BsgI,FokI,AccBSI
,AccIII,AciI,AclWI,AlwI,Alw26I,AlwXI,Asp26HI,Asp27HI,Asp35HI,Asp36HI,Asp
40HI,Asp50HI,AsuHPI,BacI,BbsI,BbvI,BbvII,Bbv16II,Bce83I,BcefI,BcgI,Bco5I
,Bco116I BcoKI,BinI,Bli736I,BpiI,BpmI,Bpu10I,BpuAI,Bsal,BsaMI,Bsc9II,Bsc
AI,BscCI,BseII,Bsc3DI,BscNI,BscRI,BscZI,BsiI,BsmI,BsmAI,BsmBI,BsmFI,Bsp2
4I,Bsp423I,BspBS3II,BspIS4I,BspKT5I,BspLU11III,BspMI,BspPI,BspST5I,BspTS
514I,BsrI,BsrBI,BsrDI,BsrSI,BssSI,Bst11I,Bst7lI,Bst2BI,BstBS32I,BstD102I
,BstF5I,BstTS5I,Bsu6I,CjeI,CjePI,Eam1104I,EarI,Eco31I,Eco57I,EcoA4I,EcoO
44I,Esp3I,FauI,GdiII,GsuI,HgaI,HphI,Ksp632I,MboII,MlyI,MmeI,MnI,Mval269I
,PhaI,PieI,RlcAI,SapI,SfaNI,SimI,StsI,TaqII,TspII,TspRI,Tth111II,及びVp
aK32Iがある。
「第三制限エンドヌクレアーゼ」とは、ここで用いられる場合、それ自体の認
識配列の3‘側で切断する制限エンドヌクレアーゼを言う。好適な第三制限エン
ドヌクレアーゼはII型制限エンドヌクレアーゼである。
ここで用いられる「単離する」という術語は、DNAコンストラクトを、増幅
に用いた試薬から分離させる方法を言う。好ましくは、当該DNAコンストラク
トが、増幅緩衝液、プライマ、細胞物質、培養媒質、又はゲル材料を概ね含まな
いとよい。
「標識」という術語は、あるcDNA配列を特徴的に定義すべく充分な数の塩
基対を含んだヌクレオチド配列を言う。典型的には、ある標識がある一つの真核
生物のcDNA配列を特徴的に表すには、その標識は少なくとも約8個の塩基対
長を含む。ある好適な実施例では、標識は少なくとも約10、12又は14塩基
対長である。本発明の標識が得られたら、それらを結紮して標識アレイ、例えば
少なくとも二つの標識を連ねて結紮したもの、を作製することが好ましい。好ま
しくは、標識アレイが少なくとも10個、より好ましくは少なくとも20個、さ
らにより好ましくは少なくとも30個、またさらに好ましくは少なくとも40個
、そしてさらに好ましくは少なくとも50個又はそれ以上の、例えば100個、
150個、200個
又はそれ以上、の標識を含むとよい。標識アレイ中の標識を配列決定するには、
アレイをシークエンシング・ベクタに挿入し、配列決定することができる。
本発明はさらに、TALEST実施例で用いるDNAベクタ及びキットを提供する。
好適なDNAベクタには、挿入部位と、この挿入部位の5‘側に位置した制限エ
ンドヌクレアーゼ認識配列(配列A)であって、この制限エンドヌクレアーゼが
配列Aの3’側に位置する切断部位(配列B)を有する、制限エンドヌクレアー
ゼ認識配列(配列A)と、この配列Aの5’側にある又はこれに重複する制限エ
ンドヌクレアーゼ認識配列(配列C)とを含む。配列Aは、ここで説明した本発
明の方法に用いられる第二制限エンドヌクレアーゼ認識配列と同じでもよい。配
列Cは、ここで説明した本方法で用いられる第三制限エンドヌクレアーゼ認識配
列と同じでもよい。mRNA集団中で遺伝子発現パターンを同定するのに用いる
好適なキットは、ここで説明されたTALESTベクタなどのDNAベクタと、約7個
から40個のT残基を含むプライマと、配列Aを認識すると共に配列BでDNA
を切断する第一制限エンドヌクレアーゼと、配列Cを認識する第二制限エンドヌ
クレアーゼとを含む。
本発明の第一又はTALEST実施例の概観を図2及び4に示す。図2及び4に示し
、ここに説明した概観は特定の制限エンドヌクレアーゼ及び規定されたベクタを
用いて本発明の詳細な説明を行なうものであるが、当業者であれば、その他の制
限エンドヌクレアーゼも選択可能であることはよく知られ、また、その他の分子
生物学的方法、例えばSambrook J.et al.,“Molecular Cloning:A laboratory M
anual",Second Ed.(Coldspring Harbor Laboratory Press,Cold Spring Harbo
r,New York,1989,Volume 1,Chapter 7)、を用いても、本発明は実施可能であ
り、本発明はここに提供された詳細な実施例に限定されない。
まず、ポリアデニル化mRNAを標準的な手法を用いて当該の細胞集団から単
離する。次に、希少切断酵素部位(例えばNotI)をその5‘端に有するオリゴdT
配列でこのmRNAをプライミングすることにより、逆転写酵素を用いてこのm
RNAをcDNAに変換する。cDNA合成を開始させるのに用いることのでき
る適したプライマの配列は、NotIエンドヌクレアーゼ認識配列に連結したオリゴ
dT配列を含む5'TTTTTTTTTTTTTTTTTTTCGCCGGGCGCATG 3'(配列同定番号NO:3)であ
る。最初の鎖のcDNAをRNAase H及びDNAポリメラーゼ1を用いて二本鎖cD
NAに変換する。次にこの二本鎖cDNAを二つのことなる制限酵素(例えばNo
tI及びMboI)で消化する。二つの制限酵素を用いることにより、このcDNAを
、図1に示すTALESTベクタに直接クローンすることができる。
TALESTベクタは、NotI認識部位と、BamHIエンドヌクレアーゼで切断されたと
きに、MboIエンドヌクレアーゼで消化させたDNAに適合性のある端部を生じる
BamHI認識部位とを含む。MboIは、真核生物のDNAでは256個の塩基対ごと
に平均して一回現れる4塩基認識配列(GATC)を有する。このように、クローン
可能なNotI/MboIcDNA断片の平均の大きさは、クローンされたpoly Aの尾の
部分を含め約300塩基対である。cDNAをTALESTベクタにクローンすると、
細胞中で発現した遺伝子のほとんどすべてを表すcDNAライブラリが形成され
る。
ライブラリは、ライブラリ中の各cDNAの5‘末端が常にMboI認識配列、即
ちGATC配列で始まるように定方向で作製されるが、この認識配列は、その遺伝子
中で最も3‘側に見つかるMboI部位由来である。次に、このプラスミドをホスト
細胞内に形質転換させ、このバクテリアを成長させることで、このライブラリを
増幅する。
TALESTベクタは、各cDNAで最初にあるGAT配列のすぐ5‘側に位置するBsg
I制限エンドヌクレアーゼ部位を有する。BsgIは、規定された配列(GTGCAG)を
認識するがDNAの切断はこの認識配列から下流(3’側)のほぼ16塩基目で
行なうII型制限エンドヌクレアーゼである。このようにTALESTベクタをBsgIで切
断すると、センス鎖上でGATC開始配列から下流の12塩基目で、挿入されたcD
NAを切断し、アンチセンス鎖では10塩基目で切断することで、この環状プラ
スミドが直線形となる。BsgIは3‘の「上側張出し」を残すため、センス鎖上で
対になっていない二つの塩基を、T4DNAポリメラーゼを用いて取り除き、平滑
末端とする。
BsgI部位から上流の9個の塩基は第二II型制限部位、FokIである。この酵素は
、5個の塩基配列GGATGを認識するが、切断するのはセンス鎖上では9塩基下流(
3‘)であり、アンチセンス鎖では13塩基下流である。その結果得られる断片
にT4DNAポリメラーゼ処理を行なうと、平滑末端を有する配列
GGATCNNNNNNNNNN(配列同定番号NO:4)という15塩基の「標識」が生成される。
選択に応じ、PmlIを第二制限部位として用いてもよい。この部位は、その認識
配列(CACGTG)がBsgIのそれと重複し、またDNAのセンス鎖及びアンチセンス
鎖の両方を同じ場所で切断して平滑末端を生むため、便利である。BsgIで線形に
なったプラスミドをPmIIで消化すると、平滑末端を持つ配列GTGCAGGATCNNNNNNNN
NN(配列同定番号NO:5)という20塩基の断片が切り取られるが、このときの最初
の6個の塩基はTALESTベクタを由来とするものであり、続く14個(GATCNNNNNNN
NNN(配列同定番号NO:6))はcDNAを由来とするものである。
増幅されたcDNAライブラリ全体をBsgI及びFokIで消化すると、20個の塩
基対の断片が切り取られるが、この断片は、それぞれ最後の10個の塩基が異な
り、またそれぞれが単一の発現した遺伝子の独特のマーカーとなる「標識」の混
合物を構成している。10個の塩基が未知の配列で並んでいると、可能性として
410即ち1,048,576通りの異なる標識配列があることになる。この数は
、全組織におけるヒトゲノムで発現する遺伝子の数の約4倍を越える。
標識を互いに混合し、一個の分子中、約30から60個、好ましくは約40か
ら50個の標識から成る縦列アレイを作製すべく、DNAリガーゼで酵素処理す
る。次に、このアレイをシークエンシング・ベクタにクローンし、自動DNA配
列分析にかける。アレイが分析されるとき、個々の標識が認識されるが、それは
なぜなら、これらは、結紮中に、ランダム・センス又はアンチセンスあるいは標
識の方向に応じて、規定されたパンクチュエーション配列GGATC(MboI認識配列
を含む)又はその逆相補体により、各々から分離されるからである。
各標識は、最初のcDNAのうちの最も3‘側のMboI部位を由来とする規定の
GGATC配列で始まり、研究対照の細胞集団中で発現した遺伝子のうちの一つの独
特のマーカーとなる、未知の配列の10個の塩基をさらに有している。GGATC開
始配列が存在することで、実質的には、5個の塩基という、同定のための情報が
さらに提供されており、またこの情報を、標識された遺伝子中の特定の部位に位
置を
限定することができる。このように、実際には15個の塩基が、cDNAにコピ
ーされた各mRNAについて知られ、本方法で分析される。
TALESTA実施例
第二の即ちTALESTA実施例は、ある一つのmRNA集団中で遺伝子発現パター
ンを同定するもう一つの方法を含む。当該方法は、二本鎖cDNAを、mRNA
集団から、「プライミング」制限エンドヌクレアーゼの切断部位にオリゴdT配列
の5‘端で連結されたオリゴdT配列などのプライマを用いて作製するステップと
、この二本鎖cDNAを、プライマ内ではなくこのcDNA内の一部位で切断す
る第一制限エンドヌクレアーゼで切断することで、cDNAインサートの集団を
得るステップとを含む。cDNAインサートをクローニング・ベクタの挿入部位
に挿入してDNAコンストラクトを得るが、このときこのクローニング・ベクタ
は、このDNAコンストラクトを第二制限エンドヌクレアーゼで消化するとDN
AコンストラクトがcDNΛインサート内の一部位で切断されるよう、挿入部位
の5’側に第二制限エンドヌクレアーゼ認識配列を含む。DNAコンストラクト
を、例えば適したホスト細胞、例えばE.coli、などの中で増幅し、単離した後、
第二制限エンドヌクレアーゼで消化して、3‘端上側張出し配列を有する直鎖状
のDNA分子を得る。この直鎖状DNA分子をアダプタ配列にアニール及び結紮
する。アダプタ配列は、第一制限エンドヌクレアーゼ認識配列と、直鎖状のDN
A分子の3’端上側張出し配列に適合性のある3‘端下側張出し配列とを含む二
本鎖オリゴデオキシヌクレオチド配列を含む。このアダプタをアニール及び結紮
すると、第一制限エンドヌクレアーゼ制限部位を両側に持つcDNAを含む直鎖
状のDNA分子結紮産物が生まれる。この結紮産物を第一制限エンドヌクレアー
ゼで消化して標識を得る。この標識のヌクレオチド配列を得ると、当該mRNA
集団中で遺伝子発現パターンが同定される。
ここでは、「アダプタ」という術語は二本鎖のオリゴデオキシヌクレオチド配
列を言うが、このときこの上側の鎖の配列は5‘から3’方向に、そして下側の
鎖の配列は3‘から5’方向に、相互に並んでいる。
ここで、「3‘端下側張出し部」という術語は、アダプタの下側の鎖の3’端
に位置する一本鎖配列を言う。
ここで、「3‘端上側張出し部」という術語は、アダプタの上側の鎖の3’端
に位置する一本鎖配列を言う。
本発明はさらに、TALESTA実施例で用いられるDNAベクタ及びキットを提供
するものである。ある一つのmRNA集団中で遺伝子発現パターンを同定するの
に用いるのに好適なキットには、消化すると変性上側張出し部を残すことのでき
る、変性配列に隣り合った(3‘端で)パンクチュエーティング制限エンドヌク
レアーゼ認識配列を含むDNAベクタなどのDNAベクタが含まれる。
本発明の第二又はTALESTA実施例の概観を図3に示す。図3で提供した、かつ
ここで説明した概観は、特定の制限エンドヌクレアーゼと、規定されたベクタを
用いて本発明を詳細に説明したものだが、当業者であれば、その他の制限エンド
ヌクレアーゼも選択でき、またSambrook J.et al.,“Molecular Cloning:A la
boratory Manual",Sccond Ed.(Coldspring Harbor Laboratory Press,Cold S
pring Harbor,New York,1989,Volume 1,Chapter 7)に説かれたようなその他の
分子生物学的方法を用いても本発明を実施できることは公知であり、本発明はこ
こで提供された詳細な実施例に限定されるものではない。
まず、標準的手法を用いてポリアデニル化mRNAを目的の細胞集団から単離
する。次に、親和捕獲ラベル(例えばビオチン)をその5‘端に持つオリゴdT配
列でこのmRNAをプライミングすることにより、逆転写酵素を用いてこのmR
NAをcDNAに変換する。標準的手法によりRNAase H及びDNAポリ
メラーゼIを用いて、この一番目の鎖のcDNAを二本鎖cDNAに変換する。
その後、この二本鎖cDNAを、4個の塩基対認識配列を有するパンクチュエー
ティング制限エンドヌクレアーゼで切断する。「パンクチュエーティング制限エ
ンドヌクレアーゼ」とは、そのエンドヌクレアーゼでcDNAを切断すると、各
々の標識配列の5’端に認識配列が来るため、この標識配列を連結させると、こ
の認識配列が標識配列の各端部に来ることで、連結されたcDNA配列同士の間
のパンクチュエーティング配列となるものを言う。親和捕獲ラベルを含んだ3‘
端断片を親和捕獲器(例えば磁気ビーズに結合させたストレプトアビジン)を用
いて精製する。次に、この
捕獲されたcDNA断片を、II型制限エンドヌクレアーゼ認識配列、パンクチュ
エーティング・エンドヌクレアーゼ制限部位に適合性のある5’端上側張出し配
列を含む二本鎖オリゴデオキシヌクレオチド配列を含むアダプタにアニールして
、第一結紮産物を形成する。次に、この第一結紮産物を、II型制限エンドヌクレ
アーゼで切断してこの結紮産物を親和捕獲器から解放するが、このとき、この解
放された結紮産物は、cDNAインサート由来の配列に隣り合ったパンクチュエ
ーティング・エンドヌクレアーゼ認識配列を含み、このcDNA由来の配列は、
1又は2個の塩基の変性3‘端上側張出し配列を含む。その後、解放された結紮
産物を標準的技術を用いて結紮して変性クローニング・ベクタにすると、この結
紮産物の5’端側制限エンドヌクレアーゼ認識配列が、ベクタの制限消化により
生まれた上側張出し部と適合するものになり、3‘端側部位が、この親和捕獲器
から当該断片を切り離すのに用いた同じII型制限エンドヌクレアーゼでこの変性
ベクタを消化することにより導入された上側張出し部と適合性あるものとなる。
変性ベクタはさらに、変性上側張出し部にすぐ隣接した(3’側)パンクチュエ
ーティング制限エンドヌクレアーゼ認識配列を含有する。次にDNAコンストラ
クトをコンピテント・バクテリアに形質転換して標準的技術により増幅し、標識
ライブラリを作製する。増幅後、ベクタDNAをパンクチュエーティング制限エ
ンドヌクレアーゼで消化して標識を解放する。
TALESTB実施例
第三又はTALESTB実施例は、ある一つのmRNA集団中で遺伝子発現パターン
を同定するさらにもう一つの方法を含むものである。当該方法は、二本鎖cDN
Aを、mRNA集団から、親和捕獲ラベルを有するプライマを用いて作製するス
テップと、この二本鎖cDNAを、4個の塩基対認識配列を有するパンクチュエ
ーティング・エンドヌクレアーゼで切断することでcDNAインサートを得るス
テップとを含む。親和捕獲ラベルを有する3‘端cDNAインサートを親和捕獲
器に捕獲させて、捕獲されたcDNAインサートを得る。この捕獲されたcDN
Aインサートを、第二制限エンドヌクレアーゼ(例えばII型制限エンドヌクレア
ーゼ)と、認識配列と、第一ベクタ挿入部位に適合性のある5’端上側張出し配
列と、パンクチュ
エーティング・エンドヌクレアーゼ制限部位に適合性のある5‘端下側張出し配
列とを含む二本鎖オリゴデオキシヌクレオチド配列を含む第一アダプタにアニー
ルすることで、第一結紮産物を得る。この第一結紮産物を第二制限エンドヌクレ
アーゼ(例えばII型制限エンドヌクレアーゼ)で切断して、この結紮産物を親和
捕獲器から解放するが、このときこの解放された結紮産物は、cDNAインサー
ト由来の配列に隣り合ったパンクチュエーティング・エンドヌクレアーゼ制限部
位を含み、このcDNA由来の配列は、3’端上側張出し配列を含む。解放され
た結紮産物を、第二アダプタ、例えばこの結紮産物の3‘端上側張出し配列に適
合性のある3’端下側張出し配列と、第二ベクタ挿入部位に適合性のある5‘端
下側張出し配列と、を含む二本鎖オリゴデオキシヌクレオチド配列など、でアニ
ールすることで、第二結紮産物を得る。第二結紮産物には、両側にパンクチュエ
ーティング・エンドヌクレアーゼ制限部位を持つcDNA由来の配列と、この産
物の5’端にある第一ベクタ挿入部位と、この産物の3‘端にある第二ベクタ挿
入部位とが含まれる。この第二結紮産物をクローニング・ベクタの挿入部位に挿
入して、DNAコンストラクトを得る。このDNAコンストラクトを増幅し、単
離し、パンクチュエーティング・エンドヌクレアーゼで消化して標識を得る。こ
の標識のヌクレオチド配列を得ることで、当該mRNA集団中で遺伝子発現パタ
ーンを同定する。
ここで、「親和捕獲ラベル」という術語は、あるプライマに結びつける又はそ
の中に含めることのできる成分であって、捕獲成分、例えば親和捕獲器と相互作
用(例えば結合)することのできるものを言う。このような成分の例には、たんぱ
く質、例えば抗体、抗原、酵素、コエンザイム、例えばビオチン、などがあるが
、これらに限らない。
ここで、「パンクチュエーティング・エンドヌクレアーゼ」という術語は、DN
Aを少なくとも一回で切断する能力のある制限エンドヌクレアーゼを言う。典型
的には、パンクチュエーティング酵素は真核生物のDNAの4個の塩基対の認識
配列を認識する。好ましくは、パンクチュエーティング・エンドヌクレアーゼが
DNAをおよそ256塩基対ごとに切断するとよい。ある好適な実施例では、パ
ンクチュエーティング・エンドヌクレアーゼはここで説明した第一制限エンドヌ
クレアーゼと同じである。本発明の方法において有用なパンクチュエーティング
・エンドヌクレ
アーゼの例にはSau3A,MspI,MboI,AluI,BstUI,DpnII,HaeIII,HhaI,HinPI
,MseI,NlaIII,RmaI,及びTaqIがあるが、これらに限定されるものではない。
ここで、「親和捕獲器」という術語は、親和捕獲ラベルと相互作用する(例え
ば結合する成分を言う。親和捕獲器には、さらに、捕獲成分に共有結合させた固
体の担体、例えば不溶性のマトリックス、例えば磁気ビーズ、を含めることがで
きる。このような成分の例には、たんぱく質、例えば抗体、抗原、酵素がある。
親和捕獲ラベルがビオチンである場合、好適なたんぱく質捕獲成分はストレプト
アビジンである。
ここで、「隣り合った」という文言は、あるヌクレオチド又はアミノ酸配列(
又はその一部分)の、別のヌクレオチド又はアミノ酸配列(又はその一部分)に
対する物理的位置を言う。典型的には、ある配列が、別の配列の約8、10、1
2、14又は15塩基対又はアミノ酸内にあれば、もう一方の配列に隣り合って
いることになる。
ここで、「5‘端下側張出し」という術語は、アダプタの下側の鎖の5’端に
位置する一本鎖の配列を言う。
ここで、「5‘端上側張出し」という術語は、アダプタの上側の鎖の5’端に
位置する一本鎖の配列を言う。
ここで、「適合性のある」という文言は、ある一つの配列の少なくとも一部分
、例えば上側張出し又は下側張出し配列、が、例えば別の上側張出し又は下側張
出し配列などの所定の配列に対して相補であることを意味する。例えば、第一D
NA分子の3‘端上側張出し配列は、第二DNA分子の3’端下側張出し配列に
対して適合性がある。本開示では、「相補」という術語は分子生物学における通
常の意味を有する。二つのヌクレオチド配列又は鎖は、それらが通常の対合規則
に基づいて塩基対を形成できれば(Watson-Crick又はHoogstein)相補である。こ
のことは、それらの鎖が必ずしもすべてのヌクレオチドにおいて塩基対であるこ
とを要件としない。二つの配列は、一つ又は少ない数の(例えば、25塩基から
成る直鎖では最大5まで)ヌクレオチドの削除、付加、又は置換、あるいはこの
ような変更の組合せなどにより生じるものなど、低レベル(例えば約1から3%
)の塩基のミス対合があってもやはり相補と考えてよい。
本発明はさらに、TALESTB実施例で用いられるDNAベクタ及びキットを提供
する。例えばここで説明したTALESTBベクタなど、好適なDNAベクタは挿入部
位を含み、パンクチュエーティング・エンドヌクレアーゼ認識部位を欠いたもの
である。ある一つのmRNA集団中で遺伝子発現パターンを同定するために用い
るのに好適なキットは、例えばここで説明したTALESTBベクタなどのDNAベク
タと、約7から40個のT残基を含むプライマと、パンクチュエーティング・エ
ンドヌクレアーゼと、二本鎖オリゴデオキシヌクレオチド配列を含む第一アダプ
タであって、第二制限エンドヌクレアーゼ(例えばII型制限エンドヌクレアーゼ
)、認識配列、第一ベクタの挿入部位に適合性のある5‘端上側張出し配列、及
び、パンクチュエーティング・エンドヌクレアーゼ制限部位に適合性のある5’
端下側張出し配列を含む第一アダプタと、二本鎖オリゴデオキシヌクレオチド配
列を含む第二アダプタであって、3‘端下側張出し配列、及び、第二ベクタ挿入
部位に適合性のある5’端下側張出し配列、を含む第二アダプタとを含む。
本発明の第三又はTALESTB実施例の概観を図5に示し、以下に説明する。ここ
で説明する第三実施例の概観は、特定の制限エンドヌクレアーゼと、規定された
ベクタを用いて本発明を詳細に説明したものだが、当業者であれば、その他の制
限エンドヌクレアーゼも選択でき、またSambrook J.et al.,“Molecular Clo
ning:A laboratory Manual",Second Ed.(Coldspring Harbor Laboratory Press,
Cold Spring Harbor,New York,1989,Volume 1,Chaptcr 7)に説かれたようなそ
の他の分子生物学的方法を用いても本発明を実施できることは公知であり、本発
明はここで提供された詳細な実施例に限定されるものではない。
本発明の第三実施例を行なうには、標準的手法を用いてポリアデニル化mRN
Aを目的の細胞集団から単離する。次に、ビオチン基をその5“端に持つオリゴ
dT配列でこのmRNAをプライミングすることにより、逆転写酵素を用いてこの
mRNAをcDNAに変換する。標準的手法によりRNAase H及びDNAP
olIを用いて、この一番目の鎖のcDNAを二本鎖cDNAに変換する。その後
、この二本鎖cDNAを、制限酵素、例えばSau3A、で消化する。この酵素の持
つ4個の塩基の認識配列(GATC)は、真核生物のDNAでは平均で256個の塩
基対毎に一回あるものであり、平均的cDNAを数回切断することとなる。次に
、最も3’側
の断片(各cDNAの最も3“側のSau3A部位と、poly Aの尾との間の配列を表
す)を、ストレプトアビジンに共有結合した磁気ビーズで親和捕獲法により捕獲
し、その他のSau3A制限断片はすべて洗い流し、部分的に二本鎖となった以下の
配列(配列同定番号NO:7及び配列同定番号NO:8から成る、このときNはA、T、
C又はGのいずれでもよい)の突出断片を残す:
次のステップは、この(磁気ビーズ上で)固相のcDNAを、部分的に二本鎖
配列(配列同定番号NO:9及び配列同定番号NO:10から成る):
を有する合成二本鎖オリゴヌクレオチド第一アダプタにアニールすることであ
る。ただしこのとき、下側の鎖の上側張出し「CTAG」配列は固相のcDNA分子
上の上側張出し「GATC」配列にアニールすることとなる。このアダプタ配列は、
アニールされたcDNAでGATC配列のすぐ5‘側に位置するBsgI制限部位(GTGC
AG)を含む。BsgIは、上に示した規定された配列を認識するが、この認識配列か
ら16塩基ほど「下流」(3’端側)でDNAを切断するII型制限酵素である。
固相cDNAをBsgIで切断すると、部分的に二本鎖となったオリゴマー配列(配
列同定番号NO:11及び配列同定番号NO:12から成る)が磁気ビーズから解放され、
アダプタ分子と、以下に示す2個の塩基の3‘端「上側張出し部」を残したもう
一つのcDNA由来のアンチセンス鎖とから構成される規定された配列ができる
。
このオリゴマーの5‘端は、NotI制限部位に適合性のある、対になっていない
「GGCC」配列を含んでいる。次にこの断片を、配列:
の16個の変性オリゴヌクレオチドから構成される第二の部分的に二本鎖になっ
たアダプタ配列(配列同定番号NO:13及び配列同定番号NO:14)に溶液相でアニー
ル及び結紮する。
変性「NN」配列が存在することで、このアダプタは、第一結紮産物にアニール
して、第二の部分的に二本鎖となった以下の結紮産物(配列同定番号NO:15及び
配列同定番号NO:16から成る)を生じさせることができる。
こうして、新しい断片は、両側にSau3A部位(GATC)部位を持つ、各cDNA
を由来とする12塩基の未知の配列と、それぞれNotI及びEcoRIで消化したベク
タに適合性のある両端とから構成される。当業者であれば、第一及び第二アダプ
タ上のベクタ挿入部位に適合性のある配列は互換可能である、即ち、上述したよ
うに第一アダプタがNotI挿入部位に適合性のある配列を有し、第二アダプタがEc
oRI挿入部位に適合性のある配列を有していても、あるいは図5に示すようにそ
の逆でもよいことは理解されよう。これらのインサートをこのような切断ベクタ
にクローンすると、新しいcDNA「標識」ライブラリが形成されるが、このと
き各mRNA種は規定される12塩基の配列を生じる。このライブラリをTALEST
Bプラスミド・ベクタにクローンし、適したE.coliホストに形質転換する。次に
、プラスミドDNAを標準的手法で単離し、Sau3Aで消化して、部分的に二本鎖
となった「標識」配列(配列同定番号NO:17及び配列同定番号NO:18から成る):
を解放するが、このとき、12個の「N」はcDNAインサートを由来とする
未知の配列を表す。これらの標識を、プラスミドの主鎖内のSau3A部位を由来と
するその他の小型の制限断片から分離するために、これら部位のうちのいくつか
をTALESTBベクタ内で位置指定突然変異誘発により破壊した。TALEST標識をゲル
電気泳動法により単離し、相互に混合し、一個の分子中、50から60個の標識
から成る縦列アレイを作製すべく、DNAリガーゼで酵素処理する。次に、この
アレイをシークエンシング・ベクタ内にクローンし、自動DNA配列分析にかけ
る。
アレイを分析すると、個々の標識が認識されるが、それはなぜなら、これらは
、もとのcDNAの最も3‘側にあるSau3A部位を由来とする規定されたGATCパ
ンクチュエーション配列により、互いから切り離されているからである。各標識
はこれまでのところ未知の配列の塩基をさらに12個有しているが、研究対象と
なった細胞集団中での発現遺伝子の一つの独特のマーカーとなっている。標識を
アレイの中にセンス又はアンチセンス方向のいずれで結紮してもよい。しかしな
がら、未知の配列の塩基が12個あると、可能性として412即ち16,777,
216通りの異なる標識の配列があることになる。この数は、(全組織中で)ヒ
トゲノムで発現する遺伝子の数よりも二桁大きい大きさである。従って、ある一
つの標識配列が一つの遺伝子にそのセンス方向でマッチし、異なる遺伝子にその
アンチセンス方向でマッチするといったことは、実際上あり得ない。さらに、GA
TC開始配列が存在することで、実際的には、同定情報となる4個の塩基がさらに
提供され、またこの情報の位置が、標識遺伝子内の特定の部位に限定される。し
かしながら、個々の標識の頻度分布を生み出すには、センス及びアンチセンスの
両方の方向で標識が同一であるとみなすことが重要である。これを達成するため
にソフトウェア・プログラムが作成された。このソフトウェア・プログラムは自
動DNA配列ファイルをスキャンして、規定された長さのランダムな配列(例え
ば、制限エンドヌクレアーゼBsgIを用いてTALEST実施例を行なう場合に生まれる
12個の塩基対)が介在する対
になった制限エンドヌクレアーゼ配列(例えばパンクチュエーティング制限エン
ドヌクレアーゼ配列、例えばGATC)を探すものである。このソフトウェアは次に
、この配列を、対になった各々の制限エンドヌクレアーゼ配列同士の間にある塩
基対部分から構成された個々の標識にパースする。同じ標識配列が複数存在する
ときに、一緒にパースして標識の頻度分布を作成する。一つの標識はセンス又は
アンチセンスのいずれの方向でも結紮して標識アレイにできるため、このソフト
ウェアは、方向に関係なく標識を同一のものとして得点する方法を確立しなけれ
ばならない。これは、このソフトウェアが同定する標識配列すべてがその逆相補
配列に比較され、そしてアルファベットで前に来る配列のみを頻度分布に入力す
るといった決まりを確立することで達成される。このソフトウェアはさらに、別
々の細胞又は組織から作成した標識の頻度分布を比較し、ユーザが指定したレベ
ルと異なる頻度のものを強調するようなものとしてもよい。
当業者には公知である自動化された高処理量のDNAシークエンサにより、標
識の同時配列決定が可能である。このように、本方法は、高処理量のDNAシー
クエンサを用いて容易かつ迅速に分析することのできる標識を容易かつ迅速に作
製する方法を提供するものである。さらに、本発明はcDNAライブラリの初期
作製を含むため、このライブラリを目的の標識に対応するオリゴヌクレオチドで
プローブすれば、その標識で同定される遺伝子の発現頻度を判定することができ
る。例えば、ある標識が腫瘍cDNAプールでは三回現れるのに正常細胞プール
では全く現れない場合、両方のcDNAライブラリを標識でプローブしてそれら
の正確な頻度を確認してもよいであろう。その後、完全長遺伝子を単離し、当業
者に公知のクローニング法を用いて同定してもよいであろう。
TALESTB実施例(図5にダイアグラムで図示)に関連するもう一つの実施例を
図6に概略的に示す。この実施例では、アダプタを一個だけ使用し、TALESTB実
施例で用いたのと同じステップを用いて、予め親和捕獲器で捕獲されたcDNA
断片を単離する。つまり、cDNA集団を、mRNAのプレパラートから、親和
捕獲ラベル(例えばビオチン)に共有結合させたプライマを用いて作製し、次に
このcDNAを、cDNA配列内でのみ切断するパンクチュエーティング・制限
エンドヌクレアーゼ(例えばMboI又はSau3A)で切断する。次に3‘端cDNA
断片を、
親和捕獲器(例えば磁気ビーズに結合させたストレプトアビジン)を用いて捕獲
し、捕獲されなかった断片を洗い落とす。次に、捕獲されたcDNAインサート
を、このcDNAインサートの末端に適合性のある一端(即ちパンクチュエーテ
ィング制限エンドヌクレアーゼ部位に適合性のある)と、II型制限エンドヌクレ
アーゼ認識配列(例えばBsgIの認識配列)と、EcoRI制限部位に適合性のある一
端とを有する二本鎖オリゴデオキシヌクレオチド配列であるアダプタにアニール
及び結紮する。その後、このcDNAを・型制限エンドヌクレアーゼ(例えば図
6に示すようにBsgI)を用いて親和捕獲器から切り離し、このcDNA断片を単
離する。
本方法のこの時点では、図5に示したように第二アダプタを提供する代わりに
、結紮されたアダプタの一端に適合性のある制限エンドヌクレアーゼアクセプタ
部位(例えばEcoRI部位)と、cDNA分子の他端に適合性のある部位(即ちBsg
I酵素の制限部位にアニール可能な下側張出し配列)とを有するベクタが提供さ
れる。好ましくは、BsgIによるcDNAの切断で生じる可能性のあるcDNA端
部のすべてを受け入れるには、当該ベクタは、図6に「NN」で示すような2塩基
の変性3‘端下側張出し部を有する、16倍変性組のプラスミド・ベクタである
とよい。このcDNA及びベクタをアニールし、結紮してコンストラクトを作製
し、このコンストラクトを適したホスト細胞(例えばE.coli)内に導入し、当業
者に公知の標準的技術を用いて増幅する。増幅されたプラスミドを単離し、パン
クチュエーティング・制限エンドヌクレアーゼ(例えばSau3A)で消化すること
でcDNA標識配列を解放し、その後このcDNA標識配列を単離し、結紮して
、一アレイ当り、通常少なくとも10個の標識及び好ましくは約40から60個
の標識から成る標識アレイを作製する。次に、標準的技術を用いてこの標識アレ
イを適したベクタ(例えばBamHIで切断してパンクチュエーティング制限エンド
ヌクレアーゼ部位に適合性のある末端にしたプラスミドなど)内にクローンし、
そこでこの標識アレイの配列を決定する。図6に示すように、標識アレイのヌク
レオチド配列は、パンクチュエーティング制限エンドヌクレアーゼ配列(図6で
GATCで示される)と、それに続くcDNA配列と、それに続く別のパンクチュエ
ーティング制限エンドヌクレアーゼ配列と、それに続くcDNA配列と、等々、
と最後のフランキングベクタ配列
とを含む。このように、mRNA集団中で遺伝子発現パターンは、発現した遺伝
子をそれぞれが表す標識配列を同定することにより、その同定が可能である。
その他の実施例
本発明の三つの実施例は、以下に説明する別の方法において有用である。
例えば、本発明の方法を用いると、ある一つのmRNA集団中で遺伝子発現の
頻度を判定することができる。当該方法は、本発明のcDNAインサートを含む
DNAコンストラクトを作製してcDNAライブラリを得るステップを含む。当
該方法は、さらに、目的の標識配列を含むオリゴヌクレオチド・プローブを、好
ましくは本発明の方法を用いて作製することで、示差的に発現した遺伝子を同定
するステップと、このcDNAライブラリを、当該標識配列を含むオリゴヌクレ
オチド・プローブでプローブすることにより、この標識配列を含む遺伝子の発現
頻度を判定するステップとを含む。
「オリゴヌクレオチド・プローブ」という術語は、目的の分子に特異的に結合
する核酸を言う。
「プロービング」という術語は、ここでは例えば標識を含むヌクレオチド配列
などのヌクレオチド配列を用いてRNA又はDNAのプールにハイブリダイズす
る方法を言う。プールRNA又はDNAは細胞又は組織中のその自然環境から単
離してもよく、あるいはプールを細胞又は組織内でin situでアッセイしてもよ
い。
上記及び本出願を通じて用いられる「ハイブリダイズする」とは分子静物画で
の通常の意味を持つ。これはヌクレオチド・ポリマー同士の塩基対形成という相
互作用を言うものである。塩基対が存在するとは、通常の塩基対合の法則に基づ
き、二つのヌクレオチド配列の各々において、ある一定の割合のヌクレオチド(
少なくとも80%)が他方のものに対して相補であることを意味する。安定的な
ハイブリダイゼーションを得るために相補でなければならないヌクレオチドの割
合の正確な数値は、ヌクレオチドの配列、溶液の塩濃度、温度及びpHを含む数
多くの因子に応じて様々であろう。
「緊縮条件」下でのハイブリダイゼーションに言及する場合、「緊縮」とはい
かなる核酸配列についても経験的な用語であると理解されねばならない。しかし
なが
ら、この用語は、二つの配列の間で塩基対が正確にマッチしている、又は塩基の
ミスマッチのパーセンテージが小さい(5から10%)ようなDNA配列であれ
ば、検出及び単離が可能なように充分安定な、塩基対を基にしたハイブリッド分
子が形成されるハイブリダイゼーション条件の性質を示すものである。一方、塩
基のミスマッチが多量にある二つの配列は同じ条件下ではこのような安定したハ
イブリッドを形成しないであろう。当業者であれば、条件の緊縮性を調節すべく
様々な因子を変更してもよいことは既知であり、またどのようにこのような因子
を変更して所望の結果を得るかも理解されていることであろう。これらの因子の
例には、温度、ナトリウムイオン濃度、及び、塩化テトラメチルアンモニウム又
は塩化テトラエチルアンモニウム濃度である。当業者であれば、ある一式の条件
の緊縮度は、例えばその分子のG+C含有量、短い方の分子の長さ、及び分子に
おけるミスマッチの位置など、当該DNA又はRNAの特徴に左右されるであろ
うことは認識されよう。しかしながら、当業者であればさらに、溶解温度(TM
)の推定を可能とする公式があることも公知であろう。DNAについては、オリ
ゴヌクレオチドプローブのためのこのような公式の一例は、ナトリウムイオン濃
度、G+C含有量、及びプローブの長さに関する変数に基づく関数である。(Sam
brook et al.,Molecular Cloning(1989)at 11.46)。同様の公式がRNA:RN
Aハイブリッド及びRNA:DNAハイブリッドについても入手可能である(Id
.at 9.51.)。加えて、当業者であれば、溶解温度に対するミスマッチの影響を
推定できること、そしてこの溶解温度は、パーフェクト・マッチ又はミスマッチ
のDNAについて経験的に判定可能であることは公知であろう。
従って、当業者であれば、「緊縮条件」はごく通常の技術を用いれば請求の範
囲に挙げられたDNA配列について容易に判断可能であることを認識されよう。
本発明では、「緊縮条件」は、好ましくは少なくとも80%の塩基対合を、より
好ましくは少なくとも90%又は95%の塩基対合を、さらにより好ましくは少
なくとも97%の塩基対合を、そして最も好ましくは少なくとも98%の塩基対
合を要するものでなければならない。
当業者であれば、ハイブリダイゼーション条件は、温度、塩濃度、及び、ハイ
ブリダイゼーション及び洗浄溶液のホルムアルデヒド含有量を変えることで変更
可
能であることは認識されよう。さらに、可能性としてあり得るミスマッチの量に
関して、又はより高い又はより低い程度の緊縮性を提供すべく、条件の許容量を
設定してもよい。さらに、緊縮度の適切なレベルを経験的に判定することで、計
算されたTMを開始推定値として用いた特定のハイブリダイゼーションを提供す
ることができる。例えば、Tmとミスマッチの程度との間の対応性を、当業者に
公知の方法や、例えばSambrook et al.,Molccular Cloning(1989)at 11.47,11.5
5-57に説明された方法に基づき、計算してもよい。
本発明の方法を用いると、さらに二つ又はそれ以上のmRNA集団の間で遺伝
子発現の差を検出することができる。当該方法は、本発明の方法に基づき、第一
mRNA集団と、少なくとももう一つの別のmRNA集団とから遺伝子発現パタ
ーンを同定するステップを含む。次に、このようにして得られた遺伝子発現パタ
ーンを比較して、このmRNA集団間での遺伝子発現の差を検出することができ
る。好適な態様では、第一mRNA集団を正常な細胞又は組織から得、別のmR
NA集団を疾患又は異常を有する目的生物の細胞又は組織から得る。別の好適な
態様では、mRNA集団を異なる発生段階の細胞又は組織から得る。さらに別の
好適な態様では、mRNA集団を同じ目的生物の異なる組織又は臓器を由来とす
る細胞から得る。別の好適な態様では、mRNA集団を異なる目的生物から得る
。
本発明の目的のために、「目的生物」という術語は、RNAを得ることのでき
るあらゆる生物を含む。当業者であれば、この術語は、例えば動物、植物、その
他の真核細胞及びバクテリアを含むことを認識されよう。
本発明はさらに、目的生物中で疾患の存在を検出する方法を提供するものであ
る。当該方法は、本発明の方法に基づき、正常細胞又は組織と、疾患又は異常を
有する目的生物から得た細胞又は組織とで異なる発現をしている遺伝子を同定す
るステップと、この遺伝子の標識配列を単離するステップとを含む。第一目的生
物から得たmRNA集団と、第二正常又は罹病目的生物から得たmRNA集団と
を、この標識配列でプローブすることで、この遺伝子の発現レベルを判定するこ
とができる。次に、第一目的生物におけるこの遺伝子の発現レベルを、第二目的
生物中のこの遺伝子の発現レベルと比較すれば、第一目的生物における疾患の存
在を検出することができる。
さらに別の実施例では、本発明の方法を用いて遺伝子を単離することができる
。ある遺伝子を単離するには、単離しようとするこの遺伝子の配列の一部分を含
む標識を同定し、標準的技術、例えばこの標識配列をプローブとして用いて、c
DNAライブラリから完全長クローンを同定する方法、などにより、この遺伝子
を単離する。単離しようとする遺伝子の配列の「一部分」とは、この部分が言及
する鎖の配列のうちの連続したサブセットと同じヌクレオチド配列を有する線形
の鎖を言う。
ある好適な実施例では、本発明の方法を用いて、第一mRNA集団において第
二mRNA集団と比較したときに異なるレベルで発現している、示差的に発現し
た一遺伝子又は複数の遺伝子を単離することができる。示差的に発現した遺伝子
を単離するには、結紮された標識アレイのヌクレオチド配列を、第一細胞種又は
組織と第二細胞種又は組織とから、本発明の方法に基づいて得る。次に、第一及
び第二細胞種又は組織の個々の標識配列の発現頻度を比較する。こうして、第一
細胞種又は組織において、第二細胞種又は組織と比較したときに示差的に発現し
ている標識配列を同定し、単離することができる。こうして、示差的に発現して
いる標識配列に対応する遺伝子を同定することができる。「対応する」という術
語は、ある一つの核酸分子の少なくとも一部分が第二の核酸分子に相補か又は相
同のいずれかであることを意味する。従って、mRNA分子を逆転写の鋳型とし
て用いてcDNA分子を生成した場合、このcDNA分子はこのmRNA分子に
対応するものであろう。同様に、ゲノム配列の複数の部分がcDNA配列に相同
又は相補である場合、その遺伝子のゲノム配列はそのcDNA配列に対応するも
のであろう。
第一のmRNA集団において第二のmRNA集団に比較して異なるレベルで発
現している遺伝子を単離するには、第一mRNA集団から採った遺伝子発現パタ
ーンと、第二のもう一つのmRNA集団から採った遺伝子発現パターンとを、こ
こで説明する方法に基づいて同定する。次に、これらの遺伝子発現パターンを比
較してmRNA集団間での遺伝子発現の差を検出することができる。こうして、
第一mRNA集団において第二mRNA集団と比較したときに異なるレベルで発
現している遺伝子を同定し、単離することができる。
本発明をさらに以下の実施例により描写するが、これらの実施例は限定的なも
のと捉えられてはならない。本出願全体を通じて引用された全文献、特許出願、
特許、及び公開済の特許出願の内容を参考文献としてここに編入することとする
。
実施例
実施例1、2、4、5及び6に説明する方法は、ここで説明する方法の三つの
実施例の各々において用いることができるものである。実施例3では、ここで説
明する三つの実施例の各々の標識を作製する方法が説かれている。実施例1−mRNAの単離
RNAの抽出法は当業において公知であり、例えばSambrook J.,et al.,“Mol
ecular Cloning:A Laboratory Manual",Sccond Ed.(Coldspring Harbor Labor
atory Prcss,Cold Spring Harbor,New York,1989,Volume 1,Chaptcr 7)に説か
れている。その他の単離抽出法も公知である。単離は特に塩化グアニジウム又は
グアニジウムイソチオシアネートなどのカオトロピック剤の存在下で行われるが
、その他の洗剤及び抽出剤も代わりに用いることができる。メッヤンジャーRN
Aは、オリゴ(dT)セルロース・カラム又はその他、mRNA分子のポリアデニル
化3‘端部分に結合することのできるクロマトグラフィ媒質を用いたクロマトグ
ラフィにより、全抽出RNAから単離することが好ましいが、必ずしも必要では
ない。
簡単に説明すると、細胞をRNA抽出緩衝液[0.14M NaCl,15mM MgCl2,10mM
TrisHCl(pH8.6),0.5% NP-40,1mM DTT,1000単位/ml Nascインヒビタ(Pharma
cia)]中にVortexミキサを30秒間用いて溶解させた後、氷上に5分間放置する
。12,000gで90秒間遠心分離して核及びその他の細胞組織片を沈殿させ、上清
をプロティナーゼKで除たんぱくした後、フェノール抽出する。イソプロパノー
ルでRNAを沈殿させ、70%のエタノールですすぐ。最後に、poly A+画分を
オリゴdTカラム分画により採集する(Aviv,D.P.,et al.,Proc.Natl.Acad.
Sci.USA69,1408-1412(1972))。実施例2−二本鎖cDNAの作製
次に、二本鎖cDNAをこのmRNA集団から、図3に示した配列のDNAプ
ライマを用いて作製する。アンカー・プライマはT残基の連なり(約7から40
個の残基)と、7個以上の塩基を認識する制限酵素で切断するための部位とが含
まれるが、この切断部位は、NotIなど、T残基の連なりの5‘端側部位に位置し
ている。
cDNAの反応を当業者に公知の条件下で行なわせる。このような技術は例えば
Volume 2 of J.Sambrook et al.,"Molecular Cloning:A Laboratory Manual.,
Second Ed."に説かれている。これらの方法では、この方法を行なう一つの方法
はトリ骨髄芽球症ウィルスの逆転写酵素を用いる方法である。
二番目のcDNA鎖合成は、RNAaseH/DNAポリメラーゼIセルフ・プ
ライミング法を用いて行なってよい。簡単に説明すると、それぞれ2マイクログ
ラムの細胞質Poly A+RNA及びベクタ・プライマDNAを、0.3M Na-アセテー
トを含有する70%エタノール中に同時沈殿させ、そのペレットを12Flの蒸留水に
溶解させた。最初の鎖の合成には、76℃で10分間熱変性させた後、4Flの5X
反応緩衝液(250mM Tris-HCl(pH8.3),375mM KCl,15mM MgCl2)、2Flの0.1MDTT、1
F1の各10mMのdATP,dCTP,dGTP及びdTTPを試料に37℃で加えた。200単位の逆転
写酵素MMLV-H-RT(BRL)を加えて反応を開始させ、37℃で30分間インキュベー
トした後、この反応チューブを氷上に移動させて反応を停止させた。二番目の鎖
の合成には、上述の反応混合液に、92Flの蒸留水、32Flの5XE.coli反応緩衝液(1
00mM Tris-HCl(pH7.5),20mM MgCl2,,50mM(NH4)2SO4,500mM KCl,250g/mlのBS
A,750M βNAD)、3Flの各10mMのdATP,dCTP,dGTP及びdTTP、15単位のE.coliリガ
ーゼ(Pharmacia)、40単位のE.coliポリメラーゼ(Pharmacia)及び15単位のRNase
H(Pharmacia)を加えた後、16℃で2時間インキュベートした。この反応混合液を
15分間、65℃に加熱した。
このcDNA試料を次にMboI及びNotIで切断する。次にcDNAベクタ試料を図
2で示したTALESTベクタに挿入する。TALESTベクタも同様にBamH1及びNotIで当
業者に公知の方法を用いて消化されたものである。簡単に説明すると、ブランク
のcDNAインサートとブランクのベクタを含有する試料を1mlまでlx E.coli
反応緩衝液で希釈し、100単位のE.coliリガーゼを加える。その結果得られる混
合液を16℃で一晩インキュベートする。cDNAの挿入後、ベクタ混合液を用
いてE.coliコンピテント細胞を形質転換させる。クローニングに適したホスト細
胞は、例えばSambrooketal.,“Molccular Cloning:A Laboratory Manual"に説か
れている。ホスト細胞を成長させて、生成されたベクタの数を増加又は増幅させ
る。適したE.coli株はDH5又はMC1061である。実施例3−標識の作製
TALEST実施例では、TALESTベクタは成長させたホスト細胞から当業者に公知の
方法、例えば「ミニプレツプ(原語:miniprep)」について説いたJ.Sambrook e
t al.,"Molecular Cloning:A Laboratory Manual.,Sccond Ed."などを用いて単
離される。次にベクタをBsgIで切断すると、このプラスミドはセンス鎖上でMboI
開始配列から12塩基下流、そしてアンチセンス鎖では10塩基下流の部位で線
形になる。そこでT4 DNAポリメラーゼを用いてベクタの平滑末端を作る。次にベ
クタをPm1Iで切断すると、配列GTGCAGGATCNNNNNNNNNNを持つ、20塩基の平滑末
端で終わる断片が生まれる。これらの標識をベクタの残りから、例えば上掲した
Sambrook et al.の説いたようにポリアクリルアミドゲル電気泳動法により分離
する。
TALESTA実施例では、二本鎖のcDNAを制限エンドヌクレアーゼSau3Aで切断
して制限断片を作製し、オリゴdT−ビオチン成分を含有する最も3‘端側の断片
を、ストレプトアビジン磁気ビーズを用いて捕獲する。この断片は、以下に示す
ように部分的に二本鎖となった配列(配列同定番号NO:7及び配列同定番号NO:8か
ら成る)を有する。
捕獲された断片は、まだ磁気ビーズに固定されているが、これを、部分的に二
本鎖となった配列(配列同定番号NO:19及び配列同定番号NO:20から成る):
を有する5‘端アダプタにアニールして、二本鎖配列(配列同定番号NO:21及び
配列同定番号NO:22から成る):
を有する結紮された複合体を作製する。
固相結合したcDNAを・型制限エンドヌクレアーゼBsgIで消化すると、cD
NAインサートが5‘端から規定された距離で切断され、部分的に二本鎖となっ
た配列(配列同定番号NO:23及び配列同定番号NO:24から成る):
を有する断片が解放される。
次に、この解放された断片を16倍変性ベクタの、配列:
を有するクローニング部位にクローンする。
この断片をベクタに結紮し、コンピテントE.coli内に形質転換させ、プラスミ
ドDNAを作製する。次にプラスミドDNAを制限エンドヌクレアーゼSau3Aで
消化して、部分的に二本鎖となった配列(配列同定番号NO:17及び配列同定番号N
O:18から成る):
を有する標識を解放する。
TALESTB実施例では、二本鎖cDNAを制限エンドヌクレアーゼSau3Aで切断し
て制限断片を作製し、オリゴdT−ビオチン成分を含有する最も3‘端側の断片を
ストレプトアビジン磁気ビーズを用いて捕獲する。この断片は部分的に二本鎖と
なった配列(配列同定番号NO:7及び配列同定番号NO:8から成る):
を有する。
捕獲された断片は、まだ磁気ビーズに固定されているが、これを、部分的に
二本鎖となった配列(配列同定番号NO:19及び配列同定番号NO:20から成る)
を有する5‘端アダプタにアニールして、
を有する結紮された複合体を作製する。
固相結合したcDNAをII型制限エンドヌクレアーゼBsgIで消化すると、cD
NAインサートが5‘端から規定された距離で切断され、部分的に二本鎖となっ
た配列(配列同定番号NO:23及び配列同定番号NO:24から成る):
を有する断片が解放される。
次に、この解放された断片を、部分的に二本鎖をなった配列(配列同定番号NO:
13及び配列同定番号NO:14から成る):
を有する16倍変性第二アダプタに結紮して、部分的に二本鎖になった配列(
配列同定番号NO:25及び配列同定番号NO:26から成る):
を有する結紮された断片を作製する。
次にこの断片を、以下のクローニング部位:
が生じるよう、予め制限エンドヌクレアーゼEcoRI及びNotIで消化したクローニ
ング・ベクタ内に結紮する。
その結果得られる組換えベクタを、次にコンピテントE.coli内に形質転換させ
てプラスミドDNAを作製する。このプラスミドDNAを次に制限エンドヌクレ
アーゼSau3Aで消化して、部分的に二本鎖となった配列(配列同定番号NO:17及び
配列同定番号NO:18から成る):
を有する標識を解放する。実施例4−標識の配列決定
実施例3で作製した標識を互いに混合し、一個の分子中30から40個の標識
から成る縦列アレイを作製するためにDNAリガーゼで酵素処理する。30から
40個の標識長を単離するために、約420から560個のヌクレオチド長のD
NA配列を例えば上述のSambrook et al.,に説かれたようなアガロース・ゲル電
気泳動法により単離する。次にこの30から40個の標識のアレイをシークエン
シング・ベクタ内にクローンする。適したシークエンシング・ベクタは当業者に
公知である。適したシークエンシング・ベクタの一例はpUCl9である。こうして
、この標識を含有するシークエンシング・ベクタを自動DNA配列分析にかける
。実施例5−cDNAライブラリを標識配列でプローブすることによる、遺伝子発 現頻度の判定
ある特定の配列の標識が、個々の標識の収集中に多く又は少なく現れているよ
うであれば、その標識を単離した遺伝子の実際の頻度を、その親cDNAライブ
ラリをプローブすることにより判定してよい。当業者に公知の標準的方法を用い
てこの親cDNAライブラリをプローブしてもよい。例えば、プラスミドの単離
又は標識作製のためにバクテリア・コロニーを単離する前に、このコロニーを含
有するプレートに、ニトロセルロース又はナイロンの膜を被せて複製コピーを作
製してもよい。あるいはその代わりに、同じ組織源から新しいcDNAライブラ
リをプラスミド又はファージ・ベクタ中に作製し、上述したようにフィルタに晒
してもよい。次に、このフィルタを、目的の標識と同じ配列を有する合成オリゴ
ヌクレオチド・プローブに暴露する。プローブは、まず、J.Sambrook et al.,“
Molecular Cloning:A Laboratory Manual.,Sccond Ed.及びその他のソースで
説かれたような標準的技術を用いて32Pでラベルする。次にフィルタを洗浄して
X線フィルムに感光する。プローブにハイブリダイズしているコロニー又はプラ
ークの数を計数し、スクリーンされたライ
ブラリ中のコロニーの総数でその数を除算すると、このライブラリを得た組織中
における転写の広がりの頻度を推定できる。実施例6−示差的に発現した遺伝子のクローニング
本発明の方法を用いて示差的に発現した遺伝子を単離してもよい。特に、相対
的に過剰に発現した遺伝子を同定かつ単離してもよい。関連する組織(例えば腫
瘍と、それが発生した正常組織)を由来とする別々のライブラリ中の標識頻度を
比較することにより、それら組織の一方で過剰に又は不足して発現しており、い
ずれかの組織の病理学的又はその他の表現型に関係する可能性のある遺伝子に対
応する標識を同定することが可能である。これらの「示差的に発現した」遺伝子
をより充分に特徴づけるには、ヒトRNA又はcDNA配列の適宜フィルタされ
たデータベースでその標識配列を検索することができる。あるいは、その標識配
列を、実施例5で説明したようにハイブリダイゼーション用のプローブとして用
いてcDNAライブラリから完全長のクローンを同定してもよい。こうして、こ
れらのクローンを配列決定し、標準的な手法を用いて既知の遺伝子に対するホモ
ロジーを調べてもよい。
等価物
当業者であれば、ごく通常の実験を用いるのみで、ここに説明した本発明の具
体的な実施例に対する等価物を数多く認識され、又は確認できることであろう。
このような等価物は以下の請求の範囲の包含するところとして意図されている。
配列表
─────────────────────────────────────────────────────
フロントページの続き
(72)発明者 サジャディ フレイドン ジー.
アメリカ合衆国 92024 カリフォルニア
州 エンシニタス、プラムツリードライブ
1548