JP2000515006A - コードアダプターの連結による配列決定 - Google Patents

コードアダプターの連結による配列決定

Info

Publication number
JP2000515006A
JP2000515006A JP10500755A JP50075598A JP2000515006A JP 2000515006 A JP2000515006 A JP 2000515006A JP 10500755 A JP10500755 A JP 10500755A JP 50075598 A JP50075598 A JP 50075598A JP 2000515006 A JP2000515006 A JP 2000515006A
Authority
JP
Japan
Prior art keywords
tag
oligonucleotide
polynucleotide
adapter
nucleotides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10500755A
Other languages
English (en)
Other versions
JP2000515006A5 (ja
JP4124377B2 (ja
Inventor
アルブレッチ,グレン
ブレナー,シドニー
エイチ. ロイド,デイビッド
ビー. ダブリッジ,ロバート
シー. パラス,マイケル
Original Assignee
リンクス セラピューティクス,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/659,453 external-priority patent/US5846719A/en
Application filed by リンクス セラピューティクス,インコーポレイテッド filed Critical リンクス セラピューティクス,インコーポレイテッド
Publication of JP2000515006A publication Critical patent/JP2000515006A/ja
Publication of JP2000515006A5 publication Critical patent/JP2000515006A5/ja
Application granted granted Critical
Publication of JP4124377B2 publication Critical patent/JP4124377B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Abstract

(57)【要約】 本発明は、コードアダプターの1つ以上のセットの標的ポリヌクレオチド末端への連結に基づく核酸配列分析の方法を提供する。その突出鎖が標的ポリヌクレオチドの相補的突出鎖と完全にマッチした2重鎖を形成するコードアダプターが連結され、そして突出鎖におけるヌクレオチドの同一性は、コードアダプターにより保持されるオリゴヌクレオチドタグにより決定される。このような決定すなわち「解読」は、標識タグ相補物を連結されたアダプター上のその対応するタグに特異的にハイブリダイズさせることにより行われる。

Description

【発明の詳細な説明】 コードアダプターの連結による配列決定 発明の分野 本発明は、一般的に、ポリヌクレオチドのヌクレオチド配列を決定するための 方法、より詳細には、コードアダプターの特異的連結によりポリヌクレオチドの 末端ヌクレオチドを同定する方法に関する。 発明の背景 ほとんど全ての科学的および商業的適用のための選り抜きのDNA配列決定法は 、Sanger(例えば、Sangerら、Proc.Natl.Acad.Sci.,74:5463-5467(1977))によ り開拓されたジデオキシ鎖終結アプローチに基づく。この方法はいくつかの方法 により改善され、そして種々の形態で、全ての市販されているDNA配列決定器機 において使用される(例えば、Hunkapillerら、Science,254:59-67(1991))。 鎖終結法は、各々が共通の起源を有し、そして各々が既知の塩基で終結する、 標識DNAフラグメントの1セット以上の作製を必要とする。次いで、フラグメン トのセット(単数または複数)は、配列情報を得るためにサイズにより分離され なければならない。サイズ分離は、通常、高分離度ゲル電気泳動により達成され 、これはたった1つのヌクレオチドでサイズが異なる非常に大きなフラグメント を区別する能力を有さなければならない。多くの著しい改善(例えば、細孔配列 (capillary array)および非ゲル電気泳動分離媒体の使用を用いる分離)にも かかわらず、この技術は、小型化または大規模に並行する実行に容易に向いてい ない。 DNA配列決定へのSangerに基づくアプローチに対する代替として、いくつかの いわゆる「1塩基ずつ」または「単一塩基」配列決定アプローチが調べられた( 例えば、Cheeseman、米国特許第5,302,509号;Tsienら、国際出願WO 91/06678; Rosenthalら、国際出願WO 93/21340;Canardら、Gene,148:1-6(1994);およびM etzkerら、Nucleic Acids Research,22:4259-4267(1994))。これらのアプ ローチは、化学的または生化学的操作のサイクルあたりの単一ヌクレオチドの決 定より特徴づけられ、そして分離工程を必要としない。従って、それらが考えら れるように実行され得る場合、「1塩基ずつ」のアプローチは、多くの配列決定 反応を、例えば、微粒子または固相配列に付着させた標的ポリヌクレオチド上で 並行して行う可能性を約束する(例えば、国際特許出願PCT/US95/12678(WO96/12 039))。 不運なことに、「1塩基ずつ」の配列決定スキームは、非常に多くの問題(例 えば、完全な配列決定操作における数ヌクレオチドより多くのいずれかの決定を 妨げる非効率的な化学的性質)のために広範な適用を有さなかった。さらに、酵 素操作を必要とする1塩基ずつのアプローチにおいて、さらなる問題は、自動化 プロセシングに使用される器具使用で生じる。一連の酵素的工程が高い表面対容 積比および狭いチャンネル面積を有する反応チャンバーにおいて行われる場合、 酵素は表面成分に固着し得、これは洗浄および連続プロセシング工程を非常に難 しくする。タンパク質の蓄積はまた、分子レポーターシステム、特に蛍光標識を 使用するものに影響を与え、そしてこのようなシステムに基づく測定の解釈を難 しくかつ不便にする。これらのおよび類似の困難は、並行する配列決定の努力へ の「1塩基ずつ」の配列決定スキームの適用を著しく示した。 複数の酵素を使用する反復プロセシングサイクルを最小化するか、または削除 する代替のアプローチが、ポリヌクレオチドの末端ヌクレオチドの決定に利用可 能な場合、特に自動化システムにおいて、1塩基ずつの配列決定技術における重 要な進歩が遂げられ得る。 発明の要旨 従って、本発明者らの発明の目的は、現在の1塩基ずつのアプローチの欠点を こうむらないDNA配列決定スキームを提供することである。 本発明者らの発明の別の目的は、共通の反応容器に存在する何千のDNAフラグ メントに対して並行してまたは同時に適用しやすいDNA配列決定の方法を提供す ることである。 本発明者らの発明のさらなる目的は、最小の酵素的工程で標的ポリヌクレオチ ドの末端部分の同定を可能にするDNA配列決定の方法を提供することである。 本発明者らの発明のなお別の目的は、1つ以上の標的ポリヌクレオチドの複数 の末端ヌクレオチドの配列を同定するためのコードアダプターの1セットを提供 することである。 本発明者らの発明は、コードアダプターの1つ以上のセットの標的ポリヌクレ オチド末端への(または並行した配列決定操作において使用される場合、複数の 標的ポリヌクレオチド末端への)連結に基づく核酸配列分析の方法を提供するこ とによりこれらのおよび他の目的を提供する。各コードアダプターは、突出鎖お よび最小にクロスハイブリダイズするオリゴヌクレオチドのセットから選択され るオリゴヌクレオチドタグを含む。コードアダプター(その突出鎖は、標的ポリ ヌクレオチドの相補的突出鎖と完全にマッチした2重鎖を形成する)が連結され る。連結後、突出鎖におけるヌクレオチドの同一性および順序が決定されるか、 または連結アダプター上のその対応するタグに相補的な標識タグを特異的にハイ ブリダイズさせることにより「解読(decode)」される。 例えば、4つのヌクレオチドの突出鎖(例えば、5'-AGGT)を有するコードア ダプターが、標的ポリヌクレオチドの相補的な突出鎖と完全にマッチした2重鎖 を形成し、そして連結される場合、ポリヌクレオチド上の4つの相補的ヌクレオ チド3'-TCCAは、突出鎖の全ての可能な4つのヌクレオチド配列について1つで ある、256のこのようなタグのセットから選択される唯一のオリゴヌクレオチド タグにより同定され得る。タグ相補物は、連結されたアダプターのオリゴヌクレ オチドタグと共に完全にマッチする2重鎖(または3重鎖)を形成するそれらの タグ相補物のみの特異的なハイブリダイゼーションを可能にする条件下で、連結 アダプターに適用される。タグ相補物は、オリゴヌクレオチドタグ、従って突出 鎖の配列の同一性を決定するために、個々にまたは1つ以上の混合物として適用 され得る。 以下により十分に説明されるように、コードアダプターは、(i)Brenner米 国特許第5,599,675号およびPCT公報第WO 95/27080号に記載されるように、連結 、同定、および切断の反復サイクルを含むプロセスの工程として1つ以上のヌク レオチドを同定するために、または(ii)「スタンド(stand)単独」同定方法( こ こで、コードアダプターのセットが標的ポリヌクレオチドに適用され、その結果 各セットが標的ポリヌクレオチドの異なる部分のヌクレオチド配列を同定し得る )としてのいずれかで、配列分析において使用され得る;すなわち、後者の実施 態様において、配列分析は、各セットの単一の連結、それに続く同定を用いて行 われる。 コードアダプターの重要な特性は、例えば、国際特許出願PCT/US95/12791(WO 96/12041)およびPCT/US96/09513(WO 96/41011)に記載されるような、最小にクロ スハイブリダイズするオリゴヌクレオチドのセットのメンバーであるオリゴヌク レオチドタグの使用である。このようなセットのオリゴヌクレオチドの配列は、 少なくとも2つのヌクレオチドで同じセットの全ての他のメンバーの配列と異な る。従って、このようなセットの各メンバーは、2未満のミスマッチを有する任 意の他のメンバーの相補物と2重鎖(または3重鎖)を形成し得ない。好ましく は、最小にクロスハイブリダイズするセットの各メンバーは、特定の適用に必要 とされるセットのサイズに一致したできるだけ多くのヌクレオチドで全ての他の メンバーと異なる。例えば、標識をコードアダプターに送達するために12〜20マ ーのようなより長いオリゴヌクレオチドタグが使用される場合、最小にクロスハ イブリダイズするセットのメンバー間の差異は、好ましくは、2より著しく大き い。好ましくは、このようなセットの各メンバーは、少なくとも4つのヌクレオ チドで全ての他のメンバーと異なる。より好ましくは、このようなセットの各メ ンバーは少なくとも6つのヌクレオチドで全ての他のメンバーと異なる。本発明 のオリゴヌクレオチドタグの相補物は、「タグ相補物」と本明細書中で呼ばれる 。 オリゴヌクレオチドタグは1本鎖であり得、そして2重鎖形成による1本鎖タ グ相補物への特異的ハイブリダイゼーションのために設計され得る。オリゴヌク レオチドタグはまた2本鎖であり得、そして3重鎖形成による1本鎖タグ相補物 への特異的ハイブリダイゼーションのために設計され得る。好ましくは、コード アダプターのオリゴヌクレオチドタグは2本鎖であり、そしてそれらのタグ相補 物は1本鎖であり、その結果その相補物とのタグの特異的ハイブリダイゼーショ ンは、3重鎖構造の形成により生じる。 好ましくは、本発明の方法は以下の工程:(a)コードアダプターをポリヌク レオチド末端に連結する工程であって、アダプターはオリゴヌクレオチドの最小 にクロスハイブリダイズするセットから選択されたオリゴヌクレオチドタグおよ びポリヌクレオチドの突出鎖に相補的な突出鎖を有する工程;ならびに(b)タ グ相補物をコードアダプターのオリゴヌクレオチドタグに特異的にハイブリダイ ズさせることにより、ポリヌクレオチドの突出鎖における1つ以上のヌクレオチ ドを同定する工程、を包含する。 図面の簡単な説明 図1A〜1Eは、複数のタグ化ポリヌクレオチドの末端ヌクレオチド配列を決定す るためのコードアダプターの使用を模式的に示す。 図2は、固相支持体に固定される同一ポリヌクレオチドの自己連結の現象を示 す。 図3Aは、ブロックされた3'炭素を有する2本鎖アダプターが標的ポリヌクレオ チドに連結される、本発明の好ましい方法における工程を示す。 図3Bは、連結および切断の段階を追ったサイクルによるDNA配列決定方法にお ける好ましい実施態様の使用を示す。 図4は、本発明の方法を用いる試験ポリヌクレオチドの末端ヌクレオチドの決 定によるデータを示す。 図5は、配列決定のためにcDNA分予で充填された微粒子の平面配列を観察する ための、フローチャンバーおよび検出装置の模式図である。 定義 本明細書中で使用される用語「コードアダプター」は、優先権書類である米国 特許出願第08/689,587号の用語「コードプローブ」と同義に使用される。 本明細書中で使用される用語「連結」は、1つ以上(通常2つ)のオリゴヌク レオチドの末端間での共有結合の形成を意味する。通常、この用語は、以下の反 応により生じるホスホジエステル結合の形成をいい、これは通常リガーゼにより 触媒される: オリゴ1(5')-OP(O-)(=O)O+HO-(3')オリゴ2-5' →オリゴ1(5')-OP(O-)(=O)O-(3')オリゴ2-5' ここで、オリゴ1およびオリゴ2は、2つの異なるオリゴヌクレオチドまたは同じ オリゴヌクレオチドの異なる末端のいずれかである。この用語は、ホスホジエス テル結合の非酵素的形成、ならびにオリゴヌクレオチド末端間での非ホスホジエ ステル共有結合(例えば、ホスホロチオエート結合、ジスルフィド結合など)の 形成を含む。連結反応は、通常テンプレートにより駆動され、オリゴ1およびオ リゴ2の末端は、テンプレート鎖への特異的ハイブリダイゼーションにより並置 して導かれる。テンプレート駆動連結の特殊なケースは、相補的突出鎖を有する 2つの2本鎖オリゴヌクレオチドの連結である。 オリゴヌクレオチドタグに関して本明細書中で用いられる「相補物」または「 タグ相補物」は、オリゴヌクレオチドタグが特異的にハイブリダイズして完全に マッチした2重鎖または3重鎖を形成するオリゴヌクレオチドをいう。特異的ハ イブリダイゼーションが3重鎖を生じる実施態様では、オリゴヌクレオチドタグ は2本鎖または1本鎖のいずれかであるように選択され得る。従って、3重鎖が 形成される場合、用語「相補物」は、1本鎖オリゴヌクレオチドタグの2本鎖相 補物または2本鎖オリゴヌクレオチドタグの一本鎖相補物のいずれかを包含する ことを意味する。 本明細書で用いられる用語「オリゴヌクレオチド」は、モノマー対モノマーの 相互作用の通常のパターン(例えば、ワトソン−クリック(Watson-Crick)型の 塩基対形成、塩基の積み重ね、フーグスティーン(Hoogsteen)または逆フーグ スティーン型の塩基対形成など)により標的ポリヌクレオチドに特異的に結合し 得る、天然のまたは改変されたモノマーまたは連結物(デオキシリボヌクレオシ ド、リボヌクレオシド、それらのアノマー型、ペプチド核酸(PNA)などを含む)の 直鎖状オリゴマーを含む。通常、モノマーは、ホスホジエステル結合またはその アナログにより連結され、少数のモノマーユニット(例えば3〜4)から数10のモ ノマーユニット(例えば、40〜60)のサイズの範囲のオリゴヌクレオチドを形成 する。オリゴヌクレオチドが一連の文字(例えば、「ATGCCTG」)により示される 場合はいつも、他に記載されない限り、ヌクレオチドは左から右に5'→3'の順で あり、「A」はデオキシアデノシンを示し、「C」はデオキシシチジンを示し、 「G」はデオキシグアノシンを示し、および「T」はチミジンを示すことが理解さ れる。通常、本発明のオリゴヌクレオチドは、4つの天然のヌクレオチドを含む ;しかし、それらはまた、非天然のヌクレオチドアナログを含み得る。天然また は非天然のヌクレオチドを有するオリゴヌクレオチドが用いられ得る場合、例え ば、酵素によるプロセシングが必要とされる場合、通常、天然のヌクレオチドか らなるオリゴヌクレオチドが必要であることが当業者には明らかである。 二重鎖に関して「完全にマッチした」は、二重鎖を作製するポリヌクレオチド 鎖またはオリゴヌクレオチド鎖が、各鎖中の全てのヌクレオチドが他鎖中のヌク レオチドとワトソン−クリック塩基対形成を受けるように、互いに2本鎖構造を 形成することを意味する。この用語はまた、用いられ得るヌクレオシドアナログ (例えば、デオキシイノシン、2-アミノプリン塩基を有するヌクレオシドなど) の対形成を含む。三重鎖に関しては、この用語は、三重鎖が完全にマッチした二 重鎖および第3鎖からなり、ここで、全てのヌクレオチドが、完全にマッチした 二重鎖の塩基対とのフーグスティーンまたは逆フーグスティーン会合を受けるこ とを意味する。逆に、二重鎖におけるタグとオリゴヌクレオチドとの間の「ミス マッチ」は、二重鎖または三重鎖におけるヌクレオチドの対またはトリプレット (triplet)がワトソン−クリックおよび/またはフーグスティーンおよび/また は逆フーグスティーン結合を受け得ないことを意味する。 本明細書中で用いられる「ヌクレオシド」は、天然のヌクレオシドを含み、こ れは2'-デオキシ形態および2'-ヒドロキシル形態(例えば、KornbergおよびBaker 、DNA Replication、第2版(Freeman,San Francisco,1992)に記載される)を含 む。ヌクレオシドに関して「アナログ」は、改変された塩基部分および/または 改変された糖部分を有する合成ヌクレオシド(例えば、Scheit,Nucleotide Anal ogs(John Wiley,New York,1980);UhlmanおよびPeyman,Chemical Reviews,9 0:543-584(1990)などに記載される)などを含む。ただし、それらは特異的にハイ ブリダイズし得る。このようなアナログは、結合特性を増強する、複雑度を減少 させる、特異性を増大させるなどのために設計された合成ヌクレオシドを含む。 本明細書中で使用される、ポリヌクレオチドに関する「配列決定」または「ヌ クレオチド配列を決定すること」は、ポリヌクレオチドの部分的ならびに全配列 情報の決定を含む。すなわち、この用語は、標的ポリヌクレオチドについての配 列比較、フィンガープリンティング、および同様のレベルの情報、ならびに標的 ポリヌクレオチドにおけるヌクレオシド、通常各ヌクレオシドの明確な同定およ び順序付けを含む。この用語はまた、標的ポリヌクレオチド内の4つの型のヌク レオチドのうちの1つ、2つ、または3つの同一性、順序、および位置の決定を 含む。例えば、いくつかの実施態様において、配列決定は、標的ポリヌクレオチ ド「CATCGC」内の単一の型のヌクレオチド(例えば、シトシン)の順序および位 置を同定することによりもたらされ得、その結果、その配列は、二進符号(例え ば、「C-(Cでない)-(Cでない)-C-(Cでない)-C...」について「100101...」)な どとして示される。 本明細書中で使用される、ポリヌクレオチドの集団に関する用語「複雑度」は 、この集団に存在する分子の異なる種の数を意味する。 発明の詳細な説明 本発明は、1つ以上の標的ポリヌクレオチドの末端(単数または複数)に特異 的にハイブリダイズするコードアダプターの連結を含む。特異的ハイブリダイゼ ーションが起こる領域についての配列情報は、このように連結されたコードアダ プターのオリゴヌクレオチドタグを「解読」することにより得られる。本発明の 1つの局面において、コードアダプターの複数セットは、付着(staggered)切断 点で標的ポリヌクレオチドに連結され、その結果コードアダプターは、標的ポリ ヌクレオチドの複数の部分のそれぞれから配列情報を提供する。このような部分 は、ばらばらであり得るか、重複し得るか、または連続的であり得る;しかし、 好ましくは、この部分は連続的であり、そして個々の部分の長さの和に等しいヌ クレオチド配列の同定を共に可能にする。この局面において、コードアダプター の単一の連結、それに続く連結されたアダプターのタグを「解読すること」によ る同定のみが存在する。本発明の別の局面において、コードアダプターは、以下 により十分に記載される、連結、同定、および切断の反復サイクルを含むプロセ スにおいて同定工程として使用される。 後者の実施態様において、本発明は、その認識部位がそれらの切断部位から離 れているヌクレアーゼを使用する。好ましくは、このようなヌクレアーゼは、II 型制限エンドヌクレアーゼである。このヌクレアーゼは、コードアダプターが連 結される標的ポリヌクレオチド上に突出鎖を作製するために使用される。本発明 の所定の実施態様で得られる配列情報量は、このようなヌクレアーゼがどれくら い使用されるか、および切断の際にどれくらいの長さの突出鎖が生じるかに部分 的に依存する。 本発明の重要な局面は、多くの標的ポリヌクレオチドを並行して配列決定する 能力である。この局面において、本発明の方法は、以下の工程を包含する: (a)レパートリー由来の各第1のオリゴヌクレオチドタグが第1の最小にクロ スハイブリダイズするセットから選択されるように、タグのレパートリー由来の 第1のオリゴヌクレオチドタグを、ポリヌクレオチドの集団中の各ポリヌクレオ チドに付着させる工程;(b)集団中の実質に全ての異なるポリヌクレオチドが 、付着された異なる第1のオリゴヌクレオチドタグを有するように、ポリヌクレ オチドの集団をサンプリングする工程;(c)1つ以上のコードアダプターを集 団中の各ポリヌクレオチドの末端に連結する工程であって、各コードアダプター は、第2の最小にクロスハイブリダイズするセットから選択される第2のオリゴ ヌクレオチドタグおよび集団のポリヌクレオチドの突出鎖に相補的な突出鎖を有 する、工程;(d)第1のオリゴヌクレオチドタグとそれらのそれぞれの相補物 とを特異的にハイブリダイズさせることにより集団のポリヌクレオチドを選別す る工程であって、それぞれの相補物は、1つ以上の固相支持体上の空間的に別々 の領域において実質的に同一のオリゴヌクレオチドの均一の集団として付着され る、工程;および(e)タグ相補物を1つ以上のコードアダプターの各第2のオ リゴヌクレオチドタグに特異的にハイブリダイズさせることにより、ポリヌクレ オチドの上記の突出鎖における1つ以上のヌクレオチドを同定する工程。この実 施態様において、1つ以上のコードアダプターが、ポリヌクレオチドが第1のオ リゴヌクレオチドタグにより固相支持体上に選別される前または後のいずれかに 、ポリヌクレオチド末端に連結され得る。好ましい実施態様において、コードア ダプターは、コードアダプターがポリヌクレオチドから切断され、そしてポリヌ クレオチドが配列同定後に短縮されるのを可能にする、II型制限エンドヌクレア ーゼ部 位を含む。 好ましい実施態様によれば、この方法は、連結、同定、および切断の反復サイ クルをさらに含み、その結果1つ以上のヌクレオチドが各サイクルで同定される 。 好ましくは、2〜6のヌクレオチドが同定され、そしてそれらの順序が各サイク ルで決定される。 連結および切断のサイクルを使用しない配列分析 本発明に従う連結および切断のサイクルを使用しない配列分析は、図1A〜1Eの 実施態様により示される。この実施態様において、k個の標的ポリヌクレオチド は、以下、およびBrenner、国際特許出願PCT/US95/12791(WO 96/12041)およPCT/ US96/09513(WO 96/41011)に記載ように調製される。すなわち、サンプルは、小 さな「t」により示されるオリゴヌクレオチドタグに結合したポリヌクレオチド の集団から採取される。これらのタグは、選別のためのオリゴヌクレオチドタグ または「第1の」オリゴヌクレオチドタグと呼ばれる。サンプルのタグ-ポリヌ クレオチド結合体は、図1Aにおける(14)〜(18)により示される、結合体の1〜k 個の集団を得るために、例えば、ポリメラーゼ連鎖反応(PCR)またはクローニ ングにより増幅される。好ましくは、(小さな「t」)タグの反対の結合体の末 端は、1つ以上のアダプターを連結するために調製され、これらのそれぞれは、 その切断部位がその認識部位から離れている、ヌクレアーゼの認識部位を含む。 示された実施態様において、「切断アダプター」と本明細書中で呼ばれる3つの このようなアダプターが使用される。使用されるこのようなアダプターの数は、 所望される配列情報の量、適切な勢力範囲および切断特徴を有するII型ヌクレア ーゼの利用可能性などを含むいくつかの要因に依存する。好ましくは、1〜3つ の切断アダプターが使用され、そしてこのアダプターは、切断後に少なくとも4 つのヌクレオチドの突出末端を作製し得る、異なるII型ヌクレアーゼを適応させ るための設計である。 本発明の方法が、cDNA集団の配列決定をするサインに適用される場合、切断ア ダプターの連結前に、タグ-ポリヌクレオチド結合体は、高頻度の認識部位を有 する制限エンドヌクレアーゼ(例えば、TaqI、AluI、HinPlI、DpnII、NlaIIIな ど)で切断され得る。平滑末端を残すAluIのような酵素について、付着末端は、 例えば、上記で引用されたBrenner、国際特許出願PCT/US95/12791およびKuijper ら、Gene,112:147-155(1992)に記載のようにT4 DNAポリメラーゼを用いて産生 され得る。標的ポリヌクレオチドがTaqIでの切断により調製される場合、以下の 末端は連結に利用可能である: 従って、3つの切断アダプターの例示的なセットが、以下のように構築され得 る: ここで、切断アダプター(1)、(2)、および(3)は大文字で示され、ヌク レアーゼBbsI、BbvI、およびBsmFIのそれぞれの認識部位は下線で示され、そし て5'リン酸は「p」として示される。標的ポリヌクレオチドの二重下線部分は、 連結および切断後の突出鎖の位置を示す。全ての場合において、標的ポリヌクレ オチドは、4つのヌクレオチドの5'突出鎖が残される。明らかに、多くの異なる 実施態様は、ヌクレアーゼの異なる数および種類を用いて構築され得る。Brenne r、米国特許第5,599,675号およびWO 95/27080に記載されるように、好ましくは 、切断前に、内部BbsI、BbvI、およびBsmFI部位は、標的ポリヌクレオチドの内 部部位での所望でない切断を妨げるために、例えば、メチル化によりブロックさ れる。 示された実施態様に戻って、切断アダプターA1、A2、およびA3は、図1Bに示さ れる結合体を得るために、k個の標的ポリヌクレオチドに対して1:1:1の濃度比 で連結され(20)、その結果、タグ-ポリヌクレオチド結合体の各集団内に、付着 されたA1、A2、およびA3を有するほぼ等しい数の結合体が存在する。連結(20) 後に、標的ポリヌクレオチドは、切断アダプターの各ヌクレアーゼで連続的に切 断され、そして1セットのコードアダプターに連結される。最初に、標的ポリヌ クレオチドは、切断アダプターA1のヌクレアーゼで切断され(22)、この後、第1 のセットのコードアダプターが、得られた突出鎖に連結される。この切断は、連 結に利用可能な各型(すなわち、t1、t2、...tk)の標的ポリヌクレオチドの約1 /3をもたらす。好ましくは、コードアダプターは、突出鎖の全ての可能な配列を まとめて含む、1つ以上のアダプター混合物として適用される。その突出鎖が標 的ポリヌクレオチドの突出鎖と完全にマッチした2重鎖を形成するコードアダプ ターのみが連結して、コード結合体を形成するように、反応条件が選択される( 28)、(30)、および(32)(図1C)。小文字つきの大文字「T」は、唯一のオ リゴヌクレオチドタグが標識のためにコードアダプターにより保持されることを 示す。コードアダプターにより保持されるオリゴヌクレオチドタグは、時々、標 識をコードアダプターに送達するためのタグまたは「第2の」オリゴヌクレオチ ドタグと呼ばれる。以下により十分に記載されるように、選別のために使用され る1本鎖オリゴヌクレオチドタグは、好ましくは、4つのヌクレオチドのうちの 3つのみからなり、その結果、T4 DNAポリメラーゼ「ストリッピング(stripping )」反応(例えば、Kuijperら(上記))が、固相支持体へのロードのための標的 ポリヌクレオチドを調製するために使用され得る。他方では、標識を送達するた めに使用されるオリゴヌクレオチドタグは、全てのヌクレオチドからなり得る。 上記のように、コードアダプターは、突出鎖(24)およびオリゴヌクレオチドタ グ(26)を含む。従って、t1-ポリヌクレオチド結合体の「A1」切断が以下の末端 :を生じる場合、オリゴヌクレオチドタグT24は、以下の構造(配列番号1)を有 し得る: ここで、2本鎖部分は、唯一のタグ相補物と完全にマッチした3重鎖を形成し、 そして全ての他のタグ相補物と少なくとも6つのミスマッチで3重鎖を形成する 、48個(=12個のヌクレオチド位置×4種類のヌクレオチド)の2本鎖20マーオ リゴヌクレオチドタグの1セットのうちの1つであり得る。本実施例におけるコ ードアダプターは、計768(3×256)メンバーの1つ以上の混合物中の標的ポリ ヌクレオチドに連結され得る。必要に応じて、コードアダプターはまた、4つの ヌクレオチド配列「ttct」が突出鎖とオリゴヌクレオチドタグとの間のスペーサ ーとして作用する、上記の実施例において示されるようなスペーサー領域を含み 得る。 第1のセットのコードアダプターの連結(28)、(30)、および(32)後、タ グ-ポリヌクレオチド結合体は、切断アダプターA2のヌクレアーゼで切断され(3 4)、この後、第2のセットのコードアダプターが結合体を形成するために適用 される(36)、(38)、および(40)(図1D)。最後に、タグ-ポリヌクレオチ ド結合体は、切断アダプターA3のヌクレアーゼで切断され(42)、この後、第3 のセットのコードアダプターが結合体を形成するために適用される(44)、(46 )、および(48)(図1E)。コードアダプターの連続する切断および連結の完了 後、混合物は、以下により十分に記載され、そしてBrenner(例えば、PCT/US95/ 12791またはPCT/US96/09513)により教示されるように、オリゴヌクレオチドタ グt1〜tkを介して1つ以上の固相支持体にロードされる(50)。単一の標的ポリ ヌクレオチドが分析される場合、明らかに複数のオリゴヌクレオチドタグ、t1、 t2、...tkは必要ない。このような実施態様において、選別が必要とされない場 合、ビオチンまたは同様の部分が、ポリヌクレオチド-コードアダプター結合体 を固定するために使用され得る。また、切断、連結、および固相支持体へのロー ディング工程の順序は、実行される特定の実施態様に依存する。例えば、タグ- ポリヌクレオチド結合体は、最初に、固相支持体にロードされ、続いて切断アダ プターの連結、その切断、およびコードアダプターの連結が行われ得る;または 切断アダプターが、最初に連結され、続いてローディング、切断、およびコード アダプターの連結が行われ得るなどである。 コードアダプターが本発明に従って標的ポリヌクレオチドの末端に連結された 後、配列情報は、コードアダプターのオリゴヌクレオチドタグとそれらの個々の タグ相補物との間に完全にマッチした2重鎖および/または3重鎖の形成を可能 にする条件下で、個々にまたは混合物としてのいずれかで固定化標的ポリヌクレ オチドに標識タグ相補物を連続的に適用することにより得られる。混合物の数お よび複雑度は、使用される標識システムの型、部分(その配列が同定される)の 長さ、複雑度を低減するアナログが使用されるか否かなどを含む、いくつかの要 因に依存する。好ましくは、図1a〜1eに示される実施態様について、単一の蛍光 色素が、48(=3×16)のタグ相補物のそれぞれを標識するために使用される。 タグ相補物は、標的ポリヌクレオチドの各4つのヌクレオチド部分のヌクレオチ ドを同定するために個々に適用される(すなわち、計48について各12位置に対す る4つのタグ相補物)。明らかに、異なる長さの部分が、タグ相補物の異なる数 を必要とし、例えば、本実施例によれば、5ヌクレオチド部分は20のタグ相補物 を必要とし、2ヌクレオチド部分は8タグ相補物を必要とするなどである。タグ 相補物は、完全にマッチした2重鎖のみが形成されるような十分にストリンジェ ントな条件下で適用され、特異的にハイブリダイズしたタグ相補物上の蛍光標識 からのシグナルが測定され、そしてタグ相補物は、次の混合物が適用され得るよ うにコードタグから洗浄される。16個のタグ相補物が、標的配列の4マー部分の 以下の配列と1対1の対応を有する:ここで「N」はヌクレオチドA、C、G、またはTのいずれか1つである。従っ て、各ヌクレオチド位置に対して4つの別々の疑問符(interrogation)、各種 類のヌクレオチドの1つが作製される。この実施態様は、ヌクレオチド決定の増 大した信頼性の代わりに、有意な程度の重複性(計16個のタグ相補物が4つのヌ クレオチドを同定するために使用される)を含む。 あるいは、4つのタグ相補物の12個の混合物はそれぞれ、色素とヌクレオチド の種類との間の1対1の対応があるような4つのスペクトル的に区別可能な蛍光 色素を用いることにより連続して適用され得る。例えば、4つのタグ相補物の混 合物は、第1の蛍光標識がx=Aの場合に観察され、第2の蛍光標識がx=Cの場合に 観察され、第3の蛍光標識がx=Gの場合に観察されるなどのように、突出鎖配列 「nnxn」のヌクレオチド「x」を同定し得る。 さらなる配列情報は、Brenner、国際特許出願PCT/US95/03678(WO 95/27080)に 開示される「マルチステッピング(multi-stepping)」プロセスに類似するプロセ スにおいて上記の実施態様を用いて得られ得る。この実施態様において、本明細 書中で「ステッピングアダプター」といわれる第4のアダプターは、例えば3:l: 1:1の濃度比で、切断アダプターA1、A2、およびA3と共に標的ポリヌクレオチド の末端に連結される。従って、利用可能な末端の約半分は、ステッピングアダプ ターに連結される。ステッピングアダプターは、その区域(reach)(以下に定義 )が、切断アダプターA1、A2、およびA3を介して決定される配列の末端で標的ポ リヌクレオチドの切断を可能にするように配置されるII型ヌクレアーゼの認識部 位を含む。上記の切断アダプターのセットと共に使用され得るステッピングアダ プターの例は、以下の通りである: ここで、上記のように、ヌクレアーゼ(この場合、BpMI)の認識部位は一本下線 が引かれ、そして切断部位のヌクレオチドは二重下線が引かれる。ステッピング アダプターのヌクレアーゼで切断された標的ポリヌクレオチドは、切断アダプタ ーA1、A2、およびA3に含まれるものと同じかまたは異なるヌクレアーゼ認識部位 を含み得る、さらなるセットの切断アダプターA4、A5、およびA6に連結され得る 。コードアダプターの拡大したセットが必要とされるか否かは、切断および連結 反応がシグナル測定装置に許容され得るか否かに依存する。上記のように、シグ ナル測定に関して酵素反応を最小化することが所望される場合、コードアダプタ ーのさらなるセットが使用されなければならない。すなわち、上記の768のオリ ゴ ヌクレオチドタグおよびタグ相補物が、4つのヌクレオチドそれぞれの突出鎖を 産生する6つの切断反応に必要とされる場合、1536のオリゴヌクレオチドタグお よびタグ相補物(64のタグ相補物それぞれの24の混合物)が必要とされる。A1、 A2、およびA3と同じヌクレアーゼ認識部位を有し、そして上記に示されるステッ ピングアダプターと共に使用され得る、例示的な切断アダプターA4、A5、および A6は、以下の通りである: ここで、切断部位は二重下線で示される。切断アダプターA4、A5、およびA6は、 好ましくは、全ての可能な2ヌクレオチド突出鎖が示されるように、混合物とし て適用される。 一旦コードアダプターが連結されると、標的ポリヌクレオチドは、Brenner、 国際特許出願PCT/US95/12791(WO 96/12041)に開示されるように、固相支持体、 好ましくは微粒子へのローディングのために調製される。簡単には、選別のため のオリゴヌクレオチドタグは、T4 DNAポリメラーゼでの「ストリッピング」反応 (例えば、Kuijperら(上記))を用いて1本鎖にされる。1本鎖オリゴヌクレ オチドタグは、特異的にハイブリダイズされ、そして微粒子上のそれらのタグ相 補物に連結される。次いで、ロードされた微粒子は、連続送達、特異的ハイブリ ダイゼーション、およびコードアダプターに対する標識化タグ相補物の除去を可 能にする、Brenner(上記)に記載のような装置において分析される。 コードアダプターが一度だけ標的ポリヌクレオチド(または標的ポリヌクレオ チドの集団)に連結される実施態様において、本発明に従って使用され得る連結 のいくつかの非酵素的テンプレート駆動方法が存在する。このような連結方法は 、Shabarova,Biochimie 70:1323-1334(1988);Dolinnayaら、Nucleic Acids Re search,16:3721-3738(1988);Letsingerら、米国特許第5,476,930号;Gryaznov ら、 Nucleic Acids Research,22:2366-2369(1994);Kangら、Nucleic Acids Resear ch,23:2344-2345(1995);Gryaznovら、Nucleic Acids Research,21:1403-1408( 1993);Gryaznov、米国特許第5,571,677号に開示されるもの、および同様の参考 文献を含むが、それらに限定されない。好ましくは、非酵素的連結は、Letsinge rら(上記)の方法により行われる。この方法において、3'ブロモアセチル化末 端を有するコードアダプターは、相補的突出鎖およびその5'末端にチオホスホリ ル基を有するポリヌクレオチドと反応される。このような化学的性質を使用する 例示的なコードアダプターは、以下の構造を有する: ここで、BおよびB'はヌクレオチドおよびそれらの相補物であり、そしてz,r,s 、q、およびtは以下に記載されるとおりである。Br、C、H、およびNはそれら の通常の化学的意味を有する。上記の参考文献において説明されるように、テン プレート駆動反応において、3'ブロモアセチル化オリゴヌクレオチドは、水性条 件下で5'チオホスホリル基を有するオリゴヌクレオチドと自発的に反応して、チ オホスホリルアセチルアミノ連結を形成する。チオホスホリル基は、Kangら(上 記)に記載されるように、アデノシン-5'-0-(1-チオトリホスフェート)(すなわ ち、g-S-ATP)の存在下でT4キナーゼでの処理により標的ポリヌクレオチドの5' 水酸基に容易に付着される。 連結および切断のサイクルを用いる配列分析 コードアダプターは、連結、同定、および切断のサイクルの反復を含むDNA配 列決定のアダプターに基づく方法(例えば、Brenner、米国特許第5,559,675号お よびPCT公報第WO 95/27080号に記載される方法)において使用され得る。簡単に は、このような方法は、以下の工程を含む:(a)コードアダプターをポリヌク レオチド末端に連結する工程であって、コードアダプターは、その切断部位がそ の認識部位とは離れている、ヌクレアーゼのヌクレアーゼ認識部位を有する、工 程;(b)ポリヌクレオチド末端の1つ以上のヌクレオチドを、それに連結され るコードアダプターの正体により同定する工程;(c)コードアダプターのヌク レアーゼ認識部位を認識するヌクレアーゼでポリヌクレオチドを切断し、その結 果ポリヌクレオチドは1つ以上のヌクレオチドにより短くされる、工程;および (d)ポリヌクレオチドの前記のヌクレオチド配列が決定されるまで、前記の工 程(a)から(c)を反復する工程。同定工程において、タグ相補物の連続セッ トは、上記のように、標的ポリヌクレオチド末端に連結されたコードアダプター により保持されるそれぞれのタグに特異的にハイブリダイズされる。ポリヌクレ オチドの突出鎖におけるヌクレオチドの型および配列は、上記のように、特異的 にハイブリダイズされたタグ相補物およびタグ相補物が生じたセットにより保持 される標識により同定される。 オリゴヌクレオチドタグおよびタグ相補物 オリゴヌクレオチドタグは、本発明の好ましい実施態様において2つの異なる 目的のために使用される:オリゴヌクレオチドタグは、混合物から分析のための 同一ポリヌクレオチドの均一集団へ多数のポリヌクレオチド(例えば、数千から 数10万)を選別するために、Brenner、国際特許出願PCT/US95/12791およびPCT/U S96/09513(WO 96/12041およびWO 96/41011)に記載されるように使用され、そし てそれらは、標識を数十から数千の範囲からなるコードアダプターに送達するた めに使用される。前者の使用のために、多くの数すなわちレパートリーのタグが 代表的に必要とされ、従って、個々のオリゴヌクレオチドタグの合成は問題であ る。これらの実施態様において、タグの組合せ合成が好ましい。他方では、極端 に多くのレパートリーのタグが、例えば、標識をコードアダプターに送達するた めに必要とされない場合、オリゴヌクレオチドタグの最小にクロスハイブリダイ ズするセットは、組合せ的に合成されるのと同様に別々に合成され得る。 Brenner(上記)に記載のように、オリゴヌクレオチドの最小にクロスハイブ リダイズするセットのヌクレオチド配列は、単純なコンピュータープログラム( 例えば、そのソースコード(source code)がAppendixIおよびIIに列挙されるプロ グラムによって例示される)によって簡便に数値化される。同様のコンピュータ ープログラムは、本発明の任意の実施態様についてオリゴヌクレオチドの最小 にクロスハイブリダイズするセットを列挙するために容易に書かれる。以下の表 Iは、示された長さおよび数のヌクレオチド差異の数についての最小にクロスハ イブリダイズするオリゴヌクレオチドのセットのサイズに関するガイダンスを提 供する。上記のコンピュータープログラムを使用して、数値を生成した。 表I4つのヌクレオチドからなるワードの最小にクロスハイブリダイズするセット 数百から数千のオリゴヌクレオチドまたは数万のオリゴヌクレオチドでさえも含 むセットは、例えば、Frankら、米国特許第4,689,405号;Frankら、Nucleic Aci ds Research,11:4365-4377(1983);Matsonら、Anal.Biochem.,224:110-116(199 5);Fodorら、国際出願PCT/US93/04145(WO 93/22684);Peaseら、Proc.Natl.Aca d.Sci.,91:5022-5026(1994);Southernら、J.Biotechnology,35:217-227(1994) 、Brennan、国際出願PCT/US94/05896(WO 94/27719);Lashkariら、Proc.Natl.Ac ad.Sci.,92:7912-7915(1995)などに開示されるような、種々の並行合成アプロー チにより直接合成され得る。 好ましくは、混合物中のタグ相補物は、組合せ的に合成されたかまたは個々に 合成されたかにかかわらず、完全にマッチしたハイブリッドが類似したまたは実 質的に同一の融解温度を有するような互いに類似した二重鎖または三重鎖安定性 を有するように選択される。これは、ミスマッチタグ相補物が、コードアダプタ ーに適用される場合(例えば、ストリンジェントな条件下で洗浄することにより )、完全にマッチしたタグ相補物とより容易に区別されるされることを可能にす る。組合せ的に合成されたタグ相補物について、最小にクロスハイブリダイズす るセットは、このセット中の全ての他のサブユニットとほぼ同等の二重鎖安定性 に寄与するサブユニットから構築され得る。このような選択を行うためのガイダ ンスは、最適PCRプライマーを選択し、そして二重鎖安定性を計算するための公 開された技術(例えば、Rychlikら、Nucleic Acids Research,17:8543-8551(19 89)および18:6409-6412(1990);Breslauerら、Proc.Natl.Acad.Sci.,83:3746-3 750(1986);Wetmur,Crit.Rev.Biochem.Mol.Biol.,26:227-259(1991)など)に より提供される。より少数のオリゴヌクレオチドタグが、例えば、標識をコード アダプターに送達するために必要とされる場合、AppendixIおよびIIのコンピュ ータープログラムを使用して、直接使用され得る(すなわち、「センテンス(sen tence)」への連鎖なく)最小にクロスハイブリダイズするセットのオリゴヌクレ オチドの配列を作成し、そして列挙し得る。このようなリストは、さらなる最小 にクロスハイブリダイズするセットを形成するために、さらなる基準(例えば、 GC含有量、ミスマッチの分布、理論的融解温度など)についてさらにスクリーニ ングされ得る。 より短いタグ(例えば、約30ヌクレオチド以下)について、RychlikおよびWet murにより記載されるアルゴリズムが二重鎖安定性を計算するために好ましく、 そしてより長いタグ(例えば、約30〜35ヌクレオチド以上)について、編集者Br own、ICN-UCLA Symp.Dev.Biol.,第23巻(Academic Press,New York,1981)に おいてSuggsら、683-693頁により開示されるアルゴリズムが簡便に使用され得る 。明らかに、本発明の範囲内で最小にクロスハイブリダイズするサブユニットの セットを設計するために当業者に利用可能な多くのアプローチがある。例えば、 サブユニットが組み立てられた場合、末端ヌクレオチドの異なる塩基スタッキン グエネルギーの影響を最小にするために、同じ末端ヌクレオチドを有するサブユ ニットが提供され得る。このように、サブユニットが連結される場合、全ての隣 接末端ヌクレオチドの塩基スタッキングエネルギーの合計は同じであり、それに よりタグ融解温度の変化を低減するか、または除去する。 複数サブユニットタグにおいて、以下のイタリック体で示される末端ヌクレオ チドの「ワード」はまた、完全なマッチがそれと任意の他のタグ相補物上の同様 の末端「ワード」との間でいつも形成されるように、タグの各末端に付加され得 る。このように増大したされたタグは以下の形態を有する: ここでプライム記号(’)が付いたW'は相補物を示す。タグ末端は完全にマッ チした二重鎖を常に形成し、全てのミスマッチワードは内部ミスマッチであり、 それにより、それらの末端でミスマッチワードを他に有するタグ相補物二重鎖の 安定性を低減する。内部ミスマッチを有する二重鎖が、末端で同じミスマッチを 有する二重鎖より著しく安定でないことは周知である。 オリゴヌクレオチドタグが選別のために用いられる場合、最小にクロスハイブ リダイズするセットの好ましい実施態様は、そのサブユニットが4つの天然ヌク レオチドのうち3つから構成される実施態様である。以下により十分に議論され るように、オリゴヌクレオチドタグの1つの型のヌクレオチドの非存在は、標的 ポリヌクレオチドがDNAポリメラーゼの5'→3'エキソヌクレアーゼ活性の使用に より固相支持体にロードされることを可能にする。以下は、A、G、およびTか らなる群より選択される4つのヌクレオチドを含む各サブユニットの例示的な最 小にクロスハイブリダイズするセットである: 表II このセットにおいて、各メンバーは、全ての他のメンバーの相補物と3つのミス マッチ塩基を有する二重鎖を形成する。 オリゴヌクレオチドタグが標識をコードアダプターに送達するために使用され る場合、4つ全てのヌクレオチドが使用される。 本発明のオリゴヌクレオチドタグおよびそれらの相補物は、例えば、以下の参 考文献:BeaucageおよびIyer,Tetrahedron,48:2223-2311(1992);Molkoら、米 国特許第4,980,460号;Kosterら、米国特許第4,725,677号;Caruthersら、米国 特許第4,415,732号;同第4,458,066号;および同第4,973,679号などに開示され る標準的な化学(例えばホスホールアミダイト化学)を用いて、自動化DNA合成 機(例えば、Applied Biosystems,Inc.(Foster City,Calfornia)モデル392また は394DNA/RNA Synthesizer)で簡便に合成される。例えば、非天然骨格基(例え ば、ペプチド核酸(PNA)、N3'→P5'ホスホールアミドなど)をもたらす代替の 化学もまた使用され得る。いくつかの実施態様において、タグは、酵素によるプ ロセシングまたは操作を可能にする天然に生じるヌクレオチドを含み得るが、一 方対応するタグ相補物は、選別の間により安定な二重鎖の形成を促進する、非天 然ヌクレオチドアナログ(例えば、ペプチド核酸または同様の化合物)を含み得 る。標識をコードアダプターに送達するために使用されるタグの場合、オリゴヌ クレオチドタグおよびタグ相補物の両方は、連結が化学的または酵素的のいずれ かで起こり得るのであれば、非天然ヌクレオチドまたはアナログから構築され得 る。 タグの2本鎖形態は、相補鎖を別々に合成し、続いて二重鎖形成を可能にする 条件下で混合することにより作られ得る。あるいは、2本鎖タグは、プライマー 結合部位として働く既知のオリゴヌクレオチド配列に連結される1本鎖レパート リーを最初に合成することより形成され得る。次いで、第2鎖は、1本鎖レパー トリーとプライマーとを組合せ、そしてポリメラーゼで伸長することにより合成 される。この後者のアプローチは、Oliphantら、Gene,44:177-183(1986)に記載 される。次いで、このような二重鎖タグは、本発明に従う標的ポリヌクレオチド の選別および操作のために、標的ポリヌクレオチドと共にクローニングベクター に挿入され得る。 増強した結合特徴を有するヌクレオチド(例えば、PNAまたはオリゴヌクレオ チドN3'→P5'ホスホールアミドなど)から構成されるタグ相補物が使用される場 合、選別は、タグを1本鎖にするためにDNAポリメラーゼの3'→5'エキソヌクレ アーゼ活性を使用する「ストリッピング」反応に対する代替として、天然のヌク レオチドを含むタグとそれらのPNAまたはホスホールアミダイト相補物との間の Dループの形成により実行され得る。 選別のためのオリゴヌクレオチドタグは、12〜60のヌクレオチドまたは塩基対 の長さの範囲であり得る。好ましくは、オリゴヌクレオチドタグは、18〜40のヌ クレオチドまたは塩基対の長さの範囲であり得る。より好ましくは、オリゴヌク レオチドタグは、25〜40のヌクレオチドまたは塩基対の長さの範囲であり得る。 好ましいおよびより好ましい数のサブユニットに関して、これらの範囲は、以下 のように表され得る: 表III 好ましい実施態様におけるタグ中のサブユニットの数 最も好ましくは、選別のためのオリゴヌクレオチドタグは1本鎖であり、そして 特異的ハイブリダイゼーションは、タグ相補物とのワトソン-クリック型塩基対 形成を生じる。 好ましくは、選別のための1本鎖オリゴヌクレオチドタグのレパートリーは少 なくとも100のメンバーを含み;より好ましくは、このようなタグのレパートリ ーは少なくとも1000のメンバーを含み;そして最も好ましくは、このようなタグ のレパートリーは少なくとも10,000のメンバーを含む。 好ましくは、標識を送達するためのタグ相補物のレパートリーは少なくとも16 のメンバーを含み;より好ましくは、このようなタグのレパートリーは、少なく とも64のメンバーを含む。さらにより好ましくは、タグ相補物のこのようなレパ ートリーは、16〜1024のメンバー(例えば、長さが2〜5ヌクレオチドの突出鎖 のヌクレオチドを同定するためのメンバー)を含む。最も好ましくは、タグ相補 物のこのようなレパートリーは、64〜256のメンバーを含む。所望のサイズのレ パートリーは、例えば、AppendixIおよびIIのコンピュータープログラムの助け により、所望のサイズのワードのセットもしくはサブユニットを直接作製するこ とにより選択されるか、またはレパートリーは、1セットのワードを作製し、次 いでこれを組合せ的合成スキームにおいて使用して所望のサイズのレパートリー を得ることにより形成される。好ましくは、標識を送達するための1本鎖タグ相 補物の長さは、8〜20である。より好ましくは、長さは9〜15である。 三重鎖タグ 特異的ハイブリダイゼーションが三重鎖形成を介して生じる複数の実施態様に おいて、タグ配列のコーディングは、二重鎖形成タグと同じ原理に従う;しかし 、サブユニット配列の選択に対してさらなる制約がある。一般的に、フーグステ ィーン型の結合を介した第3鎖会合は、2本鎖標的におけるホモピリミジン-ホ モプリン進路に沿って最も安定である。通常、塩基トリプレットは、T-A*Tまた はC-G*Cモチーフ(ここで「-」はワトソン-クリック型塩基対形成を示し、そし て「*」はフーグスティーン型結合を示す)において形成する;しかし、他のモ チーフもまた可能である。例えば、フーグスティーン型塩基対形成は、鎖の状態 および組成に依存して、第3鎖(フーグスティーン鎖)と第3鎖が結合する二重 鎖のプリンリッチ鎖との間の平行および逆平行方向を可能にする。特定の実施態 様において所望のように三重鎖安定性を最大にするか、さもなければ調節するた めに、適切な配列、方向、条件、ヌクレオチド型(例えば、リボースまたはデオ キシリボースヌクレオシドが使用されるか否か)、塩基修飾(例えば、メチル化 シトシンなど)を選択するための文献中に広範なガイダンスがある(例えば、Ro bertsら、Proc.Natl.Acad.Sci.,88:9397-9401(1991);Robertsら、Science,258 :1463-1466(1992);Robertsら、Proc.Natl.Acad.Sci.,93:4320-4325(1996);Dis te fanoら、Proc.Natl.Acad.Sci.,90:1179-1183(1993);Mergnyら、Biochemistry, 30:9791-9798(1991);Chengら、J.Am.Chem.Soc.,114:4465-4474(1992);Bealお よびDervan、Nucleic Acids Research,20:2773-2776(1992);BealおよびDervan 、J.Am.Chem.Soc.,114:4976-4982(1992);Giovannangeliら、Proc.Natl.Acad.Sc i.,89:8631-8635(1992);MoserおよびDervan、Science,238:645-650(1987);McS hanら、J.Biol.Chem.,267:5712-5721(1992);Yoonら、Proc.Natl.Acad.Sci.,89: 3840-3844(1992);Blumeら、Nucleic Acids Research,20:1777-1784(1992);Th uongおよびHelene、Angew.Chem.Int.Ed.Engl.32:666-690(1993);Escudeら、Pro c.Natl.Acad.Scl.,93:4365-4369(1996)など)。1本鎖または二重鎖タグをそれ らの1本鎖または二重鎖相補物にアニーリングさせるための条件は周知である( 例えば、Jiら、Anal.Chem.65:1323-1328(1993);Cantorら、米国特許第5,482,83 6号など)。選別における三重鎖タグの使用は、その相補物へのアニーリングの ためにタグを暴露するための、ポリメラーゼを用いた「ストリッピング」反応を 必要としない利点を有する。 好ましくは、三重鎖ハイブリダイゼーションを用いる本発明のオリゴヌクレオ チドタグは2本鎖DNAであり、そして対応するタグ相補物は1本鎖DNAである。よ り好ましくは、5-メチルシトシンは、タグとその相補物との間で形成される三重 鎖のpH安定性の範囲を広げるためにタグ相補物中のシトシンの代わりに使用され る。三重鎖を形成するための好ましい条件は、上記の参考文献に充分に開示され る。簡単には、ハイブリダイゼーションは、濃縮塩溶液(例えば、1.0M NaCl、1 .0M酢酸カリウムなど)中でpH5.5未満で(または、5-メチルシトシンが使用され る場合6.5)起こる。ハイブリダイゼーション温度は、タグの長さおよび組成に 依存する;しかし、18〜20マータグまたはそれより長いタグについては、室温で のハイブリダイゼーションが適切である。洗浄は、あまり濃縮されていない塩溶 液(例えば、10mM酢酸ナトリウム、100mM MgCl2、pH5.8)で室温で行われ得る。 タグは、pH9.0の同様の塩溶液中のインキュベーションによりそれらのタグ相補 物から溶出され得る。 三重鎖を形成するオリゴヌクレオチドタグの最小にクロスハイブリダイズする セットは、AppendixIIのコンピュータープログラムまたは同様のプログラムによ り作製され得る。2本鎖8マーワードの例示的なセットは、小文字の対応する相 補物と共に大文字で以下に列挙される。このような各ワードは、3つの塩基対に よりこのセット中の他の各ワードと異なる。 表IV 例示的な最小にクロスハイブリダイズする、2本鎖8マータグのセット 表V 三重鎖のタグ相補物と三重鎖を形成する、 種々の2本鎖タグのレパートリーサイズ アダプターの合成および構造 コードアダプターおよび切断アダプターは、例えば、以下の参考文献:Beauca geおよびIyer,Tetrahedron,48:2223-2311(1992);Molkoら、米国特許第4,980, 460号;Kosterら、米国特許第4,725,677号;Caruthersら、米国特許第4,415,732 号;同第4,458,066号;および同第4,973,679号などにおいて開示されるような標 準的な化学(例えば、ホスホールアミダイト化学)を用いて自動化DNA合成機で 簡便に合成される。例えば、非天然骨格基(例えば、ホスホロチオエート、ホス ホールアミダイトなど)をもたらす代替の化学もまた、得られたオリゴヌクレオ チドが特定の実施態様において使用される連結および/または切断試薬に適合す るのであれば使用され得る。代表的に、相補鎖の合成後、この鎖は、2本鎖アダ プターを形成するために組み合わされる。コードアダプターの突出鎖は、全ての 可能な配列が突出部分部分において示されるように混合物として合成され得る。 このような混合物は、周知の技術(例えば、Teleniusら、Genomics,13:718-725 (1992);Welshら、Nucleic Acids Research,19:5275-5279(1991);Grothuesら 、Nucleic Aclds Research、21:1321-1322(1993);Herley,欧州特許出願903044 96.4(EP公報第395398)などに開示される)を用いて容易に合成される。一般的に 、これらの技術は、単純に、複数のヌクレオチドを導入することが所望されるカ ップリング工程間で活性化モノマーの混合物の増大するオリゴヌクレオチドへの 適用を要求する。上記のように、いくつかの実施態様において、アダプターの複 雑度を低減することが所望され得る。これは、例えば、Kong Thoo Linら、Nucle ic Acids Research,20:5149-5152または米国特許第5,002,867号;Nicholsら、N ature,369:492-493(1994)などにおいて教示されるように、複雑度を低減したア ナログ(例えば、デオキシイノシン、2-アミノプリンなど)を用いて達成され得 る。 いくつかの実施態様において、自己相補性領域を含む単一のポリヌクレオチド としてコードアダプターまたは切断アダプターを合成することが所望され得る。 合成後、自己相補性領域はアニールされて、1つの末端の突出鎖およびもう1つ の末端の1本鎖ループとアダプターを形成させる。好ましくは、このような実施 態様において、ループ領域は、約3〜10のヌクレオチドまたは米国特許第4,914, 210号に開示されるような他の匹敵する連結部分(例えば、アルキルエーテル基 )を含み得る。多くの技術は、以下に引用される参考文献に議論されるように、 標識のために反応基の塩基またはヌクレオシド連結への付着に利用可能である。 従来のリガーゼが以下により十分に記載されるように本発明において使用され る場合、アダプターの5'末端は、いくつかの実施態様においてリン酸化され得る 。一リン酸塩は、化学的またはキナーゼを用いて酵素的のいずれかで第2のオリ ゴ ヌクレオチドに付着され得る(例えば、Sambrookら、Molecular Cloning:A Labo ratory Manual,第2版(Cold Spring Harbor Laboratory,New York,1989))。 化学的リン酸化は、HornおよびUrdea、Tetrahedron Lett.,27:4705(1986)により 記載され、そして開示されたプロトコルを行うための試薬は、市販されている( 例えば、Clontech Laboratories(Palo Alto,California)からの5'Phosphate-ONTM )。 本発明のコードアダプターは、例えば、1本鎖または2本鎖タグが使用される か否か、複数のタグが使用されるか否か、5'突出鎖または3'突出鎖が使用される か否か、3'ブロッキング基が使用されるか否かなどに依存して、いくつかの実施 態様を有し得る。コードアダプターのいくつかの実施態様のための式は以下に示 される。1本鎖タグを用いたコードアダプターに好ましい構造は以下の通りであ る: または ここで、Nはヌクレオチドであり、そしてN'はその相補物であり、pはリン酸 基であり、zは3'水酸基または3'ブロッキング基であり、nは、両端を含む2〜 6の整数であり、rは0以上の整数であり、sは、コードアダプターがヌクレア ーゼ認識部位を有する時はいつでも4〜6の整数であるか、またはヌクレアーゼ 認識部位がない場合はいつでも0であり、qは0以上の整数であり、そしてtは 、両端を含む8〜20の整数である。より好ましくは、nは4または5であり、そ してtは両端を含む9〜15である。コードアダプターがヌクレアーゼ認識部位 を含む時はいつでも、「r」ヌクレオチド対の領域は、この部位を認識するヌク レアーゼが適用された時はいつでも、予め決定された数のヌクレオチドが標的ポ リヌクレオチドから切断されるように選択される。特定の実施態様における「r 」のサイズは、ヌクレアーゼの区域(この用語は、米国特許第5,599,675号およ びWO 95/27080において定義される)ならびに標的ポリヌクレオチドから切断さ れよ うと努められるヌクレオチド数に依存する。好ましくは、rは0〜20であり;よ り好ましくは、rは0〜12である。「q」ヌクレオチド対の領域は、ヌクレアー ゼ認識部位とコードプローブのタグ領域との間のスペーサーセグメントである。 「q」ヌクレオチドの領域は、さらなるヌクレアーゼ認識部位、標識またはシグ ナル発生部分などを含み得る。1本鎖オリゴヌクレオチドの「t」ヌクレオチド は、最小にクロスハイブリダイズするセットから選択される「tマー」のオリゴ ヌクレオチドタグである。 3'ブロッキング基「z」は種々の形態を有し得、そして連結を排除し、そして この方法の他の工程(例えば、3'ブロック鎖の除去、連結など)を妨げない、ほ とんど任意の化学的存在物を含み得る。例示的な3'ブロッキング基は、水素(す なわち、3'デオキシ)、リン酸、ホスホロチオエート、アセチルなどを含むが、 これらに限定されない。好ましくは、3'ブロッキング基は、3'ブロック鎖の合成 間にこの基を付加における簡便さ、およびこの鎖をリガーゼを用いて連結させ得 るためのホスファターゼを用いたこの基の除去における簡便さのためリン酸であ る。3'リン酸を有するオリゴヌクレオチドは、編集者Eckstein、Oligonucleotid e and Analogues:A Practical Approach(IPL Press,Oxford,1991)の第12章に おいて記載されるプロトコルを用いて合成され得る。 さらなる3'ブロッキング基は、例えば、以下の参考文献に開示される、1塩基 ずつの配列決定スキームにおける可逆的鎖終結ヌクレオチドのために開発された 化学から利用可能である:Cheeseman、米国特許第5,302,509号;Tsienら、国際 出願WO 91/06678号;Canardら、Gene,148:1-6(1994);およびMetzkerら、Nuclei c Acids Research,22:4259-4267(1994)。およそ、これらの化学は、プライミン グ鎖の3'末端の生産的遊離水酸基への特異的ブロッキング基(通常、付随標識を 有する)の化学的または酵素的除去を可能にする。 好ましくは、zが3'ブロッキング基の場合、これはリン酸基であり、そしてア ダプターの2本鎖部分は、その認識部位がその切断部位から離れているヌクレア ーゼのヌクレアーゼ認識部位を含む。 三重鎖構造を形成するために1本鎖タグ相補物と特異的にハイブリダイズする 、2本鎖オリゴヌクレオチドタグが使用される場合、本発明のコードタグは以下 の 形態を有する: または ここで、N、N'、p、q、r、s、z、およびnは上記のように定義される。好まし くは、この実施態様において、tは12〜24の範囲の整数である。 明らかに、当業者には明らかである上記に示された基本的設計の要素を含むさ らなる構造がある。例えば、本発明のコードアダプターは、以下のような複数の タグを有する実施態様を含む。 または ここで、コードアダプターはk個の2本鎖タグを含む。好ましくは、t1=t2=tkで あり、そしてkは1、2、または3のいずれかである。 タグ相補物の標識 本発明のタグ相補物は、放射性部分、蛍光部分、比色定量部分、化学発光部分 などの直接的または間接的付着を含む、オリゴヌクレオチドタグを解読するため の種々の方法で標識され得る。DNAを標識し、そしてDNAアダプターを構築するた めの方法論の多くの包括的な概説は、本発明のアダプターの構築に適用可能なガ イダンスを提供する。このような概説は、Matthewsら、Anal Biochem.,第169巻 、1-25頁(1988);Haugland,Handbook of Fluorescent Probes and Research Chemicals(Molecular Probes,Inc.,Eugene,1992);KellerおよびManak,DNA Pr obes,第2版(Stockton Press,New York,1993);ならびに編集者Eckstein、 Oligonucleotides and Analogues:A Prctical Approach(IRL Press,Oxford,19 91);Wetmur,Critical Reviews in Biochemistry and Molecular Biology,26: 2 27-259(1991)などを含む。本発明に適用可能な多くのより特定した方法論は、以 下の参考文献のサンプルにおいて開示される:Fungら、米国特許第4,757,141号 ;Hobbs,Jrら、米国特許第5,151,507号;Cruickshank,米国特許第5,091,519号 ;(レポーター基の付着のための官能化オリゴヌクレオチドの合成);Jablonsk iら、Nucleic Acids Research,14:6115-6128(1986)(酵素-オリゴヌクレオチド 結合体);Juら、Nature Medicine,2:246-249(1996);およびUrdeaら、米国特 許第5,124,246号(分枝DNA)。標識部分の付着部位は、このような標識が連結お よび/または切断工程を妨げなければ重要でない。 好ましくは、1つ以上の蛍光色素が、例えば、Menchenら、米国特許第5,188,9 34号;Bergotら、PCT出願PCT/US90/05565(WO 91/05060)により開示されるように 、タグ相補物の標識として使用される。本明細書中で使用する用語「蛍光シグナ ル発生部分」は、1つ以上の分子の蛍光吸収および/または発光特性による情報 を伝達するシグナリング手段を意味する。このような蛍光特性は、蛍光強度、蛍 光寿命、発光スペクトル特徴、エネルギー転移などを含む。 アダプターの連結および自己連結の防止 本発明の好ましい実施態様によれば、切断アダプターは、コードアダプターの 最後の連結のためのこのような末端を調製するために標的ポリヌクレオチドの末 端に連結される。好ましくは、連結は、標準的なプロトコルにおいてリガーゼを 用いて酵素的に行われる。多くのリガーゼは公知であり、そして本発明での使用 に適する(例えば、Lehman,Science,186:790-797(1974);編集者Boyer、The E nzyme,第15B巻(Academic Press,New York,1982)中のEnglerら、DNA Ligases ,3-30頁など)。好ましいリガーゼは、T4 DNAリガーゼ、T7 DNAリガーゼ、E.co li DNAリガーゼ、Taqリガーゼ、Pfuリガーゼ、およびTthリガーゼを含む。それ らの使用のためのプロトコルは周知である:例えば、Sambrookら、(上記で引用 );Barany、PCR Methods and Applications、1:5-16(1991);Marshら、Strat egies、5:73-76(1992);など。一般的に、リガーゼは、5'リン酸基が隣接鎖の3' 水酸基への連結のために存在することを必要とする。これは、5'リン酸基を残す ヌクレアーゼ(例えば、FokI)を選択することにより、標的ポリヌクレオチド の少なくとも1つの鎖に簡便に提供される。 固定されたポリヌクレオチドの4ヌクレオチドの突出鎖が互いに相補的である (114)、図2に示されるように、特別な問題は、自己連結し得るポリヌクレオ チド末端またはアダプターのいずれかの処理において生じ得る。この問題は、分 析されるポリヌクレオチド(112)が、固相支持体(110)に付着された同一のポ リヌクレオチドの均一集団としてアダプターに提示される実施態様において特に 重篤である。これらの状況において、固定ポリヌクレオチドの遊離末端は、互い に完全にマッチした2重鎖(116)を形成するためにねじれ得る。この末端の5' 鎖がリン酸化されている場合、ポリヌクレオチドは、リガーゼの存在下で容易に 連結される。類似の問題はまた、2本鎖アダプターについて存在する。すなわち 、それらの5'鎖がリン酸化される時はいつでも、1つのアダプターの5'鎖は、そ れらの突出鎖のヌクレオチド配列が相補的である時はいつでも、もう1つのアダ プター遊離3'水酸基に連結され得る。自己連結が起こる場合、アダプターの突出 鎖も標的ポリヌクレオチドの突出鎖のどちらも、分析またはプロセシングに利用 可能でない。次に、これは、アダプターの標的ポリヌクレオチドへの正しい連結 に応答して発生されるシグナルの喪失または消失を導く。ランダム配列でパリン ドローム4マーの生じる確率は、反復対のヌクレオチドの確率(6.25%)と同じ であるので、デノボ配列決定のためのアダプターに基づく方法は、自己連結のた めに数サイクル後に高い期待値の失敗を有する。これが生じる場合、ポリヌクレ オチドのさらなる分析は不可能になる。 上記の問題は、好ましい実施態様のために図3Aに示されるように、以下の工程 で本発明を実施することにより手段を講じ得る:(a)ポリヌクレオチド(122 )の末端にコードアダプターを連結する工程(120)であって、ここでポリヌク レオチド末端は脱リン酸化5'水酸基を有し、そして連結されるコードアダプター (124)の末端は第1鎖(126)および第2鎖(128)を有し、そしてコードアダ プターの第2鎖は3'ブロッキング基(130)を有する、工程;(b)例えば、洗 浄により(132)、またはインサイチュでこの基を酵素的もしくは化学的に除去 することにより(例えば、ブロッキング基がリン酸である場合、ホスファターゼ での処理により)、連結後に第2鎖の3'ブロッキング基を除去する工程;(c) ポリヌクレオチドの5'水酸基をリン酸化する工程(134);(d)非ブロック3' 部分を有する第2鎖(142)を連結して、コードアダプター(138)を再生する工 程(136);および(e)それに連結されたコードアダプターの正体により(例 えば、蛍光標識(140)タグ相補物を介して)、ポリヌクレオチド末端の1つ以 上のヌクレオチドを同定する工程(144)。コードアダプターおよび標的ポリヌ クレオチドは、単一でまたは混合物としてのいずれかで連結のために組み合わさ れ得る。例えば、定義配列を有する単一の種類のアダプターは、共通の(そして おそらく未知の)ヌクレオチド配列を有する単一の種類のポリヌクレオチドと組 み合わされ得るか;または定義配列を有する単一の種類のアダプターは、ポリヌ クレオチドの混合物(例えば、同じ反応容器中の異なる固相支持体に付着された 同一のポリヌクレオチドの複数の均一集団)と組み合わされ得るか(例えば、Br ennerら、国際出願PCT/US96/09513(WO 96/41011)に記載される);または、コー ドアダプターの混合物、特にそれらの突出鎖に異なるヌクレオチド配列を有する 混合物は、単一種のポリヌクレオチドと混合され得る;またはコードアダプター の混合物は、ポリヌクレオチドの混合物と組み合わされ得る。用語「アダプター 」または「コードアダプター」が単数形で使用される場合、これは、用語「プロ ーブ」の語法と類似した様式で、異なる配列の突出鎖を有するアダプターの混合 物ならびに同じ配列の突出鎖を有する単一の種類のアダプターを含むことを意味 する。 融解による除去に加えて、3'デオキシは、Kuijperら、Gene,112:147-155(199 2);Aslanidisら、Nucleic Acids Research,18:6069-6074(1990);および同様 の参考文献により開示される、ポリメラーゼ「交換」反応により第2鎖から除去 され得る。簡単には、T4 DNAポリメラーゼおよび同様の酵素の5'→3'エキソヌク レアーゼ活性を使用して、溶液中にそれらの三リン酸対応物でプライミング鎖の ヌクレオチドを交換し得る(例えば、Kuijperら(上記))。従って、このよう な反応により、3'ジデオキシヌクレオチドは、反応混合物から2'-デオキシ-3'ヒ ドロキシヌクレオチドで交換され得、これはポリヌクレオチドキナーゼでの処理 後に、第2鎖を標的ポリヌクレオチドに連結可能にする。 連結および切断のサイクルを使用する好ましい実施態様は、以下の工程を含 む:(a)ポリヌクレオチド(222)の末端にコードアダプターを連結する工程 (220)であって、ポリヌクレオチド末端は脱リン酸化5'水酸基を有し、そして 連結される2本鎖アダプター(224)の末端は第1鎖(226)および第2鎖(228 )を有し、2本鎖アダプターの第2鎖は3'ブロッキング基(230)を有し、そし て2本鎖アダプターは、その認識部位がその切断部位から離れているヌクレアー ゼのヌクレアーゼ認識部位(250)を有する、工程;(b)例えば、第2鎖を洗浄 することより(232)、連結後に3'ブロッキング基を除去する工程;(c)ポリ ヌクレオチドの5'水酸基をリン酸化する工程(234);(d)2本鎖アダプター (238)およびヌクレアーゼ認識部位(250)を再生するために、非ブロック3'部 分を有する第2鎖(242)を連結する工程(236);(e)それに連結されたアダ プターの同定により、ポリヌクレオチド末端の1つ以上のヌクレオチドを同定す る工程(244);(f)認識部位を認識するヌクレアーゼでポリヌクレオチドを 切断し(252)、その結果ポリヌクレオチドは1つ以上のヌクレオチドまで短く され、認識部位は、切断(254)がポリヌクレオチド(222)から2つのヌクレオ チドを除去するように示されたアダプター(224)において配置される、工程; (g)ポリヌクレオチドの5'末端を脱リン酸化する工程(256);および(h) 工程(a)から(g)を反復する工程(258)。 代表的には、連結前に、分析されるポリヌクレオチドの末端は、通常3'または 5'突出鎖(すなわち、「粘着」末端)を有する、予め決定された切断を生成する 1つ以上の制限エンドヌクレアーゼでそれらを消化することにより調製される。 このような消化は、通常、5'鎖をリン酸化させておく。好ましくは、これらの5' リン酸化末端は、標準的なプロトコル(例えば、Sambrookら、Molecular Cloning ,第2版(Cold Spring Harbor Laboratory,New York,1989)を用いて、ホスフ ァターゼ(例えば、子ウシ腸アルカリホスファターゼまたは同様の酵素)での処 理により脱リン酸化される。5'リン酸の除去により、標的ポリヌクレオチドは、 リガーゼの存在下では連結され得なくなる。好ましくは、脱リン酸化工程は、遊 離5'水酸基を残す。 好ましいヌクレアーゼ 本発明に従って使用される用語としての「ヌクレアーゼ」は、以下により十分 に議論される連結された複合体に適用された場合に、連結された複合体を切断し て、増大したアダプターおよび短くされた標的ポリヌクレオチドを生成する、任 意の酵素、酵素の組み合わせ、もしくは他の化学試薬、または化学試薬および酵 素の組合せを意味する。本発明のヌクレアーゼは、単一のタンパク質であったり 、単にタンパク質の組合せから構成される必要はない。ヌクレアーゼまたはヌク レアーゼとして使用される試薬の組み合わせの重要な特性は、その(それらの) 切断部位がその(それらの)認識部位から離れていることである。ヌクレアーゼ の認識部位とその切断部位との間の距離は、本明細書中でその「区域」と呼ばれ る。取り決めにより、「区域」は、各鎖の認識部位と加水分解ホスホジエステル 結合との間のヌクレオチドの数を与える2つの整数により定義される。例えば、 FokIの認識および切断特性は、代表的に、これが以下のように(配列番号2)2 本鎖DNAを認識および切断するので、「GGATG(9/13)」として示される: ここで、ボールドのヌクレオチドはFokIの認識部位であり、そしてNは任意のヌ クレオチドおよびそれらの相補物である。 ヌクレアーゼのみが、その認識部位との複合体を形成した後に標的ポリヌクレ オチドを切断することは重要であり;そして好ましくは、ヌクレアーゼは、切断 後に標的ポリヌクレオチド上に突出鎖を残す。 好ましくは、本発明で使用されるヌクレアーゼは、(i)その認識部位がその 切断部位から離れており、そして(ii)切断が標的ポリヌクレオチド上に突出鎖 をもたらす、天然のタンパク質エンドヌクレアーゼである。最も好ましくは、II 型制限エンドヌクレアーゼは、例えば、Szybalskiら、Gene,100:13-26(1991); Robertsら、Nucleic Acids Research,21:3125-3137(1993);およびLivakおよび Brenner、米国特許第5,093,245号に記載のように本発明におけるヌクレアーゼと して使用される。本発明での使用のための例示的なII型ヌクレアーゼは、AlwXI 、BsmAI、BbvI、BsmFI、StsI、HgaI、BscAI、BbvII、BcefI、Bce85I、BccI、Bcg I、 BsaI、BsgI、 BspMI、Bst71I、EarI、Eco57I、Esp3I、FauI、FokI、GsuI、HphI 、MboII、MmeI、RleAI、SapI、SfaNI、TaqII、Tth111II、Bco5I、BpuAI、FinI、 BsrDI、およびそのアイソシゾマーを含む。好ましいヌクレアーゼは、BbvI、Fok I、HgaI、EarI、およびSfaNIを含む。BbvIは、最も好ましいヌクレアーゼである 。 好ましくは、ヌクレアーゼ切断工程前に、通常配列決定操作の開始で、標的ポ リヌクレオチドは、使用されるヌクレアーゼの認識部位および/または切断部位 をブロックするように処理される。これは、標的ポリヌクレオチドにおける内部 位置でのヌクレアーゼ認識部位の偶然の出現による標的ポリヌクレオチドの所望 でない切断を妨げる。ブロッキングは、メチル化および配列特異的アプタマー(a ptamer)、DNA結合タンパク質、または3重鎖を形成するオリゴヌクレオチドによ る処置を含む、種々の方法において達成され得る。天然タンパク質エンドヌクレ アーゼが使用される時はいつでも、認識部位は、使用されるヌクレアーゼのコグ ネイトメチラーゼで標的ポリヌクレオチドをメチル化することにより、都合良く ブロックされ得る。すなわち、全てではないにしても、大部分のII型細菌性制限 エンドヌクレアーゼについて、その認識部位をメチル化する、いわゆる「コグネ イト」メチラーゼが存在する。多くのこのようなメチラーゼは、Robertsら(上 記)およびNelsonら、Nucleic Acids Research,21:3139-3154(1993)に開示され 、そして種々の供給源(特に、New England Biolabs(Beverly,MA)から市販され ている。あるいは、PCR工程が配列決定のための標的ポリヌクレオチドの調製に おいて使用される場合、5-メチルシトシン三リン酸は、天然のシトシンがアンプ リコンにおいてメチル化シトシンで置換されるために増幅の間に使用され得る。 この後者のアプローチは、固相支持体に結合した標的ポリヌクレオチドを別の酵 素で処置する必要性を排除する追加の利点を有する。 明らかに、当業者は、本発明に従ってなおさらなる実施態様を設計するために 上記で示されるが、上記で明白に示されなかった実施態様の特性を組み合わせ得 る。 本発明の異なる実施態様を行うために種々のキットが提供される。一般的に、 本発明のキットは、コードアダプター、切断アダプター、および標識タグ相補物 を含む。キットは、ヌクレアーゼ試薬、連結試薬、および本発明の特定の実施態 様を行うための使用説明書をさらに含む。天然のタンパク質エンドヌクレアーゼ およびリガーゼを使用する実施態様においては、リガーゼ緩衝液およびヌクレア ーゼ緩衝液が含まれ得る。いくつかの場合において、これらの緩衝液は同一であ り得る。このようなキットはまた、メチラーゼおよびその反応緩衝液を含み得る 。好ましくは、キットはまた、1つ以上の固相支持体(例えば、標的ポリヌクレ オチドを選別および固定するためにタグ相補物を保持する微粒子)を含む。 固相支持体上での選別のための、タグのポリヌクレオチドへの付着 本発明の重要な局面は、各微粒子または領域が実質的に付着された1種類のみ のポリヌクレオチドを有するような、(例えば、cDNAライブラリーから)固相支 持体上の微粒子または別の領域へのポリヌクレオチド集団の選別および付着であ る。この目的は、実質的に全ての異なるポリヌクレオチドが付着された異なるタ グを有することを保証することにより達成される。この状態は、順に、分析のた めにタグ-ポリヌクレオチド結合体の全集合のサンプルを採取することにより達 成される。(2つの異なる位置で2回操作されるか、または分析される同じポリ ヌクレオチドを単に生じるように、同一のポリヌクレオチドが異なるタグを有す ることが許容である。)このようなサンプリングは、タグがポリヌクレオチドに 付着された後、例えば、より多くの混合物から小容量を採取することにより、明 白に行われ得るか(これは、ポリヌクレオチドおよびタグをプロセスするために 使用される技術の二次的効果として本質的に行われ得る)、またはサンプリング は、明白におよびプロセシング工程の本質的部分としての両方で行われ得る。 好ましくは、実質的に全ての異なるcDNAが異なるタグを有するcDNAライブラリ ーの構築において、その複雑度または異なるタグの数が細胞または組織サンプル から抽出されるmRNAの総数を大きく超える、タグレパートリーが使用される。好 ましくは、タグレパートリーの複雑度は、ポリヌクレオチド集団の少なくとも10 倍であり;より好ましくは、タグレパートリーの複雑度は、ポリヌクレオチド集 団の少なくとも100倍である。以下に、例示的な9-ワードタグの全レパートリー を含むプライマー混合物を用いたcDNAライブラリーの構築についてのプロトコル が開示される。タグ含有プライマーのこのような混合物は、89または約1.34×1 08の複雑度を有する。Winslowら、Nucleic Acids Research,19:3251-3253(1991 )により示されるように、ライブラリー構築のためのmRNAは、10〜100ほどの少な い哺乳動物細胞から抽出され得る。単一の哺乳動物細胞は約5×105コピーの約3 .4×104の異なる種類のmRNA分子を含むので、標準的技術により、約100の細胞由 来のmRNA、すなわち(理論的に)約5×107mRNA分子を単離し得る。この数とプ ライマー混合物の複雑度との比較は、任意のさらなる工程を行うことなく、そし てmRNAが完全な効率(1%以下の効率がより正確である)でcDNAに変換されるこ とを保証することさえなく、cDNAライブラリー構築プロトコルが、異なるタグの 総数のたった37%を含む集団を生じることを示す。すなわち、いずれの明白なサ ンプリング工程を少しも行うことなく、このプロトコルは、タグレパートリーの 37%以下を含むサンプルを本質的に生じる。これらの条件下で二重に得られる確 率は約5%であり、これは好ましい範囲内である。10の細胞からのmRNAを用いて サンプリングされたタグレパートリーの画分はたった3.7%に低減され、これは 全てのプロセシング工程が100%の効率で起こることを保証さえする。実際に、c DNAライブラリーを構築するためのプロセシング工程の効率は非常に低く、「経 験則」では、良いライブラリーは、105の哺乳動物細胞から抽出されたmRNA由来 の約108のcDNAクローンを含むはずである。 上記のプロトコルにおけるより多量のmRNAの使用、または一般的により多量の ポリヌクレオチドの使用(ここで、このような分子の数はタグレパートリー、タ グ-ポリヌクレオチド結合体の混合物の複雑度を超える)は、タグおよびmRNAま たはポリヌクレオチドの型の全ての可能な塩基対形成を潜在的に含む。このよう な場合、明白なサンプリングは、タグ-ポリヌクレオチド結合体の出発混合物の 連続希釈後にサンプル容量を取り出すことにより実行され得る。必要とされる希 釈量は、出発物質の量およびプロセシング工程の効率に依存し、これは容易に評 価される。 mRNAが106の細胞から抽出され(約0.5μgのポリ(A)+RNAに相当する)、代表 的なプロトコル(例えば、Sambrookら、Molecular Cloning,第2版,8.61頁) において要求されるように、プライマーが約10〜100倍の濃度過剰で存在した場 合(1mg/mLの10μL 1.8kbmRNAは、約1.68×10-11モルに等しい、そして1mg/m Lの1 0μL 18マープライマーは、約1.68×10-9モルに等しい)、cDNAライブラリー中 のタグ-ポリヌクレオチド結合体の総数は、出発数のmRNAまたはタグ-ポリヌクレ オチド結合体を含む約5×1011のベクターに単に等しいか、またはそれ未満であ り(再度、これは、cDNA構築の各工程--第1鎖合成、第2鎖合成、およびベクタ ーへの連結--が完全な効率で起こることを保証する)、これは非常に控えめな評 価である。実際の数は著しく少ない。 nのタグ-ポリヌクレオチド結合体のサンプルが反応混合物からランダムに取り 出される(これは、サンプル容量を採取することにより実施され得る)場合、同 じタグを有する結合体を取り出す確率は、ポアソン分布P(r)=e- λ(λ)r/r(こ こで、rは同じタグを有する結合体の数である)およびλ=np(ここで、pは選 択される所定のタグの確率である)により記載される。n=106およびp=1/(1.34 ×108)であれば、λ=0.00746およびP(2)=2.76×10-5である。従って、10万の 分子のサンプルは、好ましい範囲内で良好に予想された数の二重(double)を生じ る。このようなサンプルは、以下のように容易に得られる:5×1011のmRNAが、 挿入物としてタグ-cDNA結合体を有する5×1011のベクターに変換され、そして 5×1011のベクターが100μlの容量を有する反応溶液にあることを保証する。 4回の10倍連続希釈は、最初の溶液からの10μlを90μlの適切な緩衝液(例え ばTE)を含む容器に移すことにより行われ得る。このプロセスは、1μlあたり 5×105のベクター分子を含む100μl溶液を得るために3回のさらなる希釈で反 復され得る。この溶液からの2μlアリコートは、挿入物としてタグ-cDNA結合 体を含む106のベクターを生じる。次いで、このサンプルは、コンピテント宿主 細胞の簡単な形質転換により増幅され、続いて培養される。 もちろん、上記のように、上記のプロセス中の工程は完全な効率で進行しない 。特に、ベクターがタグ-ポリヌクレオチド結合体のサンプルを増幅するために 使用される場合、宿主を形質転換する工程は非常に非効率的である。通常、たっ た1%のベクターが宿主により取り込まれ、そして複製される。従って、このよ うな増幅方法のために、いっそうより少ない希釈が、106の結合体のサンプルを 得るために必要とされる。 オリゴヌクレオチドタグのレパートリーは、多くの方法(直接酵素的連結、タ グ配列を含むプライマーを用いた増幅(例えば、PCRを介した)などを含む)で ポリヌクレオチド集団に結合され得る。最初の連結工程は、タグ-ポリヌクレオ チド結合体の非常に多くの集団を生成し、その結果、単一のタグが一般的に多く の異なるポリヌクレオチドに付着される。しかし、上記のように、結合体の十分 に小さなサンプルを採取することにより、「二重」(すなわち、2つの異なるポ リヌクレオチド上の同じタグ)を得る確率は、無視され得る。一般的に、サンプ ルが大きいほど、二重を得る確率は大きくなる。従って、設計のトレードオフは 、タグ-ポリオヌクレオチド結合体の大きなサンプルを選択すること(これは、 例えば、ショットガン配列決定操作または迅速に変化するmRNAプールの適切な提 示における標的ポリヌクレオチドの適切な適用範囲を確実にする)と小さなサン プルを選択すること(これは、最小数の二重が存在することを確実にする)との 間に存在する。大部分の実施態様において、二重の存在は、複数の蛍光シグナル を生じる微粒子が簡単に無視され得るように、ノイズのさらなる原因または配列 決定の場合におけるスキャニングおよびシグナルプロセシング工程での重要でな い複雑化を単に付加する。 本明細書中で使用する、タグの、分子(特に、ポリヌクレオチド)への付着に 関する用語「実質的に全て」は、二重を本質的に含まないタグ-分子結合体の集 団を得るために使用されるサンプリング手順の統計学的性質を反映することを意 味する。タグ-分子結合体の実際の割合に関する実質的に全ての意味は、タグが 使用された方法に依存する。好ましくは、核酸配列決定について、実質的に全て は、少なくとも80%のポリヌクレオチドが、付着された特有のタグを有すること を意味する。より好ましくは、少なくとも90%のポリヌクレオチドが、付着され た特有のタグを有することを意味する。さらにより好ましくは、少なくとも95% のポリヌクレオチドが、付着された特有のタグを有することを意味する。そして 、最も好ましくは、少なくとも99%のポリヌクレオチドが、付着された特有のタ グを有することを意味する。 好ましくは、ポリヌクレオチド集団がメッセンジャーRNA(mRNA)からなる場 合、オリゴヌクレオチドタグは、好ましくはタグ配列の相補物を含む1セットの プライマーでmRNAを逆転写することにより付着され得る。このようなプライマー の例示的なセットは、以下の配列を有し得る: ここで、「[W、W、W、C]9」は、各4のヌクレオチドの9のサブユニットのオリ ゴヌクレオチドタグの配列を示し、そして「[W、W、W、C]」は、上記に列挙され たサブユニット配列を示す(すなわち、「W」はTまたはAを示す)。下線の配 列は、それが使用される場合、ビオチンを介した固相支持体への付着からポリヌ クレオチドを放出するために使用され得る、任意の制限エンドヌクレアーゼ部位 を同定する。上記のプライマーについて、微粒子に付着される相補物は以下の形 態を有する: 逆転写後、mRNAは、例えば、RNaseH消化により除去され、そしてcDNAの第2鎖 は、例えば、以下の形態(配列番号3)のプライマーを用いて合成される。ここで、NはA、T、G、またはCのいずれか1つであり;Rはプリン含有ヌク レオチド、そしてYはピリミジン含有ヌクレオチドである。この特定のプライマ ーは得られた2本鎖DNAにBstY1制限部位を作成し、これは、SalI部位と共に、例 えばBamHIおよびXhoI部位を有するベクターへのクローニングを容易にする。Bst Y1およびSalI消化後に、例示的な結合体は以下の形態を有する: 次いで、ポリヌクレオチド-タグ結合体は、標準的な分子生物学技術を用いて操 作され得る。例えば、上記の結合体(これは、実際には混合物である)は、市販 のクローニングベクター(例えば、Stratagene Cloning System(La Jolla,CA) に挿入され;宿主(例えば、市販の宿主細菌)にトランスフェクトされ得;次い で、これは結合体の数を増大させるために培養される。次いで、クローニングベ クターは、標準的な技術(例えば、Sambrookら、Molecular Cloning,第2版(Co ld Spring Harbor Laboratory,New York,1989))を用いて単離され得る。ある いは、適切なアダプターおよびプライマーが使用され得、その結果、結合体集団 がPCRにより増大され得る。 好ましくは、リガーゼに基づく配列決定法が使用される場合、BstY1およびSal I消化フラグメントは、以下の単一コピー制限部位を有するBamHI/XhoI消化ベク ターにクローニングされる: これは、以下により十分に議論される配列決定プロセスの開始を可能にするFokI 部位を付加する。 タグは、標準的なクローニング法により、存在するライブラリーのcDNAに結合 され得る。cDNAは、それらの存在するベクターから切り出され、単離され、次い でタグレパートリーを含むベクターに連結される。好ましくは、タグ含有ベクタ ーは、2つの制限酵素で切断することにより線状化され、その結果、切り出され たcDNAは予め決定された方向で連結され得る。線状化タグ含有ベクターの濃度は 、cDNA挿入物の濃度を超えて実質的に過剰であり、その結果、連結はタグの本質 的なサンプリングを提供する。 増幅後に1本鎖タグを曝露する一般的な方法は、標的ポリヌクレオチド含有結 合体を、T4 DNAポリメラーゼまたは同様の酵素の5'→3'エキソヌクレアーゼ活性 で消化することを含む。単一のデオキシヌクレオシド三リン酸の存在下で使用さ れる場合、このようなポリメラーゼは、単一のデオキシヌクレオシド三リン酸の 相補物がテンプレート鎖に到達されるまで、2本鎖フラグメントの非テンプレー ト鎖に存在する3'凹化末端からヌクレオチドを切断する。このようなヌクレオチ ドが達成された場合、ポリメラーゼ伸長活性は、切除活性がヌクレオチドを除去 するより高い速度でヌクレオチドを付加するので、5'→3'消化は効果的停止する 。結果として、3つのヌクレオチドで構築された1本鎖タグは、固相支持体への ローディングのために容易に調製される。 この技術はまた、標的ポリヌクレオチドの内部FokI部位を優先的にメチル化す るが、一方ポリヌクレオチドの末端の単一のFokI部位をメチル化しないままにす るために使用され得る。最初に、末端FokI部位は、ポリメラーゼとデオキシシチ ジン三リン酸とを用いて1本鎖にされる。次いで、このフラグメントの2本鎖部 分はメチル化され、この後、1本鎖末端は、4つ全てのヌクレオシド三リン酸の 存在下でDNAポリメラーゼを用いてフィルインされ、それによりFokI部位を再生 する。明らかに、この手順は、FokI以外のエンドヌクレアーゼに対して一般化さ れ得る。 オリゴヌクレオチドタグが、例えば、上記ようにそれらを1本鎖にすることに より、特定のハイブリダイゼーションのために調製された後、ポリヌクレオチド は、タグとそれらの相補物との間で完全にマッチした2重鎖の形成に好ましい条 件下で、タグの相補的配列を含む微粒子と混合される。これらの条件を作成する ために文献中に広範なガイダンスがある。このようなガイダンスを提供する例示 的な参考文献は、Wetmur,Critical Reviews in Biochemistry and Molecular B iology,26:227-259(1991);Sambrookら、Molecular Cloning:A Laboratory Man ual,第2版(Cold Spring Harbor Laboratory,New York,1989)などを含む。 好ましくは、ハイブリダイゼーション条件は十分にストリンジェントであり、そ の結果、その結果、完全にマッチした配列のみが安定な2重鎖を形成する。この ような条件下で、それらのタグにより特異的にハイブリダイズされるポリヌクレ オチドは、微粒子に付着された相補的配列に連結され得る。最終的に、微粒子は 洗浄され、非連結および/またはミスマッチタグを有するポリヌクレオチドを除 去される。 合成支持体として従来より使用されるCPG微粒子が使用される場合、微粒子表 面上のタグ相補物の密度は、いくつかの配列決定操作に必要なものより、代表的 に大きい。すなわち、種々の酵素での付着されたポリヌクレオチドの連続処理を 必要とする配列決定アプローチにおいて、密な間隔のポリヌクレオチドは、ポリ ヌクレオチドに対して相対的に巨大な酵素の接近を阻害する傾向にあり得る。こ のような場合、ポリヌクレオチドは、好ましくは微粒子と混合され、その結果、 タグ相補物がポリヌクレオチドより著しく過剰に(例えば、10:1〜100:1または それより多く)存在する。これは、微粒子表面上のポリヌクレオチドの密度が酵 素接近を阻害するほど高くないことを確実にする。好ましくは、微粒子表面上の 平均ポリヌクレオチド間の間隔は、およそ30〜100nmである。標準的なCPG支持体 およびBallotiniビーズ(固体ガラス支持体型)のための比の選択におけるガイ ダンスは、MaskosおよびSouthern,Nucleic Acids Research,20:1679-1684(199 2)に見出される。好ましくは、配列決定適用のために、20〜50μm範囲の直径の 標準的なCPGビーズは、約105のポリヌクレオチドでロードされ、そして5〜10μ m範囲の直径のBangs Laboratories(Carmel,IN)から入手可能なグリシダルメタ クリレート(GMA)ビーズは、数万のポリヌクレオチド(例えば、4×104〜6× 104)でロードされる。 好ましい実施態様において、選別のためのタグ相補物は組合せ的に微粒子上で 合成され;従って、合成の終わりに微粒子の複合体混合物を得、これからローデ ィングタグ化ポリヌクレオチドのためにサンプルが採取される。微粒子サンプル のサイズは、いくつかの因子(タグ相補物レパートリーのサイズ、ロードされた 微粒子を観察するために使用される装置の性質(例えば、その能力)、同じタグ 相補物を有する複数コピーの微粒子(すなわち、「ビーズ二重」)に対する寛容 などを含む)に依存する。以下の表は、微粒子サンプルサイズ、微粒子直径、お よび種々の直径の微粒子のパックされた配置のおおよその物理的寸法についての ガイダンスを提供する。 微粒子直径 5μm 10μm 20μm 40μm 1/105平方オングストロー ム1でロードされた最大 3×105 1.26×106 5×106 ポリヌクレオチド数 106の微粒子 45×45cm 1×1cm 2×2cm 4×4cm の単層のおよその面積 微粒子サンプルが所定のタグ相補物を含むか、または複数コピーに存在する確率 は、以下の表に示されるようにポアソン分布により記載される。 表VI 高い特異性の選別およびパンニング(panning) 選別の反応速度論は、オリゴヌクレオチドタグのそれらのタグ相補物へのハイ ブリダイゼーション速度に依存し、これは順にハイブリダイゼーション反応にお けるタグの複雑度に依存する。従って、トレードオフは選別速度とタグ複雑度と の間に存在し、その結果、選別速度の増大が、ハイブリダイゼーション反応に関 与するタグの複雑度の低減を犠牲にして達成され得る。以下に説明されるように 、このトレードオフの影響は、「パンニング」により改良され得る。 ハイブリダイゼーションの特異性は十分に小さなサンプルを採取することによ り増大され得、その結果、サンプル中の高い割合のタグが特有であり、そしてサ ンプル中の実質的に全てのタグの最も近い隣接物(neighbor)が少なくとも2つ のワードで異なる。この後者の条件は、使用されるレパートリーサイズの約0.1 %以下である多数のタグ-ポリヌクレオチド結合体を含むサンプルを採取するこ とにより満たされ得る。例えば、タグが表IIから選択される8つのワードで構築 される場合、88すなわち1.67×107のタグおよびタグ相補物のレパートリーが生 成される。上記のタグ-cDNA結合体のライブラリーにおいて、0.1パーセントサン プルは、約16,700の異なるタグが存在することを意味する。これが微粒子のレパ ートリー等価物またはこの実施例における1.67×107の微粒子サンプルに直接ロ ードされるのであれば、サンプリングされた微粒子のまばらなサブセットのみが ロードされる。ロードされた微粒子の密度は、サンプリングされたタグ-cDNA結 合体を使用してロードされなかった微粒子からロードされた微粒子を分離する「 パンニング」工程に着手することにより(例えば、より効率的な配列決定のため に)増大され得る。従って、上記の例において、「0.1パーセント」のサンプル が16,700のcDNAしか含まなくても、サンプリングおよびパンニング工程は、所 望するほど多くのロードされた微粒子が蓄積されるまで反復され得る。あるいは 、ロードされた微粒子は、従来のプロトコルを用いて蛍光活性化細胞選別(FACS )装置によりロードされていない微粒子から分離され得る(例えば、タグ-cDNA 結合体は、蛍光標識された右プライマーを提供することにより以下に記載の技術 において蛍光標識され得る。ローディングおよびFACS選別後、標識は、例えば、 メチル化部位を認識するDpnIまたは同様の酵素により、コードアダプターに連結 される前に切断され得る。 パンニング工程は、タグ-cDNA結合体(これらはそれぞれ、オリゴヌクレオチ ドタグに反対のまたは遠位の末端に捕獲部分を含む)のサンプルを提供すること により実行され得る。好ましくは、この捕獲部分は、タグ-cDNA結合体から放出 され得る型であり、その結果、タグ-cDNA結合体は単一塩基配列決定法で配列決 定され得る。このような部分は、ビオチン、ジゴキシゲニン、または同様のリガ ンド、3重鎖結合領域などを含み得る。好ましくは、このような捕獲部分は、ビ オチン成分を含む。ビオチンは、多くの標準的技術によりタグ-cDNA結合体に付 着され得る。PCRプライマー結合部位を含む適切なアダプターがタグ-cDNA結合体 に付着される場合、ビオチンは、サンプリング後の増幅においてビオチン化プラ イマーを用いることにより付着され得る。あるいは、タグ-cDNA結合体がクロー ニングベクターの挿入物である場合、ビオチンは、適切な制限酵素での消化によ りタグ-cDNA結合体を切り出し、続いて単離し、そしてビオチン化ウリジン三リ ン酸の存在下でDNAポリメラーゼを用いてタグに対して遠位の突出鎖をフィルイ ンした後に付着され得る。 タグ-cDNA結合体が捕獲された後、多くの方法において、例えば、還元により 切断されるか(例えば、Hermanら、Anal.Biochem.,156:48-55(1986))、または 光化学的に切断されるか(例えば、Olejnikら、Nucleic Acids Research,24:36 1-366(1996))、またはPCRプライマーに制限部位を導入することにより酵素的に 切断される化学的連結により、ビオチン部分から放出され得る。後者の実施態様 は、上記のタグ-ポリヌクレオチド結合体のライブラリーを考慮することにより 例示され得る: 以下のアダプターは、PCRによる増幅を可能にするために、これらのフラグメン トの末端に連結され得る:ここで「ACTAGT」はSpeI認識部位であり(これは、単一塩基配列決定に容易な互 い違い切断を残す)、そしてX'およびZ'は選択されたヌクレオチドであり、そ の結果、それぞれのプライマーのアニーリングおよび解離温度がほぼ同じである 。アダプターの連結およびビオチン化プライマーを用いたPCRによる増幅後に、 結合体のタグは、T4 DNAポリメラーゼのエキソヌクレアーゼ活性により1本鎖に され、そして結合体は、付着されたタグ相補物を有する微粒子サンプル(例えば 、レパートリー等価物)と組み合わされる。(タグの誤った付着を最小にするた めに)ストリンジェントな条件下でのアニーリング後、結合体は、好ましくは、 それらのタグ相補物に連結され、そしてロードされた微粒子は、アビジン化磁気 ビーズまたは同様の捕獲技術により、ロードされていない微粒子から分離される 。 例に戻ると、このプロセスは、異なるタグ(これは、SpeIでの切断により磁気 ビーズから放出され得る)を有する約10,500(=16,700×0.63)のロードされた 微粒子の蓄積をもたらす。新たな微粒子およびタグ-cDNA結合体のサンプルを用 いてこのプロセスを40〜50回反復することにより、4〜5×105のcDNAが、放出 された微粒子をプールすることにより蓄積され得る。次いで、プールされた微粒 子は、単一塩基配列決定技術により同時に配列決定され得る。 サンプリングおよびパンニング工程を反復する回数の決定、またはより一般的 には、分析するcDNA量の決定は、目的による。目的が、例えば集団の5%以上を 構成する、相対的に共通な配列の発生量における変化をモニターすることである ならば、相対的に小さなサンプル(すなわち、総集団サイズの小さな画分)は、 相対的な発生量の統計学的に有意な評価を可能にし得る。他方では、例えば、集 団の0.1%以下を構成する希な配列の発生量をモニターしようとするなら、大き なサンプルが必要とされる。一般的に、サンプルサイズとサンプルに基づく相対 的発生量評価の信頼性との間に直接的な関連がある。信頼できる統計学的評価を するための適切なサンプルサイズの決定についての文献において広範なガイダン スがある(例えば、Kollerら、NUcleic Acids Research,23:185-191(1994);Go od,Biometrika,40:16-264(1953);Bungeら、J.Am.Stat.Assoc.,88:364-373(19 93)など)。好ましくは、3.0〜3.5×104の異なる配列の105〜108の独立したクロ ーンを含む一連のcDNAライブラリーの分析に基づく遺伝子発現における変化をモ ニターするために、少なくとも104の配列サンプルが各ライブラリーの分析のた めに蓄積される。より好ましくは、少なくとも105の配列サンプルは、各ライブ ラリーの分析のために蓄積される;そして最も好ましくは、少なくとも5×105 の配列サンプルが各ライブラリーの分析のために蓄積される。あるいは、サンプ リングされた配列の数は、好ましくは、集団サイズの0.1%を超えずに、95%の 信頼限界で、0.1%〜5%の範囲内の頻度で存在する配列の相対的発生量を評価 するために十分である。 タグライブラリーの構築 例示的なタグライブラリーは、以下の式により定義されるヌクレオチドA、G 、 およびTの化学的に合成された9-ワードタグを形成するために以下のように構 築される。 ここで「[4(A、G、T)9]」は、各タグがA、G、Tの9つの4-マーワードからな る、タグ混合物を示し;「p」は5'リン酸を示す。この混合物は、以下の右およ び左プライマー結合領域(配列番号4および5)に連結される: 右および左プライマー結合領域は上記のタグ混合物に連結され、この後、連結さ れた構造の1本鎖部分はDNAポリメラーゼでフィルインされ、次いで以下に示さ れる右および左プライマーと混合され、そして増幅されて、タグライブラリーを 生じる。 左プライマー結合領域の下線部分は、RsrII認識部位を示す。右プライマー結合 領域の最も左の下線領域は、Bsp120I、 ApaI、およびEcoO 109Iの認識部位およ びHgaIの切断部位を示す。右プライマー結合領域の最も右の下線領域は、HgaIの 認識部位を示す。必要に応じて、右または左プライマーは、増幅および/または 切断後の精製を容易にするために、(例えば、Clontech Laboratories,Palo Al to,CAから入手可能な従来の試薬を用いて)付着されたビオチンと共に合成され 得る。コードアダプターを用いたcDNA「サイン(signature)」配列決定のためのタグ-ポ リヌクレオチド結合体のプラスミドライブラリーの構築 cDNAは、mRNAのポリA領域の境界に固定された第1鎖合成のプライマーとして pGGCCCT15(AまたはGまたはC)および第2鎖合成のプライマーとしてN8(AまたはT) GATCを用いた従来のプロトコルによりmRNAサンプルから生成される。すなわち、 両方は、第2鎖プライマーが2つの形態で存在し、そして第1鎖プライマーが3 つの形態で存在するような縮重プライマーである。第2鎖プライマーのGATC配列 は、MboIの認識部位に対応し;他の4つの塩基認識部位もまた、BamHI、SphI、E coRIなどのように使用され得る。第2鎖プライマーの認識部位に隣接したAおよ びTの存在は、ストリッピングおよび交換反応が、「GGCCC」の5塩基5'突出を 作成するために次の工程で使用され得る。第1鎖プライマーはmRNAサンプルにア ニールされ、そして逆転写酵素で伸長され、この後RNA鎖は、逆転写酵素のRNase H活性により分解され、1本鎖cDNAが残る。第2鎖プライマーはアニールされ、 そして従来のプロトコルを用いてDNAポリメラーゼで伸長される。第2鎖の合成 後、得られたcDNAは、製造者のプロトコルを用いてCpGメチラーゼ(New England Biolabs,Beverly,MA)でメチル化される。次いで、cDNAの3'鎖は、dATPおよ びdTTPの存在下でT4 DNAポリメラーゼを用いた上記のストリッピングおよび交換 反応で切り戻され、この後、cDNAはHga Iで予め切断された上記のタグライブラ リーに連結されて、以下の構築物を生じる: 別々に、以下のクローニングベクターは、例えば、市販のプラスミド(例えば、 Bluescriptファージミド(Stratagene,La Jolla,CA))から開始して構築される (配列番号6)。 プラスミドは、PpuMIおよびPmeIで切断され(挿入物が指向されるようにRsrII適 合可能末端および平滑末端を生じる)、次いでDAMメチラーゼでメチル化される 。タグ含有構築物はRsrIIで切断され、次いで開裂したプラスミドに連結され、 この後結合体はMboIおよびBamHIで切断され、プラスミドの連結およびクローニ ングを可能にする。次いで、プラスミドは、本発明に従う使用のために増幅され 、そして単離される。 実施例1pGEM7Z から増幅された標的ポリヌクレオチドの配列決定:連結および切断のサイ クルによるヌクレオチドの同定 本実施例において、プラスミドpGEM7Z(Promega,Madison,WI)のセグメントを 増幅し、そして2本鎖DNAリンカー(このうちの一方の鎖をビーズ上で直接合成 する(従って、ビーズに共有結合する))を介してガラスビーズに付着させる。 標的ポリヌクレオチドの末端をコードアダプターへの連結のために調製した後、 連結および切断の各サイクルにおいて、コードアダプターの混合物(全部で1024 の異なるアダプター)を標的ポリヌクレオチドに適用し、その結果、その突出鎖 が標的ポリヌクレオチドと完全にマッチした2重鎖を形成するアダプターのみが 連結される。次いで、16の蛍光標識されたタグ相補物のそれぞれを、正しいタグ 相補物のみのハイブリダイゼーションを可能にする条件下でポリヌクレオチド- アダプター結合体に適用する。洗浄後の蛍光シグナルの存在または非存在は、特 定の位置の特定のヌクレオチドの存在または非存在を示す。本実施例の配列決定 プロトコルは、Brenner、国際特許出願PCT/US95/12791およびPCT/US96/09513(WO 96/12041およびWO 96/41011)に記載されるように、1つ以上の固相支持体に選 別される複数の標的ポリヌクレオチドに適用可能である。 47マーオリゴヌクレオチドを、標準的自動化DNA合成機プロトコルを用いてBal lotiniビーズ(0.040〜0.075mm、Jencons Scientific,Bridgeville,PA)上に 直接合成する。その47マーに対する相補鎖を別々に合成し、そしてHPLCにより精 製する。ハイブリダイズされると、得られた2重鎖はビーズから遠位の末端にBs tXI制限部位を有する。相補鎖を、以下の混合物中で付着された47マーにハイブ リダイズさせる:25μLの200pmol/μL相補鎖;20mgの47マーを有するBallotin iビーズ;6μLのNuw England Biolabs#3制限緩衝液(10×ストック溶液から) ;および25μLの蒸留水。混合物を93℃に加熱し、次いで55℃にゆっくりと冷却 し、この後40ユニットのBstXI(10ユニット/μL)を、60μLの反応容量にするよ うに添加する。混合物を55℃で2時間インキュベートし、この後ビーズをTE(pH 8.0)中で3回洗浄する。 ビーズに付着したpGEM7Zのセグメントを以下のように調製する:2つのPCRプ ライマーを、標準的なプロトコルを用いて調製した(配列番号7および配列番号 8): PCR反応混合物は以下からなる:1μlの1ng/μl pGEM7Z;10μlの10pmol/μ lプライマー1;10μlの10pmol/μlプライマー2;10μlの2.5mMデオキシリ ボヌク レオチド三リン酸;10μlの10×PCR緩衝液(Perkin-Elmer);0.5μlの5ユニ ット/μlTaq DNAポリメラーゼ;および100μlの最終容量を得るための58μl 蒸留水。反応混合物を93℃30秒;60℃15秒;および72℃60秒の25サイクルに供し て、172塩基対産物を得、これをBbvI(100μlのPCR反応混合物、12μlの10× #1New England Biolabs緩衝液、8μlの1ユニット/μl BbvIが37℃で6時 間インキュベートされる)およびBstXI(BbvI反応混合物に添加する:5μlの1 M NaCl、67μlの蒸留水、および8μlの10ユニット/μl BstXI、得られた混 合物を55℃で2時間インキュベートする)で連続的に消化する。 上記の反応混合物を製造者のプロトコルに従ってCentricon 30(Amicon,Inc.) スピンカラムに通過させた後、BbvI/BstXI制限処理フラグメントを、以下の混合 物:17μlのBbvI/BstXI制限処理フラグメント(10μg)、10μlのビーズ(20 mg)、6mlの10×連結緩衝液(New England Biolabs、NEBとして以下で呼ばれる )、2000単位/μlの5μlT4 DNAリガーゼ、および22μlの蒸留水(この混合 物を、25℃で4時間インキュベートする)中でBallotiniビーズに付着された2 本鎖リンカーに連結し、この後ビーズをTE(pH8.0)で3回洗浄し、5'リン酸を有 する配列決定のための以下の標的ポリヌクレオチド(配列番号9)を残す: 5'リン酸を、製造者のプロトコルを用いてNew England Biolabs(Beverly,MA)か ら入手可能なアルカリホスファターゼ(例えば、子ウシ腸由来)でビーズ混合物 を処理することにより除去する。 以下の64コードアダプターの16セット(配列番号10〜配列番号25)の上部鎖の それぞれを、標準的方法を用いて自動化DNA合成機(モデル392 Applied Biosyst ems,Foster City)で別々に合成する。全てのアダプターについて同じである下 部鎖を別々に合成し、次いでそれぞれの上部鎖にハイブリダイズさせる:ここで、Nおよびpは上記で定義された通りであり、そして小文字で示されたヌ クレオチドは12マーのオリゴヌクレオチドタグである。各タグは、6ヌクレオチ ドで互いに異なる。等モル量の各アダプターを、1000pmol/μlの濃度の混合物 を形成するために、NEB緩衝液2番(New England Biosciences,Beverly,MA) 中で混合する。 各16タグ相補物を、アミノ誘導体オリゴヌクレオチドとして別々に合成し、そ してポリエチレングリコールリンカー(Clontech Laboratories,Palo Alto,CA )を通してタグ相補物の5'末端に付着される、フルオレセイン分子(例えば、Mo lecular Probes,Eugene,ORから入手可能なFAM、フルオレセインのNHSエステル )でそれぞれ標識する。タグ相補物の配列は、単に、上記に列挙されたタグの12 マー相補物である。 標的ポリヌクレオチドへのアダプターの連結を、5μlビーズ(20mg)、3μ LNEB 10×リガーゼ緩衝液、5μLアダプター混合物(25nM)、2.5μL NEB T4 DNAリガーゼ(2000ユニット/μL)および14.5μLの蒸留水からなる混合物中 で行う。混合物を、16℃で30分間インキュベートし、この後、ビーズをTE(pH8. 0)で3回洗浄する。 TEの遠心分離および除去後、連結アダプターの3'リン酸を、製造者のプロトコ ルを用いて子ウシ腸アルカリホスファターゼ(CIP)(New England Biolabs,Bever ly,MA)でポリヌクレオチド-ビーズ混合物を処理することにより除去する。3'リ ン酸の除去後、CIPを、製造者のプロトコルを用いて、例えば、PronaseTM(Boeri nger Mannhiem,Indianapolis,INから入手可能)または等価なプロテアーゼを用 いたタンパク質分解消化により不活化し得る。次いで、ポリヌクレオチド-ビー ズ混合物を洗浄し、そして標的ポリヌクレオチドへのアダプターの連結を完全に するために、T4ポリヌクレオチドキナーゼおよびT4 DNAリガーゼ(New England B iolabs,Beverly,MA)の混合物で処理して、標的ポリヌクレオチドとアダプター との間のギャップに5'リン酸を付加する。次いで、ビーズ-ポリヌクレオチド混 合物をTEで洗浄する。 別々に、各標識タグ相補物を、オリゴヌクレオチドタグとそれらのそれぞれの 相補物との間でのみ完全にマッチした2重鎖の形成を可能にする条件下で、ポリ ヌクレオチド-ビーズ混合物に適用し、この後混合物をストリンジェントな条件 下で洗浄し、そして蛍光シグナルの存在または非存在を測定する。タグ相補物を 、25nMタグ相補物、50mM NaCl,3mM Mg、10mM Tris-HCl(pH8.5)からなる溶液中 で20℃で適用し、10分間インキュベートし、次いで同じ溶液(タグ相補物なしで )で55℃で10分間洗浄する。 4つのヌクレオチドを上記のように同定した後、コードアダプターを、製造者 のプロトコルを用いてBbvIでポリヌクレオチドから切断する。最初の連結および 同定後、連結、同定、および切断のサイクルを3回反復して、標的ポリヌクレオ チドの16末端ヌクレオチドの配列を得る。図4は、5〜16位(ビーズから最も遠 位〜ビーズから最も近位)のヌクレオチドを同定するために適用された4つのタ グ相補物のそれぞれからの相対的蛍光を示す。 実施例2 コードアダプターを用いたサイン配列決定のための cDNA ライブラリーの構築および選別 本実施例においてcDNAライブラリーを構築し、ここで8つの4-ヌクレオチド 「ワード」からなるオリゴヌクレオチドタグを各cDNAに連結する。上記のように 、このサイズのオリゴヌクレオチドタグのレパートリーは十分に大きく(約108 )、その結果、cDNAが約106のmRNAの集団から合成される場合、各cDNAは選別の ための特有のタグを有する確率が高い。mRNA抽出後、第1鎖合成を、(特定のcD NA制限部位をブロックするために)5-Me-dCTPおよびオリゴヌクレオチドタグ含 有ビオチン化プライマー混合物の存在下で行う。従来の第2鎖合成後、タグ-cDN A結合体をDpnII(5-Me-デオキシシトシンにより影響されない)で切断し、ビオ チン化部分をストレプトアビジンコート磁気ビーズを用いて反応混合物から分離 し、そしてタグ-cDNA結合体を、それらをビオチン化プライマーにより運ばれるB smBI部位を介して磁気ビーズから切断することにより回収する。次いで、タグ-c DNA結合体を含むBsmBI-DpnIIフラグメントをプラスミドに挿入し、そして増幅す る。プラスミドの単離後、タグ-cDNA結合体を、予め定義されたエンドヌクレア ーゼ部位を含むビオチン化および蛍光標識化プライマーを用いて、5-Me-dCTPの 存在 下でPCRによりプラスミドから増幅する。ストレプトアビジンコート磁気ビーズ でのアフィニティ精製後、タグ-cDNA結合体をビーズから切断し、タグを1本鎖 にするためにdGTPの存在下でT4 DNAポリメラーゼで処理し、次いで付着されたタ グ相補物を有するGMAビーズのレパートリーと混合する。ストリンジェントなハ イブリダイゼーションおよび連結後、GMAビーズを、cDNAでロードされたGMAビー ズの富化集団を生成するためにFACSを介して選別する。ロードされたGMAビーズ の富化集団を、1塩基ずつの配列がコードアダプターを用いて起こるフローチャ ンバー中で平面配列に固定する。 約5μgのポリ(A+)mRNAを、従来のプロトコルを用いてDBY746酵母細胞から 抽出する。第1および第2鎖cDNA合成を、製造者のプロトコルに従ってStratage ne(La Jolla,CA)cDNA合成キットを用いて、100〜150pmolの以下のプライマー( 配列番号26): とポリ(A+)mRNAとを組み合せることにより行う。これは、第1鎖デオキシシト シンが5炭素位置でメチル化されているcDNAをもたらす。上記の式において、「 V」はG、C、またはAであり、「W、W、W、G」は上記の表IIから選択される4 -ヌクレオチドワードであり、一重下線部分はBsmBI認識部位であり、二重下線部 分はPacI認識部位である。従来のプロトコルを用いたサイズ画分(GIBCO-BRLcDN Aサイズ画分キット)後に、cDNAを製造者のプロトコルを用いてDpnII(New Engla nd Bioscience,Beverly,MA)で消化し、ストレプトアビジンコート磁気ビーズ (M-280ビーズ、Dynal A.S.,Oslo,Norway)でアフィニティ精製する。ビーズに より捕獲されたDNAをBsmBIで消化して、標準的なプロトコルを用いて改変pBCSK- ベクター(Stratagene,La Jolla,CA)へのクローニングのためにタグ-cDNA結 合体を放出する。以下のフラグメント(配列番号27)をKpnI/EcoRV消化ベクター に挿入することによってBbsI部位を付加することにより、pBCSK-ベクターを改変 する。 BsmBI/DpnII消化タグ-cDNA結合体を、予めBbsIおよびBamHIで消化したpBCSK-に 挿入する。連結後に、増幅のために、製造者の推奨する宿主にベクターをトラン スフェクトする。 標準的プラスミドミニプレップから上記のpBCSK-ベクターを単離した後に、タ グ-cDNA結合体を、タグ-cDNA挿入物に隣接するベクター配列に相補的な20-マー プライマーを用いて5-Me-dCTPの存在下でPCRにより増幅する。「上流」プライマ ー(すなわちタグに隣接)をビオチン化し、そして「下流」プライマー(すなわ ちcDNAに隣接)をフルオレセインで標識する。増幅後、PCR産物をアフィニティ 精製し、次いでPacIで切断して、蛍光標識されたタグ-cDNA結合体を放出させる 。結合体のタグを、それらをdGTPの存在下でT4 DNAポリメラーゼを用いて処理す ることにより1本鎖にする。反応物をクエンチングした後、タグ-cDNA結合体を フェノール-クロロホルム抽出により精製し、そしてタグ相補物(各タグ相補物 は5'リン酸を有する)を保持する5.5mm GMAビーズと組み合わせる。それらの相 補物と完全にマッチした2重鎖を形成するタグのみが連結されるように、ハイブ リダイゼーションを耐熱性リガーゼの存在下でストリンジェントな条件下で行う 。GMAビーズを洗浄し、そしてロードされたビーズを蛍光標識されたcDNAを用い てFACS選別により濃縮し、ロードされたGMAビーズを同定する。GMAビーズに付着 されたタグ-cDNA結合体をDpnIIで消化して蛍光標識を除去し、そして配列決定の ためのcDNAを調製するためにアルカリホスファターゼで処理する。 以下の切断アダプター(配列番号28)を、DpnII消化およびホスファターゼ処 理cDNAに連結する: この後、3'リン酸をアルカリホスファターゼにより除去し、cDNAの5'鎖をT4 DNA キナーゼで処理し、そして切断アダプターとcDNAとの間のニックを連結する。Bb vIによる切断後、実施例1のコードアダプターを上記のcDNAの末端に連結する。 図5に模式的に示されたフローチャンバー(500)を、標準的ミクロ機械加工 技術(例えば、Ekstromら、国際特許出願PCT/SE91/00327(WO 91/16966);Brown ,米国特許第4,911,782号;Harrisonら、Anal.Chem.64:1926-1932(1992)など) を用いて、ガラス板(506)中の液体入口(502)および出口(504)を有する空洞 を エッチングすることにより調製する。フローチャンバー(500)の寸法は、ロー ドされた微粒子(508)(例えば、GMAビーズ)が、100万〜200万ビーズの密にパ ックされた平面単層で空洞内(510)で配置され得るようなものである。空洞(51 0)は、エッチングされたガラス板(506)へのガラスカバースリップ(512)のア ノード結合により入口および出口を有して密封チャンバー内に作られる(例えば 、Pomerantz,米国特許第3,397,279号)。試薬は、シリンジポンプ(514〜520) から、一般的に自動化DNAおよびペプチド合成機で使用されるようにマイクロプ ロセッサーにより制御される弁ブロック(522)を通してフローチャンバーに供 給される(例えば、Bridghamら、米国特許第4,668,479号;Hoodら、米国特許第4 ,252,769号;Barstowら、米国特許第5,203,368号;Hunkapiller,米国特許第4,7 03,913号など)。 連結、同定、および切断の3サイクルを、約100,000cDNAのそれぞれの末端に1 2ヌクレオチドの配列を生じさせるために、フローチャンバー(500)において行 う。cDNAのヌクレオチドを、実施例1に記載のようにタグ相補物をコードアダプ ターにハイブリダイズさせることにより同定する。特異的にハイブリダイズした タグ相補物を、それらの蛍光標識を光源(526)(レーザー、水銀アークランプ などであり得る)からの照明ビーム(524)で励起することにより検出する。照 明ビーム(524)はフィルター(528)を通して通過し、そしてフローチャンバー (500)内のコードアダプターに特異的にハイブリダイズしたタグ相補物上の蛍 光標識を励起する。生じた蛍光(530)を共焦点顕微鏡(532)により集め、フィ ルター(534)を通過させ、そしてCCDカメラ(536)に指向させる。これは、ワ ークステーション(538)によるプロセシングおよび分析のためにビーズ配列の 電気画像を作成する。好ましくは、各連結および切断工程後、cDNAをPronaseTM または同様の酵素で処理する。コードアダプターおよび約0.75ユニット/μLのT 4 DNAリガーゼ(Promega,Madison,WI)を、16℃で約20〜30分間、約1〜2μ L/分の流速でフローチャンバーに通過させる。この後、3'リン酸をアダプター から除去し、そして0.02ユニット/μLのアルカリホスファターゼ(New Englan d Bioscience,Beverly,MA)および7ユニット/μLのT4 DNAキナーゼ(New En gland Bioscience,Beverly,MA)の混合物を15〜20分間、1〜2μL/分の流速 で37℃ でフローチャンバーを通過させることにより第2鎖連結のためのcDNAを調製する 。連結を、20〜30分間フローチャンバーに通したT4 DNAリガーゼ(0.75ユニット /mL、Promega)により達成する。25nM濃度のタグ相補物を、20℃で10分間、1〜 2μL/分の流速でフローチャンバーに通過させ、この後、タグ相補物によりも たらされる蛍光標識を照明し、そして蛍光を集める。タグ相補物を、ハイブリダ イゼーション緩衝液を55℃で10分間、1〜2μL/分の流速で37℃でフローチャ ンバーに通過させることにより、コードアダプターから融解する。コードアダプ ターを、1ユニツト/μLのBbvI(New England Bioscience,Beverly,MA)を37 ℃で20分間、1〜2μL/分の流速で通過させることによりcDNAから切断する。 補遺I最小にクロスハイブリダイズするセット(1本鎖タグ/1本鎖タグ相補物)を作 成するための例示的なコンピュータープログラム 補遺II最小にクロスハイブリダイズするセット(2本鎖タグ/1本鎖タグ相補物)を作 製するための例示的なコンピュータープログラム
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(GH,KE,LS,MW,S D,SZ,UG),EA(AM,AZ,BY,KG,KZ ,MD,RU,TJ,TM),AL,AM,AT,AU ,AZ,BA,BB,BG,BR,BY,CA,CH, CN,CZ,DE,DK,EE,ES,FI,GB,G E,GH,HU,IL,IS,JP,KE,KG,KP ,KR,KZ,LC,LK,LR,LS,LT,LU, LV,MD,MG,MK,MN,MW,MX,NO,N Z,PL,PT,RO,RU,SD,SE,SG,SI ,SK,TJ,TM,TR,TT,UA,UG,UZ, VN,YU (72)発明者 ブレナー,シドニー イギリス国 シービー2 3ピージェイ ケンブリッジ,セント エドワーズ パッ セージ 17ビー (72)発明者 ロイド,デイビッド エイチ. アメリカ合衆国 カリフォルニア 94014, デイリイ シティ,ナンバー 1,ポイン ト パシフィック ドライブ 850 (72)発明者 ダブリッジ,ロバート ビー. アメリカ合衆国 カリフォルニア 94002, ベルモント,ホーリー ロード 825 (72)発明者 パラス,マイケル シー. アメリカ合衆国 カリフォルニア 94066, サン ブルノ,オーク アベニュー 408

Claims (1)

  1. 【特許請求の範囲】 1.ポリヌクレオチド末端のヌクレオチド配列を決定する方法であって、該方法 は以下の工程: 1つ以上のコードアダプターをポリヌクレオチドの1つまたは両方の末端に連 結する工程であって、ここで各コードアダプターは、(i)最小にクロスハイブ リダイズするオリゴヌクレオチドのセットから選択されたオリゴヌクレオチドタ グ、および(ii)ポリヌクレオチドの鎖の一部分に相補的な突出鎖、を含む2本 鎖デオキシリボ核酸であり、ここで該最小にクロスハイブリダイズするオリゴヌ クレオチドのセットの各オリゴヌクレオチドは、少なくとも2つのヌクレオチド で該セットの他の全てのオリゴヌクレオチドとは異なる、工程、および タグ相補物を、それに連結された1つ以上のコードアダプターの各オリゴヌク レオチドタグに特異的にハイブリダイズさせることにより、該ポリヌクレオチド 鎖の該部分のそれぞれにおける1つ以上のヌクレオチドを同定する工程、 を包含する、方法。 2.請求項1に記載の方法であって、前記連結する工程が、前記複数の異なるコ ードアダプターの前記突出鎖が前記ポリヌクレオチドの鎖の複数の異なる部分に 相補的であり、その結果、該異なるコードアダプターと該鎖の該異なる部分との 間に1対1の対応が存在するように、該複数の異なるコードアダプターを該ポリ ヌクレオチドの前記末端に連結することを包含する、方法。 3.前記ポリヌクレオチドの鎖の前記異なる部分が連続している、請求項2に記 載の方法。 4.請求項1から3のいずれか1つに記載の方法であって、前記コードアダプタ ーの前記突出鎖が、2から6のヌクレオチドを含み、そして前記同定する工程が 、前記ポリヌクレオチドの前記部分における各ヌクレオチドの同一性が連続的に 決定されるように、前記タグ相補物を前記オリゴヌクレオチドタグに特異的にハ イ ブリダイズさせることを包含する、方法。 5.請求項1から4のいずれか1つに記載の方法であって、前記同定する工程が 、前記ポリヌクレオチドの前記部分において同定されるヌクレオチドの数に等し いタグ相補物の多数のセットを提供することをさらに包含する、方法。 6.請求項5に記載の方法であって、前記同定する工程が、蛍光シグナル発生部 分により発生されるシグナルによって予め決定されたヌクレオチドの存在を同定 し得る前記セットのそれぞれにおいて、前記タグ相補物を提供することをさらに 包含し、ヌクレオチドの各種類について異なる蛍光シグナル発生部分が存在する 、方法。 7.請求項1から6のいずれか1つに記載の方法であって、前記コードアダプタ ーの前記オリゴヌクレオチドタグが1本鎖であり、そして該オリゴヌクレオチド タグに対する前記タグ相補物が1本鎖であり、その結果、オリゴヌクレオチドタ グとそのそれぞれのタグ相補物との間の特異的なハイブリダイゼーションがワト ソン-クリック塩基対形成により生じる、方法。 8.請求項7に記載の方法であって、前記コードアダプターが以下の形態を有し : または ここで、Nはヌクレオチドであり、N'はその相補物であり、pはリン酸基であ り、zは3'水酸基または3'ブロッキング基であり、nは2から6の間の整数であ り、rは0から18の間の整数であり、sは、コードアダプターがヌクレアーゼ認 識部位を有する場合はいつでも4から6の間のいずれかである整数であるか、ま たはヌクレアーゼ認識部位がない場合はいつでも0であり、qは0を超える整数 であるかもしくは0に等しく、そしてtは8を超える整数であるかもしくは8に 等しい、方法。 9.請求項8に記載の方法であって、ここでrが0から12の間であり、tが8か ら20の間の整数であり、そしてzがリン酸基である、方法。 10.請求項1から6のいずれか1つに記載の方法であって、前記コードアダプ ターの前記オリゴヌクレオチドタグが2本鎖であり、そして該オリゴヌクレオチ ドタグに対する前記タグ相補物が1本鎖であり、その結果、オリゴヌクレオチド タグとそのそれぞれのタグ相補物との間の特異的なハイブリダイゼーションがフ ーグスティーンまたは逆フーグスティーン3重鎖の形成により生じる、方法。 11.請求項10に記載の方法であって、前記コードアダプターは以下の形態を 有し: または ここで、Nはヌクレオチドであり、N'はその相補物であり、pはリン酸基であ り、zは3'水酸基または3'ブロッキング基であり、nは2から6の間の整数であ り、rは0から18の間の整数であり、sは、コードアダプターがヌクレアーゼ認 識部位を有する場合はいつでも4から6の間のいずれかである整数であるか、ま たはヌクレアーゼ認識部位がない場合はいつでも0であり、qは0を超える整数 であるかもしくは0に等しく、そしてtは8を超える整数であるかもしくは8に 等しい、方法。 12.請求項11に記載の方法であって、rが0から12の間であり、tが12から 24の間の整数であり、そしてzがリン酸基である、方法。 13.請求項1から12のいずれか1つに記載の方法であって、前記最小にクロ スハイブリダイズするセットのメンバーは、少なくとも6ヌクレオチドで他の全 てのメンバーと異なる、方法。 14.複数のポリヌクレオチドのヌクレオチド配列を決定する方法であって、該 方法は以下の工程: (a)レパートリー由来の各第1のオリゴヌクレオチドタグが第1の最小にク ロスハイブリダイズするオリゴヌクレオチドのセットから選択されるように、該 タグレパートリー由来の第1のオリゴヌクレオチドタグをポリヌクレオチド集団 中の各ポリヌクレオチドに付着させる工程であって、ここで該第1の最小にクロ スハイブリダイズするセットの各オリゴヌクレオチドは、少なくとも2つのヌク レオチドで該第1のセットの他の全てのオリゴヌクレオチドとは異なる、工程; (b)該ポリヌクレオチドの集団をサンプリングして、サンプル中の実質に全 ての異なるポリヌクレオチドが、付着された異なる第1のオリゴヌクレオチドタ グを有するように、ポリヌクレオチドのサンプルを形成する工程; (c)該第1のオリゴヌクレオチドタグとそれらのそれぞれの相補物とを特異 定にハイブリダイズさせることにより、該サンプルの該ポリヌクレオチドを選別 する工程であって、該それぞれの相補物は、1つ以上の固相支持体の上の空間的 に別々の領域に実質的に同一のオリゴヌクレオチドの均一な集団として付着され る、工程 (d)1つ以上のコードアダプターを該サンプル中の該ポリヌクレオチドの1 つの末端または両末端に連結する工程であって、ここで各コードアダプターは、 (i)オリゴヌクレオチドの最小にクロスハイブリダイズするセットから選択さ れたオリゴヌクレオチドタグ、および(ii)該ポリヌクレオチド鎖の部分に相補 的な突出鎖を含む、2本鎖デオキシリボ核酸であり、第2の最小にクロスハイブ リダイズするセットの各オリゴヌクレオチドは、少なくとも2ヌクレオチドで該 第2のセットの他の全てのオリゴヌクレオチドと異なる、工程;および (e)タグ相補物を1つ以上の該コードアダプターの各第2のオリゴヌクレオ チドタグに特異的にハイブリダイズさせることにより、該ポリヌクレオチドの該 突出鎖における複数のヌクレオチドを同定する工程、 を包含する、方法 15.請求項14に記載の方法であって、(f)新たな突出鎖が前記ポリヌクレ オチドのそれぞれの前記末端に形成されるように、その切断部位から離れたヌク レアーゼ認識部位を有するヌクレアーゼを用いて前記コードアダプターを該ポリ ヌクレオチドから切断する工程、および(g)工程(d)から(f)を反復する 工程、をさらに包含する、方法。 16.mRNA分子の集団を同定する方法であって、該方法は以下の工程: (a)各cDNA分子が、付着された第1のオリゴヌクレオチドタグを有するよう に、該mRNA分子の集団からcDNA分子の集団を形成する工程であって、該第1のオ リゴヌクレオチドタグが、第1の最小にクロスハイブリダイズするオリゴヌクレ オチドのセットから選択され、ここで該第1の最小にクロスハイブリダイズする セットの各オリゴヌクレオチドは、少なくとも2つのヌクレオチドで該第1のセ ットの他の全てのオリゴヌクレオチドと異なる、工程; (b)該cDNA分子の集団をサンプリングして、実質的に全ての異なるcDNA分子 が付着された異なる第1のオリゴヌクレオチドタグを有するようなcDNA分子のサ ンプルを形成する工程; (c)該第1のオリゴヌクレオチドタグをそれらのそれぞれの相補物と特異的 にハイブリダイズさせることにより該cDNA分子を選別する工程であって、該それ ぞれの相補物は、1つ以上の固相支持体上の空間的に別々の領域において実質的 に同一の相補物の均一な集団として付着される、工程; (d)1つ以上のコードアダプターを該集団中の該cDNA分子の末端に連結する 工程であって、ここで各コードアダプターは、(i)最小にクロスハイブリダイ ズするオリゴヌクレオチドのセットから選択されたオリゴヌクレオチドタグ、お よび(ii)該ポリヌクレオチドの鎖の一部分に相補的な突出鎖を含む、2本鎖デ オキシリボ核酸であり、ここで第2の最小にクロスハイブリダイズするセットの 各オリゴヌクレオチドは、少なくとも2つのヌクレオチドで該第2のセットの他 の全てのオリゴヌクレオチドと異なる、工程;および (e)タグ相補物を1つ以上の該コードアダプターの各第2のオリゴヌクレオ チドタグに特異的にハイブリダイズさせることにより、該cDNA分子の該突出鎖の それぞれにおける複数のヌクレオチドの同一性および順序を決定する工程、 を包含し、ここで該mRNA分子の集団が、該cDNA分子の配列の一部分の頻度分布に より同定される、方法 17.請求項16に記載の方法であって、(f)新たな突出鎖が前記cDNA分子の それぞれの前記末端に形成されるように、その切断部位から離れたヌクレアーゼ 認識部位を有するヌクレアーゼを用いて前記コードアダプターを前記ポリヌクレ オチドから切断する工程、および(g)工程(d)から(f)を反復する工程、 をさらに包含する、方法。 18.ポリヌクレオチド末端のヌクレオチド配列を決定する方法であって、該方 法は以下の工程: (a)コードアダプターを該ポリヌクレオチドの末端に連結する工程であって 、ここで各コードアダプターは、(i)最小にクロスハイブリダイズするオリゴ ヌクレオチドのセットから選択されたオリゴヌクレオチドタグ、および(ii)該 ポリヌクレオチドの鎖の一部分に相補的な突出鎖を含む、2本鎖デオキシリボ核 酸であり、ここで該最小にクロスハイブリダイズするセットの各オリゴヌクレオ チドは、少なくとも2ヌクレオチドで該セットの他の全てのオリゴヌクレオチド と異なる、工程; (b)タグ相補物をそれに連結されたコードアダプターの該オリゴヌクレオチ ドタグに特異的にハイブリダイズさせることにより、該ポリヌクレオチド鎖の該 一部分における1つ以上のヌクレオチドを同定する工程; (c)新たな突出鎖が該ポリヌクレオチドの末端に形成されるように、その切 断部位から離れたヌクレアーゼ認識部位を有するヌクレアーゼを用いて、該コー ドアダプターを該ポリヌクレオチド末端から切断する工程;および (d)工程(a)から(c)を反復する工程、 を包含する、方法。 19.請求項18に記載の方法であって、前記コードアダプターの前記突出鎖が 2から6のヌクレオチドを含み、そして前記同定する工程が、前記ポリヌクレオ チドの前記部分における各ヌクレオチドの同一性が連続的に決定されるように、 連続的に前記タグ相補物を前記オリゴヌクレオチドタグに特異的にハイブリダイ ズさせる工程を包含する、方法。 20.請求項19に記載の方法であって、前記同定する工程が、前記ポリヌクレ オチドの前記部分において同定されたヌクレオチドの数に等しい前記タグ相補物 の多数のセットを提供することをさらに包含する、方法。 21.請求項20に記載の方法であって、前記同定する工程が、蛍光シグナル発 生部分により発生されるシグナルにより予め決定されたヌクレオチドの存在を示 し得る前記セットのそれぞれにおいて、前記タグ相補物を提供することをさらに 包含し、ヌクレオチドの各種類について異なる蛍光シグナル発生部分が存在する 、方法。 22.請求項18から21のいずれか1つに記載の方法であって、ここで前記コ ードアダプターの前記オリゴヌクレオチドタグが1本鎖であり、そして前記オリ ゴヌクレオチドタグに対する前記タグ相補物が1本鎖であり、その結果、オリゴ ヌクレオチドタグとそのそれぞれのタグ相補物との間の特異的なハイブリダイゼ ーションがワトソン-クリック塩基対形成により生じる、方法。 23.以下の形態を有する複数の2本鎖オリゴヌクレオチドアダプターを含む物 質の組成物: または ここで、Nはヌクレオチドであり、N'はその相補物であり、pはリン酸基であ り、zは3'水酸基または3'ブロッキング基であり、nは2から6の間の整数であ り、rは0から18の間の整数であり、sは、コードアダプターがヌクレアーゼ認 識部位を有する場合はいつでも4から6の間のいずれかである整数であるか、ま たはヌクレアーゼ認識部位がない場合はいつでも0であり、qは0を超える整数 であるかもしくは0に等しく、そしてtは8を超える整数であるかもしくは8に 等しく、そして(N)1は、1本鎖であり、そして最小にクロスハイブリダイズする オリゴヌクレオチドのセットの各オリゴヌクレオチドが少なくとも2塩基対で該 セットの他の全てのオリゴヌクレオチドと異なるような該セットから選択される 、組成物。 24.請求項23に記載の組成物であって、ここで前記rが0から12の間であり 、前記tが8から20の間の整数であり、そして前記zがリン酸基である、組成物 。 25.以下の形態を有する複数の2本鎖オリゴヌクレオチドアダプターを含む物 質の組成物: または ここで、Nはヌクレオチドであり、N'はその相補物であり、pはリン酸基であ り、zは3'水酸基または3'ブロッキング基であり、nは2から6の間の整数であ り、rは0から18の間の整数であり、sは、コードアダプターがヌクレアーゼ認 識部位を有する場合はいつでも4から6の間のいずれかである整数であるか、ま たはヌクレアーゼ認識部位がない場合はいつでも0であり、qは0を超える整数 であるかもしくは0に等しく、そしてtは8を超える整数であるかもしくは8に 等しく、 (N)t (N')t は、最小にクロスハイブリダイズするオリゴヌクレオチドのセットの各オリゴヌ クレオチドが少なくとも2つの塩基対で該セットの他の全てのオリゴヌクレオチ ドと異なるような、該セットから選択される2本鎖部分を形成する、組成物。 26.請求項25に記載の組成物であって、ここで前記rが0から12の間であり 、前記tが12から24の間の整数であり、そして前記zがリン酸基である、組成物 。 27.請求項23から26のいずれか1つに記載の組成物であって、ここで前記 最小にクロスハイブリダイズするセットのメンバーは、少なくとも6つのヌクレ オチドで他の全てのメンバーと異なる、組成物。
JP50075598A 1996-06-06 1997-06-02 コードアダプターの連結による配列決定 Expired - Lifetime JP4124377B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US08/659,453 1996-06-06
US08/659,453 US5846719A (en) 1994-10-13 1996-06-06 Oligonucleotide tags for sorting and identification
US68958796A 1996-08-12 1996-08-12
US08/689,587 1996-08-12
PCT/US1997/009472 WO1997046704A1 (en) 1996-06-06 1997-06-02 Sequencing by ligation of encoded adaptors

Publications (3)

Publication Number Publication Date
JP2000515006A true JP2000515006A (ja) 2000-11-14
JP2000515006A5 JP2000515006A5 (ja) 2004-12-09
JP4124377B2 JP4124377B2 (ja) 2008-07-23

Family

ID=27097828

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50075598A Expired - Lifetime JP4124377B2 (ja) 1996-06-06 1997-06-02 コードアダプターの連結による配列決定

Country Status (13)

Country Link
EP (1) EP0923650B1 (ja)
JP (1) JP4124377B2 (ja)
CN (1) CN1195872C (ja)
AT (1) ATE356221T1 (ja)
AU (1) AU733782B2 (ja)
CA (1) CA2256700A1 (ja)
CZ (1) CZ397998A3 (ja)
DE (1) DE69737450T2 (ja)
HK (1) HK1021206A1 (ja)
HU (1) HUP0003944A3 (ja)
NO (1) NO985698L (ja)
PL (1) PL331513A1 (ja)
WO (1) WO1997046704A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007097443A1 (ja) * 2006-02-20 2007-08-30 National University Corporation Hokkaido University Dna塩基配列を決定する方法
JP2017527295A (ja) * 2014-10-14 2017-09-21 深▲せん▼華大基因科技有限公司 リンカー要素、及び、それを使用してシーケンシングライブラリーを構築する方法
JP2018138052A (ja) * 2014-01-31 2018-09-06 スウィフト バイオサイエンシズ, インク.Swift Biosciences, Inc. Dna基質を処理するための改善された方法

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE43097E1 (en) 1994-10-13 2012-01-10 Illumina, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
WO1998053300A2 (en) 1997-05-23 1998-11-26 Lynx Therapeutics, Inc. System and apparaus for sequential processing of analytes
DE69638179D1 (de) * 1995-06-07 2010-06-10 Solexa Inc Verfahren zur Verbesserung der Effizienz der Polynukleotidsequenzierung
GB9620769D0 (en) * 1996-10-04 1996-11-20 Brax Genomics Ltd Nucleic acid sequencing
US5888737A (en) * 1997-04-15 1999-03-30 Lynx Therapeutics, Inc. Adaptor-based sequence analysis
US6607878B2 (en) 1997-10-06 2003-08-19 Stratagene Collections of uniquely tagged molecules
US6265163B1 (en) 1998-01-09 2001-07-24 Lynx Therapeutics, Inc. Solid phase selection of differentially expressed genes
JP3944996B2 (ja) 1998-03-05 2007-07-18 株式会社日立製作所 Dnaプローブアレー
EP2045334A1 (en) 1998-06-24 2009-04-08 Illumina, Inc. Decoding of array sensors with microspheres
US6480791B1 (en) * 1998-10-28 2002-11-12 Michael P. Strathmann Parallel methods for genomic analysis
WO2000039333A1 (en) * 1998-12-23 2000-07-06 Jones Elizabeth Louise Sequencing method using magnifying tags
NO986133D0 (no) 1998-12-23 1998-12-23 Preben Lexow FremgangsmÕte for DNA-sekvensering
US6261782B1 (en) * 1999-04-06 2001-07-17 Yale University Fixed address analysis of sequence tags
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
EP2360270B1 (en) 1999-05-20 2016-11-09 Illumina, Inc. Combinatorial decoding of random nucleic acid arrays
US6544732B1 (en) 1999-05-20 2003-04-08 Illumina, Inc. Encoding and decoding of array sensors utilizing nanocrystals
US8481268B2 (en) 1999-05-21 2013-07-09 Illumina, Inc. Use of microfluidic systems in the detection of target analytes using microsphere arrays
US8080380B2 (en) 1999-05-21 2011-12-20 Illumina, Inc. Use of microfluidic systems in the detection of target analytes using microsphere arrays
US6403319B1 (en) * 1999-08-13 2002-06-11 Yale University Analysis of sequence tags with hairpin primers
US7604996B1 (en) 1999-08-18 2009-10-20 Illumina, Inc. Compositions and methods for preparing oligonucleotide solutions
AU2001238068A1 (en) 2000-02-07 2001-08-14 Illumina, Inc. Nucleic acid detection methods using universal priming
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
WO2001057268A2 (en) 2000-02-07 2001-08-09 Illumina, Inc. Nucleic acid detection methods using universal priming
US7285384B2 (en) 2000-02-16 2007-10-23 Illuminia, Inc. Parallel genotyping of multiple patient samples
AU2003249681A1 (en) * 2002-05-31 2003-12-19 Diversa Corporation Multiplexed systems for nucleic acid sequencing
CA2513985C (en) 2003-01-21 2012-05-29 Illumina Inc. Chemical reaction monitor
DE602004024034D1 (de) * 2003-01-29 2009-12-24 454 Corp Nukleinsäureamplifikation auf basis von kügelchenemulsion
GB0308852D0 (en) * 2003-04-16 2003-05-21 Lingvitae As Method
WO2005010184A1 (ja) * 2003-07-25 2005-02-03 Takara Bio Inc. 変異の検出方法
GB0324456D0 (en) 2003-10-20 2003-11-19 Isis Innovation Parallel DNA sequencing methods
US7622281B2 (en) 2004-05-20 2009-11-24 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for clonal amplification of nucleic acid
EP2003214B1 (en) 2005-02-01 2013-04-10 AB Advanced Genetic Analysis Corporation Reagents, methods, and libraries for bead-based sequencing
GB0524069D0 (en) 2005-11-25 2006-01-04 Solexa Ltd Preparation of templates for solid phase amplification
US8192930B2 (en) * 2006-02-08 2012-06-05 Illumina Cambridge Limited Method for sequencing a polynucleotide template
US20090062129A1 (en) * 2006-04-19 2009-03-05 Agencourt Personal Genomics, Inc. Reagents, methods, and libraries for gel-free bead-based sequencing
US8889348B2 (en) 2006-06-07 2014-11-18 The Trustees Of Columbia University In The City Of New York DNA sequencing by nanopore using modified nucleotides
US9678055B2 (en) 2010-02-08 2017-06-13 Genia Technologies, Inc. Methods for forming a nanopore in a lipid bilayer
US9605307B2 (en) 2010-02-08 2017-03-28 Genia Technologies, Inc. Systems and methods for forming a nanopore in a lipid bilayer
US8324914B2 (en) 2010-02-08 2012-12-04 Genia Technologies, Inc. Systems and methods for characterizing a molecule
US8845880B2 (en) 2010-12-22 2014-09-30 Genia Technologies, Inc. Nanopore-based single DNA molecule characterization, identification and isolation using speed bumps
US8962242B2 (en) 2011-01-24 2015-02-24 Genia Technologies, Inc. System for detecting electrical properties of a molecular complex
US9110478B2 (en) 2011-01-27 2015-08-18 Genia Technologies, Inc. Temperature regulation of measurement arrays
US9074204B2 (en) * 2011-05-20 2015-07-07 Fluidigm Corporation Nucleic acid encoding reactions
JP2014531908A (ja) 2011-10-14 2014-12-04 プレジデント アンド フェローズ オブ ハーバード カレッジ 構造アッセンブリによる配列決定
US11021737B2 (en) 2011-12-22 2021-06-01 President And Fellows Of Harvard College Compositions and methods for analyte detection
US10227639B2 (en) 2011-12-22 2019-03-12 President And Fellows Of Harvard College Compositions and methods for analyte detection
US8986629B2 (en) 2012-02-27 2015-03-24 Genia Technologies, Inc. Sensor circuit for controlling, detecting, and measuring a molecular complex
CN102766689B (zh) * 2012-04-17 2015-07-22 盛司潼 一种增加测序读长的测序方法
EP4001427A1 (en) * 2012-04-24 2022-05-25 Gen9, Inc. Methods for sorting nucleic acids and multiplexed preparative in vitro cloning
CN108018343B (zh) * 2012-05-10 2023-01-03 通用医疗公司 用于测定核苷酸序列的方法
US9914967B2 (en) 2012-06-05 2018-03-13 President And Fellows Of Harvard College Spatial sequencing of nucleic acids using DNA origami probes
JP2015525077A (ja) 2012-06-15 2015-09-03 ジェニア・テクノロジーズ・インコーポレイテッド チップの構成および高精度な核酸配列決定
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
US9759711B2 (en) 2013-02-05 2017-09-12 Genia Technologies, Inc. Nanopore arrays
US10138509B2 (en) 2013-03-12 2018-11-27 President And Fellows Of Harvard College Method for generating a three-dimensional nucleic acid containing matrix
US10648026B2 (en) 2013-03-15 2020-05-12 The Trustees Of Columbia University In The City Of New York Raman cluster tagged molecules for biological imaging
ES2717756T3 (es) * 2013-09-30 2019-06-25 Qiagen Gmbh Moléculas adaptadoras de ADN para la preparación de genotecas de ADN y método para su producción y uso
US9551697B2 (en) 2013-10-17 2017-01-24 Genia Technologies, Inc. Non-faradaic, capacitively coupled measurement in a nanopore cell array
US9322062B2 (en) 2013-10-23 2016-04-26 Genia Technologies, Inc. Process for biosensor well formation
EP3640349A3 (en) 2013-10-23 2020-07-29 Roche Sequencing Solutions, Inc. High speed molecular sensing with nanopores
WO2015116734A1 (en) * 2014-01-28 2015-08-06 Lanzatech New Zealand Limited Method of producing a recombinant microorganism
US10179932B2 (en) 2014-07-11 2019-01-15 President And Fellows Of Harvard College Methods for high-throughput labelling and detection of biological features in situ using microscopy
EP3330386A1 (en) * 2014-09-05 2018-06-06 QIAGEN GmbH Preparation of adapter-ligated amplicons
ES2726149T3 (es) * 2014-09-12 2019-10-02 Mgi Tech Co Ltd Oligonucleótido aislado y su uso en la secuenciación de ácidos nucleicos
EP3207169B1 (en) * 2014-10-14 2020-07-01 MGI Tech Co., Ltd. Mate pair library construction
US10221448B2 (en) 2015-03-06 2019-03-05 Pillar Biosciences Inc. Selective amplification of overlapping amplicons
US10689690B2 (en) * 2015-08-13 2020-06-23 Centrillion Technology Holdings Corporation Library construction using Y-adapters and vanishing restriction sites
JP6882282B2 (ja) 2015-11-03 2021-06-02 プレジデント アンド フェローズ オブ ハーバード カレッジ 三次元核酸含有マトリックスの立体撮像のための方法と装置
CN108603224B (zh) 2015-12-16 2022-06-28 富鲁达公司 高水平多路复用扩增
SG11201807444PA (en) * 2016-03-10 2018-09-27 Univ Leland Stanford Junior Transposase-mediated imaging of the accessible genome
EP3449016A4 (en) 2016-04-25 2019-10-02 President and Fellows of Harvard College HYBRIDIZATION CHAIN REACTION PROCESS FOR IN-SITU MOLECULE DETECTION
WO2018013837A1 (en) * 2016-07-15 2018-01-18 The Regents Of The University Of California Methods of producing nucleic acid libraries
JP7057348B2 (ja) 2016-08-31 2022-04-19 プレジデント アンド フェローズ オブ ハーバード カレッジ 蛍光in situ配列決定を用いた単一アッセイに生体分子の検出を組み合わせる方法
EP3507364A4 (en) 2016-08-31 2020-05-20 President and Fellows of Harvard College METHODS OF GENERATING NUCLEIC ACID SEQUENCE LIBRARIES FOR IN SITU FLUORESCENT SEQUENCING DETECTION
US10550425B2 (en) 2016-11-14 2020-02-04 Agilent Technologies, Inc. Composition and method for improving signal-to-noise in hybridization to oligonucleotide arrays
US11783918B2 (en) 2016-11-30 2023-10-10 Microsoft Technology Licensing, Llc DNA random access storage system via ligation
JP2020516593A (ja) 2017-04-14 2020-06-11 プレジデント アンド フェローズ オブ ハーバード カレッジ 細胞由来のマイクロフィラメントネットワークの生成方法
CN107299151B (zh) * 2017-08-28 2020-06-09 华中农业大学 用于鉴别稻米脂肪酸品质的dna分子标记及其应用
US11584929B2 (en) 2018-01-12 2023-02-21 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
AU2019280712A1 (en) 2018-06-06 2021-01-07 The Regents Of The University Of California Methods of producing nucleic acid libraries and compositions and kits for practicing same
SG11202101934SA (en) 2018-07-30 2021-03-30 Readcoor Llc Methods and systems for sample processing or analysis

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5102785A (en) * 1987-09-28 1992-04-07 E. I. Du Pont De Nemours And Company Method of gene mapping
EP0392546A3 (en) * 1989-04-14 1991-09-11 Ro Institut Za Molekularnu Genetiku I Geneticko Inzenjerstvo Process for determination of a complete or a partial contents of very short sequences in the samples of nucleic acids connected to the discrete particles of microscopic size by hybridization with oligonucleotide probes
US5650274A (en) * 1993-06-25 1997-07-22 Hitachi, Ltd. DNA analyzing method
GB9401200D0 (en) * 1994-01-21 1994-03-16 Medical Res Council Sequencing of nucleic acids
US5552278A (en) * 1994-04-04 1996-09-03 Spectragen, Inc. DNA sequencing by stepwise ligation and cleavage
US5604097A (en) * 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
HUP9900910A2 (hu) * 1995-06-07 1999-07-28 Lynx Therapeutics, Inc. Oligonukleotid jelzések osztályozáshoz és azonosításhoz

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007097443A1 (ja) * 2006-02-20 2007-08-30 National University Corporation Hokkaido University Dna塩基配列を決定する方法
US7951536B2 (en) 2006-02-20 2011-05-31 National University Corporation Hokkaido University Method for determining base sequence of DNA
JP2018138052A (ja) * 2014-01-31 2018-09-06 スウィフト バイオサイエンシズ, インク.Swift Biosciences, Inc. Dna基質を処理するための改善された方法
JP2017527295A (ja) * 2014-10-14 2017-09-21 深▲せん▼華大基因科技有限公司 リンカー要素、及び、それを使用してシーケンシングライブラリーを構築する方法

Also Published As

Publication number Publication date
CN1195872C (zh) 2005-04-06
EP0923650A1 (en) 1999-06-23
CN1230226A (zh) 1999-09-29
CZ397998A3 (cs) 1999-07-14
AU733782B2 (en) 2001-05-24
CA2256700A1 (en) 1997-12-11
AU3374097A (en) 1998-01-05
HK1021206A1 (en) 2000-06-02
PL331513A1 (en) 1999-07-19
NO985698D0 (no) 1998-12-04
HUP0003944A2 (en) 2001-03-28
DE69737450T2 (de) 2007-11-29
ATE356221T1 (de) 2007-03-15
NO985698L (no) 1999-02-08
DE69737450D1 (de) 2007-04-19
HUP0003944A3 (en) 2003-08-28
EP0923650B1 (en) 2007-03-07
JP4124377B2 (ja) 2008-07-23
WO1997046704A1 (en) 1997-12-11

Similar Documents

Publication Publication Date Title
JP4124377B2 (ja) コードアダプターの連結による配列決定
US6013445A (en) Massively parallel signature sequencing by ligation of encoded adaptors
US5888737A (en) Adaptor-based sequence analysis
JP4293634B2 (ja) 分類および同定のためのオリゴヌクレオチドタグ
JP4712822B2 (ja) 分子タグ化システム
US5780231A (en) DNA extension and analysis with rolling primers
JP4250174B2 (ja) 段階連結および切断によるdna配列決定
US6297017B1 (en) Categorising nucleic acids
US5962228A (en) DNA extension and analysis with rolling primers
KR20190130146A (ko) 핵산 라이브러리를 제조하기 위한 방법 및 조성물
USRE43097E1 (en) Massively parallel signature sequencing by ligation of encoded adaptors
CN114096678A (zh) 多种核酸共标记支持物及其制作方法与应用
AU733924B2 (en) Characterising DNA
EP0840803B1 (en) Simultaneous sequencing of tagged polynucleotides
JPH11151092A (ja) ローリングプライマーを用いたdna伸長および分析

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040401

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060519

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080401

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080327

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080327

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080501

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

A72 Notification of change in name of applicant

Free format text: JAPANESE INTERMEDIATE CODE: A721

Effective date: 20080327

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term