[発明の詳細な説明]
本発明の実施では、別段の表示がない限り、当業者の技量に含まれる有機化学、ポリマー技術、分子生物学(組み換え技法を含む)、細胞生物学、生化学、および免疫学の従来技法および説明を使用しうる。そのような従来技法には、ポリマーアレイ合成、ハイブリダイゼーション、ライゲーション、およびラベルを使ったハイブリダイゼーションの検出が含まれる。適切な技法の具体的例示は、以下に記載する実施例を参照することによって得ることができる。しかし、他の等価な従来手法も、もちろん使用することができる。そのような従来技法および説明は、「Genome Analysis: A Laboratory Manual Series」(第I〜IV巻)、「Using Antibodies: A Laboratory Manual」、「Cells: A Laboratory Manual」、「PCR Primer: A Laboratory Manual」および「Molecular Cloning: A Laboratory Manual」(いずれもCold Spring Harbor Laboratory Press刊)、Stryer, L. (1995)「Biochemistry」(第4版)Freeman, ニューヨーク、Gait「Oligonucleotide Synthesis: A Practical Approach」1984, IRL Press, ロンドン、NelsonおよびCox (2000)「Lehninger, Principles of Biochemistry」第3版, W.H. Freeman Pub., ニューヨーク州ニューヨーク、ならびにBergら(2002)「Biochemistry」第5版, W.H. Freeman Pub., ニューヨーク州ニューヨークなどといった、標準的な実験マニュアルに見いだすことができ、これらは全て、あらゆる目的で、引用によりその全てが本明細書に組み込まれる。
本明細書および添付の特許請求の範囲で使用される場合、単数形「ある」「1つの」「その」には、文脈上そうでないことが明白でない限り、複数の指示物が含まれることに注意されたい。したがって例えば、「あるポリメラーゼ」という場合、それは1つの薬剤またはそのような薬剤の混合物を指し、「その方法」という場合、それは当業者に知られる等価なステップおよび方法を含むことになる。
別段の定義がない限り、本明細書で使用する技術用語および科学用語は全て、本発明が属する分野の当業者が一般に理解している意味と同じ意味を持つ。本明細書で言及する刊行物は全て、その刊行物に記載されていてかつここに記載する発明と関連して使用されるかもしれない、装置、組成物、製剤および方法を説明し開示する目的で、引用により本明細書に組み込まれる。
値の範囲が記載されている場合は、その範囲の上限および下限ならびにその明記された範囲内にある他の任意の明記された値または中間値の間にある、各中間値は、文脈上そうでないことが明白でない限り、下限の単位の10分の1まで、本発明に包含されると理解される。これらの小さな範囲の上限および下限は、その小さな範囲に独立して含まれることができ、やはり本発明に包含される(ただし、明記された範囲内で具体的に除外された端点を除く)。明記された範囲が端点の一方または両方を含む場合は、それら含まれる端点の一方/両方を除外した範囲も、本発明に含まれる。
以下の説明では、本発明がより完全に理解されるように、数多くの具体的詳細を述べる。しかし、これら具体的詳細の1つ以上を伴わずに本発明を実施しうることは、当業者には明白であるだろう。本発明が不明瞭になるのを避けるために、当業者によく知られる周知の特徴および手法が記載されていない場合もある。
本発明を主として具体的実施形態に関して説明するが、本明細書を読めば他の実施形態も当業者には明白になるだろうと予見され、そのような実施形態は本発明の方法に含まれるものとする。
I.概観
本発明は、本明細書で述べるように幅広い応用に利用することができる、核酸同定および核酸検出のための組成物および方法に関する。
本発明の組成物および方法を使ってターゲット核酸をシーケンスするための方法全体には、試料からターゲット核酸を抽出し、フラグメント化することが含まれる。フラグメント化された核酸は、一般に1つ以上のアダプターを含むであろうターゲット核酸テンプレートを作製するために使用される。ターゲット核酸テンプレートは増幅方法に付されて、核酸ナノボールを形成し、それが通常は面上に配置される。シーケンシング応用は、本発明の核酸ナノボール上で、通常、以下に詳述するコンビナトリアル・プローブ・アンカー・ライゲーション(「cPAL」)法を含むライゲーションによるシーケンシング技法によって行われる。cPALおよび他のシーケンシング方法は、本発明の核酸コンストラクト(これには核酸ナノボールならびに線状および環状核酸テンプレートが含まれる)中の特異的配列、例えば一塩基多型(「SNP」)を含むものを、検出するためにも使用することができる。
II.ゲノム核酸のフラグメントの調製
本明細書でさらに詳しく説明するとおり、本発明の核酸テンプレートはターゲット核酸およびアダプターを含む。本発明の核酸テンプレートを構築するためのターゲット核酸を得るために、本発明は試料からゲノム核酸を取得するための方法、およびそれらゲノム核酸を断片化して、本発明の核酸テンプレートを構築するための後続の方法に役立つフラグメントを作製するための方法を提供する。
IIA.ゲノム核酸のフラグメント調製の概観
当技術分野で知られる方法を使って、試料からターゲット核酸を得ることができる。理解されるだろうが、試料は、例えば限定するわけではないが、体液(例えば、限定するわけではないが、事実上任意の生物の血液、尿、血清、リンパ、唾液、肛門分泌物および膣分泌物、汗および精液を含み、哺乳動物試料が好ましく、ヒト試料は特に好ましい);環境試料(例えば、限定するわけではないが、空気試料、農学的試料、水試料および土壌試料を含む);生物兵器剤試料;研究試料(すなわち核酸の場合であれば、試料は、PCT/US99/01705に概説されているように、ターゲットおよびシグナル増幅の両方を含む増幅反応の、例えばPCR増幅反応の、産物であることができる);精製試料、例えば精製ゲノムDNA、RNA、タンパク質など;生試料(細菌、ウイルス、ゲノムDNAなど)など、多くの物質を含むことができ、当業者には理解されるだろうが、試料には事実上どんな実験操作が加えられてもよい。ある態様では、本発明の核酸コンストラクトがゲノムDNAから形成される。一定の実施形態では、ゲノムDNAが全血から得られるか、血液または細胞培養物由来の細胞調製物から得られる。
ある例示的実施形態では、ゲノムDNAがターゲット生物から単離される。「ターゲット生物」とは関心対象の生物を意味し、理解されるであろうが、この用語は、核酸を取得することができる任意の生物、特にヒトを含む哺乳動物を包含するが、いくつかの実施形態では、ターゲット生物が病原体(例えば細菌またはウイルス感染の検出用)である。ターゲット生物から核酸を取得する方法は当技術分野ではよく知られている。ヒトのゲノムDNAを含む試料は多くの実施形態に利用することができる。全ゲノムシーケンシングなど、いくつかの態様では、そのターゲットDNAフラグメントの集団がゲノム全体を十分にカバーすることが保証されるように、好ましくは、約20〜約1,000,000ゲノム相当(genome equivalent)またはそれ以上のDNAが取得される。取得されるゲノム相当数は、一つには、本発明に従って使用されるそのゲノムDNAのフラグメントを、さらに調製するために利用する方法に依存しうる。例えば、以下に詳述するロング・フラグメント・リード法では、約20〜約50ゲノム相当が一般に利用される。やはり以下に詳述する多重置換増幅を利用する方法の場合、約1000〜約100,000ゲノム相当が一般に利用される。フラグメント化に先だって増幅を使用しない方法の場合は、約100,000〜約1,000,000ゲノム相当が使用される。
ターゲットゲノムDNAは、例えば前掲のSambrookおよびRussell「Molecular Cloning: A Laboratory Manual」に開示されているように、従来の技法を使って単離される。次に、ターゲットゲノムDNAを、酵素消化、せん断、または超音波処理(後者の2つは本発明では特に有用である)を含む従来の技法により、所望のサイズに分画またはフラグメント化する。
ターゲット核酸のフラグメントサイズは、使用するソースターゲット核酸とライブラリー構築法に依存して変動しうるが、典型的には50〜600ヌクレオチド長の範囲にある。もう一つの実施形態では、フラグメントが300〜600または200〜2000ヌクレオチド長である。さらにもう一つの実施形態では、フラグメントが10〜100、50〜100、50〜300、100〜200、200〜300、50〜400、100〜400、200〜400、300〜400、400〜500、400〜600、500〜600、50〜1000、100〜1000、200〜1000、300〜1000、400〜1000、500〜1000、600〜1000、700〜1000、700〜900、700〜800、800〜1000、900〜1000、1500〜2000、1750〜2000、および50〜2000ヌクレオチド長である。
さらにもう一つの実施形態では、特定サイズのフラグメントまたは特定サイズ範囲内のフラグメントを単離する。そのような方法は当技術分野ではよく知られている。例えばゲル分画を使って、例えば500塩基対±50塩基対などの塩基対範囲内で、特定サイズのフラグメントの集団を作製することができる。
溶解および抽出時に生成するせん断力が、所望の範囲のフラグメントを生じさせるだろうから、多くの場合、抽出されたDNAの酵素消化は必要ない。さらにもう一つの実施形態では、制限エンドヌクレアーゼを使った酵素的フラグメント化によって、より短いフラグメント(1〜5kb)を生成させることができる。さらにもう一つの実施形態では、約10〜約1,000,000ゲノム相当のDNAにより、そのフラグメントの集団がゲノム全体をカバーすることが保証される。したがって、そのようなフラグメントの集団から作成される核酸テンプレートを含有するライブラリーは、ひとたび同定されアセンブルされるとゲノム全体の配列の大半または全てを与えることになるような配列を持つターゲット核酸を含むだろう。
ある場合には、利用できる試料DNAが少量しかなく、例えば容器の壁などへの非特異的結合によって失われる危険がある時はいつでも、試料DNAと混合して、試料DNAと一緒に使用することができるように、キャリアDNA(例えば無関係な環状合成二本鎖DNA)を用意することが有利である。
ある実施形態では、フラグメント化の後にDNAを変性させて、一本鎖フラグメントを生成させる。
ある実施形態では、本発明の装飾された(decorated)核酸を作製し、それらの核酸を使って配列情報を取得する後続のステップに、全てのフラグメントを十分に高い濃度で利用できることを保証するために、フラグメント化の後(そして実際には本明細書に概説する任意のステップの前または後)に、フラグメント化された核酸の集団に増幅ステップを適用することができる。そのような増幅方法は当技術分野ではよく知られており、限定するわけではないが、次に挙げるものが含まれる:ポリメラーゼ連鎖反応(PCR)、ライゲーション連鎖反応(オリゴヌクレオチドリガーゼ増幅(oligonucleotide ligase amplification)OLAと呼ばれることもある)、サイクリングプローブ技術(cycling probe technology:CPT)、鎖置換アッセイ(strand displacement assay:SDA)、転写媒介増幅(transcription mediated amplification:TMA)、核酸配列ベース増幅(nucleic acid sequence based amplification:NASBA)、ローリングサークル増幅(RCA)(環状化されたフラグメントの場合)、および侵入的切断技術(invasive cleavage technology)。
さらなる実施形態では、フラグメント化の後に、ターゲット核酸をさらに修飾して、本発明の方法に従って複数のアダプターを挿入するための準備をする。フラグメント化のプロセスは、アダプターを挿入するために使用する手法(特にリガーゼおよびポリメラーゼなどの酵素の使用)には適さない末端を持つターゲット核酸をもたらしうるので、そのような修飾が必要になりうる。本明細書に概説する全てのステップと同様、このステップは随意であり、任意のステップと組み合わせることができる。
ある例示的実施形態では、物理的フラグメント化の後に、ターゲット核酸が、しばしば、平滑末端とオーバーハング末端の組合せ、ならびに末端でのホスフェートケミストリーとヒドロキシルケミストリーの組合せを持つ。この実施形態では、ターゲット核酸をいくつかの酵素で処理して、特定のケミストリーを持つ平滑末端を作り出す。ある実施形態では、ポリメラーゼおよびdNTP類を使って、オーバーハングの5'一本鎖を全て埋めることにより、平滑末端を作り出す。3'エキソヌクレアーゼ活性を持つポリメラーゼ(常にそうであるわけではないが、一般的には、5'活性のものと同じ酵素である。例えばT4ポリメラーゼ)を使って、3'オーバーハングを除去する。適切なポリメラーゼには、T4ポリメラーゼ、Taqポリメラーゼ、大腸菌(E.coli)DNAポリメラーゼ1、クレノウ(Klenow)フラグメント、逆転写酵素、φ29関連ポリメラーゼ(野生型φ29ポリメラーゼおよびそのようなポリメラーゼの誘導体を含む)、T7 DNAポリメラーゼ、T5 DNAポリメラーゼ、RNAポリメラーゼが含まれるが、これらに限るわけではない。これらの技法を使って、さまざまな応用に役立つ平滑末端を生じさせることができる。
さらなる随意の実施形態では、ターゲット核酸が互いにライゲートするのを避けるために、末端のケミストリーを変化させる。例えば、平滑末端を作り出すプロセスでは、ポリメラーゼに加えて、プロテインキナーゼも、その3'ホスファターゼ活性を利用して3'ホスフェート基をヒドロキシル基に変換することにより、使用することができる。そのようなキナーゼには、市販のキナーゼ、例えばT4キナーゼ、ならびに市販はされていないが望ましい活性を持つキナーゼを含めることができるが、これらに限るわけではない。
同様に、ホスファターゼを使って末端ホスフェート基をヒドロキシル基に変換することもできる。適切なホスファターゼには、例えば、当技術分野で知られていて、New England Biolabsなどから市販されている、アルカリホスファターゼ(仔ウシ腸由来(CIP)を含む)、アンタークティク(Antarctic)ホスファターゼ、アピラーゼ(Apyrase)、ピロホスファターゼ、無機(酵母)耐熱性無機ピロホスファターゼなどが含まれるが、これらに限るわけではない。
図16に図示するように、これらの修飾は、本発明の方法の後続のステップにおいて、ターゲット核酸が互いにライゲートするのを防ぎ、よって、アダプター(および/またはアダプターアーム)がターゲット核酸の末端にライゲートされるステップにおいて、ターゲット核酸が他のターゲット核酸にではなくアダプターにライゲートすることを保証する。ターゲット核酸1601および1602は、好ましくは、アダプター1603および1604に、望ましい向き(この図に図解するように、望ましい向きは、同じ形(丸または四角)を持つ末端同士が互いにライゲートするような向きである)でライゲートされる。末端を修飾することにより、ターゲット核酸同士が互いにライゲートし、アダプター同士が互いにライゲートする望ましくない構成1607、1608、1609および1610が回避される。また、以下にさらに詳しく述べるように、アダプターとターゲット核酸の両方について末端のケミストリーを制御することにより、各アダプター-ターゲット核酸ライゲーションの向きも制御することができる。末端のケミストリーは、当技術分野で知られていて本明細書でもさらに説明する方法を使って、制御することができる。
当業者には理解されるだろうが、本明細書に概説する全てのステップと同様に、これらのステップおよび酵素は、どの組合せでも使用することができる。例えば、制限エンドヌクレアーゼの使用など、いくつかの酵素的フラグメント化技法では、これらの酵素的「末端修復」ステップの1つ以上が不必要になりうる。
上述の修飾は、未知のコンフォメーションでライゲートした異なるフラグメントを含んでいる核酸テンプレートの生成を防ぐことができ、よって、そのような望ましくないテンプレートに起因しうる配列同定およびアセンブリにおけるエラーを減少させ、かつ/または除去することができる。
ある場合には、階層的フラグメント化方法を、本明細書に記載する酵素的または機械的なフラグメント化の方法のいずれかと組み合わせて利用する。そのような方法は、米国出願第11/451,692号およびPCT出願公開WO 2006/138284に記載されており、これらは、あらゆる目的で、特に階層的フラグメント化に関する全ての教示内容について、引用により、その全てが本明細書に組み込まれる。
いくつかの実施形態では、制御されたランダムな酵素的(controlled randam enzymatic:「CoRE」)フラグメント化方法を利用して、本発明で使用するためのフラグメントを調製する。CoREフラグメント化は酵素的エンドポイントアッセイであり、酵素的フラグメント化の利点(例えば少量および/または小体積のDNAに使用できることなど)を持つと共に、その短所(基質濃度または酵素濃度の変動に対する感受性および消化時間に対する感受性を含む)の多くを持たない。簡単に述べると、CoREフラグメント化には、図1に模式的に図解する3つの一連の酵素ステップが含まれる。まず最初に、dTTPに対して所定の比率でdUTPまたはUTPをドープしたdNTP類の存在下で、核酸101を酵素触媒による多重置換増幅(MDA)に付す。これにより、増幅産物(103)の両方の鎖中のTの位置が、所定の制御可能な比率で、デオキシウラシル(「dU」)またはウラシル(「U」)に置換される。次に、そのU成分を、通常はUDG、EndoVIII、およびT4PNKの組合せによって切り出すことで(104)、機能的な5'ホスフェート末端と3'ヒドロキシル末端を持つ一塩基ギャップを作り出す(105)。この一塩基ギャップは、MDA産物中のUの頻度によって規定される平均間隔で生成することになる。ギャップ付き核酸(105)をポリメラーゼで処理することにより、反対鎖上のニックが収斂して二本鎖切断が生じるまでニックトランスレーションが起こり、その結果、サイズが比較的均一な二本鎖フラグメントの集団(107)が得られる。二本鎖フラグメント(107)のサイズ分布は、酵素処理の持続時間または程度によるのではなく、MDA反応で使用したdTTP対DUTPまたはUTPの比率の結果であるので、このCoREフラグメント化方法は、高度なフラグメント化再現性をもたらす。
ある場合には、特に、長いフラグメント(例えば約150〜約750キロ塩基長)を単離することが望ましい場合には、本発明は、細胞を溶解し、穏やかな遠心分離ステップで無傷の核酸をペレット化する方法を提供する。ゲノム核酸、通常、ゲノムDNAを、酵素的消化により、例えば数時間にわたるプロテイナーゼKおよびRNase消化などを使って、遊離させる。次に、その結果得られた物質を終夜透析するか、直接希釈して、残存細胞廃棄物の濃度を低下させる。このような核酸単離方法は、多くの破壊的プロセス(例えばエタノール沈殿、遠心分離、およびボルテックス)を伴わないので、ゲノム核酸はおおむね無傷のままであり、大部分が150キロ塩基を超えるフラグメントを与えることになる。
ある場合には、上述のフラグメント化方法のいずれかと組み合わせて、本発明は、二倍体ゲノムの再構築、例えば母系および父系染色体または配列の同定を可能にする、ゲノム核酸フラグメントの集団の等分(aliquoting)方法を、さらに提供する。これは、従来技術のプロセスに対して著しい利点である。
この実施形態では、核酸がアリコート(aliquot)あたりハプロイドゲノムの約10%の濃度まで希釈されるように、ゲノムフラグメントを等分する。そのような希釈レベルでは、特定アリコート中の塩基対の約95%はオーバーラップしない。本明細書においてロング・フラグメント・リード(LFR)フラグメント化方法ともいうこの等分方法は、特定の実施形態では、上述し、本明細書にさらに詳しく説明する方法に従って単離される大分子量フラグメントに使用することができる。LFR法の一例を図2Cに模式的に図解する。LFRは通常、ゲノム核酸(通常はゲノムDNA)の5'エキソヌクレアーゼによる短い処理で、3'一本鎖オーバーハングを生成させることから始まる。そのような一本鎖オーバーハングは、多重置換増幅(MDA)開始部位として役立つ(図2A)。次に、その5'エキソヌクレアーゼ処理DNAをサブゲノム濃度に希釈し、多数のアリコートに(通常はマルチウェルプレートの多数のウェルに)分散させる。各ウェル中のフラグメントを、通常は標準的MDA法(図2A)および/またはエキソヌクレアーゼを利用するMDA法(図2B)を使って増幅する。ある場合には、上述のCoRE法を使って、増幅後の各ウェル中のフラグメントをさらにフラグメント化することができるように、この増幅方法により、フラグメント中にウラシル成分が導入される。MDA産物のフラグメント化は、超音波処理または酵素処理によっても達成することができる。一般に、MDA産物のフラグメント化に続いて、得られたフラグメントの末端を、通常はT4ポリメラーゼおよびT4ポリヌクレオチドキナーゼで修復する。次に、フラグメントをアルカリホスフェターゼで処理し、次に、フラグメントをアダプターでタグ付けする。一般に、タグアダプターアームは、2つのセグメントに分けてデザインされる。一つのセグメントは全てのウェルに共通であり、本明細書にさらに詳しく述べる方法を使って、フラグメントに直接、平滑末端ライゲートされる。第2のセグメントは各ウェルにユニークであり、各ウェルの内容物を混合した場合に各ウェルからのフラグメントを同定することができるように、「バーコード」配列を含む。図3に、本発明のこの態様のためにフラグメントに付加することができる例示的バーコードアダプターをいくつか図解する。
ある場合には、LFR法を使って、個々の細胞のゲノムを解析する。この場合、DNAを単離するためのプロセスは、上述の方法に類似するが、より小さな体積で行われる。ひとたびDNAが単離されたら、それを個々のウェルに等分する前に、材料の喪失が起こらないように、特に各フラグメントの末端からの配列が失われないように、ゲノムDNAを注意深くフラグメント化しなければならない。というのも、そのような材料の喪失は、最終ゲノムアセンブリにギャップをもたらすことになるからである。ある場合には、配列の喪失は、互いに約100kbの距離で、phi29ポリメラーゼなどのポリメラーゼのための開始部位を作り出す、低頻度ニッキング(infrequent nicking)酵素の使用によって回避される。ポリメラーゼが新しいDNA鎖を作り出すにつれて、それが古い鎖を置き換え、最終的には、ポリメラーゼ開始部位の近くにオーバーラップする配列が存在して(図4)、配列の欠失がほとんどなくなることになる。
ある場合には、利用できる試料DNAが少量しかなく、例えば容器の壁などへの非特異的結合によって失われる危険がある場合はいつでも、試料DNAと混合して、試料DNAと一緒に使用することができるように、キャリアDNA(例えば無関係な環状合成二本鎖DNA)を用意することが有利である。ある一実施形態では、フラグメント化の後にDNAを変性させて、一本鎖フラグメントを生成させる。
ある実施形態では、本発明の装飾された核酸を作製し、それらの核酸を使って配列情報を取得する後続のステップに、全てのフラグメントを十分に高い濃度で利用できることを保証するために、フラグメント化の後(そして実際には本明細書に概説する任意のステップの前または後)に、フラグメント化された核酸の集団に増幅ステップを適用することができる。そのような増幅方法は当技術分野ではよく知られており、限定するわけではないが、次に挙げるものが含まれる:ポリメラーゼ連鎖反応(PCR)、ライゲーション連鎖反応(オリゴヌクレオチドリガーゼ増幅OLAと呼ばれることもある)、サイクリングプローブ技術(CPT)、鎖置換アッセイ(SDA)、転写媒介増幅(TMA)、核酸配列ベース増幅(NASBA)、ローリングサークル増幅(RCA)(環状化されたフラグメントの場合)、および侵入的切断技術。
さらなる実施形態では、フラグメント化の後に、ターゲット核酸をさらに修飾して、本発明の方法に従って複数のアダプターを挿入するための準備をする。フラグメント化のプロセスは、アダプターを挿入するために使用する手法(特にリガーゼおよびポリメラーゼなどの酵素の使用)には適さない末端を持つターゲット核酸をもたらしうるので、そのような修飾が必要になりうる。本明細書に概説する全てのステップと同様、このステップは随意であり、任意のステップと組み合わせることができる。フラグメントを修飾して他の核酸分子への定方向的(directd)ライゲーションのための準備をする方法には、ポリメラーゼおよびホスファターゼなどの酵素の適用によって、フラグメントの末端を、それらが他の核酸分子に所望の向きでしかライゲートできないように修飾することが含まれる。そのような方法を本明細書にさらに詳しく説明する。
IIB.CoREフラグメント化
上述のように、本発明で使用されるフラグメント化の方法には、機械的フラグメント化方法と酵素的フラグメント化方法がどちらも含まれ、酵素的フラグメント化方法と機械的フラグメント化方法の組合せも含まれる。多くの機械的および酵素的フラグメント化方法が当技術分野ではよく知られている。
ある態様において、本発明は、本明細書において、制御されたランダムな酵素的(CoRE)フラグメント化と呼ぶ、フラグメント化の方法を提供する。本明細書に記載するCoREフラグメント化方法は、単独で使用するか、当技術分野で知られる他の機械的および酵素的フラグメント化方法と組み合わせて使用することができる。CoREフラグメント化には、図1に模式的に図解する3つの一連の酵素ステップが含まれる。まず最初に、核酸101を、ある比率のデオキシウラシル(「dU」)またはウラシル(「U」)をドープしたdNTP類の存在下で行われる増幅方法に付すことにより、増幅産物(103)の両方の鎖中のTの位置が、所定の制御可能な比率で、dUTPまたはUTPに置換される。本発明のこのステップでは、例えば限定するわけではないが、ポリメラーゼ連鎖反応(PCR)、ライゲーション連鎖反応(オリゴヌクレオチドリガーゼ増幅OLAと呼ばれることもある)、サイクリングプローブ技術(CPT)、鎖置換アッセイ(SDA)、転写媒介増幅(TMA)、核酸配列ベース増幅(NASBA)、ローリングサークル増幅(RCA)(環状化されたフラグメントの場合)、および侵入的切断技術など、数多くの増幅方法を使用することができる。一定の実施形態では、dTTPに対して所定の比率でdUTPまたはUTPをドープしたdNTP類の存在下での多重置換増幅(MDA)を使って、両方の鎖の一定の位置に置換されたdUTPまたはUTPを持つ増幅産物(103)を生成させる。
増幅およびウラシル成分の挿入後に、それらのウラシルを、通常はUDG、EndoVIII、およびT4PNKの組合せによって切り出すことで(104)、機能的な5'ホスフェート末端と3'ヒドロキシル末端を持つ一塩基ギャップを作り出す(105)。この一塩基ギャップは、MDA産物中のUの頻度によって規定される平均間隔で生成することになる。すなわち、dUTPの量が多いほど、得られるフラグメントは短くなる。当業者には理解されるだろうが、化学作用または他の酵素作用を受けるヌクレオチドなど、同じように切断をもたらすことができる修飾ヌクレオチドによるヌクレオチドの選択的置換をもたらすことになる他の技法も使用することができる。
ギャップを持つ核酸(105)を、エキソヌクレアーゼ活性を持つポリメラーゼで処理すると、反対鎖上のニックが収斂して二本鎖切断が生じるまで核酸に沿ってニックの「トランスレーション(translation)」または「トランスロケーション(translocation)」が起こり、その結果、サイズが比較的均一な二本鎖フラグメントの集団(107)が得られる。ポリメラーゼ(例えばTaqポリメラーゼ)のエキソヌクレアーゼ活性が、ニックに隣接する短いDNA鎖を切り出すと同時に、ポリメラーゼ活性がその鎖中のニックとそれ以降のヌクレオチドを「埋める(fill in)」ことになる(基本的に、Taqは鎖に沿って移動し、エキソヌクレアーゼ活性を使って塩基を切り出し、同じ塩基を付加するので、結果として、ニックは酵素が末端に到達するまで鎖に沿ってトランスロケートされることになる)。
二本鎖フラグメント(107)のサイズ分布は、酵素処理の持続時間または程度によるのではなく、MDA反応で使用したdTTP対DUTPまたはUTPの比率の結果であるので、このCoREフラグメント化方法は、高度なフラグメント化再現性をもたらす。このように、CoREフラグメント化は、全てのフラグメントがよく似たサイズを持つ二本鎖核酸フラグメントの集団をもたらす。
IIC.ロング・フラグメント・リード技術
本発明のロング・フラグメント・リード(LFR)法は、同じアリコート中に母系コンポーネントと父系コンポーネントのゲノムの任意の所与の領域がどちらとも存在する確率が極めて稀になるように、長いゲノムDNAフラグメントを、多くの異なるアリコートに物理的に分離することに基づく。各アリコートにユニークな識別子を入れ、多くのアリコートを全体として解析することにより、DNAの長いフラグメントを、二倍体ゲノムへとアセンブルすることができ(例えば各親染色体の配列を得ることができ)、従来技術に対して著しい利点になる。本明細書における議論はDNBアレイおよびライゲーションによるシーケンシングを使ったLFR法の使用に焦点を当てるが、これらのLFR法をさまざまな他のアレイおよび他のシーケンシング方法と共に使用することで、2つの別個のハプロイドゲノムとしての、二倍体ゲノムのシーケンシングがもたらされることは理解されるはずである。これは家族性遺伝病などの同定を容易にすることができる。
フラグメントの適当な分離を達成するために、一般的には、DNAを、アリコートあたりハプロイドゲノムの約10%の濃度まで希釈する(図2C)。この濃度では、あるアリコート中の塩基対の95%はオーバーラップしない。そのような希釈は、母系フラグメントと父系フラグメントが通常は異なるアリコートに入るような、統計的分離をもたらす(図2C、2番目のパネル)。希釈率がフラグメントの元のサイズに依存しうることは、理解されるはずである。すなわち、穏やかな技法を使ってゲノムDNAを単離することによって、およそ100kbのフラグメントを得ることができ、次に、それを等分する。大きなフラグメントを与えることができる技法ほど、必要なアリコートが少なくなり、短いフラグメントをもたらす技法では、より大きな希釈が必要になりうる。
いくつかの実施形態では、各アリコート中のフラグメントが増幅され、さらなる実施形態では、各アリコート中のフラグメントがさらにフラグメント化された後、同じアリコートに由来するフラグメントは全て同じタグアダプターを含むことになるように、アダプターでタグ付けされる。例えば、引用によりその全てが、特に追加の等分操作およびカバレッジの議論に関して、本明細書に組み込まれる、US2007/0072208を参照されたい。
多くの実施形態では、各アリコートがマルチウェルプレート(例えば384穴プレート)の独立したウェルに含まれる。LFRに関する以下の議論はマルチウェルプレートに関してなされるが、この方法で生成する異なるアリコートを保持するために、数多くの、異なるタイプの容器およびシステムを使用できることは、理解されるだろう。そのような容器およびシステムは当技術分野ではよく知られており、どのタイプの容器およびシステムが本発明のこの態様での使用に適当であるかは、当業者には明白であるだろう。
上述のように、細胞からゲノム核酸の長いフラグメントを単離することは、いくつかの異なる方法によって達成することができる。ある実施形態では、細胞を溶解し、穏やかな遠心分離ステップで、無傷の核酸をペレット化する。次に、数時間にわたるプロテイナーゼKおよびRNase消化によって、ゲノムDNAを遊離させる。次に、いくつかの実施形態では、残存細胞廃棄物の濃度を低下させるために、その物質を処理することができる。そのような処理は当技術分野ではよく知られており、例えば、限定するわけではないが、ある期間(すなわち2〜16時間)にわたる透析および/または希釈を挙げることができる。このような核酸単離方法は、多くの破壊的プロセス(例えばエタノール沈殿、遠心分離、およびボルテックス)を伴わないので、ゲノム核酸はおおむね無傷のままであり、大部分が150キロベースを超える長さを持つフラグメントを与えることになる。いくつかの実施形態では、フラグメントが約100〜約750キロベース長である。さらなる実施形態では、フラグメントが約150〜約600、約200〜約500、約250〜約400、および約300〜約350キロベース長である。
LFR法の一例を図2に模式的に図解する。LFRは通常、ゲノム核酸(通常はゲノムDNA)の5'エキソヌクレアーゼによる短い処理で、3'一本鎖オーバーハングを生成させることから始まる。そのような一本鎖オーバーハングは、MDA開始部位として役立つ(図2)。また、エキソヌクレアーゼの使用により、フラグメントの集団にバイアスを導入することなく、増幅前の熱またはアルカリ変性ステップが排除される。いくつかの実施形態では、アルカリ変性が5'エキソヌクレアーゼ処理と組み合わされ、それが、どちらか一方の処理だけの場合に見られるものよりも大きなバイアスの低下をもたらす。
5'エキソヌクレアーゼで処理され、場合によってはアルカリ変性で処理されたDNAを、次に、サブゲノム濃度に希釈して、多数のアリコートに(通常はマルチウェルプレートの多数のウェルに)分散させる。いくつかの実施形態では、10%ゲノム相当をマルチウェルプレートの各ウェルに分注する。384穴プレートを使用する場合、各ウェルに10%ゲノム相当を分注することにより、各プレートは全部で38ゲノムを含むことになる。さらなる実施形態では、5〜50%ゲノム相当を各ウェルに分注する。上記のように、アリコート数およびゲノム相当数は元のフラグメントサイズに依存しうる。
複数のウェルに分離した後、各ウェルのフラグメントを、通常はMDA法を使って、増幅する。一定の実施形態では、MDA反応が、修飾Phi29ポリメラーゼに基づく増幅反応である。本明細書における議論の多くはMDA反応に関するものであるが、種類の異なる多くの増幅反応を本発明に従って使用できること、およびそのような増幅反応が当技術分野ではよく知られており、引用により本明細書に組み込まれるManiatisら「Molecular Cloning: A Laboratory Manual」第2版, 1989および「Short Protocols in Molecular Biology」Ausubelら編に、一般論として記載されていることは、当業者には理解されるだろう。
いくつかの実施形態では、増幅産物中にウラシルが導入されるように、MDA反応をデザインする。いくつかの実施形態では、ランダムヘキサマーを利用する標準的MDA反応を使って、各ウェル中のフラグメントを増幅する。多くの実施形態では、フラグメントの集団における増幅バイアスを減少させるために、ランダムヘキサマーではなく、ランダム8マープライマーを使用する。さらなる実施形態では、増幅のバイアスを減少させるために、いくつかの異なる酵素もMDA反応に添加することができる。例えば、低濃度の非プロセッシブ(non-processive)5'エキソヌクレアーゼおよび/または一本鎖結合タンパク質を使って、8マー用の結合部位を作り出すことができる。ベタイン、DMSO、およびトレハロースなどの化学薬剤も、同様の機序によってバイアスを減少させるために使用することができる。
各ウェル中のフラグメントの増幅後に、多くの実施形態では、その増幅産物を、もう1ラウンドのフラグメント化に付す。いくつかの実施形態では、上述のCoRE法を使って、増幅後の各ウェル中のフラグメントを、さらにフラグメント化する。上述のように、CoRE法を使用するには、各ウェル中のフラグメントを増幅するために使用されるMDA反応を、MDA産物中にウラシルが取り込まれるようにデザインする。MDA産物のフラグメント化は、超音波処理または酵素処理によって達成することもできる。この実施形態で使用することができるであろう酵素処理には、DNase I、T7エンドヌクレアーゼI、ミクロコッカスヌクレアーゼなどの使用が含まれるが、これらに限るわけではない。
いくつかの実施形態において、CoRE法を使ってMDA産物をフラグメント化する場合は、MDA産物が入っている各ウェルを、ウラシルDNAグリコシラーゼ(UDG)、DNAグリコシラーゼ-リアーゼエンドヌクレアーゼVIII、およびT4ポリヌクレオチドキナーゼの混合物で処理することにより、ウラシル塩基を切り出して、機能的な5'ホスフェート基と3'ヒドロキシル基を持つ一塩基ギャップを作り出す。Taqポリメラーゼなどのポリメラーゼの使用によるニックトランスレーションは、二本鎖平滑末端切断をもたらし、それが、MDA反応に添加されたdUTPの濃度に依存するサイズ範囲を持つライゲーション可能なフラグメントをもたらす。いくつかの実施形態では、使用するCoRE法が、phi29による重合および鎖置換によるウラシルの除去を伴う(図4参照)。
一般に、MDA産物のフラグメント化に続いて、得られたフラグメントの末端を修復する。多くのフラグメント化技法は、オーバーハング末端を持つ末端、ならびにその後のライゲーション反応では役に立たない、3'および5'ヒドロキシル基および/または3'および5'ホスフェート基などの官能基を持つ末端をもたらしうるので、このような修復が必要になりうる。本発明の多くの態様では、平滑末端を持つように修復されたフラグメントであることが有用であり、場合によっては、正しい向きのホスフェート基およびヒドロキシル基が存在せず、したがってターゲット配列の「重合」を妨げるように、末端のケミストリーを改変することが望ましいこともある。末端のケミストリーは当技術分野で知られる方法を使って制御することができる。例えば、ある状況では、全ての末端がヒドロキシル基を含むように、ホスファターゼの使用によって、全てのホスフェート基が除去される。次に、所望のコンポーネント間のライゲーションが可能になるように、各末端を選択的に改変することができる。次に、フラグメントの一端を、いくつかの実施形態ではアルカリホスフェターゼを使った処理によって、「活性化」することができる。次に、それらのフラグメントに、多くの実施形態では、アダプターでタグ付けする。一般に、これらのタグアダプターは、LFR法において同じウェルに由来するフラグメントを同定するために使用することができる。
図3に、LFR法に従ってタグとして使用するためのアダプターデザインのいくつかの実施形態の模式的図解を示す。一般に、アダプターは2つのセグメントに分けてデザインされる。一つのセグメントは全てのウェルに共通であり、本明細書にさらに詳しく述べる方法を使って、フラグメントに直接、平滑末端ライゲートされる。図3に図示する実施形態では、「共通」アダプターが2つのアダプターアームとして付加され、一方のアームは、フラグメントの5'末端に平滑末端ライゲートされ、他方のアームは、フラグメントの3'末端に平滑末端ライゲートされる。タグ付けアダプターの第2のセグメントは、各ウェルにユニークな「バーコード」セグメントである。このバーコードは一般に、ユニークなヌクレオチド配列であり、特定ウェル中の各フラグメントには同じバーコードが与えられる。したがって、全てのウェルに由来するタグ付きフラグメントをシーケンシング応用のために再混合した場合、バーコードアダプターの同定によって、同じウェルに由来するフラグメントを同定することができる。図3に図解する実施形態では、バーコードが共通アダプターアームの5'末端にライゲートされる。共通アダプターとバーコードアダプターは、フラグメントに、逐次的に、または同時に、ライゲートすることができる。本明細書でさらに詳しく説明するように、共通アダプターおよびバーコードアダプターの末端は、各アダプターセグメントが正しい向きで適正な分子にライゲートすることになるように、修飾することができる。そのような修飾は、フラグメントが互いにライゲートできないことを保証し、アダプターセグメントが図解した向きでしかアダプターセグメントにライゲートできないことを保証することにより、アダプターセグメントまたはフラグメントの「重合」を防止する。
さらなる実施形態では、各ウェル中のフラグメントをタグ付けするために使用されるアダプターに、3セグメントデザインを利用する。この実施形態は、バーコードアダプターセグメントが2つのセグメントに分割される点以外は、上述のバーコードアダプターデザインに似ている(図3参照)。このデザインは、異なるバーコードセグメントを一つにライゲートして完全なバーコードセグメントを形成させることによってコンビナトリアルバーコードアダプターセグメントを生成させることにより、可能なバーコードの範囲を拡げることができる。このコンビナトリアルデザインは、可能なバーコードアダプターのレパートリーを大きくすると同時に、生成させる必要があるフルサイズバーコードアダプターの数を減少させる。
各ウェル中のフラグメントをタグ付けした後、フラグメントの全てを合わせて単一の集団を形成させる。次に、これらのフラグメントを使って、以下にさらに詳しく議論するように、本発明の核酸テンプレートを生成させることができる。これらのタグ付きフラグメントから生成させた核酸テンプレートは、各フラグメントに取り付けられたバーコードタグアダプターにより、特定のウェルに属すると同定することが可能になる。
ある場合には、個々の細胞を含む小数の細胞のゲノムを解析するために、LFR法を使用する。この場合、DNAを単離するためのプロセスは上述の方法に類似するが、より小さい体積で行われる。ひとたびDNAが単離されたら、試料を個々のウェルに等分するステップの前に、材料の喪失が起こらないように、特に各フラグメントの末端からの配列が失われないように、ゲノムDNAを注意深くフラグメント化しなければならない。というのも、そのような材料の喪失は、最終ゲノムアセンブリにギャップをもたらすことになるからである。ある場合には、配列の喪失は、互いに約100kbの距離で、phi29ポリメラーゼなどのポリメラーゼのための開始部位を作り出す、低頻度ニッキング酵素の使用によって回避される。ポリメラーゼが新しいDNA鎖を作り出すにつれて、それが古い鎖を置き換え、最終的には、ポリメラーゼ開始部位の近くにオーバーラップする配列が存在して(図4)、配列の欠失がほとんどなくなることになる。さらなる一実施形態では、次にDNAを、上述の方法に従って希釈し、複数のウェルに等分する。いくつかの実施形態では、5'エキソヌクレアーゼの制御された使用(MDA反応前またはMDA反応中)により、単一の細胞からの元のDNAの多重複製を促進し、よってコピーをコピーすることによる早期エラー(early error)の増殖を最小限に抑えることができる。
本明細書に記載するLFR法を、当技術分野で知られる任意のシーケンシング法を使った二倍体ゲノムのシーケンシングに使用できることは、理解されるだろう。本明細書に記載するLFR法は、さらなる実施形態において、多くのシーケンシングプラットフォーム(例えば限定するわけではないが次に挙げるもの)で使用することができる:GeneChip(Affymetrix)、CodeLink Bioarray(Amersham)、Expression Array System(Applied Biosystems)、SurePrintマイクロアレイ(Agilent)、Sentrix LD BeadChipまたはSentrix Array Matrix(Illumina)およびVerigene(Nanosphere)。
いくつかの実施形態において、本明細書に記載のLFR法は、2006年6月13日に出願された米国特許出願第11/451,692号(これは、あらゆる目的で、特に核酸をフラグメント化し、等分する方法に関する全ての教示内容について、引用により、その全てが本明細書に組み込まれる)に記載されている、多レベルまたは多段階のフラグメント化/等分操作を含まない。すなわち、いくつかの実施形態では、1ラウンドの等分操作だけを利用し、各アリコートに別々のアレイを使用するのではなく、アリコートを再プールして単一のアレイに使用することができる。
III.本発明の核酸テンプレート
本発明は、ターゲット核酸と複数の散在アダプター(interspersed adaptors)とを含む核酸テンプレートを提供する。核酸テンプレートコンストラクトは、各ターゲット核酸の全体にわたる複数の部位にアダプター分子を挿入することによって組み立てられる。散在アダプターは、ターゲット核酸中の複数部位から連続的にまたは同時に配列情報を獲得することを可能にする。
「ターゲット核酸」という用語は、関心対象の核酸を指す。ある態様において、本発明のターゲット核酸はゲノム核酸であるが、mRNA(および対応するcDNAなど)を含む他のターゲット核酸も使用することができる。ターゲット核酸には、天然の、または遺伝子改変された、または合成的に調製された核酸(哺乳動物疾患モデル由来のゲノムDNAなど)が含まれる。ターゲット核酸は、事実上任意の供給源から取得することができ、当技術分野で知られる方法を使って調製することができる。例えばターゲット核酸は増幅なしで直接単離するか、当技術分野で知られる方法、例えば限定するわけではないが、ポリメラーゼ連鎖反応(PCR)、鎖置換増幅(SDA)、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、ローリングサークル増幅(RCR)および他の増幅方法などを用いる増幅によって単離することができる。ターゲット核酸は、クローニングによって(例えば限定するわけではないが、プラスミド、酵母人工染色体および細菌人工染色体などの運搬体へのクローニングによって)得ることもできる。
いくつかの態様では、ターゲット核酸がmRNAまたはcDNAを含む。一定の実施形態では、生物学的試料からの単離された転写物を使って、ターゲットDNAが作製される。単離されたmRNAは従来の技法を使ってcDNAに逆転写することができ、それら従来の技法も、「Genome Analysis: A Laboratory Manual Series」(第I〜IV巻)または「Molecular Cloning: A Laboratory Manual」に記載されている。
ターゲット核酸は、指定どおりに一本鎖または二本鎖であることができ、あるいは二本鎖配列の部分または一本鎖配列の部分を両方とも含むことができる。応用に応じて、核酸はDNA(ゲノムDNAおよびcDNAを含む)、RNA(mRNAおよびrRNAを含む)またはハイブリッド(この場合、核酸は、デオキシリボ-およびリボ-ヌクレオチド任意の組合せ、ならびにウラシル、アデニン、チミン、シトシン、グアニン、イノシン、キサンチン(xathanine)、ヒポキサンチン(hypoxathanine)、イソシトシン、イソグアニンなどを含む、塩基の任意の組合せを含有する)であることができる。
本明細書における「核酸」もしくは「オリゴヌクレオチド」もしくは「ポリヌクレオチド」という用語、または文法上等価な用語は、共有結合で一つに連結された少なくとも2つのヌクレオチドを意味する。本発明の核酸は、一般的には、ホスホジエステル結合を含むだろうが、ある場合には、以下に(例えばプライマーおよびラベルプローブなどのプローブの構築で)概説するように、例えばホスホルアミド(Beaucageら, Tetrahedron 49(10):1925 (1993)およびその参考文献;Letsinger, J. Org. Chem. 35:3800 (1970);Sprinzlら, Eur. J. Biochem. 81:579 (1977);Letsingerら, Nucl. Acids Res. 14:3487 (1986);Sawaiら, Chem. Lett. 805 (1984)、Letsingerら, J. Am. Chem. Soc. 110:4470 (1988);およびPauwelsら, Chemica Scripta 26:141 91986))、ホスホロチオエート(Magら, Nucleic Acids Res. 19:1437 (1991);および米国特許第5,644,048号)、ホスホロジチオエート(Briuら, J. Am. Chem. Soc. 111:2321 (1989))、O-メチルホスホロアミダイト結合(Eckstein「Oligonucleotides and Analogues: A Practical Approach」Oxford University Press参照)、ならびにペプチド核酸(本明細書では「PNA」ともいう)バックボーンおよび結合(Egholm, J. Am. Chem. Soc. 114:1895 (1992);Meierら, Chem. Int. Ed. Engl. 31:1008 (1992);Nielsen, Nature, 365:566 (1993);Carlssonら, Nature 380:207 (1996)参照;これらは全て引用により本明細書に組み込まれる)を含む代替的バックボーンを持っていてもよい核酸類似体が含まれる。他のアナログ核酸には、二環式構造を持つもの、例えばロックト核酸(本明細書では「LNA」ともいう)、Koshkinら, J. Am. Chem. Soc. 120:13252 3 (1998);陽性バックボーンを持つもの(Denpcyら, Proc. Natl. Acad. Sci. USA 92:6097 (1995));非イオン性バックボーンを持つもの(米国特許第5,386,023号、同第5,637,684号、同第5,602,240号、同第5,216,141号、および同第4,469,863号;Kiedrowshiら, Angew. Chem. Intl. Ed. English 30:423 (1991);Letsingerら, J. Am. Chem. Soc. 110:4470 (1988);Letsingerら, Nucleoside & Nucleotide 13:1597 (1994);ASC Symposium Series 580, Y.S.SanghuiおよびP.Dan Cook編「Carbohydrate Modifications in Antisense Research」の第2章および第3章;Mesmaekerら, Bioorganic & Medicinal Chem. Lett. 4:395 (1994);Jeffsら, J. Biomolecular NMR 34:17 (1994);Tetrahedron Lett. 37:743 (1996))ならびに非リボースバックボーンを持つもの、例えば米国特許第5,235,033号および同第5,034,506号、ならびにASC Symposium Series 580, Y.S.SanghuiおよびP.Dan Cook編「Carbohydrate Modifications in Antisense Research」の第6章および第7章に記載されているものなどが含まれる。1つ以上の炭素環式糖を含有する核酸も、核酸の定義に含まれる(Jenkinsら, Chem. Soc. Rev. (1995) 169-176頁)。いくつかの核酸類似体が、Rawls, C & E News Jun. 2, 1997, 35頁に記載されている。「ロックト核酸」(LNA(商標))も、核酸類似体の定義に含まれる。LNAは、リボース環が2-O-原子と4'-C原子とをつなぐメチレン架橋によって「ロック」された、一群の核酸類似体である。これらの参考文献は全て、あらゆる目的で、特に核酸に関する全ての教示内容について、引用によりその全てが本明細書に組み込まれる。リボース-ホスフェートバックボーンのこれらの修飾は、生理的環境におけるそのような分子の安定性および半減期を増加させるために行うことができる。例えば、PNA:DNAおよびLNA-DNAハイブリッドは、より高い安定性を示すことができ、それゆえにいくつかの実施形態で使用しうる。
本発明の核酸テンプレート(本明細書では「核酸コンストラクト」および「ライブラリーコンストラクト」ともいう)は、ターゲット核酸とアダプターとを含む。本明細書で使用する「アダプター」という用語は、既知の配列を持つオリゴヌクレオチドを指す。本発明において役立つアダプターは、いくつかのエレメントを含みうる。アダプターに含まれるエレメント(本明細書では「特徴」ともいう)のタイプおよび数は、意図するアダプターの用途に依存するだろう。本発明において役立つアダプターは、一般に、限定するわけではないが、制限エンドヌクレアーゼ認識および/または切断のための部位、特に、後述するようにアダプター内の認識部位でのエンドヌクレアーゼ結合とアダプター外での切断とを可能にするタイプIIs認識部位、プライマー結合(核酸コンストラクトを増幅するため)またはアンカープライマー(本明細書では「アンカープローブ」という場合もある)結合(核酸コンストラクト中のターゲット核酸をシーケンスするため)のための部位、ニッカーゼ(nickase)部位などを含むだろう。いくつかの実施形態では、アダプターが制限エンドヌクレアーゼのための認識部位を1つだけ含み、他の実施形態では、アダプターが1つ以上の制限エンドヌクレアーゼのための認識部位を2つ以上含むだろう。本明細書に概説するように、認識部位は多くの場合(必ずしもそうではないが)、アダプターの末端から可能な限り遠い位置で二本鎖コンストラクトの切断が起こりうるように、アダプターの末端に見いだされる。
いくつかの実施形態において、本発明のアダプターは、アダプターに含まれる特徴の数およびサイズに依存して、約10〜約250ヌクレオチドの長さを持つ。一定の実施形態では、本発明のアダプターが約50ヌクレオチドの長さを持つ。さらなる実施形態では、本発明において役立つアダプターが、約20〜約225、約30〜約200、約40〜約175、約50〜約150、約60〜約125、約70〜約100、および約80〜約90ヌクレオチドの長さを持つ。
さらなる実施形態では、アダプターが、場合により、2つの「アーム」としてターゲット核酸にライゲートすることができるようなエレメントを含んでもよい。これらのアームの一方または両方は、制限エンドヌクレアーゼのための完全な認識部位を含むか、両方のアームが制限エンドヌクレアーゼのための認識部位の一部を含みうる。後者の場合は、アダプターアームが各末端に結合したターゲット核酸を含むコンストラクトの環状化によって、認識部位全体が再構成されることになる。
さらなる実施形態では、本発明において役立つアダプターが、アダプターの5'および3'末端に異なるアンカー結合部位を含むだろう。本明細書においてさらに説明するように、そのようなアンカー結合部位は、本明細書ならびに米国特許出願第60/992,485号;同第61/026,337号;同第61/035,914号;同第61/061,134号;同第61/116,193号;同第61/102,586号;同第12/265,593号;および同第12/266,385号;同第11/938,106号;同第11/938,096号;同第11/982,467号;同第11/981,804号;同第11/981,797号;同第11/981,793号;同第11/981,767号;同第11/981,761号;同第11/981,730号;同第11/981,685号;同第11/981,661号;同第11/981,607号;同第11/981,605号;同第11/927,388号;同第11/927,356号;同第11/679,124号;同第11/541,225号;同第10/547,214号;および同第11/451,691号(これらは全て、特にライゲーションによるシーケンシングに関する開示について、引用によりその全てが本明細書に組み込まれる)に記載されているシーケンシングのコンビナトリアル・プローブ・アンカー・ライゲーション(cPAL)法を含むシーケンシング応用において、使用することができる。
ある態様において、本発明のアダプターは散在(interspersed)アダプターである。「散在アダプター」とは、本明細書においては、ターゲット核酸の内部領域内の離散した位置に挿入されるオリゴヌクレオチドを意味する。ある態様において、ターゲット核酸に関して「内部」とは、ターゲット核酸内のヌクレオチドの順序を乱す配列逆位などの変換を導入しうる環状化および切断などの加工前に、ターゲット核酸の内部にある部位を意味する。
本発明の核酸テンプレートコンストラクトは、ターゲット核酸中に特定の向きで挿入された複数の散在アダプターを含有する。本明細書においてさらに議論するように、ターゲット核酸は、1つ以上の細胞(1〜数百万個の細胞を含む)から単離された核酸から作製される。次に、これらの核酸を機械的または酵素的方法によってフラグメント化する。
本発明の核酸テンプレートコンストラクトの一部分になるターゲット核酸は、ターゲット核酸の連続する領域内の予め決められた位置に間隔を置いて挿入された散在アダプターを持ちうる。間隔は等しくても等しくなくてもよい。いくつかの態様では、散在アダプター間のスペーシングの正確さが、1〜数ヌクレオチドの正確さでしかわからなくてもよい。別の態様では、アダプターのスペーシングがわかっており、ライブラリーコンストラクトにおける他のアダプターに対する各アダプターの向きがわかっている。すなわち、多くの実施形態において、アダプターは、一端のターゲット配列が天然のゲノム配列において他端のターゲット配列と隣接するように、既知の距離に挿入される。例えば、アダプターの端から3塩基の位置に置かれた認識部位から16塩基の位置を切断するタイプIIs制限エンドヌクレアーゼの場合、エンドヌクレアーゼはアダプターの末端から13塩基の位置を切断する。第2のアダプターを挿入した場合、アダプターの「上流」にあるターゲット配列と、アダプターの「下流」にあるターゲット配列とは、元のターゲット配列において実際に隣接する配列である。
本明細書に記載する本発明の実施形態は、一般に、環状核酸テンプレートコンストラクトに関して説明されるが、核酸テンプレートコンストラクトが線状であってもよいことは理解されるだろう。さらにまた、本発明の核酸テンプレートコンストラクトは一本鎖または二本鎖であることができ、いくつかの実施形態では後者が好ましい。
本発明は、1つ以上の散在アダプターを含有するターゲット核酸を含むテンプレートを提供する。さらにもう一つの実施形態では、複数のゲノムフラグメントから形成される核酸テンプレートを使って、核酸テンプレートのライブラリーを作成することができる。そのような核酸テンプレートのライブラリーは、いくつかの実施形態では、全体としてゲノム全体の全部または一部を包含するターゲット核酸を含むだろう。すなわち、十分な数の出発ゲノム(例えば細胞)を、ランダムフラグメント化と組み合わせて使用することにより、得られた特定サイズのターゲット核酸(本発明の環状テンプレートを作製するために使用されるもの)は、「ゲノム」を十分に「カバー(cover)」する。ただし、理解されるだろうが、時にはバイアスが意図せず導入されてしまい、ゲノム全体が表現されるのを妨げることもありうる。
本発明の核酸テンプレートコンストラクトは複数の散在アダプターを含み、いくつかの態様では、これらの散在アダプターが制限エンドヌクレアーゼのための認識部位を1つ以上含む。さらなる態様では、アダプターが、タイプIIsエンドヌクレアーゼのための認識部位を含む。タイプIIsエンドヌクレアーゼは一般に市販されており、当技術分野ではよく知られている。対応するタイプIIエンドヌクレアーゼと同様に、タイプIIsエンドヌクレアーゼは二本鎖ポリヌクレオチド配列内のヌクレオチド塩基対の特異的配列を認識する。その配列を認識すると、エンドヌクレアーゼはポリヌクレオチド配列を切断して、一般的には、配列の一方の鎖にオーバーハング、すなわち「付着末端」を残す。また、タイプIIsエンドヌクレアーゼは、一般に、その認識部位外を切断し、その距離は、そのエンドヌクレアーゼに依存して認識部位から約2〜30ヌクレオチド離れたどこかでありうる。いくつかのタイプIIsエンドヌクレアーゼは、その認識部位から既知の塩基数だけ離れた位置を切断する「イグザクト・カッター(exact cutter)」である。いくつかの実施形態では、「イグザクト・カッター」ではなく特定の範囲(例えば6〜8ヌクレオチド)内で切断するタイプIIsエンドヌクレアーゼを使用する。一般に、本発明において役立つタイプIIs制限エンドヌクレアーゼは、その認識部位から少なくとも6ヌクレオチド(すなわち、認識部位の末端と最も近い切断点との間の数)離れた切断部位を持つ。例示的タイプIIs制限エンドヌクレアーゼには、Eco57M I、Mme I、Acu I、Bpm I、BceA I、Bbv I、BciV I、BpuE I、BseM II、BseR I、Bsg I、BsmF I、BtgZ I、Eci I、EcoP15 I、Eco57M I、Fok I、Hga I、Hph I、Mbo II、Mnl I、SfaN I、TspDT I、TspDW I、Taq IIなどが含まれるが、これらに限るわけではない。いくつかの例示的実施形態では、本発明で使用されるタイプIIs制限エンドヌクレアーゼが、AcuI(これは、約16塩基のカット長を持ち、2塩基の3'オーバーハングを伴う)およびEcoP15(これは、25塩基のカット長を持ち、2塩基の5'オーバーハングを伴う)である。以下にさらに議論するように、本発明の核酸テンプレートコンストラクトのアダプター中にタイプIIs部位を含めれば、ターゲット核酸中の所定の位置に複数のアダプターを挿入するためのツールになる。
理解されるだろうが、アダプターは、他の(非タイプIIs)制限エンドヌクレアーゼのための認識部位、増幅のためのプライマー結合部位、ならびに本明細書でさらに説明するシーケンシング反応で使用されるプローブ(「アンカープローブ」)用の結合部位などといった他のエレメントも含みうる。
ある態様では、本発明において役立つアダプターが、図5に示す配列を持つ。図5Bにおけるアダプターの1つの模式図に同定されているように、アダプターは、タイプIIs制限エンドヌクレアーゼのための認識部位(503および506)、ニッキングエンドヌクレアーゼのための部位(504)、ならびに二次的特質に影響を及ぼすことができる配列、例えばヘアピンを破壊するための塩基(501および502)など、複数の機能的特徴を含むことができる。本発明において役立つアダプターは、以下にさらに詳しく議論するように、そのようなアダプターを含む核酸テンプレートを使ってコンカテマーを生成させた時に分子内結合を促進するのに役立ちうるパリンドローム配列も、さらに含有しうる。
IV.本発明の核酸テンプレートの調製
IVA.環状テンプレートの生成の概観
本発明は、さまざまなシーケンシング応用および遺伝子タイピング応用を含む、本明細書に記載する幅広い応用に利用することができる、核酸同定および核酸検出のための組成物および方法に関する。本明細書に記載する方法は、増幅反応に使用される環状核酸テンプレートの構築を可能にするものであり、その増幅反応は、そのような環状テンプレートを利用してモノマー型環状テンプレートのコンカテマーを作り出し、さまざまなシーケンシング応用および遺伝子タイピング応用に利用することができる後述の「DNAナノボール」を形成させる。本発明の環状または線状コンストラクトは、散在外来核酸アダプターを持つターゲット核酸配列、一般的にはゲノムDNAのフラグメント(ただし、本明細書で述べるとおり、他のテンプレート、例えばcDNAも使用することができる)を含む。本発明は、後続の各アダプターが、先に挿入された1つ以上のアダプターに対して所定の位置に、かつ場合によっては所定の向きで付加される、核酸テンプレートコンストラクトを作製するための方法を提供する。これらの核酸テンプレートコンストラクトは、一般に、複数の散在アダプターを伴うターゲット核酸を含む環状核酸(ただし、一定の実施形態において、コンストラクトは線状であることもできる)である。これらのアダプターは、後述するように、シーケンシング応用および遺伝子タイピング応用に使用される外来配列であり、通常は制限エンドヌクレアーゼ部位(特にその認識部位外を切断するタイプIIs酵素などの酵素のための部位)を含有する。解析が容易になるように、本発明の反応では、好ましくは、アダプターがランダムにではなく、特定の向きに挿入される実施形態を利用する。したがって本発明は、複数のアダプターを、特定の向きに、かつそれらの間に所定のスペーシングを持って含有する核酸コンストラクトを作製するための方法を提供する。
後続の各アダプターの挿入のスペーシングおよび向きに対する制御は、散在アダプターのランダムな挿入と比較して、いくつかの利点を持つ。特に、本明細書に記載する方法は、アダプター挿入プロセスの効率を改善し、よって後続の各アダプターが挿入される時に増幅ステップを導入する必要が減少する。加えて、付加される各アダプターのスペーシングおよび向きを制御することにより、各アダプターに一般に含まれる制限エンドヌクレアーゼ認識部位は、それ以降の切断およびライゲーションステップが核酸コンストラクト中の適正な位置で起こり、それゆえに、不適正な位置または向きにアダプターを持つ核酸テンプレートの情報を減少させまたは排除することによってプロセスの効率を増加させることが可能になるように配置されることが保証される。加えて、後から付加される各アダプターの位置および向きに対する制御は、結果として得られる核酸コンストラクトの一定の用途にとっても有益でありうる。なぜなら、これらのアダプターは、例えばターゲット核酸内の一定の位置に同定される塩基の相対的空間位置(relative spatial location)を同定するのを助けるための既知配列の基準点(reference point)として役だつなど、シーケンシング応用において、さまざまな機能を果たすからである。本明細書では、シーケンシング応用におけるそのようなアダプターの用途を、さらに説明する。
ゲノム核酸、一般的には二本鎖DNA(図6の601)は、複数の細胞(一般的には約10〜100個から1000個またはそれ以上の細胞)から得られる。複数の細胞を使用することにより、最終的なDNAナノボールは、そのゲノムの良好なシーケンシングカバレッジが得られるような冗長レベルを持つことができる。本明細書に記載するようにサイズ分画と組み合わせた物理的または酵素的分割など、標準的な技法を使ってゲノム核酸を適当なサイズに分画する。
二本鎖フラグメントの5'および3'末端は、場合によっては、本明細書に記載するように、調節することができる。例えば、核酸を分画するために使用される多くの技法は、フラグメントの長さと末端のケミストリーの組合せをもたらす。例えば、末端はオーバーラップを含むことができ、多くの目的には、二本鎖フラグメントの平滑末端が好ましい。これは、ポリメラーゼおよびdNTP類など、既知の技法を使って行うことができる。同様に、分画技法は、3'および5'ヒドロキシル基および/または3'および5'ホスフェート基など、さまざまな末端ももたらしうる。いくつかの実施形態では、後述するように、これらの末端を酵素的に改変することが望ましい。例えばアダプターを持たない複数のフラグメントのライゲーションを防止するには、ホスフェート基およびヒドロキシル基が正しい向きで存在せず、したがってターゲット配列の「重合」が防止されるように、末端のケミストリーを改変することが望ましい場合がある。末端のケミストリーに対する制御は、当技術分野で知られる方法を使って行うことができる。例えば、ある状況では、ホスファターゼの使用により、全ての末端がヒドロキシル基を含有するように、全てのホスフェート基が除去される。次に、所望のコンポーネント間でのライゲーションが可能なように、各末端を選択的に改変することができる。
さらにまた、多くの実施形態ではこの段階での増幅ステップは必要ないが、必要に応じて、さらなる操作のためにゲノムフラグメントの数を増加させるべく、場合によっては、多種多様な既知の技法を使って増幅も行うことができる。
分画および随意の末端調節後に、アダプター「アーム」のセットをゲノムフラグメントの末端に付加する。それら2つのアダプターアームは、一つにライゲートされた時に、第1アダプターを形成する。例えば、図6に図示するように、コンストラクトの各末端にアダプターアームを持つ線状コンストラクトの環状化(605)は、それら2つのアームを一つにライゲートして、完全なアダプター(606)ならびに環状コンストラクト(607)を形成させる。したがって、第1アダプターの第1アダプターアーム(603)をゲノムフラグメントの一端に付加し、第1アダプターの第2アダプターアーム(604)をゲノムフラグメントの他端に付加する。一般に、以下により詳しく説明するように、アダプターアームの一方または両方は、所望するシステムに依存して、タイプIIsエンドヌクレアーゼのための認識部位を含むだろう。あるいは、アダプターアームは、アームのライゲーション時に再構成される部分認識配列を、それぞれ含有することもできる。
後続のアダプターをシーケンシング用に望ましい位置および向きでライゲートするために、本発明は、タイプIIs制限エンドヌクレアーゼが環状核酸コンストラクトの第1アダプター内の認識部位に結合した後、第1アダプター外かつゲノムフラグメント(本明細書では「ターゲット核酸」ともいう)内の位置で切断を起こす方法を提供する。次に、切断が起こる点に、第2アダプターを(ここでも、通常は、第2アダプターの2つのアダプターアームを付加することによって)ライゲートすることができる。ターゲット核酸を既知の点で切断するには、その制限エンドヌクレアーゼが結合することのできる唯一の点が第1アダプター内にあり、したがってコンストラクトの望ましくない切断が回避されるように、ターゲット核酸中にランダムに含まれうるその同じ酵素のための他の認識部位を全てブロックすることが望ましい場合がある。一般に、第1アダプター中の認識部位を、まず最初に、不活化から保護し、次に、そのコンストラクト中の保護されていない他の認識部位を、一般的にはメチル化によって不活化する。すなわち、メチル化された認識部位は、酵素を結合せず、したがって切断は起こらないことになる。アダプター内の非メチル化認識部位だけが、酵素の結合とそれに続く切断を許すことになる。
第1アダプター中の認識部位を不活化から保護する方法の一つは、メチル化酵素が一本鎖には結合しないことから、その部位を一本鎖にすることである。したがって、第1アダプターの認識部位を保護する方法の一つは、2つの第1アダプターアームにライゲートされた線状ゲノムフラグメントを、ウラシルで修飾されたプライマーを使って増幅することによる方法である。プライマーはアダプターアームに相補的であり、増幅(一般的にはPCRを使用)した時に結果として生じる線状コンストラクトが第1アダプターアームの一方の認識部位に埋め込まれたウラシルを含有するように、ウラシルで修飾される。既知の技法を使ってウラシルを消化すると、その第1アダプターアーム(またはウラシルを含有するものはすべて)一本鎖になる。次に、配列特異的メチラーゼを線状コンストラクトに適用すると、第1アダプターに含まれるものと同じエンドヌクレアーゼのための二本鎖認識部位の全てがメチル化されることになる。そのような配列特異的メチラーゼは、第1アダプターアーム中の一本鎖認識部位をメチル化することができないだろうから、第1アダプターアーム中の認識部位は、メチル化による不活化から保護されることになる。後述するように、制限部位がメチル化されれば、それは、制限エンドヌクレアーゼ酵素によって切断されないだろう。
ある場合には、以下により詳しく説明するように、同じアダプターから「上流」と「下流」の両方を切断することができるように、単一のアダプターが同じ認識部位を2つ持っていてもよい。この実施形態では、図7に図示するとおり、「上流」または「下流」認識部位のどちらか一方が選択的に、不活化から保護され、または不活化されるように、プライマーおよびウラシルの位置が適切に選択される。例えば図7では、2つの異なるアダプターアーム(矩形として表す)が、それぞれ、制限エンドヌクレアーゼのための認識部位を含む(一方のアダプターアーム中の丸と他方のアダプターアーム中の三角で表される)。丸で表される認識部位を持つアダプターアームを、上述のウラシル分解法を使って保護する必要があるならば、その認識部位にウラシルが組み込まれるように、ウラシル修飾増幅プライマーをデザインする。次に、ウラシル分解を行うと、そのアダプターアームは一本鎖になり(半分の矩形で表される)、よって、その認識部位は不活化から保護される。
第1アダプターアーム中の認識部位をメチル化から保護した後、例えば架橋オリゴヌクレオチドおよびT4リガーゼを使って、線状コンストラクトを環状化する。環状化により、第1アダプターアーム中の二本鎖制限エンドヌクレアーゼ認識部位が再構成される。いくつかの実施形態において、架橋オリゴヌクレオチドはブロックされた末端を持つ。これは、環状化させるのに役立ち、かつ非ブロック末端をライゲートし、かつ認識部位近くにニックを残す、架橋オリゴヌクレオチドをもたらす。このニックは、後述するように、さらに利用することができる。制限エンドヌクレアーゼの適用により、ターゲット核酸の内部にある第1アダプターと2塩基オーバーハング(酵素に依存する)を含む末端とを含む第2の線状コンストラクトが生じる。
第2アダプター用の第2のアダプターアームセットを、第2の線状コンストラクトにライゲートする。ニックを利用する場合、いくつかの例では、アダプターが適正な向きでライゲートされることを保証するために、エキソヌクレアーゼ活性を持つポリメラーゼを使用することによって、第1アダプター中のニックを「トランスレート」(または「トランスロケート」)する。ポリメラーゼ(例えばTaqポリメラーゼ)のエキソヌクレアーゼ活性が、ニックに隣接する短いDNA鎖を切り出すと同時に、ポリメラーゼ活性がその鎖中のニックとそれ以降のヌクレオチドを「埋める」ことになる(基本的に、Taqは鎖に沿って移動し、エキソヌクレアーゼ活性を使って塩基を切り出し、同じ塩基を付加するので、結果として、ニックは酵素が末端に到達するまで鎖に沿ってトランスロケートされることになる)。
さらにまた、テンプレートの非対称性を生み出すために、コンストラクトの一端を一塩基で修飾する。例えば、Taqなど、一定のポリメラーゼは、テンプレート非依存的なヌクレオチド付加を起こすことで、平滑DNA二重鎖の3'末端に単一のヌクレオチドを付加し、3'オーバーハングを生成させる。当業者には理解されるだろうが、溶液中のdNTP濃度に依存して、どの塩基でも付加することができる。一定の実施形態では、利用するポリメラーゼが、単一のヌクレオチドを付加することしかできないだろう。例えばTaqポリメラーゼは単一のGまたはAを付加することができるだろう。他のヌクレオチドを付加してオーバーハングを生成させるために、他のポリメラーゼも使用することができる。ある実施形態では、過剰のdGTPを使用して、一方の鎖の3'末端にグアノシンのテンプレート非依存的な付加をもたらす。第2線状コンストラクトの3'末端のこの「Gテール(G-tail)」は、末端の非対称性をもたらし、したがって、第2アダプターアームを第2線状コンストラクトの3'末端にアニールさせるCテールを持つ第2アダプターアームに、ライゲートすることになる。5'末端にライゲートさせるつもりのアダプターアームは、5'Gテールにライゲートするような位置に置かれたCテールを持つだろう。第2アダプターアームのライゲーション後に、コンストラクトを環状化して、2つのアダプターを含む第2の環状コンストラクトを生成させる。第2アダプターは一般的にはタイプIIsエンドヌクレアーゼのための認識部位を含有するだろう。この認識部位は、第1アダプターに含まれる認識部位と同じであっても異なってもよいが、後者はさまざまな応用に利用することができる。
第3アダプターは、第1アダプターの第2アーム中の認識部位(元々はメチル化によって不活化されていた認識部位)に結合する制限エンドヌクレアーゼで切断することにより、第1アダプターの反対側に挿入することができる。この認識部位を利用可能にするために、第1アダプター中の第2認識部位に相補的なウラシル修飾プライマーを使って環状コンストラクトを増幅することにより、第1アダプターが第2制限認識部位に埋め込まれたウラシルを含んでいる第3の線状コンストラクトを生成させる。そのウラシルを分解して第1アダプターを一本鎖にすると、それがアダプター中の認識部位をメチル化から保護することになる。次に、配列特異的メチラーゼを適用すると、保護されていない認識部位が全て不活化されることになる。環状化すると、第1アダプター中の認識部位が再構成され、制限エンドヌクレアーゼの適用により、そのサークルが切断されて、第3線状コンストラクト中に第3アダプターを挿入することができる位置が生じる。第3線状コンストラクトへの第3アダプターアームのライゲーションは、上述したものと同じ一般手法に従って行われるだろう。すなわち、第3線状コンストラクトにはAテールまたはGテールを付加し、第3アダプターアームにはTテールまたはCテールを付加して、アダプターアームが第3線状コンストラクトにアニールしてライゲートされうるようにする。次に、第3アダプターアームを含む線状コンストラクトを環状化して、第3環状コンストラクトを形成させる。第2アダプターと同様に、第3アダプターも一般的には、第1アダプターに含まれる認識部位とは異なる、制限エンドヌクレアーゼのための認識部位を含むだろう。
第4アダプターは、第2および第3アダプター中に認識部位を持つタイプIIs制限エンドヌクレアーゼを利用することによって付加することができる。これらの制限エンドヌクレアーゼによる切断は、第4の線状コンストラクトをもたらすことになり、次にそれを第4アダプターアームにライゲートすることができる。第4アダプターアームにライゲートされた第4線状コンストラクトの環状化により、本発明の核酸テンプレートコンストラクトが生成することになる。当業者には理解されるだろうが、他のアダプターを付加することができる。このように本明細書に記載する方法は、2つ以上のアダプターを、向き依存的、そして時には距離依存的に、付加することを可能にする。
本発明は、後から付加される各アダプターが挿入される向きを制御するための方法も提供する。そのような「ニックトランスレーション」法は、ターゲット核酸とアダプターを互いにライゲートする方法を制御する方法になる。これらの方法は、アダプターと他のアダプターとのライゲーションおよびターゲット核酸分子と他のターゲット核酸分子とのライゲーションを防止すること(本質的にアダプターおよびターゲット核酸分子の「重合」を回避すること)により、核酸コンストラクト中のアーチファクトも防止する。アダプターとターゲット核酸分子がライゲートされる際に取りうるさまざまな向きの例を、図8に模式的に図解する。ターゲット核酸801および802を、好ましくは、アダプター803および804に、所望の向きでライゲートする(この図に図解するように、所望の向きとは、同じ形状−丸または四角−の末端同士がライゲートする向きである)。分子の末端を修飾することにより、ターゲット核酸同士がライゲートし、アダプター同士がライゲートする望ましくない構成807、808、809および810が回避される。さらにまた、以下にさらに詳しく議論するように、各アダプター-ターゲット核酸ライゲーションの向きも、アダプターとターゲット核酸の両方の末端のケミストリーを制御することによって、制御することができる。末端のケミストリーに対する制御は、当技術分野で知られる方法を使って行うことができる。例えば、ある状況では、ホスファターゼの使用により、全ての末端がヒドロキシル基を含有するように、全てのホスフェート基が除去される。次に、所望のコンポーネント間でのライゲーションが可能なように、各末端を選択的に改変することができる。本発明のニックトランスレーション法においてアダプターの末端を修飾し、その挿入を制御するための、これらの方法および他の方法を、以下にさらに詳しく説明する。
次に、これらの核酸テンプレートコンストラクト(これらのアダプターが散在するターゲット配列を含む「モノマー」)は、コンカテマーの生成に使用することができ、それは次に、シーケンシングや特異的ターゲット配列の検出などといった下流の応用に使用することができる核酸ナノボールを形成する。
本発明は、ターゲット核酸中に挿入された複数の散在アダプターを含む核酸テンプレートコンストラクトを形成させるための方法を提供する。本明細書でさらに議論するように、本発明の方法は、アダプターに含まれるタイプIIs制限エンドヌクレアーゼのための認識部位を利用することによって、後続の各アダプターの挿入を可能にする。複数のアダプターを所望の順序および/または向きで挿入するには、アダプター中の認識部位だけが酵素の結合およびその後の切断に利用することができるように、ターゲット核酸内に含まれる制限エンドヌクレアーゼ認識部位をブロックすることが必要な場合がある。そのような方法の利点には、同じ制限エンドヌクレアーゼ部位を各アダプター中に使用することができ(これは、最終的にコンカテマーを生成させるために使用されることになる環状テンプレートの作製を簡単にする)、実質上、新しいアダプターのそれぞれがフラグメントに沿って「歩いていく」ことによって付加が起こりうるように、先に挿入されたアダプターを次のアダプターのための「踏み石」として使用して、アダプターを挿入することができるという点がある。制限酵素にとって利用可能な認識部位を制御することで、一定の配列の切り出しによって限定された配列表現(sequence representation)しか得られないこと(これはターゲット配列内の部位が利用可能な場合に起こりうる)も回避される。
IVB.第1アダプターの付加
本発明の核酸テンプレートの作製における第1ステップとして、第1アダプターをターゲット核酸にライゲートする。第1アダプター全体を1つの末端に付加してもよいし、第1アダプターの2つの部分(これを、本明細書では「アダプターアーム」という)をターゲット核酸の各末端にライゲートすることもできる。第1アダプターアームは、ライゲーション時にそれらが第1アダプター全体を再構成するように、デザインされる。上で詳しく述べたように、第1アダプターは一般的にはタイプIIs制限エンドヌクレアーゼのための認識部位を1つ以上含むだろう。いくつかの実施形態では、タイプIIs制限エンドヌクレアーゼ認識部位が、2つのアダプターアームのライゲーション後でなければ制限エンドヌクレアーゼへの結合には利用することができないように、それら2つのアダプターアーム間に分割されるだろう。
図6は、アダプター/ターゲット核酸テンプレート(本明細書では、これを、「ターゲットライブラリーコンストラクト」、「ライブラリーコンストラクト」、および文法上等価な全ての用語で表すこともある)を組み立てるための方法の一態様の模式的表現である。DNA、例えばゲノムDNA 601を単離し、上述のように標準的技法を使って、ターゲット核酸602にフラグメント化する。次に、フラグメント化されたターゲット核酸602を、各鎖の5'および3'末端が平滑末端またはブラントエンドになるように修復する。この反応に続いて、フラグメント化されたターゲット核酸の各鎖の3'末端に、校正活性を持たないポリメラーゼ(non-proofreading polymerase)を使って付加された単一のAにより、各フラグメントに「Aテールを付加」する。Aテール付加(A-tailing)は、一般に、ポリメラーゼ(例えばTaqポリメラーゼ)を使用し、そのポリメラーゼがテンプレート配列非依存的にターゲット核酸の末端に1つ以上のAを付加することを強いられるように、アデノシンヌクレオチドだけを供給することによって達成される。
図6に図解する例示的方法では、次に、第1アダプターの第1アーム(603)および第2アーム(603)を各ターゲット核酸にライゲートして、各末端にライゲートされたアダプターアームを持つターゲット核酸を生成させる。ある実施形態では、ターゲット核酸のAテールに相補的になるように、アダプターアームに「Tテールを付加」する。これは、まず最初にターゲット核酸にアニールするための手段をアダプターアームに与え、次にリガーゼを適用して、アダプターアームをターゲット核酸に接合させることにより、ターゲット核酸へのアダプターアームのライゲーションを容易にする。
さらにもう一つの実施形態において、本発明は、分子内または分子間ライゲーションアーチファクトの生成が最小限に抑えられるような方法での各フラグメントへのアダプターライゲーションを提供する。これは望ましい。なぜなら、互いにライゲーションアーチファクトを形成するターゲット核酸のランダムフラグメントは、ターゲット核酸フラグメント間に偽の近接ゲノム関係を作り出して、配列アラインメントプロセスを複雑にするからである。Aテール付加およびTテール付加の両方を使ってアダプターをDNAフラグメントに取り付けることにより、アダプターおよびフラグメントのランダムな分子内または分子間会合が防止され、それが自己ライゲーション、アダプター-アダプターライゲーションまたはフラグメント-フラグメントライゲーションによって生成されるであろうアーチファクトを減少させる。
A/Tテール付加(またはG/Cテール付加)の代替策として、ターゲット核酸およびアダプターのライゲーションアーチファクトの形成を防止すると共に、アダプターアームをターゲット核酸に対して方向付けるには、例えばターゲット核酸およびアダプターアームに相補的なNNオーバーハングを使用すること、または単一フラグメント核酸/アダプターアームライゲーション比が最適化されるように適切なターゲット核酸対アダプター比での平滑末端ライゲーションを使用することなど、さまざまな他の方法を実行することができる。
ターゲット核酸を含み、各末端にアダプターアームを持つ、線状コンストラクトを生成させた後、その線状ターゲット核酸を環状化(605)して(このプロセスについては、本明細書においてさらに詳しく説明する)、ターゲット核酸とアダプターとを含む環状コンストラクト607を得る。環状化プロセスは第1アダプターの第1アームと第2アームを一つにして、環状コンストラクト中に連続した第1アダプター(606)を形成させることに注意されたい。いくつかの実施形態では、環状コンストラクト607が、サークル依存的増幅などにより、例えばランダムヘキサマーおよびφ29またはヘリカーゼを使って、増幅される。あるいは、ターゲット核酸/アダプター構造は線状のままであってもよく、増幅をアダプターアーム中の部位からプライミングされるPCRによって達成してもよい。増幅は、好ましくは、制御された増幅プロセスであり、高忠実度の校正活性を持つポリメラーゼを使用して、クエリされるゲノムまたはそのゲノムの1つ以上の部分の十分な表現になっている、増幅されたターゲット核酸/アダプターコンストラクトの配列の正確な(sequence-accurate)ライブラリーをもたらす。
IVC.複数アダプターの付加
図6は、アダプター/ターゲット核酸テンプレート(本明細書では、これを、「ターゲットライブラリーコンストラクト」、「ライブラリーコンストラクト」、および文法上等価な全ての用語で表す場合もある)を組み立てるための方法の一態様の模式的表現である。DNA、例えばゲノムDNA 601を単離し、標準的技法を使って、ターゲット核酸102にフラグメント化する。次に(ここで述べる)いくつかの態様では、フラグメント化されたターゲット核酸602を、各鎖の5'および3'末端が平滑末端またはブラントエンドになるように修復する。
図6に図解する例示的方法では、第1アダプターの第1アーム(603)および第2アーム(604)を各ターゲット核酸にライゲートして、各末端にライゲートされたアダプターアームを持つターゲット核酸を生成させる。
ターゲット核酸を含み、各末端にアダプターアームを持つ、線状コンストラクトを生成させた後、その線状ターゲット核酸を環状化(605)して(このプロセスについては、本明細書においてさらに詳しく説明する)、ターゲット核酸とアダプターとを含む環状コンストラクト607を得る。環状化プロセスにより、第1アダプターの第1アームと第2アームは一つになって、環状コンストラクト中の連続した第1アダプター(606)を形成させることに注意されたい。いくつかの実施形態では、環状コンストラクト607が、サークル依存的増幅などにより、例えばランダムヘキサマーおよびφ29またはヘリカーゼを使って、増幅される。あるいは、ターゲット核酸/アダプター構造は線状のままであってもよく、増幅をアダプターアーム中の部位からプライミングされるPCRによって達成してもよい。増幅は、好ましくは、制御された増幅プロセスであり、高忠実度の校正活性を持つポリメラーゼを使用して、クエリされるゲノムまたはそのゲノムの1つ以上の部分の十分な表現になっている、増幅されたターゲット核酸/アダプターコンストラクトの、配列の正確なライブラリーが得られる。
第1アダプターを付加するためのプロセスと同様に、第2のアダプターアームセット(610)および(611)を、線状分子(609)の各末端に付加し、次にライゲートして(612)、完全なアダプター(614)および環状分子(613)を形成させることができる。アダプター(609)の反対側を切断するタイプIIsエンドヌクレアーゼを利用し、次に、線状化された分子の各末端に第3のアダプターアームセット(617)および(618)をライゲートすることにより、再び、第3アダプターを、アダプター(609)の反対側に付加することができる。最後に、環状コンストラクトを再び切断し、線状化されたコンストラクトに第4のアダプターアームセットを付加することにより、第4アダプターを付加することができる。図6に図示する実施形態は、アダプター(620)および(614)中に認識部位を持つタイプIIsエンドヌクレアーゼを適用して環状コンストラクトを切断する方法である。アダプター(620)および(614)中の認識部位は同一であっても異なってもよい。同様に、図6に図示する全てのアダプター中の認識部位は、同一であっても異なってもよい。
図9に一般論として図解するように、第1アダプターを含む環状コンストラクトは、認識配列外(そしてアダプター外)のターゲット核酸を切断(910)するように配置された2つのタイプIIs制限エンドヌクレアーゼ認識部位を、そのアダプター中に含みうる。構造510のまわりの矢印は、認識部位および制限部位を示す。プロセス911では、タイプIIs制限エンドヌクレアーゼEcoP15を使って、環状コンストラクトを切断する。図9に示す態様では、ターゲット核酸の一部にマッピングされる各ライブラリーコンストラクトの一部(構造910の矢じりの間にあるターゲット核酸部分)が、コンストラクトから切り離されることになることに注意されたい。プロセス911におけるEcoP15によるライブラリーコンストラクトの制限切断は、第1アダプターを含有する線状コンストラクトのライブラリーをもたらし、ここで、第1アダプターは線状コンストラクト912の末端に対して「内部」にある。得られた線状ライブラリーコンストラクトは、エンドヌクレアーゼ認識部位とエンドヌクレアーゼ制限部位の間の距離+アダプターのサイズによって規定されるサイズを持つことになる。プロセス913では、フラグメント化されたターゲット核酸904と同様に、線状コンストラクト912を従来の方法で処理して、ブラントエンドまたは平滑末端にし、校正活性を持たないポリメラーゼを使って単一のAを含むAテールを線状ライブラリーコンストラクトの3'末端に付加し、第2アダプターの第1アームおよび第2アームを、線状化されたライブラリーコンストラクトの末端に、A-Tテール付加およびライゲーション913によってライゲートする。得られるライブラリーコンストラクトは914に見られる構造を含み、第1アダプターが線状コンストラクトの末端に対して内部にあり、ターゲット核酸には一端で第1アダプターが隣接し、他端で第2アダプターの第1アームまたは第2アームが隣接する。
プロセス915では、二本鎖線状ライブラリーコンストラクトを一本鎖916になるように処理し、次に、その一本鎖ライブラリーコンストラクト916をライゲート917して、2つのアダプターが散在しているターゲット核酸918の一本鎖サークルを形成させる。917のライゲーション/環状化プロセスは、分子内ライゲーションを最適化する条件下で行われる。一定の濃度および反応条件では、各核酸コンストラクトの末端の局所的分子内ライゲーションの方が、分子間のライゲーションより有利になる。
IVD.ターゲット核酸とアダプターの間で起こるライゲーションの向きの制御
ある態様では、本発明は、上述したターゲット核酸へのアダプターのライゲーションが所望の向きで達成される方法を提供する。向きに対するそのような制御は有利である。なぜなら、互いにライゲーションアーチファクトを形成するターゲット核酸のランダムフラグメントは、ターゲット核酸フラグメント間に偽の近接ゲノム関係を作り出して、配列アラインメントプロセスを複雑にするからである。
アダプター挿入の向きを制御するのに利用できる方法がいくつかある。上述のように、正しい向きが存在する場合にのみライゲーションが起こりうるようにターゲットとアダプターの末端のケミストリーを改変する方法を行うことができる。あるいは、以下に概説するように、やはり末端ケミストリーに依拠する「ニックトランスレーション法」を行うこともできる。最後に、プライマーの特別な選択による増幅を含む方法を後述のように行うことができる。
図12は、第2アダプターが核酸コンストラクトに付加される際にとりうる異なる向きの模式的図解である。ここでも、プロセス1200は、挿入された第1アダプター1210を持つ環状ライブラリーコンストラクト1201から始まる。第1アダプター1210は特定の向きを持ち、矩形は第1アダプターの「外側鎖(outer strand)」を表し、菱形は第1アダプターの「内側鎖(inner strand)」を表す(Ad1向き1210)。第1アダプター1210中のタイプIIs制限エンドヌクレアーゼ部位は、矢印1201の基部で示され、切断部位は矢じりで示される。プロセス1203は、タイプIIs制限エンドヌクレアーゼによる切断、第2アダプターの第1および第2アダプターアームのライゲーション、ならびに再環状化を含む。得られたライブラリーコンストラクト1204および1206からわかるように、第2アダプターは第1アダプターに関して2つの異なる方法で挿入されうる。望ましい向き1204では、楕円が矩形と共に外側鎖に挿入され、ボウタイ(bowtie)が菱形と共に内側鎖に挿入される(Ad2向き1220)。望ましくない向きでは、楕円が菱形と共に内側鎖に挿入され、ボウタイが矩形と共に外側鎖に挿入される(Ad2向き1230)。
以下の議論と、参照する説明図の大半は、明快になるように、第1アダプターとの関連で、第2アダプターの挿入について議論するが、ここで議論するプロセスが、挿入されたアダプターを3個、4個、5個、6個、7個、8個、9個、10個またはそれ以上持つライブラリーコンストラクトを作製する第2アダプター以降に付加されるアダプターにも当てはまりうることは、理解されるだろう。
ある実施形態では、Aテール付加とTテール付加の両方を使って、アダプターを核酸フラグメントに取り付ける。例えば、フラグメントの末端を修復するために上述の修飾を行った後、フラグメント化されたターゲット核酸の各鎖の3'末端に校正活性を持たないポリメラーゼを使って付加された単一のAで、各フラグメントに「Aテールを付加」することができる。Aテール付加は、一般に、ポリメラーゼ(例えばTaqポリメラーゼ)を使用し、そのポリメラーゼがテンプレート配列非依存的にターゲット核酸の末端に1つ以上のAを付加することを強いられるように、アデノシンヌクレオチドだけ(または過剰量のアデノシンヌクレオチド)を供給することによって達成される。「Aテール付加」が使用される実施形態では、ターゲット核酸のAテールと相補的になるようにアダプター/アダプターアームの5'末端に「Tテール」を付加することによって、アダプター(またはアダプターアーム)へのライゲーションを達成することができる。これは、まず最初にターゲット核酸にアニールするための手段をアダプターアームに与え、次にリガーゼを適用して、アダプターアームをターゲット核酸に接合させることにより、ターゲット核酸へのアダプターアームのライゲーションを容易にする。
本願に係る発明の態様は、核酸テンプレートが望ましいサイズを持ち、単一のフラグメントに由来するターゲット核酸を含む場合に、最適に作動するので、核酸テンプレートを作製するプロセスの全体を通して、環化反応が確実に分子内で起こるようにすることは、有益でありうる。すなわち、第1、第2、第3アダプターなどのアダプターにライゲートされるプロセスにおいて、ターゲット核酸が互いにライゲートしないことを保証することは、有益でありうる。環状化プロセスを制御する一実施形態を図10に図解する。図10に示すように、ブロッキングオリゴ1017および1027を使って、結合領域である1012および1022領域をそれぞれブロックする。ブロッカーオリゴヌクレオチド1017は結合配列1016に相補的であり、ブロッカーオリゴヌクレオチド1027は結合配列1026に相補的である。5'アダプターアームと3'アダプターアームの模式的図解において、下線を付した塩基はジデオキシシトシン(ddC)であり、太字フォントの塩基はホスホリル化される。ブロッカーオリゴヌクレオチド1017および1027はアダプターアームに共有結合しておらず、ライブラリーコンストラクトへのアダプターアームのライゲーション後かつ環状化前に「融解除去(melted off)」することができ;さらに、ジデオキシヌクレオチド(ここではddC、あるいは異なる非ライゲート可能ヌクレオチド)が、アダプターへのブロッカーのライゲーションを防止する。これに加えて、またはこれに代えて、いくつかの態様では、ブロッカーオリゴ-アダプターアームハイブリッドが、アダプターへのブロッカーのライゲーションを減少させるために、アダプターアームとブロッカーの間に1つ以上の塩基ギャップを含有する。いくつかの態様では、アダプターアームのライゲーション(環状化)に先だってブロッカー配列を容易に融解することができるように、ブロッカー/結合領域ハイブリッドが約37℃のTmを持つ。
IVD(i).ライゲーションの向きの制御:アーム-バイ-アームライゲーション
ある態様では、アダプターの指向的挿入(directional insertion)を、ターゲット核酸の末端を修飾することなく、「アーム-バイ-アーム」ライゲーション法を使って制御することができる。一般に、これは、アダプターアームがターゲット核酸に付加され、鎖置換によるプライマー伸長が、それぞれ一端にアダプターアームを持つ2つの二本鎖分子を生成させ、次にアダプターアームを持たない末端に第2のアダプターアームをライゲートすることができるという、2段階ライゲーションプロセスである。このプロセスは、両方の末端に同じアダプターアームを含む核酸分子の生成を防止することができる。例えば図11Aに図示するように、アーム-バイ-アームライゲーションプロセスは、両方の末端がアダプターAまたはアダプターBで占められている核酸分子の形成を防止することができる。多くの実施形態では、ターゲット核酸の各末端は、2つのアームがライゲートされた時に、それらが完全な全アダプターを形成することができるように、異なるアダプターアームにライゲートされることが好ましい。これは、各アダプターアームの付加後に必要になる増幅ステップの数を最小限に抑えるのに特に役立ちうる。なぜなら、アーム-バイ-アームライゲーションは、各ライゲーション反応で生成する有用でない分子の数を減少させるからである。
図11に、アーム-バイ-アームライゲーション法の一実施形態を図解する。この実施形態では、第1アダプターアームAの一方の鎖を、脱ホスホリル化したターゲット核酸の両方の鎖に付加する。このアダプターアームは、一方の末端(閉じた丸として図示)が、一般的にはアルカリホスファターゼを使ってブロックされる。プライマー交換を使って、ブロックされた末端を持つ鎖を置き換えることができる。鎖置換を伴うプライマー伸長(これは、例示的一実施形態では、phi29またはPfuポリメラーゼの使用によって達成することができる)が、両端から始まり、インサート全体に伸長することにより、2つの二本鎖核酸(それぞれが一端にアダプターアームAを持ち、他端に平滑末端を持つもの)をもたらす。これに代わる実施形態では、プライマー交換反応を必要とすることなくプライマー伸長を開始させるために、アダプターアームAをブロックされた鎖の上流でプライマーとプレハイブリダイズさせて使用することができる。鎖置換ポリメラーゼ反応後に、今度は第2アダプターアームBを、一般的には、アダプターアームを持つ末端にではなく、ターゲット核酸の平滑末端にライゲートすることができる。このアーム-バイ-アームライゲーションプロセスは、両方の末端に同じアダプターアームを含むターゲット核酸の形成を防止することができる。
IVD(ii).ライゲーションの向きの制御:ニックトランスレーション法
ある実施形態において、本発明は、核酸分子を構築するための「ニックトランスレーション法」を提供する。ある実施形態では、核酸分子を所望する向きでライゲートするために、ニックトランスレーション法を使用する。さらにもう一つの実施形態では、アダプターを所望の向きで挿入するために、ニックトランスレーション法を使用する。そのような方法では、一般に、一つにライゲート使用とする核酸分子の一方または両方の一端または両端を修飾する。例えば、アダプターをターゲット核酸にライゲートする場合、ライゲートしようとするターゲット核酸およびアダプターの一方または両方の一端または両端を修飾する。そのような修飾後は、コンストラクトの一方の鎖に挿入されたニックの「トランスロケーション」または「トランスレーション」により、ライゲートされたアダプター-ターゲット核酸コンストラクトの最終的な向きを制御することができる。本明細書に記載する「ニックトランスレーション法」は、以下にさらに詳しく説明するように、プライマー伸長法またはギャップ-フィル-イン(gap-fill-in)法も含みうる。以下の議論は、ターゲット核酸へのアダプターのライゲーションを制御することに関してなされるが、これらの方法がアダプターとターゲット核酸のライゲーションに限定されないこと、そしてこれらの方法は任意の2つの核酸分子のライゲーションを制御するためにも使用できることは、理解されるだろう。例えば、ニックトランスレーション法および本明細書に記載する他の任意の制御されたライゲーション法は、遺伝子工学的および/またはDNA工学的方法の一部として、例えば新しいプラスミドまたは他のDNAベクターの構築、遺伝子またはゲノムの合成または修飾、ならびにナノテクノロジーコンストラクト用のビルディングブロックの構築において使用することができる。
図13は、そのような「ニックトランスレーション」タイプのプロセスの模式的図解である。図13のコンストラクト1306は、本明細書に記載する方法を使って形成され、制限エンドヌクレアーゼ認識部位(図13の矢印の基部)を伴う散在アダプター1304と、切断部位とを持っている。図14では、ライブラリーコンストラクトが環状化されず、ターゲット核酸フラグメント1406(制限エンドヌクレアーゼ認識部位1404を持つ)とアダプター1412とが交互する分岐コンカテマーであるが、図13に示すニックトランスレーションタイプのプロセスは、そのようなライブラリーコンストラクト構成でも同様に行うことができる。本明細書で使用する「ライブラリーコンストラクト」という用語は、1つ以上のアダプターを含む核酸コンストラクトを指し、「核酸テンプレート」という用語と交換可能である。
挿入された第1アダプターを持つライブラリーコンストラクトを、ターゲット核酸を切断して3'ヌクレオチドオーバーハング1308を与える制限エンドヌクレアーゼ−一定の態様ではタイプIIs制限エンドヌクレアーゼ−で消化する(プロセス1301)。図11では、2つのヌクレオチド(NN-3')1308を示すが、オーバーハングヌクレオチドの数は、別の態様では、少なくとも一つには、使用する制限エンドヌクレアーゼの素性に依存して、変化する。ライブラリーコンストラクト1310は線状化されており、挿入された第1アダプターを1304に示す。挿入された第1アダプター1304は、アダプターフラグメントの境界にニック1312を含むか、アダプターの内部にニック1314の導入を可能にするニッキングエンドヌクレアーゼのための認識部位を含む。どちらの場合も、ライブラリーコンストラクト1310の上側の鎖をニック1312または1314から下側の鎖の末端まで伸長して、一端に3'オーバーハングを持ちかつ他端に平滑末端を持つ鎖を形成させることができるポリメラーゼ1316で、ライブラリーコンストラクト1310を処理する1303。このライブラリーコンストラクト1310に、第2アダプター1318をプロセス1305でライゲートする。ここで、第2アダプター1318は、一端に縮重ヌクレオチドオーバーハングを持ち、他端に単一の3'ヌクレオチド(例えばdT)オーバーハングを持っていて、ライブラリーコンストラクト1320を形成する。次に、ライブラリーコンストラクト1320を、プロセス1307において(例えばTaqポリメラーゼ)で)処理して、平滑末端に3'dAを付加する。次に、ライブラリーコンストラクト1322を、例えばウラシル含有プライマーを用いるPCRによって増幅することができる。あるいは、次に、ライブラリーコンストラクト1322をプロセス1309において環状化してもよく、その場合は(例えば図14のステップ1421において)CDAを行うことができる。本明細書で論じるプロセスを図13に示すニックトランスレーションタイプのプロセスと組み合わせることで、ライブラリーコンストラクト中に先に挿入された任意のアダプターに対して、それ以後に付加されるアダプターの相対的位置と相対的向きの両方を選択することが可能になる。
ニックトランスレーションタイプの手法を利用するには、上で議論したように、ターゲット核酸および/またはアダプターの末端の一方または両方を修飾することは有益でありうる。ある例示的実施形態では、アダプターアームの5'末端だけがターゲット核酸の3'末端だけへのライゲーションに利用可能であるように、ターゲット核酸の3'末端にライゲートしようとするアダプターの第1アームは、その3'末端がブロックされるようにデザインすることができる。同様に、第2アームの3'末端だけがターゲット核酸の5'末端にライゲートすることができるように、ターゲット核酸の5'末端にライゲートしようとする第2アームは、その5'末端がブロックされるようにデザインすることができる。アダプターアームおよび/またはターゲット核酸の一端をブロックするための方法は、当技術分野ではよく知られている。例えば、ターゲット核酸(本明細書では「核酸インサート」または「DNAインサート」または「インサート」ともいう)を、上述のように、所定の機能的末端を生成し、3'末端と5'末端の両方からホスフェートを除去する酵素で処理する。全てのホスフェート基を除去することにより、ターゲット核酸分子は互いにライゲートすることができなくなる。この実施形態におけるアダプターは、ライゲートすることができる1本の鎖(例えば5'ホスフェート基を生成または維持することによる)と、ライゲーションから保護された3'末端を持つ相補鎖とを持つようにもデザインされる。一般に、3'末端のこの保護は、ジデオキシヌクレオチドを使って3'末端を不活化することによって達成される。したがって、修飾ターゲット核酸が両端のホスフェート基を欠き、修飾アダプターが一方の5'末端にのみホスフェート基を含み、相補鎖上には3'ブロック(例えばジデオキシ)を持つ場合、形成されるであろう唯一のライゲーション産物は、ターゲット核酸がホスフェート基を持つアダプターの5'末端にライゲートしたものである。このライゲーションステップに続いて、アダプターの保護された3'末端を、機能的3'末端を含む鎖と交換することができる。この交換は、一般的には、3'保護を持つ鎖が一般に短く容易に変性するという事実を利用して達成される。機能的な3'末端を持つ交換鎖は、より長く、それゆえにより効率よく相補鎖に結合するだろう。また、さらなる実施形態では、機能的末端を持つ鎖による保護された鎖の交換に向かう反応がさらに促されるように、機能的な末端を持つ鎖が、より高濃度で添加される。次に、機能的な3'末端を持つこの鎖を、ポリメラーゼがターゲット核酸の5'末端からエキソヌクレアーゼ的に塩基を除去することによって機能的な5'ホスフェートが露出するように、ニックトランスレーション活性を持つDNAポリメラーゼを添加することによってプライミングする。この新たに生成した5'ホスフェートは、リガーゼによって伸長産物にライゲートさせることができる。(伸長反応中にリガーゼが存在しない場合は、2つのポリメラーゼ分子が、ターゲット核酸の各末端から、それらが互いに出会って、切断された分子をもたらすまで、ニックトランスレートすることになる)。例えば、図2に図解するように、ターゲット核酸(インサート)をまず末端修復して、所定の機能的末端、好ましくは平滑末端を形成させる。次に、インサートのコンカテマー化を避けるために、5'末端ホスフェートを除去する。次に、インサートをDNAリガーゼおよびDNAアダプターと混合する。このDNAアダプターは2つのオリゴヌクレオチドを含有し、それら2つのオリゴヌクレオチドが一つにハイブリダイズした場合に、1つの平滑末端と、1つの粘着末端とを持つ。平滑末端側は、保護/不活化された3'末端を持つ1本の「トップ鎖(top-strand)」と、機能的な5'末端ホスフェートを持つ1本の「ボトム鎖」とを含有するので、やはり自己ライゲートすることはできない。したがって、唯一可能なライゲーションの組合せは、各末端に平滑末端ライゲーションされた1本の「ボトム鎖」を持つ1つのインサートである。次に、3'末端保護を持つ「トップ鎖」を、ポリメラーゼ伸長反応においてプライマーとして作用することができる機能的な3'末端を含有するオリゴヌクレオチドと交換する。ポリメラーゼおよびリガーゼを添加すると、第2のオリゴヌクレオチドがニックトランスレーションおよびライゲーション反応によって作り込まれる。ポリメラーゼは、インサート内に伸長していく時に、DNAリガーゼによって認識され、シールされうる、機能的な5'末端を持つニックを導入する。その結果得られる、各鎖の両側にアダプターまたはアダプターアームを持つインサートを、ここで、アダプターに特異的なプライマーを用いるPCRに付すことができる。
一般に、上述のようなニックトランスレーション反応では、活性なリガーゼが、混合物中に存在するか、ポリメラーゼの添加前に、またはポリメラーゼの添加と同時に添加される。いくつかの実施形態では、低活性ポリメラーゼ(遅いニックトランスレーション)条件を使用することが有益でありうる。ポリメラーゼの前またはポリメラーゼと同時にリガーゼを添加することも、低活性条件も、トランスレートしているニックが、DNAフラグメントの反対の末端に到達する前にシールされることを保証するのに役立ちうる。いくつかの実施形態では、TaqポリメラーゼをT4リガーゼと共に37℃(通常は低いポリメラーゼ活性と高いリガーゼ活性をもたらすであろう温度)でインキュベートすることによって、これを達成することができる。次に、ニックトランスレーション-ライゲーションがその反応中の大半/全てのコンストラクトで完全に起こることをさらに保証するために、より高い温度(例えば50〜60℃)でさらにインキュベートしてもよい。
さらなる実施形態において、本発明は、複数の散在アダプターを含む核酸テンプレートコンストラクトを形成させるための方法を提供する。本発明の方法は、後続の各アダプターが先に付加された1つ以上のアダプターに対して所定の位置に挿入されるように、複数のアダプターを挿入する方法を含む。当技術分野では、例えば米国特許出願第60/992,485号;同第61/026,337号;同第61/035,914号;同第61/061,134号;同第61/116,193号;同第61/102,586号;同第12/265,593号;同第12/266,385号;同第11/679,124号;同第11/981,761号;同第11/981,661号;同第11/981,605号;同第11/981,793号および同第11/981,804号(これらはそれぞれ、あらゆる目的で、特に複数の散在アダプターを含む核酸テンプレートを作製するための方法および組成物ならびにそのような核酸テンプレートを使用するための全ての方法に関する全ての教示内容について、引用によりその全てが本明細書に組み込まれる)で議論されているように、複数の散在アダプターを挿入する一定の方法が知られている。連続するターゲット配列が複数の散在アダプターで中断されるような形で、既知のアダプター配列をターゲット配列中に挿入すると、各アダプターの「上流」と「下流」の両方を配列決定することができるようになり、したがって各核酸テンプレートから生成させることができる配列情報の量が増加する。本発明は、先に付加された1つ以上のアダプターに対して所定の位置に後続の各アダプターを挿入するためのさらなる方法を提供する。
ニックトランスレーション・ライゲーションは通常、第1鎖をライゲートした後に、少なくともポリメラーゼを反応に添加することによって行われる。いくつかの実施形態では、全てのコンポーネントを一度に添加することによって、ニックトランスレーション反応を1段階反応として行うことができ、いくつかの実施形態では、反応の各ステップが逐次的に行われる。ニックトランスレーション反応の「1段階」アプローチには考えられる実施形態が複数ある。例えば、プライマーとの単一の混合物を使用することができ、反応の開始時に、Taqがそこに添加される。耐熱性リガーゼの使用により、単に温度を上昇させるだけで、プライマー交換およびニックトランスレーション・ライゲーション(および必要であればPCR)を行うことが可能になる。もう一つの例示的実施形態では、反応混合物が、3'ブロック鎖を活性化する弱い3'エキソヌクレアーゼを持つ最小限の濃度の非プロセッシブニックトランスレートポリメラーゼを含有するだろう。
さらにもう一つの実施形態では、T4ポリヌクレオチドキナーゼ(PNK)またはアルカリホスファターゼを使ってアダプターおよび/またはターゲット核酸の3'末端を改変することにより、それらをニックトランスレーションプロセスに備えさせる。例えば環状化反応の一部としてアダプターを挿入することができる。末端修復しアルカリホスファターゼ処理したターゲット核酸は、アダプターにライゲートされ、この例示的実施形態では、自己相補的ヘアピン状ユニットを形成するようにデザインされる(図16)。これらのヘアピンは、酵素または化学物質によって認識され切断されうる修飾を所与の位置に含有するようにデザインされる。例えばヘアピンがデオキシウリジンを含有する場合、そのデオキシウリジンを、UDG/EndoVIIIによって認識し、切断することができる。切断後、それら2つのヘアピンは、それぞれの3末端にホスフェートを持つ一本鎖になる。次に、これらの3'ホスフェートをT4ポリヌクレオチドキナーゼ(PNK)またはアルカリホスファターゼ((SAP)で除去することにより、本明細書においてさらに説明するニックトランスレーション法が可能になる。図4Aに図解するような例示的実施形態の一つでは、2つのヘアピンが、互いに部分的に相補的であるようにデザインされ、したがって分子内ハイブリダイゼーションによって、環状化された分子を形成することができる。最後に、環状化された分子をニックトランスレーションプロセスに付す。このプロセスでは、ポリメラーゼがインサート中に伸長して機能的5'末端ホスフェートを持つニックを導入し、そのニックはDNAリガーゼによって認識され、シールされうる。
上述のようにヘアピンを使用する代わりに、互いに部分的に相補的な1対の二本鎖アダプターを環状化に使用することもできる。あるペアは、UDG/EndoVIIIによって認識され切断されうるデオキシウリジンを一方の鎖上に持つ。一方の鎖にニックを入れる他の方法、例えば限定するわけではないが、ニッキング酵素、エンドヌクレアーゼ酵素によって認識されうるイノシン修飾DNAの組み込み、およびRNA-エンドヌクレアーゼによって認識されうるRNA修飾を持つDNAの組み込みなども使用することができる。ターゲット核酸およびアダプターは、上述のように、例えばターゲット核酸をアルカリホスファターゼで処理して他のターゲット核酸にライゲートすることができない平滑末端を生成させることなどにより、制御されたライゲーションに備えさせることができる。環状化は、ターゲット核酸にライゲートされた鎖からアダプター中の3'保護鎖を変性させて取り除き、ターゲット核酸インサートの各末端に2つの部分的に相補的な一本鎖末端を残すことによって活性化される。次に、それらの末端を分子内ハイブリダイゼーションによって接合し、ニックトランスレーションおよびライゲーションに付して、共有結合によって閉じたサークルを形成させる。次に、そのサークルをUDG/EndoVIIIで処理して、サークルを次のアダプターの指向的挿入に備えさせる。
図15に図解するさらにもう一つの実施形態では、5'ホスフェートを除去するために、線状ターゲット核酸をシュリンプアルカリホスファターゼ(SAP)で処理する。次に、ターゲット核酸をアダプターの一方のアーム(アームA)(これは、5'ホスフェートを持つ鎖と、保護された3'末端を持つ相補的な、より短い鎖とを含有する)にライゲートする。次に、ライゲーション産物をニックトランスレーションに付す。環状化反応において生成するニックは、第1アダプターのトップ鎖上に位置し、ニックトランスレーション反応において使用するポリメラーゼのためのプライマーとして作用する。ポリメラーゼはアダプター-インサート接合部のニックまでトップ鎖を伸長させ、アダプターAアームの一方を遊離させ、平滑末端またはAもしくはGオーバーハングを生成させる。次に、その結果得られたポリメラーゼ生成インサート末端を、第2アダプターアーム(アームB)にライゲートする。環状化反応においてニックが生成するように第1アダプターをデザインすることにより、後続のアダプターを予め決められた向きで付加することができる。この戦略は、あらゆるタイプIIs制限酵素または他の酵素的もしくは非酵素的フラグメント化方法に、それらが生成させる消化産物が平滑末端を持つか、3'オーバーハングを持つか、5'オーバーハングを持つかとは関わりなく、応用することができる。以後のプライマー交換、伸長、ライゲーション、およびPCRは、図2に記載したものと同様である。ブロックされたオリゴヌクレオチドを融解除去した後、ニックトランスレーション・ライゲーション反応を経てDNA環状化を行うことを含む、増幅なしのオプションを使って、サークルを閉じることもできる。
本明細書に記載するニックトランスレーションおよび鎖置換を伴う鎖合成プロセスでは、校正活性を持つポリメラーゼ(3'-5'エキソヌクレアーゼ活性を持つもの)、例えばPfuポリメラーゼ、および校正活性を持たないポリメラーゼ(3'-5'エキソヌクレアーゼ活性を欠くもの)を使用することができる。校正活性を持つポリメラーゼは、ニックトランスレーションプロセスにおいて平滑末端を効率よく生成させることができるが、保護されていない3'オーバーハングも分解するという欠点がある。したがって、結果として得られるニックトランスレーション産物は2つの平滑末端を持つことになり、それゆえに、後続のアダプターを所定の向きでライゲートすることはできないだろう。一つの解決策は、ライゲートされるアダプター(例えば図15のアームA)の3'末端を、例えばジデオキシリボヌクレオシド三リン酸(ddNTP)を3'末端に使用することなどによって、分解から保護することである。しかし、ddNTP保護は、3'末端をその後の伸長からも保護するので、そのアダプターが直接環状化手順に持ち越されることを制限する。もう一つの潜在的解決策は、ニックトランスレーション環状化に先だって(例えばアルカリホスファターゼを使って)除去することができる3'末端の修飾(例えば3'ホスフェート)を使って、3'末端をポリメラーゼ分解から保護することである。もう一つのアプローチは、(図16に記載するような)ヘアピン状のアダプターを、ニックトランスレーション反応において、校正活性を持つポリメラーゼと組み合わせて使用することである。これらのアダプターは分解から保護されるが、余分なUDG/EndoVIIIステップを必要とするという欠点がある。さらにまた、本発明者らは、校正活性を持つポリメラーゼの一つであるPfuポリメラーゼが、保護されていない3'オーバーハングを分解することなく、効率よく平滑末端を生成できることを見いだした(これは低い3'-5'エキソヌクレアーゼ活性を示す)。
校正活性を持たないポリメラーゼ、例えばTaqポリメラーゼは、ニックトランスレーションプロセスにおいて、平滑末端と一塩基オーバーハングの両方を生成させることができる(Taqは平滑末端に加えてテンプレート非依存的なA-およびG-テールも生成することができる)。ニックトランスレーションプロセスにおいて3'-5'エキソヌクレアーゼ活性を持たないポリメラーゼを使用することの利点は、保護されていない3'オーバーハングが無傷のまま残ることである。これにより、3'オーバーハングを分解から保護しなくても、後続のアダプターを所定の向きでライゲートすることが可能になる。多くの校正活性を持つポリメラーゼの潜在的欠点は、それらがテンプレート非依存的プロセスで3'末端に単一のヌクレオチドを付加する機能を持つことである。このプロセスは制御することが難しく、しばしば3'末端の混成集団を生成することになり、それが低いアダプター-インサートライゲーション収率をもたらす。一般に、平滑末端ライゲーションを利用する方法は、一塩基オーバーハングライゲーションよりも効率がよい。
ある実施形態では、第1アダプターのライゲーション後に、サークルを形成させてから、第1アダプター中に認識部位を持つタイプIIsエンドヌクレアーゼで切断するのではなく(これは、本発明の核酸テンプレートを作製するいくつかの実施形態、例えば図6および9に模式的に図解する実施形態におけるステップである)、ニックトランスレーション法の変法を使って、第2アダプターを付加することができる。この変法の例示的実施形態を図17に模式的に図解する。一般に、これらの実施形態は、上に詳述し、図6および9に図解したように、ターゲット核酸への第1アダプターの付加と、それに続く環状化で始まる。図17Aに図解する実施形態では、5'-3'エキソヌクレアーゼ活性を持つポリメラーゼ(例えばTaqポリメラーゼ)を使ってニックトランスレーションが行われ、これが、ターゲット核酸の内部に位置する第1アダプターを持つ逆位したサークル(inverted circle)を生成させる。次に、この産物を末端修復し、アダプター2へのライゲーション(上に詳述した方法を使用する)に付すことができる。この実施形態の一つの欠点は、ターゲット核酸が、シーケンシング応用に要求される長さよりも長くなりうることであり、そのような長いテンプレートは、そのテンプレートから生成する核酸コンカテマー産物において二次構造を生成しやすくなるかもしれない(本発明の核酸テンプレートからのコンカテマーの生成については以下にもっと詳しく議論する)。そのような二次構造は、これらのコンカテマーをシーケンシング応用、例えば後述するcPALなどに使用した場合に、シグナルの低下をもたらしうる。この欠点を克服する一つの方法は、ターゲット核酸を短縮することであり、そのアプローチの例示的実施形態の一つを図17Bに図示する。この実施形態では、第1アダプターを、本明細書に記載する方法を使って、ウラシルで修飾する。第1アダプターを含むサークルのニックトランスレーション-逆位に続いて、アダプターCアームを、末端修復した分子の両末端に付加する。ウラシル修飾アダプター1をウラシルが除去されるように処理してギャップを生成させると共に、活性化された3'末端が生じるように処理する。一般的には、UDG/EndoVIII酵素混合物の適用によってウラシルを除去し、PNKおよび/またはアルカリホスファターゼを使って、3'ホスフェートを除去し、活性化された3'末端を生じさせる。アダプター1の活性化された3'末端およびアダプターアームCの3'末端は、ニックトランスレーションポリメラーゼ(すなわち5'-3'エキソヌクレアーゼ活性を持つポリメラーゼ)によって認識されて、元の長さの約半分にトリミングされたターゲット核酸によって挟まれたアダプター1を持つ産物をもたらす。アダプター1が追加のニッキング修飾(限定するわけではないが、イノシンの組み込み、RNA修飾などを含む)で修飾されるのであれば、このポリメラーゼ切断手順を繰り返して、ターゲット核酸のサイズをさらに減少させることができる。
さらにもう一つの実施形態では、図17Cに図解するように、図17AおよびBに図解するニックトランスレーション法を拡張して、複数のアダプターを挿入することもできる。アダプターを修飾することにより、複数のアダプターから同時にニックトランスレーション反応をプライミングするために、ニックまたはギャップおよび機能的3'末端を生成させることができる。図17Cに図解するように、ターゲット核酸と2つのアダプター(それぞれ一方の鎖にウラシル修飾を含んでいるもの)とを含む核酸コンストラクトを環状化する。次に、サークルをUDG/EndoVIIIなどの酵素混合物で処理して、ウラシルを除去し、ギャップを導入する。これらのギャップを同時にニックトランスレートしてサークルを逆位(invert)させることで、そのコンストラクトを追加アダプターへのライゲーションに利用できるようにすることができる。同じアダプター上に複数の修飾を付加することにより、後続のニッキング/ギャップ形成およびニックトランスレーション-逆位を行って、複数のアダプターを導入することができる。いくつかの実施形態では、アダプター内の同じ位置にウラシルを付加し直して、そのアダプターをさらなるニックトランスレーション反応に適したものにすることができる。ウラシルは、例えば、アダプター中の修飾を「構築し直す(build back)」ためだけにニックトランスレーション反応をウラシルと共にインキュベートした後、より高濃度の非修飾ヌクレオチドを添加して、コンストラクトの残りを埋めることなどによって、付加し直すことができる。
図17Dに図解するさらにもう一つの実施形態では、ニックトランスレーション酵素の速度を制御することによって、ターゲット核酸をトリミングすることができる。例えば、ニックトランスレーション酵素は、温度を変えるか試薬類を制限することによって遅くすることができ、それは、ニックトランスレーションプロセスを使ってアダプター中の最初の部位からシフトさせた2つのニックが環状化されたインサート中に導入されるという結果をもたらしうる。同様に、鎖置換ポリメラーゼ(例えばphi29)の使用は、ニックをシフトさせることになり、置換された核酸セグメントにより、分岐点を生成させる。これらのニックまたは分岐点は、ニックの反対鎖を切断して線状産物をもたらすさまざまな酵素(限定するわけではないが、S1エンドヌクレアーゼ、Bal31、T7エンドヌクレアーゼ、マングビーンエンドヌクレアーゼ、ならびにT7エキソヌクレアーゼなどの5'→3'エキソヌクレアーゼとS1またはマングビーンエンドヌクレアーゼなどの酵素の組合せ)によって認識されうる。次に、その産物を(必要であれば)末端修復し、次のアダプターにライゲートすることができる。残存するターゲット核酸のサイズは、ニックトランスレーション反応の速度によって、ここでも、例えばdNTP類などの試薬類の濃度を低下させるか、反応を至適温度未満の温度で行うことなどによって、制御されることになる。ターゲット核酸のサイズは、ニックトランスレーション反応のインキュベーション時間によって制御することもできる。
さらにもう一つの実施形態では、ニックトランスレーション法を使って、環状化ステップを経ることなく核酸テンプレートを形成させることができる。そのような方法の例示的実施形態を、図18に図解する。この図では、ヘアピンのような形状をした第1アダプター1801が、ターゲット核酸1802に、上述のライゲーション法を使って、例えばターゲット核酸をシュリンプアルカリホスファターゼで処理してホスフェート基を除去し、それによって第1アダプターへのライゲーションに利用できるターゲット核酸の末端を制御することなどにより、ライゲートされることを示している。第1アダプターのライゲーション後に、制御された二本鎖特異的5'-3'エキソヌクレアーゼ反応を行って、一本鎖3'末端を生成させる。いくつかの実施形態では、T7エキソヌクレアーゼを使ってエキソヌクレアーゼ反応が行われるが、本発明のこの実施形態では他の二本鎖特異的エキソヌクレアーゼも使用できることは理解されるだろう。さらなる実施形態では、エキソヌクレアーゼ反応により、約100〜3000塩基長の一本鎖3'末端が生成する。さらなる実施形態では、エキソヌクレアーゼ反応により、約150〜約2500、約200〜約2000、約250〜約1500、約300〜約1000、約350〜約900、約400〜約800、約450〜約700、および約500〜約600塩基長の一本鎖3'末端が生成する。
本明細書に記載するニックトランスレーションプロセスを、本明細書に記載する他の任意のアダプター付加方法と組み合わせて使用できることは、理解されるだろう。例えば、上で説明し図11Aに模式的に図解したアーム-バイ-アームライゲーションプロセスを、ニックトランスレーションプロセスと組み合わせて使用することにより、PCR増幅用のコンストラクトを調製することができる。
さらにもう一つの実施形態では、PCRを行わずに直接環状化した後、ニックトランスレーション・ライゲーションを行ってサークルをシールするために、アーム-バイ-アームライゲーション反応で使用されるアダプターアームAをデザインすることができる。例示的一実施形態では、直接環状化のために、アダプターアームAを、図11Bに図示するようにデザインすることができる。セグメント1101は、アダプターアームBと相補的になるようにデザインされる。図11Bのコンストラクトでは、鎖置換ポリメラーゼ(例えばphi29)により、ブロックされた末端を除去するためのプライマー交換を必要とすることなく、直接プライマー伸長することが可能である(ポリメラーゼがセグメント1102の3'ホスフェートを通り越して伸長することはないだろう)。このコンストラクトは環状化のための3'オーバーハングも与える。セグメント1102は、環状化前にアダプターアームAがアダプターアームBにハイブリダイズすることを防止する。いくつかの実施形態では、セグメント1102がアームBへのハイブリダイゼーションを防止するために必要でない場合(例えばアダプターアームBが極めて高濃度で与えられる場合)や、セグメント1102がアダプターアームAではなくアダプターアームBのデザインの一部であることもありうる。
一本鎖3'末端を生成させた後、第2アダプター1803をターゲット核酸の一本鎖3'末端にハイブリダイズさせ、ニックトランスレーション・ライゲーション反応によって第1アダプターにつなぐ(ある実施形態ではニックトランスレーション・ライゲーションが「プライマー伸長」または「ギャップ・フィル-イン」反応である)。第2アダプターは5'ホスフェートと3'ブロック(垂直線1804で示されている)とを持つ。3'ブロックは、いくつかの実施形態では、3'ホスフェート(これは、いくつかの例示的実施形態では、ポリヌクレオチドキナーゼ(PNK)および/またはシュリンプアルカリホスファターゼを使って除去することができる)などの除去可能なブロックであることができる。第2アダプターは、いくつかの実施形態では、3'および/または5'末端に縮重した塩基を持ちうる。いくつかの例示的実施形態では、第2アダプターが、約2〜6個の縮重した塩基を5'末端に持ち、4〜9個の縮重した塩基を3'末端に持つが、第2アダプターの一端または両端にある縮重した塩基の数はどの組合せでも本発明に包含されることは理解されるだろう。図18に図示する実施形態では、第2アダプターが5'末端に3個の縮重塩基(「N3」)を含み、その3'末端に7個の縮重塩基(「N7」)を含む。第2アダプターへの第1アダプターの接合は、いくつかの実施形態では、ターゲット核酸へのアダプターのハイブリダイゼーションが有利になるような反応条件下で達成しうる。いくつかの例示的実施形態では、そのような反応条件が約20〜約40℃の温度を含みうる。そのような反応条件下で使用することができるポリメラーゼには、phi29、クレノウ、T4ポリメラーゼおよびPol Iが含まれるが、これらに限るわけではない。
次に、ライゲーション産物1805を変性させかつ/または5'-3'エキソヌクレアーゼでさらに加工した後、再アニーリングステップにより、2つの一本鎖核酸分子(図18では「×2」で表す)を形成させる。再アニーリング中に、第2アダプターのN7部分は、最初のハイブリダイゼーション配列モチーフからランダムな距離にあるセグメントにハイブリダイズすることにより、一本鎖ループ1806を形成しうる。いくつかの実施形態では、変性によって核酸1807の長い一本鎖領域が生じるまで、第2アダプターのN7末端がハイブリダイズしないだろう。2つの捕捉されたゲノムセグメント(一般的には約20〜約200塩基長)間の平均距離は、多くの実施形態では、約0.5〜約20キロベースになる。この平均距離は、一つには、アダプターの縮重塩基(「N」)の数およびハイブリダイゼーション条件のストリンジェンシーに依存するだろう。次に、再アニーリングステップに続いて、アダプターハイブリダイゼーションおよびニックトランスレーション・ライゲーションを、さらにもう1回行うことができる。最後のアダプター(図18では、最後のアダプターが第3アダプター1808として図示されているが、最後のアダプターが本明細書に記載する方法のいずれかによって挿入される第4、第5、第6、第7またはそれ以上のアダプターでありうることは、理解されるだろう)は第2アダプターに似ているが、多くの実施形態では、3'末端の縮重塩基を欠くだろう。さらなる実施形態では、最後のアダプターが増幅反応用プライマー(例えばPCRプライマー)のための結合部位を含みうる。
さらなる実施形態では、PCR反応などの増幅反応(図18の1809参照)を、例えば最初のアダプターと最後のアダプターに含まれるプライマー結合部位を使うことによって行うことができる。さらなる実施形態において、最初のアダプターと最後のアダプターは同じアダプターの2つのアームであることができ、最後のアダプターの付加に先だって、2つ以上のアダプターを挿入することができる。さらにもう一つの実施形態では、増幅産物を使って、本明細書に記載する任意のプロセスまたは当技術分野で知られる任意のプロセスを使ってさらなるアダプターを挿入するための環状二本鎖核酸分子を形成させることができる。
IVD(iii).後続のアダプターの制御された挿入:制限エンドヌクレアーゼ認識部位の保護
上述のようにターゲット核酸中に挿入されるアダプターの向きを制御することに加えて、複数のアダプターを、ターゲット核酸中の、先に挿入されたアダプターに対して指定された位置に、挿入することもできる。そのような方法には、一定の制限エンドヌクレアーゼ認識部位、特に先に挿入されたアダプターに含まれる認識部位が不活化から保護される実施形態が含まれる。後続のアダプターを所望の位置に所望の向きでライゲートするために、本発明は、タイプIIs制限エンドヌクレアーゼが、環状核酸コンストラクトの第1アダプター内の認識部位に結合し、次に第1アダプター外かつゲノムフラグメント(本明細書では「ターゲット核酸」ともいう)内の点を切断する方法を提供する。次に、第2アダプターを、切断が起こった点にライゲートすることができる(これは、ここでも、通常は、第2アダプターの2つのアダプターアームを付加することによって行われる)。ターゲット核酸を既知の位置で切断するには、その制限エンドヌクレアーゼが結合できる唯一の点が第1アダプター内にあり、したがってコンストラクトの望ましくない切断が回避されるように、ターゲット核酸中にランダムに含まれうる、その同じ酵素の他の認識部位をすべてブロックする必要がある。一般に、第1アダプター中の認識部位を、まず最初に不活化から保護し、次に、コンストラクト中の他の保護されていない認識部位を全て、一般的にはメチル化によって、不活化する。本明細書にいう制限エンドヌクレアーゼ認識部位の「不活化」とは、認識部位を、何らかの方法で、制限エンドヌクレアーゼによる結合にとって利用不可能にし、よってその酵素による切断という後続のステップを防止することを意味する。例えば、メチル化された認識部位は制限エンドヌクレアーゼを結合することができず、したがって切断は起こらないだろう。保護されていない核酸コンストラクト中の認識部位が全てメチル化されたら、アダプター内にある非メチル化認識部位だけが、酵素の結合と、その後の切断を許すことになる。認識部位を不活化する他の方法には、メチラーゼブロックを認識部位に適用すること、ブロッキングオリゴヌクレオチドを使って認識部位をブロックすること、他の何らかのブロッキング分子、例えばジンクフィンガータンパク質を使って認識部位をブロックすること、および認識部位にニックを入れてメチル化を防止することなどが含まれるが、これらに限るわけではない。所望の認識部位を保護するためのそのような方法は、米国特許出願第12/265,593号(2008年11月5日出願)および同第12/266,385号(2008年11月6日出願)に記載されており、これらはどちらも、あらゆる目的で、特にターゲット核酸への複数の散在アダプターの挿入に関する全ての教示内容について、引用によりその全てが本明細書に組み込まれる。
アダプターとターゲット核酸とを互いにライゲートする際の向きを制御するための上述の方法を、後から付加される各アダプターのスペーシングを制御するための後述の方法とも組み合わせて使用することもできることは理解されるだろう。
ある態様において、本発明は、二本鎖分子をメチル化することしかできないメチラーゼが、保護された認識部位をメチル化することができないように、第1アダプター中の認識部位を一本鎖にすることによって、第1アダプター中の認識部位を不活化から保護する方法を提供する。第1アダプター中の認識部位を一本鎖にする方法の一つは、2つの第1アダプターアームにライゲートされた線状ゲノムフラグメントを、ウラシルで修飾されたプライマーを使って、増幅することによる方法である。プライマーはアダプターアームに相補的であり、増幅(一般的にはPCRを使用)した時に結果として生じる線状コンストラクトが第1アダプターアームの一方の認識部位に埋め込まれたウラシルを含有するように、ウラシルで修飾される。これらのプライマーは、第1アダプターの第1および/または第2アーム中のタイプIIs制限エンドヌクレアーゼ認識部位の近くにウラシルを持つPCR産物を生成させる。ウラシルを消化すると、保護されるべきタイプIIs認識部位を含むアダプターアームの領域が一本鎖になる。次に、配列特異的メチラーゼを線状コンストラクトに適用すると、第1アダプターに含まれるものと同じエンドヌクレアーゼのための二本鎖認識部位の全てがメチル化されることになる。そのような配列特異的メチラーゼは、第1アダプターアーム中の一本鎖認識部位をメチル化することができないだろうから、第1アダプターアーム中の認識部位は、メチル化による不活化から保護されることになる。
ある場合には、以下により詳しく説明するように、同じアダプターから「上流」と「下流」の両方を切断することができるように、単一のアダプターが同じ認識部位を2つ持っていてもよい。この実施形態では、図7に図示するとおり、「上流」または「下流」認識部位のどちらか一方が選択的に、不活化から保護され、または不活化されるように、プライマーおよびウラシルの位置が適切に選択される。
第3アダプターは、第1アダプターの第2アーム中の認識部位(元々はメチル化によって不活化されていた認識部位)に結合する制限エンドヌクレアーゼで切断することにより、第1アダプターの反対側に挿入することができる。この認識部位を利用可能にするために、第1アダプター中の第2認識部位に相補的なウラシル修飾プライマーを使って環状コンストラクトを増幅することにより、第1アダプターが第2制限認識部位に埋め込まれたウラシルを含んでいる第3の線状コンストラクトを生成させる。そのウラシルを分解して第1アダプターを一本鎖にすると、それがアダプター中の認識部位をメチル化から保護することになる。次に、配列特異的メチラーゼを適用すると、保護されていない認識部位が全て不活化されることになる。環状化すると、第1アダプター中の認識部位が再構成され、制限エンドヌクレアーゼの適用により、そのサークルが切断されて、第3線状コンストラクト中に第3アダプターを挿入することができる位置が生じる。第3線状コンストラクトへの第3アダプターアームのライゲーションは、上述したものと同じ一般手法に従って行われるだろう。すなわち、第3線状コンストラクトにはAテールまたはGテールを付加し、第3アダプターアームにはTテールまたはCテールを付加して、アダプターアームが第3線状コンストラクトにアニールしてライゲートされうるようにする。次に、第3アダプターアームを含む線状コンストラクトを環状化して、第3環状コンストラクトを形成させる。第2アダプターと同様に、第3アダプターも一般的には、第1アダプターに含まれる認識部位とは異なる、制限エンドヌクレアーゼのための認識部位を含むだろう。
第4アダプターは、第2および第3アダプター中に認識部位を持つタイプIIs制限エンドヌクレアーゼを利用することによって付加することができる。これらの制限エンドヌクレアーゼによる切断は、第4の線状コンストラクトをもたらすことになり、次にそれを第4アダプターアームにライゲートすることができる。第4アダプターアームにライゲートされた第4線状コンストラクトの環状化により、本発明の核酸テンプレートコンストラクトが生成することになる。
一般に、本発明の方法は、コンストラクト中に残存する保護されていない認識部位を全て不活化した後は、タイプIIsエンドヌクレアーゼの適用によって、保護された部位にのみ結合が起こり、よって、そのコンストラクト中で以降の切断が起こる場所が制御されるように、タイプIIsエンドヌクレアーゼ認識部位を不活化から特異的に保護する手段を提供する。上述の方法は、所望の認識部位を不活化から保護する方法の一実施形態になる。当技術分野で知られる技法を使って上述の方法に変更を加えうること、およびそのような変更された方法も本発明に包含されることは、理解されるだろう。
ある例示的実施形態では、後から挿入される各アダプターが、複数の方法を併用して認識部位を不活化から保護する方法を使って、挿入される。図19は、ウラシル分解とニッカーゼの組合せを使ったメチル化とメチル化からの保護との組合せであるプロセスを使用することによって第2アダプターが第1アダプターに対して所望の位置に挿入される、実施形態の模式的図解である。図19は、1904にタイプIIs制限エンドヌクレアーゼ認識部位を持つ関心対象のゲノムDNA 1902を示している。ゲノムDNAはプロセス1905において分画またはフラグメント化されて、タイプIIs制限エンドヌクレアーゼ認識部位1904を持つフラグメント1906を与える。プロセス1907では、アダプターアーム1908および1910がフラグメント1906にライゲートされる。第1および第2アダプターアーム1908および1910を持つフラグメント1906(ライブラリーコンストラクト)は、プロセス1911において、PCRにより、アダプターアーム1908および1910に相補的なウラシル修飾プライマー1912を使って増幅される。これらのプライマーは、タイプIIs制限エンドヌクレアーゼ認識部位の近くにウラシルを持つPCR産物を生成させる。プロセス1913では、ウラシルが、例えばウラシル-DNAグリコシラーゼ酵素(Krokanら (1997) Biochem. J. 325:1-16)を使って特異的に分解され、タイプIIs制限エンドヌクレアーゼ認識部位領域中が一本鎖であるPCR産物が残る。図示するように、タイプIIs制限エンドヌクレアーゼ認識部位を一本鎖にするには、ウラシルの組み込みと分解を使用することができるが、本明細書でさらに説明するように、限定的消化における3'または5'エキソヌクレアーゼの使用などといった他の方法を使って、これらの領域を一本鎖にすることもできる。
プロセス1915では、配列特異的ニッカーゼを使って各二本鎖タイプIIs制限エンドヌクレアーゼ認識部位中の塩基にニックを入れることで、これらの部位をタイプIIs制限エンドヌクレアーゼ認識から保護する。しかし、第1および第2アダプターアーム1908および1910中の一本鎖タイプIIs制限エンドヌクレアーゼ認識部位部分はニックが形成されず、ひとたび環状化されライゲートされると1917、第1および第2アダプターアーム中のタイプIIs制限エンドヌクレアーゼ認識部位が再形成されて、このタイプIIs制限エンドヌクレアーゼ認識部位が制限切断に利用可能になる。このプロセスのためのニッカーゼおよびタイプIIs制限エンドヌクレアーゼを選択する際は、それら2つの酵素が同じ配列を認識すること、または一方の酵素が他方の酵素のサブ配列(配列内の配列)を認識することが好ましい。あるいは、ニッカーゼは異なる配列を認識してもよいが、タイプIIs制限エンドヌクレアーゼ認識部位中にニックを形成するように、アダプター内に配置される。ウラシルの使用または3'もしくは5'分解により、プロセス全体を通して1つのニッカーゼ酵素を使用することが可能になる。あるいは、2つ以上の配列特異的ニッカーゼを使用してもよい。次に、プロセス1919(ここでは、タイプIIs制限エンドヌクレアーゼ認識部位が1922で示されており、コンストラクトは1920で切断され、ニックは1918で示されている)では、環状化されたコンストラクトをタイプIIs制限エンドヌクレアーゼで切断することにより、プロセス1921においてコンストラクトに付加される第2のアダプターアームセットのライゲーションに利用することができる線状化されたコンストラクトが得られる。
ライゲーションプロセス1921では、第2アダプターの第1アダプターアーム1924および第2アダプターアーム1926が、線状化されたコンストラクトに付加され、プロセス1923では2回目の増幅がPCRにより、ここでもアダプターアーム1924および1926に相補的なウラシル修飾プライマー1928を使って行われる。先と同様に、プライマーは、タイプIIs制限エンドヌクレアーゼ認識部位の近くにウラシルを持つPCR産物を生成させる。プロセス1925では、ウラシルが特異的に分解されて、第2アダプターの第1および第2アダプターアーム1924および1926のタイプIIs制限エンドヌクレアーゼ認識部位領域中が一本鎖であるPCR産物が残る。ライゲーションプロセス1921は、ターゲット核酸フラグメント1906中のタイプIIs制限部位1904内のニック1918を修復する働きも持つ。プロセス1927では、再び配列特異的ニッカーゼを使って、ターゲット核酸フラグメント中の二本鎖タイプIIs制限エンドヌクレアーゼ認識部位内の塩基にニックを入れ(タイプIIs制限エンドヌクレアーゼ認識部位1904のニッキング1914が起こる)、第1アダプター1930のタイプIIs制限エンドヌクレアーゼ認識部位内の塩基にニックを入れて、これらの部位をタイプIIs制限エンドヌクレアーゼ認識から保護する。
次に、プロセス1929では、ニックが入ったコンストラクトを環状化してライゲートし(ここでは、第2アダプターの第1および第2アーム1924および1926中のタイプIIs制限エンドヌクレアーゼ認識部位が再形成1932される)、プロセス1931において、環状化されたコンストラクトをタイプIIs制限エンドヌクレアーゼで再び切断するプロセスを繰り返すことにより、コンストラクトへの第3のアダプターアーム対1936および1938のライゲーションに利用することができるもう一つの線状化コンストラクト(これには第1および第2アダプターが既に付加されている)を生成させる。タイプIIs制限エンドヌクレアーゼ認識部位は1922に示され、制限部位は1920に示され、ターゲット核酸フラグメント中のタイプIIs制限エンドヌクレアーゼ認識部位内のニックは1918に示され、第1アダプター中のニックは1934に示されている。このプロセスを繰り返して、所望するとおりの数のアダプターを付加することができる。この図では、最初に付加されたアダプターは1つのタイプIIs制限エンドヌクレアーゼ認識部位を持っていたが、別の態様では、コンストラクト用のターゲット核酸サイズを正確に選択することができるように、最初に付加されるアダプターが2つのタイプIIs制限エンドヌクレアーゼ認識部位を持っていてもよい。
ある態様では、アダプターは、タイプIIs制限エンドヌクレアーゼ認識部位を取り囲むかタイプIIs制限エンドヌクレアーゼ認識部位と部分的にオーバーラップする配列特異的ニッカーゼ部位を持つようにデザインすることができる。ニッカーゼを利用することにより、各アダプターのタイプIIs制限エンドヌクレアーゼ認識部位をメチル化から選択的に保護することができる。さらなる実施形態では、ニッカーゼが別の配列または部位を認識しうるが、タイプIIs制限エンドヌクレアーゼ認識部位を切断する。ニッカーゼは、二本鎖DNA中の特異的認識配列を認識し、認識配列に対して特異的な位置にある一方の鎖を切断することにより、二重鎖DNA中に一本鎖切断点を生じさせるエンドヌクレアーゼであり、限定するわけではないが、Nb.BsrDI、Nb.BsmI、Nt.BbvCI、Nb.Bbv.Nb.BtsIおよびNt.BstNBIなどが、これに含まれる。配列特異的ニッカーゼとタイプIIs制限エンドヌクレアーゼの組合せを使用することにより、ターゲット核酸中の全てのタイプIIs制限エンドヌクレアーゼ認識部位および先に挿入されたアダプター中のタイプIIs制限エンドヌクレアーゼ認識部位を、消化から保護することができる(もちろん、そのタイプIIs制限エンドヌクレアーゼはニック感受性である、すなわちニックが入れられた認識部位では結合しないと仮定する)。
図20は、第1アダプターに対する第2アダプターの所望の位置が、メチル化および配列特異的ニッカーゼを使って選択される、本発明の方法の実施形態の模式的表現である。図20は、2004にタイプIIs制限エンドヌクレアーゼ認識部位を持つ関心対象のゲノムDNA(ターゲット核酸)2002を示している。ゲノムDNAはプロセス2005において分画またはフラグメント化されて、タイプIIs制限エンドヌクレアーゼ認識部位2004を持つフラグメント2006を与える。プロセス2007ではアダプターアーム2008および2010をフラグメント2006にライゲートする。アダプターアーム2008および2010を持つフラグメント2006(ライブラリーコンストラクト)を、プロセス2009において環状化し、プロセス2011においてサークル依存的増幅法で増幅することにより、ターゲット核酸フラグメント2006(2004にタイプIIs制限エンドヌクレアーゼ認識部位を持つもの)と第1アダプター2012とが交互する高度に分岐したコンカテマーが得られる。
プロセス2013では、配列特異的ニッカーゼ2030を使って、ライブラリーコンストラクト中のアダプター内の特異的タイプIIs制限エンドヌクレアーゼ認識部位中またはその近傍の核酸にニックを入れることにより、これらの部位のメチル化をブロックする。ここでは、アダプターアーム2012および2014中のタイプIIs制限エンドヌクレアーゼ認識部位に、配列特異的ニッカーゼ2030によってニックを入れる。プロセス2015では、コンストラクト中のニックが入っていないタイプIIs制限エンドヌクレアーゼ認識部位をメチル化(ここではタイプIIs制限エンドヌクレアーゼ認識部位2004のメチル化2016が起こる)することにより、これらの部位をタイプIIs制限エンドヌクレアーゼ認識から保護する。しかし、アダプター2012および2014中のタイプIIs制限エンドヌクレアーゼ認識部位はニックが存在するのでメチル化されない。
プロセス2017では、ライブラリーコンストラクト中のニックが修復されて、アダプター2012中のタイプIIs制限エンドヌクレアーゼ認識部位は認識および制限切断2018に利用可能であり、かつゲノムフラグメント2004中のタイプIIs制限エンドヌクレアーゼ認識部位は利用可能でない、ライブラリーコンストラクトが得られる。次に、プロセス2021で、メチル化されたコンストラクトを第2のアダプターアーム対にライゲートし、環状化し、サークル依存的増幅法によって増幅することにより、ターゲット核酸フラグメント2006(2004にタイプIIs制限エンドヌクレアーゼ認識部位を持つもの)、第1アダプター2012および第2アダプター2020が交互するコンカテマーが得られる。次に、プロセス2023では、配列特異的ニッキングを、今度は、第2アダプター2020中のタイプIIs制限エンドヌクレアーゼ認識部位のメチル化はブロックするが、そのコンストラクト中の他のタイプIIs制限エンドヌクレアーゼ認識部位(すなわち、フラグメント中のタイプIIs制限エンドヌクレアーゼ認識部位2004および第1アダプター2012中のタイプIIs制限エンドヌクレアーゼ認識部位)のメチル化はブロックしないように、第2アダプター2020中の部位を認識する配列特異的ニッカーゼを使って、再び行う。次に、続いてメチル化2015を行い、所望であればさらなるアダプターアームを付加する。異なるアダプターのそれぞれには異なる配列特異的ニッカーゼ部位を使用して、このプロセスの全体を通して配列特異的なニッキングを可能にする。
図21は、第1アダプターに対する第2アダプターの所望の位置が、メチル化および配列特異的メチラーゼブロッカーを使って選択される、プロセスの模式的表現である。図21は、2214にタイプIIs制限エンドヌクレアーゼ認識部位を持つ関心対象のゲノムDNA(ターゲット核酸)2212を示している。ゲノムDNAはプロセス2105において分画またはフラグメント化されて、タイプIIs制限エンドヌクレアーゼ認識部位2104を持つフラグメント2106を与える。プロセス2107では、アダプターアーム2108および2110をフラグメント2106にライゲートする。アダプターアーム2108および2110を持つフラグメント2106(ライブラリーコンストラクト)を、プロセス2109において環状化し、プロセス2111においてサークル依存的増幅法で増幅することにより、ターゲット核酸フラグメント2106(2104にタイプIIs制限エンドヌクレアーゼ認識部位を持つもの)と第1アダプター2112とが交互する高度に分岐したコンカテマーが得られる。
プロセス2113では、配列特異的メチラーゼブロッカー2130、例えばジンクフィンガーを使って、ライブラリーコンストラクト中の特異的タイプIIs制限エンドヌクレアーゼ認識部位におけるメチル化をブロックする。ここでは、アダプターアーム2112および2114中のタイプIIs制限エンドヌクレアーゼ認識部位がメチラーゼブロッカー2130でブロックされる。このプロセスのためのメチラーゼブロッカーおよびタイプIIs制限エンドヌクレアーゼを選択する際は、それら2つの実体が同じ部位配列を認識する必要はなく、一方の実体が他の実体のサブ配列を認識する必要もない。ブロッカー配列はタイプIIs制限エンドヌクレアーゼ認識部位の上流にあっても下流にあってもよいが、メチラーゼブロッカーがその部位を(例えばジンクフィンガーまたは他の核酸結合タンパク質または他の実体で)ブロックするようなコンフィギュレーションを持つ。プロセス2115では、コンストラクト中の保護されていないタイプIIs制限エンドヌクレアーゼ認識部位をメチル化(ここではタイプIIs制限エンドヌクレアーゼ認識部位2104のメチル化2116)することにより、これらの部位をタイプIIs制限エンドヌクレアーゼ認識から保護する。しかし、アダプター2112および2114中のタイプIIs制限エンドヌクレアーゼ認識部位は、メチラーゼブロッカーが存在するのでメチル化されない。
プロセス2117では、メチラーゼブロッカーがライブラリーコンストラクトから放出されて、アダプター2112中のタイプIIs制限エンドヌクレアーゼ認識部位が認識および制限切断2118に利用可能であり、かつゲノムフラグメント2104中のタイプIIs制限エンドヌクレアーゼ認識部位が利用可能でない、ライブラリーコンストラクトが得られる。次に、プロセス2121で、メチル化されたコンストラクトを第2のアダプターアーム対にライゲートし、環状化し、サークル依存的増幅法によって増幅することにより、ターゲット核酸フラグメント2106(2104にタイプIIs制限エンドヌクレアーゼ認識部位を持つもの)、第1アダプター2112および第2アダプター2120が交互するコンカテマーが得られる。次に、プロセス2123では、メチラーゼブロッキングを、今度は、第2アダプター2120中のタイプIIs制限エンドヌクレアーゼ認識部位のメチル化はブロックするが、そのコンストラクト中の他のタイプIIs制限エンドヌクレアーゼ認識部位(すなわち、フラグメント中のタイプIIs制限エンドヌクレアーゼ認識部位2104および第1アダプター2112中のタイプIIs制限エンドヌクレアーゼ認識部位)のメチル化はブロックしないように、第2アダプター2120中の部位を認識するメチラーゼブロッカーを使って、再び行う。次に、続いてメチル化2115を行い、所望であればさらなるアダプターアームを付加する。異なるアダプターのそれぞれには異なるメチラーゼブロッカー部位を使用して、このプロセスの全体を通して配列特異的なメチラーゼブロッキングを可能にする。図9および図21は、第2アダプターの挿入を第1アダプターとの関連で示しているが、このプロセスは、第2アダプター以降のアダプターにも適用可能であって、4個、6個、8個、10個またはそれ以上のアダプターが挿入されているライブラリーコンストラクトが作製されることを理解すべきである。
図22は、第1アダプターに対する第2アダプターの所望の位置が、メチル化およびウラシル分解を使って選択される、プロセスの模式的図解である。図22は、2204にタイプIIs制限エンドヌクレアーゼ認識部位を持つ関心対象のゲノムDNA 2202を示している。ゲノムDNAはプロセス2205において分画またはフラグメント化されて、タイプIIs制限エンドヌクレアーゼ認識部位2204を持つフラグメント2206を与える。プロセス2207では、アダプターアーム2208および2210がフラグメント2206にライゲートされる。第1および第2アダプターアーム2208および2210を持つフラグメント2206は、プロセス2211において、PCRにより、アダプターアーム2208および2210に相補的なウラシル修飾プライマー2212を使って増幅される。これらのプライマーは、タイプIIs制限エンドヌクレアーゼ認識部位またはその近くにウラシルを持つPCR産物を生成させる。プロセス2213では、ウラシルが、例えばウラシル-DNAグリコシラーゼ酵素(Krokanら (1997) Biochem. J. 325:1-16)を使って特異的に分解され、タイプIIs制限エンドヌクレアーゼ認識部位領域中が一本鎖であるPCR産物が残る。図示するように、タイプIIs制限エンドヌクレアーゼ認識部位を一本鎖にするには、ウラシルの組み込みと分解を使用することができるが、本明細書でさらに説明するように、限定的消化における3'または5'エキソヌクレアーゼの使用などといった他の方法を使って、これらの領域を一本鎖にすることもできる。
プロセス2215では、配列特異的メチラーゼを使って各二本鎖タイプIIs制限エンドヌクレアーゼ認識部位中の塩基をメチル化する(ここでは、タイプIIs制限エンドヌクレアーゼ認識部位2204のメチル化2214が起こる)ことで、これらの部位をタイプIIs制限エンドヌクレアーゼ認識から保護する。しかし、第1および第2アダプターアーム2208および2210中の一本鎖タイプIIs制限エンドヌクレアーゼ認識部位はメチル化されず、ひとたび環状化されライゲートされると2217、タイプIIs制限エンドヌクレアーゼ認識部位が再形成されて2216、このタイプIIs制限エンドヌクレアーゼ認識部位が制限切断に利用可能になる。このプロセスのためのメチラーゼおよびタイプIIs制限エンドヌクレアーゼを選択する際は、それら2つの酵素が同じ配列を認識するか、一方の酵素が他方の酵素のサブ配列(配列内の配列)を認識することが必要である。次に、プロセス2219(ここでは、タイプIIs制限エンドヌクレアーゼ認識部位が2218に示されており、コンストラクトは2220で切断される)では、環状化されたコンストラクトをタイプIIs制限エンドヌクレアーゼで切断することにより、プロセス2221においてコンストラクトに付加される第2のアダプターアームセットのライゲーションに利用することができる線状化されたコンストラクトが得られる。
ライゲーションプロセス2221では、第1アダプターアーム2222および第2アダプターアーム2224が、線状化されたコンストラクトに付加され、プロセス2223では2回目の増幅がPCRにより、ここでもアダプターアーム2222および2224に相補的なウラシル修飾プライマー2226を使って行われる。先と同様に、プライマーは、タイプIIs制限エンドヌクレアーゼ認識部位の近くにウラシルを持つPCR産物を生成させる。プロセス2225では、ウラシルが特異的に分解されて、第2アダプターの第1および第2アダプターアーム2222および2224のタイプIIs制限エンドヌクレアーゼ認識部位領域中が一本鎖であるPCR産物が残る。プロセス2227では、再び配列特異的メチラーゼを使って、ターゲット核酸フラグメント中の二本鎖タイプIIs制限エンドヌクレアーゼ認識部位内の塩基をメチル化し(ここでも、タイプIIs制限エンドヌクレアーゼ認識部位2204のメチル化2214が起こる)、第1アダプター2228のタイプIIs制限エンドヌクレアーゼ認識部位内の塩基をメチル化して、これらの部位をタイプIIs制限エンドヌクレアーゼ認識から保護する。次に、プロセス2229では、メチル化されたコンストラクトを環状化し(ここでは、第2アダプターの第1および第2アーム2222および2224中のタイプIIs制限エンドヌクレアーゼ認識部位が再形成2230される)、プロセス2219において、環状化されたコンストラクトをタイプIIs制限エンドヌクレアーゼで再び切断するプロセスを繰り返すことにより、コンストラクトへの第3のアダプターアーム対のライゲーションに利用することができるもう一つの線状化コンストラクト(これには第1および第2アダプターが既に付加されている)を生成させる。このプロセスを繰り返して、所望するとおりの数のアダプターを付加することができる。この図では、最初に付加されたアダプターは1つのタイプIIs制限エンドヌクレアーゼ認識部位を持っていたが、別の態様では、コンストラクト用のターゲット核酸サイズを正確に選択することができるように、最初に付加されるアダプターが2つのタイプIIs制限エンドヌクレアーゼ認識部位を持っていてもよい。
複数の散在アダプターの制御された挿入のための上記の方法に加えて、コンストラクトの集団を、所望する向きのアダプターを含むものについて濃縮することにより、特定の向きのアダプターを含むコンストラクトを、さらに選択することができる。そのような濃縮方法は、米国特許出願第60/864,992号(出願日11/09/06);同第11/943,703号(出願日11/02/07);同第11/943,697号(出願日11/02/07);同第11/943,695号(出願日11/02/07);PCT/US07/835540(出願日11/02/07)に記載されており、これらは全て、あらゆる目的で、特に特定の向きのアダプターについて選択するための方法および組成物に関する教示内容の全てについて、引用によりその全てが本明細書に組み込まれる。
V.DNBの作製
ある態様では、本発明の核酸テンプレートを使って、核酸ナノボール(本明細書ではこれを「DNAナノボール」「DNB」および「アンプリコン」ともいう)を生成させる。これらの核酸ナノボールは、一般的には、本発明の核酸テンプレートのコピーを複数含むコンカテマーであるが、本発明の核酸ナノボールは、本明細書に記載する方法を使って任意の核酸分子から形成させることができる。
ある態様では、ローリングサークル複製(rolling circle replication:RCR)を使って、本発明のコンカテマーを生成させる。RCRプロセスはM13ゲノムの複数の連続コピーを生じさせることが示されている(Blanco,ら (1989) J Biol Chem 264:8935-8940)。そのような方法では、核酸が線状コンカテマー化によって複製される。RCR反応の条件および試薬を選択するための指針は、例えば米国特許第5,426,180号;同第5,854,033号;同第6,143,495号;および同第5,871,921号(これらは、あらゆる目的で、特にRCRまたは他の方法を使ってコンカテマーを生成させることに関する全ての教示内容について、引用によりその全てが本明細書に組み込まれる)など、当業者が入手することのできる数多くの参考文献に見いだすことができる。
一般に、RCR反応コンポーネントには、一本鎖DNAサークル、DNAサークルにアニールする1つ以上のプライマー、DNAサークルにアニールしたプライマーの3'末端を伸長するための鎖置換活性を持つDNAポリメラーゼ、ヌクレオシド三リン酸、および従来のポリメラーゼ反応バッファーが含まれる。そのようなコンポーネントを、プライマーがDNAサークルにアニールできるような条件下で混合する。DNAポリメラーゼによるこれらのプライマーの伸長は、DNAサークル相補体のコンカテマーを形成する。いくつかの実施形態では、本発明の核酸テンプレートが二本鎖サークルであり、これを、RCR反応で使用することができる一本鎖サークルを形成するように変性させる。
いくつかの実施形態では、考えうる全ての配列を含む混合物に由来する短いオリゴヌクレオチド(例えば6マー)の、またはサークルが合成物である場合には、サークル複製用の選択された配列を持つそれら短いオリゴヌクレオチドの限られた混合物の、連続的ライゲーションによって、環状核酸の増幅を実行することができ、これは「サークル依存的増幅」(circle dependent amplifiation:CDA)と呼ばれている。「サークル依存的増幅」または「CDA」とは、多重ハイブリダイゼーション、プライマー伸長および鎖置換事象のカスケードをもたらす、テンプレートの両方の鎖を表す産物を生成させるために、環状テンプレートの両方の鎖にアニールするプライマーを使用する、二本鎖環状テンプレートの多重置換増幅を指す。これは、プライマー部位の数の指数的増加につながり、その結果として、時間と共に生成される産物の量の指数的増加につながる。使用されるプライマーは、ランダムな配列を持つもの(例えばランダムヘキサマー)であるか、または所望の産物の増幅について選択するための特異的配列を持つことができる。CDAにより、結果として、コンカテマー二本鎖フラグメントのセットが形成されることになる。
コンカテマーは、ターゲット分子の最初と最後の両方に相補的な架橋(bridging)テンプレートDNAの存在下で行われるターゲットDNAのライゲーションによって生成させることもできる。異なるターゲットDNAの集団を、対応する架橋テンプレートの混合物により、コンカテマーに変換することができる。
いくつかの実施形態では、核酸テンプレートの集団のサブセットを、例えばアダプターの所望する数またはタイプなど、特定の特徴に基づいて単離することができる。この集団を、従来の技法を使って、例えば従来のスピンカラムなどを使って、単離するか、他の形で加工(例えばサイズ選択)することによって、ある集団を形成させ、そこからRCRなどの技法を使ってコンカテマーの集団を生成させることができる。
本発明のDNBを形成させるための方法は、特許出願公開番号WO2007120208、WO2006073504、WO2007133831、およびUS2007099208、ならびに米国特許出願第60/992,485号;同第61/026,337号;同第61/035,914号;同第61/061,134号;同第61/116,193号;同第61/102,586号;同第12/265,593号;同第12/266,385号;同第11/938,096号;同第11/981,804号;同第11/981,797号;同第11/981,793号;同第11/981,767号;同第11/981,761号;同第11/981,730号(2007年10月31日出願);同第11/981,685号;同第11/981,661号;同第11/981,607号;同第11/981,605号;同第11/927,388号;同第11/927,356号;同第11/679,124号;同第11/541,225号;同第10/547,214号;同第11/451,692号;および同第11/451,691号に記載されており、これらは全て、あらゆる目的で、特にDNBの形成に関する全ての教示内容について、引用によりその全てが本明細書に組み込まれる。
VI.DNBのアレイの作製
ある態様では、本発明のDNBを、ある面に配置して、単分子のランダムアレイを形成させる。DNBは、共有結合的取り付けおよび非共有結合的取り付けを含むさまざまな技法によって面に固定することができる。ある実施形態では、面が、ポリヌクレオチド分子のコンポーネント、例えばアダプターオリゴヌクレオチドとの複合体(例えば二本鎖デュプレックス)を形成する捕捉プローブを含みうる。別の実施形態では、捕捉プローブが、引用によりその全てが本明細書に組み込まれるGryaznovらの米国特許第5,473,060号に記載されているような、アダプターとの三重鎖を形成するオリゴヌクレオチドクランプ(clamp)などの構造を含みうる。
本発明のDNBのアレイを形成させるための方法は、特許出願公開番号WO2007120208、WO2006073504、WO2007133831、およびUS2007099208、ならびに米国特許出願第60/992,485号;同第61/026,337号;同第61/035,914号;同第61/061,134号;同第61/116,193号;同第61/102,586号;同第12/265,593号;同第12/266,385号;同第11/938,096号;同第11/981,804号;同第11/981,797号;同第11/981,793号;同第11/981,767号;同第11/981,761号;同第11/981,730号;同第11/981,685号;同第11/981,661号;同第11/981,607号;同第11/981,605号;同第11/927,388号;同第11/927,356号;同第11/679,124号;同第11/541,225号;同第10/547,214号;同第11/451,692号;および同第11/451,691号に記載されており、これらは全て、あらゆる目的で、特にDNBのアレイの形成に関する全ての教示内容について、引用によりその全てが本明細書に組み込まれる。
いくつかの実施形態では、面が、例えばマイクロアレイにcDNAを取り付けるために使用される技法(例えば引用により本明細書に組み込まれるSmirnovら (2004), Genes, Chromosomes & Cancer, 40: 72-77;Beaucage (2001) Current Medicinal Chemistry, 8:1213-1244)と同じ技法により、ポリヌクレオチド分子上の相補的官能基と反応して共有結合を形成する反応性官能基を持ちうる。DNBは、疎水面、例えば、-OH基などのさまざまな反応性官能基の濃度が低い清浄なガラス面に、効率よく取り付けることもできる。ポリヌクレオチド分子と面上の反応性官能基の間に形成される共有結合による取り付けを、本明細書では、「化学的取り付け(chemical attachment)」ともいう。
さらなる実施形態において、ポリヌクレオチド分子は面に吸着することができる。そのような実施形態では、ポリヌクレオチド分子が、面との非特異的相互作用によって、または例えば水素結合、ファンデルワールス力などの非共有結合的相互作用によって、固定化される。
取り付けは、不完全に取り付けられた単分子または先の準備ステップに由来して存在する他の試薬類であってその存在が望ましくないもの、または面に非特異的に結合されるものを除去するために、さまざまなストリンジェンシーの洗浄ステップも含みうる。
ある態様では、面上のDNBが、離散領域(discrete resion)の一区画に拘束される。離散領域は、当技術分野で知られ本明細書でもさらに説明する方法を使って、面に組み込むことができる。例示的実施形態では、離散領域が、ポリヌクレオチド分子を固定化するために使用することができる反応性官能基または捕捉プローブを含有する。
離散領域は、直線的パターン、六角形パターンなどに対応しうる規則的アレイの中で、所定の位置を持ちうる。そのような領域の規則的アレイは、解析中にそのアレイから集められるシグナルの検出およびデータ解析にとって有利である。また、離散領域の制限された区画に拘束された第1および/または第2ステージアンプリコンは、特に蛍光プローブを解析操作に使用する場合には、より濃縮されたまたはより強いシグナルを与え、それにより、より高い信号対雑音比値をもたらす。いくつかの実施形態では、所与の領域がどの異なる単分子を受容する可能性も同じになるように、DNBが、離散領域にランダムに分配される。言い換えると、結果として得られるアレイは、製作直後は位置的にアドレス可能(spatially addressable)ではないが、同定、シーケンシングおよび/または符号解読操作を行うことにより、位置的にアドレス可能にすることができる。したがって、面上に配置される本発明のポリヌクレオチド分子の実体(identity)は識別可能であるが、面上にそれらを配置した時点で、最初は不明である。いくつかの実施形態では、離散した区画が、本発明の単分子のサイズに対応して、単分子を面に適用した時に、実質的に全ての領域が、1個を超える単分子で占有されることがないように、取り付けのケミストリー、使用する高分子構造などと共に選択される。いくつかの実施形態では、DNBが、あるパターン化された形で離散領域を含む面に、特異的DNB(ある例示的実施形態では、タグアダプターまたは他のラベルによって同定されるもの)が、特異的離散領域または離散領域群に配置されるように、配置される。
いくつかの実施形態では、離散領域の区画が1μm2未満である。いくつかの実施形態では、離散領域の区画が0.04μm2〜1μm2の範囲にある。いくつかの実施形態では、離散領域の区画が0.2μm2〜1μm2の範囲にある。離散領域がほぼ円形または正方形であってそれらのサイズを単一の長さ寸法で示すことができる実施形態では、そのような領域のサイズが125nm〜250nmの範囲、または200nm〜500nmの範囲にある。いくつかの実施形態では、最近接離散領域の中心間距離が0.25μm〜20μmの範囲にあり、いくつかの実施形態では、そのような距離が1μm〜10μmの範囲、または50〜1000nmの範囲にある。一般に、離散領域は、面上の離散領域の大部分が光学的に解像可能であるようにデザインされる。いくつかの実施形態では、領域が所定の位置を持つような事実上任意のパターンで、領域を面上に配列することができる。
さらなる実施形態では、離散領域間の区間(本明細書では「領域間区間」という)が、コンカテマーまたは他の高分子構造物がそのような領域に結合しないという意味で不活性であるために、分子が面の離散領域に誘導される。いくつかの実施形態では、そのような領域間区間を、例えばコンカテマーDNAとは無関係なDNA、他のポリマーなどといったブロッキング剤で処理することができる。
多種多様な支持体を、本発明の組成物および方法と共に使用して、ランダムアレイを形成させることができる。ある態様では、照会されるべき単分子が同じ平面内にあるように、支持体がある面、好ましくは実質的に平坦な面を持つ硬質固体である。後者の特徴は、例えば検出用光学機器による効率のよいシグナル収集を可能にする。もう一つの態様では、支持体がビーズを含み、そのビーズの面は、ポリヌクレオチド分子を固定化するために使用することができる反応性官能基または捕捉プローブを含む。
さらにもう一つの態様において、特に単分子のランダムアレイを、要求される体積が小さいハイブリダイゼーション反応によって解析する場合に、本発明の固形支持体は非多孔性である。適切な固形支持体材料には、ガラス、ポリアクリルアミド被覆ガラス、セラミックス、シリカ、ケイ素、石英、さまざまなプラスチックなどの材料が含まれる。ある態様において、平坦な面の区画は0.5〜4cm2の範囲にあることができる。ある態様では、固形支持体が、均一にシラン化された面を持つガラスまたは石英、例えば顕微鏡スライドである。これは、従来のプロトコールを使って、例えば酸処理の後、80℃の、3-グリシドキシプロピルトリメトキシシラン、N,N-ジイソプロピルエチルアミン、および無水キシレン(8:1:24v/v)の溶液に浸漬すること(これによってエポキシシラン化面が形成される)などによって達成することができる(例えばBeattieら (1995), Molecular Biotechnology, 4:213)。そのような面は、捕捉オリゴヌクレオチドの末端取り付けが、例えば面への適用に先だって捕捉オリゴヌクレオチドに3'または5'トリエチレングリコールホスホリルスペーサー(前掲のBeattieら参照)を与えることなどによって可能になるように、容易に処理することができる。本発明で使用するための面を官能化し、さらに調製するためのさらなる実施形態は、例えば米国特許出願第60/992,485号;同第61/026,337号;同第61/035,914号;同第61/061,134号;同第61/116,193号;同第61/102,586号;同第12/265,593号;同第12/266,385号;同第11/938,096号;同第11/981,804号;同第11/981,797号;同第11/981,793号;同第11/981,767号;同第11/981,761号;同第11/981,730号;同第11/981,685号;同第11/981,661号;同第11/981,607号;同第11/981,605号;同第11/927,388号;同第11/927,356号;同第11/679,124号;同第11/541,225号;同第10/547,214号;同第11/451,692号;および同第11/451,691号に記載されており、これらはそれぞれ、あらゆる目的で、特にアレイを形成するための面の調製に関する全ての教示内容について、およびアレイの形成、特にDNBのアレイの形成に関する全ての教示について、引用によりその全てが本明細書に組み込まれる。
離散領域のパターンが要求される本発明の実施形態では、フォトリソグラフィー、電子線リソグラフィー、ナノインプリントリソグラフィー、およびナノプリンティングを使って、さまざまな面上にそのようなパターンを生成させることができる(例えばPirrungら, 米国特許第5,143,854号;Fodorら, 米国特許第5,774,305号;Guo (2004) Journal of Physics D: Applied Physics, 37:R123-141;これらは引用により本明細書に組み込まれる)。
ある態様では、複数の離散領域を含有する面がフォトリソグラフィーによって製作される。市販の光学的に平坦な石英基材に、厚さ100〜500nmのフォトレジストの層をスピンコートする。次に、フォトレジストを石英基材上にベークする。活性化させる領域のパターンを持つレチクルの像を、フォトレジストの面にステッパーを使って投影する。露光後に、フォトレジストを現像して、UV光源に露光された投影パターンの区画を除去する。これは、極めて微細な細部を作り出すことができる乾式現像技法であるプラズマエッチングによって達成される。次に、基材をベークして残存フォトレジストを強化する。ベーク後の石英ウェハは官能化の準備ができている。次に、そのウェハを、3-アミノプロピルジメチルエトキシシランの蒸着に付す。アミノ官能化モノマーの密度は、モノマー濃度および基材の曝露時間を変化させることにより、緻密に制御することができる。プラズマエッチングによって露出させた石英の区画だけが、モノマーと反応し、モノマーを捕捉することができる。次に、基材を再びベークして、アミノ官能化モノマーの単層を露出した石英に硬化させる。ベーク後は、アセトンを使って残存フォトレジストを除去することができる。レジストとシランとでは取り付けのケミストリーが異なるので、基材上のアミノシラン官能化区画は、アセトンリンスを行っても無傷のまま残りうる。これらの区画は、それらをピリジンおよびN-N-ジメチルホルムアミドの溶液中のp-フェニレンジイソチオシアネートと反応させることにより、さらに官能化することができる。その場合、基材はアミン修飾オリゴヌクレオチドと反応することができる。あるいは、5'-カルボキシ-モディファイヤー-c10(5'-carboxy-modifier-c10)リンカー(Glen Research)を使って、オリゴヌクレオチドを調製することができる。この技法により、オリゴヌクレオチドをアミン修飾支持体に直接取り付けることが可能になり、それにより、追加の官能化ステップを回避することができる。
もう一つの態様では、複数の離散領域を含有する面が、ナノインプリントリソグラフィー(NIL)によって製作される。DNAアレイ作製の場合は、石英基材に、一般にトランスファー層と呼ばれるレジストの層をスピンコートする。次に、一般にインプリント層と呼ばれる第2のタイプのレジストを、トランスファー層の上に塗布する。次に、マスターインプリントツールが、インプリント層に圧痕を作る。次に、インプリント層の総厚を、プラズマエッチングにより、インプリントの低区画がトランスファー層に達するまで、減少させる。トランスファー層は、インプリント層より除去しにくいので、ほとんど手付かずのまま残る。次に、インプリント層およびトランスファー層を加熱によって硬化させる。次に、基材を、インプリントの低区画が石英に達するまで、プラズマエッチャーに入れる。次に、基材を上述のように蒸着によって誘導体化する。
もう一つの態様では、複数の離散領域を含有する面が、ナノプリンティングによって製作される。このプロセスでは、フォトリソグラフィー、インプリントリソグラフィー、または電子線リソグラフィーを使って、プリントヘッド上に要求されるフィーチャーのネガ像であるマスターモールドを作製する。プリントヘッドは、通常、ポリジメチルシロキサン(PDMS)などの柔らかい可撓性ポリマーでできている。この材料、または異なる性質を持つ複数材料の層を、石英基材上にスピンコートする。次に、モールドを使って、レジスト材料のトップ層に、制御された温度および圧力条件下で、フィーチャーを型押しする。次に、そのプリントヘッドをプラズマベースのエッチングプロセスに付して、プリントヘッドのアスペクト比を改善し、型押しされた材料の経時的弛緩によるプリントヘッドの歪みを除去する。均一に誘導体化された面上にアミン修飾オリゴヌクレオチドのパターンを沈着させることにより、ナノプリンティングを使って、ランダムアレイ基材を作製する。これらのオリゴヌクレオチドは、RCR産物用の捕捉プローブとして役立つだろう。ナノプリンティングの潜在的利点の一つは、交互配置(interleave)された異なる捕捉プローブのパターンをランダムアレイ支持体上にプリントできることである。これは、それぞれのヘッドが異なるパターンを持ち、全てのパターンが組み合わされて最終構造の支持体パターンを形成する、複数のプリントヘッドを使った逐次プリントによって達成されるだろう。そのような方法により、ランダムアレイ内でのDNAエレメントの何らかの位置符号化(positional encoding)が可能になる。例えば、特異的配列を含有する対照コンカテマーを、ランダムアレイの全体にわたって規則的な間隔で結合させることができる。
さらにもう一つの態様では、コアおよび被覆材料を持つ約10,000〜1億本の光ファイバーの束または束の束から製造されたプリンティングヘッドまたはインプリントマスターを使って、サブミクロンサイズの捕捉オリゴヌクレオチドスポットの高密度アレイを製造する。ファイバーを牽引し融合させることにより、類似するサイズまたは2〜5分の1もしくは2〜5倍のサイズの被覆材料によって隔てられた約50〜1000nmのコアを持つユニークな材料が生成する。被覆材料のディファレンシャルエッチング(溶解)により、非常に数多くのナノサイズのポストを持つナノプリンティングヘッドが得られる。このプリンティングヘッドは、オリゴヌクレオチドまたは他の生物学的化合物(タンパク質、オリゴペプチド、DNA、アプタマー)もしくは化学的化合物(例えばさまざまな活性基を持つシラン)を沈着させるために使用することができる。ある実施形態では、このガラス繊維ツールを、パターン形成された支持体として使用して、オリゴヌクレオチドまたは他の生物学的もしくは化学的化合物を沈着させる。この場合は、エッチングによって作り出されたポストだけが、沈着させる材料と接触するだろう。また、溶融ファイバー束の平坦な切り口を使って、コアを通る光を誘導して、コアの先端面だけで光誘発性化学反応を起こらせることにより、エッチングの必要を排除することもできる。どちらの場合も、次に、同じ支持体を、オリゴヌクレオチドまたは他の反応物をタグ付けするために使用した蛍光ラベルをイメージングするための導光/集光装置として、使用することができる。この装置は、大きな開口数(潜在的に>1)を持つ大きな視野を与える。活性材料またはオリゴヌクレオチドの沈着を行うスタンピングツールまたはプリンティングツールを使って、2〜100個の異なるオリゴヌクレオチドを、交互配置的パターンでプリントすることができる。このプロセスには、約50〜500nmまでのプリントヘッドの正確な位置決めが要求される。このタイプのオリゴヌクレオチドアレイは、2〜100個の異なるDNA集団(例えば異なるソースDNA)を取付けるために使用することができる。また、DNA特異的なアンカーまたはタグを使用することにより、サブ光分解能(sub-light resolution)スポットからのパラレル読出しにも、使用することができる。情報は、DNA特異的タグ(例えば16個のDNAに対する16個の特異的アンカー)によってアクセスすることができ、5〜6色の組み合わせにより、16回のライゲーションサイクルまたは1回のライゲーションサイクルと16回の符号解読サイクルとを使って、2塩基を読み取ることができる。このアレイ作製方法は、1フラグメントあたりに要求される情報が限られている(例えばサイクル数が少ない)場合に効率がよく、したがって、1サイクルあたりの情報量、または1面あたりのサイクル数を増加させる。
ある態様では、複数の本発明のアレイを、単一の面上に置くことができる。例えば、標準的な96または384ウェルプレート形式に合致するように、パターン形成されたアレイ基材を作製することができる。作製フォーマットは、一片のガラスまたはプラスチックおよび他の光学適合材料上に、9mmピッチの6mm×6mmアレイの8×12パターンまたは4.5mmピッチの3.33mm×3.33mmアレイの16×24パターンであることができる。ある例では、各6mm×6mmアレイが、1マイクロメートルピッチの250〜500nm角の領域3600万個からなる。ユニットアレイ間で異なる反応が混合しないように、疎水性もしくは他の面または物理的障壁を使用することができる。
当技術分野では分子のアレイを形成させる方法が他にも知られており、それらをDNBアレイの形成に応用することができる。
理解されるだろうが、離散領域を含む面に、本発明のDNBおよび/または核酸テンプレートを広範囲にわたる密度で置いて、アレイを形成させることができる。いくつかの実施形態では、各離散領域が約1〜約1000個の分子を含みうる。さらなる実施形態では、各離散領域が約10〜約900、約20〜約800、約30〜約700、約40〜約600、約50〜約500、約60〜約400、約70〜約300、約80〜約200、および約90〜約100個の分子を含みうる。
いくつかの実施形態では、核酸テンプレートおよび/またはDNBのアレイが、1平方ミリメートルあたり少なくとも50万、100万、200万、300万、400万、500万、600万、700万、800万、900万、または1000万分子の密度で設けられる。
VII.DNBを使用する方法
上述の方法に従って作製されるDNBは、ターゲット核酸中の配列を同定する際に、多くの利点をもたらす。なぜなら、DNBに含有されるアダプターは、アンカーおよびシーケンシングプローブを利用する方法と組み合わせた場合に、空間的向きおよび配列の決定を可能にする既知配列の点になるからである。本発明に従ってDNBを使用する方法には、ターゲット核酸中の特異的配列のシーケンシングおよび検出(例えば特定ターゲット配列(例えば特異的遺伝子)を検出し、かつ/またはSNPを同定および/または検出すること)が含まれる。本明細書に記載する方法は、核酸再配列およびコピー数変異を検出するためにも使用することができる。核酸定量、例えばデジタル遺伝子発現(digital gene expression)(すなわち、全トランスクリプトーム-試料中に存在する全てのmRNA-の解析)および試料中の特異的配列または配列群の数の検出も、本明細書に記載する方法を使って達成することができる。本明細書における議論の大部分はDNBの配列を同定することに向けられるが、他の、アダプターを含む非コンカテマー核酸コンストラクトも、本明細書に記載する実施形態で使用しうることは、理解されるだろう。
VIIA.cPALシーケンシングの概観
一般に、DNBの配列は、以下に説明するように、本明細書においてコンビナトリアル・プローブ・アンカー・ライゲーション(「cPAL」)と呼ばれる方法およびその変法を使って、本発明に従って同定される。簡単に述べると、cPALでは、ターゲット核酸中の特定検出位置にあるヌクレオチドが、アダプターの全部または一部にハイブリダイズする少なくとも1つのアンカープローブと、検出位置に対応(例えばハイブリダイズ)する「照合位置」に特定ヌクレオチドを含有するシーケンシングプローブとの、ライゲーションによって形成されるプローブライゲーション産物を検出することによって同定される。シーケンシングプローブは、ユニークな同定用ラベルを含有する。照合位置にあるヌクレオチドが検出位置のヌクレオチドと相補的である場合は、ライゲーションが起こって、ユニークなラベルを含有するライゲーション産物をもたらし、次にそのラベルを検出することができる。cPAL法のさまざまな例示的実施形態の説明を以下に述べる。以下の説明が限定を意図していないこと、および以下の実施形態が本発明によって包含されることは、理解されるだろう。
「相補的」または「実質的に相補的」とは、ヌクレオチド間または核酸間(例えば、二本鎖DNA分子の2本の鎖の間、またはオリゴヌクレオチドプライマーと一本鎖核酸上のプライマー結合部位との間など)で起こるハイブリダイゼーションもしくは塩基対形成または二重鎖の形成を指す。相補的ヌクレオチドは、一般に、AとT(もしくはAとU)またはCとGである。2つの一本鎖RNAまたはDNA分子は、適当なヌクレオチド挿入またはヌクレオチド欠失を加えて最適に整列して比較した時に、一方の鎖のヌクレオチドが他方の鎖の少なくとも約80%、通常は少なくとも約90%〜約95%、より好ましくは約98〜100%と対を形成するのであれば、実質的に相補的であるという。
本明細書にいう「ハイブリダイゼーション」とは、2つの一本鎖ポリヌクレオチドが非共有結合的に結合して安定な二本鎖ポリヌクレオチドを形成するプロセスを指す。その結果生じる(通常は)二本鎖のポリヌクレオチドが「ハイブリッド」または「二重鎖(duplex)」である。「ハイブリダイゼーション条件」は、典型的には、約1M未満の塩濃度、より一般的には約500mM未満の塩濃度を含み、約200mM未満であってもよい。「ハイブリダイゼーションバッファー」は、5%SSPEなどの緩衝塩溶液または当技術分野で知られる他の同様のバッファーである。ハイブリダイゼーション温度は5℃という低温であってもよいが、典型的には22℃より高く、さらに典型的には約30℃より高く、典型的には37℃を超える。ハイブリダイゼーションは、通常、ストリンジェントな条件下で、すなわちプローブはそのターゲットサブ配列にはハイブリダイズするが、他の非相補的配列にはハイブリダイズしないような条件下で行われる。ストリンジェントな条件は配列依存的であり、状況が異なればストリンジェントな条件も異なる。例えば、長いフラグメントは、特異的なハイブリダイゼーションのために、短いフラグメントより高いハイブリダイゼーション温度を必要とする。相補鎖の塩基組成および長さ、有機溶媒の存在、ならびに塩基ミスマッチの程度などといった他の因子もハイブリダイゼーションのストリンジェンシーに影響を及ぼしうるので、いずれか一つだけのパラメータの絶対測定値よりもパラメータの組み合わせの方が重要である。一般に、ストリンジェントな条件は、所定のイオン強度およびpHにおける、その特異的配列についてのTmを約5℃下回るように選択される。代表的なストリンジェント条件には、少なくとも0.01M〜1M以下のナトリウムイオン濃度(または他の塩)という塩濃度、約7.0〜約8.3のpH、および少なくとも25℃の温度が含まれる。例えば、5×SSPE(750mM NaCl、50mMリン酸Na、5mM EDTA、pH7.4)および30℃の温度という条件は、アレル特異的プローブハイブリダイゼーションに適している。ストリンジェントな条件のさらなる例は当技術分野ではよく知られており、例えばSambrook Jら(2001)「Molecular Cloning, A laboratory Manual」(第3版、Cold Spring Harbor Laboratory Press)を参照されたい。
本明細書で使用する「Tm」という用語は、一般に、二本鎖核酸分子の集団の半分が一本鎖に解離した状態になる温度を指す。核酸のTmを算出するための等式は当技術分野ではよく知られている。標準的な参考文献に示されているように、核酸が0.5M以下のカチオン濃度を持つ水性溶液中にあり、(G+C)含量が30%〜70%であり、nが塩基数であり、mが塩基対ミスマッチのパーセンテージである場合、Tm値の簡単な推定値は、式:Tm=81.5+16.6(log10[Na+])0.41(%[G+C])-675/n-1.0mによって算出することができる(例えばSambrook Jら(2001)「Molecular Cloning, A Laboratory Manual」(第3版、Cold Spring Harbor Laboratory Press)を参照されたい)。他の参考文献には構造特徴も配列特徴も考慮してTmを算出する、より洗練された計算方法が記載されている(「Nucleic Acid Hybridization」のAndersonおよびYoung (1985)「Quantitative Filter Hybridization」ならびにAllawiおよびSantaLucia (1997), Biochemistry 36:10581-94も参照されたい)。
本明細書において「シングルcPAL(シングルcPAL)」と呼ぶcPAL法の一例では、図23に図解するように、アンカープローブ2302が、DNB 2301のアダプター2308上の相補的領域にハイブリダイズする。アンカープローブ2302は、ターゲット配列2309に直接隣接するアダプター領域にハイブリダイズするが、ある場合には、図24に模式的に図解し、以下にさらに説明するように、アンカープローブの末端に所望の数の縮重塩基を組み込むことによって、ターゲット配列中に「入り込む(reach into)」ようにアンカープローブをデザインすることもできる。弁別的に標識されたシーケンシングプローブのプール2305は、ターゲット配列の相補的領域にハイブリダイズすることになり、アンカープローブに隣接してハイブリダイズするシーケンシングプローブが、通常はリガーゼの適用により、ライゲートされてプローブライゲーション産物を形成する。シーケンシングプローブは、一般に、照合位置にある異なるヌクレオチドと、他の位置の考えうる全ての塩基(またはユニバーサル塩基)という、2つの部分を含むオリゴヌクレオチドのセットまたはプールであるので、各プローブは、ある特定位置における各塩基タイプを表現する。シーケンシングプローブは、各シーケンシングプローブとその位置に異なるヌクレオチドを持つシーケンシングプローブとを区別する検出可能なラベルで標識される。したがって、図23に図解する例では、アンカープローブ2302に隣接してハイブリダイズし、アンカープローブにライゲートされるシーケンシングプローブ2310により、アダプターから5塩基の位置にあるターゲット核酸中の塩基は「G」であると同定されることになる。図23は、照合塩基がライゲーション部位から5塩基の位置にある状況を図示しているが、以下により詳しく説明するように、照合塩基はライゲーション部位に「もっと近く」てもよく、ある場合には、ライゲーションの点であってもよい。ライゲーションを行ったら、ライゲートされていないアンカーおよびシーケンシングプローブを洗い流し、アレイ上のライゲーション産物の存在をラベルを使って検出する。アンカープローブおよびシーケンシングプローブのハイブリダイゼーションとライゲーションのサイクルを複数回使って、DNB中の各アダプターの各側にある所望の数の、ターゲット核酸の塩基を同定することができる。アンカープローブおよびシーケンシングプローブのハイブリダイゼーションは、逐次的に起こっても、同時に起こってもよい。ベースコールの忠実度は、一つには、ライゲーション部位の近くにミスマッチが存在する場合は一般的にはライゲートしないリガーゼの忠実度に依拠する。
本発明は、ハイブリダイゼーション-ライゲーションサイクルごとに、2つ以上のアンカープローブを使用する方法も提供する。図25は「オーバーハング付きダブルcPAL(double cPAL with overhang)」法のもう一つの例を図解しており、ここでは、第1アンカープローブ2502と第2アンカープローブ2505がそれぞれアダプターの相補的領域にハイブリダイズする。図25に図解する例では、第1アンカープローブ2502はアダプター2511の第1領域に完全に相補的であり、第2アンカープローブ2505は第1アンカープローブのハイブリダイゼーション位置に隣接する第2アダプター領域に相補的である。第2アンカープローブは、第1アンカープローブに隣接していない末端に、縮重塩基も含む。結果として、第2アンカープローブは、アダプター2511に隣接するターゲット核酸2512の領域にハイブリダイズすることができる(「オーバーハング」部分)。第2アンカープローブは一般に短すぎてその二重鎖ハイブリダイゼーション状態を単独では維持できないが、第1アンカープローブへのライゲーション後は、後続の方法のために安定にハイブリダイズされうる、より長いアンカープローブを形成する。「シングルcPAL」法に関して上で議論したように、ターゲット核酸の検出位置における各塩基タイプを表し、各シーケンシングプローブとその位置に他のヌクレオチドを持つシーケンシングプローブとを区別する検出可能なラベルで標識されている、シーケンシングプローブのプール2508は、アダプター-アンカープローブ二重鎖にハイブリダイズし2509、ライゲートされたアンカープローブの末端5'または3'塩基にライゲートされる。図25に図解する例では、シーケンシングプローブ2514とライゲートされたアンカープローブ2513の間のライゲーション点から5'側に5番目の位置にある塩基を照会するように、シーケンシングプローブがデザインされる。第2アダプタープローブ2505は5つの縮重塩基をその5'末端に持つので、これはターゲット核酸2512中に5塩基分入り込み、ターゲット核酸2512とアダプター2511の間の境界から全部で10塩基の位置を、シーケンシングプローブで照会することを可能にする。
上述したダブルcPAL法の例の変法において、第1アンカープローブが、アダプターの末端に、より近いところで終わる場合、第2アダプタープローブは、それに比例して、より強く縮重することになるので、第1アダプタープローブの末端にライゲートするだけでなく、DNB上の複数の部位で他の第2アダプタープローブにもライゲートする潜在的可能性が、より大きくなる。そのようなライゲーションアーチファクトを防ぐために、第2アンカープローブを、第1アンカープローブまたはシーケンシングプローブへのライゲーションに関与するように、選択的に活性化することができる。そのような活性化方法を以下にさらに詳しく説明するが、これには、アンカープローブの末端を、それらが特定のアンカープローブまたはシーケンシングプローブにアダプターに関して特定の向きでしかライゲートできないように、選択的に修飾するなどの方法が含まれる。
上述のダブルcPAL法と同じように、3つ以上のアンカープローブを利用するcPAL法も本発明に包含されることは理解されるだろう。
加えて、シーケンシング反応は、各アダプターの一端または両端で行うことができる。例えば、シーケンシング反応は、検出がアダプターの3'側または5'側のどちらか一方で起こる「一方向性(unidirectional)」であるか、またはアダプターの3'側および5'側にある検出位置で塩基が検出される「二方向性」であることができる。二方向性シーケンシング反応は、同時に行うか(すなわちアダプターの両側にある塩基が同時に検出されるか)、または任意の順序で逐次的に行うことができる。
複数サイクルのcPAL(シングル、ダブル、トリプルなどを問わない)により、アダプターに隣接するターゲット核酸の領域中の複数の塩基が同定されることになる。簡単に述べると、アンカープローブのハイブリダイゼーション、およびアダプターとターゲット核酸の間の境界面から離れたさまざまな位置にあるヌクレオチドを検出するようにデザインされたシーケンシングプローブプールとの酵素的ライゲーション反応を繰り返すことによって、ターゲット核酸内の複数の隣接塩基を照合するために、cPAL法が繰り返される。任意の所与のサイクルにおいて、使用されるシーケンシングプローブは、1つ以上の位置における1つ以上の塩基の実体(identity)が、そのシーケンシングプローブに取り付けられたラベルの実体(identity)と相互に関係付けられるようにデザインされる。ライゲートされたシーケンシングプローブ(したがって照合位置にある塩基)が検出されたら、ライゲートされた複合体をDNBからはぎ取り、アダプターおよびシーケンシングプローブのハイブリダイゼーションとライゲーションの新しいサイクルを行う。
理解されるだろうが、本発明のDNBは、上述のcPAL法だけでなく、他のシーケンシング法でも、例えば他のライゲーションによるシーケンシング法、ならびにハイブリダイゼーションによるシーケンシング、合成によるシーケンシング(プライマー伸長によるシーケンシングを含む)、切断可能なプローブのライゲーションによる連続(chained)シーケンシングなど(ただしこれらに限るわけではない)といった他のシーケンシング法でも、使用することができる。
上述のシーケンシング法と同様の方法を使って、一塩基多型(SNP)の検出など、ターゲット核酸中の特異的配列を検出することもできる。そのような方法では、SNPを含有する配列など、特定の配列にハイブリダイズするシーケンシングプローブが適用されることになる。そのようなシーケンシングプローブは、どのSNPがターゲット核酸中に存在するかを同定するために、弁別的に標識することができる。アンカープローブをそのようなシーケンシングプローブと組み合わせて使用することで、さらなる安定性および特異性を得ることもできる。
VIIB.シーケンシング
ある態様において、本発明は、ライゲーションによるシーケンシング法(sequencing by ligation method)を利用することによってDNBの配列を同定するための方法を提供する。ある態様において、本発明は、コンビナトリアル・プローブ・アンカー・ライゲーション(cPAL)法を利用する、DNBの配列を同定するための方法を提供する。一般に、cPALでは、アンカープローブとシーケンシングプローブのライゲーションによって形成されるプローブライゲーション産物を検出することによって、ターゲット核酸中の検出位置にあるヌクレオチドが同定される。本発明の方法は、あるDNB中およびゲノムの一部または全部を表す多くのDNB中に含まれるターゲット核酸の部分配列または全配列をシーケンスするために使用することができる。
本明細書でさらに議論するように、全てのDNBは繰り返しモノマー単位を含み、各モノマー単位は1つ以上のアダプターとターゲット核酸とを含む。ターゲット核酸は複数の検出位置を含む。「検出位置」という用語は、ターゲット配列中にあって、その配列情報が望まれている位置を指す。当業者には理解されるだろうが、一般にターゲット配列は、例えば本明細書に記載するように全ゲノムのシーケンシングなどにおいて、その配列情報が要求される複数の検出位置を持つ。ある場合には、例えばSNP解析において、特定区画中の単一SNPだけを読み取ることが望ましいこともありうる。
本発明は、アンカープローブとシーケンシングプローブの組合せを利用する、シーケンシングの方法を提供する。「シーケンシングプローブ」とは、ターゲット配列の特定の検出位置にあるヌクレオチドの実体(identity)を与えるようにデザインされたオリゴヌクレオチドを意味する。シーケンシングプローブはターゲット配列内のドメインにハイブリダイズする。例えば第1シーケンシングプローブは第1ターゲットドメインにハイブリダイズし、第2シーケンシングプローブは第2ターゲットドメインにハイブリダイズしうる。本明細書における用語「第1ターゲットドメイン」および「第2ターゲットドメイン」または文法上等価な用語は、検査対象である核酸内のターゲット配列の2つの部分を意味する。第1ターゲットドメインは第2ターゲットドメインに直接隣接していてもよいし、第1ターゲットドメインと第2ターゲットドメインは介在配列(例えばアダプター)によって隔てられていてもよい。「第1」および「第2」という用語は、ターゲット配列の5'-3'方向に関して、配列の向きを与えようとするものではない。例えば、相補的ターゲット配列の5'-3'方向を仮定した場合、第1ターゲットドメインは、第2ドメインの5'側または第2ドメインの3'側のどちらにでも位置しうる。シーケンシングプローブはオーバーラップすることができる。例えば第1シーケンシングプローブはアダプターの一方の末端に隣接する最初の6塩基にハイブリダイズし、第2シーケンシングプローブは、アダプターのその末端から4番目〜9番目の塩基にハイブリダイズすることができる(例えばアンカープローブが3つの縮重塩基を持つ場合)。あるいは、第1シーケンシングプローブはアダプターの「上流」末端に隣接する6塩基にハイブリダイズし、第2シーケンシングプローブはアダプターの「下流」末端に隣接する6塩基にハイブリダイズすることができる。
シーケンシングプローブは、一般に、検出位置(本明細書では「照合位置」ともいう)をクエリするために、いくつかの縮重塩基と、プローブ内の特異的位置にある特異的ヌクレオチドとを含むだろう。
一般に、縮重塩基を使用する場合は、シーケンシングプローブのプールを使用する。すなわち、「NNNANN」という配列を持つプローブは、実際には、5つの位置に4つのヌクレオチド塩基の考えうる全ての組合せを持ち、6つ目の位置にはアデノシンを持つ、プローブ(すなわち1024の配列)のセットである。(本明細書で注記するとおり、この用語法はアダプタープローブにも適用できる。例えばアダプタープローブが例えば「3つの縮重塩基」を持つ場合、それは実際には、アンカー部分に対応する配列と、3つの位置の考えうる全ての組合せとを含むアダプタープローブのセットであり、したがって64のプローブのプールである)。
いくつかの実施形態では、各照合位置について、4つの異なる形で標識されたプールを一つのプールに混合して、シーケンシングステップで使用することができる。したがって、任意の特定シーケンシングステップでは、それぞれが照合位置に異なる特異的塩基を持ち、かつ照合位置にある塩基に対応する異なるラベルを持つ、4つのプールが使用される。すなわち、シーケンシングプローブはまた、一般に、特定の照合位置にある特定のヌクレオチドが、同じ照合位置に異なるヌクレオチドを持つシーケンシングプローブのラベルとは異なるラベルと関連づけられるように標識される。例えば4つのプール、すなわちNNNANN-色素1、NNNTNN-色素2、NNNCNN-色素3およびNNNGNN-色素4を、色素が光学的に分解可能である限り、単一のステップで使用することができる。いくつかの実施形態では、例えばSNP検出の場合に、SNPコールがCまたはAのどちらか一方であるなどの理由で、2つのプールを含めるだけでよい場合もある。同様に、いくつかのSNPは3つの可能性を持つ。あるいは、いくつかの実施形態では、反応が同時にではなく逐次的に行われるのであれば、異なるステップに限り、同じ色素を使用することもできる。すなわち、例えばNNNANN-色素1プローブをある反応において単独で使用し、シグナルが検出されるか、検出されず、そのプローブを洗い流し、次に第2のプール、NNNTNN-色素1を導入することができる。
本明細書に記載するシーケンシング法のいくつかでは、シーケンシングプローブが、例えば約3〜約25塩基など、広範囲にわたる長さを持ちうる。さらなる実施形態では、シーケンシングプローブが、約5〜約20、約6〜約18、約7〜約16、約8〜約14、約9〜約12、および約10〜約11塩基の範囲の長さを持ちうる。
本発明のシーケンシングプローブは、ターゲット配列の一部と本発明のプローブとのハイブリダイゼーションが起こるように、ターゲット配列の配列に対して相補的(一般的には完全に相補的)になるようにデザインされる。特に、照合位置塩基および検出位置塩基が完全に相補的であることと、これがあてはまらない限り、本発明の方法がシグナルをもたらさないことが重要である。
多くの実施形態において、シーケンシングプローブは、それらがハイブリダイズするターゲット配列に対して完全に相補的である。すなわち実験は、当技術分野では知られているとおり、完全な塩基対の形成が有利になるような条件下で行われる。当業者には理解されるだろうが、ターゲット配列の第1のドメインに完全に相補的なシーケンシングプローブは、同じターゲット配列の第2のドメインには実質的に相補的であることしかできないだろう。すなわち、本発明は、多くの場合、いくつかのターゲット配列には完全に相補的であり、他の配列にはそうでないようなプローブのセット、例えばヘキサマーのセットの使用に依拠する。
いくつかの実施形態では、その応用例によっては、シーケンシングプローブとターゲットの間の相補性が完全である必要がなく、ターゲット配列と本発明の一本鎖核酸の間のハイブリダイゼーションを妨害するであろう塩基対ミスマッチがいくつか存在してもよい。しかし、ミスマッチの数が多くて、最もストリンジェンシーの低いハイブリダイゼーション条件下でさえ、ハイブリダイゼーションが起こりえない場合、その配列は相補的ターゲット配列ではない。このように、本明細書にいう「実質的に相補的」とは、シーケンシングプローブが、ターゲット配列に対して十分に相補的であって、通常の反応条件下でハイブリダイズすることを意味する。しかし、大半の応用では、完全な相補性が存在する場合にのみプローブハイブリダイゼーションに有利になるように、条件が設定される。あるいは、リガーゼ反応が起こるのを許すには、十分な相補性が要求される。すなわち、配列の何らかの部分にミスマッチが存在してもよいが、照合位置塩基は、その位置に完全な相補性が存在する場合にのみ、ライゲーションを許すべきである。
ある場合には、本発明のプローブにおいて縮重塩基を使用することに加えて、または本発明のプローブにおいて縮重塩基を使用する代わりに、2つ以上の塩基にハイブリダイズするユニバーサル塩基を使用することができる。例えばイノシンを使用することができる。これらのシステムおよびプローブコンポーネントの任意の組合せを利用することができる。
本発明の方法においてい役立つシーケンシングプローブは、通常、検出可能なように標識される。本明細書にいう「ラベル」または「標識された」とは、ある化合物が、その化合物の検出が可能になるように取り付けられた少なくとも1つの元素、同位体または化学化合物を持つことを意味する。一般に、本発明において役立つラベルには、放射性同位体または重同位体などといった同位体ラベル、磁気ラベル、電気的ラベル、熱的ラベル、着色および発光色素、酵素、さらには磁気粒子などが含まれるが、これらに限るわけではない。本発明において役立つ色素は、それらの強いシグナルゆえに符号解読のために良好な信号対雑音比を与える発色団、リン光体または蛍光色素であることができる。シーケンシングプローブは、量子ドット、蛍光ナノビーズまたは2分子以上の同じフルオロフォアを含む他のコンストラクトで標識することもできる。複数の同じフルオロフォア分子を含むラベルは、一般に、1分子のフルオロフォアを含むラベルよりも強いシグナルを与え、消光に対する感受性も低くなる。フルオロフォアを含むラベルに関する本明細書におけるどの議論も、1分子のフルオロフォアを含むラベルおよび複数のフルオロフォア分子を含むラベルにあてはまることは理解されるだろう。
本発明の多くの実施形態には蛍光ラベルの使用が含まれる。本発明における使用に適した色素には、蛍光性ランタノイド錯体、例えばユーロピウムおよびテルビウムの錯体、フルオレセイン、ローダミン、テトラメチルローダミン、エオシン、エリスロシン、クマリン、メチル-クマリン類、ピレン、マラカイトグリーン(Malacite green)、スチルベン、ルシファーイエロー、カスケードブルー(Cascade Blue(商標))、テキサスレッド、およびRichard P. Haugland「Molecular Probes Handbook」の第6版(この文献は、ここに明白に、あらゆる目的で、特に本発明で役立つラベルに関するその教示内容について、引用によりその全てが本明細書に組み込まれる)に記載されている他の色素が含まれるが、これらに限るわけではない。核酸中に組み込むために任意のヌクレオチドと共に使用される市販の蛍光色素には、次に挙げるものが含まれるが、これらに限るわけではない:Cy3、Cy5(Amersham Biosciences、米国ニュージャージー州ピスカタウェイ)、フルオレセイン、テトラメチルローダミン-、Texas Red(登録商標)、Cascade Blue(登録商標)、BODIPY(登録商標)FL-14、BODIPY(登録商標)R、BODIPY(登録商標)TR-14、Rhodamine Green(商標)、Oregon Green(登録商標)488、BODIPY(登録商標)630/650、BODIPY(登録商標)650/665-、Alexa Fluor(登録商標)488、Alexa Fluor(登録商標)532、Alexa Fluor(登録商標)568、Alexa Fluor(登録商標)594、Alexa Fluor(登録商標)546(Molecular Probes, Inc.、米国オレゴン州ユージーン)、Quasar 570、Quasar 670、Cal Red 610(BioSearch Technologies、カリフォルニア州ノバート)。合成後取り付けに利用できる他のフルオロフォアには、とりわけ、Alexa Fluor(登録商標)350、Alexa Fluor(登録商標)532、Alexa Fluor(登録商標)546、Alexa Fluor(登録商標)568、Alexa Fluor(登録商標)594、Alexa Fluor(登録商標)647、BODIPY 493/503、BODIPY FL、BODIPY R6G、BODIPY 530/550、BODIPY TMR、BODIPY 558/568、BODIPY 558/568、BODIPY 564/570、BODIPY 576/589、BODIPY 581/591、BODIPY 630/650、BODIPY 650/665、カスケードブルー、カスケードイエロー、ダンシル、リサミンローダミンB、マリーナブルー(Marina Blue)、オレゴングリーン488、オレゴングリーン514、パシフィックブルーー(Pacific Blue)、ローダミン6G, ローダミングリーン、ローダミンレッド、テトラメチルローダミン、テキサスレッド(Molecular Probes、米国オレゴン州ユージーンから入手可能)、ならびにCy2、Cy3.5、Cy5.5、およびCy7(Amersham Biosciences、米国ニュージャージー州ピスカタウェイ、その他)が含まれる。いくつかの実施形態では、フルオロセイン(fluoroscein)、Cy3、テキサスレッド、Cy5、Quasar 570、Quasar 670およびCal Red 610などのラベルが、本発明の方法で使用される。
当技術分野で知られる方法を使って、本発明の標識シーケンシングプローブを形成させるために、ラベルを、核酸に、そしてヌクレオシドのさまざまな位置に、取り付けることができる。例えば、取り付けは、核酸の一方または両方の末端で行うか、内部位置で行うか、その両方で行うことができる。例えばラベルの取り付けは、リボース-ホスフェートバックボーンのリボース上、2位または3'位(後者は末端標識用)において、ある実施形態ではアミド結合またはアミン結合によって、行うことができる。取り付けは、リボース-ホスフェートバックボーンのホスフェートを介して行うか、ヌクレオチドの塩基に対して行うこともできる。ラベルは、プローブの一方または両方の末端に取り付けるか、プローブの長さ方向に沿って、ヌクレオチドの任意の一つに取り付けることができる。
シーケンシングプローブには、所望する照合位置に依存して、異なる構造が与えられる。例えば、フルオロフォアで標識されるシーケンシングプローブの場合、各シーケンシングプローブ内の単一の位置が、その標識に使われるフルオロフォアの実体(identity)と関連づけられる。一般に、フルオロフォア分子は、アンカープローブへのライゲーションを目的とする末端とは反対側の、シーケンシングプローブの末端に取り付けられるだろう。
本明細書にいう「アンカープローブ」とは、アダプターの少なくとも一部分(これを本明細書では「アンカー部位」という)に対して相補的になるようにデザインされたオリゴヌクレオチドを意味する。アダプターは、本明細書で説明するように、複数のアンカープローブとのハイブリダイゼーションのために、複数のアンカー部位を含有することができる。本明細書でさらに議論するように、本発明において役立つアンカープローブは、アンカープローブの少なくとも一方の末端がアダプターの一方の末端と(「上流」もしくは「下流」または両方で)面一になるような形でアダプターにハイブリダイズするように、デザインすることができる。さらなる実施形態では、アダプターの少なくとも一部分(第1アダプター部位)にハイブリダイズすると共に、アダプターに隣接するターゲット核酸の少なくとも1つのヌクレオチド(「オーバーハング」)にもハイブリダイズするように、アンカープローブをデザインすることができる。図24に図解するように、アンカープローブ2402はアダプターの一部に相補的な配列を含む。アンカープローブ2402は、一方の末端に、4つの縮重塩基も含む。この縮重は、アンカープローブ集団の一部が、アダプターに隣接するターゲット核酸の配列と完全にまたは部分的にマッチすることを可能にし、アンカープローブがアダプターにハイブリダイズして、アダプターに隣接するターゲット核酸のヌクレオチドの実体(identity)がなんであれ、アダプターに隣接するターゲット核酸中に入り込むことを可能にする。こうしてアンカープローブの末端塩基がターゲット核酸中にシフトすることにより、コールされる塩基の位置が、ライゲーション点の近くにシフトするので、リガーゼの忠実度を維持することが可能になる。一般にリガーゼは、プローブが、それらがハイブリダイズするターゲット核酸の領域に完全に相補的であるならば、より高い効率でプローブをライゲートするが、ライゲーション点からの距離が増加すると共に、リガーゼの忠実度は低下する。したがって、シーケンシングプローブとターゲット核酸の間の正しくない対形成に起因するエラーを最小限に抑えかつ/または防止するには、検出しようとするヌクレオチドと、シーケンシングプローブおよびアンカープローブのライゲーション点との間の距離を維持することが有用でありうる。ターゲット核酸中に入り込むようにアンカープローブをデザインすることによって、より多くの、各アダプターに隣接するヌクレオチドの同定を可能にしながらも、リガーゼの忠実度が維持される。図24に図解する実施形態は、シーケンシングプローブがアダプターの一方の側にあるターゲット核酸の領域にハイブリダイズするものであるが、シーケンシングプローブがアダプターの他方の側でハイブリダイズする実施形態も本発明に包含されることは、理解されるだろう。図24において、「N」は縮重塩基を表し、「B」は未決定配列のヌクレオチドを表す。理解されるだろうが、いくつかの実施形態では、縮重塩基ではなくユニバーサル塩基を使用することができる。
本発明のアンカープローブは、アンカープローブがDNBに(一般的にはDNBのアダプターに)ハイブリダイズすることを可能にする任意の配列を含みうる。そのようなアンカープローブは、アンカープローブをアダプターにハイブリダイズさせた時に、アンカープローブの全長がアダプター内に含まれるような配列を含みうる。いくつかの実施形態では、アンカープローブが、アダプターの少なくとも一部分に相補的な配列を含むと共に、アダプターに隣接するターゲット核酸領域にハイブリダイズすることができる縮重塩基も含むことができる。いくつかの例示的実施形態では、アンカープローブが、アダプターに相補的な3つの塩基と3つの縮重塩基とを含むヘキサマーである。いくつかの例示的実施形態では、アンカープローブが、アダプターに相補的な3つの塩基と5つの縮重塩基とを含む8マーである。さらなる例示的実施形態において、特に複数のアンカープローブが使用される場合に、第1アンカープローブは、アダプターに相補的ないくつかの塩基を一端に含むと共に他端に縮重塩基を含み、一方、第2アンカープローブは全て縮重塩基を含み、縮重塩基を含む第1アンカープローブの末端にライゲートするようにデザインされる。これらが例示的実施形態であること、既知塩基と縮重塩基の広範囲にわたる組合せを使って、本発明において役立つアンカープローブを作製できることは、理解されるだろう。
本発明は、DNBの配列を同定するためのライゲーションによるシーケンシング法を提供する。一定の態様において、本発明のライゲーションによるシーケンシング法は、DNB上の隣接する領域にハイブリダイズさせた場合に、ライゲートしてプローブライゲーション産物を形成することができるアンカープローブとシーケンシングプローブの異なる組合せを提供することを含む。次に、そのプローブライゲーション産物が検出され、それが、ターゲット核酸中の1つ以上のヌクレオチドの実体(identity)を与える。本明細書にいう「ライゲーション」とは、2つ以上のヌクレオチドを互いに接合する任意の方法を意味する。ライゲーションには、化学的ライゲーションならびに酵素的ライゲーションを含めることができる。一般に、本明細書で議論するライゲーションによるシーケンシング法は、リガーゼによる酵素的ライゲーションを利用する。そのようなリガーゼは、核酸テンプレートの作製に関して上で議論したリガーゼと同じであっても異なってもよい。そのようなリガーゼには、DNAリガーゼI、DNAリガーゼII、DNAリガーゼIII、DNAリガーゼIV、大腸菌(E. coli)DNAリガーゼ、T4 DNAリガーゼ、T4 RNAリガーゼ1、T4 RNAリガーゼ2、T7リガーゼ、T3 DNAリガーゼ、および耐熱性リガーゼ(Taqリガーゼを含むが、これに限るわけではない)などが含まれるが、これらに限るわけではない。上で議論したように、ライゲーションによるシーケンシング法は、多くの場合、リガーゼの忠実度に頼って、ハイブリダイズする核酸に対して完全に相補的なプローブだけを接合する。この忠実度は、プローブ中の特定の位置にある塩基と、2つのプローブ間のライゲーション点との間の距離が増加するに連れて、減少するだろう。したがって、従来のライゲーションによるシーケンシング法では、同定することのできる塩基の数が制限される場合がある。本発明は、本明細書でさらに説明するように、複数のプローブプールを使用することにより、同定することができる塩基の数を増加させる。
このライゲーションによるシーケンシングというシーケンシング法ならびに本明細書に記載する他のシーケンシング法では、さまざまなハイブリダイゼーション条件を使用することができる。これらの条件には、高、中および低ストリンジェンシー条件が含まれる。例えば、引用により本明細書に組み込まれるManiatisら「Molecular Cloning: A Laboratory Manual」第2版、1989、およびAusubelら編「Short Protocols in Molecular Biology」を参照されたい。ストリンジェントな条件は配列依存的であり、状況が異なればストリンジェントな条件も異なることになる。長い配列ほど高い温度で特異的にハイブリダイズする。核酸のハイブリダイゼーションに関する広範な指針は、Tijssen「Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes」の「Overview of principles of hybridization and the strategy of nucleic acid assay」(1993)に見いだされる。一般に、ストリンジェントな条件は、所定のイオン強度およびpHにおけるその特異的配列の熱融解点(Tm)よりも、約5〜10℃低くなるように選択される。Tmは、平衡状態において、ターゲットに相補的なプローブの50%がターゲット配列にハイブリダイズする温度(所定のイオン強度、pH、および核酸濃度下)である(ターゲット配列は過剰に存在するので、Tmでは、平衡状態においてプローブの50%が占有される)。ストリンジェントな条件は、pH7.0〜8.3で塩濃度が約1.0M未満のナトリウムイオン濃度、典型的には約0.01〜1.0Mのナトリウムイオン濃度(または他の塩)であり、温度が短いプローブ(例えば10〜50ヌクレオチド)の場合は少なくとも約30℃、長いプローブ(例えば50ヌクレオチドより長いもの)の場合は少なくとも約60℃であるような条件であることができる。ストリンジェントな条件は、ホルムアミドなどのヘリックス不安定化剤の添加によって達成することもできる。ハイブリダイゼーション条件は、当技術分野で知られているとおり、非イオン性バックボーン、すなわちPNAを使用する場合にも変化しうる。さらにまた、ターゲット結合後に架橋剤を添加して、ハイブリダイゼーション複合体の2本の鎖を架橋、すなわち共有結合させてもよい。
シーケンシング法の説明の大部分は本発明の核酸テンプレートに関して行うが、これらのシーケンシング法が、本明細書で説明するように、そのような核酸テンプレートから作製されるDNBにおける配列の同定も包含することは理解されるだろう。
本発明の核酸テンプレートを使用する、当技術分野で知られる、および本明細書に記載する、どのシーケンシング方法についても、本発明は、ターゲット核酸中の少なくとも約10〜約200塩基を決定するための方法を提供する。さらなる実施形態において、本発明は、ターゲット核酸中の少なくとも約20〜約180、約30〜約160、約40〜約140、約50〜約120、約60〜約100、および約70〜約80塩基を決定するための方法を提供する。さらなる実施形態では、シーケンシング方法を使って、本発明の核酸テンプレート中の各アダプターの一端または両端に隣接する少なくとも5、10、15、20、25、30またはそれ以上の塩基を同定する。
本明細書に記載する、および当技術分野で知られている、シーケンシング方法はいずれも、溶液中の本発明の核酸テンプレートおよび/またはDNB、または面上および/またはアレイ中に配置された核酸テンプレートおよび/またはDNBに、応用することができる。
VIIB(i).シングルcPAL
ある態様において、本発明は、DNBの隣接する領域にハイブリダイズし、通常はリガーゼの適用によってライゲートされる、シーケンシングプローブとアンカープローブの組合せを使用することによって、DNBの配列を同定するための方法を提供する。そのような方法を、本明細書では、一般にcPAL(コンビナトリアル・プローブ・アンカー・ライゲーション)法という。ある態様において、本発明のcPAL法は、1つのアンカープローブと1つのシーケンシングプローブとを含むプローブライゲーション産物を生成させる。アンカープローブを1つだけ使用するそのようなcPAL法を、本明細書では、「シングルcPAL」という。
シングルcPALの一実施形態を図23に図解する。DNBのモノマー単位2301はターゲット核酸2309とアダプター2308とを含む。アンカープローブ2302はアダプター2308上の相補的領域にハイブリダイズする。図23に図解する例では、アンカープローブ2302が、ターゲット配列2309に直接隣接するアダプター領域にハイブリダイズするが、本明細書でさらに議論するように、アンカープローブの末端に所望の数の縮重塩基を組み込むことによって、アダプターに隣接するターゲット配列中に入り込むようにアンカープローブをデザインすることもできる。弁別的に標識されたシーケンシングプローブのプール2306は、ターゲット核酸の相補的領域にハイブリダイズするだろう。アンカープローブ2302に隣接するターゲット核酸2309の領域にハイブリダイズするシーケンシングプローブ2310は、アンカープローブにライゲートされて、プローブライゲーション産物を形成するだろう。ハイブリダイゼーションおよびライゲーションの効率は、プローブの照合位置にある塩基がターゲット核酸の検出位置にある未知の塩基と相補的である場合に増加する。この増加した効率は、ミスマッチシーケンシングプローブと比較して、完全に相補的シーケンシングプローブのアンカープローブへのライゲーションにとって有利に働く。上で議論したように、ライゲーションは一般にリガーゼを使って酵素的に達成されるが、他のライゲーション法も本発明に従って利用することができる。図23において、「N」は縮重塩基を表し、「B」は未決定配列のヌクレオチドを表す。理解されるだろうが、いくつかの実施形態では、縮重塩基ではなく、ユニバーサル塩基を使用することができる。
やはり上で議論したように、シーケンシングプローブは、特定位置の各塩基タイプを表現し、各シーケンシングプローブとその位置に他のヌクレオチドを持つシーケンシングプローブとを区別する検出可能なラベルで標識された、オリゴヌクレオチドであることができる。したがって、図23に図解する例では、アンカープローブ2302に隣接してハイブリダイズし、そのアンカープローブにライゲートされるシーケンシングプローブ2310により、アダプターから5塩基の位置にあるターゲット核酸中の塩基は「G」であると同定されることになる。アンカープローブおよびシーケンシングプローブのハイブリダイゼーションとライゲーションのサイクルを複数回使って、DNB中の各アダプターの各側にある所望の数の、ターゲット核酸の塩基を同定することができる。
理解されるだろうが、アンカープローブおよびシーケンシングプローブのハイブリダイゼーションは、本明細書に記載するどのcPAL法でも、逐次的または同時であることができる。
図23に図解する実施形態では、シーケンシングプローブ2310がアダプターの「上流」にある領域にハイブリダイズするが、シーケンシングプローブがアダプターの「下流」にもハイブリダイズしうることは理解されるだろう。「上流」および「下流」という用語は、システムの向きに依存して、アダプターの5'側および3'側にある領域を指す。一般に「上流」および「下流」は相対的用語であり、限定を意図するものではなく、むしろそれらは理解を容易にするために用いられる。図6に図解するように、シーケンシングプローブ607は、アダプター604の下流にハイブリダイズして、アダプターとターゲット核酸603の間の境界面から4塩基離れたヌクレオチドを同定することができる。さらなる実施形態では、シーケンシングプローブがアダプターの上流と下流の両方にハイブリダイズして、アダプターの両側の核酸中の位置のヌクレオチドを同定することができる。そのような実施形態では、シングルcPAL法の各ハイブリダイゼーション-ライゲーション-検出サイクルにつき、各アダプターから複数のデータポイントを生成させることができる。
いくつかの実施形態では、シングルcPAL法で使用されるプローブが、アダプターに対応する約3〜約20個の塩基と約1〜約20個の縮重塩基とを(すなわち、アンカープローブのプールの形で)持ちうる。そのようなアンカープローブは、ユニバーサル塩基、ならびに縮重塩基とユニバーサル塩基の組合せも含みうる。
いくつかの実施形態では、縮重塩基を持つアンカープローブが、縮重塩基における完全マッチハイブリダイゼーションの安定性を増加させるために、アダプター配列に関して約1〜5個のミスマッチを持ちうる。そのようなデザインは、ターゲット(未知)配列に完全にマッチするプローブが有利になるように、ライゲートされたアンカープローブとシーケンシングプローブの安定性を制御するための付加的な方法になる。さらなる実施形態では、本明細書で説明するように、シーケンシングプローブとのライゲーション反応に参加することになるアンカープローブの縮重部分の遠位端での完全マッチハイブリッドが有利になるように、ハイブリダイズしたプローブの安定性に影響を与えるために、アンカープローブの縮重部分中のいくつかの塩基を、塩基脱落部位(すなわち糖上に塩基を持たない部位)または他のヌクレオチド類似体で置き換えることができる。そのような修飾は、特に、多数の(すなわち5個を超える)縮重した塩基を含むアンカープローブの場合には、例えば内部塩基に組み込むことができる。さらにまた、アンカープローブの遠位端にある縮重塩基またはユニバーサル塩基のいくつかは、以下にさらに説明するように、(例えばウラシルの組み込みによって)ハイブリダイゼーション後に切断してシーケンシングプローブまたは第2アンカープローブへのライゲーション部位を生成することができるようにデザインすることができる。
さらなる実施形態では、アンカープローブのハイブリダイゼーションを、反応条件(例えばハイブリダイゼーションのストリンジェンシー)の操作によって、制御することができる。例示的実施形態では、アンカーハイブリダイゼーションプロセスを、高ストリンジェンシーの条件(高温、低塩濃度、高pH、高濃度のホルムアミドなど)で開始し、これらの条件を徐々にまたは段階的に緩和することができる。これは、異なるアンカープローブプールが除去され、次に、後続のサイクルにおいて加えられる、連続的なハイブリダイゼーションサイクルを必要としうる。そのような方法により、完全に相補的なアンカープローブ(特にシーケンシングプローブにライゲートされることになる遠位端において完全に相補的なアンカープローブ)で占有されるターゲット核酸のパーセンテージが、より高くなる。より多くの完全マッチハイブリッドを得るために、各ストリンジェンシー条件でのハイブリダイゼーション時間も制御することができる。
VIIB(ii).ダブルcPAL(およびそれ以上)
さらなる実施形態において、本発明は、ハイブリダイゼーション-ライゲーションサイクルごとに2つのライゲートされたアンカープローブを利用するcPAL法を提供する。例えば米国特許出願第60/992,485号;同第61/026,337号;同第61/035,914号および同第61/061,134号を参照されたい(これらは特に、引用によりその全てが、そして特に実施例および特許請求の範囲が、本明細書に組み込まれる)。図25は、第1アンカープローブ2502および第2アンカープローブ2505がアダプターの相補的領域にハイブリダイズする、すなわち、第1アンカープローブは第1アンカー部位にハイブリダイズし、第2アンカープローブは第2アダプター部位にハイブリダイズする、「ダブルcPAL」法の一例を図解している。図25に図解する例では、第1アンカープローブ2502がアダプター2511の一領域(第1アンカー部位)に完全に相補的であり、第2アンカープローブ2505が、第1アンカープローブのハイブリダイゼーション位置に隣接するアダプター領域(第2アンカー部位)に相補的である。一般に、第1アンカー部位と第2アンカー部位は隣接している。
第2アンカープローブは、場合によっては、アダプター2511に隣接するターゲット核酸2512の領域にハイブリダイズするように、第1アンカープローブに隣接しない末端に縮重塩基も含みうる。これにより、アダプター/ターゲット境界面からさらに遠く離れたターゲット核酸塩基について、配列情報を生成させることができる。ここでも、本明細書に概説するように、プローブが「縮重塩基」を持つという場合、それは、そのプローブが、実際には、その縮重位置に、考えうる配列の組合せの全てを持つ、プローブのセットを含むことを意味する。例えば、あるアンカープローブが6個の既知塩基と3個の縮重塩基を持つ9塩基長である場合、そのアンカープローブは、実際には、64のプローブのプールである。
第2アンカープローブは、一般に短すぎてその二重鎖ハイブリダイゼーション状態を単独では維持できないが、第1アンカープローブへのライゲーション後は、後続の方法に適した、より長いアンカープローブを形成する。いくつかの実施形態では、第2アンカープローブが、アダプターに相補的な約1〜約5個の塩基と、約5〜約10個の縮重配列の塩基とを持つ。「シングルcPAL」法に関して上で議論したように、ターゲット核酸の検出位置における各塩基タイプを表し、各シーケンシングプローブとその位置に他のヌクレオチドを持つシーケンシングプローブとを区別する検出可能なラベルで標識されている、シーケンシングプローブのプール2508は、アダプター-アンカープローブ二重鎖にハイブリダイズし2509、ライゲートされたアンカープローブの末端5'または3'塩基にライゲートされる。図25に図解する例では、シーケンシングプローブ2514とライゲートされたアンカープローブ2513の間のライゲーション点から5'側に5番目の位置にある塩基を照会するように、シーケンシングプローブがデザインされる。第2アダプタープローブ2505は5つの縮重塩基をその5'末端に持つので、これはターゲット核酸2512中に5塩基分入り込み、ターゲット核酸2512とアダプター2511の間の境界から全部で10塩基の位置を、シーケンシングプローブで照会することを可能にする。図25において、「N」は縮重塩基を表し、「B」は未決定配列のヌクレオチドを表す。理解されるだろうが、いくつかの実施形態では、縮重塩基ではなく、ユニバーサル塩基を使用することができる。
いくつかの実施形態では、第2アンカープローブがアダプターに対応する約5〜10個の塩基と、ターゲット核酸に対応する一般に縮重した約5〜15個の塩基とを持ちうる。この第2アンカープローブは、まず最初に、2つのアンカープローブ間のライゲーション点付近の数塩基が完全マッチで占有されたターゲットのパーセンテージが高くなるような至適条件下で、ハイブリダイズさせることができる。第1アダプタープローブおよび/またはシーケンシングプローブは、単一のステップで、または逐次的に、ハイブリダイズさせ、第2アンカープローブにライゲートすることができる。いくつかの実施形態では、第1および第2アンカープローブが、そのライゲーション点に、アダプターに対して相補的でない約5〜約50個の相補的塩基を持つことで、「分岐(branching-out)」ハイブリッドを形成しうる。このデザインはハイブリダイズした第2アンカープローブのアダプター特異的安定化を可能にする。いくつかの実施形態では、第2アンカープローブが、第1アンカープローブのハイブリダイゼーション前にシーケンシングプローブにライゲートされ、いくつかの実施形態では、第2アンカープローブがシーケンシングプローブのハイブリダイゼーションに先だって第1アンカープローブにライゲートされ、いくつかの実施形態では、第1および第2アンカープローブならびにシーケンシングプローブが同時にハイブリダイズし、ライゲーションが第1アンカープローブと第2アンカープローブの間および第2アンカープローブとシーケンシングプローブの間で同時にまたは本質的に同時に起こり、一方、別の実施形態では、第1アンカープローブと第2アンカープローブの間および第2アンカープローブとシーケンシングプローブの間のライゲーションが、任意の順序で逐次的に起こる。ライゲートしていないプローブの除去には、ストリンジェントな洗浄条件を使用することができる(例えば温度、pH、塩、至適ホルムアミド濃度を持つバッファーはいずれも使用することができ、至適条件および/または濃度は当技術分野で知られる方法を使って決定される)。そのような方法は、アンカープローブとターゲット核酸の間の対応する接合点外でハイブリダイズさせる多数の縮重塩基を持つ第2アンカープローブを利用する方法では、特に役立ちうる。
一定の実施形態において、ダブルcPAL法は、一方のアンカープローブがアダプターに完全に相補的であり、第2のアンカープローブは完全に縮重している(ここでも、実際にはプローブのプールである)という、2つのアンカープローブのライゲーションを利用する。そのようなダブルcPAL法の一例を図26に図解する。ここでは、第1アンカープローブ2602をDNB 2601のアダプター2611にハイブリダイズさせる。第2アンカープローブ2605は完全に縮重しているので、アダプター2611に隣接するターゲット配列2612の領域の未知ヌクレオチドにハイブリダイズすることができる。第2アンカープローブは、短すぎてその二重鎖ハイブリダイゼーション状態を単独で維持することはできないが、第1アンカープローブへのライゲーション後は、より長いライゲートされたアンカープローブコンストラクトの形成により、cPALプロセスの後続ステップに必要な安定性が得られるようにデザインされる。第2完全縮重アンカープローブは、いくつかの実施形態では、約5〜約20塩基長であることができる。長いもの(すなわち10塩基を超えるもの)の場合は、ハイブリダイゼーション条件およびライゲーション条件に変更を加えて、縮重アンカープローブの実効Tmをを低下させることができる。短い第2アンカープローブは一般にターゲット核酸およびアダプターに非特異的に結合するだろうが、その短い長さは、一般に、アダプターおよび第1アンカープローブに隣接する領域に完全に相補的な第2アンカープローブだけが、リガーゼによる第1および第2アンカープローブの接合を可能にする安定性を持ち、より長いライゲートされたアンカープローブコンストラクトを生成することになるような形で、ハイブリダイゼーション速度に影響を及ぼすだろう。非特異的にハイブリダイズした第2アンカープローブは、隣り合ってハイブリダイズした何らかのシーケンシングプローブに、引き続いてライゲートされるのに十分な時間、DNBにハイブリダイズしつづけるだけの安定性を持たないだろう。いくつかの実施形態では、第2および第1アンカープローブのライゲーション後に、ライゲートされていないアンカープローブが全て、通常は洗浄ステップによって除去されることになる。図26において、「N」は縮重塩基を表し、「B」は未決定配列のヌクレオチドを表す。理解されるだろうが、いくつかの実施形態では、縮重塩基ではなく、ユニバーサル塩基を使用することができる。
さらなる例示的実施形態では、第1アンカープローブがアダプターに相補的な3個の塩基と3個の縮重塩基とを含むヘキサマーであり、一方、第2アンカープローブは縮重塩基しか含まず、第1および第2アンカープローブは、縮重塩基を持つ第1アンカープローブの末端だけが第2アンカープローブにライゲートすることになるように、デザインされる。さらなる例示的実施形態では、第1アンカープローブが、アダプターに相補的な3個の塩基と5個の縮重塩基とを含む8マーであり、ここでも第1および第2アンカープローブは、縮重塩基を持つ第1アンカープローブの末端だけが、第2アンカープローブにライゲートすることになるように、デザインされる。これらが例示的実施形態であること、そして第1および第2(そしていくつかの実施形態では第3および/または第4)アンカープローブのいずれの設計にも、既知塩基と縮重塩基の広範囲にわたる組合せを使用できることは、理解されるだろう。
上述したダブルcPAL法の例の変法において、第1アンカープローブが、アダプターの末端に、より近いところで終わる場合、第2アダプタープローブは、それに比例して、より強く縮重することになるので、第1アダプタープローブの末端にライゲートするだけでなく、DNB上の複数の部位で他の第2アダプタープローブにもライゲートする潜在的可能性が、より大きくなる。そのようなライゲーションアーチファクトを防ぐために、第2アンカープローブを、第1アンカープローブまたはシーケンシングプローブへのライゲーションに関与するように、選択的に活性化することができる。そのような活性化には、アンカープローブの末端を、それらが特定のアンカープローブまたはシーケンシングプローブに、アダプターに関して特定の向きでしかライゲートできないように、選択的に修飾するなどの方法が含まれる。例えば、5'および3'ホスフェート基を第2アンカープローブに導入することにより、修飾された第2アンカープローブは、アダプターにハイブリダイズした第1アンカープローブの3'末端にはライゲートできるが、2つの第2アンカープローブが互いにライゲートすることはできない(なぜなら、3'末端がホスホリル化されており、それが酵素的ライゲーションを防止するからである)ようにすることができる。ひとたび第1および第2アンカープローブがライゲートされたら、3'ホスフェート基を(例えばT4ポリヌクレオチドキナーゼまたはシュリンプアルカリホスファターゼおよび仔ウシ腸ホスファターゼなどのホスファターゼで)除去することによって、第2アンカープローブの3'末端を活性化することができる。
第2アンカープローブの3'末端と第1アンカープローブの5'末端の間でライゲーションが起こることを望む場合は、第1アンカープローブを、その5'末端がホスホリル化されるようにデザインしかつ/または修飾することができ、第2アンカープローブを、5'リン酸化も3'リン酸化もされていないようにデザインしかつ/または修飾することができる。この場合も、第2アンカープローブは第1アンカープローブにライゲートできるが、他の第2アンカープローブにはライゲートできないだろう。第1および第2アンカープローブのライゲーションに続いて、第2アンカープローブの遊離末端に(例えばT4ポリヌクレオチドキナーゼを使って)5'ホスフェート基を作ることにより、それを、cPALプロセスの後続のステップにおいてシーケンシングプローブへのライゲーションに利用できるようにすることができる。
いくつかの実施形態では、2つのアンカープローブがDNBに同時に適用される。いくつかの実施形態では、2つのアンカープローブがDNBに逐次的に適用され、一方のアンカープローブを、他方のアンカープローブより先に、DNBにハイブリダイズさせる。いくつかの実施形態では、第2アダプターをシーケンシングプローブにライゲートする前に、2つのアンカープローブが互いにライゲートされる。いくつかの実施形態では、アンカープローブおよびシーケンシングプローブが、単一のステップでライゲートされる。2つのアンカープローブおよびシーケンシングプローブが単一のステップでライゲートされる実施形態では、3つのプローブ(2つのアンカープローブとシーケンシングプローブ)の全てがライゲーションに適した配置につくまでの間、その位置を維持するのに十分な安定性を持つように、第2アダプターをデザインすることができる。例えば、アダプターに相補的な5個の塩基と、アダプターに隣接するターゲット核酸の領域にハイブリダイズさせるための5個の縮重塩基とを含む、第2アンカープローブを使用することができる。そのような第2アンカープローブは、低ストリンジェンシー洗浄で維持されるのに十分な安定性を持つことができるので、第2アンカープローブのハイブリダイゼーションのステップとシーケンシングプローブのハイブリダイゼーションのステップの間に、ライゲーションステップは必要ないだろう。続いて行われるシーケンシングプローブの第2アンカープローブへのライゲーションでは、第2アンカープローブが第1アンカープローブにもライゲートされて、アンカープローブのみまたはシーケンシングプローブのみのいずれと比較しても安定性が増加した二重鎖が得られるだろう。
上述のダブルcPAL法と同じように、3つ以上のアンカープローブによるcPALも本発明に包含されることは理解されるだろう。そのようなアンカープローブは、本明細書に記載する当技術分野で知られる方法に従って、アンカープローブの1つの一端が、末端アンカープローブに隣接してハイブリダイズするシーケンシングプローブへのライゲーションに利用可能であるような形でアダプターの領域にハイブリダイズするように、デザインすることができる。ある例示的実施形態では、3つのアンカープローブを用意する。この場合、2つは、アダプター内の異なる配列に相補的であり、3つ目は、ターゲット核酸内の配列にハイブリダイズするように縮重塩基を含む。さらにもう一つの実施形態では、アダプター内の配列に相補的な2つのアンカーの一方も、一端に1つ以上の縮重塩基を含むことにより、そのアンカープローブが、第3アンカープローブとのライゲーションのためにターゲット核酸中に入り込むことが可能になっていてもよい。さらなる実施形態では、アンカープローブの1つが、アダプターに対して完全にまたは部分的に相補的であることができ、第2および第3のアンカープローブが、ターゲット核酸へのハイブリダイゼーションのために完全に縮重しているだろう。さらなる実施形態では、4つ以上の完全に縮重したアンカープローブを、3つのライゲートされたアンカープローブに逐次的にライゲートして、ターゲット核酸配列内へのさらなるリードの拡張を達成することができる。ある例示的実施形態では、アダプターに相補的な12個の塩基を含む第1アンカープローブが、6個の塩基全てが縮重している第2ヘキサマーアンカープローブとライゲートしうる。同様に完全に縮重したヘキサマーである第3アンカーも、第2アンカープローブにライゲートして、ターゲット核酸の未知配列内にさらに入り込むことができる。未知配列内にさらに入り込むために、第4、第5、第6などのアンカープローブも加えることができる。さらなる実施形態では、本明細書に記載するcPAL法のいずれかに従って、アンカープローブの1つ以上が、そのアンカープローブを「タグ付け(tag)」しかつ/またはDNBのアダプターにハイブリダイズしたそのアンカープローブを同定するのに役立つ1つ以上のラベルを含みうる。
VIIB(iii).蛍光標識されたシーケンシングプローブの検出
上で議論したように、本発明に従って使用されるシーケンシングプローブは、多種多様なラベルで検出可能に標識することができる。以下の説明は主として、シーケンシングプローブがフルオロフォアで標識される実施形態に関するものであるが、他の種類のラベルを含むシーケンシングプローブを利用する類似の実施形態が本発明に包含されることは、理解されるだろう。
複数サイクルのcPAL(シングル、ダブル、トリプルなどを問わない)により、アダプターに隣接するターゲット核酸の領域中の複数の塩基が同定されることになる。簡単に述べると、アンカープローブのハイブリダイゼーション、およびアダプターとターゲット核酸の間の境界面から離れたさまざまな位置にあるヌクレオチドを検出するようにデザインされたシーケンシングプローブプールとの酵素的ライゲーション反応を繰り返すことによって、ターゲット核酸内の複数の隣接塩基を照合するために、cPAL法が繰り返される。任意の所与のサイクルにおいて、使用されるシーケンシングプローブは、1つ以上の位置における1つ以上の塩基の実体(identity)が、そのシーケンシングプローブに取り付けられたラベルの実体(identity)と相互に関係付けられるようにデザインされる。ライゲートされたシーケンシングプローブ(したがって照合位置にある塩基)が検出されたら、ライゲートされた複合体をDNBからはぎ取り、アダプターおよびシーケンシングプローブのハイブリダイゼーションとライゲーションの新しいサイクルを行う。
一般論として、シーケンシングプローブ内の照合位置にある塩基を同定するには一般に4つのフルオロフォアが使用され、ハイブリダイゼーション-ライゲーション-検出サイクルあたり1つの塩基がクエリされる。しかし、理解されるだろうが、8、16、20および24個のフルオロフォアまたはそれ以上を利用する実施形態も、本発明に包含される。フルオロフォアの数を増やすと、任意の1サイクル中に同定されうる塩基の数が増加する。
ある例示的実施形態では、次の構造を持つ7マーのシーケンシングプローブプールのセットを使用する:
3'-F1-NNNNNNAp
3'-F2-NNNNNNGp
3'-F3-NNNNNNCp
3'-F4-NNNNNNTp
「p」はライゲーションに利用できるホスフェートを表し、「N」は縮重塩基を表す。F1〜F4は4つの異なるフルオロフォアを表し、したがって各フルオロフォアは特定塩基と関連づけられる。この例示的プローブセットでは、アダプターにハイブリダイズしたアンカープローブへのシーケンシングプローブのライゲーション時に、アダプターにすぐ隣接する塩基の検出が可能になるだろう。シーケンシングプローブをアンカープローブにライゲートするために使用するリガーゼが、プローブの照合位置にある塩基とターゲット核酸の検出位置にある塩基の間の相補性を識別する限りにおいて、シーケンシングプローブのハイブリダイゼーションおよびライゲーション時に検出される蛍光シグナルは、ターゲット核酸の検出位置にある塩基の実体(identity)を与える。
いくつかの実施形態では、シーケンシングプローブのセットが、3つの弁別的に標識されたシーケンシングプローブを含み、4番目の選択肢であるシーケンシングプローブは未標識のまま残されるだろう。
ハイブリダイゼーション-ライゲーション-検出サイクルを行った後、アンカープローブ-シーケンシングプローブライゲーション産物を取り除き、新しいサイクルを開始する。いくつかの実施形態では、アンカープローブとシーケンシングプローブの間のライゲーション点から6塩基またはそれ以上、かつターゲット核酸とアダプターの境界面から12塩基またはそれ以上の範囲まで、正確な配列情報を得ることができる。同定することができる塩基の数は、ターゲット核酸中にさらに入り込むことができる縮重末端を持つアンカープローブの使用など、本明細書に記載する方法を使って増加させることができる。
イメージの取り込み(imaging acquisition)は、Metamorph(Molecular Devices、カリフォルニア州サニーベール)などの市販イメージングパッケージの使用など、当技術分野で知られる方法を使って行うことができる。データ抽出は、例えばC/C++で書かれた一連のバイナリによって行うことができ、ベースコーリング(base-calling)およびリードマッピング(read-mapping)は、一連のMatlabスクリプトおよびPerlスクリプトによって行うことができる。
ある例示的実施形態では、面に配置されたDNBが、本明細書に記載するように、1サイクルのcPALを受け、利用されるシーケンシングプローブが、4つの異なるフルオロフォア(それぞれがプローブ内の照合位置にある特定塩基に対応する)で標識される。面上に配置された各DNBの塩基の実体(identity)を決定するために、各視野(「フレーム」)が、4つの蛍光標識シーケンシングプローブに対応する4つの異なる波長で撮像される。各サイクルから得られる全ての画像をサイクルディレクトリ(cycle directory)に保存する。この場合、画像の数はフレームの数の4倍である(4つのフルオロフォアを使用する場合)。次に、サイクル画像データを、後続処理用に構成されたディレクトリ構造に保存することができる。
いくつかの実施形態では、データ抽出が2タイプの画像データ、すなわち面上の全てのDNBの位置の境界を画定するための明視野像、および各シーケンシングサイクル中に獲得される蛍光画像のセット、に依拠することになる。データ抽出ソフトウェアを使って、明視野像を持つ全てのオブジェクトを同定することができ、次に、そのオブジェクトのそれぞれについて、ソフトウェアを使って、各シーケンシングサイクルの平均蛍光値を計算することができる。任意の所与のサイクルについて、その塩基がA、G、CまたはTのいずれであるかをクエリするために異なる波長で撮像された4つの画像に対応する4つのデータポイントがある。これらの生データポイント(本明細書では「ベースコール」ともいう)を統合することにより、各DNBについて不連続なシーケンシングリードが得られる。
次に、同定された塩基の集団をアセンブルすることで、ターゲット核酸に関する配列情報を与え、かつ/またはターゲット核酸における特定配列の存在を同定することができる。いくつかの実施形態では、同定された塩基を、複数のDNBで行われる複数のシーケンシングサイクルから得られたオーバーラップ配列の整列によって、完全配列にアセンブルする。本明細書で使用する「完全配列」という用語は、部分ゲノムまたは全ゲノムの配列ならびに部分ターゲット核酸または全ターゲット核酸の配列を指す。さらなる実施形態では、アセンブリ方法が、オーバーラップ配列を「つなぎ合わせ(piece together)」て完全配列を得るために使用することができるアルゴリズムを利用する。さらなる実施形態では、同定された配列を完全配列へとアセンブルするのを補助するために、参照テーブルを使用する。参照テーブルは、選択した生物に関する既存のシーケンシングデータを使って編集することができる。例えばヒトゲノムデータには、国立バイオテクノロジー情報センターを通して、ftp.ncbi.nih.gov/refseq/releaseでアクセスするか、またはJ. Craig Venter Instituteを通して、http://www.jcvi.org/researchhuref/でアクセスすることができる。ヒトゲノム情報の全てまたはサブセットを使って、特定のシーケンシングクエリのための参照テーブルを作成することができる。さらにまた、ヒトゲノム内での変動は、そこに含まれる情報の起源に依存して、参照データにある傾向を与えうるので、特別な民族性、地理的遺伝形質を持つヒト、宗教または文化的に規定される集団からの遺伝子配列を含む、特別な集団から導き出された実験データから、特別な参照テーブルを構築することもできる。
本明細書で議論する本発明の実施形態のいずれにおいても、核酸テンプレートおよび/またはDNBの集団は、ゲノム全体またはターゲットポリヌクレオチド全体を実質的にカバーするように、いくつかのターゲット核酸を含みうる。本明細書にいう「実質的にカバーする」とは、解析されるヌクレオチド(すなわちターゲット配列)の量が、少なくとも2コピー、別の態様では少なくとも10コピー、別の態様では少なくとも20コピー、別の態様では少なくとも100コピーのターゲットポリヌクレオチドに相当するものを含有することを意味する。ターゲットポリヌクレオチドは、ゲノムDNAフラグメントおよびcDNAフラグメントなどのDNAフラグメント、ならびにRNAフラグメントを含みうる。ターゲットポリヌクレオチド配列を再構築するステップに関する指針は、次の参考文献に見いだすことができ、これらは引用により本明細書に組み込まれる:Landerら, Genomics, 2:231-239 (1988);Vingronら, J. Mol. Biol., 235:1-12 (1994)などの参考文献。
VIIB(iv).プローブのセット
理解されるだろうが、シーケンシングとアンカープローブの異なる組合せを、上述のさまざまなcPAL法に従って使用することができる。本発明において役立つプローブのセット(本明細書では「プローブのプール」ともいう)に関する以下の説明は、例示的実施形態であり、本発明がこれらの組合せに限定されないことは理解されるだろう。
ある態様では、プローブのセットが、アダプターから特定の距離にある位置のヌクレオチドの同定用にデザインされる。例えば一定のプローブセットを使って、アダプターから最大3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30個およびそれ以上離れた位置の塩基を同定することができる。上で議論したように、アダプターに隣接するターゲット核酸中に入り込んで、シーケンシングプローブがアダプターからさらに離れてライゲートできるようにし、よってアダプターからさらに離れた塩基の実体(identity)が与えられるように、一端に縮重塩基を持つアンカープローブをデザインすることができる。
ある例示的実施形態では、プローブのセットが、アダプターの隣接する領域にハイブリダイズするようにデザインされた少なくとも2つのアンカープローブを含む。ある実施形態では、第1アンカープローブがアダプターの一領域に完全に相補的であり、一方、第2アンカープローブはアダプターの隣接する領域に相補的である。いくつかの実施形態では、第2アンカープローブが、アダプターに隣接したターゲット核酸中に伸びて、ターゲット核酸中のヌクレオチドにハイブリダイズする1つ以上の縮重ヌクレオチドを含むだろう。ある例示的実施形態では、第2アンカープローブが少なくとも1〜10個の縮重塩基を含む。さらにもう一つの例示的実施形態では、第2アンカープローブが2〜9、3〜8、4〜7、および5〜6個の縮重塩基を含む。さらにもう一つの例示的実施形態では、第2アンカープローブが、1つ以上の縮重塩基を、その配列の一端もしくは両端および/または内部領域内に含む。
さらにもう一つの実施形態では、プローブのセットが、ターゲット核酸内の1つ以上の検出位置における塩基決定のための、1つ以上のシーケンシングプローブ群も含むだろう。ある実施形態では、セットが、ターゲット核酸内の約1〜約20の位置を同定するのに十分な、異なるシーケンシングプローブ群を含む。さらにもう一つの例示的実施形態では、セットが、ターゲット核酸内の約2〜約18、約3〜約16、約4〜約14、約5〜約12、約6〜約10、および約7〜約8個の位置を同定するのに十分なシーケンシングプローブ群を含む。
さらなる例示的実施形態では、標識またはタグ付きプローブの10個のプールが本発明に従って使用されるだろう。さらなる実施形態では、プローブのセットが、異なる配列を持つ2つ以上のアンカープローブを含むだろう。さらなる実施形態では、プローブのセットが、異なる配列を持つ3、4、5、6、7、8、9、10、11、12、13、14、15個またはそれ以上のアンカープローブを含むだろう。
さらにもう一つの例示的実施形態では、1つ以上のシーケンシングプローブ群と3つのアンカープローブとを含む、プローブのセットが用意される。第1アンカープローブはアダプターの第1領域に相補的であり、第2アンカープローブはアダプターの第2領域に相補的であり、第2領域および第1領域は互いに隣接している。第3アンカープローブは3つ以上の縮重ヌクレオチドを含み、アダプターに隣接したターゲット核酸中のヌクレオチドにハイブリダイズすることができる。第3アンカープローブは、いくつかの実施形態では、アダプターの第3領域に相補的であってもよく、その第3領域は、第2アンカープローブが第1アンカープローブと第3アンカープローブに挟まれるような形で第2領域に隣接することができる。
いくつかの実施形態では、アンカーおよび/またはシーケンシングプローブのセットがさまざまな濃度の各タイプのプローブを含み、そのさまざまな濃度が、一つには、アンカープローブに含まれうる縮重塩基に依存しうる。例えば、低いハイブリダイゼーション安定性を持つであろうプローブ、例えばAおよび/またはTの数が多いプローブは、それらの低い安定性を相殺する方法として、高い相対濃度で存在させることができる。さらなる実施形態では、相対濃度のこれらの相違が、より小さなプローブプールを個別に調製してから、それら個別に作成されたプローブプールを適正な量で混合することによって確立される。
VIIB(v).他のシーケンシング方法
ある態様では、本発明の方法および組成物を、WO2007120208、WO2006073504、WO2007133831、およびUS2007099208、ならびに米国特許出願第60/992,485号;同第61/026,337号;同第61/035,914号;同第61/061,134号;同第61/116,193号;同第61/102,586号;同第12/265,593号;同第12/266,385号;同第11/938,096号;同第11/981,804号;同第11/981,797号;同第11/981,793号;同第11/981,767号;同第11/981,761号;同第11/981,730号;同第11/981,685号;同第11/981,661号;同第11/981,607号;同第11/981,605号;同第11/927,388号;同第11/927,356号;同第11/679,124号;同第11/541,225号;同第10/547,214号;同第11/451,692号;および同第11/451,691号(これらは全て、あらゆる目的で、特にシーケンシング、とりわけコンカテマーのシーケンシングに関する全ての教示内容について、引用によりその全てが本明細書に組み込まれる)に記載されているような技法と組み合わせて使用する。
さらにもう一つの態様では、DNBの配列が、当技術分野で知られているシーケンシング方法、例えば限定するわけではないが、Drmanacの米国特許第6,864,052号;同第6,309,824号;および同第6,401,267号ならびにDrmanacらの米国特許出願公開第2005/0191656号に開示されているようなハイブリダイゼーションに基づく方法;ならびに合成によるシーケンシング法、例えばNyrenらの米国特許第6,210,891号;Ronaghiの米国特許第6,828,100号;Ronaghiら (1998), Science, 281:363-365;Balasubramanianの米国特許第6,833,246号;Quakeの米国特許第6,911,345号;Liら, Proc. Natl. Acad. Sci., 100:414-419 (2003);SmithらのPCT公開WO2006/074351;ならびにライゲーションに基づく方法、例えばShendureら (2005), Science, 309:1728-1739, Macevicz, 米国特許第6,306,597号(これらの参考文献はそれぞれ、あらゆる目的で、特に組成物、組成物の使用方法および組成物の製造方法を、特にシーケンシングに関連して、説明する図面、凡例および付随する本文に関する教示内容について、引用によりその全てが本明細書に組み込まれる)などを使って同定される。
いくつかの実施形態では、本発明の核酸テンプレート、ならびにそれらのテンプレートから作製されるDNBが、合成によるシーケンシング法で使用される。本発明の核酸テンプレートを利用する合成によるシーケンシング法の効率は、複数の散在アダプターを含まない核酸を利用する従来の合成によるシーケンシング法よりも増大する。本発明の核酸テンプレートでは、単一の長いリードではなく、それぞれがテンプレート中のアダプターの一つで始まる複数の短いリードが可能である。そのような短いリードは、消費する標識dNTP類が少なく、したがって試薬類のコストの節約になる。さらにまた、合成によるシーケンシング反応は、高密度のシーケンシングターゲットならびにモノマー単位の多重コピーを与えるDNBアレイで行うことができる。そのようなアレイは、単分子レベルで検出可能なシグナルを与えると同時に、配列情報の量を増加させる。なぜなら、DNBモノマー単位は大半がまたは全てが、シーケンシングフェーズを失うことなく(without losing sequencing phase)、伸長されるだろうからである。アレイの高密度も試薬コストを下げ、いくつかの実施形態では、試薬コストの削減が、従来の合成によるシーケンシグ法よりも約30〜約40%になりうる。いくつかの実施形態では、本発明の核酸テンプレートの散在アダプターが、互いに約30〜約100塩基離れた距離に挿入されるのであれば、約2〜約10の標準的リードを結合する方法を与える。そのような実施形態では、新たに合成された鎖をさらなるシーケンシングサイクルのためにはぎ取る必要がなく、したがって、約100〜約400の合成によるシーケンシングサイクルの間、単一のDNBアレイを使用することが可能になるだろう。
VIIC.2フェーズ(two-phase)シーケンシング
ある態様において、本発明は、「2フェーズ」シーケンシング(本明細書では「ショットガンシーケンシング」ともいう)のための方法を提供する。そのような方法は、2008年12月1日に出願された米国特許出願第12/325,922号に記載されており、この特許出願は、あらゆる目的で、特に2フェーズまたはショットガンシーケンシングに関係する全ての教示内容について、引用によりその全てが本明細書に組み込まれる。
一般に、本発明において役立つ2フェーズシーケンシング法は、次のステップを含む:(a)ターゲット核酸をシーケンスして、1つ以上の関心対象配列を含む一次ターゲット核酸配列を生成させる;(b)複数のターゲット特異的オリゴヌクレオチドを合成する、ここで、前記複数のターゲット特異的オリゴヌクレオチドのそれぞれは関心対象配列の少なくとも一つに対応する;(c)複数のターゲット特異的オリゴヌクレオチドにハイブリダイズするターゲット核酸のフラグメント(またはそのようなフラグメントを含み、かつ、本明細書に記載するようにアダプターおよび他の配列をさらに含みうる、コンストラクト)のライブラリーを用意する;そして(d)フラグメント(またはそのようなフラグメントを含むコンストラクト)のライブラリーをシーケンスして、二次ターゲット核酸配列を生成させる。ヒトゲノムDNAなどのゲノムDNAの一次配列において、失われた配列によるギャプを閉じ、低確信度ベースコールを解消するには、これらの方法のために合成されるターゲット特異的オリゴヌクレオチドの数が約1万〜約100万になりうるので、本発明では、少なくとも約10,000のターゲット特異的オリゴヌクレオチド、または約25,000、または約50,000、または約100,000、または約20,000、または約50,000、または約100,000、または約200,000またはそれ以上のターゲット特異的オリゴヌクレオチドの使用が考えられる。
複数のターゲット特異的オリゴヌクレオチドが関心対象配列の少なくとも一つ「に対応する」とは、そのようなターゲット特異的オリゴヌクレオチドが、そのようなオリゴヌクレオチドにハイブリダイズするターゲット核酸のフラグメントが関心対象の配列を含む可能性が高くなるように、関心対象配列の近傍に、例えば限定するわけではないが、関心対象配列に隣接して、ターゲット核酸にハイブリダイズするようにデザインされることを意味する。したがって、そのようなターゲット特異的オリゴヌクレオチドは、そのような関心対象配列が濃縮されたフラグメントのライブラリーを作成するためのハイブリッド捕捉方法にとって、または関心対象配列をシーケンスするためのシーケンシングプライマーとして、または関心対象配列を増幅するための増幅プライマーとして、または他の目的にとって有用である。
本発明によるショットガンシーケンシングおよび他のシーケンシング方法において、シーケンシングリードのアセンブリ後は、ギャップが存在すること、または配列の特定部位にある1つ以上の塩基または塩基のストレッチにおいて確信度が低いことは、アセンブルされた配列から、当業者にとって明白である。そのようなギャップ、低確信度配列、または特定の位置に単に異なる配列(すなわちターゲット配列中の1つ以上のヌクレオチドの変化)を含みうる関心対象配列は、一次ターゲット核酸配列を参照配列と比較することによって同定することもできる。
そのような方法の一実施形態によれば、ターゲット配列のシーケンシングによる一次ターゲット核酸配列の生成が、配列リーディングのコンピュータ入力および配列リーディングのコンピュータアセンブリによる一次ターゲット核酸配列の生成を含む。さらにまた、ターゲット特異的オリゴヌクレオチドのデザインをコンピュータ化し、ターゲット特異的オリゴヌクレオチドのそのようなコンピュータ化された合成を、配列リーディングのコンピュータ入力およびアセンブリならびにターゲット特異的オリゴヌクレオチドのデザインと統合することができる。これは、とりわけ有用である。というのも、合成されるべきターゲット特異的オリゴヌクレオチドの数は、例えばヒトなどの高等生物のゲノムの場合は、数万または数十万にものぼりうるからである。したがって本発明は、決定された配列およびさらなる処理のために同定された領域からオリゴヌクレオチドプールを生成させるプロセスの自動化された統合(automated integration)を提供する。いくつかの実施形態では、コンピュータ駆動プログラムが、同定された領域、およびその同定された領域に近接または隣接する、決定された配列を使って、これらの領域をカバーする新しいフラグメントを単離しかつ/または生成させるためのオリゴヌクレオチドをデザインする。次に、それらのオリゴヌクレオチドを本明細書に記載するように使用して、例えば第1シーケンシングライブラリーから、または第1シーケンシングライブラリーの前駆体から、または同じターゲット核酸から作成された異なるシーケンシグライブラリーから、またはターゲット核酸から直接的に、フラグメントを単離する。さらなる実施形態では、さらなる解析のための領域の同定と第2のライブラリーの単離/作成との、この自動化された統合により、オリゴヌクレオチドプール内のオリゴヌクレオチドの配列が規定され、これらのオリゴヌクレオチドの合成が指示される。
本発明の2フェーズシーケンシング法のいくつかの実施形態では、ハイブリッド捕捉プロセス後に遊離プロセスが行われ、この技術の別の態様では、増幅プロセスが第2シーケンシングプロセスの前に行われる。
さらなる実施形態では、決定された配列を参照配列と比較することにより、一部または全ての領域が、同定ステップにおいて同定される。いくつかの態様では、第2ショットガン・シーケンシング・ライブラリーが、参照配列に基づくオリゴヌクレオチドを含むオリゴヌクレオチドのプールを使って単離される。また、いくつかの態様では、オリゴヌクレオチドのプールが、異なる配列を持つ少なくとも1000個のオリゴヌクレオチドを含み、別の態様では、オリゴヌクレオチドのプールが、異なる配列を持つ少なくとも10,000、25,000、50,000、75,000、または100,000個もしくはそれ以上のオリゴヌクレオチドを含む。
本発明のいくつかの態様では、この2フェーズシーケンシング法で使用されるシーケンシングプロセスの1つ以上がライゲーションによるシーケンシング(sequencing-by-ligation)によって行われ、別の態様では、シーケンシングプロセスの1つ以上がハイブリダイゼーションによるシーケンシング(sequencing-by-hybridization)または合成によるシーケンシング(sequencing-by-synthesis)によって行われる。
本発明の一定の態様では、複雑なターゲット核酸の約1〜約30%が、この方法のフェーズII(Phase II)で再シーケンスされる必要があると同定され、別の態様では複雑なターゲット核酸の約1〜約10%が、本方法のフェーズIIで再シーケンスされる必要があると同定される。いくつかの態様では、同定された複雑なターゲット核酸のパーセンテージに関するカバレッジが約25倍〜約100倍である。
さらなる態様では、本方法のフェーズIIで再シーケンスされる各ターゲット核酸領域について、1〜約10個のターゲット特異的選択オリゴヌクレオチドが規定されて、合成され;別の態様では、本法のフェーズIIで再シーケンスされる各ターゲット核酸領域について、約3〜約6個のターゲット特異的選択オリゴヌクレオチドが規定される。
この技術のさらなる態様では、ターゲット特異的選択オリゴヌクレオチドが自動化されたプロセスによって同定、合成され、ここでは、核酸配列が欠けているか低確信度の核酸配列を持つ複雑な核酸の領域を同定し、ターゲット配列選択オリゴヌクレオチドの配列を規定するプロセスが、ターゲット特異的選択オリゴヌクレオチドを合成するためのオリゴヌクレオチド合成ソフトウェアおよびハードウェアと交信する。この技術の他の態様では、ターゲット特異的選択オリゴヌクレオチドが約20〜約30塩基長であり、いくつかの態様では無修飾である。
さらなる解析のために同定された全ての領域が、複雑なターゲット核酸中に実際に存在するわけではない場合もありうる。ある領域におけるカバレッジの欠如が予測される理由の一つとして、複雑なターゲット核酸中に存在すると予想される領域が実際には存在せず(例えばある領域がそのターゲット核酸中では欠失または再配列を起こしている)、したがってそのプールから作成されるオリゴヌクレオチドの全てが、第2のショットガン・シーケンシング・ライブラリーに含めるためのフラグメントを単離するわけではないかもしれないことを挙げることができる。いくつかの実施形態では、さらなる解析のために同定された各領域について、少なくとも1つのオリゴヌクレオチドがデザインされ作製される。さらなる実施形態では、さらなる解析のために同定された各領域について、平均して3つ以上のオリゴヌクレオチドが用意されるだろう。ターゲット核酸から誘導されたテンプレートを使ったオリゴヌクレオチドのポリメラーゼ伸長による、第2のショットガン・シーケンシング・ライブラリーの作成に、オリゴヌクレオチドのプールを直接使用できることは、本発明の特徴である。オリゴヌクレオチドプールとサークル依存的複製とを使ったサークル依存的複製によるアンプリコンの作製に、オリゴヌクレオチドのプールを直接使用できることは、本発明のもう一つの特徴である。存在しない関心領域(例えば解析のために同定されたが欠失または再配列などによって存在しない予想領域)を同定するためのシーケンシング情報を与えることは、本発明のもう一つの特徴である。
2フェーズシーケンシング法の上述の実施形態は、本明細書に記載する、および当技術分野で知られている、核酸コンストラクトおよびシーケンシング法のどれとでも、組み合わせて使用することができる。
VIID.SNP検出
上で議論した方法および組成物は、さらなる実施形態において、DNBなどの核酸コンストラクト中の特異的配列を検出するために使用することができる。特に、シーケンシングおよびアンカープローブを利用するcPAL法を使って、一塩基多型(SNP)を含む多型または遺伝子突然変異に関係する配列を検出することができる。例えば、SNPの存在を検出するために、一方のプローブを他方のプローブと比較して検出することで、試料中に多型が存在するかどうかを示すことになるように、2セットの弁別的に標識されたシーケンシングプローブを使用することができる。そのようなシーケンシングプローブは、SNPの検出の特異性と効率をさらに改善するために、上述のcPAL法と類似する方法でアンカープローブと一緒に使用することができる。
VIII.例示的実施形態
ある態様では、本発明は、ターゲット核酸中の配列を決定するための方法を提供する。この方法は、(a)ターゲット核酸のフラグメントと少なくとも第1アンカー部位を含むアダプターとを含むシーケンシングテンプレートを提供するステップ;(b)アンカープローブをアンカー部位にハイブリダイズさせるステップ、ここで、アンカープローブはアダプター部位に相補的な領域とターゲット核酸配列に結合するための3つ以上の縮重塩基とを含む;(c)アダプターに対して所定の位置にある1つ以上のヌクレオチドの配列を決定するためのシーケンシングプローブのプールをハイブリダイズさせるステップ、ここで、シーケンシングプローブは、特定塩基の存在を同定するために検出可能に標識される;(d)アンカープローブとシーケンシングプローブをライゲートするステップ;および(e)シーケンシングプローブを検出し、それによってターゲット核酸中の配列を決定するステップを含む。
さらにもう一つの態様において、上記のいずれかに従って、本発明は、複数の検出位置を含むターゲット配列の検出位置にある第1ヌクレオチドの同定を決定する方法を提供する。この方法は、(a)複数のコンカテマーを持つ面を提供するステップ、ここで、各コンカテマーは複数のモノマーを含み、各モノマーは(i)ターゲット検出位置の第1セットを含むターゲット配列の第1ターゲットドメインと、(ii)少なくとも、(1)第1アンカー部位と(2)第2隣接アンカー部位とを含む第1アダプターとを含む;(b)第2アンカープローブを第1アンカー部位にハイブリダイズさせるステップ;(c)第2アンカープローブを第2アンカー部位にハイブリダイズさせるステップ、ここで、第2アンカープローブは第2アンカー部位外の配列にもハイブリダイズする;(d)ユニークヌクレオチドが第1ヌクレオチドに相補的であるならばシーケンシングプローブがコンカテマーにハイブリダイズするような条件下で、少なくとも第1シーケンシングプローブを第1ターゲットドメインにハイブリダイズさせるステップ、ここで、第1シーケンシングプローブは(i)ターゲットドメインに相補的な第1プローブドメインと、(ii)第1照合位置にあるユニークヌクレオチドと、(iii)ラベルとを含む;(e)アンカープローブとシーケンシングプローブとをライゲートするステップ;および(f)第1ヌクレオチドを同定するステップを含む。
ある実施形態において、上記のいずれかに従って、本発明は、ターゲット配列の検出位置の第1ヌクレオチドの同定を決定する方法であって、シーケンシングプローブのセットを、複数のコンカテマーを含む面と接触させる方法を提供する。この実施形態では、各シーケンシングプローブが、(a)ターゲットドメインに相補的な第1プローブドメインと、(b)第1照合位置にあるユニークヌクレオチドと、(c)ラベルとを含み;ここで、セットの各ラベルは、ユニークヌクレオチドに対応する。
さらにもう一つの実施形態では、上記のいずれかに従って、コンカテマー中のモノマーのそれぞれが複数のアダプターを含む。
さらにもう一つの実施形態では、上記のいずれかに従って、コンカテマー中のアダプターの少なくとも1つが、少なくとも1つのタイプIIsエンドヌクレアーゼ認識部位を含む。
さらにもう一つの実施形態では、上記のいずれかに従って、第1アンカープローブを第1アンカー部位にハイブリダイズさせるステップ;第2アンカープローブを第2アンカー部位にハイブリダイズさせるステップ;少なくとも第1シーケンシングプローブを第1ターゲットドメインにハイブリダイズさせるステップ;およびアンカープローブとシーケンシングプローブをライゲートするステップが、第2検出位置の第2ヌクレオチドを同定するために繰り返される。
さらにもう一つの実施形態では、上記のいずれかに従って、第2アンカープローブが、第2アンカー部位外の配列にハイブリダイズする少なくとも3つの縮重塩基を含む第2アンカープローブのセットを含む。
さらにもう一つの実施形態では、上記のいずれかに従って、第2アンカープローブが、ライゲーションのために選択的に活性化されうる少なくとも一つの末端を含む。
さらにもう一つの実施形態では、上記のいずれかに従って、複数のコンカテマーを持つ面が、官能化された面である。さらにもう一つの実施形態では、面が、アミン、シラン、およびヒドロキシルを含む群から選択される官能成分で官能化される。
さらにもう一つの実施形態では、上記のいずれかに従って、面が、固定化されたコンカテマーを含む複数の空間的に異なる領域(spatially distinct region)を含む。
さらにもう一つの実施形態では、上記のいずれかに従って、コンカテマーが捕捉プローブを使って面上に固定化される。
さらにもう一つの実施形態では、上記のいずれかに従って、ゲノム核酸がフラグメント化されて、ターゲット配列を形成する。
さらにもう一つの実施形態では、上記のいずれかに従って、ターゲット配列がゲノム核酸配列である。
さらにもう一つの実施形態では、上記のいずれかに従って、ゲノム核酸配列がヒト配列である。
ある態様では、上記のいずれかに従って、本発明は、本明細書に記載するプローブのセットを含みうるシーケンシングテンプレートと共に使用するためのキットを提供する。一般に本発明のキットは、アンカープローブ対、アンカープローブ対とテンプレート中のターゲット核酸に隣接する追加のアンカープローブ、および核酸テンプレート中の特定位置における塩基決定のためのシーケンシングプローブを含むことができる。そのようなキットは、本方法で使用するための核酸テンプレートの作製に使用されるアダプターを、さらに含むことができる。
ある態様では、上記のいずれかに従って、本発明は、標識またはタグ付きプローブの10個のプール、異なる配列を持つ4つ以上のプローブを含むアンカープローブのセット、3つ以上の縮重塩基を持つアンカープローブのセット、およびリガーゼを含む、核酸シーケンシングシステムを提供する。さらにもう一つの実施形態では、核酸シーケンシングシステムが、アンカープローブ、シーケンシングプローブ、およびライゲートされたシーケンシングプローブとアンカープローブを核酸テンプレートから変性させるための薬剤を、さらに含むだろう。
[実施例1]
DNBの作製
1つ以上のアダプターが散在しているターゲット核酸を含む本発明の核酸テンプレートからDNB(本明細書では「アンプリコン」ともいう)を作製するための例示的プロトコールを以下に述べる。一本鎖線状核酸テンプレートをまず、ホスホリル化された5'プライマーとビオチン化された3'プライマーとによる増幅にかけて、ビオチンでタグ付けされた二本鎖線状核酸テンプレートを得る。
まず最初に、MagPrepストレプトアビジンビーズ(Novagen製品番号70716-3)を、1×ビーズ結合バッファー(ヌクレアーゼフリー水中の150mM NaClおよび20mMトリス、pH7.5)に、ヌクレアーゼフリー微量遠心チューブ中で再懸濁することによって、ストレプトアビジン磁気ビーズを調製した。そのチューブを磁気チューブラックに入れ、磁気粒子を清澄化して、上清を取り出して捨てた。次に、ビーズを800μlの1×ビーズ結合バッファーで2回洗浄し、80μlの1×ビーズ結合バッファーに再懸濁した。PCR反応から得られる増幅された核酸テンプレート(本明細書では「ライブラリーコンストラクト」ともいう)を体積60μlにし、20μlの4×ビーズ結合バッファーをチューブに加えた。次に、MagPrepビーズが入っているチューブに核酸テンプレートを加え、穏やかに混合し、室温で10分間インキュベートし、MagPrepビーズを清澄化した。上清を取り出して捨てた。次に、MagPrepビーズ(増幅されたライブラリーコンストラクトと混合したもの)を800μlの1×ビーズ結合バッファーで2回洗浄した。洗浄後に、MagPrepビーズを80μlの0.1N NaOHに再懸濁し、穏やかに混合し、室温でインキュベートし、清澄化した。上清を取り出して、新しいヌクレアーゼフリーチューブに加えた。4μlの3M酢酸ナトリウム(pH5.2)を各上清に加え、穏やかに混合した。
次に、420μlのPBIバッファー(QIAprep PCR Purification Kitと共に供給されるもの)を各チューブに加え、試料を混合してから、2mlコレクションチューブに入れたQIAprep Miniprepカラム(Qiagen製品番号28106)に適用し、14,000rpmで1分間、遠心分離した。素通り画分を捨て、0.75mlのPEバッファー(QIAprep PCR Purification Kitと共に供給されるもの)を各カラムに加え、カラムをさらに1分間遠心分離した。再び素通り画分を捨てた。カラムを新しいチューブに移し、50μlのEBバッファー(QIAprep PCR Purification Kitと共に供給されるもの)を加えた。カラムを14,000で1分間遠心して、一本鎖核酸テンプレートを溶出させた。次に各試料の量を測定した。
CircLigaseを使った一本鎖テンプレートの環状化:まず最初に、10pmolの一本鎖線状核酸テンプレートをヌクレアーゼフリーPCRチューブに移した。ヌクレアーゼフリー水を加えて反応体積を30μlにし、試料を氷上に保った。次に、4μlの10×CircLigase反応バッファー(Epicentre製品番号CL4155K)、2μlの1mM ATP、2μlの50mM MnCl2、および2μlのCircLigase(100U/μl)(これらをまとめて4×CircLigase Mixという)を各チューブに加え、試料を60℃で5分間インキュベートした。さらに10μlの4×CircLigase Mixを各チューブに加え、試料を60℃で2時間、80℃で20分インキュベートした後、4℃でインキュベートした。次に各試料の量を測定した。
エキソヌクレアーゼ消化によるCircLigase反応からの残存線状DNAの除去。まず最初に、30μlの各CircLigase試料をヌクレアーゼフリーPCRチューブに加え、次に3μlの水, 4μlの10×エキソヌクレアーゼ反応バッファー(New England Biolabs製品番号B0293S)、1.5μlのエキソヌクレアーゼI(20U/μl、New England Biolabs製品番号M0293L)、および1.5μlのエキソヌクレアーゼIII(100U/μl、New England Biolabs製品番号M0206L)を各試料に加えた。これらの試料を37℃で45分間インキュベートした。次に、75mM EDTA、pH8.0を各試料に加え、試料を85℃で5分間インキュベートした後、4℃まで下げた。次に試料を清浄なヌクレアーゼフリーチューブに移した。次に、500μlのPNバッファー( QIAprep PCR Purification Kitと共に供給されるもの)を各チューブに加え、混合し、試料を2mlコレクションチューブ中のQIAprep Miniprepカラム(Qiagen製品番号28106)に適用し、14,000rpmで1分間遠心分離した。素通り画分を捨て、0.75mlのPEバッファー(QIAprep PCR Purification Kitと共に供給されるもの)を各カラムに加え、カラムをさらに1分間遠心分離した。ふたたび素通り画分を捨てた。カラムを新しいチューブに移し、40μlのEBバッファー(QIAprep PCR Purification Kitと共に供給されるもの)を加えた。カラムを14,000で1分間遠心して、一本鎖ライブラリーコンストラクトを溶出させた。次に各試料の量を測定した。
DNB作製のためのサークル依存的複製:核酸テンプレートをサークル依存的複製に付して、ターゲット核酸とアダプター配列のコンカテマーを含むDNBを生成させた。40fmolのエキソヌクレアーゼ処理一本鎖サークルをヌクレアーゼフリーPCRストリップチューブに加え、水を加えて最終体積を10.0μlにした。次に10μlの2×プライマーミックス(7μlの水、2μlの10×phi29反応バッファー(New England Biolabs製品番号B0269S)、および1μlのプライマー(2μM))を各チューブに加え、そのチューブを室温で30分間インキュベートした。次に、20μlのphi29ミックス(14μlの水、2μlの10×phi29反応バッファー(New England Biolabs製品番号B0269S)、3.2 dNTPミックス(各2.5mMのdATP、dCTP、dGTPおよびdTTP)、ならびに0.8μlのphi29 DNAポリメラーゼ(10U/μl、New England Biolabs製品番号M0269S))を各チューブに加えた。次に、そのチューブを30℃で120分間インキュベートした。次にチューブを取り出し、75mM EDTA、pH 8.0を各試料に加えた。次にサークル依存的複製産物の量を測定した。
DNB量の決定:DNBの量を決定した後、色純度を調べることによって、DNBの品質を評価した。DNBをアンプリコン希釈バッファー(0.8×phi29反応バッファー(New England Biolabs製品番号B0269S)および10mM EDTA、pH8.0)に懸濁し、さまざまな希釈液をフロースライドのレーンに入れ、30℃で30分間インキュベートした。次に、フロースライドをバッファーで洗浄し、Cy5、テキサスレッド、FITCまたはCy3で標識された4つの異なるランダム12マープローブを含有するプローブ溶液を、各レーンに加えた。フロースライドを30℃に予熱したホットブロックに移し、30℃で30分間インキュベートした。次に、Imager 3.2.1.0ソフトウェアを使って、フロースライドを撮像した。次に、サークル依存的複製産物の量を測定した。
[実施例2]
シングルおよびタブルc-PAL
異なる長さの完全に縮重した第2アンカープローブを2アンカープローブ検出システムで試験した。使用した組合せは次のとおりである:1)ターゲット核酸に隣接するアダプターに結合するアンカーと、9マーのシーケンシングプローブとを使って、アダプターから4番目の位置を読む、標準的1アンカーライゲーション;2)同じ第1アンカーおよび縮重した5マーを含む第2アンカーと、9マーのシーケンシングプローブとを使って、アダプターから9番目の位置を読む、2アンカーライゲーション;3)同じ第1アンカーおよび縮重した6マーを含む第2アンカーと、9マーのシーケンシングプローブとを使って、アダプターから10番目の位置を読む、2アンカーライゲーション;ならびに4)同じ第1アンカーおよび縮重した8マーを含む第2アンカーと、9マーのシーケンシングプローブとを使って、アダプターから12番目の位置を読む、2アンカーライゲーション。1μMの第1アンカープローブと6μMの縮重第2アンカープローブとをリガーゼ反応バッファー中でT4 DNAリガーゼと混合し、反応スライドの表面に30分間適用した後、未反応のプローブおよび試薬をスライドから洗い流した。リガーゼと、5'Fl-NNNNNBNNN、または5'Fl-NNBNNNNNN、5'Fl-NNNBNNNNN、5'Fl-NNNNBNNNNタイプの蛍光プローブとを含有する第2反応混合物を導入した。Flは4つのフルオロフォアのうちの1つを表し、Nは、ランダムに導入された4つの塩基A、G、C、またはTの任意の1つを表し、Bは、フルオロフォアと特異的に関連づけられた4つの塩基A、G、C、またはTの1つを表す。1時間のライゲーション後に、未反応のプローブおよび試薬をスライドから洗い流し、各DNAターゲットに付随する蛍光をアッセイした。
図27は、これらの系において異なる長さの縮重第2アンカープローブに付随するシグナル強度を示しており、第2アンカープローブの長さの増加に伴って強度は減少する。図28に見られるように、そのような強度に関するフィットスコアも縮重第2アンカーの長さと共に減少したが、塩基10リードまでは依然として妥当なフィットスコアを生成した。
1アンカープローブ法および2アンカープローブ法を使った時間の効果を図29および図30に図解する。標準アンカーと縮重5マーの両方を9マーシーケンシングプローブと一緒に使って、それぞれ、アダプターから4番目および9番目の位置を読んだ。強度レベルは、2アンカープローブ法の方が大きく異なったが、標準的1アンカー法と2アンカープローブ法はどちらも、両方の時点で、それぞれ0.8を超える同程度のフィットスコアを示した。
縮重第2アンカープローブ長が強度およびフィットスコアに及ぼす効果:第2アンカープローブの長さと組成が異なる第1および第2アンカープローブの異なる組合せを使って、アダプターの5'側にある塩基を同定するために使用した場合に、縮重アンカープローブがシグナル強度およびフィットスコアに及ぼす効果を比較した。標準的1アンカー法を、アダプターに相補的な何らかの領域を持つ部分的に縮重したプローブまたは完全に縮重した第2アンカープローブによる2アンカープローブ法を使ったシグナル強度およびフィットスコアと比較した。5マー〜9マーの縮重第2アンカープローブを1つの濃度で使用し、これらのうちの2つ、すなわち6マーおよび7マーは、4倍濃度でも試験した。アダプターに相補的な2つのヌクレオチドと3'末端の異なる長さの縮重ヌクレオチドとを含む第2アンカープローブも、第1の濃度で試験した。各反応では、ターゲット核酸中のリード位置に存在するヌクレオチドを同定するために、同じ、4つのシーケンシングプローブのセットを利用した。
実験で使用した組合せは次のとおりである:
反応1:1μMの12塩基第1アンカープローブ
第2アンカープローブなし
リード位置:アダプター末端から2つめのヌクレオチド
反応2:1μMの12塩基第1アンカープローブ
20μMの5縮重塩基第2アンカープローブ
リード位置:アダプター末端から7番目のヌクレオチド
反応3:1μMの12塩基第1アンカープローブ
20μMの6縮重塩基第2アンカープローブ
リード位置:アダプター末端から8番目のヌクレオチド
反応4:1μMの12塩基第1アンカープローブ
20μMの7縮重塩基第2アンカープローブ
リード位置:アダプター末端から9番目のヌクレオチド
反応5:1μMの12塩基第1アンカープローブ
20μMの8縮重塩基第2アンカープローブ
リード位置:アダプター末端から10番目のヌクレオチド
反応6:1μMの12塩基第1アンカープローブ
20μMの9縮重塩基第2アンカープローブ
リード位置:アダプター末端から11番目のヌクレオチド
反応7:1μMの12塩基第1アンカープローブ
80μMの6縮重塩基第2アンカープローブ
リード位置:アダプター末端から8番目のヌクレオチド
反応8:1μMの12塩基第1アンカープローブ
80μMの7縮重塩基第2アンカープローブ
リード位置:アダプター末端から9番目のヌクレオチド
反応9:1μMの12塩基第1アンカープローブ
20μMの6ヌクレオチド第2アンカープローブ(4縮重塩基-2既知塩基)
リード位置:アダプター末端から6番目のヌクレオチド
反応10:1μMの12塩基第1アンカープローブ
20μMの7ヌクレオチド第2アンカープローブ(5縮重塩基-2既知塩基)
リード位置:アダプター末端から7番目のヌクレオチド
反応11:1μMの12塩基第1アンカープローブ
20μMの8ヌクレオチド第2アンカープローブ(6縮重塩基-2既知塩基)
リード位置:アダプター末端から8番目のヌクレオチド。
図31および32は、アンカープローブとシーケンシングプローブの異なる組合せの結果を図解している。縮重第2アンカープローブの長さは、完全に縮重しているか部分的に縮重しているかを問わず、6マーを使用すると最も良いことがわかった。完全に縮重した6マーを高濃度で使用した場合のシグナル強度は、部分的に縮重した6マーのそれと類似するシグナル強度を示した(図31)。全てのデータは、最も長い第2アンカーを用いる反応6(これは、強度スコアも、行われた反応の中で最も低い値を示した(図31))除いて、かなり良好なフィットスコアを持っていた(図32参照)。
第1アンカープローブの長さが強度およびフィットスコアに及ぼす効果:第1アンカープローブの長さがさまざまである第1および第2アンカープローブの異なる組合せを使って、アダプターの3'側の塩基を同定するために使用した場合に、第1アンカープローブの長さがシグナル強度およびフィットスコアに及ぼす効果を比較した。標準的1アンカー法を、アダプターに相補的な何らかの領域を持つ部分的に縮重したプローブまたは完全に縮重した第2アンカープローブによる2アンカープローブ法を使ったシグナル強度およびフィットスコアと比較した。各反応では、ターゲット核酸中のリード位置に存在するヌクレオチドを同定するために、同じ、4つのシーケンシングプローブのセットを利用した。実験で使用した組合せは次のとおりである:
反応1:1μMの12塩基第1アンカープローブ
第2アンカープローブなし
リード位置:アダプター末端から5番目のヌクレオチド
反応2:1μMの12塩基第1アンカープローブ
20μMの5縮重塩基第2アンカープローブ
リード位置:アダプター末端から10番目のヌクレオチド
反応3:1μMの10塩基第1アンカープローブ
20μMの7ヌクレオチド第2アンカープローブ(5縮重塩基-2既知塩基)
リード位置:アダプター末端から10番目のヌクレオチド
反応4:1μMの13塩基第1アンカープローブ
20μMの7縮重塩基第2アンカープローブ
リード位置:アダプター末端から12番目のヌクレオチド
反応5:1μMの12塩基第1アンカープローブ
20μMの7縮重塩基第2アンカープローブ
リード位置:アダプター末端から12番目のヌクレオチド
反応6:1μMの11塩基第1アンカープローブ
20μMの7縮重塩基第2アンカープローブ
リード位置:アダプター末端から12番目のヌクレオチド
反応7:1μMの10塩基第1アンカープローブ
20μMの7縮重塩基第2アンカープローブ
リード位置:アダプター末端から12番目のヌクレオチド
反応8:1μMの9塩基第1アンカープローブ
20μMの7縮重塩基第2アンカープローブ
リード位置:アダプター末端から12番目のヌクレオチド。
観察されたシグナル強度(図33)およびフィットスコア(図34)は、最適強度が最も長い第1アンカープローブの使用によって得られることを示し、これは一つには、長いプローブが複合アンカープローブに与える高い融解温度によるものだろう。
2アンカープライマー法を使った強度およびフィットスコアにキナーゼインキュベーションが及ぼす影響:上述の反応を、1μMの10塩基第1アンカープローブ、20μMの7マー第2アンカープローブ、およびFluor-NNNNBNNNNという構造を持つシーケンシングプローブを使って、異なる温度で行うことにより、1単位/mlのキナーゼの存在下で3日間にわたって、アダプターから10番目の位置を読んだ。15マー第1アンカーおよびシーケンシングプローブによる反応を陽性対照とした。結果は図35および図36に示すとおりである。キナーゼは対照と比較してシグナル強度に影響を及ぼしたが、値域は4℃から37℃まで変化せず、フィットスコアは対照と等しいままだった。キナーゼインキュベーションが影響を受ける温度は42℃であり、これはデータとの不十分なフィットを示した。
次に、キナーゼにとって必要な最小時間を、上述したものと同じプローブおよび条件を使って調べた。図37および図38に示すように、5分以上のキナーゼインキュベーションは、実質上等価なヌクレオチドシグナル強度およびフィットスコアをもたらす。
本明細書は、ここに記載した技術の例示的態様における方法、システムおよび/または構造ならびにその使用の完全な説明を提供するものである。この技術のさまざまな態様を、ある程度具体的に、または1つ以上の個別の態様を参照して、上に説明したが、当業者は、開示された態様に、その技術の要旨または範囲から逸脱することなく、数多くの改変を加えることができるだろう。ここに記載した技術の要旨および範囲から逸脱することなく、多くの態様を作ることができるので、適切な範囲は、後述する本願特許請求の範囲に示される。したがって他の態様も考えられる。さらにまた、別段のクレームが明示的になされないかぎり、または請求項の表現により特定の順序が本質的に必要とされない限り、どの操作も任意の順序で行いうることを理解すべきである。上記の説明に含まれ、添付の図面に示される事項は全て、特定の態様の単なる例示であると解釈されるべきであり、示した実施形態への限定を意図するものではない。文脈上そうでないことが明白であるか、別段の明記がある場合を除き、本明細書に記載の濃度値は、一般に、混合物の特定のコンポーネントの添加時または添加後に起こる何らかの変換を考慮せず、混合値またはパーセンテージとして与えられる。既に明示的に本明細書に組み込まれているのでない場合も、本明細書において言及した、公表された参考文献および特許文書は全て、あらゆる目的で、引用によりその全てが本明細書に組み込まれる。以下の特許請求の範囲に定義される本技術の基本的要素から逸脱することなく、詳細または構造に変化を加えることができる。