JP2016521557A - 標的配列決定のための方法 - Google Patents

標的配列決定のための方法 Download PDF

Info

Publication number
JP2016521557A
JP2016521557A JP2016518293A JP2016518293A JP2016521557A JP 2016521557 A JP2016521557 A JP 2016521557A JP 2016518293 A JP2016518293 A JP 2016518293A JP 2016518293 A JP2016518293 A JP 2016518293A JP 2016521557 A JP2016521557 A JP 2016521557A
Authority
JP
Japan
Prior art keywords
fragment
sequence
adapter
circularized
nucleotide sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016518293A
Other languages
English (en)
Inventor
ルネ・コルネリス・ヨセフス・ホガース
Original Assignee
キージーン・エン・フェー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by キージーン・エン・フェー filed Critical キージーン・エン・フェー
Publication of JP2016521557A publication Critical patent/JP2016521557A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明の方法は、ヌクレオチド配列の一部からの知識に基づき、核酸試料から配列情報を生成する手法を提供する。部分配列の知識は、制限部位の存在に関する知識を含み得る。部分配列の知識は、アダプターライゲーション断片又はヌクレオチド伸長断片を生成するのに使用することができる。ライゲーションされたアダプター及び「既知のヌクレオチド配列部分」に関する情報の組み合わせから、プローブが設計され得る。プローブは、配列決定され得る環状断片の提供において使用することができる。既知配列及び決定された配列を組み合わせることは、既に存在する配列情報に配列情報を追加し、利用可能なゲノム配列情報を補完する。

Description

本発明は、核酸試料のヌクレオチド配列決定の分野に関する。より詳細には本発明は、幾つかの配列情報が既に利用可能である核酸試料からの更なる配列情報の生成に関する。
ここ数年でハイスループットシーケンシング法が広く利用可能となってきている。これらの方法は、大量の配列データをしばしばより短い又はより長いヌクレオチド配列断片の形態で生成する(別名リード)。課題は、これらのデータをドラフトゲノム配列又はコンティグに組み立てること、及び完全なゲノムに達するために断片間のギャップを埋めることである。
WO200511236は、断片が例えば制限酵素を用いて提供される複数の標的配列の増幅方法を記載する。二本鎖断片は一本鎖断片に変性される。一本鎖断片に、プライマー結合部位を含有し得る特異的二本鎖セレクターがライゲーションされ、セレクターライゲーション断片が環状化される。得られた環状DNAは増幅され得、配列決定され得る。
WO2012003374は、制限酵素消化DNAが断片の両側に相補的なオリゴヌクレオチドセットを介して環状化される配列決定方法を記載する。オリゴヌクレオチドセットは、スプリントオリゴヌクレオチド及びベクターオリゴヌクレオチドを含有する。ベクターオリゴヌクレオチドは断片の末端間にライゲーションされ、スプリントオリゴヌクレオチドは断片及びベクターオリゴヌクレオチドの末端に相補的である。オリゴヌクレオチドセットは、プライマー結合部位を含んでもよい。スプリントオリゴヌクレオチドの除去後、環状断片は増幅され得、配列決定され得る。WO2012003374は、ライゲーションの前に二本鎖構築物を必要とする。
WO2011067378は、標的配列及び2つの相補的プローブ部分(このうち1つは標的断片の末端に位置する)を含む断片が生成される、環状化標的断片の増幅方法を記載する。相補的プローブ部分に二本鎖プローブがアニールされ、ライゲーションされる。プローブライゲーション断片は、ビオチンなどの固定化部分を有するプローブを用いて単離される。断片は配列決定を用いて分析することができる。WO201 1067378は、環状化に有用なプローブを設計するために配列の少なくとも2つの部分の知識を必要とする。
WO2008153492は、複数のプローブの組み合わせを用いて標的核酸に配列エレメントを導入する方法を記載する。
従来技術は複数のプローブを使用するか又は試料核酸のヌクレオチド配列の複数部分の知識を必要とする。例えば制限断片が使用される場合、従来技術方法は制限断片の2つの既知のゲノム配列末端を使用する。限られた量の初期の配列情報に基づいて、追加の配列情報を提供する方法の必要性が当技術分野に残されている。この度、本発明者らは、制限断片の末端又は末端近くに位置することができる単一の配列情報に、一般的に既知の配列(アダプター)とともに依存し、1つのプローブのみを使用して増幅及び配列決定することができる環状核酸を生成する、簡略化された方法を提供する。
WO200511236 WO2012003374 WO2011067378 WO2008153492 EP534858 WO2008007951 WO2010082815A1 WO2011074960A1 WO200500791 WO03/004690 WO03/054142 WO2004/069849 WO2004/070005 WO2004/070007 WO2005/003375 US6045994
Quailら、BMC Genomics 2012, 13:341頁 Seoら(2004) Proc. Natl. Acad. Sci. USA 101:5488〜93頁 「Next Generation Genome sequencing」M. Janitz編(Wiley-Blackwell、2008) Marmur及びLane、Proc. Natl. Acad. Sci. USA 46:453 (1960) Dotyら、Proc. Natl. Acad. Sci. USA 46:461 (1960) Vosら1995. AFLP: a new technique for DNA fingerprinting. Nucleic Acids Research 23(21): 4407〜4414頁
本発明の方法はこれより、ヌクレオチド配列の一部からの知識に基づき核酸試料から配列情報を生成する手法を提供する。部分配列の知識は、制限部位の存在の統計的発生に関する知識を含む、制限部位の存在に関する知識を含み得る。部分配列の知識は、アダプターライゲーション断片又はヌクレオチド伸長断片を生成するのに使用することができる。ライゲーションされたアダプターと、制限部位などのヌクレオチド配列の一部に関する情報との組み合わせから、プローブが設計され得る。プローブは、配列決定される得る環状断片の提供において使用することができる。既知配列及び決定された配列を組み合わせることは、既に存在する配列情報に配列情報を追加し、ゲノム配列を補完する。
故に本発明は、1つの実施形態において、核酸試料から配列情報を得る方法であって、
a)核酸試料のヌクレオチド配列情報の少なくとも一部が、少なくとも1つの「既知のヌクレオチド配列部分(Known Nucleotide Sequence Section)」の形態で利用可能である核酸試料を提供する工程と、
b)核酸試料を断片化して1つ又は複数の断片を得る工程と、
c)場合により、断片の末端を平滑化する工程と、
d)場合により、1つ又は複数の3'ヌクレオチドを断片に付加する工程と、
e) 1つ又は複数のアダプターを断片の一端又は両端にライゲーションしてアダプターライゲーション断片を得る工程と、
f)アダプターライゲーション断片を変性させて、変性アダプターライゲーション断片を得る工程と、
g)少なくとも1つの、好ましくはそれぞれの、任意に選択された「既知のヌクレオチド配列部分」含有変性アダプターライゲーション断片に、「既知のヌクレオチド配列部分」の少なくとも一部及びアダプター配列の少なくとも一部を含む環状化プローブを提供する工程と、
h)変性アダプターライゲーション断片を環状化プローブと結合する工程と、
i)環状化プローブ及び変性アダプターライゲーション断片をハイブリダイズさせ、環状化変性アダプターライゲーション断片を形成させる工程と、
j)場合により、オーバーハングを除去する工程と、
k)場合により、「既知のヌクレオチド配列部分」(の一部)とアダプター(の一部)の間の欠損ヌクレオチドを充填する工程と、
l)環状化アダプターライゲーション断片の末端をライゲーションして、ライゲーションされた環状化アダプターライゲーション断片を得る工程と、
m)ライゲーションされた環状化アダプターライゲーション断片を配列決定する工程と
を含み、
ライゲーションされた環状化アダプターライゲーション断片の配列情報を得るのに、断片ごとにたった1つの「既知のヌクレオチド配列部分」の配列情報が必要とされる方法を提供する。
本発明はまた、1つの実施形態において、核酸試料から配列情報を得る方法であって、
a)核酸試料のヌクレオチド配列情報の少なくとも一部が、少なくとも1つの「既知のヌクレオチド配列部分」の形態で利用可能である核酸試料を提供する工程と、
b)核酸試料を断片化して1つ又は複数の断片を得る工程と、
c)場合により、断片の末端を平滑化する工程と、
d)場合により、1つ又は複数の3'ヌクレオチドを断片に付加する工程と、
e) 1つ又は複数のアダプターを断片の一端又は両端にライゲーションしてアダプターライゲーション断片を得る工程と、
f)少なくとも1つの、好ましくはそれぞれの、任意に選択された「既知のヌクレオチド配列部分」含有アダプターライゲーション断片に、「既知のヌクレオチド配列部分」の少なくとも一部及びアダプター配列の少なくとも一部を含む環状化プローブを提供する工程と、
g)アダプターライゲーション断片を環状化プローブと結合する工程と、
h)アダプターライゲーション断片を変性させて変性アダプターライゲーション断片を得る工程と、
i)環状化プローブ及び変性アダプターライゲーション断片をハイブリダイズさせ、環状化変性アダプターライゲーション断片を形成させる工程と、
j)場合により、オーバーハングを除去する工程と、
k)場合により、「既知のヌクレオチド配列部分」(の一部)とアダプター(の一部)の間の欠損ヌクレオチドを充填する工程と、
l)環状化アダプターライゲーション断片の末端をライゲーションして、ライゲーションされた環状化アダプターライゲーション断片を得る工程と、
m)ライゲーションされた環状化アダプターライゲーション断片を配列決定する工程と
を含み、
ライゲーションされた環状化アダプターライゲーション断片の配列情報を得るのに、断片ごとにたった1つの「既知のヌクレオチド配列部分」の配列情報が必要とされる方法も提供する。
別の実施形態において、核酸試料から配列情報を得る方法であって、
a)核酸試料のヌクレオチド配列情報の少なくとも一部が、少なくとも1つの「既知のヌクレオチド配列部分」の形態で利用可能である核酸試料を提供する工程と、
b)核酸試料を断片化して1つ又は複数の断片を得る工程と、
c)場合により、断片の末端を平滑化する工程と、
d) 1つ又は複数の3'ヌクレオチド、好ましくは10から20ヌクレオチドを断片に付加してヌクレオチド伸長断片を得る工程と、
e)ヌクレオチド伸長断片を変性させて、変性ヌクレオチド伸長断片を得る工程と、
f)少なくとも1つの、好ましくはそれぞれの、任意に選択された「既知のヌクレオチド配列部分」含有変性ヌクレオチド伸長断片に、「既知のヌクレオチド配列部分」の少なくとも一部及びヌクレオチド伸長配列の配列の少なくとも一部を含む環状化プローブを提供する工程と、
g)変性ヌクレオチド伸長断片を環状化プローブと結合する工程と、
h)環状化プローブ及び変性ヌクレオチド伸長断片をハイブリダイズさせ、環状化変性ヌクレオチド伸長断片を形成させる工程と、
i)場合により、オーバーハングを除去する工程と、
j)場合により、「既知のヌクレオチド配列部分」(の一部)とヌクレオチド伸長配列(の一部)の間の欠損ヌクレオチドを充填する工程と、
k)環状化ヌクレオチド伸長断片の末端をライゲーションして、ライゲーションされた環状化ヌクレオチド伸長断片を得る工程と、
l)ライゲーションされた環状化ヌクレオチド伸長断片を配列決定する工程と
を含み、
ライゲーションされた環状化ヌクレオチド伸長断片の配列情報を得るのに、断片ごとにたった1つの「既知のヌクレオチド配列部分」の配列情報が必要とされる方法が提供される。
上記に詳述された3つの実施形態は同じ概念の実施形態であるが、変性工程及び環状化プローブとの結合工程が入れ替わり、又はアダプターライゲーション工程が、アダプターライゲーションに代わるものとして1つ若しくは複数、好ましくは10〜20ヌクレオチドを断片に付加することに取って代わられた実施形態である。本出願を通して、本発明の多くの変更形態及び実施形態が記載される。変更形態及び実施形態の幾つかは特定の技術的特徴に焦点を合わされ、この特徴の範囲内で、及び本明細書に開示された全ての実施形態に直接関連せずに記載されているのみである。けれども、1つの特定の特徴の実施形態又は変更形態が、方法全体を再び記載することなく他の実施形態において同様に適用され得る及び適用されるであろうことは、明示的に言及されることなく当業者には明らかになろう。
本発明は、既に利用可能な幾つかの配列情報がある段階から始まる核酸試料由来の配列データを提供する。これは同じ生物由来であってもよく、又は別の、好ましくは関連する生物由来であってもよい。故に、核酸の配列の一部は既知である。既知である配列の一部は、0.01%、0.1%、1%、5%又は10%まで低くてもよい。複数の試料が調べられる場合、既知である配列の一部は試料ごとに独立している。このような実施形態において、試料の1つ(又は複数、ただし全てからではない)の完全な配列は完全に(すなわち100%)既知であってもよい。例えば、典型的には再配列決定に使用される場合、相対的にごく一部が既知の又は全く知られていない第2の配列と比べて、参照配列はより大部分(完全、すなわち100%ではないにしても)が既知である。別の種由来の配列情報に基づく再配列決定の場合、やはり1つの試料(1つの種、例えばナス)由来の配列情報が(一部)既知であり、別の種(例えばトマト)の再配列決定に使用されることになろう。このような実施形態において、KNSSの起源は異なる種(ナス)であるが、別の種(トマト)の配列情報の分析及び生成に使用される。故に、研究中の核酸試料のヌクレオチド配列情報の少なくとも一部(より多くの配列情報が望ましい)は、少なくとも1つの「既知のヌクレオチド配列部分」(同一である必要はない)の形態で利用可能である。環状化プローブが研究中の断片のKNSSにハイブリダイズできるように、配列同一性パーセンテージはKNSSの長さに対して50%を超える、75%を超える、90%を超える、95%を超えることになろう。
この既に利用可能な配列情報(「既知のヌクレオチド配列部分」又はKNSSとして本明細書に示された)は、遺伝子配列、プロモーター等などの機能情報も利用可能な配列情報であってもよい。しかし、また、部分ゲノム、EST、物理地図、他の技術で同定された断片(配列マーカー、lllumina社のSequencing by Synthesis又はRoche社製454 Sequencing技術(GSII又はGS Flex)又は次次世代シーケンシング及び/若しくはSMRTシーケンシング(Pacific BIO Biosciences社等、及び特にQuailら、BMC Genomics 2012, 13:341頁に記載された)として総称的に示されるような現在の配列決定技術により生成されるようなハイスループットシーケンシング方法からの(短い)配列リードなどの)などの機能情報が利用できない配列情報であってもよい。
このようなリードの例はまた、AFLP由来断片、すなわち少なくとも部分的に配列決定されているAFLP断片であってもよい。
配列情報源の別の例はWGPタグである。WGPタグは、物理地図が生成され得るリードを生成するために、プールBACライブラリー及びハイスループットシーケンシングの組み合わせを用いて生成された配列である。例えばEP534858、WO2008007951、WO2010082815A1、WO2011074960A1を参照のこと。
典型的には、「既知のヌクレオチド配列部分」の最小長は、6個のヌクレオチドからである。6個より下のヌクレオチド長では、アニーリング工程の特異性により、該部分が短すぎて環状化プローブの後々の開発に有用でなくなる。「既知のヌクレオチド配列部分」の最小長は、好ましくは少なくとも6個、少なくとも7個、少なくとも8個であり、少なくとも10個が好ましい。良好な結果は、10から30個、好ましくは12から25個、より好ましくは15から20個の「既知のヌクレオチド配列部分」長で得られている。より長い長さが可能であり(最大40、50又は100個)、同様にうまく機能するが、比較的長い環状化プローブをもたらし、合成するのにより煩雑になる可能性がある。
核酸試料は、1つ又は複数の断片を生じるように断片化される。断片化は、物理的手段又は酵素的手段により達成することができる。物理的手段は、切断(shearing)、超音波処理、噴霧(nebulization)等を含む。切断が好ましい。断片を提供する物理的手段は、末端が典型的にはわからない断片のランダムセットをもたらす。断片の長分布は、断片化プロセスの強度により異なり得る。
核酸を断片化する酵素的手段は、1つ又は複数のヌクレアーゼ酵素、好ましくは制限エンドヌクレアーゼ酵素を用いた消化による。核酸試料、及び故に「既知のヌクレオチド配列部分」は制限酵素消化部位を含み得る、すなわち「既知のヌクレオチド配列部分」は制限酵素消化部位を含有し得る、又は制限酵素消化部位は「既知のヌクレオチド配列部分」の外側に位置し得ることから、制限酵素が使用され得る。
故に、核酸試料は制限酵素消化部位を含有してもよい。制限酵素消化部位の存在は、おそらく利用可能な配列情報から知られるが、研究中のゲノムの統計分析から導き出すこともできる。制限酵素認識配列は典型的には4〜8ヌクレオチド長であることから、認識部位の統計的発生は、MseIなどの4bpカッターには平均で256ヌクレオチドおきとなろう。
核酸試料の断片は次いで、核酸試料を制限エンドヌクレアーゼ消化部位で制限エンドヌクレアーゼ酵素により消化して、制限エンドヌクレアーゼ消化断片を生じることにより提供される。
故に、特定の実施形態において、「既知のヌクレオチド配列部分」は制限酵素消化部位を含む。制限酵素は典型的には、酵素が核酸の関連部分を認識する認識部位、及び核酸が切断又は消化される消化部位を有する。認識部位は、切断部位と同じであってもよく(EcoRIなどのII型)、又は切断部位は、認識部位から更に離れて置かれてもよい(FokIなどのIIs型)。
本明細書で使用されるとき、用語「制限酵素」又は「制限エンドヌクレアーゼ」(用語「制限酵素」及び「制限エンドヌクレアーゼ」は互換的に使用される)は、二本鎖DNA分子において特定のヌクレオチド配列(認識部位)を認識し、DNA分子の両方の鎖を全ての認識部位で又はこの近くで切断し、平滑末端又は付着末端(staggered end)を残す酵素を指す。また、一本鎖又は二本鎖DNAに対する認識部位を含有するが、その後一方の鎖のみに切り込みを入れる(ニッキングする)いわゆるニッキング制限酵素も包含される。
本明細書で使用されるとき、用語「アイソシゾマー」は、同じ認識配列に特異的であり、同じ位置に切り込みを入れる制限酵素対を指す。例えば、Sph I (GCATGAC)及びBbu I (GCATGAC)は、互いにアイソシゾマーである。任意の配列を認識し切断する第1の酵素はプロトタイプとして知られ、この配列を認識し切断する全ての後続の酵素はアイソシゾマーである。同じ配列を認識するが、これを異なって切断する酵素はネオシゾマーである。アイソシゾマーは、ネオシゾマーの特異型(サブセット)である。例えば、Sma I (CCC^GGG)及びXma I (C^CCGGG)は、互いにネオシゾマーである(アイソシゾマーでない)。アイソシゾマー及びネオシゾマーは、「既知のヌクレオチド配列部分」が得られた方法において使用された制限酵素が、現在の方法において使用される制限酵素と同じである必要がないように、本発明において使用され得る。
本明細書で使用されるとき、用語「クラスII制限エンドヌクレアーゼ」は、制限部位と同じ位置に位置する認識配列を有するエンドヌクレアーゼを指す。換言すれば、クラスII制限エンドヌクレアーゼはこの認識配列内で切断する。この例は、EcoRI(G/AATTC)及びSmaII(CCC/GGG)である。
本明細書で使用されるとき、用語「クラスIIs制限エンドヌクレアーゼ」は、制限部位から離れた認識配列を有するエンドヌクレアーゼを指す。換言すれば、IIs型制限エンドヌクレアーゼは、この認識配列の外側を片側に切断する。この例は、NmeAIII (GCCGAG(21/19)及びFokI、AlwIである。
故に、本発明の特定の実施形態において、制限エンドヌクレアーゼ酵素消化部位及び制限エンドヌクレアーゼ酵素認識部位は同じ位置に位置する(クラスII制限エンドヌクレアーゼ)。本発明の特定の他の実施形態において、制限エンドヌクレアーゼ酵素消化部位及び制限エンドヌクレアーゼ酵素認識部位は、同じ位置に位置しない(クラスIIS又はIIB制限エンドヌクレアーゼ)。特定の他の実施形態において、制限エンドヌクレアーゼ酵素消化部位は、制限エンドヌクレアーゼ酵素認識部位の片側(クラスIIS制限エンドヌクレアーゼ)又は両側(クラスIIB制限エンドヌクレアーゼ)の外側に位置する。酵素の組み合わせ及び異なるクラスの酵素の組み合わせが、制限断片の提供において使用され得る。また、物理的断片化及び酵素的断片化の組み合わせも、本発明の全ての実施形態にわたって使用され得る。
故に「既知のヌクレオチド配列部分」は、制限酵素消化部位を含んでもよい。制限酵素消化部位(本明細書ではXXXYYYとして表される)は、「既知のヌクレオチド配列部分」全体が(NNNNNNNNXXXYYYNNNNNN)として表され得るように、「既知のヌクレオチド配列部分」の内側(内部) (NNNNNNとして示される「既知のヌクレオチド配列部分」の他のヌクレオチド)に位置してもよい。制限酵素消化部位はまた、「既知のヌクレオチド配列部分」のへりに位置してもよい(NNNNNNNNNNXXXYYY)。「既知のヌクレオチド配列部分」は、AFLP又は、制限酵素消化部位の残りの部分(NNNNNXXX)を含み得る配列リードを提供するWO2008007951に記載されているようなハイスループット物理的マッピングなどの、制限酵素を使用した以前の方法により得られると言える。このような断片も、「既知のヌクレオチド配列部分」として使用することができる。このような「既知のヌクレオチド配列部分」の構造はNNNNNNNNNXXXYYYとして表すことができ、N及びXは本明細書の他の部分に記載されており、これらの配列から知られる。YYYは、制限酵素消化部位XXXYYYの他の部分(消化部位の残りの半分)を形成したヌクレオチドである。YYYは次いで、AFLP断片又は配列リードにおいて直接同定できないが、YYYは、「既知のヌクレオチド配列部分」の配列情報を生成した元々の核酸試料中に制限酵素消化部位が存在した断片の起源から推定され得ることから、それでもやはり本質的に存在すると見なすことができる。例えば、配列決定されたAFLP断片が、制限酵素の1つとしてMseI (T/TAA)を用いて得られ、及び配列情報がXXXXAATである場合、MseIの使用によりTが本質的に存在することから、完全な「既知のヌクレオチド配列部分」はXXXXAATTとなるであろう。
「既知のヌクレオチド配列部分」は、配列情報が以前に得られた方法により(例えば、AFLP又はハイスループット物理的マッピングWO2008007951などの制限酵素ベースの方法を用いて)、並びに/又は制限酵素認識部位及び/若しくは消化部位を同定することができるアルゴリズムで利用可能な配列情報をスクリーニングして、核酸試料の利用可能な配列情報から同定することができる。
「既知のヌクレオチド配列部分」は断片の末端の一方にあってもよく、又は断片の内側にあってもよく、故に断片の末端から離れていてもよい。「既知のヌクレオチド配列部分」は、断片の末端から離れた位置、好ましくは断片の末端から少なくとも5、10、15、20、30、50、75又は100ヌクレオチドの位置に位置することができる。
核酸試料は、制限酵素で消化することができる。制限酵素は、核酸を制限酵素消化部位で消化(切断)する。結果として、制限酵素消化断片が得られることになる。制限酵素消化断片の末端は、制限酵素に応じて平滑であってもよく又は付着であってもよい。
本明細書で使用されるとき、用語「制限酵素消化断片」又は「制限断片」は、制限エンドヌクレアーゼによる消化により産生されたDNA分子を指す。任意のゲノム(又は起源にかかわらず核酸)が、特定の制限エンドヌクレアーゼにより制限断片の別々のセットに消化されるであろう。制限エンドヌクレアーゼ切断の結果生じるDNA断片は、様々な手法において更に使用され得る。
本発明の方法において得ることができ、及びKNSSを含む制限断片は、典型的な構造としてXXXNNNNZZZZZZYYYを有してもよい。NNNN、XXX及びYYYは本明細書において上記に定義され、NNNNは、任意の長さの既知である「既知のヌクレオチド配列部分」であってもよく、ZZZZZZZは、未知の配列でありこの配列の少なくとも一部を決定することが目標である任意の長さの制限断片である。
断片化後、酵素的であろうと又は物理的であろうと、特定の実施形態において、断片は平滑化され得、すなわち任意の突出しているオーバーハングが除去され得る。このような方法は当技術分野でよく知られており、結果として、断片は平滑末端を有する(すなわちオーバーハングは残っていない)ことになる。
断片化後、及び同様に平滑化後、既存のオーバーハングを修飾する、又は特異的アダプターのライゲーションに使用され得る望ましいオーバーハングを作製するために、当技術分野で知られた方法(DNAポリメラーゼ)を用いて3'ヌクレオチドが付加され(ライゲーションされ、結合され、連結され)得る。
(制限)断片の末端の少なくとも一方に、アダプターがライゲーションされる。アダプターは(制限)断片の両方の末端にライゲーションされてもよく、例えば、オーバーハングであるが未知の末端を残すII型酵素[2bpの未知の付着末端を残すNmeAIII (GCCGAGN(21/19)のような]が使用される場合、異なるアダプターが(制限)断片の各末端へのライゲーションに提供されてもよい。異なるアダプターは、付着末端の構成に応じてライゲーションすることができる。
特定の実施形態において、好ましくは制限酵素を用いた消化による断片化及びアダプターライゲーションは、同時に行うことができる。制限酵素が使用される場合、次いでアダプターは、アダプターがライゲーションされるときに制限部位が復元されないような方法で典型的には設計される。
本明細書で使用されるとき、用語「アダプター」は、(制限)断片の末端にライゲーションすることができるように設計される、限られた数の塩基対、例えば約10から約30塩基対長を有する短い典型的には二本鎖のDNA分子を指す。アダプターは一般的に、互いに部分的に相補的であるヌクレオチド配列を有する2つの合成オリゴヌクレオチドから成る。アダプターは平滑末端を有してもよく、又は付着末端を有してもよく、又は平滑末端及び付着末端を有してもよい。付着末端は3'又は5'オーバーハングである。適切な条件下、2つの合成オリゴヌクレオチドを溶液中で混合すると、これらは互いにアニールして二本鎖構造を形成する。アダプターはまた一本鎖であってもよく、この場合これは、一本鎖アダプターが(制限)断片にアニーリングできるように、一本鎖アダプターならば一方の末端が少なくとも幾つかのヌクレオチド(2、3、4又は5個)について(制限)断片の一方の末端の鎖の1つと適合性である場合に便利であり、好ましい場合がある。そのためには、断片が、断片の末端の一方にヌクレオチドを付加することにより伸長されてもよい。アダプター分子の一端は、アニーリング後、(制限)断片の末端と適合性であり、これにライゲーションできるように設計されてもよく、アダプターの他端(一本鎖型又は二本鎖型のいずれか)は、ライゲーションされ得るが、これは例えば、アダプターの末端の両方の鎖がライゲーション可能であるときにアダプターがDNA断片間にライゲーションされる場合は当てはまる必要がないように設計されてもよい。ライゲーション可能であるとは一般に、3'-ヒドロキシ基又は5'-リン酸基の存在を意味する。ライゲーションがブロックされるとは一般的に、必要とされる3'及び5'官能性が欠乏し、又はブロックされていることを意味する。特定の場合において、アダプターは断片にライゲーションされて、アダプターライゲーション断片のこの後の操作、例えば増幅又は配列決定の開始点を提供することができる。後者の場合、いわゆる配列決定アダプターが断片にライゲーションされ得る。ライゲーションに対する適合性は、2つの(組み合わされた)方法で達成することができる。すなわち、(二本鎖)アダプターの末端は、アダプター及び断片がアニールできるように、制限断片のオーバーハング末端と適合性である(オーバーハング)部分を含有する。第2の方法は、アダプターの一方の鎖の末端に位置するヌクレオチドが、別のヌクレオチド(例えば制限断片由来の)に化学的に結合され得るように提供されることである。或いは、アダプターの末端のヌクレオチドが、別のヌクレオチドに結合され得るように修飾(ブロック)されてもまたよい。二本鎖アダプターは、二本鎖アダプターが断片にアニーリングでき、及び一方又は両方の鎖が断片に結合され得るように組み合わされたこれらの特徴を有し得る。
アダプター(二本鎖でも又は一本鎖でも)は、リガーゼを用いて(制限)断片の末端にライゲーションされる。この結果がアダプターライゲーション(制限)断片である。1つの実施形態において、少なくとも1つのアダプターのライゲーションは、(制限酵素消化)断片の5'末端で生じる。1つの実施形態において、少なくとも1つのアダプターのライゲーションは、(制限酵素消化)断片の3'末端で生じる。
本明細書で使用されるとき、用語「ライゲーション」は、2つの二本鎖DNA分子が共有結合される、リガーゼ酵素により触媒される酵素的反応を指す。一般に、両方のDNA鎖が共有結合されるが、鎖の末端の一方の化学的又は酵素的修飾により2本の鎖の一方のライゲーションを妨げることも可能である。この場合、共有結合は、2本のDNA鎖の一方でのみ生じることになる。
本明細書で使用されるとき、用語「ライゲーション(ligating)」は、別個の(二本)鎖のヌクレオチド配列を結合するプロセスを指す。二本鎖DNA分子は、平滑末端化されてもよく、又はオーバーハングが互いとハイブリダイズできるように適合性オーバーハング(粘着性オーバーハング)を有してもよい。或いは、DNA分子の1つは、別の一本鎖DNA分子(一本鎖アダプター)がアニールできるオーバーハングを有する二本鎖であってもよい。DNA断片の結合は、リガーゼ酵素、DNAリガーゼによる酵素的であってもよい。しかし、DNA断片が結合される、すなわち共有結合を形成している限り、非酵素的、すなわち化学的ライゲーションが使用されてもよい。典型的には、別個の鎖のヒドロキシ基とリン酸基の間のホスホジエステル結合は、ライゲーション反応において形成される。二本鎖ヌクレオチド配列は、ライゲーションの前にリン酸化されなければならない可能性がある。
アダプターライゲーション(一本鎖でも又は二本鎖でも)の代替として、一般に知られているヌクレオチド伸長方法を用い、これにより、例えば毎回一度に1ヌクレオチドを導入する一連の工程(単一ヌクレオチド伸長)により、好ましくは既知の順番で既知の配列(ヌクレオチド伸長配列)による断片の伸長を導入して、これにより3〜100ヌクレオチド、好ましくは5〜50ヌクレオチド、より好ましくは18〜40ヌクレオチド(10〜20ヌクレオチドが最も好ましい)で断片を伸長し、ヌクレオチドが好ましくはこの3'末端で断片に付加されてもよい。断片のこの伸長は、ヌクレオチド伸長断片をもたらす。
本発明の方法の実施形態において、アダプターライゲーション断片は変性される。変性工程は、以前は(一部分は)二本鎖のアダプターライゲーション断片を一本鎖にする。変性は、当技術分野で公知の任意の手段により、ただし典型的には加熱により、達成することができる。
本発明の方法において、環状化プローブが提供される。環状化プローブは、「既知のヌクレオチド配列部分」の少なくとも一部、及びアダプター配列の少なくとも一部又はヌクレオチド伸長配列の少なくとも一部を含むオリゴヌクレオチドである。原則として、「既知のヌクレオチド配列部分」を含有する核酸試料の断片化(ランダム断片化であれ又は制限であれ)から得られたそれぞれの断片に対して、環状化プローブが提供され得る。例えば物理地図(WO2008007951に記載されたような)をハイスループット生成する配列決定プロトコルのために、1000配列リード(これらのリードのそれぞれが「既知のヌクレオチド配列部分」の基礎を個々に形成する)が例えば得られる場合、対応する数の環状化プローブを生成(設計)することが可能である。環状化プローブを設計するために、これらのリードの選択物(サブセット)を作ることも可能である。故に環状化プローブは、変性アダプターライゲーション断片又はヌクレオチド伸長断片を含有する「既知のヌクレオチド配列部分」の選択物に対して提供されてもよい。例えば、リード間又は物理地図上のこの分布間の既に既知の距離を考慮しながら、特定の領域に濃縮されたリードを選択して、物理地図の局所的だが完全なギャップ閉鎖を提供することが便利であり得、又は好ましい場合がある。或いは又は更に、リードが物理地図上に極めて広範に広がっていることが好ましい場合がある。これは、選択された配列決定プラットフォーム、及びこれが提供するリード長にも依存し得る。長いリード(数Kb)は、「既知のヌクレオチド配列部分」及び環状化プローブの生成により広い間隔の配列情報を必要とし得る。配列決定プラットフォームのより長いリード長は、より長い断片を生成する、すなわちより長い認識配列を有する制限酵素の使用も可能にする。
環状化プローブにおける「既知のヌクレオチド配列部分」の部分は、前に本明細書で説明されているように6〜100ヌクレオチドの異なる長さであってもよい。環状化プローブにおけるアダプター配列又はヌクレオチド伸長配列の部分は、最大で全アダプター長又はヌクレオチド伸長配列長であるが、8から30ヌクレオチド、好ましくは9から20、より好ましくは10〜15ヌクレオチドなど、より短くてもよい。環状化プローブにおいて、「既知のヌクレオチド配列部分」及びアダプター配列又はヌクレオチド伸長配列は、隣接して位置することができる。特定の実施形態において、「既知のヌクレオチド配列部分」及び/又はアダプター配列若しくはヌクレオチド伸長配列は、環状化プローブの末端(の一方)に位置してもよいが、環状化プローブがアダプターライゲーション断片又はヌクレオチド伸長断片にアニールされる場合、一端又は両端にオーバーハングがあり得る実施形態がある。
環状化可能なプローブが断片にハイブリダイズされるときに、環状化可能なプローブがオーバーハングを有する実施形態において、オーバーハングはライゲーションの前に、好ましくは酵素を用いて、例えばフラップエンドヌクレアーゼ又はヌクレアーゼ活性を有するポリメラーゼ(両方ともそれ自体、当技術分野で公知の)を使用して除去することができる。
環状化プローブは、変性(一本鎖)アダプターライゲーション断片又はヌクレオチド伸長断片のボトム鎖又はトップ鎖を対象とすることができる。トップ鎖又はボトム鎖が環状化プローブにより標的にされるかに応じて、環状化プローブの配向は異なり得る('3-5'対5'-3')。他のアダプター、プライマー等はそれに応じて修飾され得る。
本発明の方法において、変性(一本鎖)アダプターライゲーション断片又はヌクレオチド伸長断片は環状化プローブと組み合わされる。一本鎖アダプターライゲーション断片又はヌクレオチド伸長断片及び環状化プローブの結合は、ハイブリダイズ条件下で行われる。変性アダプターライゲーション断片又はヌクレオチド伸長断片及び環状化プローブは、ハイブリダイズすることができる。環状化プローブは、断片の一端又はこの近くで「既知のヌクレオチド配列部分」の部分に、及び他端又はこの近くでアダプター又はヌクレオチド伸長の部分にアニールすることになる。ハイブリダイズされた一本鎖アダプターライゲーション断片又はヌクレオチド伸長断片及び環状化プローブは、環状構造を形成する。一本鎖アダプターライゲーション断片又はヌクレオチド伸長断片の今や環状構造は、環状化変性アダプターライゲーション断片又はヌクレオチド伸長断片として示される。これは環状化されているが、まだ環状ではない。この理由は、該構造が環状化プローブの存在により環状型で安定化されるためである。これは、環状化プローブの末端がライゲーションされた時点、又はさもなければ互いに連結された時点でのみ環状になる。
「既知のヌクレオチド配列部分」の部分及びアダプター又はヌクレオチド伸長配列の部分が、環状化プローブにおいて互いに隣接して位置する実施形態において、環状化変性アダプターライゲーション断片又はヌクレオチド伸長断片の末端もまた、環状化プローブにアニールされる場合に隣接して位置する。環状化変性アダプターライゲーション断片又はヌクレオチド伸長断片の末端は、隣接して位置する場合にライゲーションすることができる。特定の実施形態において、環状化プローブ中の「既知のヌクレオチド配列部分」の部分とアダプター又はヌクレオチド伸長配列の部分の間にスペーサーなどの間欠的部分がある場合(他の部分でより広く論じられた実施形態)、環状化変性アダプターライゲーション断片又はヌクレオチド伸長断片の末端間には、ヌクレオチド又はオリゴヌクレオチドのどちらかで埋めることができるギャップがあるため、ライゲーションされた環状化変性アダプターライゲーション断片又はヌクレオチド伸長断片を提供するのに、(埋められた)環状化変性アダプターライゲーション断片又はヌクレオチド伸長断片がライゲーションされ得る。ライゲーションは、リガーゼ又は、ライゲーションについて本明細書の他の部分に記載された他の手段を用いて行うことができる。
ライゲーションされた環状化変性アダプターライゲーション又はヌクレオチド伸長断片(環状断片としても示される)は、環状断片の配列の少なくとも一部を決定するために今や配列決定することができる。配列は、任意の公知の配列技術を用いて決定することができるが、次世代シーケンシング、又は次次世代シーケンシング及び/若しくはSMRTシーケンシング(Roche社、lllumina社、Helicos社、Pacific Biosciences社等により提供される技術などの)などの現在の配列決定技術が好ましい。
本発明の方法により得られた配列情報は、試料のより完全なゲノム配列を生成するために、既に利用可能な配列情報(「既知のヌクレオチド配列部分」などの、ただしこれに限定されない)と一緒に、例えばアライメントにより使用することができる。得られた配列情報は、現在利用可能な配列情報を補正するための配列情報を生成し、及び/又は情報が利用可能でない試料の配列情報を提供するのにも使用することができる。故に、特定の実施形態において本発明の方法により得られた配列情報は、少なくとも1つの「既知のヌクレオチド配列部分」が利用可能である好ましくは1つ又は複数の位置での、ゲノム配列におけるギャップ閉鎖に使用される。別の実施形態において、更なる配列情報は、物理地図又はドラフトゲノム配列からなどの既存の配列情報に関連づけられる。特定の好ましい実施形態において「既知のヌクレオチド配列部分」は、(植物の)形質又は遺伝子が位置するゲノムの領域に連結される。この理由は例えば、「既知のヌクレオチド配列部分」が、AFLPマーカー若しくはRFLPマーカーなどの多型マーカー、又は幾つかの以前の遺伝子マーカー情報から得られるためである。「既知のヌクレオチド配列部分」は、今や得られた配列情報を用いて既存の物理地図のアセンブリを更に作製して、物理地図の密度を向上させるのに使用することもできる。本明細書で使用されるとき、用語「アセンブリ」は、(部分的に)重複する配列のコレクションの順番づけに基づくコンティグの構築(construction)を指し、「コンティグ構築(contig building)」とも呼ばれる。該方法の更なる使用は、再配列決定、又は「既知のヌクレオチド配列部分」の近傍における配列多様性の決定に使用するのに具現化される。この文脈での近傍は、「既知のヌクレオチド配列部分」から10000ヌクレオチド内、好ましくは5000、2500、1000、500、250、又は100ヌクレオチド内である。
該方法が「マルチプレックスで」行うこともできることは、本発明の文脈から明らかであろう。これは、該方法が、複数の異なる「既知のヌクレオチド配列部分」及び/又は複数の核酸試料及び/又は多数の制限酵素でも同様にうまく機能することを意味する。モノプレックスフォーマットであれ又はマルチプレックスであれ、環状化可能な構造は、一端のKNSS、及び2つの末端のライゲーション後に配列決定される他端のアダプターライゲーション断片又はヌクレオチド伸長断片を用いて作製される(フラップ除去後、必要であれば)という本質に変わりはない。また、本明細書で上記に広く論じられている、モノプレックス適用に関して記載された実施形態及び変形形態が、下記のマルチプレックスオプションに対して同じく適用可能であることも明らかであろう。
以下、マルチプレックス変形例が、上記に記載された3つのモノプレックス実施形態に基づき詳述される。
1つの実施形態において、核酸試料のヌクレオチド配列の利用可能な部分は、複数の「既知のヌクレオチド配列部分」の形態で利用可能である。故に、複数の異なる「既知のヌクレオチド配列部分」が使用される1つの実施形態において、本発明の方法は、核酸試料から配列情報を得る方法であって、
a)核酸試料のヌクレオチド配列情報の少なくとも一部が、複数の「既知のヌクレオチド配列部分」の形態で利用可能である核酸試料を提供する工程と、
b)核酸試料を断片化して1つ又は複数の断片を得る工程と、
c)場合により、断片の末端を平滑化する工程と、
d)場合により、1つ又は複数の3'ヌクレオチドを断片に付加する工程と、
e) 1つ又は複数のアダプターを断片の一端又は両端にライゲーションしてアダプターライゲーション断片を得る工程と、
f)アダプターライゲーション断片を変性させて、変性アダプターライゲーション断片を得る工程と、
g)少なくとも1つの、好ましくはそれぞれの、複数の任意に選択された「既知のヌクレオチド配列部分」に、「既知のヌクレオチド配列部分」の少なくとも一部及びアダプター配列の少なくとも一部を含む環状化プローブを提供する工程と、
h)変性アダプターライゲーション断片を環状化プローブと結合する工程と、
i)環状化プローブ及び変性アダプターライゲーション断片をハイブリダイズさせ、環状化変性アダプターライゲーション断片を形成させる工程と、
j)場合により、オーバーハングを除去する工程と、
k)場合により、「既知のヌクレオチド配列部分」(の一部)とアダプター(の一部)の間の欠損ヌクレオチドを充填する工程と、
l)環状化アダプターライゲーション断片の末端をライゲーションして、ライゲーションされた環状化アダプターライゲーション断片を得る工程と、
m)ライゲーションされた環状化アダプターライゲーション断片を配列決定する工程と
を含み、
ライゲーションされた環状化アダプターライゲーション断片の配列情報が、それぞれの(選択された)「既知のヌクレオチド配列部分」に対して得られる方法に関する。
複数の「既知のヌクレオチド配列部分」及び環状化プローブの設計におけるこの使用は、「既知のヌクレオチド配列部分」ごとに、ライゲーションされた環状化アダプターライゲーション断片の複数の配列情報を提供する。特定の実施形態において、環状化可能なプローブを提供する工程、アダプターライゲーションプローブを結合する工程、及び変性工程の順番は、変性工程、環状化可能なプローブの提供、及びアダプターライゲーションプローブの結合の順番と交換されてもよい。特定の実施形態においてアダプターライゲーションは、ヌクレオチド伸長工程における断片への3'ヌクレオチドの付加に取って代わられてもよい。これらの変形例は、複数の試料を用いるマルチプレックス変形例に関する以下の実施形態に対して同じく適用可能である。
1つの実施形態において、それぞれが1つ又は複数の「既知のヌクレオチド配列部分」を含有する複数の試料が分析されて、これにより更なる配列情報を得る。故に、複数の試料が使用される1つの実施形態において、本発明の方法は、多数の核酸試料から配列情報を得る方法であって、
a)核酸試料のヌクレオチド配列情報の少なくとも一部が、「既知のヌクレオチド配列部分」の形態で利用可能である多数の核酸試料を提供する工程と、
核酸試料(組み合わされた又は別個のどちらか)ごとに、
b)核酸試料を断片化して1つ又は複数の断片を得る工程と、
c)場合により、断片の末端を平滑化する工程と、
d)場合により、1つ又は複数の3'ヌクレオチドを断片に付加する工程と、
e) 1つ又は複数のアダプターを断片の一端又は両端にライゲーションしてアダプターライゲーション断片を得る工程と、
f)アダプターライゲーション断片を変性させて変性アダプターライゲーション断片を得る工程と、
g)少なくとも1つの、好ましくはそれぞれの、複数の任意に選択された「既知のヌクレオチド配列部分」に、「既知のヌクレオチド配列部分」の少なくとも一部及びアダプター配列の少なくとも一部を含む環状化プローブを提供する工程と、
h)変性アダプターライゲーション断片を環状化プローブと結合する工程と、
i)環状化プローブ及び変性アダプターライゲーション断片をハイブリダイズさせ、環状化変性アダプターライゲーション断片を形成させる工程と、
j)場合により、オーバーハングを除去する工程と、
k)場合により、「既知のヌクレオチド配列部分」(の一部)とアダプター(の一部)の間の欠損ヌクレオチドを充填する工程と、
l)環状化アダプターライゲーション断片の末端をライゲーションして、ライゲーションされた環状化アダプターライゲーション断片を得る工程と、
m)ライゲーションされた環状化アダプターライゲーション断片を配列決定する工程と
を含み、
ライゲーションされた環状化アダプターライゲーション断片の配列情報が、試料ごとにそれぞれの(選択された)「既知のヌクレオチド配列部分」に対して得られる方法に関する。
特定の実施形態において、複数のKNSS及び/又は複数の試料及び/又は複数の制限酵素を用いる本明細書で上記に記載されたマルチプレックス方法も、3'ヌクレオチド伸長断片の使用に基づき、又は変性工程及び環状化プローブとの結合工程を交換して提供されることが具体的に観察される。
制限酵素の使用に基づく最も単純な形態の1つにおいて、本発明は、核酸試料から配列情報を得る方法であって、
a)核酸試料のヌクレオチド配列情報の少なくとも一部が「既知のヌクレオチド配列部分」の形態で利用可能であり、それぞれの「既知のヌクレオチド配列部分」が1つ又は複数の制限酵素消化部位を含む核酸試料を提供する工程と、
b)制限酵素が制限酵素消化部位で消化して制限酵素消化断片を得る、核酸試料を制限酵素で消化する工程と、
c)アダプターを制限酵素消化断片の制限酵素消化末端の一方又は両方にライゲーションして、アダプターライゲーション制限酵素消化断片を得る工程と、
d)アダプターライゲーション制限酵素消化断片を変性させて、変性アダプターライゲーション制限酵素消化断片を得る工程と、
e)好ましくはそれぞれの断片に対して、「既知のヌクレオチド配列部分」の少なくとも一部及びアダプター配列の少なくとも一部を含む環状化プローブを提供する工程と、
f)変性アダプターライゲーション制限酵素消化断片を環状化プローブと結合する工程と、
g)環状化プローブ及び変性アダプターライゲーション制限酵素消化断片をハイブリダイズさせ、環状化変性アダプターライゲーション制限酵素消化断片を形成させる工程と、
h)環状化アダプターライゲーション制限酵素消化断片の末端をライゲーションして、ライゲーションされた環状化アダプターライゲーション制限酵素消化断片を得る工程と、
i)ライゲーションされた環状化アダプターライゲーション制限酵素消化断片を配列決定する工程と
を含み、
ライゲーションされた環状化アダプターライゲーション制限酵素消化断片の配列情報を得るのに、断片ごとにたった1つの「既知のヌクレオチド配列部分」の配列情報が必要とされる方法に関する。
1つの実施形態において、核酸試料のヌクレオチド配列の利用可能な部分は、制限酵素消化部位を含む複数の「既知のヌクレオチド配列部分」の形態で利用可能である。故に、複数の異なる「既知のヌクレオチド配列部分」が使用される1つの実施形態において、本発明の方法は、核酸試料から配列情報を得る方法であって、
a)核酸試料のヌクレオチド配列情報の少なくとも一部が複数の「既知のヌクレオチド配列部分」の形態で利用可能であり、それぞれの「既知のヌクレオチド配列部分」が制限酵素消化部位を含む核酸試料を提供する工程と、
b)制限酵素が制限酵素消化部位で消化して制限酵素消化断片を得る、核酸試料を1つ又は複数の制限酵素で消化する工程と、
c) 1つ又は複数のアダプターを制限酵素消化断片の制限酵素消化末端の一方又は両方にライゲーションして、アダプターライゲーション制限酵素消化断片を得る工程と、
d)アダプターライゲーション制限酵素消化断片を変性させて、変性アダプターライゲーション制限酵素消化断片を得る工程と、
e)「既知のヌクレオチド配列部分」の少なくとも一部及びアダプター配列の少なくとも一部を含む環状化プローブを提供する工程と、
f)変性アダプターライゲーション制限酵素消化断片を環状化プローブと結合する工程と、
g)環状化プローブ及び変性アダプターライゲーション制限酵素消化断片をハイブリダイズさせ、環状化変性アダプターライゲーション制限酵素消化断片を形成させる工程と、
h)環状化アダプターライゲーション制限酵素消化断片の末端をライゲーションして、ライゲーションされた環状化アダプターライゲーション制限酵素消化断片を得る工程と、
i)ライゲーションされた環状化アダプターライゲーション制限酵素消化断片を配列決定する工程と
を含み、
「既知のヌクレオチド配列部分」ごとに、ライゲーションされた環状化アダプターライゲーション制限酵素消化断片の配列情報を得るのに、たった1つの「既知のヌクレオチド配列部分」の配列情報が必要とされる方法に関する。
1つの実施形態において、それぞれが1つ又は複数の「既知のヌクレオチド配列部分」を含有する複数の試料が分析されて、これにより更なる配列情報を得る。故に、複数の試料が使用される1つの実施形態において、本発明の方法は、多数の核酸試料から配列情報を得る方法であって、
a)核酸試料のヌクレオチド配列情報の少なくとも一部が「既知のヌクレオチド配列部分」の形態で利用可能であり、それぞれの「既知のヌクレオチド配列部分」が制限酵素消化部位を含む多数の核酸試料を提供する工程と、
核酸試料((組み合わされた又は別個のどちらか)ごとに、
b)制限酵素が制限酵素消化部位で消化して制限酵素消化断片を得る、核酸試料を制限酵素で消化する工程と、
c)アダプターを制限酵素消化断片の制限酵素消化末端の少なくとも一方にライゲーションして、アダプターライゲーション制限酵素消化断片を得る工程と、
d)アダプターライゲーション制限酵素消化断片を変性させて、変性アダプターライゲーション制限酵素消化断片を得る工程と、
e)それぞれの環状化プローブが1つの「既知のヌクレオチド配列部分」の少なくとも一部及びアダプター配列の少なくとも一部を含む、複数の「既知のヌクレオチド配列部分」ごとに環状化プローブを提供する工程と、
f)環状化プローブ及び変性アダプターライゲーション制限酵素消化断片をハイブリダイズさせ、環状化変性アダプターライゲーション制限酵素消化断片を形成させる、変性アダプターライゲーション制限酵素消化断片を環状化プローブと結合する工程と、
g)環状化アダプターライゲーション制限酵素消化断片の末端をライゲーションして、ライゲーションされた環状化アダプターライゲーション制限酵素消化断片を得る工程と、
h)ライゲーションされた環状化アダプターライゲーション制限酵素消化断片を配列決定する工程と
を含む方法に関する。
「既知のヌクレオチド配列部分」は、各試料について同じであってもよく(これにより、得られた配列情報を比較して試料間の多型スクリーニングを可能にする)、又は異なっていてもよい(例えばできるだけ多くの配列情報を生成するために)。
試料は、既に最初から、基本的に方法の任意の時点で試料のプールに混合されてよく、又は配列決定工程まで別々に処理されてもよい。試料は、アダプターライゲーション工程後、又は環状化工程後に混合されてもよい。
試料が一緒に処理される場合、例えばプールされ又はさもなければ混合される場合、試料は識別子を組み込むことにより互いに区別することができる。このような識別子はアダプターに組み込むことができ、アダプターへの組み込みにより又はアダプターライゲーションの前後の別個のライゲーション工程により、アダプターライゲーション工程で既に含まれてもよい。識別子は、環状化プローブの設計に組み込むこともでき、「既知のヌクレオチド配列部分」の部分とアダプターの部分の間に置かれてもよい。識別子はまた、ヌクレオチド伸長断片を得るための3'ヌクレオチドの付加中に組み込むこともできる。
多数の制限酵素が使用される1つの実施形態において、本発明の方法は、核酸試料から配列情報を得る方法であって、
a)核酸試料のヌクレオチド配列情報の少なくとも一部が「既知のヌクレオチド配列部分」の形態で利用可能であり、それぞれの「既知のヌクレオチド配列部分」が1つ又は複数の制限酵素消化部位を含む核酸試料を提供する工程と、
b)制限酵素がそれぞれの制限酵素消化部位で消化して制限酵素消化断片を得る、核酸試料を多数の制限酵素で消化する工程と、
c)アダプターを制限酵素消化断片の制限酵素消化末端の少なくとも一方にライゲーションして、アダプターライゲーション制限酵素消化断片を得る工程と、
d)アダプターライゲーション制限酵素消化断片を変性させて、変性アダプターライゲーション制限酵素消化断片を得る工程と、
e)それぞれの環状化プローブが1つの「既知のヌクレオチド配列部分」の少なくとも一部及びアダプター配列の少なくとも一部を含む、複数の「既知のヌクレオチド配列部分」ごとに環状化プローブを提供する工程と、
f)環状化プローブ及び変性アダプターライゲーション制限酵素消化断片をハイブリダイズさせ、環状化変性アダプターライゲーション制限酵素消化断片を形成させる、変性アダプターライゲーション制限酵素消化断片を環状化プローブと結合する工程と、
g)環状化アダプターライゲーション制限酵素消化断片の末端をライゲーションして、ライゲーションされた環状化アダプターライゲーション制限酵素消化断片を得る工程と、
h)ライゲーションされた環状化アダプターライゲーション制限酵素消化断片を配列決定する工程と
を含む方法に関する。
多数の制限酵素(好ましくは少なくとも2個、2個、少なくとも3個、又は3個の制限酵素)を使用する場合、異なる長分布を有し得る種々の断片セットが得られる可能性がある。異なる認識配列を含有する異なる制限酵素由来の断片には、異なるアダプターがライゲーションされ得る。このため、2つ制限酵素(例えばEcoRI及びMseI)により得られた1つの断片には、2つの異なるアダプターがライゲーションされ得る(例えばEcoRIアダプター及びMseIアダプター)。これはまた、異なる配列決定プラットフォームを提供するのにも有用であり得る。これはまた、ハイスループット能力の向上に極めて有利である。異なる(一本鎖又は二本鎖)アダプターを使用することにより、異なる環状化プローブが設計され得る。1つの断片に対して異なるアダプターを使用する実施形態において、環状化プローブは、一方の鎖(例えばトップ鎖)の1つのアダプター及び「既知のヌクレオチド配列部分」及び他方の鎖(ここではボトム鎖)の他のアダプター及び同じ「既知のヌクレオチド配列部分」に対して設計されてもよく、これにより効率性及び信頼性を更に増加することができる(1つの試料においてトップ鎖及びボトム鎖の両方を決定することは、誤差率をかなり低減する)。
異なる環状化プローブを利用可能にすることは、大きなグループの中からの断片の選択も可能にし、そのため、大規模な試料の提供に役立ち得る、又は多数の「既知のヌクレオチド配列部分」がある[例えば物理地図から利用可能な多数(数千個)の配列リードがある]方法の使用に役立ち得る複雑性の低減が達成され得る(例えば、本発明者らが、それぞれ約60ヌクレオチドの数百万配列リードに基づき物理地図を生成したWO200500791を参照のこと)。それぞれのこれらのリードの部分は、「既知のヌクレオチド配列部分」の基礎から形成することができる。
複数の「既知のヌクレオチド配列部分」と組み合わせて使用される多数の酵素、又は複数の「既知のヌクレオチド配列部分」及び多数の試料等などの可能性のある組み合わせがあることは、上記の変形形態から明らかであろう。この点において、用語「多数(multiplicity)」、「多数(multitude)」、「複数(plurality)」は、「1つを超える」若しくは「1つ又は複数の」若しくは「少なくとも1つの」を指すという点で同じ意味を有することも認められる。種々の用語「multiplicity」、「multitude」、「plurality」は、本発明の様々な(及び複雑な)多数度レベルの明確な像を描くのに使用される。種々の用語は、混乱を避けることが意図される。これは、種々の用語が互換的に使用され得ることも意味する。これは、言い回しの言語的適応を必要とし得るが、それでもやはり本発明の範囲内にとどまる。この点において、本明細書で使用されるとき、用語「a」、「an」及び「the」はこれらの単数形で複数の指示対象を指し、文脈が特に明確に指示しない限り逆もまた同様である。例えば、「a」DNA分子を単離する方法は、複数の分子(例えば数十個、数百個、数千個、数万個、数十万個、数百万個の又はこれを超える分子)の単離を含む。
本明細書で使用されるとき、用語「ハイスループットシーケンシング」及び「次世代シーケンシング」は、典型的には、一度に数百というより配列リードの何千(すなわち数万又は数十万)又は何百万の桁で、大量のリードを生成することができる配列決定技術を指す。ハイスループットシーケンシングは、従来のサンガー又はキャピラリー配列決定と区別され、これらと異なる。典型的には、配列決定産物は約600から30bpの相対的に短いリードを典型的には有する配列決定産物自体である。このような方法の例は、Seoら(2004) Proc. Natl. Acad. Sci. USA 101:5488〜93頁によるWO03/004690、WO03/054142、WO2004/069849、WO2004/070005、WO2004/070007、及びWO2005/003375に開示されたパイロシーケンシングベースの方法により与えられる。これらの技術は更に、リードアセンブリ等のための広範及び複雑なデータ記憶及び処理ワークフローを含む。ハイスループットシーケンシングの利用可能性は、現在生産されているデータのタイプ及び質に適応するように再設計される、ゲノム分析のための多くの従来のワークフロー及び方法を必要とする。次世代ハイスループットシーケンシングは、「Next Generation Genome sequencing」M. Janitz編(Wiley-Blackwell、2008)にも広く記載されている。
環状化プローブは、更にスペーサーを含んでもよい。スペーサーは、環状化プローブに組み込まれたヌクレオチド配列である。スペーサーは、「既知のヌクレオチド配列部分」の部分とアダプター配列又はヌクレオチド伸長配列の部分の間に組み込むことができる。スペーサーは一本鎖又は二本鎖であってもよい。スペーサーは任意の長さであってもよい。スペーサーは、増幅プライマー配列及び/又は配列決定プライマー配列などのプライマー配列(一般に、プライマー配列は、増幅又は伸長の開始としてのプライマーを結合することができる)などの他の機能も含有することができる。スペーサーは、スペーサーの別個の部分で提供される機能性を含有してもよく、又はこのような機能性を1つに組み合わせてもよい(すなわち、プロセスの別の時点で配列決定プライマーとして使用することができる、組み合わされた増幅プライマー配列)。
環状化断片の末端間のギャップは、ポリメラーゼとヌクレオチドとの組み合わせ又はオリゴヌクレオチド又はこれらの組み合わせにより埋めることができる。
スペーサー配列又はアダプター又はヌクレオチド伸長配列又はプライマーは、識別子を含有することができる。識別子は、試料特異的、「既知のヌクレオチド配列部分」特異的、又は両方の組み合わせであってもよい。
本明細書で使用されるとき、用語「識別子」は、アダプター若しくはプライマーに付加され得、又はこの配列に含まれ得、又はさもなければ固有の識別子を提供するための標識として使用され得る短い配列を指す。このような配列識別子(タグ)は、様々であるが規定された長さ、典型的には特定の核酸試料を同定するのに使用される4〜16bpの固有の塩基配列であってもよい。例えば4bpタグは、4(exp4)=256個の異なるタグを可能にする。このような識別子を用いて、更に処理すると配列又は試料の起源が決定され得る。異なる核酸試料由来の処理産物を組み合わせる場合、異なる核酸試料は一般的に、異なる識別子を用いて同定される。識別子は好ましくは、互いに少なくとも2塩基対異なり、ミスリードを防ぐために2個の同一連続塩基を好ましくは含有しない。互いに少なくとも2塩基対異なり、及び/又は2個の同一連続塩基を含有しない識別子は、固有の同定に適切な数の識別子を提供するために、典型的にはより長い(5から上、したがって5、6、7、8ヌクレオチド、又は9若しくは10ヌクレオチドなどこれより長い)。識別子機能は、実施形態においてアダプター又はプライマーなどの他の機能性と組み合わせることができる(すなわち、増幅ラウンド中に識別子を導入するための、例えばアニーリング末端の5'に識別子を含有する識別子含有アダプター又はプライマー)。
本明細書で使用されるとき、用語「ハイブリダイゼーション」は、標的核酸に対する相補的配列のアニーリングを伴うプロセスを指す。相補的配列を含有する核酸の2つポリマーが、互いを見出し、塩基対合相互作用を通じてアニールする能力は、よく認識された現象である。Marmur及びLane、Proc. Natl. Acad. Sci. USA 46:453 (1960)及びDotyら、Proc. Natl. Acad. Sci. USA 46:461 (1960)による「ハイブリダイゼーション」プロセスの最初の観察は、この後、モダンバイオロジーの不可欠のツールへのこのプロセスの改良が行われた。2つ相補的配列の例は5'-AGTCC-3'及び3'-GGACT-5"であり、AはTと塩基対することができ(すなわち水素結合を形成し)、GはCと塩基対合することができる。この例において2つは全てのヌクレオチド間の塩基対から相補的であるが、これは必ずしも当てはまる必要はない。2つ相補的配列が塩基対を形成し得、アニールし得る限り、2つ相補的配列はハイブリダイズされる。
本明細書で使用されるとき、用語「ストリンジェントなハイブリダイゼーション条件」は、所与のヌクレオチド配列と実質的に同一であるヌクレオチド配列を同定するのに使用されるプロセスを指す。ハイブリダイゼーション条件のストリンジェンシーは配列依存的であり、状況によって異なるであろう。一般的に、ストリンジェントな条件は、規定されたイオン強度及びpHでの特異的配列の熱融点(Tm)より5℃低いように選択される。Tmは、標的配列の50%が、完全にマッチしたプローブにハイブリダイズする温度(規定されたイオン強度及びpH下の)である。典型的には、塩(NaCl)濃度がpH7で約0.02モルであり温度が少なくとも60℃であるストリンジェントな条件が選択されるであろう。塩濃度の低下及び/又は温度の上昇は、ストリンジェンシーを向上させる。RNA-DNAハイブリダイゼーション(例えば100ntのプローブを用いるノーザンブロット)に対するストリンジェントな条件は、例えば、0.2×SSC中、63℃で20分間の少なくとも1回の洗浄、又は等価条件を含むものである。DNA-DNAハイブリダイゼーション(例えば100ntのプローブを用いるサザンブロット)に対するストリンジェントな条件は、例えば、0.2×SSC中、少なくとも50℃、通常は約55℃の温度で20分間の少なくとも1回の洗浄(通常は2回)、又は等価条件を含むものである。Sambrookら(1989)、並びにSambrook及びRussell (2001)も参照のこと。
本明細書で使用されるときハイブリダイズ条件は、好ましくは高ストリンジェンシー条件である。「高ストリンジェンシー」条件は例えば、6×SSC (20×SSCは、3.0M NaCl、0.3Mクエン酸ナトリウム、pH7.0を含有する)、5×デンハルト溶液(100×デンハルト溶液は、2%フィコール、2%ポリビニルピロリドン、2%ウシ血清アルブミンを含有する)、0.5%ドデシル硫酸ナトリウム(SDS)、及び非特異的コンペティターとして20μg/ml変性担体DNA (120〜3000ヌクレオチドの平均長を有する一本鎖魚精子DNA)を含有する水性溶液中、65℃でのハイブリダイゼーションにより提供することができる。ハイブリダイゼーション後、高ストリンジェンシー洗浄が、0.2〜0.1×SSC、0.1% SDS中、ハイブリダイゼーション温度での最終洗浄(約30分)により幾つかの工程で行われ得る。
「中程度のストリンジェンシー」は、上記に記載された溶液でのハイブリダイゼーション(ただし、約60〜62℃)に等しい条件を指す。この場合、最終洗浄は、1×SSC、0.1% SDS中、ハイブリダイゼーション温度で行われる。
「低ストリンジェンシー」は、約50〜52℃の上記に記載された溶液でのハイブリダイゼーションに等しい条件を指す。この場合、最終洗浄は、2×SSC、0.1% SDS中、ハイブリダイゼーション温度で行われる。Sambrookら(1989)、並びにSambrook及びRussell (2001)も参照のこと。
アダプターライゲーション断片及びヌクレオチド伸長断片は、増幅することができる。増幅は、配列決定プロセスの前又は配列決定プロセスの一環として、アダプターライゲーション断片又はヌクレオチド伸長断片で行うことができる。故にアダプターライゲーション断片若しくはヌクレオチド伸長断片が増幅され得、及び/又は環状化断片が増幅され得る。
増幅は、ランダムプライマー、すなわちプライマー又は増幅を開始するためのランダム配列を含有するプライマーセットを用いて行うことができる。増幅用プライマーは、「既知のヌクレオチド配列部分」の配列の少なくとも一部、又はアダプター/ヌクレオチド伸長配列の少なくとも一部、又は両方にアニーリング(及びこれらから増幅を開始)することができるプライマーであってもよい。ランダムプライマーは、断片の内部配列、すなわち未知の部分にアニールするように設計することもできる。増幅は、単一プライマー、プライマーの対又は複数のプライマーを用いて行うことができる。プライマーはまた、特異的であってもよく、すなわち、KNSSのより大きなグループの中の特定のKNSSの形態など、特定の(選択された)配列を特異的に増幅するように設計されてもよい。
増幅はまた、AFLP型選択的増幅などの選択的増幅方法であってもよい。本明細書で使用されるとき、用語「AFLP」は、核酸を1つ又は複数の制限エンドヌクレアーゼで消化して制限断片を産生する工程、アダプター制限断片にライゲーションする工程、及びアダプターライゲーション制限断片を少なくとも1つのプライマーで増幅する工程に基づく、核酸の選択的増幅の方法を指す。該プライマーは、アダプターに(部分的に)相補的であり、制限エンドヌクレアーゼの残りに(部分的に)相補的であり、及び更にプライマーの3'末端のA、C、T、又はG (又は場合によりU)の中から少なくとも1つのランダムに選択されたヌクレオチドを含有する。AFLPは任意の事前の配列情報を必要とせず、任意の開始DNAで行うことができる。一般に、AFLPは、
(a)核酸、特にDNA又はcDNAを、1つ又は複数の特異的制限エンドヌクレアーゼで消化して、DNAを対応する一連の制限断片に断片化する工程と、
(b)故に得られた制限断片を(一本鎖又は二本鎖)合成オリゴヌクレオチドアダプター(この一端は、制限断片の一端又は両端と適合性である)とライゲーションして、これにより開始DNAのアダプターライゲーション制限断片を作製する工程と、
(c)ハイブリダイズ条件下、アダプターライゲーション制限断片を、3'末端に選択的ヌクレオチドを含有する1つ又は複数のオリゴヌクレオチドプライマーと接触させる工程と、
(d)プライマーがハイブリダイズした開始DNAの制限断片に沿ってハイブリダイズされたプライマーの更なる伸長をもたらすように、プライマーとハイブリダイズされたアダプターライゲーション制限断片をPCR又は類似の手法により増幅する工程と、
(e)故に得られた増幅又は伸長されたDNA断片を検出、同定又は回収する工程と
を含む。
AFLP型増幅は故に、アダプターライゲーション断片の再現可能なサブセットを提供する。AFLPは、EP534858、US6045994、及びVosら1995. AFLP: a new technique for DNA fingerprinting. Nucleic Acids Research 23(21): 4407〜4414頁に記載されている。AFLPに関する更なる詳細は、これらの刊行物を参照のこと。AFLP、複雑性低減法及びDNAフィンガープリント技術として一般的に使用される。
本明細書で使用されるとき、用語「選択的塩基」、「選択的ヌクレオチド」、及び「ランダムに選択的なヌクレオチド」は、プライマーの3'末端に位置する塩基又はヌクレオチドを指し、選択的塩基はA、C、T又はG(又は場合によりU)の中からランダムに選択される。選択的塩基でプライマーを伸長することにより、この後の増幅は、アダプターライゲーション制限断片の再現可能なサブセットのみ、すなわち、選択的塩基を有するプライマーを用いて増幅することができる断片のみを産生するであろう。選択的ヌクレオチドは、1から10の異なる数でプライマーの3'末端に付加することができる。典型的には、1〜4個で十分である。プライマー(PCRにおける)は両方とも、異なる数の選択的塩基を含有し得る。それぞれの付加された選択的塩基により、サブセットは、サブセットにおける増幅アダプターライゲーション制限断片の量を約4倍低減する。このタイプの複雑性低減は、いずれの以前の配列知識も必要とせず又は考慮に入れず、選択的ヌクレオチドにのみ基づくことから、ランダムと見なされる。典型的には、AFLP技術(EP534858)で使用される選択的塩基の数は+N+Mにより示され、1つのプライマーはN個の選択的ヌクレオチドを有し、他のプライマーはM個の選択的ヌクレオチドを有する。故に、Eco/Mse +1/+2 AFLPは、EcoRI及びMseIによる開始DNAの消化、適切なアダプターのライゲーション、並びに1個の選択的塩基を有するEcoRI制限位置に対する1つのプライマー、及び2個の選択的ヌクレオチドを有するMseI制限部位に対する他のプライマーを用いた増幅の省略である。少なくとも1個の選択的ヌクレオチドを3'末端に有するAFLPにおいて使用されるプライマーは、AFLPプライマーとしても描かれる。選択的ヌクレオチドを3'末端に有さず、実際にアダプター及び制限部位の残りに相補的であるプライマーは、AFLP+0プライマーとして示されることもある。用語、選択的ヌクレオチドは、アダプター部分に隣接して位置し、選択的プライマーの使用により同定され、この結果としてヌクレオチドが知られるようになった標的配列のヌクレオチドに対しても使用される。
本発明のライゲーションされた環状化断片の増幅には、phi29などの鎖置換活性を有するポリメラーゼが使用されることが好ましい。増幅は、ローリングサークル増幅であることが更に好ましい。
環状化断片を濃縮又は増幅するためのアダプターライゲーション断片又はヌクレオチド伸長断片の(選択的)増幅は、線形であっても又は指数関数的であっても、アンプリコンをもたらす。
本明細書で使用されるとき、用語「増幅(amplification)」及び「増幅(amplifying)」は、ポリヌクレオチド増幅反応、すなわち、1つ又は複数の開始配列から複製されるポリヌクレオチドの集団を指す。増幅は、ポリメラーゼ連鎖反応、線形ポリメラーゼ反応、核酸配列ベースの増幅、ローリングサークル増幅等の反応を含むがこれらに限定されない様々な増幅反応を指してもよい。典型的には、増幅プライマーは増幅に使用され、増幅反応の結果がアンプリコンである。本明細書で使用されるとき、用語「増幅プライマー」は、DNAの合成をプライムすることができる一本鎖ヌクレオチド配列を指す。DNAポリメラーゼは、プライマーなしでDNAをデノボ合成することができない。増幅プライマーはDNAにハイブリダイズし、すなわち塩基対が形成される。塩基対を形成することができるヌクレオチドは互いに相補的であり、例えばシトシン及びグアニン、チミン及びアデニン、アデニン及びウラシル、グアニン及びウラシルである。増幅プライマーと既存のDNA鎖の間の相補性は100%である必要はなく、すなわち、プライマーの全ての塩基が既存のDNA鎖と塩基対合する必要はない。増幅プライマーが(部分的に)ハイブリダイズする既存のDNA鎖、例えば試料DNA又はアダプターライゲーションDNA断片の配列は、しばしばプライマー結合部位又はプライマー結合配列(PBS)と呼ばれる。既存のDNA鎖とハイブリダイズされたプライマーの3'末端から、ヌクレオチドが既存の鎖を鋳型として用いて組み込まれる(鋳型特異的DNA合成)。本発明者らは、増幅反応で使用される合成オリゴヌクレオチド分子を「プライマー」とも呼ぶことがある。増幅反応で新たに合成されたヌクレオチド配列は、内部配列と呼ばれる場合がある。PCR反応が行われる場合、内部配列は典型的には、2つのプライマー結合部位間の配列である。本発明によれば、プライマーは、DNAに追加の配列を導入するための増幅工程で使用することができる。これは、識別子、配列決定アダプター、又はビオチン部分などの捕捉リガンドなどの追加の配列をプライマーに提供して達成することができる。修飾は、DNAの合成をプライムできるプライマーの部分から上流の、プライマーの5'末端で提供することにより導入することができる。
本明細書で使用されるとき、用語「アンプリコン」は、ポリヌクレオチド増幅反応の産物、すなわち、1つ又は複数の開始配列から複製されるポリヌクレオチドの集団を指す。アンプリコンは、ポリメラーゼ連鎖反応、線形ポリメラーゼ反応、核酸配列ベースの増幅、ローリングサークル増幅等の反応を含むがこれらに限定されない様々な増幅反応により産生され得る。
本発明の1つの実施形態において、ライゲーションされた環状化アダプターライゲーション断片若しくはヌクレオチド伸長断片、又はライゲーションされた環状化アダプターライゲーション制限酵素消化断片(環状化断片)は、配列決定工程の前に更に断片化される。これは、環状化断片が極めて大きく、利用可能な配列決定技術により提供され得るリード長を超える場合に有利となり得る。更なる断片化は、別の制限酵素による制限、又は切断及び/若しくは噴霧、及び/若しくはヌクレアーゼ処理などの物理的方法により達成することができる。
特定の実施形態において、エキソヌクレアーゼ処理が好ましくは環状化後に行われてもよい。エキソヌクレアーゼ処理は、非環状化配列、すなわち残留直鎖を有する配列を除去するのに使用されてもよい。
特定の実施形態において、環状化プローブは捕捉単位(ビオチン)と共に提供される。或いは、配列決定の前に環状化断片又はこのアンプリコンを捕捉するように、増幅プライマーがビオチン化されてもよい。
単一試料-単一KNSS-単一制限酵素-単一アダプターの略図を示す図である。 制限断片のトップ鎖にライゲーションするアダプターを用いる単一「既知のヌクレオチド配列部分」配列検出。DNAは制限酵素(EcoRI)を用いて消化される。アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物が、アダプター配列及び「既知のヌクレオチド配列部分」配列に相同であるオリゴヌクレオチドを用いて環状化される。環状化され変性された産物の末端がライゲーションされる。生成ライゲーション産物が配列決定され、これを用いて「既知のヌクレオチド配列部分」配列及びフランキング配列情報が決定される。 単一試料-単一KNSS-単一制限酵素-単一アダプターの略図を示す図である。 1つのKNSSのみの、図1の相似。一端にKNSS及び他端にアダプターを有する断片のみが環状化プローブにアニーリングすることができ、この後にライゲーション及び配列決定される。他の断片は環状化プローブにアニールせず、又は、アニールするならば、配列決定できる環状構造を形成するようにライゲーションすることができない。 単一試料-単一KNSS-単一制限酵素-単一アダプター-スペーサー配列なしを示す図である。 制限断片のボトム鎖にライゲーションするアダプターを用いる単一KNSS配列検出。DNAは制限酵素(EcoRI)を用いて消化される。アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物が、アダプター配列及び「既知のヌクレオチド配列部分」配列に相同であるオリゴヌクレオチドを用いて環状化される。環状化され変性された産物の末端がライゲーションされる。生成ライゲーション産物が配列決定され、これを用いて「既知のヌクレオチド配列部分」配列及びフランキング配列情報が決定される。 単一試料-複数のKNSS-単一制限酵素-単一アダプター-スペーサー配列なしを示す図である。 単一アダプターを用いる複数のKNSS配列検出。DNAは制限酵素(EcoRI)を用いて消化される。アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物のサブセットが、アダプター配列及び「既知のヌクレオチド配列部分」配列に相同なオリゴヌクレオチドを用いて環状化される。環状化され変性された産物の末端がライゲーションされ、この後配列決定される。 複数の試料-単一KNSS-単一制限酵素-複数のアダプター(試料IDを含む)-スペーサー配列なしを示す図である。 識別子配列を含有するアダプターを用いる2つの試料における単一KNSS配列検出。2つの試料のDNAは制限酵素を用いて消化される。試料特異的アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物のサブセットが、アダプター配列及び「既知のヌクレオチド配列部分」配列に相同なオリゴヌクレオチドを用いて環状化される。環状化され変性された産物の末端がライゲーションされ、この後配列決定される。 単一試料-複数のKNSS-単一制限酵素-単一アダプター-単一スペーサー配列を示す図である。 単一アダプターを用いる単一試料における複数のKNSS配列検出。DNAは制限酵素を用いて消化される。アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物のサブセットが、アダプター配列及びKNSSに相同なオリゴヌクレオチドを用いて環状化される。環状化オリゴヌクレオチドは部分的に二本鎖となり、スペーサー配列を導入する。末端がライゲーションされ、この後標的断片が配列決定される。 単一試料-複数のKNSS-単一制限酵素-単一アダプター-多数のスペーサー配列を示す図である。 単一試料における複数のKNSS配列検出 DNAは制限酵素を用いて消化される。アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物のサブセットが、アダプター配列及びKNSSに相同なオリゴヌクレオチドを用いて環状化される。環状化オリゴヌクレオチドは部分的に二本鎖となり、標的特異的スペーサー配列を導入する。末端がライゲーションされ、この後標的断片が配列決定される。 単一試料-単一「既知のヌクレオチド配列部分」-ランダム断片化-単一アダプター-スペーサー配列なしを示す図である。 断片のトップ鎖にライゲーションするアダプターを用いる単一「既知のヌクレオチド配列部分」配列検出。DNAはランダムに断片化される。アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物が、断片の内部に位置し得る、アダプター配列及び「既知のヌクレオチド配列部分」配列に相同であるオリゴヌクレオチドを用いて環状化される。断片(フラップ)の(場合により)非ハイブリダイズ末端が除去され、得られた末端がライゲーションされる。生成ライゲーション産物が配列決定され、これを用いて「既知のヌクレオチド配列部分」配列及びフランキング配列情報が決定される。 単一試料-単一「既知のヌクレオチド配列部分」-ランダム断片化-単一アダプター-スペーサー配列なし 断片のボトム鎖にライゲーションするアダプターを用いる単一「既知のヌクレオチド配列部分」配列検出。DNAはランダムに断片化される。アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物が、断片の内部に位置し得る、アダプター配列及び「既知のヌクレオチド配列部分」配列に相同であるオリゴヌクレオチドを用いて環状化される。断片の(場合により)非ハイブリダイズ末端が除去され、得られた末端がライゲーションされる。生成ライゲーション産物が配列決定され、これを用いて「既知のヌクレオチド配列部分」配列及びフランキング配列情報が決定される。 単一試料-多数の「既知のヌクレオチド配列部分」-ランダム断片化-単一アダプター-スペーサー配列なしを示す図である。 単一アダプターを用いる多数の「既知のヌクレオチド配列部分」配列検出。DNAはランダムに断片化される。アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物のサブセットが、断片の内部に位置し得る、アダプター配列及び「既知のヌクレオチド配列部分」配列に相同なオリゴを用いて環状化される。断片の(場合により)非ハイブリダイズ末端が除去され、得られた末端がライゲーションされる。生成ライゲーション産物が配列決定され、これを用いて「既知のヌクレオチド配列部分」配列及びこのフランキング配列情報が決定される。 複数の試料-単一「既知のヌクレオチド配列部分」-ランダム断片化-複数のアダプター(試料IDを含む)-スペーサー配列なしを示す図である。 識別子配列を含有するアダプターを用いる2つの試料における単一「既知のヌクレオチド配列部分」配列検出。2つの試料のDNAはランダムに断片化される。試料特異的アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物のサブセットが、断片の内部に位置し得る、アダプター配列及び「既知のヌクレオチド配列部分」配列に相同なオリゴを用いて環状化される。断片の(場合により)非ハイブリダイズ末端が除去され、得られた末端がライゲーションされる。生成ライゲーション産物が配列決定され、これを用いて「既知のヌクレオチド配列部分」配列及びこのフランキング配列情報が決定される。 単一試料-多数の「既知のヌクレオチド配列部分」-ランダム断片化-単一アダプター-単一スペーサー配列を示す図である。 単一アダプターを用いる単一試料における多数の「既知のヌクレオチド配列部分」配列検出。DNAはランダムに断片化される。アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物のサブセットが、断片の内部に位置し得る、アダプター配列及び「既知のヌクレオチド配列部分」配列に相同なオリゴを用いて環状化される。環状化オリゴは部分的に二本鎖となり、スペーサー配列を導入する。断片の(場合により)非ハイブリダイズ末端が除去され、得られた末端がライゲーションされる。生成ライゲーション産物が配列決定され、これを用いて「既知のヌクレオチド配列部分」配列及びこのフランキング配列情報が決定される。 単一試料-多数の「既知のヌクレオチド配列部分」-ランダム断片化-単一アダプター-単一スペーサー配列 単一アダプターを用いる単一試料における多数の「既知のヌクレオチド配列部分」配列検出。DNAはランダムに断片化される。アダプターがライゲーションされ、ライゲーション産物が変性される。変性産物のサブセットが、断片の内部に位置し得る、アダプター配列及び「既知のヌクレオチド配列部分」配列に相同なオリゴを用いて環状化される。環状化オリゴは部分的に二本鎖となり、「既知のヌクレオチド配列部分」特異的スペーサー配列を導入する。断片の(場合により)非ハイブリダイズ末端が除去され、得られた末端がライゲーションされる。生成ライゲーション産物が配列決定され、これを用いて「既知のヌクレオチド配列部分」 配列及びこのフランキング配列情報が決定される。 DNA修復、dAテーリング及びアダプターライゲーション後の断片長分析を示す図である。 精製増幅された標的環状化産物のAgilent Bioanalyzer結果を示す図である。横軸に断片長を示す泳動時間が描かれている。縦軸は、断片の濃度の尺度である蛍光強度を示す。 更新された参照配列に対する26個の個々のPacBio配列リード(下)のアライメント。更新された参照配列は、この例のために(人工的に)挿入された16Nヌクレオチドを含有する。PBJellyソフトウェアのアウトプットは、16ntの示された充填配列を含有する。
(実施例1)
配列タグを用いた標的配列決定
プロトコル
アプローチは以下の工程を含有した。
1 ゲノムDNAの制限ライゲーション(RL)
EcoRI制限を500ng DNA材料で行い、修飾EcoRIアダプターをEcoRI断片の3'末端でライゲーションした。物理地図からのタグをEcoRIで生成したことから、EcoRIを使用した。しかし、原則として任意の制限酵素を使用することができる。
2 タグ配列のプールを用いた環状化及びライゲーション
混合物は、EcoRIアダプターを相補する13ヌクレオチド、及びタグ配列を相補する18ヌクレオチドを含有する37個のビオチン化プライマーで作られた(環状化プローブミックス)。環状化反応をアセンブルし、95℃で10分間変性させ、75℃に冷却した。熱安定なリガーゼを含有するライゲーションミックスを付加し、温度を45℃に下げ、ビオチン化環状化プローブと環状のライゲーションされた特異的タグ-EcoRI断片との複合体を生じさせた(環状化複合体)。
3 捕捉
環状化複合体を、環状化プローブに存在するビオチン基を用いてダイナビーズM-270ストレプトアビジンビーズに結合させた。上清を除去し、ビーズを洗浄し、洗浄バッファーを除去した。結合した円形断片を20μl Tris EDTA (TE)中、加熱処理(95℃で5分)により環状化プローブから分離した。
4 エキソヌクレアーゼ処理
10μl捕捉断片でエキソヌクレアーゼ処理を行って、残りの直鎖状(=非環状)断片を分解した。
5. 濃縮
標準的ローリングサークルTempliphy反応を、捕捉断片及びエキソヌクレアーゼ処理捕捉断片で行った。陽性産物が1%アガロースゲル上の捕捉断片及びエキソヌクレアーゼ処理捕捉断片に関して見られた。
6 定量化
Q-PCRを以下に対して行った:
10倍希釈Templiphy捕捉断片
10倍希釈Templiphyエキソヌクレアーゼ処理捕捉断片
7. 結果概要
RL反応(=工程1)の質を確認するために、RL反応で使用したアダプター配列に基づくプライマーと組み合わせて、配列タグで設計されたプライマーを用いて増幅を行った。これは、1%アガロースゲルでの可視化後、サイズ500〜3500bpに及ぶ産物をもたらした。工程5における濃縮増幅は、濃縮試料中に産物をもたらした。Q-PCR結果は、非濃縮対照と比べた場合、濃縮試料のCp値に明らかな違いがあることを示した。計算した濃縮は1K〜32K倍であった。2倍試料結果は2Cp値内であった。生成配列のマッピングは、多くのリードがゲノムにわたってマッピングされたことを示したが、他より著しく多いリード及び高いカバレッジを含有するスカフォールドがあった。
(実施例2)
トウモロコシにおける標的ギャップ充填
プロトコル
アプローチは以下の工程を含有した:
1 ゲノムDNAの断片化
500ngゲノムDNA材料を、g-TUBETM [Covaris(登録商標)]断片化により約10Kbpに断片化した。DNA末端を修復(平滑化)し、3'Aヌクレオチドを付加した(=dAテーリング)。修飾アダプターを3'断片の末端にライゲーションした。
2 タグ配列のプールを用いた環状化及びライゲーション
混合物は、アダプターを相補する18ヌクレオチド、及び選択されたゲノム配列領域において未知の配列を有するギャップに隣接する既知の配列を相補する(平均) 17 (範囲=13〜23)ヌクレオチドを含有する、119個のビオチン化オリゴヌクレオチドで作られた(環状化プローブミックス)。環状化反応をアセンブルし、95℃で10分間変性させ、一晩、45℃に下げた。熱安定なリガーゼ及びDNAポリメラーゼ(3'-5'エキソヌクレアーゼ活性を有するが、鎖置換活性を欠き、5'-3'エキソヌクレアーゼ活性を欠く)を含有するライゲーションミックスを付加し、反応混合物を37℃で2時間インキュベートし、この後、温度を60℃に上げ、60℃で30分間インキュベートした。これは、ビオチン化環状化プローブと特定のライゲーションされた環状化された断片との複合体を生じさせた(環状化複合体)。
3 捕捉
環状化複合体を、環状化プローブに存在するビオチン基を用いてダイナビーズM-270ストレプトアビジンビーズに結合させた。上清を除去し、ビーズを洗浄し、洗浄バッファーを除去した。結合した環状化断片を、20μl Tris EDTA (TE)中、加熱処理(95℃で5分)により環状化プローブから分離した。
4 エキソヌクレアーゼ処理
100μlの捕捉断片でエキソヌクレアーゼ処理を40μl SapExo混合物を用いて行って、37℃で15分、及び80℃で15分のインキュベーションにより残りの直鎖状(=非環状)断片を分解した。
5.増幅
標準的Genomiphy (=鎖置換)増幅反応を、エキソヌクレアーゼ処理捕捉断片で行った。3Kbp未満の長さを有する断片を除去するために、Ampure精製を行った。
6 PacBioライブラリー調製
PacBio配列決定のためのライブラリー調製を、平滑末端化アダプターライゲーションにより製造者の仕様書に従って行った。
7 PacBio配列決定
PacBio配列決定を、MagBead充填及び3時間の動画時間により製造者の仕様書に従って行った。
結果概要
B73トウモロコシDNA (5μg)を、g-TUBE切断(Covaris)により製造者の仕様書に従って(すなわち60秒間、6000rpm)約10Kbp断片に断片化した。AMPure精製により、1.5Kbpより小さい断片を除去した。残りの断片は、製造者の仕様書と共にNEBNext End Repair kitを用いて末端修復し、この後AMPureビーズを用いて精製を行った。この後Aテーリングを、DNA断片と、dATP及びクレノウ3'-5'エキソDNAポリメラーゼとのインキュベート工程を必要とするNEBNext dA-tailing kitを用いて行った。精製はAMPureビーズにより行った。Tオーバーハングを含有するアダプターを、末端修復Aテーリング断片にライゲーションした。アダプターライゲーション断片を、AMPureビーズを用いて精製した。断片サイズ分布をAgilent Tapestationでの分析により決定した。結果を図13に示す。
環状化は、アダプターに対する相補的配列及び標的領域に相補的な配列を含有する119個の環状化オリゴヌクレオチドと組み合わせた、アダプターライゲーション断片のインキュベーションにより開始する。更に、環状化オリゴヌクレオチドはビオチン修飾を含有する。アダプターライゲーションDNAを、環状化オリゴのミックスの存在下、95℃で10分間変性させる。この後、温度を75℃から45℃に下げ、45℃で一晩維持した。環状化後、T4-DNAポリメラーゼ及びTaq DNAリガーゼとのインキュベーションによりDNA断片の3'非マッチング部分を除去する。該インキュベーションにおいて、T4-DNAポリメラーゼが非マッチングDNA末端を除去し、必要であれば鎖充填を行い、この後リガーゼが今や隣接する断片末端を連結し、故に環状化DNA断片を生じさせる。ハイブリダイズされた環状化オリゴヌクレオチドを有するDNA断片を、ストレプトアビジン被覆磁気ビーズを用いて単離する。特異的ハイブリダイゼーションを低減するために、断片が結合したビーズを数回洗浄する。結合断片を、95℃で5分間のインキュベーションによりビーズから溶出する。単離DNAは非円形分子を含有し得ることから、エビアルカリホスファターゼ及びエキソヌクレアーゼの混合物と15分間、37℃でのインキュベーションにより直鎖状断片を除去する。酵素を80℃で10分間不活性化する。残りのDNAの増幅はGenomiphy kitを用いて行う。増幅産物はAMPureビーズを用いて精製する。総収量は3.5ugであった。長分布をAgilent BioAnalyzerを用いて分析した。結果を図14に示す。図14に示された産物は、PacBio配列決定ライブラリーを調製するのに使用する。これは、DNAのポリッシュ(polishing)及びSMRTベルアダプターのライゲーションを必要とした。配列決定を、MagBead充填及び3時間の動画時間により製造者の仕様書を用いて行った。配列決定は、最初のフィルタリング後、合計142,229,422ヌクレオチドを含有する合計25,988リードをもたらした(すなわち、平均リード長は5,472ヌクレオチドであった)。プロトコルの初期に付加したアダプター配列及びPacBio SMRTベルアダプター配列の存在について、生成リードをスクリーニングした。どちらかのアダプター配列が存在したならば、対応するリードを分割し、アダプター配列を除去した。得られたリードは、参照配列においてギャップを閉じることができるソフトウェアツールPBJellyのインプットとして使用した。PBJellyにおける工程は、1Mbp標的領域の参照配列に対するリードのマッピング、ギャップ中にマッピングされたヌクレオチドがあるかどうかの決定を必要とする。もしそうであれば、コンセンサス配列を決定し、参照配列を更新する。可視化目的のため、PBJellyからの結果を抽出し、ソフトウェアパッケージタブレットにインポートした。充填ギャップの例を図15に示す。図15は、100個の未知のヌクレオチドのギャップが減り、16個の既知のヌクレオチドで充填されことを示している。
(参考文献)
Figure 2016521557

Claims (73)

  1. 核酸試料から配列情報を得る方法であって、
    a)核酸試料のヌクレオチド配列情報の少なくとも一部が、少なくとも1つの「既知のヌクレオチド配列部分」の形態で利用可能である核酸試料を提供する工程と、
    b)核酸試料を断片化して1つ又は複数の断片を得る工程と、
    c)場合により、断片の末端を平滑化する工程と、
    d)場合により、1つ又は複数の3'ヌクレオチドを断片に付加する工程と、
    e)1つ又は複数のアダプターを断片の一端又は両端にライゲーションしてアダプターライゲーション断片を得る工程と、
    f)アダプターライゲーション断片を変性させて、変性アダプターライゲーション断片を得る工程と、
    g)少なくとも1つの、好ましくはそれぞれの、任意に選択された「既知のヌクレオチド配列部分」含有変性アダプターライゲーション断片に、「既知のヌクレオチド配列部分」の少なくとも一部及びアダプター配列の少なくとも一部を含む環状化プローブを提供する工程と、
    h)変性アダプターライゲーション断片を環状化プローブと結合する工程と、
    i)環状化プローブ及び変性アダプターライゲーション断片をハイブリダイズさせ、環状化変性アダプターライゲーション断片を形成させる工程と、
    j)場合により、オーバーハングを除去する工程と、
    k)場合により、「既知のヌクレオチド配列部分」(の一部)とアダプター(の一部)の間の欠損ヌクレオチドを充填する工程と、
    l)環状化アダプターライゲーション断片の末端をライゲーションして、ライゲーションされた環状化アダプターライゲーション断片を得る工程と、
    m)ライゲーションされた環状化アダプターライゲーション断片を配列決定する工程と
    を含み、
    ライゲーションされた環状化アダプターライゲーション断片の配列情報を得るのに、断片ごとにたった1つの「既知のヌクレオチド配列部分」の配列情報が必要とされる方法。
  2. 核酸試料から配列情報を得る方法であって、
    a)核酸試料のヌクレオチド配列情報の少なくとも一部が、少なくとも1つの「既知のヌクレオチド配列部分」の形態で利用可能である核酸試料を提供する工程と、
    b)核酸試料を断片化して1つ又は複数の断片を得る工程と、
    c)場合により、断片の末端を平滑化する工程と、
    d)場合により、1つ又は複数の3'ヌクレオチドを断片に付加する工程と、
    e)1つ又は複数のアダプターを断片の一端又は両端にライゲーションしてアダプターライゲーション断片を得る工程と、
    f)少なくとも1つの、好ましくはそれぞれの、任意に選択された「既知のヌクレオチド配列部分」含有アダプターライゲーション断片に、「既知のヌクレオチド配列部分」の少なくとも一部及びアダプター配列の少なくとも一部を含む環状化プローブを提供する工程と、
    g)アダプターライゲーション断片を環状化プローブと結合する工程と、
    h)アダプターライゲーション断片を変性させて変性アダプターライゲーション断片を得る工程と、
    i)環状化プローブ及び変性アダプターライゲーション断片をハイブリダイズさせ、環状化変性アダプターライゲーション断片を形成させる工程と、
    j)場合により、オーバーハングを除去する工程と、
    k)場合により、「既知のヌクレオチド配列部分」(の一部)とアダプター(の一部)の間の欠損ヌクレオチドを充填する工程と、
    l)環状化アダプターライゲーション断片の末端をライゲーションして、ライゲーションされた環状化アダプターライゲーション断片を得る工程と、
    m)ライゲーションされた環状化アダプターライゲーション断片を配列決定する工程と
    を含み、
    ライゲーションされた環状化アダプターライゲーション断片の配列情報を得るのに、断片ごとにたった1つの「既知のヌクレオチド配列部分」の配列情報が必要とされる方法。
  3. 核酸試料から配列情報を得る方法であって、
    a)核酸試料のヌクレオチド配列情報の少なくとも一部が、少なくとも1つの「既知のヌクレオチド配列部分」の形態で利用可能である核酸試料を提供する工程と、
    b)核酸試料を断片化して1つ又は複数の断片を得る工程と、
    c)場合により、断片の末端を平滑化する工程と、
    d) 1つ又は複数の3'ヌクレオチド、好ましくは10から20ヌクレオチドを断片に付加してヌクレオチド伸長断片を得る工程と、
    e)ヌクレオチド伸長断片を変性させて、変性ヌクレオチド伸長断片を得る工程と、
    f)少なくとも1つの、好ましくはそれぞれの、任意に選択された「既知のヌクレオチド配列部分」含有変性ヌクレオチド伸長断片に、「既知のヌクレオチド配列部分」の少なくとも一部及びヌクレオチド伸長配列の配列の少なくとも一部を含む環状化プローブを提供する工程と、
    g)変性ヌクレオチド伸長断片を環状化プローブと結合する工程と
    h)環状化プローブ及び変性ヌクレオチド伸長断片をハイブリダイズさせ、環状化変性ヌクレオチド伸長断片を形成させる工程と、
    i)場合により、オーバーハングを除去する工程と、
    j)場合により、「既知のヌクレオチド配列部分」(の一部)とヌクレオチド伸長配列(の一部)の間の欠損ヌクレオチドを充填する工程と、
    k)環状化アダプターライゲーション断片の末端をライゲーションして、ライゲーションされた環状化ヌクレオチド伸長断片を得る工程と、
    l)ライゲーションされた環状化ヌクレオチド伸長断片を配列決定する工程と
    を含み、
    ライゲーションされた環状化ヌクレオチド伸長断片の配列情報を得るのに、断片ごとにたった1つの「既知のヌクレオチド配列部分」の配列情報が必要とされる方法。
  4. オーバーハングの除去が酵素を用いることによる、請求項1から3のいずれか一項に記載の方法。
  5. 酵素がエンドヌクレアーゼである、請求項4に記載の方法。
  6. エンドヌクレアーゼがフラップエンドヌクレアーゼである、請求項5に記載の方法。
  7. 酵素がヌクレアーゼ活性を有するポリメラーゼである、請求項4に記載の方法。
  8. 断片が、好ましくは切断、超音波処理又は噴霧から成る群から選択されるランダム断片化により提供される、請求項1から7のいずれか一項に記載の方法。
  9. 核酸の断片化が1つ又は複数のヌクレアーゼ酵素を用いた消化による、請求項1から8のいずれか一項に記載の方法。
  10. ヌクレアーゼ酵素が制限エンドヌクレアーゼ酵素である、請求項9に記載の方法。
  11. 制限酵素消化部位が「既知のヌクレオチド配列部分」に含まれる、請求項10に記載の方法。
  12. 制限酵素消化部位が「既知のヌクレオチド配列部分」の外側に位置する、請求項10に記載の方法。
  13. 断片が1つ又は複数の制限エンドヌクレアーゼ酵素で核酸試料を消化して提供され、当該工程においては、制限酵素が制限酵素消化部位で消化して制限酵素消化断片を得る、請求項10に記載の方法。
  14. 制限エンドヌクレアーゼ酵素消化部位及び制限エンドヌクレアーゼ酵素認識部位が同じ位置に位置する(クラスII制限エンドヌクレアーゼ)、請求項13に記載の方法。
  15. 制限エンドヌクレアーゼ酵素消化部位及び制限エンドヌクレアーゼ酵素認識部位が同じ位置に位置しない(クラスIIS又はIIB制限エンドヌクレアーゼ)である、請求項13に記載の方法。
  16. 制限エンドヌクレアーゼ酵素消化部位が、制限エンドヌクレアーゼ酵素認識部位の片側(クラスIIS制限エンドヌクレアーゼ)又は両側(クラスIIB制限エンドヌクレアーゼ)の外側に位置する、請求項13に記載の方法。
  17. 「既知のヌクレオチド配列部分」が断片の末端の一方に位置する、請求項1から16のいずれか一項に記載の方法。
  18. 「既知のヌクレオチド配列部分」が、断片の末端から離れた位置、好ましくは断片の末端(の一方)から少なくとも5、10、15、20、30、50、75又は100ヌクレオチドの位置に位置する、請求項1から17のいずれか一項に記載の方法。
  19. アダプターが二本鎖アダプターである、請求項1から18のいずれか一項に記載の方法。
  20. アダプターが一本鎖アダプターである、請求項1から19のいずれか一項に記載の方法。
  21. 断片化及びアダプターのライゲーションが同時に行われる、請求項1又は2に記載の方法。
  22. アダプターライゲーション断片又はヌクレオチド伸長断片と環状化プローブとのハイブリダイゼーションが、環状化変性アダプターライゲーション断片又はヌクレオチド伸長断片におけるオーバーハングの作製をもたらす、請求項1から3のいずれか一項に記載の方法。
  23. 核酸のヌクレオチド配列情報の少なくとも一部が、場合により制限酵素消化部位を含む複数の「既知のヌクレオチド配列部分」の形態で知られている、請求項1から22のいずれか一項に記載の方法。
  24. それぞれが1つ又は複数の「既知のヌクレオチド配列部分」を含有する複数の試料が分析されて、これにより更なる配列情報を得る、請求項1から23のいずれか一項に記載の方法。
  25. 環状化プローブがスペーサー配列を含む、請求項1から24のいずれか一項に記載の方法。
  26. スペーサーが、「既知のヌクレオチド配列部分」の部分と少なくとも1つのアダプター配列又はヌクレオチド伸長配列の部分の間に位置する、請求項25に記載の方法。
  27. ライゲーション前に、スペーサー配列に起因するギャップが、好ましくはポリメラーゼ反応により充填される、請求項25から26に記載の方法。
  28. スペーサー配列が二本鎖である、請求項25から27に記載の方法。
  29. スペーサー配列が一本鎖である、請求項25から27に記載の方法。
  30. スペーサー配列が識別子配列を含む、請求項25から29に記載の方法。
  31. 識別子配列が試料特異的識別子である、請求項30に記載の方法。
  32. 識別子配列が「既知のヌクレオチド配列部分」特異的識別子である、請求項30から31に記載の方法。
  33. スペーサー配列が少なくとも1つのプライマー配列を含む、請求項25から32に記載の方法。
  34. プライマー配列が、増幅プライマー配列及び/又は配列決定プライマー配列である、請求項33に記載の方法。
  35. 増幅プライマー及び配列決定プライマーが、混合増幅/配列決定プライマーにおいて混合される、請求項34に記載の方法。
  36. アダプターライゲーション断片又はヌクレオチド伸長断片の変性、及び変性アダプターライゲーション断片又はヌクレオチド伸長断片と環状化プローブとの結合が逆の順番で行われる、請求項1から35のいずれか一項に記載の方法。
  37. 断片化又は消化工程及びライゲーション工程が同時に行われる、請求項1から36のいずれか一項に記載の方法。
  38. 1つ又は複数のアダプター又はヌクレオチド伸長配列が識別子配列を含む、請求項1から37のいずれか一項に記載の方法。
  39. 識別子配列が試料特異的識別子である、請求項38に記載の方法。
  40. 識別子配列が「既知のヌクレオチド配列部分」特異的識別子である、請求項38から39に記載の方法。
  41. 1つ又は複数のアダプター又はヌクレオチド伸長配列が、少なくとも1つのプライマー配列を含む、請求項1から40のいずれか一項に記載の方法。
  42. プライマー配列が、増幅プライマー配列及び/又は配列決定プライマー配列である、請求項41に記載の方法。
  43. 増幅プライマー及び配列決定プライマーが、混合増幅/配列決定プライマーにおいて混合される、請求項41から42に記載の方法。
  44. 断片化後、断片がプールされる、請求項1から43のいずれか一項に記載の方法。
  45. アダプターライゲーション断片又はヌクレオチド伸長断片が、アダプターライゲーション又はヌクレオチド伸長工程の後及び配列決定工程の前にプールされる、請求項1から44のいずれか一項に記載の方法。
  46. ライゲーション工程後、ライゲーションされた環状化アダプターライゲーション断片又はライゲーションされた環状化ヌクレオチド伸長断片が、少なくとも1つのランダムプライマーを用いて増幅される、請求項1から45のいずれか一項に記載の方法。
  47. 増幅が、鎖置換活性を有するphi29などのポリメラーゼを用いて行われる、請求項46に記載の方法。
  48. ライゲーション工程後、ライゲーションされた環状化アダプターライゲーション断片又はライゲーションされた環状化ヌクレオチド伸長断片が、少なくとも1つの「既知のヌクレオチド配列部分」の配列の少なくとも一部、又はアダプター配列若しくはヌクレオチド伸長配列の少なくとも一部、又はこの両方にアニールすることができる少なくとも1つのプライマーを用いて増幅される、請求項1から47のいずれか一項に記載の方法。
  49. 増幅がローリングサークル増幅反応である、請求項48に記載の方法。
  50. 少なくとも1つのプライマーが識別子配列を含む、請求項46から49に記載の方法。
  51. 識別子配列が、試料及び/又は「既知のヌクレオチド配列部分」に特異的である、請求項50に記載の方法。
  52. 識別子配列が2個以上の同一連続塩基を含有しない、及び/又は識別子配列が互いに全て少なくとも2塩基異なる、請求項1から51のいずれか一項に記載の方法。
  53. ライゲーションされた環状化アダプターライゲーション断片又はライゲーションされた環状化ヌクレオチド伸長断片が、配列決定工程前に更に断片化される、請求項1から52のいずれか一項に記載の方法。
  54. 更なる断片化が、切断、噴霧、超音波処理、制限酵素消化、及び/又はヌクレアーゼ処理により達成される、請求項53に記載の方法。
  55. 制限酵素消化による更なる断片化が、請求項10の制限エンドヌクレアーゼ酵素と異なる認識配列又は切断部位を有する制限エンドヌクレアーゼ酵素による、請求項54に記載の方法。
  56. 複数の「既知のヌクレオチド配列部分」及び/又は多数の試料が使用される、請求項1から55のいずれか一項に記載の方法。
  57. 環状化アダプターライゲーション断片又は環状化ヌクレオチド伸長断片がライゲーションされる工程後、エキソヌクレアーゼ処理が行われる請求項1から56のいずれか一項に記載の方法。
  58. ビオチンなどの親和性部分若しくはプローブを有する少なくとも1つの環状化プローブが提供される、又は増幅工程におけるプライマーが、ビオチンなどの親和性部分又はプローブを含有する、請求項1から57のいずれか一項に記載の方法。
  59. 環状化アダプターライゲーション断片又は環状化ヌクレオチド伸長断片が、環状化プローブの付加後に捕捉される、請求項1から58のいずれか一項に記載の方法。
  60. 場合により増幅及び/若しくはライゲーションされた環状化アダプターライゲーション断片又は環状化ヌクレオチド伸長断片が、プライマー又は環状化プローブの親和性部分を用いて捕捉される、請求項58又は59に記載の方法。
  61. アダプターライゲーション工程における1つ又は複数のアダプターのライゲーションが、断片化され場合により制限酵素消化された断片の3'末端で生じる、請求項1から60のいずれか一項に記載の方法。
  62. アダプターライゲーション工程における1つ又は複数のアダプターのライゲーションが、断片化され場合により制限酵素消化された断片の5'末端で生じる、請求項1から61のいずれか一項に記載の方法。
  63. 方法が核酸を再配列決定するのに使用される、請求項1から62のいずれか一項に記載の方法。
  64. 方法が、「既知のヌクレオチド配列部分」の近傍における配列変異を決定するのに使用される、請求項1から63のいずれか一項に記載の方法。
  65. 方法が、少なくとも1つの「既知のヌクレオチド配列部分」が利用可能である1つ又は複数の位置でゲノム配列におけるギャップ閉鎖に使用される、請求項1から64のいずれか一項に記載の方法。
  66. 更なる配列情報が、物理地図又はドラフトゲノム配列からなどの既存の配列情報に関連づけられる、請求項1から65のいずれか一項に記載の方法。
  67. 少なくとも1つの「既知のヌクレオチド配列部分」が、形質又は遺伝子が位置する領域に連結される、請求項1から66のいずれか一項に記載の方法。
  68. 形質又は遺伝子が植物の形質又は遺伝子である、請求項67に記載の方法。
  69. 配列情報を得るための、ライゲーションされた環状化アダプターライゲーション断片、又はライゲーションされた環状化ヌクレオチド伸長断片の使用であって、断片の少なくとも一部が、核酸試料の「既知のヌクレオチド配列部分」を含む、使用。
  70. 断片が核酸試料のランダム断片化(切断、超音波処理、噴霧)により提供される、請求項69に記載の使用。
  71. 断片が核酸試料の制限酵素消化により提供される、請求項69に記載の使用。
  72. 制限酵素消化部位が「既知のヌクレオチド配列部分」に含まれる、請求項71に記載の使用。
  73. 制限酵素消化部位が「既知のヌクレオチド配列部分」の外側に位置する、請求項71に記載の使用。
JP2016518293A 2013-06-07 2014-06-06 標的配列決定のための方法 Pending JP2016521557A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
NL2010933 2013-06-07
NL2010933 2013-06-07
PCT/NL2014/050369 WO2014196863A1 (en) 2013-06-07 2014-06-06 Method for targeted sequencing

Publications (1)

Publication Number Publication Date
JP2016521557A true JP2016521557A (ja) 2016-07-25

Family

ID=48875722

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016518293A Pending JP2016521557A (ja) 2013-06-07 2014-06-06 標的配列決定のための方法

Country Status (5)

Country Link
US (2) US20160083788A1 (ja)
EP (1) EP3004381A1 (ja)
JP (1) JP2016521557A (ja)
CA (1) CA2913236A1 (ja)
WO (1) WO2014196863A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017509631A (ja) * 2014-03-13 2017-04-06 エフ・ホフマン−ラ・ロシュ・アクチェンゲゼルシャフト エストロゲン受容体突然変異体を調節する方法及び組成物
JP2020501571A (ja) * 2016-12-20 2020-01-23 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 環状コンセンサスシークエンシングのための一本鎖環状dnaライブラリー

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2387878T3 (es) 2005-06-23 2012-10-03 Keygene N.V. Estrategias para la identificación de alto rendimiento y la detección de polimorfismos
WO2007037678A2 (en) 2005-09-29 2007-04-05 Keygene N.V. High throughput screening of mutagenized populations
US10316364B2 (en) * 2005-09-29 2019-06-11 Keygene N.V. Method for identifying the source of an amplicon
EP2789696B1 (en) 2005-12-22 2015-12-16 Keygene N.V. Method for high-throughput AFLP-based polymorphism detection
JP6942129B2 (ja) 2015-11-25 2021-09-29 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft ポリメラーゼ複合体の精製
DK3386550T3 (da) 2015-12-07 2021-04-26 Arc Bio Llc Fremgangsmåder til fremstilling og anvendelse af guide nukleinsyrer
CN110024037B (zh) 2016-11-30 2023-06-27 微软技术许可有限责任公司 经由连接的dna随机存取存储系统
US10793897B2 (en) 2017-02-08 2020-10-06 Microsoft Technology Licensing, Llc Primer and payload design for retrieval of stored polynucleotides
EP3635114A4 (en) * 2017-06-07 2021-03-17 Arc Bio, LLC MANUFACTURING AND USE OF GUIDE NUCLEIC ACIDS
US20210032677A1 (en) * 2017-08-10 2021-02-04 Rootpath Genomics, Inc. Methods to Improve the Sequencing of Polynucleotides with Barcodes Using Circularisation and Truncation of Template
EP3447152A1 (en) * 2017-08-25 2019-02-27 Eawag, Swiss Federal Institute of Aquatic Science and Technology Accurate and massively parallel quantification of nucleic acid
JP2020532976A (ja) * 2017-09-14 2020-11-19 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 環状一本鎖dnaライブラリーを生成するための新規な方法
EP3682027A1 (en) * 2017-09-15 2020-07-22 H. Hoffnabb-La Roche Ag Hybridization-extension-ligation strategy for generating circular single-stranded dna libraries
WO2019086531A1 (en) * 2017-11-03 2019-05-09 F. Hoffmann-La Roche Ag Linear consensus sequencing
EP3749782B1 (en) * 2018-02-05 2022-11-02 F. Hoffmann-La Roche AG Generation of single-stranded circular dna templates for single molecule sequencing
US11200446B1 (en) 2020-08-31 2021-12-14 Element Biosciences, Inc. Single-pass primary analysis
US20230279483A1 (en) * 2022-03-04 2023-09-07 Element Biosciences, Inc. Double-stranded splint adaptors and methods of use
WO2024011145A1 (en) * 2022-07-05 2024-01-11 Element Biosciences, Inc. Pcr-free library preparation using double-stranded splint adaptors and methods of use

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2643700A1 (en) * 2006-02-24 2007-11-22 Callida Genomics, Inc. High throughput genome sequencing on dna arrays
US8232091B2 (en) * 2006-05-17 2012-07-31 California Institute Of Technology Thermal cycling system
US20090156412A1 (en) * 2007-12-17 2009-06-18 Helicos Biosciences Corporation Surface-capture of target nucleic acids
WO2010120803A2 (en) * 2009-04-13 2010-10-21 Somagenics Inc. Methods and compositions for detection of small rnas
GB0921264D0 (en) * 2009-12-03 2010-01-20 Olink Genomics Ab Method for amplification of target nucleic acid
US20120003657A1 (en) * 2010-07-02 2012-01-05 Samuel Myllykangas Targeted sequencing library preparation by genomic dna circularization

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017509631A (ja) * 2014-03-13 2017-04-06 エフ・ホフマン−ラ・ロシュ・アクチェンゲゼルシャフト エストロゲン受容体突然変異体を調節する方法及び組成物
JP2020501571A (ja) * 2016-12-20 2020-01-23 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 環状コンセンサスシークエンシングのための一本鎖環状dnaライブラリー

Also Published As

Publication number Publication date
US20150284789A1 (en) 2015-10-08
WO2014196863A1 (en) 2014-12-11
US20160083788A1 (en) 2016-03-24
EP3004381A1 (en) 2016-04-13
CA2913236A1 (en) 2014-12-11

Similar Documents

Publication Publication Date Title
JP2016521557A (ja) 標的配列決定のための方法
US11142789B2 (en) Method of preparing libraries of template polynucleotides
JP7290228B2 (ja) 混合物中の核酸を配列決定する方法およびそれに関する組成物
US10006081B2 (en) End modification to prevent over-representation of fragments
US8071310B2 (en) Method for the high throughput screening of transposon tagging populations and massive parallel sequence identification of insertion sites
AU2009226248B2 (en) Expression-linked gene discovery
US9464318B2 (en) Methods and compositions for reducing non-specific amplification products
US7897747B2 (en) Method to produce single stranded DNA of defined length and sequence and DNA probes produced thereby
US20200102612A1 (en) Method for identifying the source of an amplicon
CN115461457A (zh) 双链核酸分子及利用其去除dna文库中glass接头的方法
KR20210104108A (ko) 핵산 증폭 및 식별 방법
WO2021166989A1 (ja) アダプター配列が付加されたdna分子を製造する方法、およびその利用
Robinson et al. Illumina Technology
EP3359686A1 (en) Targeted locus amplification using cloning strategies