JP2022543778A - 核酸配列決定のための方法および試薬、ならびに関連する用途 - Google Patents
核酸配列決定のための方法および試薬、ならびに関連する用途 Download PDFInfo
- Publication number
- JP2022543778A JP2022543778A JP2022506451A JP2022506451A JP2022543778A JP 2022543778 A JP2022543778 A JP 2022543778A JP 2022506451 A JP2022506451 A JP 2022506451A JP 2022506451 A JP2022506451 A JP 2022506451A JP 2022543778 A JP2022543778 A JP 2022543778A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- strand
- stranded
- double
- adapter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Abstract
本発明の技術は、概して、エラーを修正した核酸配列を提供するための方法および関連する試薬に関する。特に、いくつかの実施形態は、ヘアピン形状を含むアダプター分子、ならびにデュプレックス配列決定および他の配列決定用途における、かかるアダプターの使用方法を対象とする。いくつかの実施形態では、第1の鎖および第2の鎖の両方を含む物理的に連結した核酸複合体を増幅させ、配列決定表面上の同じクローナルクラスター中で独立して配列決定することができる。
Description
本発明の技術は、一般に、高精度(例えば、エラーを修正した)核酸配列を提供するための方法および関連する試薬に関する。特に、いくつかの実施形態は、ヘアピン形状を含むアダプター分子、ならびにデュプレックス配列決定および他の配列決定用途における、かかるアダプターの使用方法を対象とする。
関連出願の相互参照
本出願は、2019年8月1日に出願された米国仮特許出願第62/881,936号に対する優先権およびその利益を主張し、その開示は、その全体が本明細書に参照により組み込まれる。
本出願は、2019年8月1日に出願された米国仮特許出願第62/881,936号に対する優先権およびその利益を主張し、その開示は、その全体が本明細書に参照により組み込まれる。
デュプレックス配列決定は、個々の二本鎖核酸分子の両方の鎖に由来する配列情報を比較することによって、卓越した配列精度を達成するエラー修正方法である。デュプレックス配列決定プロセスまたは他の高精度配列決定様式の効率に関して、変換効率は、少なくとも1つの二本鎖コンセンサス配列リード(または他の高精度配列リード)が作られる配列決定ライブラリ調製反応に入力される固有の核酸分子の分率であると定義することができる。いくつかの場合に、変換効率の欠点が、それ以外には非常に十分に適しているであろういくつかの用途について、高精度配列決定の有用性を制限する場合がある。例えば、低い変換効率は、標的二本鎖核酸のコピー数が制限される状況をもたらす場合があり、これにより、作られる配列情報が所望な量より少なくなる場合がある。デュプレックス配列決定用途を含む様々な用途に使用するための核酸分子の生の配列リードを合成するための費用効率の高い製造方法が必要とされている。
本発明の技術は、一般に、核酸配列決定のための方法および関連する試薬に関する。特に、本技術のいくつかの態様は、より速い速度で(例えば、より少ないステップで)、および/またはより少ない費用で(例えば、より少ない試薬を利用して)提供され、より多くの望ましいデータが得られる、高精度の配列決定リードを達成するための方法を対象とする。本技術の他の態様は、デュプレックス配列決定のための変換効率を増加させるための方法および試薬を対象とする。本技術の種々の態様は、前臨床および臨床での試験および診断において多くの用途を有するだけではなく、他の用途も有する。
いくつかの態様では、本開示は、二本鎖標的核酸分子を配列決定する方法であって、(a)物理的に連結した核酸複合体を、ある表面上で増幅させて、順方向および逆方向の両方にその表面に結合した、物理的に連結した核酸複合体アンプリコンを生成するステップであって、物理的に連結した核酸複合体が、(i)二本鎖標的核酸分子、(ii)二本鎖標的核酸分子の第1の末端上にリンカードメインを含む第1のアダプター、ならびに(iii)二本鎖標的核酸分子の第2の末端上に二本鎖部分および一本鎖部分を有する第2のアダプターを含む、生成するステップと、(b)(i)逆方向に表面に結合した物理的に連結した核酸複合体アンプリコン、または(ii)順方向に表面に結合した物理的に連結した核酸複合体アンプリコンのいずれかを除去するステップと、(c)残存する結合した物理的に連結した核酸複合体アンプリコンの一部を切断して、一方の鎖からの情報を含む一本鎖アンプリコンのサブセット、および物理的に連結した核酸複合体アンプリコンのサブセットを提供するステップと、(d)一本鎖アンプリコンのサブセットを配列決定し、二本鎖標的核酸分子の元の鎖に由来する配列決定リードを提供するステップと、(e)表面上で、物理的に連結した核酸複合体アンプリコンのサブセットを増幅させるステップと、(f)他方の方向にある物理的に連結した核酸複合体アンプリコンを除去するステップと、(g)残存する結合した物理的に連結した核酸複合体アンプリコンを切断して、他の鎖からの情報を含む一本鎖アンプリコンを提供するステップと、(h)一本鎖アンプリコンを配列決定して、二本鎖標的核酸分子の他方の元の鎖に由来する配列決定リードを提供するステップと、を含む、方法を提供する。
いくつかの態様では、本開示は、二本鎖標的核酸分子を配列決定する方法であって、(a)物理的に連結した核酸複合体を、ある表面上で増幅させて、その表面に結合した物理的に連結した核酸複合体アンプリコンのクラスターを生成するステップであって、物理的に連結した核酸複合体が、(i)二本鎖標的核酸分子、(ii)二本鎖標的核酸分子の一方の末端上にリンカードメインを含む第1のアダプター、ならびに(iii)二本鎖標的核酸分子の他方の末端で二本鎖部分および一本鎖部分を有する第2のアダプターを含む、生成するステップと、(b)(i)物理的に連結した核酸複合体アンプリコンの5’末端、または(ii)物理的に連結した核酸複合体アンプリコンの3’末端で表面に結合した、物理的に連結した核酸複合体アンプリコンのいずれかを除去するステップと、(c)切断部位で、残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断して、二本鎖標的核酸分子の一方の元の鎖に由来する配列情報を含む一本鎖アンプリコンを提供するステップと、(d)一本鎖アンプリコンを配列決定して、二本鎖標的核酸分子の一方の元の鎖に由来する配列決定リードを提供するステップと、を含む、方法を提供する。いくつかの態様では、本方法は、残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断することをさらに含み、表面に結合した少なくとも1つの物理的に連結した核酸複合体アンプリコンを保存することを含む。いくつかの態様では、本方法は、(e)表面上で、少なくとも1つの物理的に連結した核酸複合体アンプリコンを増幅させ、表面に結合した物理的に連結した核酸複合体アンプリコンのクラスターを再配置させるステップと、(f)(b)で除去されない他方の方向にある物理的に連結した核酸複合体アンプリコンを除去するステップと、(g)残存する結合した物理的に連結した核酸複合体アンプリコンを切断して、二本鎖標的核酸分子の他方の元の鎖に由来する情報を含む一本鎖アンプリコンを提供するステップと、(h)一本鎖アンプリコンを配列決定し、二本鎖標的核酸分子の他方の元の鎖に由来する配列決定リードを提供するステップと、をさらに含む。
いくつかの態様では、本方法は、一方の元の鎖からの配列リードと他方の元の鎖からの配列リードとを比較して、二本鎖標的核酸分子のコンセンサス配列を生成するステップをさらに含む。いくつかの態様では、本方法は、一方の元の鎖からの配列リードおよび他方の元の鎖からの配列リードにおける配列変動を識別するステップであって、一方の元の鎖および他方の元の鎖からの配列変動が、一貫した配列変動である、識別するステップ、または一方の元の鎖中で起こり、他方の元の鎖中で起こらない配列変動を除外するか、または考慮に入れないステップをさらに含む。いくつかの態様では、本方法は、一方の元の鎖からの配列リードを、他方の元の鎖からの配列リードと比較するステップと、一方の元の鎖からの配列リードと、他方の元の鎖からの配列リードとの間で一致しないヌクレオチド位置を識別するステップと、一致しないと識別されたヌクレオチド位置を考慮に入れないか、除外するか、または修正することによって、二本鎖標的核酸分子のエラーを修正した配列を生成するステップと、をさらに含む。
いくつかの態様では、本開示は、各々が第1の鎖と第2の鎖とを含む二本鎖標的核酸分子の集合体を配列決定する方法であって、(a)複数の物理的に連結した核酸複合体を、ある表面上で増幅させ、複数のクローナルクラスターを生成し、各々のクローナルクラスターが、各々が第1の鎖のアンプリコンと第2の鎖のアンプリコンとを含む複数の物理的に連結した核酸複合体アンプリコンを含み、各々の物理的に連結した核酸複合体が、(i)集合体からの二本鎖標的核酸分子、(ii)二本鎖標的核酸分子の第1の末端に接続したリンカードメインを含む第1のアダプター、および(iii)二本鎖標的核酸分子の第2の末端に接続した二本鎖部分および一本鎖部分を有する第2のアダプターを含む、増幅させるステップと、(b)(i)逆方向または(ii)順方向に表面に結合した各々のクローナルクラスターからの物理的に連結した核酸複合体アンプリコンのいずれかを除去するステップと、(c)(b)の後に残存する、残存する表面結合した物理的に連結した核酸複合体アンプリコンの一部を切断し、それによって、第1の鎖のアンプリコンと第2の鎖のアンプリコンを物理的に分離するステップと、(d)結合していない物理的に分離された第1または第2の鎖のアンプリコンを除去するステップと、(e)表面に結合した残存する物理的に分離された第1または第2の鎖のアンプリコンを配列決定して、表面上の各々のクローナルクラスターについて第1の鎖または第2の鎖の核酸配列リードを生成するステップと、を含む、方法を提供する。いくつかの態様では、残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断することは、表面に結合したクローナルクラスターのうちの少なくともいくつかにおいて、少なくとも1つの物理的に連結した核酸複合体アンプリコンを保存することを含む。いくつかの態様では、本方法は、(f)クローナルクラスターの少なくともいくつかにおいて、表面上で、少なくとも1つの物理的に連結した核酸複合体アンプリコンを増幅させ、表面に結合した物理的に連結した核酸複合体アンプリコンのクローナルクラスターを再配置させるステップと、(g)ステップ(b)とは他方の方向にある物理的に連結した核酸複合体アンプリコンを除去するステップと、(h)結合していない物理的に分離された第1または第2の鎖のアンプリコンを除去するステップと、(i)(h)の後に残存する、残存する結合した物理的に連結した核酸複合体アンプリコンを切断し、それによって、第1の鎖のアンプリコンと第2の鎖のアンプリコンを物理的に分離するステップと、(j)表面に結合した残存する物理的に分離された第1または第2の鎖のアンプリコンを配列決定して、表面上の各々のクローナルクラスターについて第1の鎖または第2の鎖の核酸配列リードを生成するステップと、をさらに含む。
いくつかの態様では、本開示は、各々が第1の鎖と第2の鎖とを含む二本鎖標的核酸分子の集合体を配列決定する方法であって、(a)ある表面上に結合した複数の物理的に連結した核酸複合体を増幅させ、複数のクラスターを生成し、各々のクラスターが、元の二本鎖標的核酸分子を表す複数の物理的に連結した核酸複合体アンプリコンを含み、各々の物理的に連結した核酸複合体アンプリコンが、第1の鎖のアンプリコンと第2の鎖のアンプリコンとを含み、各々の物理的に連結した核酸複合体が、(i)一方の末端で第1の鎖と第2の鎖との間にリンカードメインを含む第1のアダプター、および(ii)他方の末端で二本鎖部分および一本鎖部分を有する第2のアダプターに接続する集合体からの二本鎖標的核酸分子を含む、増幅させるステップと、(b)表面結合した物理的に連結した核酸複合体アンプリコンを切断し、それによって、第1の鎖のアンプリコンと第2の鎖のアンプリコンを物理的に分離するステップと、(c)結合していない物理的に分離された第1の鎖のアンプリコンおよび/または結合していない物理的に分離された第2の鎖のアンプリコンを除去し、表面に結合した残存するアンプリコンが、(i)物理的に分離された第1の鎖のアンプリコンおよび(ii)物理的に分離された第2の鎖のアンプリコンを含む、除去するステップと、(d)表面に結合した物理的に分離された第1の鎖のアンプリコンを配列決定して、表面上の各々のクラスターについて第1の鎖の核酸配列リードを生成するステップと、(e)表面に結合した物理的に分離された第2の鎖のアンプリコンを配列決定して、表面上の各々のクラスターについて第2の鎖の核酸配列リードを生成するステップと、を含む、方法を提供する。
いくつかの態様では、表面上のクラスターの少なくともいくつかについて、本方法は、第1の鎖の核酸配列リードを、第2の鎖の核酸配列リードと比較して、元の二本鎖標的核酸分子のエラーを修正した配列リードを生成するステップをさらに含む。いくつかの態様では、本方法は、固有の分子識別子(UMI)を使用して、集合体からの元の二本鎖標的核酸分子の第1の鎖の核酸配列リードを、同じ元の二本鎖標的核酸分子の第2の鎖の核酸配列リードに関連付けるステップをさらに含む。いくつかの態様では、UMIは、表面上の物理的位置を含む。別の態様では、UMIは、タグ配列、分子特異的特徴、表面上のクラスター位置、またはそれらの組み合わせを含む。いくつかの態様では、分子特異的特徴は、参照配列に対する核酸マッピング情報、二本鎖標的核酸分子の末端またはその付近の配列情報、二本鎖標的核酸分子の長さ、またはそれらの組み合わせを含む。
いくつかの態様では、本方法は、鎖定義要素(SDE)を使用して、元の二本鎖標的核酸分子の第1の鎖の核酸配列リードを、同じ元の二本鎖標的核酸分子からの第2の鎖の核酸配列リードから区別するステップをさらに含む。いくつかの態様では、SDEは、配列リード情報とのステップ(e)および(j)、またはステップ(d)および(e)との関連付けである。いくつかの態様では、SDEは、アダプター配列の一部を含む。
いくつかの態様では、物理的に分離された第1の鎖のアンプリコンまたは第2の鎖のアンプリコンを配列決定することは、合成によって配列決定することを含む。
いくつかの態様では、本方法は、第1のアダプターおよび第2のアダプターを、集合体中の複数の二本鎖標的核酸分子の各々にライゲーションすることによって、物理的に連結した核酸複合体を調製するステップと、物理的に連結した核酸複合体を表面に提示するステップであって、複数の物理的に連結した核酸複合体が、複数の結合したオリゴヌクレオチドに対するハイブリダイゼーションを介して表面上に捕捉されるように、表面が、第2のアダプターの一本鎖部分に少なくとも部分的に相補的な複数の結合したオリゴヌクレオチドを有する、提示するステップと、をさらに含む。いくつかの態様では、本方法は、提示するステップの前に、物理的に連結した核酸複合体を増幅させるステップをさらに含む。いくつかの態様では、提示するステップの前に、物理的に連結した核酸複合体を増幅させることは、PCR増幅またはサークル増幅を含む。他の態様では、物理的に連結した核酸複合体は、表面上で順方向および逆方向の両方で捕捉される。
いくつかの態様では、増幅ステップは、ブリッジ増幅を含む。
いくつかの態様では、本方法は、集合体中の二本鎖標的核酸分子の少なくともいくつかについて、(i)第1の鎖からの配列リードを、第2の鎖からの配列リードと比較するステップと、(ii)第1の鎖からの配列リードと、第2の鎖からの配列リードとの間で一致しないヌクレオチド位置を識別するステップと、(iii)一致しない識別されたヌクレオチド位置を考慮に入れないか、除外するか、または修正することによって、二本鎖標的核酸分子のエラーを修正した配列リードを生成するステップと、をさらに含む。
いくつかの態様では、第1のアダプターは、切断可能部位またはモチーフを含む。いくつかの態様では、第1のアダプターおよび第2のアダプターが各々、配列決定プライマー結合部位、および任意選択で、単一分子識別子(SMI)配列を含む。いくつかの態様では、第2のアダプターは、配列決定プライマー結合部位、増幅プライマー結合部位、インデックス配列、またはそれらの任意の組み合わせを含む。いくつかの態様では、リンカードメインは、切断部位を含む。いくつかの態様では、第1のアダプターは、切断可能ドメインを含む。いくつかの態様では、第1のアダプターは、自己相補性ステム部分および一本鎖ヌクレオチドループ部分を含む、ヘアピンループ構造を含む。いくつかの態様では、一本鎖ヌクレオチドループ部分は、切断可能ドメインを含む。いくつかの態様では、ステム部分は、切断可能ドメインを含む。いくつかの態様では、切断可能ドメインは、酵素認識部位を含む。いくつかの態様では、酵素認識部位は、エンドヌクレアーゼ認識部位である。いくつかの態様では、エンドヌクレアーゼは、制限酵素または標的化エンドヌクレアーゼである。
いくつかの態様では、第2のアダプターは、「Y」字型のアダプターである。いくつかの態様では、Y字型のアダプターの一方または両方のアームは、表面に結合したオリゴヌクレオチドにハイブリダイズすることができる。
いくつかの態様では、第2のアダプターの一本鎖部分は、第1のプライマー結合部位を有する第1のアームと、第2のプライマー結合部位を有する第2のアームと、を含む。いくつかの態様では、変性すると、物理的に連結した二本鎖核酸複合体は、5’から3’、または3’から5’に、第1のプライマー結合部位、第1の鎖、リンカードメインを含む第1のアダプター、第2の鎖、および第2のプライマー結合部位を含む。
いくつかの態様では、表面は、配列決定表面である。いくつかの態様では、表面は、フローセルである。他の態様では、表面は、ビーズの表面である。
いくつかの態様では、増幅は、PCR増幅、等温増幅、ポロニー増幅、クラスター増幅、およびブリッジ増幅からなる群から選択される。いくつかの態様では、増幅は、表面上のブリッジ増幅である。
いくつかの態様では、複数の第1の鎖のアンプリコンおよび/または複数の第2の鎖のアンプリコンのうちの1つ以上は、順方向に表面に結合する。いくつかの態様では、複数の第1の鎖のアンプリコンおよび/または複数の第2の鎖のアンプリコンのうちの1つ以上は、逆方向に表面に結合する。
いくつかの態様では、本方法は、増幅の前に、表面の上に、複数の物理的に連結した二本鎖核酸複合体を流すステップをさらに含む。
いくつかの態様では、表面は、第2のアダプターの1つ以上の領域に少なくとも部分的に相補的な複数の1つ以上の結合したオリゴヌクレオチドを含む。いくつかの態様では、複数の1つ以上の結合したオリゴヌクレオチドは、第2のアダプターの一本鎖部分に少なくとも部分的に相補的である。
いくつかの態様では、物理的に連結した核酸複合体の第1の鎖および第2の鎖は、複数の増幅反応によって増幅され、表面上に物理的に連結した核酸複合体アンプリコンのクラスターを生成する。いくつかの態様では、複数の物理的に連結した核酸複合体の各々の第1の鎖および第2の鎖は、増幅され、表面上に複数のクラスターを同時に生成する。
いくつかの態様では、結合した物理的に連結した核酸複合体アンプリコンの一部を切断することは、第1のアダプター中の切断可能部位を非効率的に切断することを含み、表面上の各々のクラスター内で、切断された核酸複合体および切断されていない核酸複合体の両方が生じる。いくつかの態様では、フローセル上の各々のクラスター内の全ての核酸複合体の切断されていない核酸複合体の比率は、1%、5%、10%、20%、30%、40%、45%、または50%である。いくつかの態様では、切断された核酸複合体は、切断促進因子によって、第1のアダプターのリンカードメイン中の切断可能部位で切断される。いくつかの態様では、切断は、部位指向性酵素反応である。いくつかの態様では、切断促進因子は、エンドヌクレアーゼである。いくつかの態様では、エンドヌクレアーゼは、制限部位エンドヌクレアーゼまたは標的化エンドヌクレアーゼである。いくつかの態様では、切断促進因子は、リボ核酸タンパク質、Cas酵素、Cas9様酵素、メガヌクレアーゼ、転写活性化因子様エフェクターベースヌクレアーゼ(TALEN)、ジンクフィンガーヌクレアーゼ、アルゴノートヌクレアーゼ、またはそれらの組み合わせからなる群から選択される。いくつかの態様では、切断促進因子は、CRISPR関連酵素を含む。いくつかの態様では、切断促進因子は、Cas9、またはCPF1、またはそれらの誘導体を含む。他の態様では、切断促進因子は、ニッカーゼまたはニッカーゼバリアントを含む。いくつかの態様では、切断促進因子は、化学プロセスを含む。
いくつかの態様では、表面上に残存する切断されていない核酸複合体の量は、部位指向性切断のために導入される切断促進因子の量もしくは濃度を制御することによって、または切断促進因子が部位指向性切断のために導入されている時間量を制御することによって、拡張することができる。いくつかの態様では、切断されていない核酸複合体は、切断ステップの前または切断ステップの間に、抗切断促進因子の添加によって保護される。いくつかの態様では、抗切断促進因子は、第1のアダプターのリンカードメイン中に抗切断モチーフを含む。いくつかの態様では、切断可能部位は、第1のアダプターのリンカードメイン中に既に存在しており、抗切断モチーフは、第1のアダプターのリンカードメインに少なくとも部分的に相補的な配列を含むオリゴヌクレオチドのハイブリダイゼーションによって作製される。
いくつかの態様では、結合した物理的に連結した核酸複合体アンプリコンの一部を切断することは、(i)抗切断促進因子を導入するステップと、(ii)(i)の後、または(i)と同時のいずれかに、切断促進因子を導入するステップと、をさらに含み、抗切断促進因子との相互作用は、物理的に連結した核酸複合体アンプリコンを切断から保護する。いくつかの態様では、切断可能部位は、第1のアダプターのリンカードメインに少なくとも部分的に相補的な配列を含むオリゴヌクレオチドのハイブリダイゼーションによって作製され、オリゴヌクレオチドとハイブリダイズしていない物理的に連結した核酸複合体アンプリコンは、切断されない。いくつかの態様では、切断可能部位は、アダプターのリンカードメインに少なくとも部分的に相補的な配列を含む第1のオリゴヌクレオチドのハイブリダイゼーションによって作製され、抗切断モチーフは、アダプターのリンカードメインに少なくとも部分的に相補的な配列を含む第2のオリゴヌクレオチドのハイブリダイゼーションによって作製され、結合した物理的に連結した核酸複合体アンプリコンの一部を切断することは、(i)第1および第2のオリゴヌクレオチドの混合物を導入することと、(ii)切断促進因子を導入することと、をさらに含む。いくつかの態様では、第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチドのいずれかが、メチル化されている。いくつかの態様では、ハイブリダイゼーションは、ハイブリダイゼーションのために導入されるオリゴヌクレオチドの量もしくは濃度を制御することによって、またはオリゴヌクレオチドがハイブリダイゼーションのために導入される時間量を制御することによって、拡張することができる。いくつかの態様では、抗切断モチーフは、切断部位への接近を防止する嵩高い付加物または側鎖を有するオリゴヌクレオチド配列を含む。いくつかの態様では、抗切断モチーフは、切断促進因子が切断部位を認識することを防止する1つ以上のミスマッチを有するオリゴヌクレオチド配列を含む。いくつかの態様では、抗切断モチーフは、ヌクレオシド類似体、脱塩基部位、ヌクレオチド類似体、およびペプチド-核酸結合を有するオリゴヌクレオチド配列のうちの1つ以上を含む。
いくつかの態様では、切断された核酸複合体は、触媒的に活性な酵素によって第1のアダプター中の切断可能部位で切断され、切断されていない核酸複合体は、触媒的に不活性な酵素によって第1のアダプター中の切断から保護される。いくつかの態様では、切断部位は、第1のアダプターの自己相補性部分、または第1のアダプターの一本鎖部分にある。いくつかの態様では、切断部位は、物理的に連結した核酸複合体アンプリコンが表面上で自己ハイブリダイズされた構成である場合に、利用可能である。いくつかの態様では、切断部位は、物理的に連結した核酸複合体アンプリコンが二本鎖ブリッジ増幅される構成である場合に、利用可能である。
いくつかの態様では、本方法は、ステップ(a)の前に、1つ以上の標的化ゲノム領域を有する物理的に連結した核酸複合体を選択的に濃縮して、複数の濃縮された物理的に連結した核酸複合体を提供するステップをさらに含む。
本開示の多くの態様は、一緒に図面を構成する以下の図を参照することによって、より良く理解することができる。これらの図は、限定のためではなく、例示の目的のみのためである。図中の構成要素は、必ずしも縮尺どおりではない。むしろ、本開示の原理を明確に例示することを重視する。
定義
本開示がより容易に理解されるために、まず、特定の用語を以下に定義する。以下の用語および他の用語についてのさらなる定義は、本明細書全体を通して記載される。
本開示がより容易に理解されるために、まず、特定の用語を以下に定義する。以下の用語および他の用語についてのさらなる定義は、本明細書全体を通して記載される。
本出願では、文脈から別段明確でない限り、「1つの(a)」という用語は、「少なくとも1つ」を意味すると理解され得る。本出願で使用される場合、「または」という用語は、「および/または」を意味すると理解され得る。本出願では、「~を含む(comprising)」および「~を含む(including)」という用語は、それ自体によって示されるか、あるいは1つ以上のさらなる構成要素またはステップと共に示されるかにかかわらず、項目化された構成要素またはステップを包含すると理解され得る。範囲が本明細書で提示される場合、その両端が含まれる。本出願で使用される場合、「~を含む(comprise)」という用語およびこの用語の変形語、例えば、「~を含む(comprising)」および「~を含む(comprises)」は、他の付加物、構成要素、整数またはステップを除外することを意図しない。
約:「約」という用語は、ある値を参照して本明細書で使用される場合、参照される値の文脈で、類似する値を指す。一般に、その文脈に精通している当業者は、その文脈で、「約」に包含される適切な程度の分散を理解するであろう。例えば、いくつかの実施形態では、「約」という用語は、参照される値の25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、またはそれ未満内の範囲の値を包含し得る。
類似体:本明細書で使用される場合、「類似体」という用語は、1つ以上の特定の構造特徴、要素、構成要素または部分が参照物質と共通する物質(substance)を指す。典型的には、「類似体」は、参照物質と有意な構造類似性を示すが(例えば、コアまたはコンセンサス構造が共通する)、特定の別個の様式では違いもある。いくつかの実施形態では、類似体は、参照物質から、例えば、参照物質の化学操作によって、生成可能な物質である。いくつかの実施形態では、類似体は、参照物質を生成する合成プロセスと実質的に類似した合成プロセス(例えば、複数のステップが共通する)の遂行を通して生成可能な物質である。いくつかの実施形態では、類似体は、参照物質を生成するために使用されるものとは異なる合成プロセスの遂行を通して生成されるか、または生成され得る。
生体試料:本明細書で使用される場合、「生体試料」または「試料」という用語は、典型的には、本明細書に記載されるように、目的の生体源(例えば、組織または生物または細胞培養物)から得られるか、または目的の生体源に由来する試料を指す。いくつかの実施形態では、目的の供給源は、動物またはヒトなどの生物を含む。他の実施形態では、目的の供給源は、細菌、ウイルス、原生動物または真菌などの微生物を含む。さらなる実施形態では、目的の供給源は、合成組織、生物、細胞培養物、核酸または他の物質であってもよい。なおさらなる実施形態では、目的の供給源は、植物系生物であってもよい。さらに別の実施形態では、試料は、例えば、水試料、土壌試料、考古学試料、または非生物源から収集された他の試料などの環境試料であってもよい。他の実施形態では、試料は、多生物試料(例えば、混合生物試料)であってもよい。いくつかの実施形態では、生体試料は、生体組織または生物流体であるか、あるいはそれらを含む。いくつかの実施形態では、生体試料は、骨髄、血液、血球、腹水、組織もしくは微細針生検試料、細胞を含有する体液、自由に浮遊する核酸、痰、唾液、尿、脳脊髄液、腹腔液、胸水、糞便、リンパ液、婦人科系体液、皮膚スワブ、膣スワブ、パップスメア、口腔スワブ、鼻スワブ、導管洗浄液もしくは気管支肺泡洗浄液などの染液もしくは洗浄液、膣液、吸引物、擦過物、骨髄標本、組織生検標本、胎児組織もしくは体液、外科標本、糞便、他の体液、分泌液、および/または排泄物、および/またはこれらからの細胞などであってもよく、またはこれらを含んでいてもよい。いくつかの実施形態では、生体試料は、個体から得られた細胞であるか、または個体から得られた細胞を含む。いくつかの実施形態では、得られる細胞は、試料が得られる個体由来の細胞であるか、またはこれらを含む。特定の実施形態では、生体試料は、対象から得られる液体生検である。いくつかの実施形態では、試料は、任意の適切な手段によって目的の供給源から直接得られる「一次試料」である。例えば、いくつかの実施形態では、一次生体試料は、生検(例えば、穿刺吸引または組織生検)、手術、体液(例えば、血液、リンパ液、糞便など)の採取などからなる群から選択される方法によって得られる。いくつかの実施形態では、文脈から明らかになるように、「試料」という用語は、一次試料を処理することによって(例えば、その1つ以上の構成要素を除去することによって、かつ/または1つ以上の薬剤をそれに加えることによって)得られる調製物を指す。例えば、半透過性膜を使用して濾過すること。かかる「処理された試料」は、例えば、試料から抽出されるか、あるいは一次試料を、mRNAの増幅もしくは逆転写、特定の構成要素の単離および/または精製などの技術に供することによって得られる、核酸またはタンパク質を含んでいてもよい。切断部位:「切断モチーフ」および「ニック部位」とも呼ばれ、核酸分子中のヌクレオチド間の結合または結合対である。二本鎖核酸分子(例えば、二本鎖DNA)の場合、切断部位は、切断した後に「平滑」末端が形成されるように二本鎖分子中に互いにすぐ隣接する結合(一般的にホスホジエステル結合)を伴っていてもよい。切断部位は、開裂したときに「粘着末端」が残され、それによって、分子の末端に一本鎖ヌクレオチドの領域が残るように、互いにすぐ反対側にはない対の各一本鎖上にある2つのヌクレオチド結合も伴っていてもよい。切断部位は、酵素(例えば、制限酵素)またはCRISPR/Cas9などの配列認識能力を有する別のエンドヌクレアーゼによって認識されることが可能な特定のヌクレオチド配列によって定義することができる。切断部位は、このような酵素(すなわち、1型制限酵素)の認識配列内にあってもよく、またはいくつかの定義されたヌクレオチド間隔によってこれらの酵素に隣接していてもよい(すなわち、2型制限酵素)。切断部位は、特定のヌクレアーゼによって認識されることが可能な修飾ヌクレオチドの位置によって定義することもできる。例えば、脱塩基部位は、エンドヌクレアーゼVIIおよび酵素FPGによって認識され、切断することができる。ウラシル系は、酵素UDGによって認識され、脱塩基部位へとレンダリングすることができる。その他のDNA配列中のリボース含有ヌクレオチドは、相補性DNA配列にアニーリングされると、RNAseH2によって認識され、切断することができる。
決定する:本明細書に記載の多くの方法論は、「決定する」ステップを含む。当業者は、本明細書を読むと、かかる「決定する」ことが、例えば本明細書に明示的に言及される特定の技術を含め、当業者が利用可能な様々な技術のいずれかの使用を通して利用され得るか、または達成され得ることを理解するだろう。いくつかの実施形態では、決定することは、物理的な試料の操作を伴う。いくつかの実施形態では、決定することは、例えば、関連する分析を行うように適合されたコンピュータまたは他の処理ユニットを利用した、データまたは情報の検討および/または操作を伴う。いくつかの実施形態では、決定することは、供給源から関連情報および/または資料を受信することを伴う。いくつかの実施形態では、決定することは、試料またはエンティティの1つ以上の特徴を、比較可能な参照と比較することを伴う。
デュプレックス配列決定(DS):本明細書で使用される場合、「デュプレックス配列決定(Duplex Sequencing、DS)」は、その最も広い意味で、個々のDNA分子の両方の鎖からの配列を比較することによって卓越した精度を達成する、エラー修正方法を指す。
エラーを修正した:本明細書で使用される場合、「エラーを修正した」または「エラー修正」という用語は、核酸分子の二本鎖部分の2つの鎖が互いに完全に相補的ではない(例えば、ヌクレオチドミスマッチに起因する)核酸分子の領域において1つ以上のヌクレオチドエラーを識別し、その後、考慮に入れられないか、除外するか、もしくは他の状況で修正する結果得られる生成物またはプロセスを指す。いくつかの態様では、ミスマッチは、点変異、欠失、挿入、または化学修飾の結果であり得る。いくつかの態様では、ミスマッチは、配列(例えば、限定されないが、A-A、C-C、T-T、G-G、A-C、A-G、T-C、T-G)と反対の鎖の塩基対、またはこれらの対の逆(これらは等価であり、すなわち、A-GはG-Aと等価である)、塩基のうちの1つ以上に対する欠失、挿入、または他の修飾を含む。ミスマッチは、生物由来、DNA合成由来、またはミスマッチによって引き起こされる損傷または修飾ヌクレオチド塩基であり得る。いくつかの態様では、損傷または修飾ヌクレオチド塩基は、一方の鎖または両方の鎖に存在し、酵素プロセス(例えば、DNAポリメラーゼ、DNAグリコシラーゼ、または別の核酸修飾酵素または化学プロセス)によって、ミスマッチへと変換された。いくつかの態様では、このミスマッチを使用して、酵素プロセスまたは化学処理の前の核酸損傷またはヌクレオチド修飾の存在を推測することができる。
発現:本明細書で使用される場合、核酸配列の「発現」は、以下の事象のうちの1つ以上を指す:(1)DNA配列からのRNAテンプレートの産生(例えば、転写による)、(2)RNA転写物のプロセシング(例えば、スプライシング、編集、5’キャップ形成および/または3’末端形成による)、(3)RNAのポリペプチドもしくはタンパク質への翻訳、および/または(4)ポリペプチドもしくはタンパク質の翻訳後修飾。
官能基化された表面:本明細書で使用される場合、「官能基化された表面」という用語は、核酸分子または他の捕捉部分を結合または固定する(immobilize)ことが可能な固体表面、ビーズまたは別の固定された(fixed)構造を指す。いくつかの実施形態では、官能基化された表面は、標的核酸を捕捉することが可能な結合部分を含む。いくつかの実施形態では、結合部分は、ある表面に直接的に連結される。いくつかの実施形態では、標的核酸に少なくとも部分的に相補的なオリゴヌクレオチドは、結合部分として機能する。いくつかの実施形態では、オリゴヌクレオチドは、表面に共有結合される。いくつかの実施形態では、官能基化された表面は、他のガラスまたは非ガラス表面の中でも特に、孔径が制御された多孔質ガラス(CPG)、磁気多孔質ガラス(MPG)を含んでいてもよい。一実施形態では、官能基化された表面は、フローセルの表面などの配列決定表面であり得る。化学官能基化は、特に、ケトン修飾、アルデヒド修飾、チオール修飾、アジド修飾およびアルキン修飾を伴っていてもよい。いくつかの実施形態では、ハイブリダイゼーション捕捉に使用される官能基化された表面およびオリゴヌクレオチドは、他の表面化学の中でも特に、アミド結合、アルキルアミン結合、チオ尿素結合、ジアゾ結合、ヒドラジン結合を形成する固定化化学群のうちの1つ以上を用いて連結される。いくつかの実施形態では、ハイブリダイゼーション捕捉に使用される官能基化された表面およびオリゴヌクレオチドは、他の連結試薬の中でも特に、EDAC、NHS、過ヨウ素酸ナトリウム、グルタルアルデヒド、ピリジルジスルフィド、硝酸、ビオチンを含む試薬群のうちの1つ以上を用いて連結される。
gRNA:本明細書で使用される場合、「gRNA」または「ガイドRNA」は、標的化エンドヌクレアーゼ(例えば、Cas酵素(例えば、Cas9もしくはCpf1)または同様の特性を有する別のリボ核酸タンパク質など)を、DNAまたはRNAの特定の領域の切断を容易にする実質的に標的特異性の配列に結合するのに適した足場配列を含む短いRNA分子を指す。
変異:本明細書で使用される場合、「変異(mutation)」という用語は、参照配列に対する、核酸配列または構造の変化を指す。ポリヌクレオチド配列に対する変異は、複雑な複数ヌクレオチド変化の中で、試料中の点変異(例えば、単一塩基変異)、複数ヌクレオチドの変異、ヌクレオチドの欠失、配列再編成、ヌクレオチドの挿入およびDNA配列の重複を含んでいてもよい。変異は、相補的な塩基の変化(すなわち、真の変異)として、または一方の鎖にはあるが、他方の鎖にはなく、修復されるか、破壊されるか、または誤って修復されるか/真の二本鎖変異へと変換されるかのいずれかの可能性を有する変異(すなわち、ヘテロ二重鎖)として、二本鎖DNA分子の両方の鎖上で起きてもよい。参照配列は、データベース(すなわち、HG38ヒト参照ゲノム)、または配列が比較される別の試料の配列に存在し得る。変異は、遺伝的バリアントとしても知られている。
核酸:本明細書で使用される場合、その最も広い意味で、オリゴヌクレオチド鎖に組み込まれているか、または組み込まれ得る任意の化合物および/または物質を指す。いくつかの実施形態では、核酸は、ホスホジエステル結合を介してオリゴヌクレオチド鎖に組み込まれているか、または組み込まれ得る化合物および/または物質である。文脈から明らかになるように、いくつかの実施形態では、「核酸」は、個々の核酸残基(例えば、ヌクレオチドおよび/またはヌクレオシド)を指し、いくつかの実施形態では、「核酸」は、個々の核酸残基を含むオリゴヌクレオチド鎖を指す。いくつかの実施形態では、「核酸」は、RNAであるか、またはRNAを含み、いくつかの実施形態では、「核酸」は、DNAであるか、またはDNAを含む。いくつかの実施形態では、核酸は、1つ以上の天然核酸残基であるか、1つ以上の天然核酸残基を含むか、または1つ以上の天然核酸残基からなる。いくつかの実施形態では、核酸は、1つ以上の核酸類似体であるか、1つ以上の核酸類似体を含むか、または1つ以上の核酸類似体からなる。いくつかの実施形態では、核酸類似体は、ホスホジエステル骨格を利用しない点において核酸と異なる。例えば、いくつかの実施形態では、核酸は、1つ以上の「ペプチド核酸」であるか、1つ以上の「ペプチド核酸」を含むか、または1つ以上の「ペプチド核酸」からなり、骨格中のホスホジエステル結合の代わりにペプチド結合を有し、当該技術分野で既知であり、本技術の範囲内であるとみなされる。代替的または追加的に、いくつかの実施形態では、核酸は、ホスホジエステル結合ではなく、1つ以上のホスホロチオエート結合および/または5’-N-ホスホラミダイト結合を有する。いくつかの実施形態では、核酸は、1つ以上の天然ヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシンおよびデオキシシチジン)であるか、1つ以上の天然ヌクレオシドを含むか、または1つ以上の天然ヌクレオシドからなる。いくつかの実施形態では、核酸は、1つ以上のヌクレオシド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、C-5プロピニルシチジン、C-5プロピニル-ウリジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、0(6)-メチルグアニン、2-チオシチジン、メチル化塩基、インターカレーションされた塩基、およびそれらの組み合わせ)であるか、1つ以上のヌクレオシド類似体を含むか、または1つ以上のヌクレオシド類似体からなる。いくつかの実施形態では、核酸は、天然核酸中に一般的に存在する糖類と比較して、1つ以上の修飾された糖類(例えば、2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノース、ヘキソースまたはロックド核酸)を含む。いくつかの実施形態では、核酸は、RNAまたはタンパク質などの機能的遺伝子産物をコードするヌクレオチド配列を有する。いくつかの実施形態では、核酸は、1つ以上のイントロンを含む。いくつかの実施形態では、核酸は、非タンパク質コードRNA産物、例えば、マイクロRNA、リボソームRNAまたはCRISPR/Cas9ガイドRNAであってもよい。いくつかの実施形態では、核酸は、ゲノムにおいて調節目的を果たす。いくつかの実施形態では、核酸は、ゲノムから生じない。いくつかの実施形態では、核酸は、遺伝子間配列を含む。いくつかの実施形態では、核酸は、染色体外要素または非核ゲノム(ミトコンドリア、クロロプラストなど)に由来する。いくつかの実施形態では、核酸は、天然源からの単離、相補性テンプレートに基づく重合による酵素合成(インビボまたはインビトロで)、組換え細胞または系における生殖および化学合成のうちの1つ以上によって調製される。いくつかの実施形態では、核酸は、少なくとも2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000以上の残基長である。いくつかの実施形態では、核酸は、部分的または完全に一本鎖であり、いくつかの実施形態では、核酸は、部分的または完全に二本鎖である。いくつかの実施形態では、核酸は、ポリペプチドをコードするか、またはポリペプチドをコードする配列の相補体である少なくとも1つの要素を含むヌクレオチド配列を有する。いくつかの実施形態では、核酸は、酵素活性を有する。いくつかの実施形態では、核酸は、例えば、リボ核酸タンパク質複合体またはトランスファーRNAにおいて、機械的な機能を果たす。いくつかの実施形態では、核酸は、アプタマーとして機能する。いくつかの実施形態では、核酸は、データ格納に使用されてもよい。いくつかの実施形態では、核酸は、インビトロで化学的に合成されてもよい。
参照:本明細書で使用される場合、これに対して相対的に比較が行われる標準または対照を記載する。例えば、いくつかの実施形態では、目的の薬剤、動物、個体、集合体、試料、配列または値を、参照または対照の薬剤、動物、個体、集合体、試料、配列または値と比較する。いくつかの実施形態では、参照または対照は、目的の試験もしくは決定と実質的に同時に試験され、かつ/または決定される。いくつかの実施形態では、参照または対照は、歴史的な参照または対照であり、任意選択で、有形媒体で具現化される。典型的には、当業者に理解されるように、参照または対照は、評価されるものと同等の条件もしくは状況下で決定されるか、または特徴付けられる。当業者は、特定の可能な参照もしくは対照に対する信頼および/または比較を正当化するのに十分な類似性がいつ存在するかを理解するだろう。
配列リード:本明細書で使用される場合、「配列リード」または「配列決定リード」という用語は、参照または標的核酸分子に対応する核酸配列データを指す。いくつかの態様では、データは、配列決定プラットフォームによって処理される参照または標的核酸分子の全てまたは一部(例えば、その断片または部分)に対応する塩基対(または塩基対の確率)の推測配列である。配列リード長は、数塩基対(bp)~数百キロ塩基(kb)の範囲であり得る。配列リード長は、参照または標的核酸分子および使用される配列決定プラットフォームのサイズまたは長さによって影響を受ける場合がある。いくつかの態様では、配列リードは、配列決定技術、例えば、限定されないが、次世代配列決定プラットフォーム、例えば、Illumina(登録商標)HiSeq(登録商標)、Illumina(登録商標)NovaSeq(登録商標)、Illumina(登録商標)NextSeq(登録商標)、Illumina(登録商標)MiSeq(登録商標)、Illumina(登録商標)iSeq(登録商標)、Oxford Nanopore配列決定システム、ThermoFisher(登録商標)Ion Torrent(登録商標)配列決定システム、Roche 454 GS System(登録商標)、Illumina Genome Analyzer(登録商標)、Applied Biosystems SOLiD System(登録商標)、Helicos Heliscope(登録商標)、Complete Genomics(登録商標)、およびPacific Biosciences SMRT(登録商標)を使用して生成される。
単一分子識別子(SMI):本明細書で使用される場合、「単一分子識別子」または「SMI」という用語(特に、「タグ」、「バーコード」、「分子バーコード」、「固有分子識別子」、または「UMI」など、他の名前で呼ばれてもよい)は、より大きな異種の分子集合体の中で個々の分子を区別することが可能な任意の物質(例えば、ヌクレオチド配列、核酸分子特徴)を指す。いくつかの実施形態では、SMIは、外因的に適用されるSMIであってもよいか、または外因的に適用されるSMIを含んでいてもよい。いくつかの実施形態では、外因的に適用されるSMIは、縮重または半縮重した配列であってもよいか、または縮重または半縮重した配列を含んでいてもよい。いくつかの実施形態では、実質的に縮重したSMIは、無作為な固有分子識別子(R-UMI)として知られている場合がある。いくつかの実施形態では、SMIは、既知のコードのプール内からのコード(例えば、核酸配列)を含んでいてもよい。いくつかの実施形態では、所定のSMIコードは、定義された固有分子識別子(DUMI)として知られている。いくつかの実施形態では、SMIは、内因性SMIであってもよいか、または内因性SMIを含んでいてもよい。いくつかの実施形態では、内因性SMIは、標的配列の特定の剪断点、または標的配列を含む個々の分子の末端に関連する特徴に関連する情報であってもよく、またはこれらの情報を含んでいてもよい。いくつかの実施形態では、SMIは、核酸分子に対する無作為または半無作為な損傷、化学修飾、酵素修飾、または他の修飾に起因する、核酸分子における配列変動に関連するものであってもよい。いくつかの実施形態では、修飾は、メチルシトシンの脱アミノ化であってもよい。いくつかの実施形態では、修飾は、核酸ニックの部位を伴っていてもよい。いくつかの実施形態では、SMIは、外因性の要素と内因性の要素の両方を含んでいてもよい。いくつかの実施形態では、SMIは、物理的に隣接するSMI要素を含んでいてもよい。いくつかの実施形態では、SMI要素は、分子中で空間的に明確に異なってもよい。いくつかの実施形態では、SMIは、非核酸であってもよい。いくつかの実施形態では、SMIは、2つ以上の異なる種類のSMI情報を含んでいてもよい。SMIの様々な実施形態は、国際特許公開第2017/100441号にさらに開示されており、その全体が参照により本明細書に組み込まれる。
鎖定義要素(SDE):本明細書で使用される場合、「鎖定義要素」または「SDE」という用語は、二本鎖核酸物質の特定の鎖の識別を可能にし、したがって、他の/相補鎖からの区別を可能にする任意の物質(例えば、配列決定または他の核酸照合の後に、標的二本鎖核酸から得られる2つの一本鎖核酸の各々の増幅産物を、実質的に互いに区別可能にする任意の物質)を指す。いくつかの実施形態では、SDEは、アダプター配列内の実質的に非相補的な配列の1つ以上のセグメントであってもよいか、またはこのセグメントを含んでいてもよい。特定の実施形態では、アダプター配列内の実質的に非相補的な配列のセグメントは、Y字型または「ループ」形状を含むアダプター分子によって提供されてもよい。他の実施形態では、アダプター配列内の実質的に非相補的な配列のセグメントは、アダプター配列内の隣接する相補的な配列の中央に、対になっていない「バブル」を形成してもよい。他の実施形態では、SDEは、核酸修飾を包含してもよい。いくつかの実施形態では、SDEは、対になった鎖の、物理的に分離した反応コンパートメントへの物理的な分離を含んでいてもよい。いくつかの実施形態では、SDEは、化学修飾を含んでもよい。いくつかの実施形態では、SDEは、修飾された核酸を含んでもよい。いくつかの実施形態では、SDEは、核酸分子に対する無作為または半無作為な損傷、化学修飾、酵素修飾、または他の修飾に起因する、核酸分子における配列変動に関連するものであってもよい。いくつかの実施形態では、修飾は、メチルシトシンの脱アミノ化であってもよい。いくつかの実施形態では、修飾は、核酸ニックの部位を伴っていてもよい。SDEの様々な実施形態は、国際特許公開第2017/100441号にさらに開示されており、その全体が参照により本明細書に組み込まれる。
対象:本明細書で使用される場合、「対象」という用語は、生物、典型的には哺乳動物(例えば、ヒト、いくつかの実施形態では、出生前のヒト形態を含む)を指す。いくつかの実施形態では、対象は、関連する疾患、障害または状態に罹患している。いくつかの実施形態では、対象は、ある疾患、障害または状態にかかりやすい。いくつかの実施形態では、対象は、ある疾患、障害または状態の1つ以上の症状または特徴を示す。いくつかの実施形態では、対象は、ある疾患、障害または状態の症状または特徴を何ら示さない。いくつかの実施形態では、対象は、ある疾患、障害もしくは状態に対するかかりやすさ、またはある疾患、障害もしくは状態のリスクに特徴的な1つ以上の特徴を有する誰かである。いくつかの実施形態では、対象は、患者である。いくつかの実施形態では、対象は、診断および/または療法が実施されるか、および/または実施された個体である。
実質的に:本明細書で使用される場合、「実質的に」という用語は、目的の特徴または性質の全体もしくはほぼ全体の程度または度合いを示す定性的な状態を指す。生物学の当業者は、生物学的現象および化学的現象が、完全に終了すること、および/または完全に終了することに向けて進むこと、または絶対的な結果を達成するか、または回避することは、もしあるとしてもまれであることを理解するだろう。したがって、「実質的に」という用語は、多くの生物学的現象および化学的現象に内在する潜在的に完全に終了することはないことを捕捉するために本明細書で使用される。
バリアント:本明細書で使用される場合、「バリアント(variant)」という用語は、参照エンティティと有意な構造同一性を示すが、参照エンティティと比較して、1つ以上の化学部分の存在またはレベルが、参照エンティティと構造的に異なるエンティティを指す。核酸という観点で、バリアント核酸は、線形または三次元空間中の別の核酸に対して、指定された位置を有する複数のヌクレオチド残基からなる特徴的な配列要素を有し得る。相同性を有する配列は、1つ以上のバリアントによって異なる。例えば、バリアントポリヌクレオチド(例えば、DNA)は、核酸配列の1つ以上の差異の結果として、参照ポリヌクレオチドと異なる場合がある。いくつかの実施形態では、バリアントポリヌクレオチド配列は、別の配列(例えば、試料中の参照配列または他のポリヌクレオチド(例えば、DNA)配列)に対する挿入、欠失、置換または変異を含む。バリアントの例としては、SNP、SNV、CNV、CNP、MNV、MNP、変異、がん変異、ドライバー変異、パッセンジャー変異、遺伝性多型が挙げられる。
本発明の技術は、一般に、デュプレックス配列決定を使用して、核酸物質のためのエラーを修正した配列リードを提供するための方法、およびかかる方法に使用するための関連する試薬に関する。本技術のいくつかの実施形態は、より速い速度で(例えば、より少ないステップで)、および/またはより少ない費用で(例えば、より少ない試薬を利用して)提供され、より多くの望ましいデータが得られる、高精度の配列決定リードを達成するための方法を対象とする。本技術の他の態様は、デュプレックス配列決定のための変換効率(すなわち、配列が生成される核酸分子の割合)を増加させるための方法および試薬を対象とする。本技術の種々の態様は、前臨床および臨床での試験および診断において多くの用途を有するだけではなく、他の用途も有する。
本技術のいくつかの実施形態の具体的な詳細が、図1A~12Cを参照しつつ、以下に記載される。実施形態の多くは、本明細書ではデュプレックス配列決定に関して記載されるが、本明細書に記載されるものに加え、エラーを修正した配列決定リードを生成することが可能な他の配列決定様式、および配列情報を提供するための他の配列決定様式は、本技術の範囲内である。さらに、本技術の他の実施形態は、本明細書に記載されるものとは異なる構成、構成要素または手順を有していてもよい。したがって、当業者は、本技術が、追加の要素を有する他の実施形態を含んでいてもよく、また、本技術が、図1A~12Cを参照しつつ以下に示され、記載される特徴のいくつかを含まない他の実施形態を含んでいてもよいことを理解するだろう。
デュプレックス配列決定プロセスまたは他の高精度配列決定様式の効率に関して、変換効率は、少なくとも1つの二本鎖コンセンサス配列リード(または他の高精度配列リード)が作られる配列決定ライブラリ調製反応に入力される固有の核酸分子の分率であると定義することができる。いくつかの場合に、変換効率の欠点が、それ以外には非常に十分に適しているであろういくつかの用途について、高精度デュプレックス配列決定の有用性を制限する場合がある。例えば、低い変換効率は、標的二本鎖核酸のコピー数が制限される状況をもたらす場合があり、これにより、作られる配列情報が所望な量より少なくなる場合がある。この概念の非限定的な例としては、循環腫瘍細胞由来のDNAまたは腫瘍由来の無細胞DNA、または血漿などの体液に流れ込み、他の組織由来の過剰なDNAと混合した出生前乳児が挙げられる。他の非限定的な例としては、限られた量で犯罪現場に残されたものなどの法医学的材料、考古学的場所に見出され得る古代DNAなどの古代DNA、針生検で得られたものなどの非常に小さな生検、吸引または内視鏡検査、少量のホルマリン固定臨床材料、微小解剖された試料、小さな生物学的領域またはヒトもしくは非ヒト生物由来の試料、試料または毛髪、血斑または多細胞生物または単細胞生物によって生成された、または限られた量で由来する他の生物学的材料(単一細胞または少数の細胞を含む)が挙げられる。デュプレックス配列決定は、典型的には、10万を超える変異していない分子の中で1個の変異体分子を分割することができる精度を有するが、例えば、試料中の利用可能な分子が10,000個(例えば、単一コピー遺伝子もしくは遺伝子座の場合には10,000個のゲノム等価体)しかない場合、これらを二本鎖コンセンサス配列リードに変換する理想的な効率が100%であったとしても、測定可能な最小変異頻度は、1/(10,000*100%)=1/10,000であろう。臨床診断として、がんまたは治療もしくは診断に関連する変異の低レベルのシグナルを検出するための最大感度を有することが重要な場合があり、そのため、この観点では、比較的低い変換効率は、望ましくないだろう。同様に、法医学用途では、試験に利用可能なDNAが非常に少ないことが多い。犯罪現場または自然災害の現場から、わずかナノグラム量またはピコグラム量を回収することができる場合、および/または複数の個体からのDNAが混合している場合、混合物内の全ての個体のDNAの存在を検出することができるという点で、最大の変換効率を有することが重要な場合がある。
デュプレックス配列決定および他の配列決定様式を組み込んだ方法は、1つ以上の配列決定アダプターを標的二本鎖核酸分子に接続(例えば、ライゲーション)し、二本鎖標的核酸複合体を生成することを含んでいてもよい。このようなアダプター分子は、例えば、配列決定プライマー認識部位、増幅プライマー認識部位、バーコード(例えば、単一分子識別子(SMI))配列(固有分子識別子(UMI)としても知られる)、インデックス配列、一本鎖部分、二本鎖部分、鎖区別要素または特徴など、大規模並列配列決定プラットフォームに適した種々の特徴のうちの1つ以上を含んでいてもよい。上述のように、デュプレックス配列決定情報を得るためには、元の二本鎖分子の両方の鎖からの配列情報の正常な回収が必要である。本開示の態様は、増幅および配列決定の前に鎖を物理的に連結することを介して、元の二本鎖分子の両方の鎖からの配列決定情報を生成し、関連付けるための方法および試薬を提供する。
I.デュプレックス配列決定方法、ならびに関連するアダプターおよび試薬の選択された実施形態
デュプレックス配列決定は、二本鎖核酸分子からエラーを修正したDNA配列を生成するための方法であり、元々、国際特許公開第2013/142389号および米国特許第9,752,188号に記載されたものであり、その両方の全体が、参照により本明細書に組み込まれる。本技術の特定の態様では、デュプレックス配列決定を使用して、誘導体配列リードを、大規模並列配列決定(MPS)(一般的に次世代配列決定(NGS)としても知られる)中に、同じ二本鎖核酸親分子に由来するものとして認識することができるだけではなく、配列決定後に区別可能なエンティティとして互いに区別することができるような様式で、個々のDNA分子の両方の鎖を配列決定することができる。次いで、各鎖から得られる配列リードを、元の二本鎖核酸分子のエラーを修正した配列を得る目的で比較する。
デュプレックス配列決定は、二本鎖核酸分子からエラーを修正したDNA配列を生成するための方法であり、元々、国際特許公開第2013/142389号および米国特許第9,752,188号に記載されたものであり、その両方の全体が、参照により本明細書に組み込まれる。本技術の特定の態様では、デュプレックス配列決定を使用して、誘導体配列リードを、大規模並列配列決定(MPS)(一般的に次世代配列決定(NGS)としても知られる)中に、同じ二本鎖核酸親分子に由来するものとして認識することができるだけではなく、配列決定後に区別可能なエンティティとして互いに区別することができるような様式で、個々のDNA分子の両方の鎖を配列決定することができる。次いで、各鎖から得られる配列リードを、元の二本鎖核酸分子のエラーを修正した配列を得る目的で比較する。
図1は、本技術の実施形態に従う、様々なデュプレックス配列決定方法のステップの概念図である。特定の実施形態では、デュプレックス配列決定を組み込む方法は、1つ以上の配列決定アダプターを、各々が第1の鎖の標的核酸配列と第2の鎖の標的核酸配列とを含む複数の標的二本鎖核酸分子にライゲーションして、複数の二本鎖標的核酸複合体を生成することを含み得る(図1A)。二本鎖核酸ライブラリの調製が作られた後、複合体が、DNA増幅(例えば、PCRを用いる)、またはDNA増幅の任意の他の生化学的方法(例えば、ローリングサークル増幅、複数置換増幅、等温増幅、ブリッジ増幅、ポロニー増幅、等温増幅、または表面結合増幅)に供してもよく、その結果、第1の鎖の標的核酸配列のうちの1つ以上のコピーおよび第2の鎖の標的核酸配列のうちの1つ以上のコピーが作られる(例えば、図1A)。次いで、第1の鎖の標的核酸分子のうちの1つ以上の増幅コピーおよび第2の標的核酸分子のうちの1つ以上の増幅コピーは、好ましくは「次世代」大規模並列DNA配列決定プラットフォームを使用してDNA配列決定に供され得る(例えば、図1A)。
配列決定後、標的核酸分子の第1の鎖から作られる配列リードを、同じ標的核酸分子の第2の鎖から作られる配列リードと比較する。いくつかの実施形態では、1つより多い配列リードが、第1および第2の鎖から生成されてもよい。比較すると、エラーを修正した標的核酸分子配列を生成することができる(例えば、図1B)。例えば、第1と第2の鎖標的核酸配列の両方からの塩基が一致するヌクレオチド位置は、真の配列であるとみなされ、一方、この2つの鎖間で一致しないヌクレオチド位置は、技術的なエラーの可能性がある部位と認識され、この部位は、考慮に入れられないか、除外されるか、修正されるか、または別の状況で識別されてもよい。いくつかの実施形態では、ヌクレオチド位置が一致しない場合、その部位は、未知として識別され得る(例えば、図1Bで「N」として示される)。このようにして、元の二本鎖標的核酸分子のエラーを修正した配列を生成することができる(図1Bに示される)。任意選択で、いくつかの実施形態では、第1の鎖の標的核酸分子および第2の鎖の標的核酸分子から作られる配列決定リードの各々を別個にグループ分けした後、第1の鎖および第2の鎖の各々について、一本鎖コンセンサス配列を生成することができる。次いで、第1の鎖の標的核酸分子および第2の鎖の標的核酸分子からの一本鎖コンセンサス配列を比較して、エラーを修正した標的核酸分子配列を作ることができる(例えば、図1B)。
あるいは、いくつかの実施形態では、2つの鎖間の配列が一致しない部位は、元の二本鎖標的核酸分子において、生物学的に由来するミスマッチの可能性がある部位として認識することができる。あるいは、いくつかの実施形態では、2つの鎖間の配列が一致しない部位は、元の二本鎖標的核酸分子において、DNA合成に由来するミスマッチの可能性がある部位として認識することができる。あるいは、いくつかの実施形態では、2つの鎖間の配列が一致しない部位は、損傷または修飾ヌクレオチド塩基が、一方の鎖または両方の鎖に存在し、酵素プロセス(例えば、DNAポリメラーゼ、DNAグリコシラーゼ、または別の核酸修飾酵素または化学プロセス)によって、ミスマッチへと変換された可能性がある部位として認識することができる。いくつかの実施形態では、修飾ヌクレオチド塩基は、5-メチル-シトシン(cytosone)、8-オキソ-グアニン、リボース塩基、脱塩基ヌクレオチド、またはウラシルヌクレオチドである。いくつかの実施形態では、この後者の知見を使用して、酵素プロセスまたは化学処理の前の核酸損傷またはヌクレオチド修飾の存在を推測することができる。
特定の実施形態では、米国特許第9,752,188号および国際特許公開第2017/100441号に記載されるように、個々の元の二本鎖核酸分子からの第1の鎖の配列決定リードおよび第2の鎖の配列決定リードは、(a)ライブラリ調製中にアダプターと関連する単一分子識別子(SMI)配列、(b)元の二本鎖分子と関連する断片特徴、例えば、断片末端、もしくは断片末端付近、または断片末端に対する配列、および(c)それらの組み合わせを使用して、関連付け(例えば、グループ分け)することができる。
一実施形態では、デュプレックス配列決定で使用するための生配列リードの生成は、分子の一方の末端にヘアピンアダプターが接続した標的二本鎖核酸分子と、その分子の他方の端に接続した「Y」字型のアダプターとの使用を具現化する。元の二本鎖核酸分子の第1の鎖および第2の鎖の両方を含むこの連結されたかまたは二本鎖の複合体は、任意の種類の増幅(例えば、PCRまたはブリッジ)を使用してさらに増幅することができ、次いで、デュプレックス配列決定で使用するための配列リードを生成するために、大規模並列配列決定(例えば、合成による配列決定、次世代配列決定(NGS)など)を行うことができる。ヘアピンアダプター(すなわち、「ループ」または「U」字型)を有するアダプター-二本鎖核酸複合体は、非限定的な例では、配列リードがフローセル表面上の配列決定反応の位置の性質によってグループ分けされることを可能にする方法(合成によって配列決定を行う場合)で、または他の方法での配列決定反応/プロセスの位置の性質によってグループ分けされることを可能にする方法で、標的二本鎖核酸分子の元の第1の鎖および元の第2の鎖の両方からの配列リードの生成を可能にする。
本技術の態様は、第1および第2の鎖の配列決定リードを関連付け、および/またはグループ分けするための方法および試薬であって、両方の鎖に由来する配列決定情報が、それらの物理的連結の性質によって(例えば、エラー修正のために)互いに関連付けられるような方法で第1および第2の鎖を物理的に連結することによる、方法および試薬を対象とする。特定の実施形態では、デュプレックス配列決定で使用するための配列決定ライブラリを調製するための方法は、ヘアピンアダプターを標的二本鎖核酸分子の一方の末端にライゲーションすることと、「Y」字型のアダプターを同じ標的二本鎖核酸分子の反対側の末端にライゲーションすることとを含み得る。一実施形態では、ヘアピンアダプター分子は、標的二本鎖核酸分子の第1および第2の鎖の標的化分離のための切断可能なヘアピンアダプター要素を含む。
いくつかの実施形態では、第1の鎖の配列リードおよび第2の鎖の配列決定リードとの関連付けは、シーケンサー上の配列決定反応の間またはその後に達成することができる。例えば、特定の実施形態では、二本鎖核酸分子の第1および第2の鎖は、例えば、ヘアピンアダプター配列などの介在するリンカードメインによって連結される。一実施形態では、元の核酸分子の鎖の両方に由来する配列情報は、MPSシーケンサー上の同じクローナルクラスター内で(例えば、フローセル上で)生成される。自己相補性ヘアピン配列が配列決定表面上または溶液中で優先的にハイブリダイゼーションし、ポリメラーゼ伸長を損なう可能性があるため、シーケンサー上で連結した第1および第2の鎖を配列決定することに課題が生じる。本技術の特定の態様は、シーケンサー上の同じクローナルクラスター内の第1および第2の鎖の両方から配列決定リードを得ることができる一方で、連結した第1および第2の鎖の自己相補性ハイブリダイゼーションと関連するこれらの課題を克服するための方法を開示する。
アダプターおよびアダプター配列
様々な配置で、プライマー部位、フローセル配列および/またはSMI(例えば、分子バーコード)もしくはSDEなどの他の特徴を含むアダプター分子は、本明細書に開示される実施形態の多くと共に使用することが企図される。いくつかの実施形態では、提供されるアダプターは、以下の特性のうちの少なくとも1つを有するPCRプライマー(例えば、プライマー部位)に対して相補的または少なくとも部分的に相補的な1つ以上の配列であってもよく、またはこの配列を含んでいてもよい:(1)高い標的特異性がある、(2)多重化が可能である、(3)強力かつバイアスが最小限の増幅を示す。
様々な配置で、プライマー部位、フローセル配列および/またはSMI(例えば、分子バーコード)もしくはSDEなどの他の特徴を含むアダプター分子は、本明細書に開示される実施形態の多くと共に使用することが企図される。いくつかの実施形態では、提供されるアダプターは、以下の特性のうちの少なくとも1つを有するPCRプライマー(例えば、プライマー部位)に対して相補的または少なくとも部分的に相補的な1つ以上の配列であってもよく、またはこの配列を含んでいてもよい:(1)高い標的特異性がある、(2)多重化が可能である、(3)強力かつバイアスが最小限の増幅を示す。
いくつかの実施形態では、アダプター分子は、「Y」字型、「U」字型、「ヘアピン」形状であってもよく、バブル(例えば、非相補配列の一部)、または他の特徴を有し得る。他の実施形態では、アダプター分子は、「Y」字型、「U」字型、「ヘアピン」形状、またはバブルを含み得る。本開示の目的のために、「U」字型または「ヘアピン」形状のアダプターは両方とも、標的二本鎖核酸分子の第1の鎖を同一の分子の第2の鎖に連結または接続するリンカードメインを有するアダプターをまとめて指すために使用され得る。特定のアダプターは、修飾ヌクレオチドまたは非標準的ヌクレオチド、制限部位、またはインビトロで構造もしくは機能を操作するための他の特徴を含んでいてもよい。アダプター分子は、末端を有する様々な核酸物質にライゲーションしてもよい。例えば、アダプター分子は、T-オーバーハング、A-オーバーハング、CG-オーバーハング、複数ヌクレオチドオーバーハング(本明細書では「粘着末端」または「粘着性オーバーハング」とも呼ばれる)、または既知のヌクレオチド長(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個以上のヌクレオチド)を有する一本鎖オーバーハング領域、脱ヒドロキシル化塩基、核酸物質の平滑末端にライゲーションするのに適したものであってもよく、分子の末端は、標的の5’が脱リン酸化されているか、または別の状況で従来のライゲーションから遮断されていた。他の実施形態では、アダプター分子は、ライゲーション部位の5’鎖に脱リン酸化または他のライゲーションを防ぐ修飾を含んでいてもよい。後者の2つの実施形態では、このような戦略は、ライブラリ断片またはアダプター分子の二量体化を防ぐのに有用な場合がある。
図2Aは、本技術のいくつかの実施形態と共に使用するための核酸アダプター分子、および本技術の実施形態に従う二本鎖核酸断片へのアダプター分子のライゲーションから得られる二本鎖アダプター-核酸複合体を示す。図2Aに示すように、第1のアダプター分子(アダプター1)は、第1のプライマー部位および第2のプライマー部位(プライマー部位1およびプライマー部位2として標識される)を有し、T-オーバーハングによる二本鎖核酸断片へのライゲーションに適したY字型アダプター分子であり得る。T-オーバーハングによる標的核酸断片へのライゲーションに好適な第2のアダプター分子(アダプター2)を、一本鎖連結ドメインを含むヘアピンアダプターとして示す。二本鎖核酸断片の集合体の配列決定ライブラリ生成は、アダプター1およびアダプター2の両方を含むアダプターのプールを、二本鎖核酸断片の集合体へとライゲーションすることを含み得る。図2Aは、この記載されたライゲーション反応から得られた1つの産物を示す。他の産物としては、両端にアダプター1を含むアダプター-核酸複合体、および両端にアダプター2を含むアダプター-核酸複合体が挙げられる。本明細書に記載の様々な実施形態では、デュプレックス配列決定方法と共に使用するために、図2Aに示すようなアダプター-核酸複合体を生成するのが望ましい。
図2Bは、別の実施形態を図示し、標的二本鎖核酸断片が、断片の一方の末端に粘着末端1を含み、断片の反対側の末端に粘着末端2を含む。設計によって、粘着末端1(標的断片の5’末端にあるオーバーハング)の配列は既知である。同様に、粘着末端2(標的断片の3’末端にあるオーバーハング)の配列は既知である。一実施形態では、粘着末端1の配列は、粘着末端2の配列とは異なる。別の実施形態では、粘着末端1の配列は、粘着末端2の配列とは異なる長さである。さらなる実施形態では、粘着末端1は、5’オーバーハングであり、粘着末端2は、3’オーバーハングである。実質的に相補性の配列を含む特定のアダプターは、断片が両端でアダプターに接続することができるように合成することができる。一実施形態では、アダプターは、異なっていてもよい(例えば、アダプター1は、Y字型を含んでいてもよく、アダプター2は、U字型を含んでいてもよい)。他の実施形態では(図示されない)、アダプターは、同じ種類のアダプターであってもよい(例えば、Y字型、U字型、バーコード化されたアダプターなどを含むアダプター)。図2Bに示すように、この設計は、各々の標的二本鎖核酸分子が、一方の末端にY字型アダプターを有し、他方の末端にヘアピン(例えば、連結ドメインを有するアダプター)を有することを可能にする。したがって、変性すると、アダプター-核酸複合体は、第1のプライマー部位、第1の鎖、連結ドメイン、第2の鎖、および第2のプライマー部位を含む一本鎖分子を含む。断片の5’末端または3’末端のいずれかに特定のアダプターが配置されるように設計するための他の用途において利点が存在し得る。標的断片上の実質的に固有の粘着末端の特異性は、これらの種類の用途を容易にする。さらに、首尾良く開裂し、アダプターがライゲーションした標的断片の陽性選択は、濃縮された標的核酸領域の増幅および配列決定のみを確実にし得る。
したがって、いくつかの実施形態では、アダプター分子のセットは、他のアダプター分子のセットに関して異なる、または固有の、または半分固有の粘着性オーバーハングを含み得る。異なる種類の粘着末端の数は、2個または3個、4個、5個、6個、7個、8個、9個または10個以上であってもよい。異なる種類の粘着末端の数は、約11個、または12個、または15個、または20個、または25個、または30個、または35個、または40個、または45個、または50個、または60個、または70個、または80個、または90個、または100個、または120個、または140個、または150個、または200個、または300個、または400個、または500個、または750個、または1000個以上であってもよい。特定の例では、ヘアピンアダプター分子は、第1の相補性断片の粘着末端にライゲーションするのに適した第1の粘着性オーバーハングを含むことができ、Y字型アダプターは、第2の相補性断片の粘着末端にライゲーションするのに適した第2の粘着性オーバーハングを含むことができる。したがって、核酸分子の集合体の配列決定ライブラリ調製は、第1の粘着末端および第2の粘着末端を有する核酸断片を生成することと、核酸断片をヘアピンおよびY字型アダプターにライゲーションすることとを含み得る。得られた配列決定ライブラリは、各々が第1の末端にヘアピンアダプターを有し、第2の末端にY字型アダプターを有する、複数の二本鎖アダプター-核酸断片複合体を含み得る。
増幅
一実施形態では、本方法は、フローセルの表面などのシーケンサー表面上の第1の鎖および第2の鎖の両方を含むアダプター-核酸複合体の増幅を含み得る。いくつかの実施形態では、ある表面上の増幅、例えば、フローセルの表面上のブリッジ増幅は、結合した核酸テンプレートのクラスターまたは複数のコピーを生成することを含む。特定の実施形態では、連結された第1および第2の鎖の核酸テンプレートを、フローセルの表面上でブリッジ増幅させ、例えば、複数のクローナルクラスターを生成することができ、各々のクローナルクラスターが、元の二本鎖核酸分子の元の第1の鎖および第2の鎖の両方に由来する核酸テンプレートコピーを含む。クラスター中のクローナルコピーのいくつかは、順方向であり、残りは逆方向である。当業者は、ある表面の上にアダプター-核酸複合体を流し、Y字型アダプターの領域に少なくとも部分的に相補的な結合したオリゴヌクレオチドを提供するステップを含む増幅を使用して、ポロニー増幅、クラスター増幅、ブリッジ増幅などの様々な実施形態を理解するであろう。表面は、アダプターの部分に相補的な1つまたは1つより多いオリゴヌクレオチドを提供することができる。実際には、Y字型アダプターの両方のアームは、フローセルの表面にハイブリダイズすることができる。
一実施形態では、本方法は、フローセルの表面などのシーケンサー表面上の第1の鎖および第2の鎖の両方を含むアダプター-核酸複合体の増幅を含み得る。いくつかの実施形態では、ある表面上の増幅、例えば、フローセルの表面上のブリッジ増幅は、結合した核酸テンプレートのクラスターまたは複数のコピーを生成することを含む。特定の実施形態では、連結された第1および第2の鎖の核酸テンプレートを、フローセルの表面上でブリッジ増幅させ、例えば、複数のクローナルクラスターを生成することができ、各々のクローナルクラスターが、元の二本鎖核酸分子の元の第1の鎖および第2の鎖の両方に由来する核酸テンプレートコピーを含む。クラスター中のクローナルコピーのいくつかは、順方向であり、残りは逆方向である。当業者は、ある表面の上にアダプター-核酸複合体を流し、Y字型アダプターの領域に少なくとも部分的に相補的な結合したオリゴヌクレオチドを提供するステップを含む増幅を使用して、ポロニー増幅、クラスター増幅、ブリッジ増幅などの様々な実施形態を理解するであろう。表面は、アダプターの部分に相補的な1つまたは1つより多いオリゴヌクレオチドを提供することができる。実際には、Y字型アダプターの両方のアームは、フローセルの表面にハイブリダイズすることができる。
ブリッジ増幅(図示されない)を使用して、複合体の複数のコピーを生成し、コロニーまたはクラスター(本明細書ではクローナルクラスターとも呼ばれる)を形成することができる。各クローナルクラスターは、順方向および逆方向の両方に、元の分子(例えば、アダプター-核酸複合体)に由来する複数のコピーを含む。
一実施形態では、順方向のコピーまたは逆方向のコピーのいずれかが切断され、除去されるときに、配列決定反応を進めることができる。図3Aは、アダプター-核酸複合体(例えば、二本鎖核酸複合体)のブリッジ増幅の後、かつ順方向を含むコピー(例えば、核酸配列「2」が、フローセルの表面に結合する)が切断され、除去された後のプロセスにおけるステップを示す。図3Aに示すように、残存する複合体は、逆方向である(例えば、核酸配列「1」が、フローセルの表面に結合しており、例えば、分子の3’末端が表面に結合している)。一実施形態では、第1の鎖の核酸配列は、第2の鎖の相補的な核酸配列と容易にハイブリダイズし、より長い複合体の合成による配列決定を困難なものにする。例示される複合体の結合したコピーは、ヘアピンアダプター(例えば、アダプター2、図2Aおよび2B)によって提供されるリンカードメインを含む。いくつかの実施形態では、リンカードメインは、切断可能部位またはモチーフ(「C」)を含む。切断可能部位Cは、ヌクレオチド配列、単一ヌクレオチド塩基、修飾塩基、または他の酵素的または非酵素的に切断可能な特徴を含んでいてもよい。
図3Bに示すように、本プロセスは、第1の鎖の配列を第2の鎖の配列から分離するための切断可能部位Cの切断を含むステップを含み得る。一実施形態では、部位Cでの切断事象は、切断促進因子(例えば、酵素、化学物質など)によって促進され得る。一実施形態では、切断ステップは、複合体の一部のみが部位Cで切断されるように非効率的であり得る。そのため、複合体の一部(例えば、約1%、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約15%、約20%、約25%、約30%、約40%、約45%、約50%、またはそれより多い、もしくはそれより少ない、約1%~約10%、約10%~約25%、約25%~約45%、50%より多い、10%未満など)が、切断されないまま残る場合があり、第1および第2の鎖の配列は、連結したままである。いくつかの態様では、複合体の少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%が、例えば、部位Cで切断される。
部位Cでの切断によって第1の鎖を第2の鎖から分離すると、結合していない鎖(例えば、近接核酸配列2)が洗い流される。例えば、図3Cに示すように、部位Cで切断された複合体の一部は、第1の鎖のヌクレオチド配列とヘアピンアダプターの一部のみを含む。複合体は、もはや自己ハイブリダイズしないため、(例えば、結合した分子の3’末端のヌクレオチド配列1で、もしくはその周囲での)アダプターに特異的なプライマーを使用する配列決定反応を使用して、クローナルクラスター中に残存する第1の鎖の配列決定リードを生成するための配列決定反応を行うことができる(図3D)。インデックスリードを生成することもできる(図示されない)。なお、第1の鎖の配列決定リードは、シングルエンド配列リードである。クローナルクラスター中で切断されないままの複合体は、依然として自己ハイブリダイズし、配列決定プライマーによる、より長い第2の鎖の置換が困難であることに起因して、配列決定反応中に首尾良く配列決定されない可能性が高い(図3D)。
クローナルクラスター中に存在する第1の鎖からの配列決定情報を得た後、本プロセスの次のステップは、切断されていない複合体のより多くのコピーを提供するための第2のラウンドの増幅(例えば、ブリッジ増幅)を含む。ブリッジ増幅は、全長複合体上に存在する核酸配列1および核酸配列2の両方の存在を必要とする。残存する切断されていない複合体のみに、両方のアダプター配列が依然として存在する。そのため、フローセルの表面に結合した残存するオリゴヌクレオチドを利用したブリッジ増幅によって、クローナルクラスターを再配置させることができる(図4A)。
増幅の後、逆方向のコピーのいずれかが切断され、除去されるときに、第2の配列決定反応を進めることができる。図4Bは、アダプター-核酸複合体(例えば、二本鎖核酸複合体)のブリッジ増幅の後、かつ逆方向を含むコピー(例えば、核酸配列「1」が、フローセルの表面に結合する)が切断され、除去された後のプロセスにおけるステップを示す。図4Bに示すように、残存する複合体は、順方向である(例えば、核酸配列「2」が、フローセルの表面に結合しており、例えば、分子の5’末端が表面に結合している)。上述のように、第1の鎖および第2の鎖の核酸配列は、容易にハイブリダイズし、より長い複合体の合成による配列決定を困難なものにする。
図4Cに示すように、本プロセスは、第2の鎖の配列を第1の鎖の配列から分離するための切断可能部位Cの切断を含むステップを含み得る。一実施形態では、部位Cでの切断事象は、切断促進因子(例えば、酵素、化学物質など)によって促進され得る。上述したように、切断ステップは、複合体の一部のみが部位Cで切断されるように非効率的であり得る。そのため、複合体の一部(例えば、約1%、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約15%、約20%、約25%、約30%、約40%、約45%、約50%、またはそれより多い、もしくはそれより少ない、約1%~約10%、約10%~約25%、約25%~約45%、50%より多い、10%未満など)が、切断されないまま残る場合があり、第1および第2の鎖の配列は、連結したままである。あるいは、切断ステップは、効率的なものであってもよく、全ての複合体を切断することができる(例えば、図4Cに示されるように)。
部位Cでの切断によって第2の鎖を第1の鎖から分離すると、結合していない鎖(例えば、近接核酸配列1)が洗い流される。例えば、図4Dに示すように、部位Cで切断された複合体の一部は、第2の鎖のヌクレオチド配列とヘアピンアダプターの一部のみを含む。複合体は、もはや自己ハイブリダイズしないため、ヘアピンアダプターの残存する部分に特異的なプライマーを使用する配列決定反応を使用して、クローナルクラスター中に残存する第2の鎖の配列決定リードを生成するための配列決定反応を行うことができる(図4E)。インデックスリードを生成することもできる(図示されない)。なお、第2の鎖の配列決定リードは、シングルエンド配列リードである。第1の鎖および第2の鎖の両方に由来する配列リード(例えば、同じクローナルクラスター内にある)が生成されると、それらをエラー修正のために比較することができる。
図5A~5Eは、配列決定表面(例えば、フローセル)上のデュプレックス配列決定情報を提供するための二本鎖複合体配列決定の別の実施形態を示す。図5A~5Eに示す実施形態では、元のアダプター-核酸複合体の第1の鎖および第2の鎖の両方からの配列リードを、第2のブリッジ増幅ステップを行わずに生成することができる。上述のように、各々の二本鎖複合体は、ある表面上で独立してブリッジ増幅され、切断可能部位を有する介在するヘアピンリンカードメインを有する第1の鎖および相補的な第2の鎖の両方を有する二本鎖複合体の複数のコピーを含むクローナルクラスターを生成することができる(図5A)。コピーは、上述したように、順方向および逆方向の両方であってもよい。
図5Bに示されるように、一実施形態では、二本鎖複合体は、切断部位Cで(例えば、本明細書でさらに論じられる切断促進因子を介して)切断されてもよい。部位Cでの切断の後、結合していない鎖は、除去される。図5Cを参照すると、フローセルの表面に結合した残存する分子は、(a)逆方向の(例えば、プライマー部位「1」に隣接する)第1の鎖の配列と、(b)順方向の(例えば、プライマー部位「2」に隣接する)第2の鎖の配列と、を含む。
次のステップでは、逆方向に特異的なプライマーを使用した第1の配列決定反応を使用して、第1の鎖についての配列決定情報を得る(図5D)。第1の配列決定反応で使用されるプライマーは、洗い流すことができる。次のステップでは、順方向に特異的なプライマーを使用した第2の配列決定反応を使用して、第2の鎖についての配列決定情報を得る(図5E)。図5Dおよび5Eに示される実施形態は、第1の鎖および第2の鎖を連続して配列決定することを示す。別の実施形態では、第1の鎖および第2の鎖を、例えば、多色化学(例えば、4色化学)、その後の配列決定/色頻度シグナルのデコンボリューションによって同時に(例えば、同じ配列決定反応で)配列決定し、特定のシーケンサーのベースコールまたはシグナルの起源を決定することができることが理解されるであろう。
第1の鎖および第2の鎖からの配列決定リードが生成されると、デュプレックスエラー修正を提供するために、第1の鎖の配列決定リードを第2の鎖の配列決定リードと比較することができる。本明細書に記載の実施形態は、各々のクローナルクラスターからの配列決定情報が、第1の鎖の配列決定リードおよび第2の鎖の配列決定リードの両方を提供するという点で、上述の変換効率に関連する課題のいくつかを克服する。
II.ヘアピンアダプターを切断するための方法および試薬の実施形態
従来から、ポリメラーゼが、自己相補性のハイブリダイズされた領域を置換しなければならないため、ヘアピンが連結したアダプター-核酸複合体の配列決定反応は困難な場合がある。例えば、アダプター-核酸複合体の自己相補性部分の密な近接性に起因して、第1の鎖および第2の鎖の相補性部分の融点(Tm)が高いため、かかる構造のポリメラーゼに基づく配列決定は、物理的に連結された鎖のデュプレックス配列決定データの提供にとって障壁のままである。
従来から、ポリメラーゼが、自己相補性のハイブリダイズされた領域を置換しなければならないため、ヘアピンが連結したアダプター-核酸複合体の配列決定反応は困難な場合がある。例えば、アダプター-核酸複合体の自己相補性部分の密な近接性に起因して、第1の鎖および第2の鎖の相補性部分の融点(Tm)が高いため、かかる構造のポリメラーゼに基づく配列決定は、物理的に連結された鎖のデュプレックス配列決定データの提供にとって障壁のままである。
上述のように、本技術の態様は、第1および第2の鎖の核酸配列を配列決定反応中に互いに分離することができるように、切断可能部位またはモチーフを有するヘアピンアダプターの使用を組み込んでいる。
特定の実施形態では、図6に示されるように、ヘアピンアダプターは(例えば、一本鎖部分または二本鎖部分の中に)、酵素(例えば、エンドヌクレアーゼ)または他の切断促進因子(化学プロセスまたは非酵素的プロセス)によるヘアピンDNA分子のその後の切断を可能にする切断モチーフを含み得る。図7を参照すると、一実施形態では、ヘアピンアダプターの一本鎖(例えば、リンカー領域)は、エンドヌクレアーゼ(例えば、制限部位エンドヌクレアーゼ、標的エンドヌクレアーゼなど)を使用して切断され得る。例えば、図7は、エンドヌクレアーゼ(例えば、制限酵素)によって消化可能な一本鎖切断部位(例えば、核酸配列)を示す。図3A~5Eおよび7を参照して、二本鎖複合体のブリッジ増幅の後、切断部位で切断するために、酵素を導入する(例えば、フローセルを通して流す)ことができる。いくつかの実施形態では、非効率的な切断が望まれる(例えば、残存するいくつかの切断されていない二本鎖複合体が、ブリッジ増幅の第2のラウンドの起点となることが望ましい)。いくつかの実施形態では、酵素反応は、二本鎖複合体の一部が切断され、一部が切断されないままであるように、時間または濃度を制御することができる。例えば、ヘアピンDNA分子の大部分(ただし全てではない)を切断するために、制限された量の制限酵素を、官能基化された表面を横切るように流すことができる。別の実施形態では、制限酵素は、ヘアピンDNA分子の大部分(ただし全てではない)を切断するために、制限された時間にわたって、表面を横切るように流すことができる。別の実施形態では、ヘアピンDNA分子の大部分(ただし全てではない)を切断するために、大部分が触媒的に活性であり、少量が触媒的に不活性である酵素の混合物を、官能基化された表面を横切るように流すことができる。
図8Aおよび8Bは、クローナルクラスター中の二本鎖複合体の非効率的な切断を可能にする様式で、ヘアピンアダプターのリンカードメイン中に切断可能部位を提供するための別の実施形態を示す。この例では、エンドヌクレアーゼの導入の前に、本方法は、ヘアピンアダプターのリンカードメインに少なくとも部分的に相補的なオリゴヌクレオチドの導入を提供することができる。図8Bに示されるように、導入されたオリゴヌクレオチドのハイブリダイゼーションは、エンドヌクレアーゼによる切断を防止する(例えば、抗切断モチーフ「AC」を提供する)ことができる。ハイブリダイゼーションしたオリゴを有しない二本鎖複合体(図8A)は、エンドヌクレアーゼによる切断の影響を受けやすいままである。酵素切断の前に(またはエンドヌクレアーゼ導入と同時に)、配列決定するフローセルに提供されるオリゴヌクレオチドの濃度は、フローセル上の各々のクローナルクラスター内に所望な数の切断されていない複合体を残すように拡張可能であり得る。例えば、抗切断モチーフを含有する少量のオリゴヌクレオチド配列を、官能基化された表面を横切るように流し、各々のクローナルクラスター中のヘアピンDNA分子の(例えば、制限された量の)サブセットへのオリゴヌクレオチド配列のハイブリダイゼーションを起こすことができる(図8B)。(ヘアピン内に切断モチーフを含有する)ヘアピンDNA分子の大部分は、抗切断モチーフを含有するオリゴヌクレオチド配列にハイブリダイズされない。したがって、(抗切断モチーフを含有するオリゴヌクレオチド配列にハイブリダイズされていない)ヘアピンDNA分子の大部分は、ヘアピンアダプター内の一本鎖切断モチーフで切断され得る。抗切断モチーフを含有するオリゴヌクレオチド配列にハイブリダイズされるヘアピンDNA分子は、酵素によって切断されないままである。
一実施形態では、ヘアピンアダプター内の切断モチーフは、メチル化されていてもよく、オリゴヌクレオチド配列内の抗切断モチーフは、メチル化されていなくてもよい。次いで、メチル化されたDNAのみを切断する酵素を、官能基化された表面を横切るように流すことができる。別の実施形態では、ヘアピンアダプター内の切断モチーフは、メチル化されていなくてもよく、オリゴヌクレオチド配列内の抗切断モチーフは、メチル化されていてもよい。次いで、メチル化されていないDNAのみを切断する酵素を、官能基化された表面を横切るように流すことができる。別の実施形態では、オリゴヌクレオチド配列内の抗切断モチーフは、ヘアピンDNA分子の切断を防止する側鎖であり得る。別の実施形態では、オリゴヌクレオチド配列内の抗切断モチーフは、ヘアピンDNA分子の切断を防止する嵩高い付加物であり得る。別の実施形態では、オリゴヌクレオチド配列内の抗切断モチーフは、酵素がヘアピンDNA分子を切断することを防止する1つ以上のミスマッチであり得る。別の実施形態では、抗切断モチーフは、切断を防止する脱塩基部位であり得る。別の実施形態では、抗切断モチーフは、切断を防止するヌクレオチド類似体であり得る。別の実施形態では、抗切断モチーフは、切断を防止するペプチド-核酸結合であり得る。
図9A~9Bに示される別の実施形態では、ヘアピンアダプターのリンカードメインに少なくとも部分的に相補的な配列を含むオリゴヌクレオチドを提供して、リンカードメインとハイブリダイズさせ、切断部位/モチーフを形成することができる。例えば、二本鎖切断部位を認識するエンドヌクレアーゼを使用して、ハイブリダイズしたオリゴヌクレオチドによって提供される二本鎖領域を含むリンカー領域を切断することができる(図9A)。例えば、オリゴヌクレオチドを、官能基化された表面を横切るように流し、ヘアピンアダプターのリンカー領域へのオリゴヌクレオチド配列のハイブリダイゼーションを起こさせ、それによって、ヘアピンDNA分子の一部に二本鎖切断モチーフを提供することができる(図9A)。一実施形態では、オリゴヌクレオチド配列とヘアピンDNA分子との間のハイブリダイゼーションが、ヘアピンDNA分子の一部(ただし全てではない)で起こるように、制限された量のオリゴヌクレオチドを、官能基化された表面を横切るように流すことができる。別の実施形態では、オリゴヌクレオチド配列とヘアピンDNA分子との間のハイブリダイゼーションが、ヘアピンDNA分子の一部(ただし全てではない)で起こるように、オリゴヌクレオチドを、制限された時間にわたって、官能基化された表面を横切るように流すことができる。オリゴヌクレオチド配列にハイブリダイズし、それによって切断モチーフを提供するヘアピンDNA分子は、官能基化された表面にわたってエンドヌクレアーゼを流した後に切断される。切断モチーフを含有するオリゴヌクレオチド配列にハイブリダイズしていないヘアピンDNA分子は、切断されないままである。
さらに別の実施形態では、図10A~10Bに示されるように、ヘアピンアダプターのリンカードメインに少なくとも部分的に相補的な配列を含むオリゴヌクレオチドのプールを提供して、リンカードメインとハイブリダイズさせることができる。オリゴヌクレオチドのプールは、ハイブリダイズされると、切断部位/モチーフ(例えば、好適なエンドヌクレアーゼのためのもの)を提供するオリゴヌクレオチドのサブセットを含むことができる(図10A)。オリゴヌクレオチドのプールは、ハイブリダイズされると、抗切断モチーフを提供する(および/または例えば、エンドヌクレアーゼによる部位認識を破壊することによって切断を予防する)オリゴヌクレオチドのサブセットを含むこともできる(図10B)。一例では、オリゴヌクレオチドのプールを、官能基化された表面を横切るように流すことができる。切断モチーフを含有するオリゴヌクレオチド配列にハイブリダイズしたヘアピンDNA分子は、切断され、抗切断モチーフを含有するオリゴヌクレオチド配列にハイブリダイズしたヘアピンDNA分子は、切断されないままである。一実施形態では、オリゴヌクレオチドの1つのサブセットは、メチル化されていてもよく、オリゴヌクレオチドの第2のサブセットは、メチル化されていなくてもよい。一実施形態では、次いで、メチル化されたDNAのみを切断する酵素を、官能基化された表面を横切るように流すことができる。別の実施形態では、メチル化されていないDNAのみを切断する酵素を、官能基化された表面を横切るように流すことができる。別の実施形態では、抗切断モチーフを提供するオリゴヌクレオチドは、ヘアピンDNA分子の切断を防止する側鎖を含み得る。別の実施形態では、オリゴヌクレオチド配列内の抗切断モチーフは、ヘアピンDNA分子の切断を防止する嵩高い付加物であり得る。別の実施形態では、オリゴヌクレオチド配列内の抗切断モチーフは、酵素がヘアピンDNA分子を切断することを防止する1つ以上のミスマッチであり得る。別の実施形態では、抗切断モチーフは、切断を防止する脱塩基部位であり得る。別の実施形態では、抗切断モチーフは、切断を防止するヌクレオチド類似体であり得る。別の実施形態では、抗切断モチーフは、切断を防止するペプチド-核酸結合であり得る。当業者は、選択されたエンドヌクレアーゼまたは他の酵素による切断を防止するか、または促進するオリゴヌクレオチドのサブセットを提供するための他の生化学的手段を認識するだろう。
なおさらなる実施形態では、図11Aおよび11Bに示されるように、二本鎖核酸複合体のクローナルコピーの一部の非効率的な切断は、触媒的に活性な酵素の部分(縞模様、図11A)と、触媒的に不活性な酵素の部分(ドット付きの黒色、図11B)とを有するエンドヌクレアーゼの混合されたプールの使用によって達成することができる。
いくつかの実施形態では、エンドヌクレアーゼは、標的化エンドヌクレアーゼであるか、または標的化エンドヌクレアーゼを含む。いくつかの実施形態では、標的化エンドヌクレアーゼは、認識部位または認識部位付近でDNAを切断する制限エンドヌクレアーゼ(すなわち、制限酵素)(例えば、EcoRI、BamHI、XbaI、HindIII、AluI、AvaiI、BsaJI、BstNI、DsaV、Fnu4HI、HaeIII、MaeIII、NlaIV、NSil、MspJI、FspEI、NaeI、Bsu36I、NotI、HinFI、Sau3AI、PvuII、SmaI、HgaI、AluI、EcoRVなど)のうちの少なくとも1つであるか、またはそれらのうちの少なくとも1つを含む。いくつかの制限エンドヌクレアーゼの列挙は、印刷された形態およびコンピュータ可読形態の両方で入手可能であり、多くの商業的な供給業者(例えば、New England Biolabs、Ipswich、MA)によって提供される。当業者は、任意の制限エンドヌクレアーゼが本技術の様々な実施形態に従って使用され得ることを理解するだろう。他の実施形態では、標的化エンドヌクレアーゼは、リボ核酸タンパク質複合体、例えば、CRISPR関連(Cas)酵素/ガイドRNA複合体(例えば、Cas9またはCpf1)またはCas9様酵素のうちの少なくとも1つであるか、またはこれらのうちの少なくとも1つを含む。他の実施形態では、標的化エンドヌクレアーゼは、ホーミングエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALENおよび/またはメガヌクレアーゼ(例えば、メガTALヌクレアーゼなど)、アルゴノートヌクレアーゼ、またはそれらの組み合わせであるか、またはそれらを含む。いくつかの実施形態では、標的化エンドヌクレアーゼは、Cas9またはCPF1、またはそれらの誘導体を含む。別の実施形態では、ヌクレアーゼは、フォーク形状の核酸領域(例えば、FEN1)で切断することができる。いくつかの実施形態では、1つより多い(例えば、2、3、4、5、6、7、8、9、10以上の)標的化エンドヌクレアーゼが使用されてもよい。
いくつかの実施形態では、切断部位は、標的化エンドヌクレアーゼ(例えば、CRISPRまたはCRISPR様エンドヌクレアーゼ)または他のチューナブルエンドヌクレアーゼのためのユーザ向け認識配列であるか、またはそれらを含む。いくつかの実施形態では、核酸物質を切断することは、酵素消化、酵素切断、一本の鎖の酵素切断、両鎖の酵素切断、修飾核酸の組み込みの後、一方の鎖または両方の鎖の切断を引き起こす酵素処理、複製を遮断するヌクレオチドの組み込み、連鎖停止剤の組み込み、光開裂可能なリンカーの組み込み、ウラシルの組み込み、リボース塩基の組み込み、8-オキソ-グアニン付加物の組み込み、制限エンドヌクレアーゼの使用、リボ核酸タンパク質エンドヌクレアーゼ(例えば、Cas酵素、例えば、Cas9またはCPF1)の使用、または他のプログラマブルエンドヌクレアーゼ(例えば、ホーミングエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALEN、メガヌクレアーゼ(例えば、メガTALヌクレアーゼ)、アルゴノートヌクレアーゼなど)、およびそれらの任意の組み合わせのうちの少なくとも1つを含んでいてもよい。
標的化エンドヌクレアーゼ(例えば、CRISPR関連リボ核酸タンパク質複合体、例えば、Cas9またはCpf1、ホーミングヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALEN、メガTALヌクレアーゼ、アルゴノートヌクレアーゼ、および/またはそれらの誘導体)を使用して、核酸物質の標的化部分を選択的に切断することができる。いくつかの実施形態では、標的化エンドヌクレアーゼは、例えば、熱安定性、塩耐性および/またはpH耐性の向上、または特異性または代替のPAM部位認識の向上、またはより高い結合親和性を提供するために、修飾されていてもよい(例えば、アミノ酸置換を有する)。他の実施形態では、標的化エンドヌクレアーゼは、ビオチン化されてもよく、ストレプトアビジンと融合されてもよく、かつ/または他の親和性に基づく(例えば、ベイト/プレイ)技術が組み込まれてもよい。特定の実施形態では、標的化エンドヌクレアーゼは、変化した認識部位特異性を有していてもよい(例えば、変化したPAM部位特異性を有するSpCas9バリアント)。他の実施形態では、標的化エンドヌクレアーゼは、核酸物質の標的化部分に結合すると切断が起こらないように、触媒的に不活性であってもよい。いくつかの実施形態では、標的化エンドヌクレアーゼは、核酸物質の標的化部分の一本鎖を切断するように修飾され(例えば、ニッカーゼバリアント)、それによって核酸物質中にニックを生成する。CRISPRに基づく標的化エンドヌクレアーゼは、本明細書でさらに論じられ、標的化エンドヌクレアーゼの使用のさらに詳細な非限定的な例を提供する。なお、かかる標的化エンドヌクレアーゼにまつわる命名法は、依然として流動的である。本明細書での目的のために、切断される核酸配列を再定義するように核酸配列が修飾され得るような核酸配列を含むエンドヌクレアーゼを一般的に意味するように、「CRISPRに基づく」という用語を使用する。Cas9およびCPF1は、現在使用されているかかる標的化エンドヌクレアーゼの例であるが、さらに多くが自然界の異なる場所に存在すると見られ、かかる標的化され、容易に調整可能な様々な異なるヌクレアーゼの利用可能性は、今後数年で急速に成長することが予測される。例えば、Casl2a、Casl3、CasXなどは、様々な実施形態での使用が企図される。同様に、これらの特性を向上させるか、または改変するためのこれらの酵素の複数の操作されたバリアントが、利用可能になりつつある。本明細書では、ここに記載される開示内容と同様の目的を達成するために、本明細書で明示的に記載されていないか、またはまだ発見されていない実質的に機能的に類似した標的化エンドヌクレアーゼの使用を明示的に企図する。
種々の制限エンドヌクレアーゼ(すなわち、酵素)のいずれかが使用され得ることが具体的に企図される。一般的に、制限酵素は、典型的には、特定の細菌/他の原核生物によって産生され、DNAの所与のセグメント中の特定の配列で、特定の配列付近またはその間で切断する。
制限酵素が、特定の部位で、またはこれに代えて、切断のための制限部位を作成するために作られる部位で切断するために選択されることは当業者には明らかであろう。いくつかの実施形態では、制限酵素は、合成酵素である。いくつかの実施形態では、制限酵素は、合成酵素ではない。いくつかの実施形態では、本明細書で使用される制限酵素は、酵素自体のゲノム中に1つ以上の変化を導入するように修飾されている。いくつかの実施形態では、制限酵素は、DNAの所与の部分内の定義された配列間で、二本鎖の切断部を生成する。
いくつかの実施形態に従って、任意の制限酵素(例えば、I型、II型、III型および/またはIV型)を使用してもよいが、以下は、使用可能な制限酵素の非限定的なリストを表す。AluI、ApoI、AspHI、BamHI、BfaI、BsaI、CfrI、DdeI、DpnI、DraI、EcoRI、EcoRII、EcoRV、HaeII、HaeIII、HgaI、HindII、HindIII、HinFI、HPYCH4III、KpnI、MamI、MNLI、MseI、MstI、MstII、NcoI、NdeI、NotI、Pad、PstI、PvuI、PvuII、RcaI、RsaI、SacI、SacII、SalI、Sau3AI、SeaI、SmaI、SpeI、SphI、StuI、TaqI、XbaI、XhoI、XhoII、XmaI、XmaII、およびそれらの任意の組み合わせ。適切な制限酵素の広範ではあるが網羅的ではないリストは、公的に入手可能なカタログまたはインターネット上に見出すことができる(例えば、New England Biolabs、Ipswich、MA、U.S.A.で入手可能)。同じ目的を達成することができる核酸分子のホスホジエステル骨格切断を標的とするために単独で、または組み合わせて使用可能な種々の酵素、リボザイムまたは他の核酸修飾酵素が、上述のリストに含まれていなくてもよく、またはまだ発見されていなくてもよいことが、当業者によって理解される。種々の核酸修飾酵素は、(例えば、リアーゼ活性を有する酵素によって)切断可能な隣接する核酸配列のさらなる修飾(例えば、脱塩基部位を生成するため)を標的とするために使用可能な塩基修飾(例えば、CpGメチル化)を認識することができる。したがって、切断の実質的な配列特異性は、DNAまたはRNA修飾の認識に基づいて達成することができ、これを単独で、または標的化核酸の断片化を達成するための標的化エンドヌクレアーゼと組み合わせて使用することができる。切断促進因子の他の実施形態は、非酵素促進因子を含むことができる。例えば、pH変化または加水分解を使用して、切断部位で切断することができる。光切断法も、この骨格を破壊するためのアプローチである。例えば、ヘアピンアダプター配列中の修飾ヌクレオチドの組み込み、または光感受性部分を有する相補的もしくは部分的に相補的なオリゴヌクレオチドのハイブリダイゼーションは、(例えば、光に曝露すると)反対側の鎖を切断する他の化学プロセスまたは酵素プロセスのための認識部位を作製することができる。
いくつかの実施形態(例えば、上述したものなど)では、切断部位Cは、物理的に連結したアダプター-分子複合体が、表面上で自己ハイブリダイズされた構成である場合に提供される(例えば、図6、7、8A、9A、10A、および11A)。なおさらなる実施形態では、図12A~12Cに示されるように、切断部位(cleavage cite)Cは、物理的に連結した核酸複合体または二本鎖ブリッジ増幅される構成である場合に、切断促進因子による切断に利用可能である。例えば、切断部位Cは、表面上の「ブリッジ」にわたる二本鎖形成後であるが、変性の前に、二本鎖構成によって提供される二本鎖モチーフである(図12A)。切断されると、第1の鎖の配列アンプリコンは、依然として表面に結合したまま、第2の鎖のアンプリコンから分離される(図12B)。結合していないアンプリコンの変性および除去の後(図12C)、第1の鎖および第2の鎖の両方の一本鎖アンプリコンは、結合したままであり、配列決定するために利用可能である。一実施形態では、第1および第2の鎖のアンプリコンの配列決定は、図5Dおよび5Eに関して記載したものなどの配列決定反応を用いて進めることができる。
アダプター
上述のように、アダプター分子は、「Y」字型、「U」字型、「ヘアピン」形状であってもよく、またはそれらを含んでいてもよく、バブル(例えば、非相補的である配列の一部)、または他の特徴を有し得る。「U」字型または「ヘアピン」形状のアダプターは、標的二本鎖核酸分子の第1の鎖を同一の分子の第2の鎖に連結または接続するリンカードメインを有するアダプターを指し得る。特定のヘアピンアダプターは、例えば、切断可能なヘアピンアダプターであってもよく、および/または修飾ヌクレオチドまたは非標準的ヌクレオチド、制限部位、またはインビトロで構造もしくは機能を操作するための他の特徴を含んでいてもよい。
上述のように、アダプター分子は、「Y」字型、「U」字型、「ヘアピン」形状であってもよく、またはそれらを含んでいてもよく、バブル(例えば、非相補的である配列の一部)、または他の特徴を有し得る。「U」字型または「ヘアピン」形状のアダプターは、標的二本鎖核酸分子の第1の鎖を同一の分子の第2の鎖に連結または接続するリンカードメインを有するアダプターを指し得る。特定のヘアピンアダプターは、例えば、切断可能なヘアピンアダプターであってもよく、および/または修飾ヌクレオチドまたは非標準的ヌクレオチド、制限部位、またはインビトロで構造もしくは機能を操作するための他の特徴を含んでいてもよい。
アダプター分子は、末端を有する様々な核酸物質にライゲーションしてもよい。例えば、アダプター分子は、T-オーバーハング、A-オーバーハング、CG-オーバーハング、複数ヌクレオチドオーバーハング(本明細書では「粘着末端」または「粘着オーバーハング」とも呼ばれる)、または既知のヌクレオチド長(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個以上のヌクレオチド)を有する一本鎖オーバーハング領域、脱ヒドロキシル化塩基、核酸物質の平滑末端にライゲーションするのに適したものであってもよく、分子の末端は、標的の5’が脱リン酸化されているか、または別の状況で従来のライゲーションから遮断されていた。他の実施形態では、アダプター分子は、ライゲーション部位の5’鎖に脱リン酸化または他のライゲーションを防ぐ修飾を含んでいてもよい。後者の2つの実施形態では、このような戦略は、ライブラリ断片またはアダプター分子の二量体化を防ぐのに有用な場合がある。
アダプターのライゲーションドメインを、エンドヌクレアーゼ(例えば、制限エンドヌクレアーゼ、標的化エンドヌクレアーゼなど)酵素で切断して、調製されたライブラリ断片中の3’「A」オーバーハングとのライゲーションに適合する3’「T」オーバーハングを残すことができる。特定の実施形態では、得られたライゲーションドメインは、伸長した伸長鎖の3’末端上の単一塩基対チミン(T)オーバーハングであるが、他の実施形態では、平滑末端、または異なる種類、または3’もしくは5’オーバーハングの「粘着」末端であり得る。この特定の例では、「切断(CUT)」は、配列特異的エンドヌクレアーゼ、例えば、制限酵素を使用して、本質的にライゲーション可能な末端を作製する方法で切断することを暗示している。他の実施形態では、切断後、末端トランスフェラーゼなどのさらなる酵素処理または化学処理により、ライゲーション可能な末端を作製することができる。
図2Aに戻って参照すると、ライゲーション可能な末端は、T-オーバーハングとして示されるが、ライゲーション可能な末端が、種々の形態のいずれか、例えば、特に、平滑末端、A-3’オーバーハング、1個のヌクレオチド3’オーバーハング、2個のヌクレオチド3’オーバーハング、3個のヌクレオチド3’オーバーハング、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個以上のヌクレオチド3’オーバーハング、1個のヌクレオチド5’オーバーハング、2個のヌクレオチド5’オーバーハング、3個のヌクレオチド5’オーバーハング、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個以上のヌクレオチド5’オーバーハングを含む「粘着」末端であってもよいことは当業者には明らかであろう(図2B)。ライゲーション部位の5’塩基は、リン酸化されていてもよく、3’塩基は、ヒドロキシル基を有していてもよく、またはいずれかが単独で、または組み合わせて、脱リン酸化または脱水されていてもよく、またはさらに化学修飾され、任意選択で、後の時点まで、片方の鎖のライゲーションを防ぐためにライゲーションまたは片方の鎖の向上を促進してもよい。
いくつかの実施形態では、アダプター分子は、捕捉部分にライゲーションした所望な標的核酸分子を単離するのに適した捕捉部分を含んでいてもよい。
アダプター配列は、一本鎖の配列、二本鎖の配列、相補的な配列、非相補的な配列、部分的に相補的な配列、非対称配列、プライマーに結合する配列、フローセル配列、ライゲーション配列またはアダプター分子によって提供される他の配列を意味し得る。特定の実施形態では、アダプター配列は、オリゴヌクレオチドに対する相補体によって増幅するために使用される配列を意味し得る。
いくつかの実施形態では、提供される方法および組成物は、少なくとも1つのアダプター配列(例えば、核酸物質の5’末端および3’末端の各々に1つの、2つのアダプター配列)を含む。いくつかの実施形態では、提供される方法および組成物は、2つ以上のアダプター配列(例えば、3、4、5、6、7、8、9、10個以上)を含んでいてもよい。いくつかの実施形態では、アダプター配列の少なくとも2つは、互いに(例えば、配列によって)異なる。いくつかの実施形態では、各アダプター配列は、アダプター配列が互いに(例えば、配列によって)異なる。いくつかの実施形態では、少なくとも1つのアダプター配列は、少なくとも1つの他のアダプター配列の少なくとも一部に少なくとも部分的に非相補的である(例えば、少なくとも1つのヌクレオチドによって非相補的である)。
いくつかの実施形態では、アダプター配列は、少なくとも1つの非標準的ヌクレオチドを含む。いくつかの実施形態では、非標準的ヌクレオチドは、脱塩基部位、ウラシル、テトラヒドロフラン、8-オキソ-7,8-ジヒドロ-2’デオキシアデノシン(8-オキソ-A)、8-オキソ-7,8-ジヒドロ-2’-デオキシグアノシン(8-オキソ-G)、デオキシイノシン、5’ニトロインドール、5-ヒドロキシメチル-2’-デオキシシチジン、イソ-シトシン、5’-メチル-イソシトシン、もしくはイソグアノシン、メチル化ヌクレオチド、RNAヌクレオチド、リボースヌクレオチド、8-オキソ-グアニン、光開裂性リンカー、ビオチン化ヌクレオチド、デスチオビオチンヌクレオチド、チオール修飾ヌクレオチド、アクリダイト修飾ヌクレオチド、イソ-dC、イソdG、2’-O-メチルヌクレオチド、イノシンヌクレオチド、ロックド核酸、ペプチド核酸、5メチルdC、5-ブロモデオキシウリジン、2,6-ジアミノプリン、2-アミノプリンヌクレオチド、脱塩基ヌクレオチド、5-ニトロインドールヌクレオチド、アデニル化ヌクレオチド、アジドヌクレオチド、ジゴキシゲニンヌクレオチド、I-リンカー、5’ヘキシニル修飾ヌクレオチド、5-オクタジイニルdU、光開裂性スペーサー、非光開裂性スペーサー、クリックケミストリー適合性修飾ヌクレオチド、およびこれらの任意の組み合わせから選択される。
いくつかの実施形態では、アダプター配列は、磁気特性を有する部分(すなわち、磁気部分)を含む。いくつかの実施形態では、この磁気特性は、常磁性である。アダプター配列が磁気部分を含む(例えば、磁気部分を含むアダプター配列にライゲーションされた核酸物質)いくつかの実施形態では、磁場が適用される場合、磁気部分を含むアダプター配列は、磁気部分を含まないアダプター配列(例えば、磁気部分を含まないアダプター配列にライゲーションされた核酸物質)から実質的に分離される。
いくつかの実施形態では、少なくとも1つのアダプター配列は、SMIに対して5’に位置する。いくつかの実施形態では、少なくとも1つのアダプター配列は、SMIに対して3’に位置する。
いくつかの実施形態では、アダプター配列は、1つ以上のリンカードメインを含んでいてもよい。いくつかの実施形態では、リンカードメインは、ヌクレオチドで構成されていてもよい。いくつかの実施形態では、リンカードメインは、少なくとも1つの修飾ヌクレオチドまたは非ヌクレオチド分子(例えば、本開示の他の箇所に記載されるもの)を含んでいてもよい。いくつかの実施形態では、リンカードメインは、ループであってもよく、またはループを含んでいてもよい。
いくつかの実施形態では、二本鎖核酸物質の各鎖の片方または両方の末端上のアダプター配列は、さらに、SDEを提供する1つ以上の要素を含んでいてもよい。いくつかの実施形態では、SDEは、アダプター配列内に含まれる非対称プライマー部位であってもよいか、またはこの部位を含んでいてもよい。
いくつかの実施形態では、アダプター配列は、少なくとも1つのSDE、および少なくとも1つのライゲーションドメイン(すなわち、少なくとも1つのリガーゼの活性に修正可能なドメイン、例えば、リガーゼの活性を通して核酸物質にライゲーションするのに好適なドメイン)であってもよいか、またはこれらを含んでいてもよい。いくつかの実施形態では、5’から3’に、アダプター配列は、プライマー結合部位、SDEおよびライゲーションドメインであってもよいか、またはこれらを含んでいてもよい。
デュプレックス配列決定アダプターを合成するための様々な方法は、例えば、米国特許第9,752,188号、国際特許公開第2017/100441号および国際特許公開第PCT/US18/59908号(2018年11月8日に出願された)に既に記載されており、これらは全て、参照によりそれらの全体が本明細書に組み込まれる。
デュプレックス配列決定アダプターを合成するための様々な方法は、既に記載されている(例えば、参照により本明細書に組み込まれる、米国特許第9,752,188号および米国特許第PCT/US19/17908号)。例えば、一実施形態では、1つのオリゴヌクレオチドを、非相補的な領域で、縮重または半縮重ヌクレオチド配列を含有する別のオリゴヌクレオチドにハイブリダイズすることができる。次いで、ハイブリダイズされたオリゴヌクレオチドは、化学的に連結されていてもよく、またはハイブリダイズされたときに、「ループ」形状または「U」字型(ヘアピンアダプター)を形成する、連続したオリゴヌクレオチドの2つの部分であってもよい。次いで、ヌクレオチドを重合させることができる酵素を使用して、一本鎖の縮重領域または半縮重領域をコピーして、相補体が合成されるようにすることができる。これにより、相補的な二本鎖の縮重配列または半縮重配列が生成され、デュプレックス配列決定中に少なくとも1つのSMI要素として機能し得る。アダプター分子上のライゲーション部位は、この伸長生成物から、酵素操作または化学操作によって(例えば、制限消化、ポリメラーゼの末端トランスフェラーゼ活性、または当該技術分野で既知である他の酵素または任意の他の方法によって)修飾されてもよい。
プライマー
いくつかの実施形態では、以下の特性:(1)高い標的特異性がある、(2)多重化が可能である、(3)強力かつバイアスが最小の増幅を示す、のうちの少なくとも1つを有する1つ以上のPCRプライマーが、本技術の態様に従う様々な実施形態における使用が企図される。多くの従来の試験および商業製品は、従来のPCR-CEについての特定のこれらの基準を満たすプライマー混合物を設計している。しかしながら、これらのプライマー混合物は、MPSと共に使用するのに常に適しているわけではないことを注記しておく。実際に、高度に多重化されたプライマー混合物を開発することは、挑戦的なことであり、時間がかかるプロセスであり得る。好都合に、IlluminaおよびPromegaの両者は、様々な標準的および非標準的なSTRおよびSNP遺伝子座の強力で効率的な増幅を示すIlluminaプラットフォームのための多重互換性プライマー混合物を近年開発した。これらのキットは、PCRを使用して、配列決定前にその標的領域を増幅するため、ペアエンド配列決定データにおける各リードの5’末端は、DNAを増幅するために使用されるPCRプライマーの5’末端に対応する。いくつかの実施形態では、提供される方法および組成物は、均一な増幅を確実にするように設計されたプライマーを含み、これは、様々な反応濃度、融解温度、および二次構造とプライマー内/プライマー間の相互作用を最小限にすること、を伴っていてもよい。MPSアプリケーション用の高度に多重化されたプライマーの最適化について、多くの技術が記載されてきた。特に、これらの技術は、当該技術分野で十分に記載されているように、しばしばampliseq法として知られている。
いくつかの実施形態では、以下の特性:(1)高い標的特異性がある、(2)多重化が可能である、(3)強力かつバイアスが最小の増幅を示す、のうちの少なくとも1つを有する1つ以上のPCRプライマーが、本技術の態様に従う様々な実施形態における使用が企図される。多くの従来の試験および商業製品は、従来のPCR-CEについての特定のこれらの基準を満たすプライマー混合物を設計している。しかしながら、これらのプライマー混合物は、MPSと共に使用するのに常に適しているわけではないことを注記しておく。実際に、高度に多重化されたプライマー混合物を開発することは、挑戦的なことであり、時間がかかるプロセスであり得る。好都合に、IlluminaおよびPromegaの両者は、様々な標準的および非標準的なSTRおよびSNP遺伝子座の強力で効率的な増幅を示すIlluminaプラットフォームのための多重互換性プライマー混合物を近年開発した。これらのキットは、PCRを使用して、配列決定前にその標的領域を増幅するため、ペアエンド配列決定データにおける各リードの5’末端は、DNAを増幅するために使用されるPCRプライマーの5’末端に対応する。いくつかの実施形態では、提供される方法および組成物は、均一な増幅を確実にするように設計されたプライマーを含み、これは、様々な反応濃度、融解温度、および二次構造とプライマー内/プライマー間の相互作用を最小限にすること、を伴っていてもよい。MPSアプリケーション用の高度に多重化されたプライマーの最適化について、多くの技術が記載されてきた。特に、これらの技術は、当該技術分野で十分に記載されているように、しばしばampliseq法として知られている。
増幅
提供される方法および組成物は、様々な実施形態では、核酸物質(またはその一部、例えば、特定の標的領域または遺伝子座)を増幅し、増幅された核酸物質(例えば、アンプリコン産物のいくつかのメンバー)を形成する、少なくとも1つの増幅ステップを利用するか、または使用する。
提供される方法および組成物は、様々な実施形態では、核酸物質(またはその一部、例えば、特定の標的領域または遺伝子座)を増幅し、増幅された核酸物質(例えば、アンプリコン産物のいくつかのメンバー)を形成する、少なくとも1つの増幅ステップを利用するか、または使用する。
いくつかの実施形態では、核酸物質を増幅することは、第1のアダプター配列中に存在する配列に少なくとも部分的に相補的な少なくとも1つの一本鎖オリゴヌクレオチドを使用して、元の二本鎖核酸物質からの第1の核酸および第2の核酸の鎖の各々に由来する核酸物質を増幅するステップを含む。増幅ステップは、さらに、第2の一本鎖オリゴヌクレオチドを使用して、目的の各鎖を増幅することを含み、かかる第2の一本鎖オリゴヌクレオチドは、(a)目的の標的配列に少なくとも部分的に相補的であってもよいか、または(b)少なくとも1つの一本鎖オリゴヌクレオチドと第2の一本鎖オリゴヌクレオチドが、核酸物質を効果的に増幅する様式で配向されるように、第2のアダプター配列中に存在する配列に少なくとも部分的に相補的であってもよい。
いくつかの実施形態では、試料中の核酸物質を増幅することは、「管」(例えば、PCR管)中で、エマルジョン液滴、マイクロチャンバ、および上に記載の他の例または他の既知の容器内で、核酸物質を増幅することを含んでいてもよい。いくつかの実施形態では、核酸物質を増幅することは、2個以上の(例えば、3、4、5、6、7、8、9、10、20、30、40、50個以上の試料)物理的に分離した試料(例えば、管、液滴、チャンバ、容器など)において核酸物質を増幅することを含んでいてもよい。
任意の用途に適した増幅反応が、いくつかの実施形態に適合することが企図されるが、具体例として、いくつかの実施形態では、増幅ステップは、ポリメラーゼ連鎖反応(PCR)、ローリングサークル増幅(RCA)、多置換増幅(MDA)、等温増幅、エマルジョン内のポロニー増幅、表面、ビーズの表面、またはヒドロゲル内でのブリッジ増幅、およびそれらの任意の組み合わせ、であってもよいか、またはこれらを含んでいてもよい。
いくつかの実施形態では、ある表面上の増幅、例えば、フローセルの表面上のブリッジ増幅は、結合した核酸テンプレートのクラスターまたは複数のコピーを生成することを含む。特定の実施形態では、連結された第1および第2の鎖の核酸テンプレートを、フローセルの表面上でブリッジ増幅させ、例えば、複数のクローナルクラスターを生成することができ、各々のクローナルクラスターが、元の二本鎖核酸分子の元の第1の鎖および第2の鎖の両方に由来する核酸テンプレートコピーを含む。クラスター中のクローナルコピーのいくつかは、順方向であり、残りは逆由来である。まず、順方向のコピーまたは逆方向のコピーのいずれかが切断され、除去されるときに、配列決定反応を進めることができる。
いくつかの実施形態では、核酸物質を増幅することは、核酸物質の各鎖の5’末端および3’末端上のアダプター配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む。いくつかの実施形態では、核酸物質を増幅することは、目的の標的領域または標的配列(例えば、ゲノム配列、ミトコンドリア配列、プラスミド配列、合成的に生成された標的核酸など)に少なくとも部分的に相補的な少なくとも1つの一本鎖オリゴヌクレオチドと、アダプター配列のある領域(例えば、プライマー部位)に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドと、の使用を含む。
一般に、安定した増幅(例えば、PCR増幅)は、反応条件に大きく依存し得る。マルチプレックスPCRは、例えば、緩衝液の組成、一価または二価カチオンの濃度、洗剤濃度、クラウディング剤(すなわち、PEG、グリセロールなど)の濃度、プライマー濃度、プライマーTm、プライマー設計、プライマーGC含有量、プライマー修飾ヌクレオチド特性およびサイクリング条件(すなわち、温度および伸長時間、ならびに温度変化速度)に対して感受性な場合がある。緩衝液の条件の最適化は、困難かつ時間がかかるプロセスである場合がある。いくつかの実施形態では、増幅反応は、既に知られている増幅プロトコルに従って、緩衝液、プライマープール濃度、およびPCR条件、のうちの少なくとも1つを使用してもよい。いくつかの実施形態では、新しい増幅プロトコルが作成されてもよく、かつ/または増幅反応の最適化が使用されてもよい。具体例として、いくつかの実施形態では、PCR最適化キット、例えば、Promega(登録商標)のPCR最適化キットを使用してもよく、このキットは、様々なPCR用途(例えば、マルチプレックス、リアルタイム、GCリッチおよび阻害剤耐性増幅)に部分的に最適化された、いくつかの予め配合された緩衝液を含む。これらの予め配合された緩衝液は、様々なMg2+濃度およびプライマー濃度、ならびにプライマープール比で迅速に補充することができる。これに加え、いくつかの実施形態では、様々なサイクリング条件(例えば、サーマルサイクリング)が、評価および/または使用されてもよい。特定の実施形態が、特定の所望の用途に適切であるかどうかを評価する際に、様々な態様の中でも、特異性、ヘテロ接合性遺伝子座についてのアレルカバレッジ比、遺伝子座間のバランスおよび深度、のうちの1つ以上を評価してもよい。増幅成功の測定は、産物のDNA配列決定、ゲルまたはキャピラリー電気泳動またはHPLCまたは他のサイズ分離方法と、その後の断片の視覚化による産物の評価、二本鎖核酸結合色素または蛍光プローブを使用する融解曲線分析、質量分析法または当該技術分野で知られている他の方法を含んでいてもよい。
いくつかの実施形態では、少なくとも1つの増幅するステップは、少なくとも1つの非標準的ヌクレオチドであるか、またはそれを含む少なくとも1つのプライマーを含む。いくつかの実施形態では、非標準的ヌクレオチドは、ウラシル、メチル化ヌクレオチド、RNAヌクレオチド、リボースヌクレオチド、8-オキソ-グアニン、ビオチン化ヌクレオチド、ロックド核酸、ペプチド核酸、高Tm核酸バリアント、アレルを区別する核酸バリアント、本明細書の他箇所に記載の任意の他のヌクレオチドもしくはリンカーバリアント、またはこれらの任意の組み合わせから選択される。
核酸物質
種類
様々な実施形態に従って、様々な核酸物質のうちいずれかを使用してもよい。いくつかの実施形態では、核酸物質は、カノニカル糖-リン酸骨格内のポリヌクレオチドに対する少なくとも1つの修飾を含んでいてもよい。いくつかの実施形態では、核酸物質は、核酸物質中の任意の塩基内に少なくとも1つの修飾を含んでいてもよい。例えば、非限定的な例として、いくつかの実施形態では、核酸物質は、二本鎖DNA、一本鎖DNA、二本鎖RNA、一本鎖RNA、ペプチド核酸(PNA)、ロックド核酸(LNA)のうちの少なくとも1つであるか、またはこれらを含む。
種類
様々な実施形態に従って、様々な核酸物質のうちいずれかを使用してもよい。いくつかの実施形態では、核酸物質は、カノニカル糖-リン酸骨格内のポリヌクレオチドに対する少なくとも1つの修飾を含んでいてもよい。いくつかの実施形態では、核酸物質は、核酸物質中の任意の塩基内に少なくとも1つの修飾を含んでいてもよい。例えば、非限定的な例として、いくつかの実施形態では、核酸物質は、二本鎖DNA、一本鎖DNA、二本鎖RNA、一本鎖RNA、ペプチド核酸(PNA)、ロックド核酸(LNA)のうちの少なくとも1つであるか、またはこれらを含む。
供給源
核酸物質は、任意の種々の供給源に由来していてもよいことが企図される。例えば、いくつかの実施形態では、核酸物質は、少なくとも1つの対象(例えば、ヒトまたは動物対象)または他の生体源由来の試料から提供される。いくつかの実施形態では、核酸物質は、保存/貯蔵された試料から提供される。いくつかの実施形態では、試料は、血液、血清、汗、唾液、脳脊髄液、粘液、子宮洗浄液、膣スワブ、鼻スワブ、口腔スワブ、組織擦過物、毛髪、指紋、尿、便、硝子体液、腹腔洗浄液、痰、気管支洗浄、口腔洗浄、胸腔洗浄、胃洗浄、胃液、胆汁、膵管洗浄、胆管洗浄、総胆管洗浄、胆嚢液、滑液、感染した創傷、感染していない創傷、考古学的試料、法医学的試料、水試料、組織試料、食品試料、バイオリアクター試料、植物試料、爪あか、精液、前立腺液、卵管洗浄、細胞を含まない核酸、細胞内の核酸、メタゲノミクス試料、移植された異物の洗浄、鼻洗浄、腸液、上皮のブラッシング、上皮洗浄、組織生検、検死試料、壊死試料、臓器試料、ヒト識別アンプル、人工的に作られた核酸試料、合成遺伝子試料、核酸データ貯蔵試料、腫瘍組織のうちの少なくとも1つ、およびこれらの任意の組み合わせであるか、またはこれらを含む。他の実施形態では、試料は、微生物、植物系生物、または任意の集められた環境試料(例えば、水、土、考古学的試料など)のうちの少なくとも1つであるか、またはこれらを含む。
核酸物質は、任意の種々の供給源に由来していてもよいことが企図される。例えば、いくつかの実施形態では、核酸物質は、少なくとも1つの対象(例えば、ヒトまたは動物対象)または他の生体源由来の試料から提供される。いくつかの実施形態では、核酸物質は、保存/貯蔵された試料から提供される。いくつかの実施形態では、試料は、血液、血清、汗、唾液、脳脊髄液、粘液、子宮洗浄液、膣スワブ、鼻スワブ、口腔スワブ、組織擦過物、毛髪、指紋、尿、便、硝子体液、腹腔洗浄液、痰、気管支洗浄、口腔洗浄、胸腔洗浄、胃洗浄、胃液、胆汁、膵管洗浄、胆管洗浄、総胆管洗浄、胆嚢液、滑液、感染した創傷、感染していない創傷、考古学的試料、法医学的試料、水試料、組織試料、食品試料、バイオリアクター試料、植物試料、爪あか、精液、前立腺液、卵管洗浄、細胞を含まない核酸、細胞内の核酸、メタゲノミクス試料、移植された異物の洗浄、鼻洗浄、腸液、上皮のブラッシング、上皮洗浄、組織生検、検死試料、壊死試料、臓器試料、ヒト識別アンプル、人工的に作られた核酸試料、合成遺伝子試料、核酸データ貯蔵試料、腫瘍組織のうちの少なくとも1つ、およびこれらの任意の組み合わせであるか、またはこれらを含む。他の実施形態では、試料は、微生物、植物系生物、または任意の集められた環境試料(例えば、水、土、考古学的試料など)のうちの少なくとも1つであるか、またはこれらを含む。
修飾
様々な実施形態に従って、核酸物質は、特定の提供される方法または組成物が使用される用途に応じて、任意の特定のステップの前に、実質的に同時に、またはその後に、1つ以上の修飾を受けてもよい。
様々な実施形態に従って、核酸物質は、特定の提供される方法または組成物が使用される用途に応じて、任意の特定のステップの前に、実質的に同時に、またはその後に、1つ以上の修飾を受けてもよい。
いくつかの実施形態では、修飾は、核酸物質の少なくとも一部の修復であってもよいか、またはそれを含んでいてもよい。核酸修復の任意の用途に適した方法が、いくつかの実施形態に適合すると企図されるものの、特定の例示的な方法および組成物を以下および実施例に記載する。
非限定的な例として、いくつかの実施形態では、DNA修復酵素、例えば、ウラシル-DNAグリコシラーゼ(UDG)、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)、および8-オキソグアニンDNAグリコシラーゼ(OGGI)を利用して、DNA損傷(例えば、インビトロでのDNA損傷)を修正することができる。いくつかの実施形態では、これらのDNA修復酵素は、例えば、DNAから損傷した塩基を除去するグリコシラーゼである。例えば、UDGは、(シトシンの自発的な加水分解によって生じる)シトシン脱アミノ化から得られるウラシルを除去し、FPGは、8-オキソ-グアニン(例えば、活性酸素種から得られる共通のDNA病変)を除去する。FPGは、リアーゼ活性も有し、脱塩基部位に1塩基ギャップを生成することができる。かかる脱塩基部位は、例えば、ポリメラーゼがテンプレートをコピーすることができないため、その後にPCRによって増幅することができない。したがって、このようなDNA損傷修復酵素の使用は、真の変異を有していないが、配列決定およびデュプレックス配列分析の後に別の状況でエラーとして検出されない可能性がある損傷DNAを効果的に除去することができる。
さらなる実施形態では、本明細書に記載の処理ステップから生成される配列決定リードをさらにフィルタリングして、アーチファクトに最もなりやすいリードの末端をトリミングすることによって、偽の変異を除外することができる。例えば、DNA断片化は、二本鎖分子の末端に一本鎖部分を生成することができる。これらの一本鎖部分は、末端修復中に末端平滑化されてもよい(例えばKlenowによって)。いくつかの場合に、ポリメラーゼは、これらの末端修復した領域においてコピーの誤りを起こし、「偽の二重鎖分子」の生成を引き起こす。これらのアーチファクトは、配列決定されたときに真の変異であると見えてしまう場合がある。これらの末端修復機構の結果としてのエラーは、生じる可能性がある変異を除外するために配列決定リードの末端をトリミングすることによって、配列決定後の分析から除外することができ、それにより、偽の変異の数を減らすことができる。いくつかの実施形態では、配列決定リードのかかるトリミングは、自動的に達成することができる(例えば、通常の処理ステップ)。いくつかの実施形態では、変異頻度は、断片末端領域について評価することができ、変異の閾値レベルが断片末端領域で観察される場合、DNA断片の二本鎖コンセンサス配列リードを生成する前に、配列決定リードのトリミングを行うことができる。
デュプレックス配列決定方法のいくつかの実施形態は、エラー修正のための切断可能なヘアピンアダプターの使用と適合する、PCRに基づく標的化濃縮戦略を提供する。例えば、配列決定のためのリンクされたテンプレートの分割PCR(Separated PCRs of Linked Templates for sequencing、「SPLiT-DS」)方法のステップを利用する配列決定濃縮戦略も、本明細書に記載する実施形態のうちの1つ以上を使用して、予め濃縮された核酸物質から利益を得ることができる。SPLiT-DSは、元々、国際特許公開第2018/175997号に記載されており、その全体が参照により本明細書に組み込まれる。SPLiT-DS手法は、上に記載したのと同様の様式で、標準的なデュプレックス配列決定ライブラリ構築プロトコルに関して、断片化された二本鎖核酸物質(例えば、DNA試料由来)を分子バーコードで標識する(例えば、タグ化する)ことから開始されてもよい。いくつかの実施形態では、二本鎖核酸物質は、断片化されていてもよい(例えば、無細胞DNA、損傷DNAなど)。しかし、他の実施形態では、種々のステップは、超音波などの機械的な剪断、または他のDNA切断方法(例えば、本明細書にさらに記載されるもの)を用いる核酸物質の断片化を含んでいてもよい。断片化された二本鎖核酸物質を標識する態様は、末端修復および3’-dAテーリングを含んでいてもよく、特定の用途で必要とされる場合、その後に、二本鎖核酸断片と、デュプレックス配列決定アダプター(例えば、切断可能なヘアピンアダプター、Y字型アダプターなど)とをライゲーションすることを含んでいてもよい。他の実施形態では、元の核酸分子の両方の鎖からの固有に関連する情報のための内因性SMI配列、または外因性SMI配列と内因性SMI配列の組み合わせも、第1の鎖および第2の鎖の物理的連結と組み合わせて使用することができる。二本鎖核酸物質へのアダプター分子のライゲーションの後、本方法は、増幅(例えば、PCR増幅、ローリングサークル増幅、複数置換増幅、等温増幅、ブリッジ増幅、表面結合増幅など)に続いてもよい。
試薬を用いたキット
本技術の態様は、さらに、デュプレックス配列決定方法の様々な態様を実施するためのキットを包含する(本明細書では「DSキット」とも呼ばれる)。いくつかの実施形態では、キットは、核酸抽出、核酸ライブラリ調製、増幅(例えば、PCR、ブリッジ増幅)、連結した核酸複合体の切断、および配列決定について、本明細書に開示される方法または方法ステップのうちの1つ以上を実施するための説明書と共に、様々な試薬を含んでいてもよい。一実施形態では、キットは、配列決定データ(例えば、生の配列決定データ、配列決定リードなど)を分析するためのコンピュータプログラム製品(例えば、コンピュータ上で実行するためのコード化されたアルゴリズム、1つ以上のアルゴリズムを実行するためのクラウドベースのサーバへのアクセスコード)をさらに含み、本技術の態様に従って、例えば、試料に関連するバリアント対立遺伝子、変異などを決定し得る。キットには、DNA標準、ならびに陽性および陰性対照の他の形態が含まれ得る。
本技術の態様は、さらに、デュプレックス配列決定方法の様々な態様を実施するためのキットを包含する(本明細書では「DSキット」とも呼ばれる)。いくつかの実施形態では、キットは、核酸抽出、核酸ライブラリ調製、増幅(例えば、PCR、ブリッジ増幅)、連結した核酸複合体の切断、および配列決定について、本明細書に開示される方法または方法ステップのうちの1つ以上を実施するための説明書と共に、様々な試薬を含んでいてもよい。一実施形態では、キットは、配列決定データ(例えば、生の配列決定データ、配列決定リードなど)を分析するためのコンピュータプログラム製品(例えば、コンピュータ上で実行するためのコード化されたアルゴリズム、1つ以上のアルゴリズムを実行するためのクラウドベースのサーバへのアクセスコード)をさらに含み、本技術の態様に従って、例えば、試料に関連するバリアント対立遺伝子、変異などを決定し得る。キットには、DNA標準、ならびに陽性および陰性対照の他の形態が含まれ得る。
いくつかの実施形態では、DSキットは、試料調製(例えば、組織操作、DNA抽出、DNA断片化)、核酸ライブラリ調製、増幅、切断およびシーケンサー上での表面処理ステップ、ならびに配列決定の様々な態様を行うのに好適な試薬または試薬の組み合わせ(例えば、酵素、dNTP、洗浄緩衝液など)を含んでいてもよい。例えば、DSキットは、任意選択で、1つ以上のDNA抽出試薬(例えば、緩衝液、カラムなど)および/または組織抽出試薬を含んでいてもよい。任意選択で、DSキットは、さらに、例えば、物理的手段(例えば、音響剪断または超音波処理を容易にするための管、ネブライザユニットなど)または酵素的手段(例えば、無作為または半無作為のゲノム剪断のための酵素および適切な反応酵素)によって、二本鎖DNAを断片化するための1つ以上の試薬またはツールを含んでいてもよい。例えば、キットは、標的化された消化のための酵素(例えば、制限エンドヌクレアーゼ、CRISPR/CasエンドヌクレアーゼおよびRNAガイド、ならびに/または他のエンドヌクレアーゼ)、二本鎖フラグメンターゼカクテル、DNAの断片を主に二本鎖にするため、および/または一本鎖DNAを破壊するための一本鎖DNase酵素(例えば、マングビーンヌクレアーゼ、SIヌクレアーゼ)のうちの1つ以上を含む二本鎖DNAを酵素的に断片化するためのDNA断片化試薬と、かかる酵素反応を容易にするための適切な緩衝液および溶液とを含んでいてもよい。
一実施形態では、DSキットは、デュプレックス配列決定プロセスのステップを行うのに好適な試料から核酸配列ライブラリを調製して、試料中の二本鎖核酸分子のエラーを修正した(例えば、高精度の)配列を生成するためのプライマーおよびアダプターを含む。例えば、キットは、リンカードメインを含むアダプター分子の少なくとも1つのプール(例えば、ヘアピンアダプター)、二本鎖部分および一本鎖部分を含むアダプター分子の少なくとも1つのプール(例えば、「Y」字型アダプター)、またはユーザがこれを作成するためのツール(例えば、一本鎖オリゴヌクレオチド)を含んでいてもよい。いくつかの実施形態では、アダプター分子のプールは、試料中の複数の核酸分子が、アダプター分子の接続後に、実質的に固有に標識され得るように、いずれか単独でまたはライゲーションされる断片の固有の特徴と組み合わせて、単一分子識別子(SMI)配列または好適な数の実質的に固有のSMI配列を含む。当業者は、分子タグ化において、「好適な」数のSMI配列を伴うものが、様々な特定の因子(入力DNA、DNA断片化の種類、断片の平均サイズ、ゲノム内で配列決定される配列の複雑性対反復性など)に応じて、数桁程度変化することを理解するだろう。任意選択で、アダプター分子は、さらに、1つ以上のPCRプライマー結合部位、1つ以上の配列決定プライマー結合部位、または両方を含む。別の実施形態では、DSキットは、SMI配列またはバーコードを含むアダプター分子を含まないが、その代わりに、従来のアダプター分子(例えば、Y字型の配列決定アダプターなど)を含み、様々な方法ステップは、分子配列リードを関連付けるために、内因性SMIおよび/または配列決定表面上の物理的位置を利用してもよい。いくつかの実施形態では、アダプター分子は、インデックスアダプターであり、および/またはインデックス配列を含む。他の実施形態では、インデックスは、キットに供給されるプライマーを使用して、PCRによる「尾部付加(tailing in)」を通して、特定の試料に付加される。
一実施形態では、DSキットは、非相補領域および/またはいくつかの他の鎖定義要素(SDE)を各々有するアダプター分子のセット、またはユーザがこれを生成するためのツール(例えば、一本鎖オリゴヌクレオチド)を含む。別の実施形態では、キットは、アダプター分子の少なくとも1つのセットを含み、アダプター分子の少なくともサブセットが、それぞれ、少なくとも1つのSMIと少なくとも1つのSDEとを含むか、またはこれらを生成するためのツールを含む。いくつかの実施形態では、アダプター分子のサブセットは、ライゲーション可能な末端(例えば、平滑末端、オーバーハング、実質的もしくは部分的に固有の粘着末端など)を有するように構成されてもよい。デュプレックス配列決定プロセスステップを行うのに好適な試料から核酸配列決定ライブラリを調製するためのプライマーおよびアダプターのさらなる特徴は、上に記載され、米国特許第9,752,188号、国際特許公開第2017/100441号および国際特許出願第PCT/US18/59908号(2018年11月8日出願)に開示され、これらは全て、参照によりそれらの全体が本明細書に組み込まれる。
一実施形態では、DSキットは、切断促進因子(例えば、酵素、非酵素溶液、光、ハイブリダイゼーションオリゴヌクレオチドなど)および抗切断促進因子(例えば、触媒的に不活性な酵素を含む酵素、ハイブリダイゼーションオリゴヌクレオチドなど)などの、配列決定表面上で生じる処理ステップのための試薬、および本方法の様々なステップを行うための他の洗浄溶液を含む。
これに加えて、キットは、さらに、例えば、Qubit(商標)蛍光光度計(Thermo Fisher Scientific、Waltham、MAから入手可能)と共に使用するためのSYBR(商標)greenまたはSYBR(商標)gold(Thermo Fisher Scientific、Waltham、MAから入手可能)など、あるいは好適な蛍光分光計またはリアルタイムPCR機もしくはデジタルドロップレットPCR機で使用するためのPicoGreen(商標)色素(Thermo Fisher Scientific、Waltham、MAから入手可能)などのDNA結合色素などのDNA定量材料を含んでいてもよい。他のプラットフォームでのDNA定量に適した他の試薬も企図される。さらなる実施形態は、核酸サイズ選択試薬(例えば、Solid Phase Reversible Immobilization(SPRI)磁気ビーズ、ゲル、カラム)、ベイト/プレイハイブリダイゼーションを用いた標的DNA捕捉のためのカラム、qPCR試薬(例えば、コピー数決定のための)、および/またはデジタルドロップレットPCR試薬のうちの1つ以上を含むキットを含む。いくつかの実施形態では、キットは、任意選択で、ライブラリ調製酵素(リガーゼ、ポリメラーゼ、エンドヌクレアーゼ、例えば、RNAインテロゲーションのための逆転写酵素)、dNTP、緩衝液、捕捉試薬(例えば、ビーズ、表面、コーティングされた管、カラムなど)、インデックスプライマー、増幅プライマー(PCRプライマー)および配列決定プライマーのうちの1つ以上を含んでいてもよい。いくつかの実施形態では、キットは、エラーを起こしやすいDNAポリメラーゼおよび/または高忠実度DNAポリメラーゼなどのDNA損傷の種類を評価するための試薬を含んでいてもよい。特定の条件(例えば、高GCリッチゲノム/標的)におけるPCRまたはライゲーション反応のために、さらなる添加剤および試薬が企図される。
一実施形態では、キットは、さらに、試薬、例えば、ポリメラーゼ連鎖反応(PCR)プロセスを妨害するDNA配列のエラーを修復するDNAエラー修正酵素を含む(疾患を引き起こす変異の修復と対比して)。非限定的な例として、酵素は、他のグリコシラーゼ、リアーゼ、エンドヌクレアーゼおよびエキソヌクレアーゼなどの中で、特に、以下の、単機能性ウラシル-DNAグリコシラーゼ(hSMUG1)、ウラシル-DNAグリコシラーゼ(UDG)、N-グリコシラーゼ/AP-リアーゼNEIL1タンパク質(hNEIL1)、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)、8-オキソグアニンDNAグリコシラーゼ(OGG1)、ヒト脱プリン/脱ピリミジンエンドヌクレアーゼ(APE 1)、エンドヌクレアーゼIII(Endo III)、エンドヌクレアーゼIV(Endo IV)、エンドヌクレアーゼV(Endo V)、エンドヌクレアーゼVIII(Endo VIII)、T7エンドヌクレアーゼI(T7 Endo I)、T4ピリミジン二量体グリコシラーゼ(T4 PDG)、ヒト一本鎖選択的ヒトアルキルデニンDNAグリコシラーゼ(hAAG)などのうちの1つ以上を含み、これらを利用して、DNA損傷(例えば、インビトロまたはインビボでのDNA損傷)を修正することができる。これらのDNA修復酵素のいくつかは、例えば、DNAから損傷した塩基を除去するグリコシラーゼである。例えば、UDGは、(シトシンの自発的な加水分解によって生じる)シトシン脱アミノ化から得られるウラシルを除去し、FPGは、8-オキソ-グアニン(例えば、活性酸素種から得られる共通のDNA病変)を除去する。FPGは、リアーゼ活性も有し、脱塩基部位に1塩基ギャップを生成することができる。かかる脱塩基部位は、例えば、ポリメラーゼがテンプレートをコピーすることができないため、その後にPCRによって増幅することができない。したがって、かかるDNA損傷修復酵素および/またはここに列挙され、当該技術分野で既知の他のものを使用して、真の変異を有していないがそれ以外はエラーとして検出されない可能性がある損傷DNAを、効果的に除去することができる。
キットは、さらに、適切な対照、例えば、DNA増幅対照、核酸(テンプレート)定量対照、配列決定対照、類似の生物源(例えば、健常な対象)に由来する核酸分子を含んでいてもよい。いくつかの実施形態では、キットは、細胞の対照集合体を含んでいてもよい。したがって、キットは、対照を提供する好適な試薬(試験化合物、核酸、対照配列決定ライブラリなど)を含むことができ、希少な遺伝的バリアント(例えば、試料調製ステップに添加するか、または含めることができる疾患関連バリアント/変異を含む核酸分子)を含む試料について、プロトコルの確実性を決定する期待されるデュプレックス配列決定の結果を与える。いくつかの実施形態では、キットは、参照配列情報を含んでいてもよい。いくつかの実施形態では、キットは、細胞の集合体中または無細胞DNA試料中の1つ以上のDNAバリアントを識別するのに有用な配列情報を含んでいてもよい。一実施形態では、キットは、試料を運搬するための容器、試料を安定化するための保管材料、試料を凍結するための材料、対象試料中のDNAバリアントを検出するための分析用の細胞試料など、を含む。別の実施形態では、キットは、核酸汚染対照標準(例えば、試験生物または対象生物とは異なる生物におけるゲノム領域に対して親和性を有するハイブリダイゼーション捕捉プローブ)を含んでいてもよい。
キットは、さらに、PCRおよび配列決定緩衝液、希釈剤、対象試料抽出ツール(例えば、シリンジ、スワブなど)を含む、商業およびユーザの観点から望ましい材料を含む1つ以上の他の容器と、使用説明書を含む添付文書とを含んでいてもよい。これに加えて、ラベルが、上に記載のような使用のための指示書と共に、容器上に提供されてもよく、かつ/あるいはこの指示書および/または他の情報が、キットに含まれる添付書類、および/またはそれに提供されるウェブサイトアドレスを介して含まれていてもよい。キットは、例えば、試料管、プレートシーラー、マイクロ遠心分離管開口具、ラベル、磁気粒子分離器、フォームインサート、アイスパック、ドライアイスパック、断熱材など、実験器具も含んでいてもよい。
キットは、配列決定ライブラリの増幅に使用するための、事前にパッケージ化されたか、または用途に特有の官能基化された表面をさらに含んでいてもよい。一実施形態では、官能基化された表面は、その中で配列決定反応を行うのに好適な表面を含んでもよい。官能基化された表面は、配列決定ライブラリのブリッジ増幅に好適な結合したオリゴヌクレオチドで予め構成されていてもよい(例えば、表面は、1つ以上のアダプターセット中の配列ドメインに相補的な、分散した芝生状態の結合したオリゴヌクレオチドを含む)。一実施形態では、官能基化された表面は、以下に記載される配列決定システムで使用するように構成されたフローセルである。
キットは、さらに、電子計算デバイス(例えば、ラップトップ/デスクトップコンピュータ、タブレットなど)にインストール可能な、またはネットワーク(例えば、リモートサーバ、クラウドコンピューティング)を介してアクセス可能なコンピュータプログラム製品を含んでいてもよく、計算デバイスまたはリモートサーバは、デュプレックス配列決定分析ステップを含む操作を行うための命令を実行するように構成された1つ以上のプロセッサを備える。例えば、プロセッサは、生の配列決定リードまたは未分析配列決定リードを処理して、デュプレックス配列決定データを生成するための命令を実行するように構成されていてもよい。追加の実施形態では、コンピュータプログラム製品は、対象または試料の記録(例えば、特定の対象または試料もしくは試料群に関する情報)と、DNAの標的化領域に関する経験的に導き出された情報と、を含むデータベースを含んでいてもよい。コンピュータプログラム製品は、コンピュータ上で実行されるとき、本明細書に開示される方法のステップを行う、非一時的コンピュータ可読媒体に具現化される。
キットは、さらに、データ(例えば、配列決定データ、レポート、他のデータ)をアップロードし、ダウンロードするためのリモートサーバ(クラウドベースのサーバを含む)にアクセスするための命令および/またはアクセスコード/パスワードなど、またはローカルデバイスにインストールされるソフトウェアを含んでいてもよい。全ての計算作業は、リモートサーバで行われ、インターネット接続などを介してユーザ/キットユーザによってアクセスされてもよい。
キットは、本明細書に記載の方法および試薬との使用に最適化された配列決定システムとの使用に好適であり得る。例えば、配列決定システムおよび関連する配列決定試薬は、介在する処理ステップを提供する段階的配列決定反応を実行するように構成されていてもよい。一実施形態では、配列決定システムは、切断促進因子送達、抗切断促進因子送達、酵素溶液送達、オリゴヌクレオチド送達、洗浄緩衝液などのための送達システムを提供し得る。同様に、配列決定システムは、プロセシングステップ時間、温度、pH、濃度などのための適切な制御(例えば、手動、自動、半自動など)および内部プログラミングを含んでもよい。
本明細書に記載の様々な態様、実施形態、実施例などに加えて、本開示は、E1~E87と番号付けされた以下の例示的な態様(「E」)を含む。この態様のリストは、例示的なリストとして提示され、本出願は、これらの態様に限定されない。
E1.二本鎖標的核酸分子を配列決定する方法であって、本方法が、
(a)物理的に連結した核酸複合体を、ある表面上で増幅させて、順方向および逆方向の両方にその表面に結合した、物理的に連結した核酸複合体アンプリコンを生成することであって、物理的に連結した核酸複合体が、(i)二本鎖標的核酸分子、(ii)二本鎖標的核酸分子の第1の末端上にリンカードメインを含む第1のアダプター、ならびに(iii)二本鎖標的核酸分子の第2の末端上に二本鎖部分および一本鎖部分を有する第2のアダプターを含む、生成することと、
(b)(i)逆方向に表面に結合した物理的に連結した核酸複合体アンプリコン、または(ii)順方向に表面に結合した物理的に連結した核酸複合体アンプリコンのいずれかを除去することと、
(c)残存する結合した物理的に連結した核酸複合体アンプリコンの一部を切断して、一方の鎖からの情報を含む一本鎖アンプリコンのサブセット、および物理的に連結した核酸複合体アンプリコンのサブセットを提供することと、
(d)一本鎖アンプリコンのサブセットを配列決定し、二本鎖標的核酸分子の元の鎖に由来する配列決定リードを提供することと、
(e)表面上で、物理的に連結した核酸複合体アンプリコンのサブセットを増幅させることと、
(f)他方の方向にある物理的に連結した核酸複合体アンプリコンを除去することと、
(g)残存する結合した物理的に連結した核酸複合体アンプリコンを切断して、他方の鎖からの情報を含む一本鎖アンプリコンを提供することと、
(h)一本鎖アンプリコンを配列決定し、二本鎖標的核酸分子の他方の元の鎖に由来する配列決定リードを提供することと、を含む、方法。
E2.二本鎖標的核酸分子を配列決定する方法であって、本方法が、
(a)物理的に連結した核酸複合体を、ある表面上で増幅させて、その表面に結合した物理的に連結した核酸複合体アンプリコンのクラスターを生成することであって、物理的に連結した核酸複合体が、(i)二本鎖標的核酸分子、(ii)二本鎖標的核酸分子の一方の末端上にリンカードメインを含む第1のアダプター、ならびに(iii)二本鎖標的核酸分子の他方の末端上に二本鎖部分および一本鎖部分を有する第2のアダプターを含む、生成することと、
(b)(i)物理的に連結した核酸複合体アンプリコンの5’末端、または(ii)物理的に連結した核酸複合体アンプリコンの3’末端で表面に結合した、物理的に連結した核酸複合体アンプリコンのいずれかを除去することと、
(c)切断部位で、残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断して、二本鎖標的核酸分子の一方の元の鎖に由来する配列情報を含む一本鎖アンプリコンを提供することと、
(d)一本鎖アンプリコンを配列決定し、二本鎖標的核酸分子の一方の元の鎖に由来する配列決定リードを提供することと、を含む、方法。
E3.残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断することが、表面に結合した少なくとも1つの物理的に連結した核酸複合体アンプリコンを保存することを含む、E2の方法。
E4.
(e)表面上で、少なくとも1つの物理的に連結した核酸複合体アンプリコンを増幅させ、表面に結合した物理的に連結した核酸複合体アンプリコンのクラスターを再配置させることと、
(f)(b)で除去されない他方の方向にある物理的に連結した核酸複合体アンプリコンを除去することと、
(g)残存する結合した物理的に連結した核酸複合体アンプリコンを切断して、二本鎖標的核酸分子の他方の元の鎖に由来する情報を含む一本鎖アンプリコンを提供することと、
(h)一本鎖アンプリコンを配列決定し、二本鎖標的核酸分子の他方の元の鎖に由来する配列決定リードを提供することと、をさらに含む、E3の方法。
E5.一方の元の鎖からの配列リードを、他方の元の鎖からの配列リードと比較して、二本鎖標的核酸分子についてのコンセンサス配列を生成することをさらに含む、先行実施例のいずれか1つの方法。
E6.
一方の元の鎖からの配列リードおよび他方の元の鎖からの配列リードにおける配列変動を識別することであって、一方の元の鎖および他方の元の鎖からの配列変動が、一貫した配列変動である、識別すること、または
一方の元の鎖中で起こり、他方の元の鎖中で起こらない配列変動を除外するか、または考慮に入れないこと、
をさらに含む、E1~E4のいずれか1つの方法。
E7.
一方の元の鎖からの配列リードを、他方の元の鎖からの配列リードと比較することと、
一方の元の鎖からの配列リードと、他方の元の鎖からの配列リードとの間で一致しないヌクレオチド位置を識別することと、
一致しないと識別されたヌクレオチド位置を考慮に入れないか、除外するか、または修正することによって、二本鎖標的核酸分子のエラーを修正した配列を生成することと、
をさらに含む、E1~E4のいずれか1つの方法。
E8.各々が第1の鎖と第2の鎖とを含む二本鎖標的核酸分子の集合体を配列決定する方法であって、本方法が、
(a)複数の物理的に連結した核酸複合体を、ある表面上で増幅させて、複数のクローナルクラスターを生成することであって、各々のクローナルクラスターが、各々が第1の鎖のアンプリコンと第2の鎖のアンプリコンとを含む複数の物理的に連結した核酸複合体アンプリコンを含み、各々の物理的に連結した核酸複合体が、(i)集合体からの二本鎖標的核酸分子、(ii)二本鎖標的核酸分子の第1の末端に接続したリンカードメインを含む第1のアダプター、ならびに(iii)二本鎖標的核酸分子の第2の末端に接続した二本鎖部分および一本鎖部分を有する第2のアダプターを含む、生成することと、
(b)(i)逆方向または(ii)順方向に表面に結合した各々のクローナルクラスターからの物理的に連結した核酸複合体アンプリコンのいずれかを除去することと、
(c)(b)の後に残存する、残存する表面結合した物理的に連結した核酸複合体アンプリコンの一部を切断し、それによって、第1の鎖のアンプリコンおよび第2の鎖のアンプリコンを物理的に分離することと、
(d)結合していない物理的に分離された第1または第2の鎖のアンプリコンを除去することと、
(e)表面に結合した残存する物理的に分離された第1または第2の鎖のアンプリコンを配列決定して、表面上の各々のクローナルクラスターについて第1の鎖または第2の鎖の核酸配列リードを生成することと、
を含む、方法。
E9.残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断することが、表面に結合したクローナルクラスターのうちの少なくともいくつかにおいて、少なくとも1つの物理的に連結した核酸複合体アンプリコンを保存することを含む、E8の方法。
E10.
(f)クローナルクラスターの少なくともいくつかにおいて、表面上で、少なくとも1つの物理的に連結した核酸複合体アンプリコンを増幅させ、表面に結合した物理的に連結した核酸複合体アンプリコンのクローナルクラスターを再配置させることと、
(g)ステップ(b)とは他方の方向にある物理的に連結した核酸複合体アンプリコンを除去することと、
(h)結合していない物理的に分離された第1または第2の鎖のアンプリコンを除去することと、
(i)(h)の後に残存する、残存する結合した物理的に連結した核酸複合体アンプリコンを切断し、それによって、第1の鎖のアンプリコンと第2の鎖のアンプリコンを物理的に分離することと、
(j)表面に結合した残存する物理的に分離された第1または第2の鎖のアンプリコンを配列決定して、表面上の各々のクローナルクラスターについて第1の鎖または第2の鎖の核酸配列リードを生成することと、
をさらに含む、E9の方法。
E11.各々が第1の鎖と第2の鎖とを含む二本鎖標的核酸分子の集合体を配列決定する方法であって、本方法が、
(a)ある表面上に結合した複数の物理的に連結した核酸複合体を増幅させて、複数のクラスターを生成することであって、各々のクラスターが、元の二本鎖標的核酸分子を表す複数の物理的に連結した核酸複合体アンプリコンを含み、各々の物理的に連結した核酸複合体アンプリコンが、第1の鎖のアンプリコンと第2の鎖のアンプリコンとを含み、各々の物理的に連結した核酸複合体が、(i)一方の末端で第1の鎖と第2の鎖との間にリンカードメインを含む第1のアダプター、ならびに(ii)他方の末端で二本鎖部分および一本鎖部分を有する第2のアダプターに接続する集合体からの二本鎖標的核酸分子を含む、生成することと、
(b)表面結合した物理的に連結した核酸複合体アンプリコンを切断し、それによって、第1の鎖のアンプリコンおよび第2の鎖のアンプリコンを物理的に分離することと、
(c)結合していない物理的に分離された第1の鎖のアンプリコンおよび/または結合していない物理的に分離された第2の鎖のアンプリコンを除去し、表面に結合した残存するアンプリコンが、(i)物理的に分離された第1の鎖のアンプリコンおよび(ii)物理的に分離された第2の鎖のアンプリコンを含む、除去することと、
(d)表面に結合した物理的に分離された第1の鎖のアンプリコンを配列決定して、表面上の各々のクラスターについて第1の鎖の核酸配列リードを生成することと、
(e)表面に結合した物理的に分離された第2の鎖のアンプリコンを配列決定して、表面上の各々のクラスターについて第2の鎖の核酸配列リードを生成することと、
を含む、方法。
E12.表面上のクラスターの少なくともいくつかについて、第1の鎖の核酸配列リードを、第2の鎖の核酸配列リードと比較して、元の二本鎖標的核酸分子のエラーを修正した配列リードを生成することをさらに含む、E10またはE11の方法。
E13.固有の分子識別子(UMI)を使用して、集合体からの元の二本鎖標的核酸分子の第1の鎖の核酸配列リードを、同じ元の二本鎖標的核酸分子の第2の鎖の核酸配列リードに関連付けることをさらに含む、E10~E12のいずれか1つの方法。
E14.UMIが、表面上の物理的位置を含む、E13の方法。
E15.UMIが、タグ配列、分子特異的特徴、表面上のクラスター位置、またはそれらの組み合わせを含む、E14の方法。
E16.分子特異的特徴が、参照配列に対する核酸マッピング情報、二本鎖標的核酸分子の末端またはその付近の配列情報、二本鎖標的核酸分子の長さ、またはそれらの組み合わせを含む、E15の方法。
E17.鎖定義要素(SDE)を使用して、元の二本鎖標的核酸分子の第1の鎖の核酸配列リードを、同じ元の二本鎖標的核酸分子からの第2の鎖の核酸配列リードから区別することをさらに含む、E10~E16のいずれか1つの方法。
E18.SDEが、配列リード情報と、E10のステップ(e)およびステップ(j)、またはE11のステップ(d)および(e)との関連付けである、E17の方法。
E19.SDEが、アダプター配列の一部を含む、E17の方法。
E20.物理的に分離された第1の鎖のアンプリコンまたは第2の鎖のアンプリコンを配列決定することが、合成によって配列決定することを含む、E8~E19のいずれか1つの方法。
E21.第1のアダプターおよび第2のアダプターを、集合体中の複数の二本鎖標的核酸分子の各々にライゲーションすることによって、物理的に連結した核酸複合体を調製することと、
物理的に連結した核酸複合体を表面に提示することであって、複数の物理的に連結した核酸複合体が、複数の結合したオリゴヌクレオチドに対するハイブリダイゼーションを介して表面上に捕捉されるように、表面が、第2のアダプターの一本鎖部分に少なくとも部分的に相補的な複数の結合したオリゴヌクレオチドを有する、提示することと、
をさらに含む、E8~E20のいずれか1つの方法。
E22.提示するステップの前に、物理的に連結した核酸複合体を増幅させることをさらに含む、E21の方法。
E23.提示するステップの前に、物理的に連結した核酸複合体を増幅させることが、PCR増幅またはサークル増幅を含む、E22の方法。
E24.物理的に連結した核酸複合体が、表面上で順方向および逆方向の両方で捕捉される、E21~E23のいずれか1つの方法。
E25.(a)の増幅ステップが、ブリッジ増幅を含む、E8~E24のいずれか1つの方法。
E26.集合体中の二本鎖標的核酸分子の少なくともいくつかについて、
(i)第1の鎖からの配列リードを、第2の鎖からの配列リードと比較することと、
(ii)第1の鎖からの配列リードと、第2の鎖からの配列リードとの間で一致しないヌクレオチド位置を識別することと、
(iii)一致しない識別されたヌクレオチド位置を考慮に入れないか、除外するか、または修正することによって、二本鎖標的核酸分子のエラーを修正した配列リードを生成することと、
をさらに含む、E8~E25のいずれか1つの方法。
E27.第1のアダプターが、切断可能部位またはモチーフを含む、E1~E26のいずれか1つの方法。
E28.第1のアダプターおよび第2のアダプターが各々、配列決定プライマー結合部位、および任意選択で、単一分子識別子(SMI)配列を含む、E1~E27のいずれか1つの方法。
E29.第2のアダプターが、配列決定プライマー結合部位、増幅プライマー結合部位、インデックス配列、またはそれらの任意の組み合わせを含む、E1~E27のいずれか1つの方法。
E30.リンカードメインが、切断部位を含む、E1~E29のいずれか1つの方法。
E31.第1のアダプターが、切断可能ドメインを含む、E1~E29のいずれか1つの方法。
E32.第1のアダプターが、自己相補性ステム部分および一本鎖ヌクレオチドループ部分を含む、ヘアピンループ構造を含む、E1~E31のいずれか1つの方法。
E33.一本鎖ヌクレオチドループ部分が、切断可能ドメインを含む、E32の方法。
E34.ステム部分が、切断可能ドメインを含む、E32の方法。
E35.切断可能ドメインが、酵素認識部位を含む、E33またはE34の方法。
E36.酵素認識部位が、エンドヌクレアーゼ認識部位である、E35の方法。
E37.エンドヌクレアーゼが、制限酵素または標的化エンドヌクレアーゼである、E36の方法。
E38.第2のアダプターが、「Y」字型のアダプターである、E1~E37のいずれか1つの方法。
E39.Y字型のアダプターの一方または両方のアームが、表面に結合したオリゴヌクレオチドにハイブリダイズすることができる、E38の方法。
E40.第2のアダプターの一本鎖部分が、第1のプライマー結合部位を有する第1のアームと、第2のプライマー結合部位を有する第2のアームと、を含む、E1~E39のいずれか1つの方法。
E41.変性すると、物理的に連結した二本鎖核酸複合体が、5’から3’、または3’から5’に、第1のプライマー結合部位、第1の鎖、リンカードメインを含む第1のアダプター、第2の鎖、および第2のプライマー結合部位を含む、E40の方法。
E42.表面が、配列決定表面である、E1~E41のいずれか1つの方法。
E43.表面が、フローセルである、E1~E42のいずれか1つの方法。
E44.表面が、ビーズの表面である、E1~E43のいずれか1つの方法。
E45.増幅が、PCR増幅、等温増幅、ポロニー増幅、クラスター増幅、およびブリッジ増幅からなる群から選択される、E1~E44のいずれか1つの方法。
E46.増幅が、表面上のブリッジ増幅である、E1~E45のいずれか1つの方法。
E47.複数の第1の鎖のアンプリコンおよび/または複数の第2の鎖のアンプリコンのうちの1つ以上が、順方向に表面に結合する、E8~E46のいずれか1つの方法。
E48.複数の第1の鎖のアンプリコンおよび/または複数の第2の鎖のアンプリコンのうちの1つ以上が、逆方向に表面に結合する、E8~E46のいずれか1つの方法。
E49.(a)の増幅の前に、表面の上に、複数の物理的に連結した二本鎖核酸複合体を流すことをさらに含む、E8~E48のいずれか1つの方法。
E50.表面が、第2のアダプターの1つ以上の領域に少なくとも部分的に相補的な複数の1つ以上の結合したオリゴヌクレオチドを含む、E1~E49のいずれか1つの方法。
E51.複数の1つ以上の結合したオリゴヌクレオチドが、第2のアダプターの一本鎖部分に少なくとも部分的に相補的である、E50の方法。
E52.物理的に連結した核酸複合体の第1の鎖および第2の鎖が、ステップ(a)において複数の増幅反応によって増幅され、表面上に物理的に連結した核酸複合体アンプリコンのクラスターを生成する、E1~E51のいずれか1つの方法。
E53.複数の物理的に連結した核酸複合体の各々の第1の鎖および第2の鎖が、ステップ(a)において増幅され、表面上に複数のクラスターを同時に生成する、E8~E52のいずれか1つの方法。
E54.結合した物理的に連結した核酸複合体アンプリコンの一部を切断することが、第1のアダプター中の切断可能部位を非効率的に切断することを含み、表面上の各々のクラスター内で、切断された核酸複合体および切断されていない核酸複合体の両方が生じる、E1~E8およびE12~E53のいずれか1つの方法。
E55.フローセル上の各々のクラスター内の全ての核酸複合体の切断されていない核酸複合体の比率が、1%、5%、10%、20%、30%、40%、45%、または50%である、E54の方法。
E56.切断された核酸複合体が、切断促進因子によって、第1のアダプターのリンカードメイン中の切断可能部位で切断される、E54またはE55の方法。
E57.切断が、部位指向性酵素反応である、E56の方法。
E58.切断促進因子が、エンドヌクレアーゼである、E56またはE57の方法。
E59.エンドヌクレアーゼが、制限部位エンドヌクレアーゼまたは標的化エンドヌクレアーゼである、E58の方法。
E60.切断促進因子が、リボ核酸タンパク質、Cas酵素、Cas9様酵素、メガヌクレアーゼ、転写活性化因子様エフェクターベースヌクレアーゼ(TALEN)、ジンクフィンガーヌクレアーゼ、アルゴノートヌクレアーゼ、またはそれらの組み合わせからなる群から選択される、E56またはE57の方法。
E61.切断促進因子が、CRISPR関連酵素を含む、E56またはE57の方法。
E62.切断促進因子が、Cas9、またはCPF1、またはそれらの誘導体を含む、E56またはE57の方法。
E63.切断促進因子が、ニッカーゼまたはニッカーゼバリアントを含む、E56またはE57の方法。
E64.切断促進因子が、化学プロセスを含む、E56の方法。
E65.表面上に残存する切断されていない核酸複合体の量が、部位指向性切断のために導入される切断促進因子の量もしくは濃度を制御することによって、または切断促進因子が部位指向性切断のために導入されている時間量を制御することによって、拡張することができる、E54~E64のいずれか1つの方法。
E66.切断されていない核酸複合体が、切断ステップの前または切断ステップの間に、抗切断促進因子の添加によって保護される、E54~E63のいずれか1つの方法。
E67.抗切断促進因子が、第1のアダプターのリンカードメイン中に抗切断モチーフを含む、E66の方法。
E68.切断可能部位が、第1のアダプターのリンカードメイン中に既に存在しており、抗切断モチーフが、第1のアダプターのリンカードメインに少なくとも部分的に相補的な配列を含むオリゴヌクレオチドのハイブリダイゼーションによって作製される、E67の方法。
E69.結合した物理的に連結した核酸複合体アンプリコンの一部を切断することが、
(i)抗切断促進因子を導入することと、
(ii)(i)の後、または(i)と同時のいずれかに、切断促進因子を導入することと、
をさらに含み、
抗切断促進因子との相互作用が、物理的に連結した核酸複合体アンプリコンを切断から保護する、E66~E68のいずれか1つの方法。
E70.切断可能部位が、第1のアダプターのリンカードメインに少なくとも部分的に相補的な配列を含むオリゴヌクレオチドのハイブリダイゼーションによって作製され、オリゴヌクレオチドとハイブリダイズしていない物理的に連結した核酸複合体アンプリコンが、切断されない、E54~E63のいずれか1つの方法。
E71.切断可能部位が、アダプターのリンカードメインに少なくとも部分的に相補的な配列を含む第1のオリゴヌクレオチドのハイブリダイゼーションによって作製され、抗切断モチーフが、アダプターのリンカードメインに少なくとも部分的に相補的な配列を含む第2のオリゴヌクレオチドのハイブリダイゼーションによって作製され、結合した物理的に連結した核酸複合体アンプリコンの一部を切断することが、
(i)第1および第2のオリゴヌクレオチドの混合物を導入することと、
(ii)切断促進因子を導入することと、
をさらに含む、E54~E63のいずれか1つの方法。
E72.第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチドのいずれかが、メチル化されている、E71の方法。
E73.ハイブリダイゼーションが、ハイブリダイゼーションのために導入されるオリゴヌクレオチドの量もしくは濃度を制御することによって、またはオリゴヌクレオチドがハイブリダイゼーションのために導入される時間量を制御することによって、拡張することができる、E70またはE71の方法。
E74.抗切断モチーフが、切断部位への接近を防止する嵩高い付加物または側鎖を有するオリゴヌクレオチド配列を含む、E67、E68またはE71~E73のいずれか1つの方法。
E75.抗切断モチーフが、切断促進因子が切断部位を認識することを防止する1つ以上のミスマッチを有するオリゴヌクレオチド配列を含む、E67、E68、またはE71~E73のいずれか1つの方法。
E76.抗切断モチーフが、ヌクレオシド類似体、脱塩基部位、ヌクレオチド類似体、およびペプチド-核酸結合を有するオリゴヌクレオチド配列のうちの1つ以上を含む、E67、E68、またはE71~E73のいずれか1つの方法。
E77.切断された核酸複合体が、触媒的に活性な酵素によって第1のアダプター中の切断可能部位で切断され、切断されていない核酸複合体が、触媒的に不活性な酵素によって第1のアダプター中の切断から保護される、E54~E63のいずれか1つの方法。
E78.切断部位が、第1のアダプターの自己相補性部分、または第1のアダプターの一本鎖部分にある、E54~E63のいずれかのいずれか1つの方法。
E79.切断部位が、物理的に連結した核酸複合体アンプリコンが表面上で自己ハイブリダイズされた構成である場合に、利用可能である、E78の方法。
E80.切断部位が、物理的に連結した核酸複合体アンプリコンが二本鎖ブリッジ増幅される構成である場合に、利用可能である、E54~E63のいずれか1つの方法。
E81.ステップ(a)の前に、1つ以上の標的化ゲノム領域を有する物理的に連結した核酸複合体を選択的に濃縮して、複数の濃縮された物理的に連結した核酸複合体を提供することをさらに含む、E8~E80のいずれか1つの方法。
E82.二本鎖核酸分子のエラーを修正したデュプレックス配列決定に使用することができるキットであって、本キットが、
配列決定プライマーの少なくとも1つのセットと、
リンカードメインを含む第1のアダプター分子のセットと、
増幅のために表面上に固定されるように構成された、二本鎖部分および一本鎖部分を含む第2のアダプター分子のセットと、
を含み、
プライマーおよびアダプター分子が、エラーを修正したデュプレックス配列決定実験に使用することができ、
生体試料から抽出された核酸のエラーを修正したデュプレックス配列決定を実施する際のキットの使用方法に関する説明書を含む、キット。
E83.切断促進因子をさらに含む、E82のキット。
E84.リンカードメインが、切断可能モチーフを有する、E82またはE83のキット。
E85.抗切断促進因子をさらに含む、E82~E84のいずれか1つのキット。
E86.コンピュータまたはリモートコンピューティングサーバ上で実行されるとき、試料中の1つ以上の二本鎖核酸分子についてのエラーを修正したデュプレックス配列決定リードを決定するためのステップを実行する、非一時的コンピュータ可読媒体に具現化されるコンピュータプログラム製品をさらに含む、E82~E85のいずれか1つのキット。
E87.配列決定システムであって、
共有結合したオリゴヌクレオチドを含む配列決定表面と、
配列決定試薬を配列決定表面に送達するための送達システムと、
切断促進因子を配列決定表面に送達するための送達システムと、
配列決定データに関連する情報を送信するためのコンピューティングネットワークであって、その情報が、生の配列決定データ、デュプレックス配列決定データ、および試料情報、のうちの1つ以上を含む、コンピューティングネットワークと、
を含む、配列決定システム。
E1.二本鎖標的核酸分子を配列決定する方法であって、本方法が、
(a)物理的に連結した核酸複合体を、ある表面上で増幅させて、順方向および逆方向の両方にその表面に結合した、物理的に連結した核酸複合体アンプリコンを生成することであって、物理的に連結した核酸複合体が、(i)二本鎖標的核酸分子、(ii)二本鎖標的核酸分子の第1の末端上にリンカードメインを含む第1のアダプター、ならびに(iii)二本鎖標的核酸分子の第2の末端上に二本鎖部分および一本鎖部分を有する第2のアダプターを含む、生成することと、
(b)(i)逆方向に表面に結合した物理的に連結した核酸複合体アンプリコン、または(ii)順方向に表面に結合した物理的に連結した核酸複合体アンプリコンのいずれかを除去することと、
(c)残存する結合した物理的に連結した核酸複合体アンプリコンの一部を切断して、一方の鎖からの情報を含む一本鎖アンプリコンのサブセット、および物理的に連結した核酸複合体アンプリコンのサブセットを提供することと、
(d)一本鎖アンプリコンのサブセットを配列決定し、二本鎖標的核酸分子の元の鎖に由来する配列決定リードを提供することと、
(e)表面上で、物理的に連結した核酸複合体アンプリコンのサブセットを増幅させることと、
(f)他方の方向にある物理的に連結した核酸複合体アンプリコンを除去することと、
(g)残存する結合した物理的に連結した核酸複合体アンプリコンを切断して、他方の鎖からの情報を含む一本鎖アンプリコンを提供することと、
(h)一本鎖アンプリコンを配列決定し、二本鎖標的核酸分子の他方の元の鎖に由来する配列決定リードを提供することと、を含む、方法。
E2.二本鎖標的核酸分子を配列決定する方法であって、本方法が、
(a)物理的に連結した核酸複合体を、ある表面上で増幅させて、その表面に結合した物理的に連結した核酸複合体アンプリコンのクラスターを生成することであって、物理的に連結した核酸複合体が、(i)二本鎖標的核酸分子、(ii)二本鎖標的核酸分子の一方の末端上にリンカードメインを含む第1のアダプター、ならびに(iii)二本鎖標的核酸分子の他方の末端上に二本鎖部分および一本鎖部分を有する第2のアダプターを含む、生成することと、
(b)(i)物理的に連結した核酸複合体アンプリコンの5’末端、または(ii)物理的に連結した核酸複合体アンプリコンの3’末端で表面に結合した、物理的に連結した核酸複合体アンプリコンのいずれかを除去することと、
(c)切断部位で、残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断して、二本鎖標的核酸分子の一方の元の鎖に由来する配列情報を含む一本鎖アンプリコンを提供することと、
(d)一本鎖アンプリコンを配列決定し、二本鎖標的核酸分子の一方の元の鎖に由来する配列決定リードを提供することと、を含む、方法。
E3.残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断することが、表面に結合した少なくとも1つの物理的に連結した核酸複合体アンプリコンを保存することを含む、E2の方法。
E4.
(e)表面上で、少なくとも1つの物理的に連結した核酸複合体アンプリコンを増幅させ、表面に結合した物理的に連結した核酸複合体アンプリコンのクラスターを再配置させることと、
(f)(b)で除去されない他方の方向にある物理的に連結した核酸複合体アンプリコンを除去することと、
(g)残存する結合した物理的に連結した核酸複合体アンプリコンを切断して、二本鎖標的核酸分子の他方の元の鎖に由来する情報を含む一本鎖アンプリコンを提供することと、
(h)一本鎖アンプリコンを配列決定し、二本鎖標的核酸分子の他方の元の鎖に由来する配列決定リードを提供することと、をさらに含む、E3の方法。
E5.一方の元の鎖からの配列リードを、他方の元の鎖からの配列リードと比較して、二本鎖標的核酸分子についてのコンセンサス配列を生成することをさらに含む、先行実施例のいずれか1つの方法。
E6.
一方の元の鎖からの配列リードおよび他方の元の鎖からの配列リードにおける配列変動を識別することであって、一方の元の鎖および他方の元の鎖からの配列変動が、一貫した配列変動である、識別すること、または
一方の元の鎖中で起こり、他方の元の鎖中で起こらない配列変動を除外するか、または考慮に入れないこと、
をさらに含む、E1~E4のいずれか1つの方法。
E7.
一方の元の鎖からの配列リードを、他方の元の鎖からの配列リードと比較することと、
一方の元の鎖からの配列リードと、他方の元の鎖からの配列リードとの間で一致しないヌクレオチド位置を識別することと、
一致しないと識別されたヌクレオチド位置を考慮に入れないか、除外するか、または修正することによって、二本鎖標的核酸分子のエラーを修正した配列を生成することと、
をさらに含む、E1~E4のいずれか1つの方法。
E8.各々が第1の鎖と第2の鎖とを含む二本鎖標的核酸分子の集合体を配列決定する方法であって、本方法が、
(a)複数の物理的に連結した核酸複合体を、ある表面上で増幅させて、複数のクローナルクラスターを生成することであって、各々のクローナルクラスターが、各々が第1の鎖のアンプリコンと第2の鎖のアンプリコンとを含む複数の物理的に連結した核酸複合体アンプリコンを含み、各々の物理的に連結した核酸複合体が、(i)集合体からの二本鎖標的核酸分子、(ii)二本鎖標的核酸分子の第1の末端に接続したリンカードメインを含む第1のアダプター、ならびに(iii)二本鎖標的核酸分子の第2の末端に接続した二本鎖部分および一本鎖部分を有する第2のアダプターを含む、生成することと、
(b)(i)逆方向または(ii)順方向に表面に結合した各々のクローナルクラスターからの物理的に連結した核酸複合体アンプリコンのいずれかを除去することと、
(c)(b)の後に残存する、残存する表面結合した物理的に連結した核酸複合体アンプリコンの一部を切断し、それによって、第1の鎖のアンプリコンおよび第2の鎖のアンプリコンを物理的に分離することと、
(d)結合していない物理的に分離された第1または第2の鎖のアンプリコンを除去することと、
(e)表面に結合した残存する物理的に分離された第1または第2の鎖のアンプリコンを配列決定して、表面上の各々のクローナルクラスターについて第1の鎖または第2の鎖の核酸配列リードを生成することと、
を含む、方法。
E9.残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断することが、表面に結合したクローナルクラスターのうちの少なくともいくつかにおいて、少なくとも1つの物理的に連結した核酸複合体アンプリコンを保存することを含む、E8の方法。
E10.
(f)クローナルクラスターの少なくともいくつかにおいて、表面上で、少なくとも1つの物理的に連結した核酸複合体アンプリコンを増幅させ、表面に結合した物理的に連結した核酸複合体アンプリコンのクローナルクラスターを再配置させることと、
(g)ステップ(b)とは他方の方向にある物理的に連結した核酸複合体アンプリコンを除去することと、
(h)結合していない物理的に分離された第1または第2の鎖のアンプリコンを除去することと、
(i)(h)の後に残存する、残存する結合した物理的に連結した核酸複合体アンプリコンを切断し、それによって、第1の鎖のアンプリコンと第2の鎖のアンプリコンを物理的に分離することと、
(j)表面に結合した残存する物理的に分離された第1または第2の鎖のアンプリコンを配列決定して、表面上の各々のクローナルクラスターについて第1の鎖または第2の鎖の核酸配列リードを生成することと、
をさらに含む、E9の方法。
E11.各々が第1の鎖と第2の鎖とを含む二本鎖標的核酸分子の集合体を配列決定する方法であって、本方法が、
(a)ある表面上に結合した複数の物理的に連結した核酸複合体を増幅させて、複数のクラスターを生成することであって、各々のクラスターが、元の二本鎖標的核酸分子を表す複数の物理的に連結した核酸複合体アンプリコンを含み、各々の物理的に連結した核酸複合体アンプリコンが、第1の鎖のアンプリコンと第2の鎖のアンプリコンとを含み、各々の物理的に連結した核酸複合体が、(i)一方の末端で第1の鎖と第2の鎖との間にリンカードメインを含む第1のアダプター、ならびに(ii)他方の末端で二本鎖部分および一本鎖部分を有する第2のアダプターに接続する集合体からの二本鎖標的核酸分子を含む、生成することと、
(b)表面結合した物理的に連結した核酸複合体アンプリコンを切断し、それによって、第1の鎖のアンプリコンおよび第2の鎖のアンプリコンを物理的に分離することと、
(c)結合していない物理的に分離された第1の鎖のアンプリコンおよび/または結合していない物理的に分離された第2の鎖のアンプリコンを除去し、表面に結合した残存するアンプリコンが、(i)物理的に分離された第1の鎖のアンプリコンおよび(ii)物理的に分離された第2の鎖のアンプリコンを含む、除去することと、
(d)表面に結合した物理的に分離された第1の鎖のアンプリコンを配列決定して、表面上の各々のクラスターについて第1の鎖の核酸配列リードを生成することと、
(e)表面に結合した物理的に分離された第2の鎖のアンプリコンを配列決定して、表面上の各々のクラスターについて第2の鎖の核酸配列リードを生成することと、
を含む、方法。
E12.表面上のクラスターの少なくともいくつかについて、第1の鎖の核酸配列リードを、第2の鎖の核酸配列リードと比較して、元の二本鎖標的核酸分子のエラーを修正した配列リードを生成することをさらに含む、E10またはE11の方法。
E13.固有の分子識別子(UMI)を使用して、集合体からの元の二本鎖標的核酸分子の第1の鎖の核酸配列リードを、同じ元の二本鎖標的核酸分子の第2の鎖の核酸配列リードに関連付けることをさらに含む、E10~E12のいずれか1つの方法。
E14.UMIが、表面上の物理的位置を含む、E13の方法。
E15.UMIが、タグ配列、分子特異的特徴、表面上のクラスター位置、またはそれらの組み合わせを含む、E14の方法。
E16.分子特異的特徴が、参照配列に対する核酸マッピング情報、二本鎖標的核酸分子の末端またはその付近の配列情報、二本鎖標的核酸分子の長さ、またはそれらの組み合わせを含む、E15の方法。
E17.鎖定義要素(SDE)を使用して、元の二本鎖標的核酸分子の第1の鎖の核酸配列リードを、同じ元の二本鎖標的核酸分子からの第2の鎖の核酸配列リードから区別することをさらに含む、E10~E16のいずれか1つの方法。
E18.SDEが、配列リード情報と、E10のステップ(e)およびステップ(j)、またはE11のステップ(d)および(e)との関連付けである、E17の方法。
E19.SDEが、アダプター配列の一部を含む、E17の方法。
E20.物理的に分離された第1の鎖のアンプリコンまたは第2の鎖のアンプリコンを配列決定することが、合成によって配列決定することを含む、E8~E19のいずれか1つの方法。
E21.第1のアダプターおよび第2のアダプターを、集合体中の複数の二本鎖標的核酸分子の各々にライゲーションすることによって、物理的に連結した核酸複合体を調製することと、
物理的に連結した核酸複合体を表面に提示することであって、複数の物理的に連結した核酸複合体が、複数の結合したオリゴヌクレオチドに対するハイブリダイゼーションを介して表面上に捕捉されるように、表面が、第2のアダプターの一本鎖部分に少なくとも部分的に相補的な複数の結合したオリゴヌクレオチドを有する、提示することと、
をさらに含む、E8~E20のいずれか1つの方法。
E22.提示するステップの前に、物理的に連結した核酸複合体を増幅させることをさらに含む、E21の方法。
E23.提示するステップの前に、物理的に連結した核酸複合体を増幅させることが、PCR増幅またはサークル増幅を含む、E22の方法。
E24.物理的に連結した核酸複合体が、表面上で順方向および逆方向の両方で捕捉される、E21~E23のいずれか1つの方法。
E25.(a)の増幅ステップが、ブリッジ増幅を含む、E8~E24のいずれか1つの方法。
E26.集合体中の二本鎖標的核酸分子の少なくともいくつかについて、
(i)第1の鎖からの配列リードを、第2の鎖からの配列リードと比較することと、
(ii)第1の鎖からの配列リードと、第2の鎖からの配列リードとの間で一致しないヌクレオチド位置を識別することと、
(iii)一致しない識別されたヌクレオチド位置を考慮に入れないか、除外するか、または修正することによって、二本鎖標的核酸分子のエラーを修正した配列リードを生成することと、
をさらに含む、E8~E25のいずれか1つの方法。
E27.第1のアダプターが、切断可能部位またはモチーフを含む、E1~E26のいずれか1つの方法。
E28.第1のアダプターおよび第2のアダプターが各々、配列決定プライマー結合部位、および任意選択で、単一分子識別子(SMI)配列を含む、E1~E27のいずれか1つの方法。
E29.第2のアダプターが、配列決定プライマー結合部位、増幅プライマー結合部位、インデックス配列、またはそれらの任意の組み合わせを含む、E1~E27のいずれか1つの方法。
E30.リンカードメインが、切断部位を含む、E1~E29のいずれか1つの方法。
E31.第1のアダプターが、切断可能ドメインを含む、E1~E29のいずれか1つの方法。
E32.第1のアダプターが、自己相補性ステム部分および一本鎖ヌクレオチドループ部分を含む、ヘアピンループ構造を含む、E1~E31のいずれか1つの方法。
E33.一本鎖ヌクレオチドループ部分が、切断可能ドメインを含む、E32の方法。
E34.ステム部分が、切断可能ドメインを含む、E32の方法。
E35.切断可能ドメインが、酵素認識部位を含む、E33またはE34の方法。
E36.酵素認識部位が、エンドヌクレアーゼ認識部位である、E35の方法。
E37.エンドヌクレアーゼが、制限酵素または標的化エンドヌクレアーゼである、E36の方法。
E38.第2のアダプターが、「Y」字型のアダプターである、E1~E37のいずれか1つの方法。
E39.Y字型のアダプターの一方または両方のアームが、表面に結合したオリゴヌクレオチドにハイブリダイズすることができる、E38の方法。
E40.第2のアダプターの一本鎖部分が、第1のプライマー結合部位を有する第1のアームと、第2のプライマー結合部位を有する第2のアームと、を含む、E1~E39のいずれか1つの方法。
E41.変性すると、物理的に連結した二本鎖核酸複合体が、5’から3’、または3’から5’に、第1のプライマー結合部位、第1の鎖、リンカードメインを含む第1のアダプター、第2の鎖、および第2のプライマー結合部位を含む、E40の方法。
E42.表面が、配列決定表面である、E1~E41のいずれか1つの方法。
E43.表面が、フローセルである、E1~E42のいずれか1つの方法。
E44.表面が、ビーズの表面である、E1~E43のいずれか1つの方法。
E45.増幅が、PCR増幅、等温増幅、ポロニー増幅、クラスター増幅、およびブリッジ増幅からなる群から選択される、E1~E44のいずれか1つの方法。
E46.増幅が、表面上のブリッジ増幅である、E1~E45のいずれか1つの方法。
E47.複数の第1の鎖のアンプリコンおよび/または複数の第2の鎖のアンプリコンのうちの1つ以上が、順方向に表面に結合する、E8~E46のいずれか1つの方法。
E48.複数の第1の鎖のアンプリコンおよび/または複数の第2の鎖のアンプリコンのうちの1つ以上が、逆方向に表面に結合する、E8~E46のいずれか1つの方法。
E49.(a)の増幅の前に、表面の上に、複数の物理的に連結した二本鎖核酸複合体を流すことをさらに含む、E8~E48のいずれか1つの方法。
E50.表面が、第2のアダプターの1つ以上の領域に少なくとも部分的に相補的な複数の1つ以上の結合したオリゴヌクレオチドを含む、E1~E49のいずれか1つの方法。
E51.複数の1つ以上の結合したオリゴヌクレオチドが、第2のアダプターの一本鎖部分に少なくとも部分的に相補的である、E50の方法。
E52.物理的に連結した核酸複合体の第1の鎖および第2の鎖が、ステップ(a)において複数の増幅反応によって増幅され、表面上に物理的に連結した核酸複合体アンプリコンのクラスターを生成する、E1~E51のいずれか1つの方法。
E53.複数の物理的に連結した核酸複合体の各々の第1の鎖および第2の鎖が、ステップ(a)において増幅され、表面上に複数のクラスターを同時に生成する、E8~E52のいずれか1つの方法。
E54.結合した物理的に連結した核酸複合体アンプリコンの一部を切断することが、第1のアダプター中の切断可能部位を非効率的に切断することを含み、表面上の各々のクラスター内で、切断された核酸複合体および切断されていない核酸複合体の両方が生じる、E1~E8およびE12~E53のいずれか1つの方法。
E55.フローセル上の各々のクラスター内の全ての核酸複合体の切断されていない核酸複合体の比率が、1%、5%、10%、20%、30%、40%、45%、または50%である、E54の方法。
E56.切断された核酸複合体が、切断促進因子によって、第1のアダプターのリンカードメイン中の切断可能部位で切断される、E54またはE55の方法。
E57.切断が、部位指向性酵素反応である、E56の方法。
E58.切断促進因子が、エンドヌクレアーゼである、E56またはE57の方法。
E59.エンドヌクレアーゼが、制限部位エンドヌクレアーゼまたは標的化エンドヌクレアーゼである、E58の方法。
E60.切断促進因子が、リボ核酸タンパク質、Cas酵素、Cas9様酵素、メガヌクレアーゼ、転写活性化因子様エフェクターベースヌクレアーゼ(TALEN)、ジンクフィンガーヌクレアーゼ、アルゴノートヌクレアーゼ、またはそれらの組み合わせからなる群から選択される、E56またはE57の方法。
E61.切断促進因子が、CRISPR関連酵素を含む、E56またはE57の方法。
E62.切断促進因子が、Cas9、またはCPF1、またはそれらの誘導体を含む、E56またはE57の方法。
E63.切断促進因子が、ニッカーゼまたはニッカーゼバリアントを含む、E56またはE57の方法。
E64.切断促進因子が、化学プロセスを含む、E56の方法。
E65.表面上に残存する切断されていない核酸複合体の量が、部位指向性切断のために導入される切断促進因子の量もしくは濃度を制御することによって、または切断促進因子が部位指向性切断のために導入されている時間量を制御することによって、拡張することができる、E54~E64のいずれか1つの方法。
E66.切断されていない核酸複合体が、切断ステップの前または切断ステップの間に、抗切断促進因子の添加によって保護される、E54~E63のいずれか1つの方法。
E67.抗切断促進因子が、第1のアダプターのリンカードメイン中に抗切断モチーフを含む、E66の方法。
E68.切断可能部位が、第1のアダプターのリンカードメイン中に既に存在しており、抗切断モチーフが、第1のアダプターのリンカードメインに少なくとも部分的に相補的な配列を含むオリゴヌクレオチドのハイブリダイゼーションによって作製される、E67の方法。
E69.結合した物理的に連結した核酸複合体アンプリコンの一部を切断することが、
(i)抗切断促進因子を導入することと、
(ii)(i)の後、または(i)と同時のいずれかに、切断促進因子を導入することと、
をさらに含み、
抗切断促進因子との相互作用が、物理的に連結した核酸複合体アンプリコンを切断から保護する、E66~E68のいずれか1つの方法。
E70.切断可能部位が、第1のアダプターのリンカードメインに少なくとも部分的に相補的な配列を含むオリゴヌクレオチドのハイブリダイゼーションによって作製され、オリゴヌクレオチドとハイブリダイズしていない物理的に連結した核酸複合体アンプリコンが、切断されない、E54~E63のいずれか1つの方法。
E71.切断可能部位が、アダプターのリンカードメインに少なくとも部分的に相補的な配列を含む第1のオリゴヌクレオチドのハイブリダイゼーションによって作製され、抗切断モチーフが、アダプターのリンカードメインに少なくとも部分的に相補的な配列を含む第2のオリゴヌクレオチドのハイブリダイゼーションによって作製され、結合した物理的に連結した核酸複合体アンプリコンの一部を切断することが、
(i)第1および第2のオリゴヌクレオチドの混合物を導入することと、
(ii)切断促進因子を導入することと、
をさらに含む、E54~E63のいずれか1つの方法。
E72.第1のオリゴヌクレオチドまたは第2のオリゴヌクレオチドのいずれかが、メチル化されている、E71の方法。
E73.ハイブリダイゼーションが、ハイブリダイゼーションのために導入されるオリゴヌクレオチドの量もしくは濃度を制御することによって、またはオリゴヌクレオチドがハイブリダイゼーションのために導入される時間量を制御することによって、拡張することができる、E70またはE71の方法。
E74.抗切断モチーフが、切断部位への接近を防止する嵩高い付加物または側鎖を有するオリゴヌクレオチド配列を含む、E67、E68またはE71~E73のいずれか1つの方法。
E75.抗切断モチーフが、切断促進因子が切断部位を認識することを防止する1つ以上のミスマッチを有するオリゴヌクレオチド配列を含む、E67、E68、またはE71~E73のいずれか1つの方法。
E76.抗切断モチーフが、ヌクレオシド類似体、脱塩基部位、ヌクレオチド類似体、およびペプチド-核酸結合を有するオリゴヌクレオチド配列のうちの1つ以上を含む、E67、E68、またはE71~E73のいずれか1つの方法。
E77.切断された核酸複合体が、触媒的に活性な酵素によって第1のアダプター中の切断可能部位で切断され、切断されていない核酸複合体が、触媒的に不活性な酵素によって第1のアダプター中の切断から保護される、E54~E63のいずれか1つの方法。
E78.切断部位が、第1のアダプターの自己相補性部分、または第1のアダプターの一本鎖部分にある、E54~E63のいずれかのいずれか1つの方法。
E79.切断部位が、物理的に連結した核酸複合体アンプリコンが表面上で自己ハイブリダイズされた構成である場合に、利用可能である、E78の方法。
E80.切断部位が、物理的に連結した核酸複合体アンプリコンが二本鎖ブリッジ増幅される構成である場合に、利用可能である、E54~E63のいずれか1つの方法。
E81.ステップ(a)の前に、1つ以上の標的化ゲノム領域を有する物理的に連結した核酸複合体を選択的に濃縮して、複数の濃縮された物理的に連結した核酸複合体を提供することをさらに含む、E8~E80のいずれか1つの方法。
E82.二本鎖核酸分子のエラーを修正したデュプレックス配列決定に使用することができるキットであって、本キットが、
配列決定プライマーの少なくとも1つのセットと、
リンカードメインを含む第1のアダプター分子のセットと、
増幅のために表面上に固定されるように構成された、二本鎖部分および一本鎖部分を含む第2のアダプター分子のセットと、
を含み、
プライマーおよびアダプター分子が、エラーを修正したデュプレックス配列決定実験に使用することができ、
生体試料から抽出された核酸のエラーを修正したデュプレックス配列決定を実施する際のキットの使用方法に関する説明書を含む、キット。
E83.切断促進因子をさらに含む、E82のキット。
E84.リンカードメインが、切断可能モチーフを有する、E82またはE83のキット。
E85.抗切断促進因子をさらに含む、E82~E84のいずれか1つのキット。
E86.コンピュータまたはリモートコンピューティングサーバ上で実行されるとき、試料中の1つ以上の二本鎖核酸分子についてのエラーを修正したデュプレックス配列決定リードを決定するためのステップを実行する、非一時的コンピュータ可読媒体に具現化されるコンピュータプログラム製品をさらに含む、E82~E85のいずれか1つのキット。
E87.配列決定システムであって、
共有結合したオリゴヌクレオチドを含む配列決定表面と、
配列決定試薬を配列決定表面に送達するための送達システムと、
切断促進因子を配列決定表面に送達するための送達システムと、
配列決定データに関連する情報を送信するためのコンピューティングネットワークであって、その情報が、生の配列決定データ、デュプレックス配列決定データ、および試料情報、のうちの1つ以上を含む、コンピューティングネットワークと、
を含む、配列決定システム。
結論
本技術の実施形態の上述の詳細な説明は、網羅的であること、または本技術を上述の正確な形態に限定することを意図するものではない。本技術の具体的な実施形態および実施例は、例示的な目的のために上に記載されているが、関連技術分野の当業者が認識するように、本技術の範囲内で様々な等価な修正が可能である。例えば、ステップは所与の順序で提示されているが、代替的な実施形態は、異なる順序でステップを行ってもよい。本明細書に記載の様々な実施形態を組み合わせて、さらなる実施形態を提供することもできる。本明細書に引用される全ての参考文献は、本明細書に完全に記載されるかのように、参照により援用される。
本技術の実施形態の上述の詳細な説明は、網羅的であること、または本技術を上述の正確な形態に限定することを意図するものではない。本技術の具体的な実施形態および実施例は、例示的な目的のために上に記載されているが、関連技術分野の当業者が認識するように、本技術の範囲内で様々な等価な修正が可能である。例えば、ステップは所与の順序で提示されているが、代替的な実施形態は、異なる順序でステップを行ってもよい。本明細書に記載の様々な実施形態を組み合わせて、さらなる実施形態を提供することもできる。本明細書に引用される全ての参考文献は、本明細書に完全に記載されるかのように、参照により援用される。
上の記載から、本技術の特定の実施形態は、例示のために本明細書に記載されているが、本技術の実施形態の説明を不必要に曖昧にすることを回避するために既知の構造および機能は詳細には記載または示されていないことを理解されたい。文脈が許容する場合、単数または複数の用語は、それぞれ複数または単数の用語も含み得る。
さらに、「または」という単語が、2つ以上の項目のリストに関して他の項目から排他される単一の項目のみを意味するように明示的に限定されない限り、かかるリストにおける「または」の使用は、(a)そのリスト内の任意の単一の項目、(b)そのリスト内の全ての項目、または(c)そのリスト内の項目の任意の組み合わせを含むと解釈される。加えて、「~を含む(comprising)」という用語は、少なくとも列挙された特徴を含むことを意味するように、全体を通して使用され、同じ特徴の任意のより多い数および/または追加の種類の他の特徴が排除されない。特定の実施形態は例示のために本明細書には記載されているが、本技術から逸脱することなく様々な変更が行われ得ることも理解されたい。さらに、本技術の特定の実施形態と関連付けられた利点は、それらの実施形態の文脈で説明されているが、他の実施形態も、かかる利点を示してもよく、全ての実施形態が必ずしも本技術の範囲内に収まるような利点を示す必要はない。したがって、本開示および関連技術は、本明細書に明示的に示されていないまたは記載されない他の実施形態を包含することができる。
Claims (54)
- 二本鎖標的核酸分子を配列決定する方法であって、前記方法が、
(a)物理的に連結した核酸複合体を、ある表面上で増幅させて、順方向および逆方向の両方に前記表面に結合した、物理的に連結した核酸複合体アンプリコンを生成することであって、前記物理的に連結した核酸複合体が、(i)前記二本鎖標的核酸分子、(ii)前記二本鎖標的核酸分子の第1の末端上にリンカードメインを含む第1のアダプター、ならびに(iii)前記二本鎖標的核酸分子の第2の末端上に二本鎖部分および一本鎖部分を有する第2のアダプターを含む、生成することと、
(b)(i)前記逆方向に前記表面に結合した前記物理的に連結した核酸複合体アンプリコン、または(ii)前記順方向に前記表面に結合した前記物理的に連結した核酸複合体アンプリコンのいずれかを除去することと、
(c)残存する結合した物理的に連結した核酸複合体アンプリコンの一部を切断して、一方の鎖からの情報を含む一本鎖アンプリコンのサブセット、および物理的に連結した核酸複合体アンプリコンのサブセットを提供することと、
(d)前記一本鎖アンプリコンのサブセットを配列決定して、前記二本鎖標的核酸分子の元の鎖に由来する配列決定リードを提供することと、
(e)前記表面上で、前記物理的に連結した核酸複合体アンプリコンのサブセットを増幅させることと、
(f)他方の方向にある前記物理的に連結した核酸複合体アンプリコンを除去することと、
(g)前記残存する結合した物理的に連結した核酸複合体アンプリコンを切断して、前記他方の鎖からの情報を含む一本鎖アンプリコンを提供することと、
(h)前記一本鎖アンプリコンを配列決定して、前記二本鎖標的核酸分子の他方の元の鎖に由来する配列決定リードを提供することと、
を含む、方法。 - 二本鎖標的核酸分子を配列決定する方法であって、前記方法が、
(a)物理的に連結した核酸複合体を、ある表面上で増幅させて、前記表面に結合した物理的に連結した核酸複合体アンプリコンのクラスターを生成することであって、前記物理的に連結した核酸複合体が、(i)前記二本鎖標的核酸分子、(ii)前記二本鎖標的核酸分子の一方の末端上にリンカードメインを含む第1のアダプター、ならびに(iii)前記二本鎖標的核酸分子の他方の末端上に二本鎖部分および一本鎖部分を有する第2のアダプターを含む、生成することと、
(b)(i)前記物理的に連結した核酸複合体アンプリコンの5’末端、または(ii)前記物理的に連結した核酸複合体アンプリコンの3’末端で前記表面に結合した、前記物理的に連結した核酸複合体アンプリコンのいずれかを除去することと、
(c)切断部位で、残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断して、前記二本鎖標的核酸分子の一方の元の鎖に由来する配列情報を含む一本鎖アンプリコンを提供することと、
(d)前記一本鎖アンプリコンを配列決定して、前記二本鎖標的核酸分子の前記一方の元の鎖に由来する配列決定リードを提供することと、
を含む、方法。 - 前記残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断することが、前記表面に結合した少なくとも1つの物理的に連結した核酸複合体アンプリコンを保存することを含む、請求項2に記載の方法。
- (e)前記表面上で、前記少なくとも1つの物理的に連結した核酸複合体アンプリコンを増幅させて、前記表面に結合した前記物理的に連結した核酸複合体アンプリコンのクラスターを再配置させることと、
(f)(b)で除去されない他方の方向にある前記物理的に連結した核酸複合体アンプリコンを除去することと、
(g)前記残存する結合した物理的に連結した核酸複合体アンプリコンを切断して、前記二本鎖標的核酸分子の他方の元の鎖に由来する情報を含む一本鎖アンプリコンを提供することと、
(h)前記一本鎖アンプリコンを配列決定して、前記二本鎖標的核酸分子の前記他方の元の鎖に由来する配列決定リードを提供することと、
をさらに含む、請求項3に記載の方法。 - 前記一方の元の鎖からの前記配列リードを、前記他方の元の鎖からの前記配列リードと比較して、前記二本鎖標的核酸分子についてのコンセンサス配列を生成することをさらに含む、先行請求項のいずれか一項に記載の方法。
- 前記一方の元の鎖からの前記配列リードおよび前記他方の元の鎖からの前記配列リードにおける配列変動を識別することであって、前記一方の元の鎖および前記他方の元の鎖からの前記配列変動が、一貫した配列変動である、識別すること、または
前記一方の元の鎖中で起こり、かつ前記他方の元の鎖中で起こらない配列変動を除外するか、もしくは考慮に入れないこと、
をさらに含む、請求項1~4のいずれか一項に記載の方法。 - 前記一方の元の鎖からの前記配列リードを、前記他方の元の鎖からの前記配列リードと比較することと、
前記一方の元の鎖からの前記配列リードと、前記他方の元の鎖からの前記配列リードとの間で一致しない、ヌクレオチド位置を識別することと、
一致しないと識別された前記ヌクレオチド位置を考慮に入れないか、除外するか、または修正することによって、前記二本鎖標的核酸分子のエラーを修正した配列を生成することと、
をさらに含む、請求項1~4のいずれか一項に記載の方法。 - 各々が第1の鎖と第2の鎖とを含む二本鎖標的核酸分子の集合体を配列決定する方法であって、前記方法が、
(a)複数の物理的に連結した核酸複合体を、ある表面上で増幅させて、複数のクローナルクラスターを生成することであって、各々のクローナルクラスターは、各々が第1の鎖のアンプリコンと第2の鎖のアンプリコンとを含む、複数の物理的に連結した核酸複合体アンプリコンを含み、各々の物理的に連結した核酸複合体が、(i)前記集合体からの二本鎖標的核酸分子、(ii)前記二本鎖標的核酸分子の第1の鎖に接続したリンカードメインを含む第1のアダプター、ならびに(iii)前記二本鎖標的核酸分子の第2の末端に接続した二本鎖部分および一本鎖部分を有する第2のアダプターを含む、生成することと、
(b)(i)逆方向または(ii)順方向に前記表面に結合した各々のクローナルクラスターからの前記物理的に連結した核酸複合体アンプリコンのいずれかを除去することと、
(c)(b)の後に残存する、残存する表面結合した物理的に連結した核酸複合体アンプリコンの一部を切断し、それによって、前記第1の鎖のアンプリコンと前記第2の鎖のアンプリコンを物理的に分離することと、
(d)結合していない物理的に分離された第1の鎖または第2の鎖のアンプリコンを除去することと、
(e)前記表面に結合した残存する物理的に分離された第1または第2の鎖のアンプリコンを配列決定して、前記表面上の各々のクローナルクラスターについて前記第1の鎖または前記第2の鎖の核酸配列リードを生成することと、
を含む、方法。 - 前記残存する結合した物理的に連結した核酸複合体アンプリコンの少なくとも一部を切断することが、前記表面に結合した前記クローナルクラスターのうちの少なくともいくつかにおいて、少なくとも1つの物理的に連結した核酸複合体アンプリコンを保存することを含む、請求項8に記載の方法。
- (f)前記クローナルクラスターのうちの少なくともいくつかにおいて、前記表面上で、前記少なくとも1つの物理的に連結した核酸複合体アンプリコンを増幅させて、前記表面に結合した前記物理的に連結した核酸複合体アンプリコンのクローナルクラスターを再配置させることと、
(g)ステップ(b)とは他方の方向にある前記物理的に連結した核酸複合体アンプリコンを除去することと、
(h)結合していない物理的に分離された第1または第2の鎖のアンプリコンを除去することと、
(i)(h)の後に残存する、残存する結合した物理的に連結した核酸複合体アンプリコンを切断し、それによって、前記第1の鎖のアンプリコンと前記第2の鎖のアンプリコンを物理的に分離することと、
(j)前記表面に結合した残存する物理的に分離された第1または第2の鎖のアンプリコンを配列決定して、前記表面上の各々のクローナルクラスターについて前記第1の鎖または前記第2の鎖の核酸配列リードを生成することと、
をさらに含む、請求項9に記載の方法。 - 各々が第1の鎖と第2の鎖とを含む二本鎖標的核酸分子の集合体を配列決定する方法であって、前記方法が、
(a)ある表面上に結合した複数の物理的に連結した核酸複合体を増幅させて、複数のクラスターを生成することであって、各々のクラスターが、元の二本鎖標的核酸分子を表す複数の物理的に連結した核酸複合体アンプリコンを含み、各々の物理的に連結した核酸複合体アンプリコンが、第1の鎖のアンプリコンと第2の鎖のアンプリコンとを含み、各々の物理的に連結した核酸複合体が、(i)一方の末端で前記第1の鎖と前記第2の鎖との間にリンカードメインを含む第1のアダプター、ならびに(ii)他方の末端で二本鎖部分および一本鎖部分を有する第2のアダプターに接続した前記集合体からの二本鎖標的核酸分子を含む、生成することと、
(b)表面結合した物理的に連結した核酸複合体アンプリコンを切断し、それによって、前記第1の鎖のアンプリコンと前記第2の鎖のアンプリコンを物理的に分離することと、
(c)結合していない物理的に分離された第1の鎖のアンプリコンおよび/または結合していない物理的に分離された第2の鎖のアンプリコンを除去することであって、前記表面に結合した残存するアンプリコンが、(i)前記物理的に分離された第1の鎖のアンプリコンおよび(ii)前記物理的に分離された第2の鎖のアンプリコンを含む、除去することと、
(d)前記表面に結合した前記物理的に分離された第1の鎖のアンプリコンを配列決定して、前記表面上の各々のクラスターについて前記第1の鎖の核酸配列リードを生成することと、
(e)前記表面に結合した前記物理的に分離された第2の鎖のアンプリコンを配列決定して、前記表面上の各々のクラスターについて前記第2の鎖の核酸配列リードを生成することと、
を含む、方法。 - 前記表面上の前記クラスターの少なくともいくつかについて、前記第1の鎖の前記核酸配列リードを、前記第2の鎖の前記核酸配列リードと比較して、元の二本鎖標的核酸分子のエラーを修正した配列リードを生成することをさらに含む、請求項10または請求項11に記載の方法。
- 固有の分子識別子(UMI)を使用して、前記集合体からの元の二本鎖標的核酸分子の第1の鎖の核酸配列リードを、同じ元の二本鎖標的核酸分子の第2の鎖の核酸配列リードに関連付けることをさらに含む、請求項10~12のいずれか一項に記載の方法。
- 前記UMIが、前記表面上の物理的位置を含む、請求項13に記載の方法。
- 前記UMIが、タグ配列、分子特異的特徴、前記表面上のクラスター位置、またはそれらの組み合わせを含む、請求項14に記載の方法。
- 前記分子特異的特徴が、参照配列に対する核酸マッピング情報、前記二本鎖標的核酸分子の末端もしくはその付近の配列情報、前記二本鎖標的核酸分子の長さ、またはそれらの組み合わせを含む、請求項15に記載の方法。
- 鎖定義要素(SDE)を使用して、元の二本鎖標的核酸分子の前記第1の鎖の前記核酸配列リードを、同じ元の二本鎖標的核酸分子からの前記第2の鎖の前記核酸配列リードから区別することをさらに含む、請求項10~16のいずれか一項に記載の方法。
- 前記SDEが、配列リード情報と、請求項10のステップ(e)およびステップ(j)、または請求項11のステップ(d)および(e)との関連付けである、請求項17に記載の方法。
- 前記SDEが、アダプター配列の一部を含む、請求項17に記載の方法。
- 前記物理的に分離された第1の鎖のアンプリコンまたは第2の鎖のアンプリコンを配列決定することが、合成によって配列決定することを含む、請求項8~19のいずれか一項に記載の方法。
- 前記第1のアダプターおよび前記第2のアダプターを、前記集合体中の複数の二本鎖標的核酸分子の各々にライゲーションすることによって、前記物理的に連結した核酸複合体を調製することと、
前記物理的に連結した核酸複合体を前記表面に提示することであって、複数の物理的に連結した核酸複合体が、複数の結合したオリゴヌクレオチドに対するハイブリダイゼーションを介して前記表面上に捕捉されるように、前記表面が、前記第2のアダプターの前記一本鎖部分に少なくとも部分的に相補的な複数の結合したオリゴヌクレオチドを有する、提示することと、
をさらに含む、請求項8~20のいずれか一項に記載の方法。 - (a)の前記増幅ステップが、ブリッジ増幅を含む、請求項8~21のいずれか一項に記載の方法。
- 前記集合体中の前記二本鎖標的核酸分子の少なくともいくつかについて、
(i)前記第1の鎖からの前記配列リードを、前記第2の鎖からの前記配列リードと比較することと、
(ii)前記第1の鎖からの前記配列リードと、前記第2の鎖からの前記配列リードとの間で一致しない、ヌクレオチド位置を識別することと、
(iii)一致しない前記識別されたヌクレオチド位置を考慮に入れないか、除外するか、または修正することによって、前記二本鎖標的核酸分子のエラーを修正した配列リードを生成することと、
をさらに含む、請求項8~22のいずれか一項に記載の方法。 - 前記第1のアダプターが、切断可能部位またはモチーフを含む、請求項1~23のいずれか一項に記載の方法。
- 前記第1のアダプターが、切断可能ドメインを含む、請求項1~24のいずれか一項に記載の方法。
- 前記第1のアダプターが、自己相補性ステム部分および一本鎖ヌクレオチドループ部分を含む、ヘアピンループ構造を含む、請求項1~25のいずれか一項に記載の方法。
- 前記切断可能ドメインが、前記一本鎖ヌクレオチドループ部分または前記ステム部分にある、請求項26に記載の方法。
- 前記切断可能ドメインが、酵素認識部位を含む、請求項33に記載の方法。
- 前記酵素認識部位が、制限酵素または標的化エンドヌクレアーゼによって標的化される、請求項28に記載の方法。
- 前記第2のアダプターの前記一本鎖部分が、第1のプライマー結合部位を有する第1のアームと、第2のプライマー結合部位を有する第2のアームと、を含む、請求項1~29のいずれか一項に記載の方法。
- 変性すると、前記物理的に連結した二本鎖核酸複合体が、5’から3’、または3’から5’に、前記第1のプライマー結合部位、前記第1の鎖、前記リンカードメインを含む前記第1のアダプター、前記第2の鎖、および前記第2のプライマー結合部位を含む、請求項30に記載の方法。
- 前記表面が、配列決定表面である、先行請求項のいずれか一項に記載の方法。
- (a)の前記増幅の前に、前記表面の上に、前記複数の物理的に連結した二本鎖核酸複合体を流すことをさらに含む、請求項8~32のいずれか一項に記載の方法。
- 前記表面が、前記第2のアダプターの1つ以上の領域に少なくとも部分的に相補的な複数の1つ以上の結合したオリゴヌクレオチドを含む、先行請求項のいずれか一項に記載の方法。
- 前記複数の1つ以上の結合したオリゴヌクレオチドが、前記第2のアダプターの前記一本鎖部分に少なくとも部分的に相補的である、請求項34に記載の方法。
- 前記物理的に連結した核酸複合体の第1の鎖および第2の鎖が、ステップ(a)において複数の増幅反応によって増幅されて、前記表面上に前記物理的に連結した核酸複合体アンプリコンのクラスターを生成する、請求項1~35のいずれか一項に記載の方法。
- 前記複数の物理的に連結した核酸複合体の各々の前記第1の鎖および前記第2の鎖が、ステップ(a)において増幅されて、前記表面上に前記複数のクラスターを同時に生成する、請求項8~36のいずれか一項に記載の方法。
- 前記結合した物理的に連結した核酸複合体アンプリコンの一部を切断することが、前記第1のアダプター中の切断可能部位を非効率的に切断することを含み、前記表面上の各々のクラスター内で、切断された核酸複合体および切断されていない核酸複合体の両方が生じる、請求項1~8および12~37のいずれか一項に記載の方法。
- 前記フローセル上の各々のクラスター内の全ての核酸複合体の切断されていない核酸複合体の比率が、1%、5%、10%、20%、30%、40%、45%、または50%である、請求項38に記載の方法。
- 前記切断された核酸複合体が、切断促進因子によって、前記第1のアダプターの前記リンカードメイン中の切断可能部位で切断される、請求項38または39に記載の方法。
- 前記切断が、部位指向性酵素反応である、請求項40に記載の方法。
- 前記切断促進因子が、エンドヌクレアーゼである、請求項40または請求項41に記載の方法。
- 前記切断促進因子が、CRISPR関連酵素を含む、請求項40または請求項41に記載の方法。
- 前記切断促進因子が、ニッカーゼまたはニッカーゼバリアントを含む、請求項40または請求項41に記載の方法。
- 前記切断促進因子が、化学プロセスを含む、請求項40に記載の方法。
- 前記表面上に残存する切断されていない核酸複合体の量が、部位指向性切断のために導入されている前記切断促進因子の量もしくは濃度を制御することによって、または前記切断促進因子が部位指向性切断のために導入されている時間量を制御することによって、拡張することができる、請求項38~45のいずれか一項に記載の方法。
- 前記切断されていない核酸複合体が、前記切断ステップの前または前記切断ステップ中に、抗切断促進因子の添加によって保護される、請求項38~45のいずれか一項に記載の方法。
- 前記結合した物理的に連結した核酸複合体アンプリコンの一部を切断することが、
(i)抗切断促進因子を導入することと、
(ii)(i)の後、または(i)と同時のいずれかに、前記切断促進因子を導入することと、
をさらに含み、
前記抗切断促進因子との相互作用が、物理的に連結した核酸複合体アンプリコンを切断から保護する、請求項47に記載の方法。 - 前記切断可能部位が、前記第1のアダプターの前記リンカードメインに少なくとも部分的に相補的な配列を含むオリゴヌクレオチドのハイブリダイゼーションによって作製され、前記オリゴヌクレオチドとハイブリダイズしていない物理的に連結した核酸複合体アンプリコンが、切断されていない、請求項38~44のいずれか一項に記載の方法。
- 前記切断可能部位が、前記アダプターの前記リンカードメインに少なくとも部分的に相補的な配列を含む第1のオリゴヌクレオチドのハイブリダイゼーションによって作製され、抗切断モチーフが、前記アダプターの前記リンカードメインに少なくとも部分的に相補的な配列を含む第2のオリゴヌクレオチドのハイブリダイゼーションによって作製され、前記結合した物理的に連結した核酸複合体アンプリコンの一部を切断することが、
(i)前記第1および第2のオリゴヌクレオチドの混合物を導入することと、
(ii)前記切断促進因子を導入することと、
をさらに含む、請求項38~44のいずれか一項に記載の方法。 - 前記切断された核酸複合体が、触媒的に活性な酵素によって前記第1のアダプター中の切断可能部位で切断され、前記切断されていない核酸複合体が、触媒的に不活性な酵素によって前記第1のアダプター中の切断から保護される、請求項38~44のいずれか一項に記載の方法。
- 前記切断部位が、前記第1のアダプターの自己相補性部分、または前記第1のアダプターの一本鎖部分にある、請求項38~44のいずれか一項に記載の方法。
- 前記切断部位が、前記物理的に連結した核酸複合体アンプリコンが前記表面上で自己ハイブリダイズされた構成である場合に、利用可能である、請求項52に記載の方法。
- 前記切断部位が、前記物理的に連結した核酸複合体アンプリコンが二本鎖ブリッジ増幅された構成である場合に、利用可能である、請求項38~44のいずれか一項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962881936P | 2019-08-01 | 2019-08-01 | |
US62/881,936 | 2019-08-01 | ||
PCT/US2020/044673 WO2021022237A1 (en) | 2019-08-01 | 2020-08-01 | Methods and reagents for nucleic acid sequencing and associated applications |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022543778A true JP2022543778A (ja) | 2022-10-14 |
JPWO2021022237A5 JPWO2021022237A5 (ja) | 2023-08-08 |
Family
ID=74229285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022506451A Pending JP2022543778A (ja) | 2019-08-01 | 2020-08-01 | 核酸配列決定のための方法および試薬、ならびに関連する用途 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20220220543A1 (ja) |
EP (1) | EP4007818A4 (ja) |
JP (1) | JP2022543778A (ja) |
CN (1) | CN114502742A (ja) |
AU (1) | AU2020321991A1 (ja) |
CA (1) | CA3146435A1 (ja) |
IL (1) | IL290274A (ja) |
WO (1) | WO2021022237A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10844428B2 (en) | 2015-04-28 | 2020-11-24 | Illumina, Inc. | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) |
CA3050247A1 (en) | 2017-01-18 | 2018-07-26 | Illumina, Inc. | Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths |
US11028435B2 (en) | 2017-05-01 | 2021-06-08 | Illumina, Inc. | Optimal index sequences for multiplex massively parallel sequencing |
SG11201910070PA (en) | 2017-05-08 | 2019-11-28 | Illumina Inc | Universal short adapters for indexing of polynucleotide samples |
US11447818B2 (en) | 2017-09-15 | 2022-09-20 | Illumina, Inc. | Universal short adapters with variable length non-random unique molecular identifiers |
US11359238B2 (en) | 2020-03-06 | 2022-06-14 | Singular Genomics Systems, Inc. | Linked paired strand sequencing |
WO2023175026A1 (en) * | 2022-03-15 | 2023-09-21 | Illumina, Inc. | Methods of determining sequence information |
US11680293B1 (en) * | 2022-04-21 | 2023-06-20 | Paragon Genomics, Inc. | Methods and compositions for amplifying DNA and generating DNA sequencing results from target-enriched DNA molecules |
GB202209189D0 (en) * | 2022-06-22 | 2022-08-10 | Broken String Biosciences Ltd | Methods and compositions for nucleic acid sequencing |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012012037A1 (en) * | 2010-07-19 | 2012-01-26 | New England Biolabs, Inc. | Oligonucleotide adaptors: compositions and methods of use |
EP2635679B1 (en) * | 2010-11-05 | 2017-04-19 | Illumina, Inc. | Linking sequence reads using paired code tags |
DK3363901T3 (da) * | 2012-02-17 | 2021-02-22 | Hutchinson Fred Cancer Res | Sammensætninger og fremgangsmåder til præcis identificering af mutationer |
WO2013169339A1 (en) * | 2012-05-10 | 2013-11-14 | The General Hospital Corporation | Methods for determining a nucleotide sequence |
AU2014369841B2 (en) * | 2013-12-28 | 2019-01-24 | Guardant Health, Inc. | Methods and systems for detecting genetic variants |
US10435685B2 (en) * | 2014-08-19 | 2019-10-08 | Pacific Biosciences Of California, Inc. | Compositions and methods for enrichment of nucleic acids |
US10465241B2 (en) * | 2015-06-15 | 2019-11-05 | The Board Of Trustees Of The Leleand Stanford Junior University | High resolution STR analysis using next generation sequencing |
CN109072294A (zh) * | 2015-12-08 | 2018-12-21 | 特温斯特兰德生物科学有限公司 | 用于双重测序的改良衔接子、方法和组合物 |
WO2018023068A1 (en) * | 2016-07-29 | 2018-02-01 | New England Biolabs, Inc. | Methods and compositions for preventing concatemerization during template- switching |
ES2929281T3 (es) * | 2017-03-23 | 2022-11-28 | Univ Washington | Métodos para el enriquecimiento de secuencias de ácidos nucleicos dirigidos con aplicaciones para la secuenciación de ácidos nucleicos con corrección de errores |
US11584958B2 (en) * | 2017-03-31 | 2023-02-21 | Grail, Llc | Library preparation and use thereof for sequencing based error correction and/or variant identification |
-
2020
- 2020-08-01 CN CN202080055766.3A patent/CN114502742A/zh active Pending
- 2020-08-01 US US17/607,490 patent/US20220220543A1/en active Pending
- 2020-08-01 EP EP20848607.6A patent/EP4007818A4/en active Pending
- 2020-08-01 CA CA3146435A patent/CA3146435A1/en active Pending
- 2020-08-01 WO PCT/US2020/044673 patent/WO2021022237A1/en active Application Filing
- 2020-08-01 AU AU2020321991A patent/AU2020321991A1/en active Pending
- 2020-08-01 JP JP2022506451A patent/JP2022543778A/ja active Pending
-
2022
- 2022-01-31 IL IL290274A patent/IL290274A/en unknown
Also Published As
Publication number | Publication date |
---|---|
WO2021022237A1 (en) | 2021-02-04 |
EP4007818A4 (en) | 2023-09-20 |
CA3146435A1 (en) | 2021-02-04 |
AU2020321991A1 (en) | 2022-03-03 |
CN114502742A (zh) | 2022-05-13 |
EP4007818A1 (en) | 2022-06-08 |
US20220220543A1 (en) | 2022-07-14 |
IL290274A (en) | 2022-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022543778A (ja) | 核酸配列決定のための方法および試薬、ならびに関連する用途 | |
EP3377625B1 (en) | Method for controlled dna fragmentation | |
JP2021515579A (ja) | 配列決定用途および他の核酸物質インテロゲーションのための核酸物質を濃縮するための方法および試薬 | |
US10711269B2 (en) | Method for making an asymmetrically-tagged sequencing library | |
JP5986572B2 (ja) | 固定化プライマーを使用した標的dnaの直接的な捕捉、増幅、および配列決定 | |
JP2016511007A (ja) | 鎖になったrnaまたはdnaのライブラリを生成するための方法、組成物およびキット | |
JP2016536991A (ja) | 複製物配列決定リードを同定するための組成物および方法 | |
US10240196B2 (en) | Transposase-random priming DNA sample preparation | |
US20220364169A1 (en) | Sequencing method for genomic rearrangement detection | |
US20190169603A1 (en) | Compositions and Methods for Labeling Target Nucleic Acid Molecules | |
US20170175182A1 (en) | Transposase-mediated barcoding of fragmented dna | |
WO2019090621A1 (zh) | 钩状探针、核酸连接方法以及测序文库的构建方法 | |
US11174511B2 (en) | Methods and compositions for selecting and amplifying DNA targets in a single reaction mixture | |
US11136576B2 (en) | Method for controlled DNA fragmentation | |
EP4048812B1 (en) | Methods for 3' overhang repair | |
WO2022256228A1 (en) | Method for producing a population of symmetrically barcoded transposomes | |
CN115279918A (zh) | 用于测序的新型核酸模板结构 | |
AU2022246628A1 (en) | Methods for targeted nucleic acid sequencing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230728 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230728 |