JP2023506631A

JP2023506631A - 共有結合で閉端された核酸分子末端を使用したｎｇｓライブラリー調製

Info

Publication number: JP2023506631A
Application number: JP2022535868A
Authority: JP
Inventors: ルネコルネリスヨセフスホジャーズ，; ステファンジョンホワイト，
Original assignee: キージーンナムローゼフェンノートシャップ
Priority date: 2019-12-20
Filing date: 2020-12-17
Publication date: 2023-02-17
Also published as: AU2020407850A1; WO2021123062A1; US20220333100A1; EP4077661A1; CA3161280A1

Abstract

本発明は、プロテロメラーゼ認識配列、好ましくはＴｅＩＮプロテロメラーゼ認識配列を含むアダプターに関する。本発明のアダプターは、核酸分子ライブラリーを調製するために使用することができる。本発明は、プロテロメラーゼ認識配列を含む１つ又は複数のアダプターを使用して核酸分子ライブラリーを産生するための方法にも関する。アダプターをプロテロメラーゼと接触させて、アダプターの末端を切断及び閉端することができる。前記閉端アダプターは、例えば、エキソヌクレアーゼ処理から保護される。本発明の方法は、プロテロメラーゼ認識配列を有するアダプターを使用した増幅方法及び配列決定法にさらに関する。【選択図】図１

Description

本発明は、遺伝子研究の分野、より詳細には、例えば、核酸サンプルの配列分析及び処理のための標的化核酸単離の分野にある。ライブラリー調製のための及び核酸サンプルの複雑性を低減するための新しい方法及び手段が開示される。

遺伝子研究の重要な要素は、例えば、公知のバリアントの遺伝子型を判定するか、又は配列の変化若しくはバリアントを特定するための、規定のＤＮＡ遺伝子座の配列分析である。このような分析は、多くの場合、多重方式で行う必要があり、例えば、特定の遺伝子座のセットを多数のサンプルで分析する必要がある。

理想的なアッセイは、スクリーニングすることが必要とされるサンプル及び遺伝子座の数に関して柔軟であり、精度が高く、様々なシーケンスプラットフォームに適しているものである。断片のコレクションに由来する核酸のサブセットを分析する場合、目的の断片を濃縮する必要性が存在することが多い。濃縮は、標的核酸の選択（例えば、精製又は増幅）によって、又は不要な核酸の除去によって実施することができる。理想的には、濃縮ステップは増幅を含まない。例えば、米国特許出願公開第２０１４／０１３４６１０号には、ＩＩ型制限酵素を使用してサンプル中の核酸を断片化した後、保護アダプターを連結し、続いてエキソヌクレアーゼを使用して捕捉されていない核酸のすべてを分解することによる、複雑性の低減方法が記載されている。国際公開第２０１６／０２８８８７号では、この方法が、プログラム可能なエンドヌクレアーゼ、すなわち、サンプルの核酸を断片化するためのＣＲＩＳＰＲ－エンドヌクレアーゼを使用することによって改良されている。

ほとんどの用途では、次世代配列決定（ＮＧＳ）の最初のステップは、ライブラリーを調製することである。ＮＧＳのライブラリー調製は、様々なプロトコルを使用して実施することができる。ＰａｃＢｉｏプラットフォームを使用したロングリードシーケンシングライブラリーの場合、ヘアピンアダプターを、核酸分子の末端に連結する。こうしたヘアピンアダプターを付加して、エキソヌクレアーゼ処理を使用して未アダプター連結分子をすべて除去し、インプット核酸分子の複数の通過をまたぐ配列決定読み取りを生成することができる。後者は、配列決定された核酸分子の高度に正確なコンセンサス配列の作出を可能にする。ヘアピンアダプターの付加は、インプット核酸分子の任意選択の断片化から始まり、続いて断片末端を末端処理し、３’Ａ付着（又は「粘着」）末端を付加する複数のステップを含む。任意選択で、この末端処理ステップ中に修復ステップを実施して、核酸分子内の損傷位置（例えば、ニック）を除去することができる。

こうした別々のステップの代わりに、トランスポザーゼ酵素を使用して、断片化ステップ及びアダプター付加ステップを組み合わせて１つのステップ（タグメンテーション）にしてもよい。タグメンテーションは、例えば、ＩｌｌｕｍｉｎａＮｅｘｔｅｒａ及びＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＯＮＴ）迅速ライブラリー調製プロトコルで広く使用されている。トランスポザーゼ反応後に修復ステップを実施すると、ほとんどの核酸断片は、それらの末端にアダプターを含むことになる。しかしながら、断片化又はタグメンテーションは、相当にランダムな核酸断片を作出する。

本発明の目的は、例えば、その後の配列決定及び／又はクローニングのために核酸分子ライブラリーを調製するための新規な方法を提供することであり、好ましくは、この方法は、目的の核酸に関してライブラリーを濃縮するステップを含む。

ＤＮＡ１２０００キットを使用したＡｇｉｌｅｎｔ２１００バイオアナライザーＤＮＡ分析を示す図である。ボックスの左側には、断片長を含むＤＮＡサイズマーカーが示されている。左側のボックスには、実験においてインプットとして使用されているアンプリコン（約１０５０ｂｐ）が示されている。エキソヌクレアーゼ（ＥｘｏＶ）処理無し（左）及び処理有り（右）。中央のボックスには、ＴｅＩＮアダプターが連結しているアンプリコンが示されている。ＥｘｏＶ処理無し（左）及び処理有り（右）。右側のボックスには、連結ＴｅＩＮアダプターがＴｅＩＮプロテロメラーゼで処理されたアンプリコンが示されている。ＥｘｏＶ処理有り（左）及び処理無し（右）。結果は、アダプター連結アンプリコンのＴｅＩＮ処理が、ＥｘｏＶ分解からの保護をもたらすことを示している。

本発明は、以下の付番した実施形態に要約され得る。

実施形態１．少なくとも部分的に二本鎖であり、プロテロメラーゼ認識配列、好ましくはＴｅＩＮプロテロメラーゼ認識配列を含むアダプター。

実施形態２．アダプターが、識別子配列をさらに含む、実施形態１に記載のアダプター。

実施形態３．アダプターが、少なくとも１つの付着末端を含む、実施形態１又は２に記載のアダプター。

実施形態４．核酸分子ライブラリーを調製するための方法であって、
ａ）少なくとも第１及び第２の核酸分子を含むサンプルを用意するステップであり、第１の核酸分子が第２の核酸分子に存在しない第１の標的配列を含み、任意選択で第２の核酸分子が第２の標的配列を含む、ステップと；
ｂ）実施形態１～３のいずれか１つで定義したアダプターを、第１及び第２の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと；
ｃ）アダプター連結核酸分子を、プロテロメラーゼ、好ましくはＴｅＩＮプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第１及び第２の核酸分子をもたらすステップと；
ｄ）閉端末端を含む第１の核酸分子を第１の標的配列にて切断して、１つの開端末端及び１つの閉端末端を含む第１の核酸を用意するステップと
を含む方法。

実施形態５．ステップａ）のサンプルが、第１及び第２の核酸分子並びに複数のさらなる核酸分子を含む、実施形態４に記載の方法。

実施形態６．ステップｄ）の第１の核酸分子が、プログラム可能なヌクレアーゼ又は制限エンドヌクレアーゼによって切断される、実施形態４又は５に記載の方法。

実施形態７．プログラム可能なヌクレアーゼが、ＲＮＡ誘導型ＣＲＩＳＰＲヌクレアーゼである、実施形態６に記載の方法。

実施形態８．ステップａ）の第１及び第２の核酸分子が、断片化、好ましくはゲノム核酸分子の断片化によって用意される、実施形態４～７のいずれか１つに記載の方法。

実施形態９．ステップｂ）のアダプターが、タグメンテーションによって連結される、実施形態８に記載の方法。

実施形態１０．ステップｃ）において閉端末端を含む核酸分子を得た後だが、ステップｄ）において閉端末端を含む第１の核酸分子を切断する前に、サンプルをエキソヌクレアーゼに曝露するステップｃ１）を含む、実施形態４～９のいずれか１つに記載の方法。

実施形態１１．ステップｄ）において１つの開端末端及び１つの閉端末端を含む第１の核酸分子を得た後で、サンプルをエキソヌクレアーゼに曝露するステップｅ）を含む、実施形態４～９のいずれか１つに記載の方法。

実施形態１２．閉端末端を含む第２の核酸分子を第２の標的配列にて切断して、１つの開端末端及び１つの閉端末端を含む第２の核酸をもたらすステップｆ）を含む、実施形態１１に記載の方法。

実施形態１３．１つの開端末端及び１つの閉端末端を含む第１の核酸分子又は任意選択で第２の核酸分子の開端末端にさらなるアダプターを連結するステップｇ）を含み、さらなるアダプターは、増幅プライマー結合部位及び配列プライマー結合部位のうちの少なくとも１つ及び任意選択で識別子配列を含む、実施形態４～１２のいずれか１つに記載の方法。

実施形態１４．核酸分子ライブラリーが、複数のサンプルから調製され、好ましくは複数のサンプルが、好ましくはステップｃ）、ステップｄ）、ステップｅ）、ステップｆ）の前に、又はステップｇ）の前にプールされる、実施形態４～１３のいずれか１つに記載の方法。

実施形態１５．サンプルが、ステップｇ）の後にプールされる、実施形態１３に記載の方法。

実施形態１６．ステップｃ）において分子をＴｅＩＮプロテロメラーゼと接触させる前に、ステップｂ）においてアダプター連結核酸分子を修復して、一本鎖切断を除去する、実施形態４～１３のいずれか１つに記載の方法。

実施形態１７．核酸分子ライブラリーを増幅するための方法であって、
実施形態１３～１６のいずれか１つで定義した核酸分子ライブラリーを調製するステップと；
ｉ）ステップｄ）において得られる１つの開端末端及び１つの閉端末端を含む第１の核酸分子にアニーリングする第１のプライマー及び任意選択で第２のプライマー；
ｉｉ）ステップｆ）において得られる１つの開端末端及び１つの閉端末端を含む第２の核酸分子にアニーリングする第１のプライマー及び任意選択で第２のプライマー；
ｉｉｉ）ステップｇ）で定義したさらなるアダプターにアニーリングする第１のプライマー及び任意選択で第２のプライマー；並びに
ｉｖ）ｉ）又はｉｉ）で定義した第１のプライマー及びｉｉｉ）で定義した第２のプライマーの組合せ
のうちの少なくとも１つを使用して核酸分子ライブラリーを増幅するステップと
を含む方法。

実施形態１８．第１及び第２の核酸分子を含むサンプル中の目的の配列を分析するための方法であって、
実施形態１３～１６のいずれか１つで定義した核酸分子ライブラリーを調製するステップと、
任意選択で、実施形態１７で定義した調製された核酸分子を増幅するステップと、
核酸分子ライブラリーを、配列決定する、好ましくはディープシーケンシングするステップと
を含む方法。

実施形態１９．実施形態１～３のいずれか１つで定義した１つ又は複数のアダプターと；
任意選択で、プロテロメラーゼ、好ましくはＴｅＩＮプロテロメラーゼと
を含むキットオブパーツ。

定義
本発明の方法、組成物、使用及び他の態様に関する各種用語は、本明細書及び特許請求の範囲の全体にわたって使用される。そのような用語には、特段の明示のない限り、本発明が関係する技術分野における通常の意味が付与されるものとする。他の詳細に定義された用語は、本明細書で提供された定義と一致する方法で解釈されるものとする。本明細書に記載のものと類似の又は同等の任意の方法及び材料を本発明の試験の実施において使用することができ、好ましい材料及び方法は本明細書に記載されている。

本発明の方法において使用される従来の技術を実施する方法は、当業者には明らかである。分子生物学、生化学、計算化学、細胞培養、組換えＤＮＡ、バイオインフォマティクス、ゲノミクス、配列決定及び関連する分野における従来の技術の実施は、当業者には周知であり、例えば、以下の文献：Ｓａｍｂｒｏｏｋら、ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ．ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，２ｎｄＥｄｉｔｉｏｎ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ，Ｎ．Ｙ．，１９８９；Ａｕｓｕｂｅｌら、ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，ＮｅｗＹｏｒｋ，１９８７及び定期的更新；並びにｔｈｅｓｅｒｉｅｓＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌｏｇｙ，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＳａｎＤｉｅｇｏで論じられている。

「Ａ」、「ａｎ」、及び「ｔｈｅ」：これらの単数形の用語は、文脈で特に明示されていない限り、複数の指示物を含む。したがって、例えば、「細胞（ａｃｅｌｌ）」への言及は、２つ以上の細胞の組合せなどを含む。

本明細書で使用される場合、用語の「約」とは、わずかな変動を記載及び説明するために使用される。例えば、この用語は、±１０％以下、例えば、±５％以下、±４％以下、±３％以下、±２％以下、±１％以下、±０．５％以下、±０．１％、又は±０．０５％以下を意味し得る。さらに、量、比率、及び他の数値が本明細書において範囲形式で示されている場合がある。そのような範囲形式は、便宜的且つ簡潔にするために使用されており、範囲の制限として明示的に示した数値を含むように柔軟に理解されるべきであるが、あたかも各数値及び部分的範囲が明示的に示されているように、その範囲内に含まれるすべての個々の数値又は部分的範囲もまた含むように理解されたい。例えば、約１～約２００の範囲の比は、約１～約２００の明示的に記載された範囲を含むが、約２、約３、及び約４などの個々の比、並びに約１０～約５０、約２０～約１００などの部分的範囲も含むものと理解されたい。

本明細書で使用される場合、用語の「アダプター」とは、好ましくは限定された長さ、例えば約１０～約２００、若しくは約１０～約１００塩基を有するか、又は約１０～約８０、若しくは約１０～約５０、若しくは約１０～約３０塩基対の長さを有する、他の核酸の末端に、例えば、二本鎖ＤＮＡ分子の一方の鎖又は両方の鎖に結合され得る、好ましくは連結され得る一本鎖、二本鎖、部分的二本鎖、Ｙ字型又はヘアピン核酸分子であり、好ましくは化学的に合成される。アダプターの二本鎖構造は、相互に塩基対を形成する２つの別個のオリゴヌクレオチド分子によって、又は単一オリゴヌクレオチド鎖のヘアピン構造によって形成され得る。明らかなように、アダプターの結合可能な末端は、制限酵素及び／又はプログラム可能なヌクレアーゼによる切断で生じるオーバーハングと互換性があるように、任意選択で連結可能であるように設計することができるか、非鋳型伸長反応の付加（例えば、３’－Ａ付加）の後に生成されたオーバーハングと互換性があるように設計することができるか、又は平滑末端を有し得る。

「及び／又は」：用語の「及び／又は」とは、１つ又は複数の記載した事例が単独で、又は記載した事例の少なくとも１つと組み合わせて、記載したすべての事例に至るまで起こり得る状況を意味する。

核酸又は核酸反応に関して使用される「増幅」とは、特定の核酸、例えば、標的核酸又はタグ付き核酸などのコピーを作製するｉｎｖｉｔｒｏの方法を意味する。核酸を増幅する多数の方法が当技術分野では公知であり、増幅反応には、ポリメラーゼ連鎖反応、リガーゼ連鎖反応、鎖置換増幅反応、ローリングサークル増幅反応、転写介在増幅法、例えばＮＡＳＢＡ（例えば、米国特許第５，４０９，８１８号）、ループ介在増幅法（例えば、米国特許第６，４１０，２７８号に記載されているようなループ形成配列を使用する「ＬＡＭＰ」増幅）、及び等温増幅反応が含まれる。増幅される核酸は、ＤＮＡ若しくはＲＮＡ、又は修飾されたＤＮＡ及び／若しくはＲＮＡを含む、ＤＮＡとＲＮＡの混合物を含むか、それらからなるか、又はそれらに由来するＤＮＡであり得る。１つ又は複数の核酸分子の増幅から生じる産物（すなわち「増幅産物」）は、出発核酸がＤＮＡ、ＲＮＡ、又はその両方であるかどうかにかかわらず、ＤＮＡ若しくはＲＮＡのいずれか、又はＤＮＡ及びＲＮＡのヌクレオシド若しくはヌクレオチドの両方の混合物であり得、又はそれらは修飾されたＤＮＡ若しくはＲＮＡのヌクレオシド若しくはヌクレオチドを含み得る。

「コピー」とは、限定するものではないが、特定の配列に対して完全な配列相補性又は完全な配列同一性を有する配列であり得る。或いは、コピーは、必ずしもこの特定の配列に対して完全な配列相補性又は同一性を有するわけではなく、例えば、ある程度の配列変異は許容される。例えば、コピーは、ヌクレオチド類似体、例えば、デオキシイノシン若しくはデオキシウリジン、意図的な配列改変（例えば、特定の配列にハイブリダイズ可能であるが相補的ではない配列を含むプライマーを介して導入される配列改変）、及び／又は増幅中に生じる配列エラーを含み得る。

用語の「相補性」とは、本明細書では、完全に相補的な鎖（例えば、第２の鎖又は逆鎖）に対する配列の配列同一性として定義される。例えば、１００％相補的（又は完全に相補的）である配列は、本明細書では、相補鎖と１００％の配列同一性を有するものと理解され、例えば、８０％相補的である配列は、本明細書では、（完全に）相補的な鎖に対して８０％の配列同一性を有するものと理解される。

「含む」：この用語は、包括的で制限はなく、排他的ではないと解釈される。詳しくは、この用語及びその変化形は、指定した特徴、ステップ、又は構成要素が含まれることを意味する。これらの用語は、他の特徴、ステップ、又は構成要素の存在を排除するものと解釈されるべきではない。

「構築物」又は「核酸構築物」又は「ベクター」：これは、組換えＤＮＡ技術の使用によって得られる人工核酸分子を意味し、多くの場合、構築物に含まれるＤＮＡ領域を宿主細胞で発現させる目的で、外因性ＤＮＡを宿主細胞に送達するために使用され得る。構築物のベクター骨格は、例えば、（キメラ）遺伝子が組み込まれているプラスミドであってもよく、又は適切な転写調節配列が既に存在している場合（例えば（誘導性）プロモーター）、所望のヌクレオチド配列（例えばコード配列）のみが転写調節配列の下流に組み込まれる。ベクターは、分子クローニングにおけるそれらの使用を容易にするために、さらなる遺伝要素、例えば、選択可能なマーカー、複数のクローニング部位などを含むことができる。

本明細書で使用される場合、用語の「二本鎖」及び「二重鎖」とは、塩基対を形成する、すなわち、一緒にハイブリダイズする２つの相補ポリヌクレオチドを述べている。相補ヌクレオチド鎖は、当技術分野では逆相補としても公知である。

用語の「有効量」とは、本明細書で使用される場合、所望の生物学的効果を誘発するのに十分である生物学的活性剤の量を意味する。例えば、いくつかの実施形態では、エキソヌクレアーゼの有効量は、保護されていない核酸の切断を誘導するのに十分なエキソヌクレアーゼの量を意味することができる。当業者には明らかであるように、薬剤の有効量は、様々な要因、例えば使用される薬剤、薬剤が使用される条件、及び所望の生物学的効果、例えば、検出されるヌクレアーゼ切断の程度などに応じて変動し得る。

「例示的」：この用語は「例、事例、又は実例として有用である」ことを意味し、本明細書で開示されている他の構成を排除するものと解釈されるべきではない。

「発現」：これは、適切な調節領域、特にプロモーターに作動可能に連結されているＤＮＡ領域が、次にタンパク質又はペプチドに翻訳され得るＲＮＡに転写されるプロセスを意味する。

「ガイド配列」とは、本明細書では、ＲＮＡ又はＤＮＡ誘導型エンドヌクレアーゼをＲＮＡ又はＤＮＡ分子中の特定の部位に向ける配列として理解されたい。ｇＲＮＡ－ＣＡＳ複合体の文脈において、「ガイド配列」は、本明細書では、ｇＲＮＡ－ＣＡＳ複合体を二重鎖ＤＮＡ中の特定の部位に標的化するために必要とされる、ｓｇＲＮＡ又はｃｒＲＮＡのセクションとしてさらに理解されたい。

ｇＲＮＡ－ＣＡＳ複合体は、本明細書では、ＣＲＩＳＰＲ－エンドヌクレアーゼ又はＣＲＩＳＰＲ－ヌクレアーゼとも呼ばれ、ガイドＲＮＡと複合体化又はハイブリダイズされ、そのガイドＲＮＡはｃｒＲＮＡ及び／又はｔｒａｃｒＲＮＡ、又はｓｇＲＮＡであり得る、ＣＡＳタンパク質であると理解されたい。

「同一性」及び「類似性」は、公知の方法により容易に算出することができる。「配列同一性」及び「配列類似性」は、グローバル又はローカルアラインメントアルゴリズムを使用し、２つの配列の長さに応じて、２つのペプチド配列又は２つのヌクレオチド配列のアラインメントによって決定することができる。同様の長さの配列は、好ましくは、配列を全長にわたり最適に整列するグローバルアラインメントアルゴリズム（例えば、ＮｅｅｄｌｅｍａｎＷｕｎｓｃｈ）を使用して整列されるが、実質的に異なる長さの配列は、好ましくは、ローカルアライメントアルゴリズム（例えば、ＳｍｉｔｈＷａｔｅｒｍａｎ）を使用して整列される。配列は、（例えば、デフォルトパラメータを使用してプログラムＧＡＰ又はＢＥＳＴＦＩＴにより最適に整列される場合に）、（下記で定義した）配列同一性の少なくとも特定のパーセンテージを共有する場合、「実質的に同一の」又は「本質的に類似の」と呼ばれ得る。ＧＡＰは、Ｎｅｅｄｌｅｍａｎ及びＷｕｎｓｃｈのグローバルアライメントアルゴリズムを使用して、２つの配列をその全長（完全長）にわたり整列し、一致の数を最大化し、ギャップの数を最小化する。グローバルアライメントは、２つの配列が類似の長さを有する場合に配列の同一性を決定するのに適切に使用される。一般的には、ＧＡＰデフォルトパラメータは、ギャップ作成ペナルティ（ｇａｐｃｒｅａｔｉｏｎｐｅｎａｌｔｙ）＝５０（ヌクレオチド）／８（タンパク質）及びギャップ伸長ペナルティ（ｇａｐｅｘｔｅｎｓｉｏｎｐｅｎａｌｔｙ）＝３（ヌクレオチド）／２（タンパク質）と共に使用される。ヌクレオチドの場合、使用されるデフォルトスコアリングマトリックスはｎｗｓｇａｐｄｎａであり、タンパク質の場合、デフォルトスコアリングマトリックスはＢｌｏｓｕｍ６２である（Ｈｅｎｉｋｏｆｆ＆Ｈｅｎｉｋｏｆｆ、１９９２、ＰＮＡＳ８９、９１５～９１９）。配列アラインメント及び配列同一性パーセンテージのスコアは、コンピュータープログラム、例えば、ＡｃｃｅｌｒｙｓＩｎｃ．，９６８５ＳｃｒａｎｔｏｎＲｏａｄ，ＳａｎＤｉｅｇｏ，ＣＡ９２１２１－３７５２ＵＳＡから入手可能なＧＣＧＷｉｓｃｏｎｓｉｎＰａｃｋａｇｅ、バージョン１０．３を使用し、又はオープンソースソフトウェア、例えば、上記のＧＡＰと同じパラメータを使用するか、若しくはデフォルト設定を使用するＥｍｂｏｓｓＷＩＮバージョン２．１０．０のプログラム「ｎｅｅｄｌｅ」（グローバルＮｅｅｄｌｅｍａｎＷｕｎｓｃｈアルゴリズムを使用）若しくは「ｗａｔｅｒ」（ローカルＳｍｉｔｈＷａｔｅｒｍａｎアルゴリズムを使用）を使用して決定することができる（「ｎｅｅｄｌｅ」及び「ｗａｔｅｒ」の両方、並びにタンパク質アラインメント及びＤＮＡアライメントの両方において、デフォルトギャップ作成ペナルティは１０．０であり、デフォルトギャップ伸長ペナルティは０．５である；デフォルトスコアリングマトリックスは、タンパク質についてはＢｌｏｓｕｍ６２であり、ＤＮＡについてはＤＮＡＦｕｌｌである）。配列が実質的に異なる全長を有する場合は、ローカルアラインメント、例えばＳｍｉｔｈＷａｔｅｒｍａｎアルゴリズムを使用するものが好ましい。

或いは、類似性又は同一性のパーセンテージは、アルゴリズム、例えばＦＡＳＴＡ、ＢＬＡＳＴなどを使用して、公共データベースに対して検索することにより決定することができる。したがって、本発明の核酸配列及びタンパク質配列は、「クエリ配列」としてさらに使用することができ、例えば、他のファミリーメンバー又は関連配列を同定するために、公共データベースに対して検索を実施することができる。このような検索は、Ａｌｔｓｃｈｕｌら（１９９０）Ｊ．Ｍｏｌ．Ｂｉｏｌ．２１５：４０３～１０のＢＬＡＳＴｎ及びＢＬＡＳＴｘプログラム（バージョン２．０）を使用して実施することができる。ＢＬＡＳＴヌクレオチド検索は、ＮＢＬＡＳＴプログラム、スコア＝１００、ワード長＝１２を用いて実施し、本発明の核酸分子に相同なヌクレオチド配列を得ることができる。ＢＬＡＳＴタンパク質検索は、ＢＬＡＳＴｘプログラム、スコア＝５０、ワード長＝３を用いて実施し、本発明のタンパク質分子に相同なアミノ酸配列を得ることができる。比較の目的でギャップを加えたアライメントを得るには、Ａｌｔｓｃｈｕｌら，（１９９７）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２５（１７）：３３８９～３４０２に記載のように、ＧａｐｐｅｄＢＬＡＳＴを利用することができる。ＢＬＡＳＴ及びＧａｐｐｅｄＢＬＡＳＴのプログラムを利用する場合、それぞれのプログラムのデフォルトパラメータ（例えば、ＢＬＡＳＴｘ及びＢＬＡＳＴｎ）を使用することができる。ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／の米国国立バイオテクノロジー情報センター（ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ）のホームページを参照されたい。

用語の「ヌクレオチド」には、限定するものではないが、グアニン、シトシン、アデニン、及びチミン（それぞれ、Ｇ、Ｃ、Ａ及びＴ）を含む、天然に存在するヌクレオチドが含まれる。用語の「ヌクレオチド」とは、公知のプリン塩基及びピリミジン塩基だけでなく、修飾された他の複素環式塩基も含むそれらの部分を含むことをさらに意図する。そのような修飾には、メチル化されたプリン又はピリミジン、アシル化されたプリン又はピリミジン、アルキル化されたリボース又は他の複素環が含まれる。さらに、用語の「ヌクレオチド」には、ハプテン又は蛍光標識を含み、従来のリボース及びデオキシリボース糖だけでなく、他の糖も同様に含み得るそれらの部分が含まれる。修飾されたヌクレオシド又はヌクレオチドはまた、糖部分の修飾を含み、例えば、１つ若しくは複数のヒドロキシル基がハロゲン原子若しくは脂肪族基で置き換えられているか、又はエーテル、アミンなどとして官能基化されている。

用語の「核酸」、「ポリヌクレオチド」及び「核酸分子」とは、本明細書では互換的に使用され、ヌクレオチド、例えば、デオキシリボヌクレオチド又はリボヌクレオチドからなる任意の長さのポリマー、例えば、約２塩基より大きく、約１０塩基より大きく、約１００塩基より大きく、約５００塩基より大きく、１０００塩基より大きく、最大約１０，０００又はそれ以上の塩基のポリマーのことを記述し、酵素的又は合成的に生成され得る（例えば、米国特許第５，９４８，９０２号及び本明細書で引用されている参考文献に記載されているＰＮＡ）。核酸は、天然に存在する２つの核酸の配列に類似する配列特異的な方法で天然に存在する核酸とハイブリダイズすることができ、例えば、ワトソン－クリック型塩基対形成の相互作用に関与し得る。さらに、核酸及びポリヌクレオチドは、細胞、組織、及び／又は体液から単離することができる（また任意選択で、断片化することができる）。核酸は、例えば、ゲノムＤＮＡ（ｇＤＮＡ）、ミトコンドリア、無細胞ＤＮＡ（ｃｆＤＮＡ）、ライブラリー由来のＤＮＡ及び／又はライブラリー由来のＲＮＡであり得る。

本明細書で使用される場合、用語の「核酸サンプル」又は「核酸を含むサンプル」とは、核酸を含む任意のサンプルを示し、サンプルは、典型的には、必ずではないが、液体の形態中に、１つ又は複数の目的の核酸分子を含む材料又は材料の混合物に関する。１つ又は複数の目的の核酸分子は、好ましくは、目的の配列を含む。目的の核酸分子は、好ましくは、本明細書で定義した第１の核酸分子又は第２の核酸分子である。核酸サンプルは、好ましくは、目的の配列を含む。本発明の方法において出発物質として使用される核酸サンプルは、任意の供給源、例えば、全ゲノム、染色体のコレクション、単一の染色体、１つ又は複数の染色体又は転写された遺伝子に由来する１つ又は複数の領域からのものであってもよく、生物学的供給源又は実験的供給源、例えば、核酸ライブラリーから直接精製され得る。核酸サンプルは、ヒト若しくは他の種（例えば、植物、細菌、真菌、藻類、古細菌など）であり得る同じ個体から、又は同じ種の異なる個体から、又は異なる種の異なる個体から得ることができる。例えば、核酸サンプルは、細胞、組織、生検、体液、ゲノムＤＮＡライブラリー、ｃＤＮＡライブラリー及び／又はＲＮＡライブラリー由来のものであり得る。核酸サンプルは、好ましくは、少なくとも第１の核酸分子及び第２の核酸分子を含む。

用語の「目的の配列」とは、限定するものではないが、細胞内に好ましくは存在する任意の遺伝子配列、例えば、遺伝子、遺伝子の一部、又は遺伝子内の若しくは遺伝子に隣接する非コード配列などを含む。目的の配列は、染色体、エピソーム、オルガネラゲノム、例えば、ミトコンドリアゲノム若しくは葉緑体ゲノム、又は遺伝物質の本体とは独立して存在することができる遺伝物質、例えば、感染ウイルスゲノム、プラスミド、エピソーム、トランスポゾンなどに存在し得る。目的の配列は、遺伝子のコード配列内、転写された非コード配列内、例えば、リーダー配列、トレーラー配列又はイントロン内にあり得る。前記の目的の核酸配列は、二本鎖核酸又は一本鎖核酸に存在し得る。好ましくは、目的の配列は、第１の核酸分子又は第２の核酸分子に存在する。

目的の配列は、限定するものではないが、多型、例えばＳＮＰを有するか、又は有することが疑われる配列であり得る。

本明細書で使用される場合、用語の「オリゴヌクレオチド」とは、ヌクレオチドの、好ましくは約２～２００ヌクレオチド、又は最大５００ヌクレオチドの長さの一本鎖多量体を意味する。オリゴヌクレオチドは合成であってもよく、又は酵素的に作製されてもよく、いくつかの実施形態では、約１０～５０ヌクレオチドの長さである。オリゴヌクレオチドは、リボヌクレオチド単量体（すなわち、オリゴリボヌクレオチドであり得る）又はデオキシリボヌクレオチド単量体を含み得る。オリゴヌクレオチドは、例えば、約１０～２０、２０～３０、３０～４０、４０～５０、５０～６０、６０～７０、７０～８０、８０～１００、１００～１５０、１５０～２００、又は約２００～２５０ヌクレオチドの長さであり得る。

「植物」：これは、植物細胞、植物プロトプラスト、植物が再生され得る植物細胞組織培養物、植物カルス、植物塊、及び植物又は植物の一部、例えば胚、花粉、胚珠、種子、葉、花、枝、果実、穀粒、穂、穂軸、殻、茎、根、根端、葯、粒などの無傷の植物細胞を含む。植物の非限定的な例としては、作物及び栽培植物、例えば、大麦、キャベツ、キャノーラ、キャッサバ、カリフラワー、チコリ、ワタ、キュウリ、ナス、ブドウ、トウガラシ、レタス、トウモロコシ、メロン、アブラナ、ジャガイモ、カボチャ、米、ライムギ、モロコシ、カボチャ、サトウキビ、テンサイ、ヒマワリ、ピーマン、トマト、スイカ、小麦、及びズッキーニなどが挙げられる。

「プロトスペーサー配列」は、ガイドＲＮＡ、より詳しくはｃｒＲＮＡ、又はｓｇＲＮＡの場合にはガイドＲＮＡのｃｒＲＮＡ部分内のガイド配列に認識又はハイブリダイズされ得る配列である。本発明の文脈における「プロトスペーサー配列」は、標的配列、つまり本明細書で定義した第１又は第２の核酸分子に存在する配列の例であることが本明細書では理解される。

「エンドヌクレアーゼ」は、その標的部位又は認識部位に結合した際、二重鎖ＤＮＡのうちの少なくとも１つの鎖又はＲＮＡ分子の鎖を加水分解する酵素である。エンドヌクレアーゼは、本明細書では、部位特異的エンドヌクレアーゼと理解されたく、用語の「エンドヌクレアーゼ」及び「ヌクレアーゼ」は、本明細書では互換的に使用される。制限エンドヌクレアーゼは、本明細書では、二重鎖の両鎖を同時に加水分解し、ＤＮＡに二本鎖切断を導入するエンドヌクレアーゼとして理解されたい。「ニッキング」エンドヌクレアーゼは、二重鎖の１つの鎖のみを加水分解し、切断されるというよりはむしろ「切れ目が入れられた」ＤＮＡ分子を生成するエンドヌクレアーゼである。

「エキソヌクレアーゼ」は、本明細書では、ポリヌクレオチドの末端（エキソ）から１つ又は複数のヌクレオチドを切断する任意の酵素として定義される。

「複雑性を低減すること」又は「複雑性の低減」とは、本明細書では、複雑な核酸サンプル、例えば、ゲノムＤＮＡに由来するサンプル、リキッドバイオプシーに由来するｃｆＤＮＡ、単離されたＲＮＡサンプルなどの低減として理解するものとする。複雑性の低減は、好ましくは複雑な出発物質内に含まれる目的の配列を含む１つ若しくは複数の特異的な核酸の濃縮、及び／又はサンプルのサブセットの生成をもたらし、サブセットは、好ましくは複雑な出発物質内に含まれる目的の配列を含む１つ若しくは複数の特異的な核酸を含むか又はからなり、好ましくは目的の配列を含まない非特異的核酸は、出発物質中の非特異的核酸の量と比較して、つまり複雑性の低減前と比較して、量が少なくとも２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％又は９９％低減される。

複雑性の低減は、一般に、さらなる分析ステップ又は方法ステップ、例えば、増幅、バーコード、シーケンシング、エピジェネティック変化の決定などの前に実施される。好ましくは、複雑性の低減は、再現可能な複雑性の低減であり、これは、同じサンプルの複雑性が同じ方法を使用して低減される場合、ランダムな複雑性の低減とは対照的に、同じか又は少なくとも同等のサブセットが得られることを意味する。

複雑性の低減方法の例としては、例えば、ＡＦＬＰ（登録商標）（ＫｅｙｇｅｎｅＮ．Ｖ．，ｔｈｅＮｅｔｈｅｒｌａｎｄｓ；例えば、欧州特許第０５３４８５８号を参照されたい）、任意プライムＰＣＲ増幅、キャプチャープローブハイブリダイゼーション、Ｄｏｎｇにより記載されている方法（例えば、国際公開第０３／０１２１１８号、国際公開第００／２４９３９号を参照されたい）、及び指標付け連結（ＵｎｒａｕＰ．及びＤｅｕｇａｕＫ．Ｖ．（１９９４）Ｇｅｎｅ１４５：１６３～１６９）、国際公開第２００６／１３７７３３号；国際公開第２００７／０３７６７８号；国際公開第２００７／０７３１６５号；国際公開第２００７／０７３１７１号、米国特許出願公開第２００５／２６０６２８号、国際公開第０３／０１０３２８号、米国特許出願公開第２００４／１０１５３号に記載されている方法、ゲノム分割（例えば、国際公開第２００４／０２２７５８号を参照されたい）、遺伝子発現連続分析（ＳＡＧＥ；例えば、Ｖｅｌｃｕｌｅｓｃｕら，１９９５，上記を参照、及びＭａｔｓｕｍｕｒａら，１９９９，ＴｈｅＰｌａｎｔＪｏｕｒｎａｌ，ｖｏｌ．２０（６）：７１９～７２６を参照されたい）及びＳＡＧＥの変法（例えば、Ｐｏｗｅｌｌ，１９９８，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，ｖｏｌ．２６（１４）：３４４５～３４４６；並びにＫｅｎｚｅｌｍａｎｎ及びＭｕｈｌｅｍａｎｎ，１９９９，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，ｖｏｌ．２７（３）：９１７～９１８を参照されたい）、ＭｉｃｒｏＳＡＧＥ（例えば、Ｄａｔｓｏｎら，１９９９，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，ｖｏｌ．２７（５）：１３００～１３０７を参照されたい）超並列シグネチャーシーケンシング（ＭａｓｓｉｖｅｌｙＰａｒａｌｌｅｌＳｉｇｎａｔｕｒｅＳｅｑｕｅｎｃｉｎｇ）（ＭＰＳＳ；例えば、Ｂｒｅｎｎｅｒら，２０００，ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ，ｖｏｌ．１８：６３０～６３４、及びＢｒｅｎｎｅｒら，２０００，ＰＮＡＳ，ｖｏｌ．９７（４）：１６６５～１６７０を参照されたい）、自己サブトラクト型ｃＤＮＡライブラリー（Ｌａｖｅｄｅｒら，２００２，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，ｖｏｌ．３０（９）：ｅ３８）、リアルタイム多重連結依存プローブ増幅（ＲＴ－ＭＬＰＡ；例えば、Ｅｌｄｅｒｉｎｇら，２００３，ｖｏｌ．３１（２３）：ｅｌ５３を参照されたい）、高カバー率発現プロファイリング（ＨｉＣＥＰ；例えば、Ｆｕｋｕｍｕｒａら，２００３，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，ｖｏｌ．３１（１６）：ｅ９４を参照されたい）、Ｒｏｔｈら（Ｒｏｔｈら，２００４，ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ，ｖｏｌ．２２（４）：４１８～４２６）に開示されているユニバーサルマイクロアレイシステム、トランスクリプトームサブトラクション法（例えば、Ｌｉら，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，ｖｏｌ．３３（１６）：ｅｌ３６を参照されたい）、及び断片ディスプレイ（例えば、Ｍｅｔｓｉｓら，２００４，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，ｖｏｌ．３２（１６）：ｅｌ２７を参照されたい）が挙げられる。

「配列」又は「ヌクレオチド配列」：これは、核酸の又は核酸内のヌクレオチドの順序を意味する。言い換えると、核酸のヌクレオチドの任意の順序は、配列又は核酸配列と呼ぶことができる。例えば、標的配列は、ＤＮＡ二重鎖の一本鎖に含まれるヌクレオチドの順序である。

用語の「配列決定」とは、本明細書で使用される場合、ポリヌクレオチドの少なくとも１０個の連続するヌクレオチドの同一性（例えば、少なくとも２０個、少なくとも５０個、少なくとも１００個、又は少なくとも２００個以上の連続するヌクレオチドの同一性）が得られる方法を意味する。用語の「次世代配列決定」とは、例えば、現在Ｉｌｌｕｍｉｎａ、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ、ＰａｃＢｉｏ及びＲｏｃｈｅなどによって採用されているような、いわゆる並列化された合成による配列決定又はライゲーションプラットフォームによる配列決定を意味する。次世代配列決定法には、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＯＮＴ）によって商品化されたようなナノポアシーケンシング法、又はＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓによって商品化されたＩｏｎＴｏｒｒｅｎｔテクノロジーなどの電子検出ベースの方法も含まれ得る。好ましくは、次世代配列決定法は、ナノポアシーケンシング法、好ましくはナノポア選択的シーケンシング法である。

「ナノポア選択的シーケンシング」は、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ又はＯｎｔｅｒａなどのナノポアシーケンシング技術を使用してリアルタイムで単一分子を選択的に配列決定し、非標的配列を拒絶するために、ストリーミングナノポア電流シグナル又は塩基コールを参照配列にマッピングすることであると理解されるべきである。シーケンサーは、生成されているデータに応じて、核酸の配列決定を追求するか、又は終了して、非標的分子を排出しナノポアが新しい配列決定読み取りに利用可能になるのに十分な特定の短い期間にわたって特定のポアの電圧の極性を反転させることによって核酸を配列決定ポアから除去するかのいずれかを行うように操作される。ナノポア選択的シーケンシング法の例は、Ｐａｙｎｅら、２０２０（Ｎａｎｏｐｏｒｅａｄａｐｔｉｖｅｓｅｑｕｅｎｃｉｎｇｆｏｒｍｉｘｅｄｓａｍｐｌｅｓ，ｗｈｏｌｅｅｘｏｍｅｃａｐｔｕｒｅａｎｄｔａｒｇｅｔｅｄｐａｎｅｌｓ，Ｆｅｂｒｕａｒｙ３，２０２０；ＤＯＩ：１０．１１０１／２０２０．０２．０３．９２６９５６）及びＫｏｖａｋａら、２０２０（Ｔａｒｇｅｔｅｄｎａｎｏｐｏｒｅｓｅｑｕｅｎｃｉｎｇｂｙｒｅａｌ－ｔｉｍｅｍａｐｐｉｎｇｏｆｒａｗｅｌｅｃｔｒｉｃａｌｓｉｇｎａｌｗｉｔｈＵＮＣＡＬＬＥＤ，Ｆｅｂｒｕａｒｙ３，２０２０；ｄｏｉ：１０．１１０１／２０２０．０２．０３．９３１９２３）に記載されている。これら文献は、参照により本明細書に組み込まれる。

本発明の文脈における「第１の核酸分子」は、一本鎖又は二本鎖の核酸の、より小さな若しくはより長いストレッチ又は選択された部分であり得る。本発明の方法を実施する前は、第１の核酸分子は、より大きな核酸分子内に、例えば、分析しようとするサンプル中に存在するより大きな核酸分子内に含まれ得る。好ましくは、第１の核酸分子は、第１の標的配列を含む。

本発明の文脈における「第２の核酸分子」は、一本鎖又は二本鎖の核酸の、より小さな若しくはより長いストレッチ又は選択された部分であり得る。本発明の方法を実施する前は、第２の核酸分子は、より大きな核酸分子内に、例えば、分析しようとするサンプル中に存在するより大きな核酸分子内に含まれ得る。第１の核酸分子は、同じより大きな核酸分子に存在し得る。或いは、第１及び第２の核酸分子は、別々のより大きな核酸分子に存在し、別々のより大きな核酸分子は、同じサンプルに存在する。いくつかの実施形態において、第２の核酸分子は、第２の標的配列を含み得る。

第１及び第２の核酸分子のうちの少なくとも１つは、目的の配列を含み得る。好ましくは、第１の核酸分子は、目的の配列を含む。代替的な実施形態では、第２の核酸分子は、目的の配列を含む。

目的の配列は、核酸サンプル内の任意の配列、例えば、遺伝子、遺伝子複合体、遺伝子座、偽遺伝子、調節領域、高度反復性領域、多型領域、又はそれらの一部であり得る。目的の配列はまた、表現型又は疾患を示す遺伝的変異又はエピジェネティック変異を含む領域であり得る。目的の配列は、好ましくは、限定するものではないが、コピー、増幅、配列決定、及び／又は核酸調査のための他の手順などの、さらなる分析又は作用の対象である。

「標的配列」は、本明細書では、本明細書で定義した第１又は第２の核酸分子に存在する配列であると定義され、この配列は、本明細書で定義したヌクレアーゼ及びニッカーゼのうちの少なくとも１つによって認識される。

いくつかの態様では、本発明の方法で使用される核酸分子の複数又は「セット」は、濃縮のために選択される１つ又は複数の目的の配列を含む。任意選択で、そのようなセットは、構造的又は機能的に関連する核酸分子からなる。本発明の文脈における核酸分子は、限定するものではないが、ＤＮＡ、ＲＮＡ、ＢＮＡ（架橋核酸）、ＬＮＡ（ロックド核酸）、ＰＮＡ（ペプチド核酸）、モルホリノ核酸、グリコール核酸、スレオス核酸、メチル化ＤＮＡなどのエピジェネティック的に修飾されたヌクレオチド、並びにそれらの模倣体及び組合せを含む、天然及び非天然両方の人工又は非標準のヌクレオチドを含み得る。

好ましくは、目的の配列は、二重鎖ＤＮＡの一本鎖のヌクレオチドの小さな又はより長い連続ストレッチ（つまりポリヌクレオチド）であり、前記二重鎖ＤＮＡは、目的の配列に対して相補的な配列を含む相補鎖をさらに含む。好ましくは、前記二重鎖ＤＮＡは、ゲノムＤＮＡ（ｇＤＮＡ）及び／又は無細胞ＤＮＡ（ｃｆＤＮＡ）である。

発明の詳細な説明

本発明者らは、プロテロメラーゼ認識部位を含むアダプターをライブラリー調製のために使用し得ることを発見した。特に、プロテロメラーゼ酵素の認識部位を含むアダプターを、核酸分子に連結することができ、こうした核酸分子は、二本鎖であるか又はアダプター連結後に二本鎖になるかのいずれかである。その後、こうしたアダプターはプロテロメラーゼ酵素によって切断され、同時に核酸分子の末端が共有結合で閉端される。核酸分子の両末端がこのように閉端されている場合、分子は、遊離「末端」ヌクレオチドを欠如するため、エキソヌクレアーゼ分解から保護される。

対応する上鎖の３’末端ヌクレオチドが、対応する下鎖の５’末端ヌクレオチドに共有結合で連結されている二本鎖核酸の末端は、本明細書では「閉端末端」であると注釈付けされる。同様に、対応する上鎖の５’末端ヌクレオチドが、対応する下鎖の３’末端ヌクレオチドに共有結合で連結されている二本鎖核酸の末端も、本明細書では「閉端末端」であると注釈付けされる。したがって、「閉端末端」は、反対側の鎖の末端核酸が互いに共有結合で連結されていない二本鎖核酸の末端であると本明細書では理解される「開端末端」とは対照的に、反対側の鎖の末端核酸が互いに共有結合で連結されている二本鎖核酸の末端であると本明細書では理解される。

本明細書に詳述されている新規のライブラリー調製方法の場合、好ましくは、特定の核酸サンプルに存在する核酸分子はすべて、プロテロメラーゼアダプターで両側がタグ付けされており、したがってプロテロメラーゼ処理時に切断されて、５’又は３’修飾酵素に非感受性である共有結合で閉端された核酸分子がもたらされる。プロテロメラーゼ処理サンプルのエキソヌクレアーゼ処理の任意選択ステップを追加して、両末端が共有結合で閉端されていないあらゆる考え得る核酸分子を除去することができる。その後、（共有結合で閉端された）核酸分子を、例えば、標的化又はプログラム可能なエンドヌクレアーゼを使用することによって選択的に開端することができる。すべての核酸分子が依然として反応混合物中に存在するものの、例えば、配列決定アダプターを開端末端に連結して、それによりこうした開端断片を配列決定に直ぐ使えるように選択的に準備することによって、最後の開端反応で切断されたものだけを、その後の（配列決定）プロセスで使用することができる。或いは、エキソヌクレアーゼ処理を使用して開端断片を分解し、それによりさらなる処理のために未開端核酸分子を濃縮してもよい。例えば、こうした未開端分子は、例えば、こうした未開端分子を標的とするプログラム可能なエンドヌクレアーゼを使用して、第２ラウンドの選択的開端で開端することができる。

上記で言及したアプローチは、少なくとも以下の利点を有する。

核酸分子の末端にバーコードを付加し、その後サンプルをプールすることができ、その後でさらなるサンプル調製ステップが実施される。

通常は１標的遺伝子座当たり２つのｇＲＮＡが使用されるのとは対照的に、遺伝子座の標的化には単一のＣＲＩＳＰＲ酵素／ガイド複合体しか必要とされない。

このアプローチは、原理的に、配列決定プラットフォームに依存しない。

このアプローチを使用すると、増幅ステップを用いずに核酸分子を標的とすることでき、それにより天然塩基修飾の検出が可能になる。

言及したアプローチは、任意の長さの核酸分子に、つまり短い分子（＜１Ｋｂｐ）又は長い分子（＞５Ｋｂｐ）に適用することができる。

したがって、第１の態様では、本発明は、プロテロメラーゼ認識配列を含むアダプターに関する。好ましくは、アダプターは、ＴｅＩＮプロテロメラーゼ認識配列を含む。好ましくは、アダプターは、本発明の方法で使用するためのものである。好ましくは、アダプターは、本発明の方法で使用される核酸分子に連結することができる。

アダプターは一本鎖であってもよい。一本鎖アダプターは、好ましくは、本発明の方法で使用される核酸分子にハイブリダイズすることが可能なセクションを好ましくはその３’末端に含む。一本鎖アダプターは、好ましくは、核酸分子の一本鎖オーバーハングに、好ましくは、核酸分子の３’オーバーハングにハイブリダイズすることができる。アニーリングした一本鎖アダプターの一本鎖部分は、その後、限定するものではないが、クレノウ（当業者には、５’－＞３’ポリメラーゼ活性及び３’－＞５’エキソヌクレアーゼ活性を有するが５’－＞３’エキソヌクレアーゼ活性を欠如することが知られている）又はＢｓｔ－ポリメラーゼ（当業者には、５’－＞３’ポリメラーゼ活性及び鎖置換活性を有するが、３’－＞５’エキソヌクレアーゼ活性を欠如する、バチルス・ステアロサーモフィルス（Ｂａｃｉｌｌｕｓｓｔｅａｒｏｔｈｅｒｍｏｐｈｉｌｕｓ）に由来するＤＮＡポリメラーゼであることが知られている）などのポリメラーゼを使用して補充することができる、つまり二本鎖にすることができる。補充ステップは、任意選択で、二本鎖プロテロメラーゼ認識配列の生成をもたらす。

好ましくは、アダプターは、少なくとも部分的に二本鎖である。本明細書で定義した本発明の方法では、少なくとも部分的に二本鎖のアダプターを核酸分子に連結することができる。好ましくは、アダプターのヌクレオチドのうちの少なくとも１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、又は１００％は、二本鎖である。好ましくは、プロテロメラーゼ認識配列は、二本鎖である。アダプターは、１００％又は「完全に」二本鎖であってもよい。アダプターは、アダプターを核酸分子に連結した後で、例えばＤＮＡポリメラーゼを使用してアダプターの一本鎖部分を補充することによって、完全に二本鎖になり得る。

好ましくは、少なくとも部分的に二本鎖のアダプターは、互いに少なくとも部分的にアニーリングすることができる２つの一本鎖分子を含み、つまり二本鎖アダプターは、好ましくは、本明細書で定義した核酸分子にアダプターを連結する前に２つの開端末端を含む。

少なくとも部分的に二本鎖のアダプターの一方の末端を核酸分子に連結することができる。したがって、好ましくは、核酸分子に連結されている少なくとも一方の末端は二本鎖である。アダプターの二本鎖末端の少なくとも一方の末端は、平滑末端又は付着末端又は「粘着」末端であり得る。好ましくは、アダプターは、少なくとも１つの付着末端を含む。好ましくは、核酸分子に連結されているアダプターの末端は、核酸分子の末端と適合する末端を有する。例えば、核酸分子がＡオーバーハングを有する末端を含む場合、アダプターは、好ましくは、Ｔオーバーハングを有する末端を含む。同様に、核酸分子が、酵素消化によって得られ、１、２、３、４、５つ又はそれ以上のヌクレオチドのオーバーハングが後とに残る場合、アダプターは、好ましくは、核酸分子のオーバーハングに相補的な、それぞれ１、２、３、４、５つ又はそれ以上のヌクレオチドのオーバーハングを含む。

アダプターの他方の末端は、好ましくは、核酸分子又はアダプターに連結され得ない。アダプター末端の連結を遮断する任意の手段が、本発明の方法での使用に適切である。非限定的な例として、アダプターの他方の末端は一本鎖であってもよく、又は非適合性のオーバーハングを含む。

本発明のアダプターは、プロテロメラーゼ認識配列、好ましくは、ＴｅＩＮプロテロメラーゼ認識配列を含む。プロテロメラーゼ認識配列は、ＤＮＡテンプレートにおけるその存在が、プロテロメラーゼの酵素活性による閉端された直鎖状のＤＮＡへの変換を可能にする任意のＤＮＡ配列である。言い換えれば、プロテロメラーゼ認識配列は、共有結合で閉端された直鎖状のＤＮＡを形成するためのプロテロメラーゼによる二本鎖ＤＮＡの切断及び再連結に必要である。典型的には、プロテロメラーゼ認識配列は、完全回文配列、つまり２重の回転対称性を有する二本鎖ＤＮＡ配列を含む。

完全逆方向リピートの長さは、特定の生物に応じて異なる。ボレリア・ブルグドルフェリ（Ｂｏｒｒｅｌｉａｂｕｒｇｄｏｒｆｅｒｉ）では、完全逆方向リピートは１４塩基対長である。様々な中温性バクテリオファージでは、完全逆方向リピートは、２２塩基対長又はそれよりも長い。また、いくつかの場合では、例えば、大腸菌（Ｅ．ｃｏｌｉ）Ｎ１５の場合では、中央完全逆方向回文配列は逆方向リピート配列に隣接し、つまりより大きな不完全逆方向回文配列の一部を形成する。

本発明で使用されるプロテロメラーゼ認識配列は、好ましくは、少なくとも１４塩基対長の二本鎖回文（完全逆方向リピート）配列を含む。好ましい完全逆方向リピート配列としては、配列番号１～９の配列及びそれらのバリアントが挙げられる。配列番号１（ＮＣＡＴＮＮＴＡＮＮＣＧＮＮＴＡＮＮＡＴＧＮ）は、２２塩基コンセンサス配列である。例えば、国際公開第２０１０／０８６６２６号に開示の通り、完全逆方向リピートの塩基対は特定の位置が保存されているが、配列は他の位置では柔軟性である可能性がある。したがって、好ましくは、配列番号１は、本発明の方法においてプロテロメラーゼと共に使用するための完全逆方向リピート配列の最小コンセンサス配列である。プロテロメラーゼ認識配列は、参照により本明細書に組み込まれる国際公開第２０１０／０８６６２６号に記載の配列を有し得る。

好ましくは、プロテロメラーゼ認識配列は、配列番号１０と少なくとも８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、又は１００％配列同一性を有する。配列番号１０の配列は、
５’－ＴＡＴＣＡＧＣＡＣＡＣＡＡＴＴＧＣＣＣＡＴＴＡＴＡＣＧＣＧＣＧＴＡＴＡＡＴＧＧＡＣＴＡＴＴＧＴＧＴＧＣＴＧＡＴＡ－３’
である。

好ましくは、プロテロメラーゼは、アダプター配列を、認識配列の２８～２９位にて切断し、切断された末端を閉端する。

アダプターは、プロテロメラーゼ認識配列からなっていてもよい。或いは、アダプターは、追加のヌクレオチドを含み得る。アダプターは、識別子配列又は「バーコード」又は「タグ」を含み得る。識別子は、好ましくは、サンプル識別子及びＵＭＩのうちの少なくとも１つである。好ましくは、認識配列は、切断され切断された末端が閉端された後も、核酸分子の一部のままである。

ＵＭＩは、アダプター内の別々の配列であってもよく、又はプロテロメラーゼ認識配列が縮重ヌクレオチドを含む場合は、こうした縮重ヌクレオチドを使用して、識別子を導入してもよい。例えば、１つのサンプルのプロテロメラーゼ認識配列における縮重ヌクレオチドの場合では、アダプターをこの認識配列内の１つ又は複数の特定のヌクレオチドと共に使用することができるが、第２の及びさらなるサンプルでは、この位置には他の特定のヌクレオチドが使用され、それによりプロテロメラーゼ認識配列内に識別子配列が作出される。アダプターは、サンプル識別子及びＵＭＩを含み得る。

サンプル識別子は、核酸分子の配列を特定のサンプルに関連付けることができる。例えば、本発明の方法で使用されるアダプターは、特定のサンプルに特異的な識別子配列を含み得る。各追加サンプルを、前記追加サンプルに特異的な識別子配列を有するアダプターを使用して処理することができる。その後、処理したサンプルをプールすることができ、サンプル識別子配列を使用して、得られた配列を特定のサンプルに割り当てることができる。

ＵＭＩは、核酸分子に特異的な、つまり本発明の方法に使用される各核酸分子に対して固有である、実質的に固有な、好ましくは完全に固有な配列又はバーコードである。ＵＭＩは、ランダムな、疑似ランダムな、又は部分的にランダムな、又は非ランダムなヌクレオチド配列を有し得る。ＵＭＩを使用して、配列決定読み取りが由来する起源分子を一意的に特定することができる。例えば、増幅された核酸分子の読み取りは、各起源核酸分子の単一のコンセンサス配列に集束し得る。上記で示したように、ＵＭＩは、完全に又は実質的に固有であり得る。完全に固有であるとは、本発明の方法で用意されるすべてのアダプター連結核酸分子が、本発明の方法で使用されるさらなるアダプター連結核酸分子に含まれるすべての他のタグとは異なる固有のタグを含むことであると本明細書では理解されるべきである。実質的に固有であるとは、本発明の方法で用意される各アダプター連結核酸分子はランダムＵＭＩを含むが、こうしたアダプター連結核酸分子のうち同じＵＭＩを含み得るパーセンテージが低いことであると本明細書では理解されるべきである。好ましくは、同じ配列を含むまったく同じ分子を同じＵＭＩでタグ付けする可能性が無視できる場合、実質的に固有の分子識別子が使用される。好ましくは、ＵＭＩは、核酸分子の特定の配列に関して完全に固有である。ＵＭＩは、好ましくは、この固有性を保証するのに十分な長さを有する。いくつかの実装形態では、固有性がより低い分子識別子（つまり、上記に示した実質的に固有の識別子）を、他の識別技術と一緒に使用して、配列決定プロセス中に各核酸分子が一意的に特定されることを保証することができる。

識別子配列は、長さが約２～１００ヌクレオチド塩基又はそれ以上の範囲であってもよく、好ましくは、約４～１６ヌクレオチド塩基の長さを有する。識別子配列は、連続配列であってもよく、又はいくつかのサブユニットに分割されていてもよい。こうしたサブユニットの各々。こうしたサブユニットは、単一のアダプターに存在してもよく、又は別々のアダプターに存在してもよい。例えば、核酸分子が２つのアダプターにより隣接されている場合、こうした２つのアダプターの各々は、識別子配列のサブユニットを含み得る。コンセンサス配列を得るために、本発明の方法で得られた配列読み取りを、２つのサブユニットの各々の情報に基づいてグループ化することができる。

好ましくは、識別子配列は、２つ又はそれよりも多くの連続した同一の塩基を含まない。さらに、好ましくは、識別子配列間には、少なくとも２つ、好ましくは少なくとも３つの塩基に違いが存在する。

本発明で使用するためのアダプターを設計及び構築するための手段は、当業者に周知であり、本発明は、いかなる特定のアダプター設計及び／又は構築にも限定されない。非限定的な例として、２つのオリゴヌクレオチドを構築し、制御された条件下で互いにアニーリングさせて、本発明で使用するための少なくとも部分的に二本鎖のアダプターを得ることができる。さらなる非限定的な例として、長いオリゴヌクレオチド及び短いオリゴヌクレオチドを構築することができ、短いオリゴヌクレオチドは、長いオリゴヌクレオチドの末端にアニーリングすることができる。好ましくは、短いオリゴヌクレオチドの少なくとも６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、又は１００％のヌクレオチドは、長いオリゴヌクレオチドにアニーリングすることができる。好ましくは、短いオリゴヌクレオチドは、長いオリゴヌクレオチドのセクションに対して１００％相補的である。好ましくは、この相補的セクションは、プロテロメラーゼ認識配列の３’に、例えば、認識配列の３’から１、２、３、４、５、６、７、８、９、１０ヌクレオチド又はそれ以上に位置する。相補的セクションは、プロテロメラーゼ認識配列と長いオリゴヌクレオチドの３’末端との間に位置し得る。相補的セクションは、長いオリゴヌクレオチドの３’末端に位置し得る。或いは、相補的セクションは、長いオリゴヌクレオチドの３’末端の上流に、例えば、長いオリゴヌクレオチドの３’末端の上流の少なくとも１、２、３、４、５、６、７、８、９、１０、１５ヌクレオチド又はそれ以上に位置し得る。短いオリゴヌクレオチド及び長いオリゴヌクレオチドをアニーリングさせた後、相補セクションの５’に位置する長いオリゴヌクレオチドの部分を補充し、したがって二本鎖アダプターを産生させることができ、この二本鎖アダプターは、３’オーバーハングを有してもよく、その場合この３’オーバーハングは、長いオリゴヌクレオチドの３’末端である。一本鎖配列を補充すること、つまり二本鎖配列を生成することは、限定するものではないが、クレノフ（Ｋｌｅｎｏｖ）ポリメラーゼ又はＢＳＴ－ポリメラーゼなどの、任意の従来のポリメラーゼを使用して行うことができる。好ましいポリメラーゼは、ＢＳＴ－ポリメラーゼである。

任意選択で、本発明のアダプターは、プロテロメラーゼ認識配列と核酸分子に対する連結のためのアダプター部分との間に制限酵素認識部位をさらに含む。
さらなる態様では、本発明は、核酸分子ライブラリーを調製するための方法に関する。好ましくは、この方法は、以下のステップ：
ａ）少なくとも第１及び第２の核酸分子を含むサンプルを用意するステップであって、第１の核酸分子が、第２の核酸分子に存在しない第１の標的配列を含む、ステップ；
ｂ）本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第１の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップ；
ｃ）アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第１の核酸分子をもたらすステップ；並びに
ｄ）閉端末端を含む第１の核酸分子を切断して、１つの開端末端及び１つの閉端末端を含む第１の核酸を用意するステップ
のうちの１つ又は複数を含む。

任意選択で、第２の核酸分子又はそのアンプリコンの末端には、プロテロメラーゼ認識配列を含むアダプターを連結させない。そのような実施形態内では、第２の核酸分子は、例えば、ステップｃとｄとの間のエキソヌクレアーゼ処理によって排除される。特定の核酸分子に対する選択的アダプター連結は、ステップｂの選択的アダプター連結に適切な特定の末端を第１の核酸分子に作出することによって達成でき、こうした特定の末端は、第２の核酸分子の末端には作出されない。例えば、特定の付着末端は、限定するものではないが、第１の標的配列の上流にある配列を標的とする第１のｃｒＲＮＡ及び第１の標的配列の下流にある配列を標的とする第２のｃｒＲＮＡを組み合わせた、Ｃｐｆ１などのＶ型ＣＲＩＳＰＲエンドヌクレアーゼなど、そのような付着末端を作出することが可能な特定のエンドヌクレアーゼによって作出することができる。そのような実施形態内では、ステップｂで使用されるアダプターは、第１の核酸分子に対する連結のために、このようにして作出された付着末端に対する連結に適合するオーバーハングを、アダプター側に含むべきである。この実施形態内では、閉端された第１の核酸分子は、ステップｄにおいて、アダプター内の特定の配列での切断によって開端することができる。例えば、連結側とプロテロメラーゼ認識配列との間に、特定の制限酵素認識部位を含むアダプターを使用する場合。或いは、閉端された第１の核酸分子は、ステップｄにおいて、第１の標的配列などの、第１の核酸分子内の配列での切断によって開端することができる。

或いは、本発明の方法のステップｂにおいて、アダプターは、第１及び第２の核酸分子の両方に連結される。そのような実施形態内では、ステップｃで得られた閉端された第２の核酸分子は、ステップｄの前に、閉端された第１の核酸分子を含む反応混合物から特異的に排除され得る。これは、閉端された第２の核酸分子を、閉端された第１の核酸分子に存在しない特定の配列、つまり第２の標的配列にて切断することによって達成され得る。そのような実施形態内では、本明細書で定義した方法の第２の核酸分子は、第１の核酸分子に存在しない第２の標的配列を含む。その後の開端された第２の核酸分子は、エキソヌクレアーゼ処理によって排除され得る。第２の核酸分子はこの段階では存在しないため、閉端された第１の核酸は、特異的な又は非特異的な方法で、例えば、本明細書の上記に示したアダプター内の配列にて又は第１の核酸分子に存在する配列にて切断することによって開端することができる。閉端された第２の核酸分子がステップｄの前に排除されない方法の場合、この閉端された第２の核酸分子は、ステップｄにおいて、閉端された第１の核酸分子を含む反応混合物中に依然として存在する。そのような設計では、好ましくは、第２の核酸分子に存在しない第１の標的配列にて切断することによって第１の核酸を選択的に開端する。そのような方法は、好ましくは、以下のステップ：
ａ）少なくとも第１及び第２の核酸分子を含むサンプルを用意するステップであって、第１の核酸分子が第２の核酸分子に存在しない第１の標的配列を含み、任意選択で第２の核酸分子が第２の標的配列を含む、ステップと；
ｂ）本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第１及び第２の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと；
ｃ）アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第１及び第２の核酸分子をもたらすステップと；
ｄ）閉端末端を含む第１の核酸分子を第１の標的配列にて切断して、１つの開端末端及び１つの閉端末端を含む第１の核酸を用意するステップと
を含む。

好ましいプロテロメラーゼは、ＴｅＩＮプロテロメラーゼである。

有効数の成分が本発明の方法において使用されることを本明細書では理解されたい。本発明の方法によって調製される核酸分子ライブラリーは、好ましくは、限定するものではないが、クローニング、増幅、及び配列決定などの核酸分子のさらなる処理に適している。したがって、追加の態様では、本発明はまた、本明細書に記載のステップを使用して、核酸分子ライブラリーをクローニングするための方法、核酸分子ライブラリーを増幅するための方法、又は核酸分子ライブラリーを配列決定するための方法に関する。

好ましくは、調製された核酸分子ライブラリーは、目的の配列を含む核酸分子が濃縮されている。「濃縮された」は、（ｉ）目的の配列を有していない核酸分子をさらなる処理ステップから選択的に除外することによって、又は（ｉｉ）目的の配列を有する核酸分子をさらなる処理ステップのために選択的に含めることによってのいずれかによって、目的の配列を有していない核酸分子を低減又は排除することを意味すると本明細書では理解される。選択的に除外された核酸分子は、例えば、エキソヌクレアーゼ処理によって分解され得る。選択的に含まれる核酸分子は、例えば、クローニング、増幅、及び／又は配列決定され得る。

調製された核酸ライブラリーは、好ましくは、１つの閉端末端及び１つの開端末端を有する核酸分子を含む。

一実施形態では、本明細書で定義した方法は、少なくとも第１及び第２の核酸分子を含むサンプルを用意するステップａ）を含む。好ましくは、第１の核酸分子は、第２の核酸分子に存在しない第１の標的配列を含む。好ましくは、第２の核酸分子は、第２の標的配列を含む。任意選択で、第２の標的配列は、第１の核酸分子にも存在する。或いは、第２の標的配列は、第１の核酸分子には存在しない。

好ましくは、第１の核酸分子は、目的の配列を含み、第２の核酸分子は、前記目的の配列を含まない。この実施形態では、第１の核酸分子が、調製された核酸分子ライブラリーに存在することになり、好ましくはさらに処理されることになる。

代替的な実施形態では、第１の核酸分子は、目的の配列を含まないが、第２の核酸分子は、前記目的の配列を含む。この実施形態では、第２の核酸分子が、調製された核酸分子ライブラリーに存在することになり、好ましくはさらに処理されることになる。

少なくとも第１及び第２の核酸分子を含むサンプルは、任意の供給源、例えば、ヒト、動物、植物、微生物由来のものであってよく、細胞に対して内因性又は外因性のあらゆるもの、例えば、ゲノムＤＮＡ、染色体ＤＮＡ、人工染色体、プラスミドＤＮＡ、若しくはエピソームＤＮＡ、ｃＤＮＡ、ＲＮＡ、ミトコンドリアであってもよく、又はＢＡＣ若しくはＹＡＣなどの人工ライブラリーであってもよい。ＤＮＡは、核ＤＮＡ又はオルガネラＤＮＡであり得る。好ましくは、ＤＮＡは染色体ＤＮＡであり、好ましくは細胞に内因性である。好ましくは、本発明の方法の出発物質として使用されるサンプル中に存在する第１の、第２の、及び任意選択でさらなる核酸分子は、ゲノムＤＮＡ、染色体ＤＮＡ、オルガネラＤＮＡ、ミトコンドリアＤＮＡ、人工染色体、プラスミドＤＮＡ、エピソームＤＮＡ、ｃＤＮＡなどのＤＮＡ、及びＲＮＡのうちのいずれか１つである。

第１及び第２の核酸分子は、例えば、細胞溶解及び任意選択でオルガネラの溶解によって用意される長い核酸分子であり得る。本発明の方法で使用される核酸分子は、少なくとも約５０ｋｂ、１００ｋｂ、１５０ｋｂ、２００ｋｂ、３００ｋｂ、４００ｋｂ、５００ｋｂ、６００ｋｂ、７００ｋｂ、８００ｋｂ、９００ｋｂ、又は少なくとも約１０００ｋｂ（１Ｍｂ）のサイズを有し得る。本発明で使用するための第１及び／又は第２の核酸は、高分子量（ＨＭＷ）核酸又は超高分子量（ｕＨＭＷ）核酸であり得る。ｕＨＭＷ核酸は、少なくとも１Ｍｂの長さを有し得る。本発明の方法で使用される核酸分子は、少なくとも１．１Ｍｂ、１．３Ｍｂ、１．５Ｍｂ、１．７Ｍｂ、２Ｍｂ、２．５Ｍｂ、３Ｍｂ、４Ｍｂ、５Ｍｂ、６Ｍｂ、７Ｍｂ、８Ｍｂ、９Ｍｂ、又は少なくとも約１０Ｍｂのサイズを有し得る。

或いは、長い核酸分子をまず断片化して、第１及び第２の核酸分子をもたらしてもよい。したがって、一実施形態では、ステップａ）の第１及び第２の核酸分子は、断片化によって用意される。断片化は、好ましくは、ゲノム核酸分子の断片化である。

当業者であれば、より長い核酸分子を断片化するための手段に精通しており、本発明は、より長い核酸分子を断片化するためのいかなる特定の手段にも限定されない。断片化された核酸は、好ましくは、断片化されたゲノムＤＮＡである。ＤＮＡ、特にゲノムＤＮＡは、当技術分野で公知の任意の適切な方法を使用して断片化され得る。ＤＮＡ断片化の方法としては、限定するものではないが、酵素消化及び機械的力が挙げられる。

機械的力を使用した核酸分子の断片化の非限定的な例としては、音響剪断、噴霧、超音波処理、ポイントシンク剪断（ｐｏｉｎｔ－ｓｉｎｋｓｈｅａｒｉｎｇ）、針剪断、及びフレンチプレスセルの使用が挙げられる。

本明細書で定義した第１及び第２の核酸分子のうちの少なくとも１つを含む核酸分子を断片化するための酵素消化としては、限定するものではないが、エンドヌクレアーゼ制限が挙げられる。例えば、ＡＦＬＰ（登録商標）技術で使用されるものなどの酵素消化は、核酸サンプルの複雑性の低減をさらにもたらすことができる。当業者であれば、ＤＮＡ断片化のためにどの酵素を選択すべきかを知っている。非限定的な例として、核酸サンプルの断片化には、少なくとも１つの高頻度切断剤及び少なくとも１つの低頻度切断剤を使用することができる。限定するものではないがＭｓｅＩなどの高頻度切断剤は、好ましくは、約３～５ｂｐの認識部位を有する。限定するものではないがＥｃｏＲＩなどの低頻度切断剤は、好ましくは、＞５ｂｐの認識部位を有する。

特定の実施形態では、特にサンプルが、比較的大きなゲノムを含むか又は由来する場合、より短いサイズの制限断片のより大きなセットを得るために、低頻度又は高頻度切断剤である第３の酵素を使用することが好ましい場合がある。

本発明の方法は、いかなる特定の制限エンドヌクレアーゼにも限定されない。エンドヌクレアーゼは、ＥｃｏＲＩ、Ｍｓｅｌ、ＰｓｔｌなどのＩＩ型エンドヌクレアーゼであり得る。特定の実施形態では、限定するものではないが、Ａｃｅｌｌｌ、ＡＩｗＩ、ＡＩｗＸＩ、Ａｌｗ２６Ｉ、Ｂｂｖｌ、ＢｂｖＩＩ、Ｂｂｓｌ、Ｂｅｄ、Ｂｃｅ８３Ｉ、Ｂｃｅｆｌ、Ｂｃｇｌ、Ｂｉｎｌ、Ｂｓａｌ、Ｂｓｇｌ、ＢｓｍＡＩ、ＢｓｍＦｌ、ＢｓｐＭＩ、ＥａｒＩ、ＥｃｉＩ、Ｅｃｏ３ｌｌ、Ｅｃｏ５７Ｉ、Ｅｓｐ３Ｉ、Ｆａｕｌ、Ｆｏｋｌ、Ｇｓｕｌ、Ｈｇａｌ、ＨｉｎＧＵＩＩ、Ｈｐｈｌ、Ｋｓｐ６３２Ｉ、ＭｂｏＩＩ、Ｍｍｅｌ、ＭｎＩＩ、ＮｇｏＶＩＩＩ、ＰＩｅＩ、ＲＩｅＡＩ、Ｓａｐｌ、ＳｆａＮＩ、ＴａｑＪＩ、及びＺｔｈｌｌＩＩＩなどのＩＩＳ型又はＩＩＩ型エンドヌクレアーゼ、つまり認識配列が制限部位から遠位に位置するエンドヌクレアーゼを使用することができる。制限断片は、使用するエンドヌクレアーゼに応じて、平滑末端であってもよく、又は突出末端を有してもよい。

好ましい実施形態では、高頻度切断剤及び低頻度切断剤のうち少なくとも１つの認識部位は、目的の配列内又は近近傍にあり、例えば、高頻繁切断剤又は低頻度切断剤の認識部位は、目的の配列から約０～１００００、１０～５０００、５０～１０００、又は約１００～５００塩基に位置する。

本明細書に開示の本方法は、ＡＦＬＰ（登録商標）技術において、例えば倍数体細胞にも使用され得る。ＡＦＬＰ（登録商標）技術は、例えば、参照により本明細書に組み込まれる国際公開第２００７／１１４６９３号、国際公開第２００６／１３７７３３号、及び国際公開第２００７／０７３１６５号により詳細に記載されている。当技術分野に記載のＡＦＬＰ（登録商標）技術は、本明細書に記載のプロテロメラーゼ認識配列を含むアダプターを、制限核酸サンプルに付着させることによって改変することができる。

さらに、又は或いは、プログラム可能なヌクレアーゼを使用して、好ましくはＣＲＩＳＰＲヌクレアーゼ、ジンクフィンガーヌクレアーゼ、ＴＡＬＥＮ、及びメガヌクレアーゼのうちの少なくとも１つを使用して、核酸サンプルを消化してもよい。

任意選択で、第１及び／又は第２の核酸分子は、Ａ尾部を含むように、好ましくは、プロテロメラーゼ認識配列を含み、さらにＴオーバーハングを含む、部分的又は完全に二本鎖のアダプターに対する連結を容易にするように改変されていてもよい。したがって、断片化核酸にアダプターをアニーリングさせる前に、本発明の方法は、任意選択で、断片化核酸サンプルをＡ尾部化するステップを含んでいてもよい。Ａ尾部化反応は、当技術分野で周知であり、当業者であれば、例えばクレノウ断片（エキソ－）を使用するなど、Ａ尾部化反応を実施する方法を明快に理解している。

第１及び第２の核酸分子のうちの少なくとも１つを含む核酸サンプルは、複数のさらなる核酸分子を含み得る。したがって、いくつかの実施形態では、核酸サンプルは、第１の核酸分子のみ及び第２の核酸分子のみを含む。他の実施形態では、核酸サンプルは、複数の他の核酸分子に加えて、第１の核酸分子、第２の核酸分子を含む。好ましくは、前記さらなる核酸分子は、第１の標的配列を含まない。任意選択で、さらなる核酸分子は、第２の標的配列を含まない。この複数の他の核酸分子は、第１及び第２の核酸分子が由来する同じ生物、同じ組織、同じ細胞、同じオルガネラ、及び／又は同じ分子のうちの少なくとも１つに由来し得る。

第１の核酸分子を含む核酸サンプルはまた、複数の第１の核酸分子を含む核酸サンプルを含み得ることが本明細書では理解される。同様に、第２の核酸分子を含む核酸サンプルはまた、複数の第２の核酸分子を含む核酸サンプルを含み得ることが本明細書では理解される。好ましくは、第１の核酸分子は、第２の核酸分子が由来する同じ生物、同じ組織、同じ細胞、同じオルガネラ、及び／又は同じ分子に由来する。第１及び第２の核酸分子は、１つ又は複数のヌクレオチドを除いて、本質的に同じ配列を有し得る。非限定的な例として、第１及び第２の核酸分子は、対立遺伝子バリアントであり得る。或いは、第１及び第２の核酸分子は、非常に異なっていてもよく、例えば、４０％、３０％、２０％、１０％、又は５％未満の配列同一性を有し得る。本発明で使用される第１の核酸分子及び第２の核酸分子間の主な違いは、第１の核酸分子が、第２の核酸分子に存在しない標的配列を含むことである。

任意選択で、第２の核酸分子は、第２の標的配列を含み得る。この第２の標的配列は、第１の核酸分子に存在してもよく、又は存在しなくともよい。

一実施形態では、この方法は、ｂ）アダプターを、第１及び第２の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップを含む。アダプターは、好ましくは、本明細書で定義したアダプター、つまりプロテロメラーゼ認識配列を含むアダプターである。アダプターは、好ましくは、第１の核酸分子の両末端及び第２の核酸分子の両末端に連結される。好ましくは、アダプターは、サンプル中に存在する核酸の少なくとも８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、又は１００％の両末端に連結される。好ましくは、連結ステップ後、サンプル中のすべての核酸分子は、両末端にアダプターを含む。別の言い方をすれば、好ましくは、サンプル中のすべての又は実質的にすべての核酸は、共有結合で連結されたアダプターによって両側が隣接されている。アダプターの連結は、当業者に公知の任意の従来方法を使用して実施することができ、本発明は、いかなる特定の連結方法又は連結酵素（リガーゼ）にも限定されない。好ましくは、連結を容易にするため、アダプターは、例えば、制限エンドヌクレアーゼの使用及びアダプターにある適合性付着末端により得られる核酸分子を使用することによって、核酸分子の末端と適合する末端を含む。

一実施形態では、断片化核酸分子を末端処理して平滑末端を作出し、続いて３’Ａ付着オーバーハングを追加してもよい。末端処理ステップは、当技術分野で公知の任意の従来手段を使用して実施することができる。同様に、３’Ａオーバーハングの付加は、当業者に公知の任意の従来方法を使用して達成することができる。その後、３’Ａオーバーハングを含む核酸分子を、５’Ｔオーバーハングを含む適合性アダプターに連結することができる。

一実施形態では、断片化のステップ及びアダプター連結のステップは、例えば、タグメンテーションによって、単一のステップに組み合わせることができる。この実施形態では、ステップｂ）のアダプターは、好ましくは、Ｔｎ５トランスポザーゼを使用してタグメンテーションによって連結される。トランスポザーゼは、長いＤＮＡ分子を短い核酸分子へとランダムに切断し、アダプターは、切断地点のいずれ側にも連結され得る。タグメンテーション又は「トランスポザーゼ媒介性断片化及びタグ付け」は、例えば、Ｎｅｘｔｅｒａ（商標）のワークフローに例示されるように、当業者に周知のプロセスである。アダプターは、タグメンテーション反応での使用にアダプターを適合させる配列を含み得る。好ましくは、タグメンテーション反応に使用されるアダプターは、トランスポザーゼ配列をさらに含む。トランスポザーゼ配列は、好ましくは、タグメンテーション反応に使用されるトランスポザーゼと適合性である。タグメンテーション反応に続いて修復ステップを行って、すべての又は実質的にすべての生成された核酸分子が両側にアダプターを含むことを保証することができる。したがって、任意選択でタグメンテーションによって得られる、連結されたアダプターを含む核酸分子を修復して、あらゆる一本鎖切断を除去することができる。好ましくは、修復ステップは、ステップｃ）において分子をＴｅＩＮプロテロメラーゼと接触させる前に行われる。そのような修復ステップは、当技術分野で公知の任意の従来手段を使用して実施することができる。

任意選択で、プロテロメラーゼ認識配列は、アダプターの代わりにプライマーにより核酸分子に付着する。好ましくは、前記プライマーは、
ｉ）少なくとも第１及び／又は第２の核酸分子に存在するプライマー結合部位に、又は前記少なくとも第１及び／又は第２の核酸分子に連結されているアダプターの任意選択でユニバーサルなプライマー結合部位にアニーリングするための３’末端；並びに
ｉｉ）そのようなプライマーの５’尾部にあるプロテロメラーゼ認識部位
を含む。

任意選択で、プライマー結合部位は、固有の配列、つまり第１及び／又は第２の核酸分子にのみ存在する配列である。こうしたプライマーのうちの１つ又は複数を使用して、第１及び／又は第２の核酸分子をテンプレートとして使用したＰＣＲにより産生されたアンプリコンにプロテロメラーゼ配列を導入することができる。そのような実施形態内では、ステップｂ）において、本明細書で定義したアダプターを第１の核酸分子及び任意選択の第２の核酸分子の末端に連結してアダプター連結核酸分子を用意する代わりに、プロテロメラーゼ認識部位を含む少なくとも１つのプライマーを使用して第１の核酸分子及び任意選択の第２の核酸分子を増幅し、次いで、プロテロメラーゼ処理して閉端することができる得られたアンプリコンに対してその後のステップが実施される。或いは、プロテロメラーゼ配列は、変性、プライマーのアニーリング、一本鎖オーバーハングにおける塩基補充の単一のステップにより導入され得る。

したがって、（部分的）二本鎖アダプターによる連結の代わりに、プライマー又はタグメンテーションによりアダプターを付着させるこうした実施形態では、「連結する」又は「連結」という用語は、本明細書で使用される場合、「付着させる」又は「付着」という用語に置き換えることができる。

一実施形態では、本発明の方法は、アダプター連結核酸分子を、プロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第１及び第２の核酸分子をもたらすステップｃ）を含む。好ましいプロテロメラーゼは、ＴｅＩＮプロテロメラーゼである。

好ましくは、第１の核酸分子は、分子の両末端（つまり、５’末端及び３’末端）にアダプターを含み、第２の核酸分子は、分子の両末端にアダプターを含み、前記アダプターは、プロテロメラーゼ認識配列を有する。アダプターを含む第１及び第２の分子を適切な条件下でプロテロメラーゼと接触させることにより、アダプターの切断又は「制限」がもたらされる。同時に、プロテロメラーゼは、核酸分子を共有結合で閉端して、閉端された第１の核酸及び閉端された第２の核酸をもたらすことができる。閉端された直鎖状のＤＮＡ分子は、典型的には、共有結合で閉端された末端を含み、末端ヌクレオチドの喪失又は損傷から保護がもたらされる。

本発明で使用するための好ましいプロテロメラーゼは、バクテリオファージプロテロメラーゼである。プロテロメラーゼは、ハロモナス・アクアマリナ（Ｈａｌｏｍｏｎａｓａｑｕａｍａｒｉｎａ）に由来するｐｈｉＨＡＰ－１、エルシニア・エンテロコリチカ（Ｙｅｒｓｉｎｉａｅｎｔｅｒｏｌｙｔｉｃａ）に由来するＰＹ５４、クレブシエラ・オキシトカ（Ｋｌｅｂｓｉｅｌｌａｏｘｙｔｏｃａ）に由来するｐｈｉＫＯ２、ビブリオ種（Ｖｉｂｒｉｏｓｐ．）に由来するＶＰ８８２、及び大腸菌（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）由来のＮ１５、又はそれらのいずれかのバリアントからなる群から選択され得る。プロテロメラーゼは、参照により本明細書に組み込まれる国際公開第２０１０／０８６６２６号に記載のアミノ配列を有し得る。バクテリオファージＮ１５（ＴｅＩＮ）プロテロメラーゼ又はそのバリアントの使用が特に好ましい。好ましいプロテロメラーゼは、配列番号１１と少なくとも８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、又は１００％配列同一性の配列を有する。バリアントとしては、それらのホモログ又は変異体が挙げられる。変異体は、天然配列に対して短縮、置換、又は欠失を含む。バリアントは、好ましくは、上記に記載のプロテロメラーゼ認識配列を含むテンプレートから、閉端された直鎖状のＤＮＡを産生する。

この方法は、任意選択で、ステップｃ）において閉端末端を含む核酸分子を得た後だが、ステップｄ）において閉端末端を含む第１の核酸分子を切断する前に、サンプルをエキソヌクレアーゼに曝露するステップｃ１）を含み得る。したがって、一実施形態では、本発明の方法は、
ａ）少なくとも第１及び第２の核酸分子を含むサンプルを用意するステップであって、第１の核酸分子が第２の核酸分子に存在しない第１の標的配列を含み、任意選択で第２の核酸分子が第２の標的配列を含む、ステップと；
ｂ）本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第１及び第２の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと；
ｃ）アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第１及び第２の核酸分子をもたらすステップと；
ｃ１）閉端末端を含む第１及び第２の核酸分子を含むサンプルをエキソヌクレアーゼに曝露するステップと；
ｄ）閉端末端を含む第１の核酸分子を第１の標的配列にて切断して、１つの開端末端及び１つの閉端末端を含む第１の核酸を用意するステップと
を含む。

エキソヌクレアーゼは、２つの閉端末端を含まない、つまり１つ又は２つの開端末端を含む任意の核酸分子を消化し得る。そのような核酸分子は、例えば、限定するものではないが、アダプターを有してない核酸分子、開端末端を有する１つ若しくは２つのアダプターを有する核酸分子、並びに／又は１つの開端末端及び１つの閉端末端を有する切断された核酸分子である。

２つの閉端末端を有する核酸分子は分解から保護されるが、非保護断片は分解され、目的の配列を含む核酸分子、つまり第１の核酸分子又は任意選択で第２の核酸分子の濃縮又は複雑性の低減がもたらされる。したがって、一実施形態では、本発明の方法は、核酸サンプルの望ましくない（非標的）部分を除去するアプローチをとる。非限定的な例として、ステップｂ）のアダプターを、例えば、酵素消化によって作出された、選択的付着オーバーハングを有する核酸分子に連結してもよい。その後、アダプターを含む分子は、ステップｃ）において閉端され、ステップｃ１）におけるエキソヌクレアーゼ処理は、２つの閉端末端を有しない任意の核酸分子を消化することができる。したがって、ステップｃ１）におけるエキソヌクレアーゼ処理は、閉端末端を含む核酸分子の濃縮をもたらすことができる。

エキソヌクレアーゼは、エキソヌクレアーゼＩ、ＩＩＩ、Ｖ、ＶＩＩ、ＶＩＩＩ、若しくは関連する酵素、又はそれらの任意の組合せであり得る。エキソヌクレアーゼＩＩＩは、ニックを認識し、ｓｓＤＮＡのピースが形成されるまでニックをギャップまで伸長する。エキソヌクレアーゼＶＩＩは、このｓｓＤＮＡを分解することができる。エキソヌクレアーゼＩもまた、ｓｓＤＮＡを分解する。ＥｘｏＩＩＩ及びＥｘｏＶＩＩは、本発明の方法のステップｃ）において使用するためのエキソヌクレアーゼの好ましい組合せである。

エキソヌクレアーゼＶは、ｓｓＤＮＡとｄｓＤＮＡを３’から５’と５’から３’の両方の方向に分解することが可能である。したがって、好ましい実施形態では、本発明の方法のステップｃ）におけるエキソヌクレアーゼは、３’から５’及び５’から３’の両方向でｓｓＤＮＡ及びｄｓＤＮＡを分解することが可能なエキソヌクレアーゼ、好ましくはエキソヌクレアーゼＶである。

非標的配列を分解するための方法に関するさらなる情報は、すべての目的のためにその全体が参照により本明細書に組み込まれる、米国特許出願公開第２０１４／０１３４６１０号で提供されている。

ステップｃ１）は、好ましくは、エキソヌクレアーゼが実質的にすべての非保護断片を分解するのに十分な条件（例えば、時間、温度、酵素濃度）で実施される。好ましくは、ステップｃ１）は、エキソヌクレアーゼがすべての非保護断片を分解するのに十分な条件及び時間で実施される。ステップｃ１）は、好ましくは、約１分～約１２時間、好ましくは３０分間にわたって、約１０～９０℃、好ましくは約３７℃で実施される。

ステップｃ１）の後、エキソヌクレアーゼは、例えば、限定するものではないが、プロテイナーゼ、例えばプロテイナーゼＫ処理、又は熱不活性化のうちの少なくとも１つによって不活性化してもよい。そのような技術は当技術分野においては標準的であり、当業者は、エキソヌクレアーゼを不活性化する方法を明快に理解している。好ましい不活性化ステップは、サンプルを約５０～９０℃、好ましくは約７５℃の温度で、約１～１２０分間、好ましくは約１０分間、加熱することである。

一実施形態では、本発明の方法は、閉端末端を含む第１の核酸分子を第１の標的配列にて切断して、１つの開端末端及び１つの閉端末端を含む第１の核酸を用意するステップｄ）を含む。「切断」は、二本鎖切断を生成することであると本明細書では理解される。二本鎖切断は、ヌクレアーゼを使用することによって、又は反対側の鎖を切断する２つのニッカーゼを使用することによって作出され得る。二本鎖切断は、第１の核酸分子及び任意選択で第２の核酸分子の平滑開端末端を作出し得る。したがって、切断後、切断された核酸分子は、１つの開端平滑末端及び１つの閉端末端を有し得る。或いは、二本鎖切断は、切断された核酸分子の付着開端末端を作出し得る。したがって、切断後、切断された核酸分子は、１つの開端付着末端及び１つの閉端末端を有し得る。

好ましくは、ステップｄ）の第１の核酸分子は、プログラム可能なヌクレアーゼ又は制限エンドヌクレアーゼによって切断される。したがって、第１の核酸分子は、第２の核酸分子に存在しない標的配列を含む。第１の核酸分子は、標的配列を１つよりも多く含み得、例えば、第１の核酸分子は、標的配列を１、２、３、４、５、６つ又はそれ以上含み得る。一実施形態では、第２の核酸分子は、第１の核酸分子に存在しない標的配列を含み得る。第２の核酸分子は、標的配列を１つよりも多く含み得、例えば、第２の核酸分子は、標的配列を１、２、３、４、５、６つ又はそれ以上含み得る。

当業者であれば、このステップは、追加の核酸分子、例えば、少なくとも第３の、第４の、又は第５の、又はさらなる核酸分子に拡張し得ることを容易に理解する。各核酸分子は、任意選択で、他の核酸分子のいずれにも存在しない標的配列を含み得る。

したがって、核酸サンプルは、目的の配列を含む少なくとも１つの核酸分子、つまり本明細書で定義した第１の核酸分子又は任意選択で本明細書で定義した第２の核酸分子を含むと本明細書では理解される。したがって、別の表現をすると、核酸サンプルは、少なくとも約５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００個又はそれ以上の目的の配列など、１、２、３、４、５、６、７、８、９、１０又はそれ以上の目的の配列を含み得、好ましくは、サンプル内の各々の目的の配列は異なる標的配列を有する。本発明の方法は、核酸サンプルからのこうした目的の配列の同時濃縮を提供することができる。したがって、任意選択で、本発明の方法のステップｄ）において、核酸サンプルから核酸分子を濃縮するために複数のｇＲＮＡ－ＣＡＳ複合体が添加される。好ましくは、こうした複数のｇＲＮＡ－ＣＡＳ複合体は、同じＣＲＩＳＰＲ－ヌクレアーゼを含み得るが、それらのｇＲＮＡが異なっていてもよい。例えば、目的の配列を含む各核酸分子には、異なるｇＲＮＡ分子を使用することができる。本発明の方法では、例えば、少なくとも約５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００個又はそれ以上の核酸分子、好ましくは少なくとも約５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００個又はそれ以上のｇＲＮＡ分子を使用することができる。

閉端末端を含む第１の核酸分子及び任意選択で第２の核酸分子は、制限エンドヌクレアーゼによって切断され得る。第１及び第２の核酸分子が切断される実施形態では、第１及び第２の核酸分子は、異なるエンドヌクレアーゼによって切断される。任意の配列特異的エンドヌクレアーゼが、本発明での使用に適切であり得る。エンドヌクレアーゼは、いわゆる「制限エンドヌクレアーゼ」又は「制限酵素」、例えば、Ｉ型、ＩＩ型、ＩＩＩ型、ＩＶ型、又はＶ型制限エンドヌクレアーゼであり得る。好ましい制限エンドヌクレアーゼは、ＩＩ型制限エンドヌクレアーゼ、好ましくはＩＩＰ型又はＩＩＳ型である。ステップａ）における断片化が、ＤＮＡを制限酵素で切断することによって実施される場合、ステップｄ）において使用される酵素は、好ましくは、異なるエンドヌクレアーゼである。

第１の核酸分子及び任意選択で第２の核酸分子は、プログラム可能なヌクレアーゼによって切断され得る。第１及び第２の核酸分子が切断される実施形態では、第１及び第２の核酸分子は、異なるプログラム可能なヌクレアーゼ、つまり異なる標的配列を認識するプログラム可能なヌクレアーゼによって切断される。プログラム可能なヌクレアーゼは、ジンクフィンガーヌクレアーゼ、メガヌクレアーゼ、ＴＡＬエフェクターヌクレアーゼ、及びＲＮＡ誘導型ＣＲＩＳＰＲヌクレアーゼからなる群から選択され得る。好ましくは、プログラム可能なヌクレアーゼは、ＲＮＡ誘導型ＣＲＩＳＰＲ（クラスター化した規則的な配置の短い回文配列リピート）ヌクレアーゼである。

ＲＮＡ誘導型ＣＲＩＳＰＲ－ヌクレアーゼは、好ましくは、ｇＲＮＡ－Ｃａｓ複合体の一部である。ｇＲＮＡ－ＣＡＳ複合体は、ガイドＲＮＡと複合体を形成したＣＲＩＳＰＲ関連（ＣＡＳ）タンパク質又はＣＲＩＳＰＲ－ヌクレアーゼであると本明細書では理解されるべきである。ＣＲＩＳＰＲ－ヌクレアーゼは、ヌクレアーゼドメインと、ガイドＲＮＡと相互作用する少なくとも１つのドメインとを含む。ガイドＲＮＡと複合体を形成する場合、ＣＲＩＳＰＲ－ヌクレアーゼは、ガイドＲＮＡによって標的配列に誘導される。ガイドＲＮＡは、ＣＲＩＳＰＲ－ヌクレアーゼと、並びに標的配列と相互作用することにより、ガイド配列を介して特定の標的配列を含む部位に方向づけられると、ＣＲＩＳＰＲ－ヌクレアーゼは標的配列に切断を導入することができる。好ましくは、ＣＲＩＳＰＲ－ヌクレアーゼは、ヌクレアーゼの一方のドメイン又は両方のドメインがそれぞれ触媒的に活性である場合、標的配列に一本鎖切断又は二本鎖切断を導入することができる。当業者であれば、ＣＲＩＳＰＲ－ヌクレアーゼと組み合わせると、第１の核酸分子及び／又は任意選択で第２の核酸分子の所定の標的部位における一本鎖切断又は二本鎖切断の導入が達成されるようにガイドＲＮＡを設計する方法について十分に承知している。

ＣＲＩＳＰＲ－ヌクレアーゼは、一般的に６つの主要な型（Ｉ型～ＶＩ型）に分類することができ、これらはコア要素の内容及び配列に基づき、さらに亜型に分類される（Ｍａｋａｒｏｖａら，２０１１，ＮａｔＲｅｖＭｉｃｒｏｂｉｏｌ９：４６７～７７、及びＷｒｉｇｈｔら，２０１６，Ｃｅｌｌ１６４（１－２）：２９～４４）。一般に、ＣＲＩＳＰＲ－ＣＡＳシステム複合体の２つの重要な要素は、ＣＲＩＳＰＲ－ヌクレアーゼ及びｃｒＲＮＡである。ＣｒＲＮＡは、インベーダーＤＮＡに由来するスペーサー配列が点在している短い反復配列からなる。ＣＡＳタンパク質は、様々な活性、例えばヌクレアーゼ活性を有する。したがって、ｇＲＮＡ－ＣＡＳ複合体は、特定の配列を標的とするメカニズム、並びにその配列に対するある特定の酵素活性を提供する。

Ｉ型ＣＲＩＳＰＲ－ＣＡＳシステムは、典型的には、ヘリカーゼ活性とＤＮａｓｅ活性を別々に有するＣａｓ３タンパク質を含む。例えば、１－Ｅ型システムでは、ｃｒＲＮＡは、Ｃａｓｃａｄｅと呼ばれるマルチサブユニットエフェクター複合体（抗ウイルス防御のＣＲＩＳＰＲ関連複合体）に組み込まれ（Ｂｒｏｕｎｓら，２００８，Ｓｃｉｅｎｃｅ３２１：９６０～４）、これが二重鎖ＤＮＡに特異的に結合し、Ｃａｓ３タンパク質による分解を誘発する（Ｓｉｎｋｕｎａｓら，２０１１，ＥＭＳＯＪ３０：１３３５～１３４２；Ｂｅｌｏｇｌａｚｏｖａら，２０１１，ＥＭＢＯＪ３０：６１６～６２７）。

ＩＩ型ＣＲＩＳＰＲ－ＣＡＳシステムは、二重鎖ＤＮＡを特異的に切断することが可能な、単一タンパク質（約１６０ＫＤａ）であるシグネチャーＣａｓ９タンパク質を含む。Ｃａｓ９タンパク質は、典型的には２つのヌクレアーゼドメインを含んでおり、アミノ末端近くのＲｕｖＣ様ヌクレアーゼドメインと、タンパク質の中央付近のＨＮＨ（又はＭｃｒＡ様）ヌクレアーゼドメインである。Ｃａｓ９タンパク質のそれぞれのヌクレアーゼドメインは、二重らせんの一本鎖を切断することに特化されている（Ｊｉｎｅｋら，２０１２，Ｓｃｉｅｎｃｅ３３７（６０９６）：８１６～８２１）。Ｃａｓ９タンパク質は、ＩＩ型ＣＲＩＳＰＲ／－ＣＡＳシステムのＣＡＳタンパク質の一例であり、ｃｒＲＮＡ及びトランス活性化ｃｒＲＮＡ（ｔｒａｃｒＲＮＡ）と呼ばれる第２のＲＮＡと組み合わせた場合、エンドヌクレアーゼを形成し、これが侵入してきた病原体ＤＮＡを標的化し、ｃｒＲＮＡによって定められた病原体ゲノム上の位置にＤＮＡ二本鎖切断（ＤＳＢ）を導入することにより分解する。Ｊｉｎｅｋら（２０１２，Ｓｃｉｅｎｃｅ３３７：８１６～８２０）は、ｃｒＲＮＡとｔｒａｃｒＲＮＡの必須部分を融合することによって生成される一本鎖キメラガイドＲＮＡ（ｓｇＲＮＡ）が、Ｃａｓ９タンパク質と組み合わせて機能的なエンドヌクレアーゼを形成することができることを示した。

ＩＩＩ型ＣＲＩＳＰＲ－ＣＡＳシステムは、ポリメラーゼ及びＲＡＭＰモジュールを含む。ＩＩＩ型システムは、亜型のＩＩＩ－ＡとＩＩＩ－Ｂにさらに分けることができる。ＩＩＩ－Ａ型ＣＲＩＳＰＲ－ＣＡＳシステムは、プラスミドを標的とすることが明らかになっており、ＩＩＩ－Ａ型システムのポリメラーゼ様タンパク質は、ＤＮＡの特異的切断に関与している（Ｍａｒｒａｆｆｉｎｉ及びＳｏｎｔｈｅｉｍｅｒ，２００８，Ｓｃｉｅｎｃｅ３２２：１８４３～１８４５）。ＩＩＩ－Ｂ型ＣＲＩＳＰＲ－ＣＡＳシステムはまた、ＲＮＡを標的とすることが明らかになっている（Ｈａｌｅら，２００９，Ｃｅｌｌ１３９：９４５～９５６）。

ＩＶ型ＣＲＩＳＰＲ－ＣＡＳシステムは、カスケード様複合体の一部を形成することが示されている特性決定されていないタンパク質であるＣｓｆ１が含まれるが、これらのシステムは、多くの場合、関連するＣＲＩＳＰＲアレイを有していない単離されたｃａｓ遺伝子として確認されている。

Ｖ型ＣＲＩＳＰＲ－ＣＡＳシステムである、Ｐｒｅｖｏｔｅｌｌａ由来のクラスター化した規則的な配置の短い回文配列リピート（ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔｓ）及びＦｒａｎｃｉｓｅｌｌａ１又はＣＲＩＳＰＲ／Ｃｐｆ１が最近報告されている。Ｃｐｆ１遺伝子はＣＲＩＳＰＲ遺伝子座と関係しており、ｃｒＲＮＡを使用してＤＮＡを標的とするエンドヌクレアーゼをコードしている。Ｃｐｆ１はＣａｓ９よりも小さく単純なエンドヌクレアーゼであり、ＣＲＩＳＰＲ－Ｃａｓ９システムの制限のいくつかを克服し得る。Ｃｐｆ１は、ｔｒａｃｒＲＮＡを欠失している単一ＲＮＡ－誘導型エンドヌクレアーゼであり、Ｔリッチプロトスペーサー隣接モチーフを利用する。Ｃｐｆ１は、互い違いのＤＮＡ二本鎖切断を介してＤＮＡを切断する（Ｚｅｔｓｃｈｅら（２０１５）Ｃｅｌｌ１６３（３）：７５９～７７１）。Ｖ型ＣＲＩＳＰＲ－ＣＡＳシステムは、好ましくは、Ｃｐｆ１、Ｃ２ｃ１及びＣ２ｃ３のうちの少なくとも１つを含む。

ＶＩ型ＣＲＩＳＰＲ－ＣＡＳシステムは、ＲＮａｓｅＡ活性を含むＣａｓ１３ａタンパク質を含み得る。標的核酸断片がＲＮＡである場合、本発明の方法の少なくとも第１及び第２のｇＲＮＡ－ＣＡＳ複合体は、Ｃａｓ１３ａ、例えば限定するものではないが、例えばＧｏｏｔｅｎｂｅｒｇら，Ｓｃｉｅｎｃｅ．２０１７Ａｐｒ２８；３５６（６３３６）：４３８～４４２に記載されているような、レプトトリキア・ワディ（Ｌｅｐｔｏｔｒｅｉｃｈｉａｗａｄｅｅ）由来のＣａｓ１３ａ（ＬｗＣａｓ１３ａ）又はレプトトリキア・シャーイイ（Ｌｅｐｔｏｔｒｉｃｈｉａｓｈａｈｉｉ）由来のＣａｓ１３ａ（ＬｓｈＣａｓ１３ａ）を含み得る。

本発明の方法のｇＲＮＡ－ＣＡＳ複合体は、本明細書で上記に定義した任意のＣＲＩＳＰＲ－ヌクレアーゼを含み得る。好ましくは、本発明の方法で使用されるｇＲＮＡ－ＣＡＳ複合体は、ＩＩ型ＣＲＩＳＰＲ－ヌクレアーゼ、例えばＣａｓ９（例えば、配列番号１３によってコードされる配列番号１２のタンパク質、若しくは配列番号１４のタンパク質）、又はＶ型ＣＲＩＳＰＲ－ヌクレアーゼ、例えばＣｐｆ１（例えば、配列番号１６によってコードされる配列番号１５のタンパク質）、又はＭａｄ７（例えば、配列番号１７若しくは１８のタンパク質）、又はそれらに由来するタンパク質であって、好ましくは前記タンパク質に対してその全長にわたって少なくとも約７０％、８０％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、若しくは９９％配列同一性を有するタンパク質を含む。

好ましくは、本発明の方法のｇＲＮＡ－ＣＡＳ複合体は、ＩＩ型ＣＲＩＳＰＲ－ヌクレアーゼ、好ましくはＣａｓ９ヌクレアーゼを含む。

当業者は、ＣＲＩＳＰＲ－ヌクレアーゼを含むＣＲＩＳＰＲ－ＣＡＳシステムの様々な成分を調製する方法を知っている。従来技術において、その設計及び使用に関する多数の報告を利用することができる。例えば、ガイドＲＮＡの設計及びＣＡＳタンパク質（ストレプトコッカス・ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ）から最初に得られた）との併用に関するＨａｅｕｓｓｌｅｒらによる概説（ＪＧｅｎｅｔＧｅｎｏｍｉｃｓ．（２０１６）４３（５）：２３９～５０．ｄｏｉ：１０．１０１６／ｊ．ｊｇｇ．２０１６．０４．００８．）又はＬｅｅら（ＰｌａｎｔＢｉｏｔｅｃｈｎｏｌｏｇｙＪｏｕｒｎａｌ（２０１６）１４（２）４４８～４６２）による概説を参照されたい。

一般に、ＣＲＩＳＰＲヌクレアーゼ、例えばＣａｓ９は、２つの触媒的に活性なヌクレアーゼドメインを含む。例えば、Ｃａｓ９タンパク質は、ＲｕｖＣ様ヌクレアーゼドメイン及びＨＮＨ様ヌクレアーゼドメインを含み得る。ＲｕｖＣドメイン及びＨＮＨドメインは一緒に機能し、両方とも一本鎖を切断し、ＤＮＡに二本鎖切断を行う（Ｊｉｎｅｋら，Ｓｃｉｅｎｃｅ，３３７：８１６～８２１）。デッド型ＣＲＩＳＰＲ－ヌクレアーゼは、いずれのヌクレアーゼドメインも切断活性を示さないような修飾を含む。本発明の方法で使用されるｇＲＮＡ－ＣＡＳ複合体のＣＲＩＳＰＲ－ヌクレアーゼは、ヌクレアーゼドメインの１つが変異したことにより、もはや機能せず（すなわち、ヌクレアーゼ活性がない）、それによりニッカーゼを生成する、ＣＲＩＳＰＲ－ヌクレアーゼのバリアントであり得る。例は、Ｄ１０Ａ変異又はＨ８４０Ａ変異のいずれかを有するＳｐＣａｓ９バリアントである。好ましくは、ｇＲＮＡ－ＣＡＳ複合体のヌクレアーゼは、デッド型ヌクレアーゼではない。好ましくは、ｇＲＮＡ－ＣＡＳ複合体のＣＲＩＳＰＲ－ヌクレアーゼは、ニッカーゼ又は（エンド）ヌクレアーゼのいずれかである。

本発明の方法で使用し得るｇＲＮＡ－ＣＡＳ複合体は、Ｃａｓ９タンパク質若しくはバリアント全体を含むか若しくはそれからなっていてもよく、又はそれらの断片を含んでいてもよい。好ましくは、そのような断片は、ｃｒＲＮＡ及びｔｒａｃｒＲＮＡ又はｓｇＲＮＡに結合し、ヌクレアーゼ活性又はニッカーゼ活性のうちの少なくとも１つを維持する。

好ましくは、ｇＲＮＡ－ＣＡＳ複合体は、Ｃａｓ９タンパク質を含む。Ｃａｓ９タンパク質は、細菌のストレプトコッカス・ピオゲネス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓ）由来のもの（ＳｐＣａｓ９；ＮＣＢＩＲｅｆｅｒｅｎｃｅＳｅｑｕｅｎｃｅＮＣ＿０１７０５３．１；ＵｎｉＰｒｏｔＫＢ－Ｑ９９ＺＷ２）、ゲオバチルス・サーモデニトリフィカンス（Ｇｅｏｂａｃｉｌｌｕｓｔｈｅｒｍｏｄｅｎｉｔｒｉｆｉｃａｎｓ）由来のもの（ＵｎｉＰｒｏｔＫＢ－Ａ０Ａ１７８ＴＥＪ９）、コリネバクテリウム・アルサラス（Ｃｏｒｙｎｅｂａｃｔｅｒｉｕｍｕｌｃｅｒｏｕｓ）由来のもの（ＮＣＢＩＲｅｆｓ：ＮＣ＿０１５６８３．１，ＮＣ＿０１７３１７．１）；コリネバクテリウム・ジフテリエ（Ｃｏｒｙｎｅｂａｃｔｅｒｉｕｍｄｉｐｈｔｈｅｒｉａ）由来のもの（ＮＣＢＩＲｅｆｓ：ＮＣ＿０１６７８２．１，ＮＣ＿０１６７８６．１）；スピロプラズマ・シルフィディコーラ（Ｓｐｉｒｏｐｌａｓｍａｓｙｒｐｈｉｄｉｃｏｌａ）由来のもの（ＮＣＢＩＲｅｆ：ＮＣ＿０２１２８４．１）；プレボテラ・インターメディア（Ｐｒｅｖｏｔｅｌｌａｉｎｔｅｒｍｅｄｉａ）由来のもの（ＮＣＢＩＲｅｆ：ＮＣ＿０１７８６１．１）；スピロプラズマ・タイワネンス（Ｓｐｉｒｏｐｌａｓｍａｔａｉｗａｎｅｎｓｅ）由来のもの（ＮＣＢＩＲｅｆ：ＮＣ＿０２１８４６．１）；ストレプトコッカス・イニエ（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｉｎｉａｅ）由来のもの（ＮＣＢＩＲｅｆ：ＮＣ＿０２１３１４．１）；ベルリエラ・バルティカ（Ｂｅｌｌｉｅｌｌａｂａｌｔｉｃａ）由来のもの（ＮＣＢＩＲｅｆ：ＮＣ＿０１８０１０．１）；シクロフレキサス・トルキスル（Ｐｓｙｃｈｒｏｆｌｅｘｕｓｔｏｒｑｕｉｓｌ）由来のもの（ＮＣＢＩＲｅｆ：ＮＣ＿０１８７２１．１）；ストレプトコッカス・サーモフィルス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）由来のもの（ＮＣＢＩＲｅｆ：ＹＰ＿８２０８３２．１）；リステリア・イノキュア（Ｌｉｓｔｅｒｉａｉｎｎｏｃｕａ）由来のもの（ＮＣＢＩＲｅｆ：ＮＰ＿４７２０７３．１）；カンピロバクター・ジェジュニ（Ｃａｍｐｙｌｏｂａｃｔｅｒｊｅｊｕｎｉ）由来のもの（ＮＣＢＩＲｅｆ：ＹＰ＿００２３４４９００．１）；又はナイセリア・メニンギティディス（Ｎｅｉｓｓｅｒｉａｍｅｎｉｎｇｉｔｉｄｉｓ）由来のもの（ＮＣＢＩＲｅｆ：ＹＰ＿００２３４２１００．１）であり得る。ＳｐＣａｓ９に相同な不活性化ＨＮＨ又はＲｕｖＣドメインを有する、これらからのＣａｓ９バリアント例えばＳｐＣａｓ９＿Ｄ１０Ａ若しくはＳｐＣａｓ９＿Ｈ８４０Ａ、又はＳｐＣａｓ９タンパク質のＤ１０若しくはＨ８４０に対応する位置に同等の置換を有し、ニッカーゼを生じさせるＣａｓ９が包含される。

プログラム可能なヌクレアーゼは、Ｃｐｆ１、例えばアシダミノコッカス属の種（Ａｃｉｄａｍｉｎｏｃｏｃｃｕｓｓｐ）；ＵｎｉＰｒｏｔＫＢ－Ｕ２ＵＭＱ６に由来し得る。バリアントは、ＲｕｖＣ又はＮＵＣドメインがもはやヌクレアーゼ活性を有していない、不活性化ＲｕｖＣ又はＮＵＣドメインを有するＣｐｆ１ニッカーゼであり得る。当業者は、当技術分野で利用可能な技術、例えば、部位特異的突然変異誘発、ＰＣＲ媒介突然変異誘発、及び不活性化ＲｕｖＣ又はＮＵＣドメインなどの不活性化ヌクレアーゼを可能にする全遺伝子合成などについて十分に知っている。不活性ＮＵＣドメインを有するＣｐｆ１ニッカーゼの例は、Ｃｐｆ１Ｒ１２２６Ａである（ＧａｏらＣｅｌｌＲｅｓｅａｒｃｈ（２０１６）２６：９０１～９１３、ＹａｍａｎｏらＣｅｌｌ（２０１６）１６５（４）：９４９～９６２を参照されたい）。このバリアントにおいては、ＮＵＣドメインでアルギニンがアラニン（Ｒ１２２６Ａ）へ変換されており、ＮＵＣドメインが不活性化される。

ｇＲＮＡ－ＣＡＳ複合体は、プロトスペーサー配列としても注釈付けられる核酸分子中の標的配列又は「標的部位」へと複合体を方向づけるＣＲＩＳＰＲ－ヌクレアーゼ関連ガイドＲＮＡをさらに含む。ガイドＲＮＡは、好ましくは、核酸分子内の目的の配列の近くに、その配列に、又はその配列内にあり、ｓｇＲＮＡ、又はｃｒＲＮＡとｔｒａｃｒＲＮＡの組合せ（例えば、Ｃａｓ９の場合）、又はｃｒＲＮＡのみ（例えば、Ｃｐｆ１の場合）であってもよい、ｇＲＮＡ－ＣＡＳ複合体をプロトスペーサー配列に標的化するためのガイド配列を含む。任意選択で、１つ以上のタイプのガイドＲＮＡを同一の実験において使用することができ、例えば、２つ以上の異なる目的の核酸分子を対象とするか、又は同じ目的の核酸分子でさえも対象とすることできる。

任意選択の実施形態では、本発明の方法は、ミスマッチ部位のヘテロ二重鎖を認識及び切断する酵素を使用することによって、多型検出及び／又は遺伝的変異検出を行うためのものである。そのような実施形態内では、１つ又は複数のヌクレオチドサンプルを断片化し、その後、本発明の方法のステップｂ）の前又は後で少なくとも１ラウンドの変性及びアニーリングに供する。次いで、本発明の方法のステップｃ）の後、ＣＥＬＩなどの、ヘテロ二重鎖を認識及び切断する酵素で、又は参照により本明細書に組み込まれるＬａｎｇｈａｎｓＭＴ及びＰａｌｌａｄｉｎｏＭＪ（ＣｕｒｒＩｓｔｕｍｅｓＭｏｌＢｉｏｌ．２００９；１１（１）：１～１２）に記載の酵素で、閉端された核酸を処理することができる。これにより、ヘテロ二重鎖を含む二本鎖ＤＮＡ分子のみの開端がもたらされ、次いでそれらをさらなる処理（例えば、配列決定アダプターをこうした開端末端に連結し、その後の配列決定を行うことによる）のために選択的に含めてもよく、又はさらなる処理（例えば、こうした断片をエキソヌクレアーゼ処理によって分解することによる）のために選択的に除外してもよい。

一実施形態では、この方法は、ステップｄ）において１つの開端末端及び１つの閉端末端を含む第１の核酸分子を得た後、サンプルをエキソヌクレアーゼに曝露するステップｅ）を含み得る。したがって、この実施形態では、第１の核酸は開端末端を含み、第２の核酸は２つの閉端末端を含む。したがって、第２の核酸分子は、エキソヌクレアーゼ分解から保護されることになるが、第１の核酸分子は保護されないだろう。したがって、エキソヌクレアーゼへの曝露は、第１の核酸の消化をもたらすが、第２の核酸の消化はもたらさない。この実施形態では、第２の核酸分子は、好ましくは、目的の配列を含む。

エキソヌクレアーゼは、任意選択で、ステップｃ１）において本明細書で定義した同じ又は同様の条件下での、ステップｃ１）において本明細書で定義したエキソヌクレアーゼであり得る。好ましくは、エキソヌクレアーゼ消化は、少なくとも１つの開端末端を含むすべての又は実質的にすべての核酸分子の消化をもたらす。したがって、この実施形態では、本発明の方法は、
ａ）少なくとも第１及び第２の核酸分子を含むサンプルを用意するステップであって、第１の核酸分子が第２の核酸分子に存在しない第１の標的配列を含み、任意選択で第２の核酸分子が第２の標的配列を含む、ステップと；
ｂ）本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第１及び第２の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと；
ｃ）アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第１及び第２の核酸分子をもたらすステップと；
ｄ）閉端末端を含む第１の核酸分子を第１の標的配列にて切断して、１つの開端末端及び１つの閉端末端を含む第１の核酸を用意するステップと；
ｅ）サンプルをエキソヌクレアーゼに曝露するステップと
を含み得る。

任意選択で、この方法は、ステップｃ）とｄ）との間に、本明細書の上記に記載のステップｃ１）をさらに含み得る。

任意選択で、ステップｅ）は、制限エンドヌクレアーゼ及び／又はプログラム可能なヌクレアーゼを除去及び／又は不活性化するステップｅ１）、続いてサンプルをエキソヌクレアーゼに曝露するステップｅ２）を含み得る。

ステップｅ１）は、サンプルを適切な温度に加熱して、制限エンドヌクレアーゼ及び／又はプログラム可能なヌクレアーゼを除去及び／又は不活性化することを含み得る。非限定的な例として、温度は、少なくとも４０℃、４５℃、５０℃、５５℃、６０℃、６５℃、７０℃、７５℃、８０℃又はそれ以上に上昇させてもよい。温度は、少なくとも約５’、１０’、１５’、２０’、２５’、３０’、３５’、４０’、４５’、５０’、５５’、６０’（分間）又はそれ以上の期間、上昇させてもよい。

或いは、又はさらに、ステップｅ１）は、切断された第１の核酸分子を精製することを含み得る。切断された第１の核酸分子の精製は、ＡＭＰｕｒｅビーズベース精製プロセス、並びに／又は限定するものではないがプロテイナーゼＫによる消化などプロテイナーゼを用いた、制限エンドヌクレアーゼ及び／若しくはプログラム可能なヌクレアーゼの部分的若しくは完全な消化などの、任意の従来手段を使用して実施することができる。

その後、２つの閉端末端を含む第２の核酸分子を標的配列にて切断してもよい。したがって、本発明の方法は、閉端末端を含む第２の核酸分子を第２の標的配列にて切断して、１つの開端末端及び１つの閉端末端を含む第２の核酸をもたらすステップｆ）をさらに含み得る。第２の核酸分子の標的配列は、好ましくは、第１の核酸分子には存在しない。しかしながら、この実施形態内では、第２の核酸分子の切断が行われる時点では第１の核酸分子は既に除去されているため、任意選択で、第２の核酸分子の標的配列は、第１の核酸分子にも存在する。好ましくは、本発明の方法は、
ａ）少なくとも第１及び第２の核酸分子を含むサンプルを用意するステップであって、第１の核酸分子が第２の核酸分子に存在しない第１の標的配列を含み、任意選択で第２の核酸分子が第２の標的配列を含む、ステップと；
ｂ）本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第１及び第２の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと；
ｃ）アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第１及び第２の核酸分子をもたらすステップと；
ｄ）閉端末端を含む第１の核酸分子を第１の標的配列にて切断して、１つの開端末端及び１つの閉端末端を含む第１の核酸を用意するステップと；
ｅ）サンプルをエキソヌクレアーゼに曝露するステップと；
ｆ）閉端末端を含む第２の核酸分子を第２の標的配列にて切断して、１つの開端末端及び１つの閉端末端を含む第２の核酸をもたらすステップと
を含み得る。

好ましくは、ステップｆ）の第２の核酸分子は、プログラム可能なヌクレアーゼ又は制限エンドヌクレアーゼ、好ましくはステップｄ）で定義した制限エンドヌクレアーゼ又はステップｄ）で定義したプログラム可能なヌクレアーゼによって切断される。好ましくは、ステップｆ）の第２の核酸分子は、プログラム可能なヌクレアーゼを使用して、好ましくはＣＲＩＳＰＲヌクレアーゼ、ジンクフィンガーヌクレアーゼ、ＴＡＬＥＮ、及びメガヌクレアーゼのうちの少なくとも１つを使用して消化され得る。好ましくは、第２の核酸分子は、ＲＮＡ誘導型ＣＲＩＳＰＲヌクレアーゼによって消化される。第１及び第２の核酸分子を切断するために使用されるＣＲＩＳＰＲヌクレアーゼは、同じであってもよく又は異なっていてもよい。第１及び第２の核酸分子を切断するために使用されるＣＲＩＳＰＲヌクレアーゼが同じである場合、ＣＲＩＳＰＲヌクレアーゼに結合しているガイドＲＮＡ配列は同じではない。別の表現をすると、ＣＲＩＳＰＲヌクレアーゼを使用して第１及び第２の核酸分子を切断する場合、第１の核酸分子を認識及び切断するｇＲＮＡ－Ｃａｓ複合体は、第２の核酸分子を認識及び切断する異なるｇＲＮＡ－Ｃａｓ複合体であることが本明細書では理解される。

この方法は、追加の（又は「さらなる」）アダプターを、１つの開端末端及び１つの閉端末端を含む第１及び第２の核酸分子のうちの少なくとも１つの開端末端に連結するステップｇ）をさらに含み得る。

したがって、一実施形態では、この方法は、ステップａ）、ステップｂ）、ステップｃ）、ステップｄ）、及びステップｇ）を含み得る。任意選択で、この方法は、ステップａ）、ステップｂ）、ステップｃ）、ステップｃ１）、ステップｄ）、及びステップｇ）を含み得る。この実施形態では、追加のアダプターは、第１の核酸分子の開端末端に連結される。第１の核酸分子は、好ましくは、目的の配列を含む。

別の実施形態では、この方法は、ステップａ）、ステップｂ）、ステップｃ）、ステップｄ）、ステップｅ）、ステップｆ）、及びステップｇ）を含み得る。任意選択で、この方法は、ステップａ）、ステップｂ）、ステップｃ）、ステップｃ１）、ステップｄ）、ステップｅ）、及びステップｇ）を含み得る。この実施形態では、追加のアダプターは、第２の核酸分子の開端末端に連結される。第２の核酸分子は、好ましくは、目的の配列を含む。

追加のアダプターは、増幅及び／又は配列決定に適したアダプターであり得る。追加のアダプターは、配列決定アダプターであってもよく、例えば、Ｒｏｃｈｅ４５４Ａ及び４５４Ｂシーケンシング、ＩＬＬＵＭＩＮＡ（商標）ＳＯＬＥＸＡ（商標）シーケンシング、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓのＳＯＬＩＤ（商標）シーケンシング、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓのＳＭＲＴ（商標）シーケンシング、ＰｏｌｌｏｎａｔｏｒＰｏｌｏｎｙシーケンシング、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＯＮＴ）、Ｏｎｔｅｒａシーケンシング、又はＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓシーケンシングを可能にする機能性ドメインを含む。

したがって、好ましくは、追加のアダプターは、少なくとも１つの配列決定プライマー結合部位を含み、及び／又は追加のアダプターは、少なくとも１つの増幅プライマー結合部位を含む。追加のアダプターは、少なくとも２つの配列決定プライマー結合部位を含み得、及び／又はさらなるアダプターは、少なくとも２つの増幅プライマー結合部位を含み得る。追加のアダプターは、一本鎖、二本鎖、部分的に二本鎖、Ｙ字型、又はヘアピン核酸分子であり得る。好ましくは、アダプターは、ヘアピンアダプター又はＹ字型アダプターである。

ステムループアダプター又はヘアピンアダプターは一本鎖であるが、それらの末端は相補的であり、その結果、アダプターはそれ自体で折り返され、二本鎖部分と一本鎖ループが生じる。ステムループアダプターは、直鎖状の二本鎖核酸分子の末端に連結され得る。例えば、ステムループアダプターがステップｇ）において対応する第１又は第２の核酸分子の開端末端に接合される場合、末端ヌクレオチドは存在しない。したがって、得られる分子は末端ヌクレオチドを欠如する。

ステップｇ）の第１又は第２の核酸分子は、環状化可能なアダプターに連結され得る。この点において、開端末端を含む核酸分子は、断片のいずれかの側の適合性構造の自己環化によって環化され得るか（これは、アダプター連結により、若しくは連結されたアダプターの制限酵素消化の結果として生じ得る）、又は所望の断片の末端に相補的なセレクタープローブへのハイブリダイゼーションによって環化され得る。伸長及び連結の最終ステップは、共有結合で閉じた環状の、任意選択で二本鎖のポリヌクレオチドを生成する。

追加のアダプターは、保護アダプターであってもよい。この文脈では、保護アダプターは、エキソヌクレアーゼ消化のためのアダプターによって捕捉される核酸分子を保護するように特別に設計されたアダプターであると本明細書では理解されるべきある。そのようなアダプターは、化学的部分若しくは保護基（例えばホスホロチオエート）を含むことによって、或いは末端ヌクレオチドの欠如（ヘアピン若しくはステムループアダプター、又は環化可能なアダプター）のいずれかによって、エキソヌクレアーゼによる分解から保護することが好ましい。

任意選択で、追加のアダプターは、識別子配列、好ましくは本明細書で定義した識別子配列を含む。

好ましくは、核酸分子ライブラリーは、複数のサンプルから調製される。任意選択で、本発明の方法は多重化され、すなわち、複数の核酸サンプルに対して、例えば、少なくとも約１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、５００、１０００又はそれより多くの核酸サンプルに対して同時に適用される。したがって、この方法は、複数のサンプルに対して並行して実施することができ、「並行して」とは、実質的に同時であるが、各サンプルが別々の反応チューブ又は容器で処理されることであると本明細書では理解されるべきである。

さらに、又は或いは、本発明の方法の１つ又は複数のステップは、プールされたサンプルに対して実施することができる。第１及び／又は第２の核酸分子を元のサンプルまで遡るために、サンプルをプールする前に第１及び／又は第２の核酸分子を識別子でタグ付けすることができる。そのような識別子は、任意の検出可能な実体、例えば限定するものではないが、放射性標識又は蛍光標識であり得るが、好ましくは定義された長さの、特定のヌクレオチド配列又はヌクレオチド配列の組合せであるのが好ましい。さらに、又は或いは、サンプルは、独創的なプーリング戦略、例えば限定するものではないが、２Ｄ及び３Ｄプーリング戦略を使用してプールすることができ、それによって、プール後、各サンプルは、少なくとも２つ又は３つのプールにそれぞれ含まれる。特定の核酸分子は、第１及び／又は第２の核酸分子を含む対応するプールの座標を使用することによって、元のサンプルまで遡ることができる。複数のサンプルは、ステップｂ）、ステップｃ）、ステップｄ）、ステップｅ）、ステップｆ）の前、又はステップｇ）の前、又はステップｇ）の後でプールすることができる。

本明細書に記載のステップａ）とｂ）との間で、ステップｂ）とｃ）との間で、ステップｃ）とｄ）との間で、及び／又はステップｄ）の後で、核酸サンプルを精製してもよく、及び／又は反応酵素を不活性化してもよい。

本発明の実施形態では、本明細書に記載のステップｃ）とｃ１）との間で及び／又はステップｃ１）とｄ）との間で、核酸サンプルを精製してもよく、及び／又は反応酵素を不活性化してもよい。

本発明の実施形態では、本明細書に記載のステップｄ）とｅ）との間で、ｅ）とｆ）との間で、ステップｆ）とｇ）との間で、ステップｄ）とｇ）との間で、及び／又はステップｇ）の後で、核酸サンプルを精製してもよく、及び／又は反応酵素を不活性化してもよい。

複合体、酵素、遊離ヌクレオチド、考え得る遊離アダプター、及び考え得る小型無関連核酸分子を除去するために、精製ステップ、例えば、ＡＭＰｕｒｅビーズベース精製プロセスが含まれていてもよい。精製後に、第１の核酸分子及び／又は任意選択で第２の核酸分子を回収し、単一分子配列決定などのさらなる処理及び／又は分析に供することができる。

任意選択の精製ステップは、プロテイナーゼＫ処理である。或いは、又はさらに、前記精製は、以下のステップ：
ｉ．核酸サンプルを、第１の核酸分子及び／又は任意選択で第２の核酸分子に特異的及び効果的に結合する１つ又は複数の固体支持体に曝露するステップと；任意選択で、
ｉｉ．１つ又は複数の固体支持体を洗浄し、１つ又は複数の固体支持体から第１の核酸分子及び／又は任意選択で第２の核酸分子を溶出させるステップと
を含み得る。

１つ又は複数の固体支持体は、限定するものではないが、Ａｍｐｕｒｅビーズであり得る。精製後に少なくとも１つの単離された核酸分子が得られるため、本明細書で定義した方法は、核酸サンプルから１つ又は複数の核酸分子を単離するための方法であると考えることもできる。

本発明の方法は、サイズ選択ステップをさらに含み得る。任意選択で、サイズ選択ステップは、本発明の方法のステップｂ）の前、ステップｂ）とｃ）の間、ステップｃ）とｄ）の間、及び／又はステップｄ）の後に実施される。

一実施形態では、サイズ選択ステップは、本発明のステップｃ）とｃ１）との間で、及び／又はステップｃ１）とｄ）との間で実施される。

一実施形態では、サイズ選択ステップは、本発明のステップｄ）とｅ）との間で、ステップｅ）とｆ）との間で、ステップｆ）とｇ）との間で、又はステップｇ）の後で実施される。

或いは、さらなる精製、不活性化、及び／又はサイズ選択ステップは存在しない。したがって、一実施形態では、本発明の方法は、ステップａ）、ｂ）、ｃ）、ｄ）、ｅ）、ｆ）、及びｇ）の間に、又はステップｇ）後にいかなる精製ステップも必要としない。さらに、又は或いは、本発明の方法は、ステップａ）、ｂ）、ｃ）、ｄ）、ｅ）、ｆ）、及びｇ）の間に、又はステップｇ）後にいかなる不活性化ステップも必要としない。さらに、又は或いは、本発明の方法は、ステップａ）、ｂ）、ｃ）、ｄ）、ｅ）、ｆ）、及びｇ）の間に、又はステップｇ）後にいかなるサイズ選択ステップも必要としない。

本発明の方法は、１つ又は複数の標的核酸分子を配列決定するステップが続き得る。本明細書で定義した方法はまた、したがって、核酸サンプルから１つ又は複数の標的核酸分子を配列決定するための方法と考えることもできる。

好ましくは、配列決定ステップは、プロテロメラーゼ認識配列を含むアダプターの付加後に実施される。好ましくは、配列決定ステップは、ステップｃ）後で、つまり環状核酸分子の配列決定後に実施される。好ましくは、配列決定ステップは、さらなるアダプターの付加後に実施される。好ましくは、配列決定ステップは、ステップｇ）後に実施される。第１及び第２の核酸分子のうちの少なくとも１つの配列決定は、ステップｂ）後、ステップｃ１）後、ステップｄ）後、ステップｅ）後、又はステップｆ）後に実施することができる。

任意選択で、本発明の方法は、増幅ステップをさらに含む。増幅ステップは、アダプターを含む核酸分子を閉端した後で実施することができ、アダプターは、プロテロメラーゼ認識配列を含む。好ましくは、増幅ステップは、ステップｃ）後に、つまり環状核酸分子の増幅後に実施される。任意選択で、増幅ステップは、さらなるアダプターを第１又は第２の核酸分子にアニーリングさせた後で実施される。好ましくは、増幅ステップは、ステップｇ）後に実施される。第１及び第２の核酸分子のうちの少なくとも１つの増幅は、ステップａ）後、ステップｂ）後、ステップｃ１）後、ステップｄ）後、ステップｅ）後、及び／又はステップｆ）後に実施することができる。増幅は、ＰＣＲによって、又は当技術分野で公知の任意の増幅方法によって実施することができる。

一実施形態では、本発明の方法は、増幅ステップ及び／又はクローニングステップを含まない配列決定法である。エピジェネティックな情報（例えば、５－ｍＣ、６－ｍＡなど）がアンプリコンで失われるので、増幅ステップの減少は有益である。さらなる増幅は、アンプリコンに多様性を導入することができ（例えば、増幅中のエラーを介して）、その結果、それらのヌクレオチド配列は元のサンプルを反映しない。同様に、標的領域の別の生物へのクローニングは、多くの場合、元のサンプル核酸中に存在する修飾が維持されないため、いくつかの実施形態では、さらなる分析のために濃縮される標的配列は、典型的には、本明細書の方法では増幅及び／又はクローニングされない。

一態様では、本発明の方法は、核酸分子ライブラリーを増幅するための方法に関する。この方法は、好ましくは、本明細書で定義した核酸分子ライブラリーを調製するステップを含む。核酸分子ライブラリーは、好ましくは、
本明細書で定義したステップａ）、ｂ）、及びｃ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、及びｃ１）；
本明細書で定義したステップａ）、ｂ）、ｃ）、及びｄ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｃ１）、及びｄ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｄ）、及びｇ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｃ１）、ｄ）、及びｇ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｄ）、及びｅ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｃ１）、ｄ）、及びｅ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｄ）、ｅ）、及びｆ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｃ１）、ｄ）、ｅ）、及びｆ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｄ）、ｅ）、ｆ）、及びｇ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｃ１）、ｄ）、ｅ）、ｆ）、及びｇ）
のうちの少なくとも１つを使用して調製される。

この方法は、核酸分子ライブラリーを増幅するステップをさらに含む。
増幅は、単一のプライマーを使用して、例えば「ローリングサークル」増幅によって実施することができる。単一のプライマーは、好ましくは、
ｉ）ステップｄ）において得られる１つの開端末端及び１つの閉端末端を含む第１の核酸分子にアニーリングするプライマー；
ｉｉ）ステップｆ）において得られる１つの開端末端及び１つの閉端末端を含む第２の核酸分子にアニーリングするプライマー；並びに
ｉｉｉ）ステップｇ）で定義したさらなるアダプターにアニーリングするプライマー
のうちの少なくとも１つである。

或いは、又はさらに、増幅は、プライマー対を使用して、つまり第１及び第２のプライマーを使用して実施することができ、対応する第１及び／又は第２の核酸分子の増幅を可能にするように、好ましくは、第１及び第２のプライマーは、第１の核酸分子にアニーリングすることができ、並びに／又は第１及び第２のプライマーは、第２の核酸分子にアニーリングすることができる。

好ましくは、プライマー対は、第１の核酸分子に、好ましくは本明細書で定義したステップａ）、ｂ）、ｃ）、ｃ１）、ｄ）、又はステップｇ）で得られる第１の核酸分子にアニーリングすることができる第１のプライマー及び第２のプライマーを含む。好ましくは、プライマー対は、本明細書で定義したステップｄ）又はステップｇ）で得られる１つの開端末端及び１つの開端末端を含む第１の核酸分子にアニーリングすることができる第１のプライマー及び第２のプライマーを含む。

或いは、又はさらに、プライマー対は、第２の核酸分子に、好ましくは、本明細書で定義したステップａ）、ｂ）、ｃ）、ｃ１）、ｄ）、ｅ）、ｆ）、又はステップｇ）で得られる第２の核酸分子にアニーリングすることができる第１のプライマー及び第２のプライマーを含み得る。好ましくは、プライマー対は、本明細書で定義したステップｆ）又はステップｇ）で得られる１つの開端末端及び１つの開端末端を含む第２の核酸分子にアニーリングすることができる第１のプライマー及び第２のプライマーを含む。

好ましくは、プライマー対の第１のプライマーは、プライマー対の第２のプライマーと相補的ではないか又は実質的に相補的ではない。

一実施形態では、第１及び第２のプライマーのうちの少なくとも１つは、アダプターに、好ましくは本明細書で定義したプロテロメラーゼ認識配列を含むアダプターに及び／又はステップｇ）で定義したさらなるアダプターに存在する配列にアニーリングすることができる。

第１及び第２のプライマーは、同じアダプターに、好ましくは本明細書で定義したステップｇ）のアダプターに存在する第１の配列及び第２の配列にアニーリングすることができる。非限定的な例として、アダプターは、Ｙ字型アダプターであってもよく、第１のプライマー結合部位は、Ｙ字型アダプターの第１の一本鎖アームに存在してもよく、第２のプライマー結合部位は、Ｙ字型アダプターの他方の一本鎖アームに存在してもよい。

或いは、又はさらに、第１の増幅プライマーは、第１の核酸分子に存在する配列にアニーリングすることができ、第２の増幅プライマーは、アダプターに、好ましくは、プロテロメラーゼ認識配列を含むアダプターに又は本明細書で定義したステップｇ）のさらなるアダプターに存在する配列にアニーリングすることができる。

或いは、又はさらに、第１の増幅プライマーは、第２の核酸分子に存在する配列にアニーリングすることができ、第２の増幅プライマーは、アダプターに、好ましくは、プロテロメラーゼ認識配列を含むアダプターに又は本明細書で定義したステップｇ）のさらなるアダプターに存在する配列にアニーリングすることができる。

或いは、又はさらに、第１の増幅プライマーは、プロテロメラーゼ認識配列を含むアダプターに存在する配列にアニーリングすることができ、第２の増幅プライマーは、本明細書で定義したステップｇ）のさらなるアダプターに存在する配列にアニーリングすることができる。

さらなる態様では、本発明は、第１及び第２の核酸分子を含むサンプル中の目的の配列を分析するための方法に関する。この方法は、好ましくは、本明細書で定義した核酸分子ライブラリーを調製するステップを含む。

サンプルは、少なくとも第１及び第２の核酸分子を含み得る。第１及び／又は第２の核酸分子は、より長い核酸分子の一部であり得る。核酸サンプルは、第１及び第２の核酸分子を含む、複数の核酸分子を含み得る。

本明細書に詳述されているように、調製された核酸ライブラリーは、好ましくは、第１及び第２の核酸分子のうちの少なくとも１つを含む。一実施形態では、調製された核酸ライブラリーは、第１の核酸分子を含むが、第２の核酸分子を含まない。代替的な実施形態では、調製された核酸ライブラリーは、第２の核酸分子を含むが、第１の核酸分子を含まない。

前記第１又は第２の核酸分子は、好ましくは、目的の配列を含む。核酸分子ライブラリーは、好ましくは、
本明細書で定義したステップａ）、ｂ）、及びｃ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、及びｃ１）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｄ）、及びｇ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｃ１）、ｄ）、及びｇ）；
本明細書で定義したステップａ）、ｂ）、ｃ）、ｄ）、ｅ）、ｆ）、及びｇ）；並びに
本明細書で定義したステップａ）、ｂ）、ｃ）、ｃ１）、ｄ）、ｅ）、ｆ）、及びｇ）
のうちの少なくとも１つを使用して調製される。

この方法は、好ましくは、調製された核酸分子ライブラリーを分析するステップをさらに含む。分析は、当技術分野で公知の任意の従来手段を使用して実施することができる。分析は、
標識、例えば放射性標識又は蛍光標識を使用して配列を検出すること；
調製された核酸分子ライブラリーのサイズを分析すること；
ライブラリーを、任意選択でその一部をベクターにクローニングし、任意選択で続いて遺伝子発現及び／又は制限分析を行うこと；並びに
核酸分子ライブラリーを配列決定すること
のうちの少なくとも１つを含み得る。

好ましくは、調製された核酸分子ライブラリーは、配列決定、好ましくはディープシーケンシングされる。配列決定は、ＩＬＬＵＭＩＮＡ（商標）、ＳＯＬＥＸＡ（商標）シーケンシング、ＩｏｎＴｏｒｒｅｎｔシーケンシング、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓのＳＭＲＴ（商標）シーケンシング、Ｓａｎｇｅｒシーケンシング、Ｇｅｎａｐｓｙｓ、ＰｏｌｌｏｎａｔｏｒＰｏｌｏｎｙシーケンシング、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＯＮＴ）、Ｏｎｔｅｒａシーケンシング、及びＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓシーケンシングのうちの少なくとも１つを含み得る。

好ましい実施形態では、調製された核酸分子ライブラリーは、ナノポア選択的シーケンシングによって配列決定される。ナノポア選択的シーケンシングでは、リアルタイムシーケンシング中、生成されたデータ（直流電流シグナル又はこうした電流シグナルから変換された塩基コール）を、１つ又は複数の参照配列と比較する。標的配列のヌクレオチドの設定数又はシグナルの量を参照配列とアラインする場合、配列決定を進行させ、そうでない場合は、電流を反転させ、それによりポアから核酸が除去され、ポアが新しい核酸の配列決定に利用可能になるだろう。ヌクレオチドの設定数は、読み取られた核酸の少なくとも最初の５０、６０、７０、８０、９０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、又は５００ヌクレオチドであり得る。１つ又は複数の参照配列は、多数の異なる配列であり得る。好ましくは、こうした参照配列の各々は、本発明の方法によって得られる核酸分子ライブラリーの標的核酸断片の配列と、少なくとも５０、６０、７０、８０、９０、９２、９３、９４、９５、９６、９７、９８、９９、又は１００％同一である。一実施形態では、参照配列の各々は、本発明の方法によって得られる核酸分子ライブラリーの標的核酸断片のうちの１つ又は複数の配列の特定のサブセットと、少なくとも５０、６０、７０、８０、９０、９２、９３、９４、９５、９６、９７、９８、９９、又は１００％同一である。ナノポア選択的シーケンシングによって特定のサブセットを選択的に配列決定する利点の１つは、調製された核酸分子ライブラリーを使用して、異なる配列決定実行において異なるサブセットを配列決定することができることである。

一実施形態では、プロテロメラーゼ認識配列を含むアダプターは、配列決定プライマーに対する少なくとも１つの結合部位を含む。

或いは、又はさらに、ステップｇ）のさらなるアダプターは、配列決定プライマーに対する少なくとも１つの結合部位を含む。ステップｇ）のさらなるアダプターは、２つの配列決定プライマーに対する２つの異なる結合部位を含み得る。非限定的な例として、ステップｇ）のアダプターは、Ｙ字型アダプターであってもよく、第１の配列決定プライマー結合部位は、Ｙ字型アダプターの第１の一本鎖アームに存在してもよく、第２の配列決定プライマー結合部位は、Ｙ字型アダプターの他方の一本鎖アームに存在してもよい。

一態様では、本発明は、目的の配列を含む核酸分子について核酸サンプルを濃縮するための方法に関する。この方法は、好ましくは、本明細書の上記で詳述した少なくとも方法ステップａ）～ｄ）を使用するが、ステップｃ１）、ステップｅ）、ステップｆ）、及び／又はステップｇ）など、本明細書で詳述した追加のステップのいずれかを使用してもよい。

一態様では、本発明は、本明細書に記載の本発明の方法を実施するためのキットオブパーツに関する。好ましくは、キットオブパーツは、本明細書で定義した方法で使用するためのものである。好ましくは、キットオブパーツは、本明細書で定義したプロテロメラーゼ認識配列を含む少なくとも１つ又は複数のアダプターを含む。

本明細書で定義した方法で使用するためのアダプターは、好ましくは、本発明の方法のステップｄ）及び／又はステップｆ）で使用される制限エンドヌクレアーゼ又はプログラム可能なヌクレアーゼの認識部位を含まない。より好ましくは、プロテロメラーゼ認識配列と第１及び／又は第２の核酸分子に連結した末端との間に位置するアダプターの部分は、本発明の方法のステップｄ）及び／又はステップｆ）で使用される制限エンドヌクレアーゼ又はプログラム可能なヌクレアーゼの認識部位を含まない。

１つ又は複数のアダプターは、１つのバイアルに組み合わせてもよく又は別々のバイアルに存在してもよく、例えば、１つのバイアルのアダプターは、同じ識別子配列、好ましくは同じサンプル識別子配列を含む。キットオブパーツは、本明細書で定義したプロテロメラーゼを含むバイアルをさらに含み得る。

キットオブパーツは、本明細書に記載の方法を実行するための１つ又は複数の試薬を含み得る。したがって、キットオブパーツは、
本明細書で定義したプロテロメラーゼ認識配列を含むアダプターを含む１つ又は複数のバイアル；
ステップｇ）のための本明細書で定義したさらなるアダプターを含む１つ又は複数のバイアル；
本明細書で定義したプロテロメラーゼを含む１つ又は複数のバイアル；
本明細書で定義したｇＲＮＡ－ＣＡＳ複合体を含む１つ又は複数のバイアル；
ＣＲＩＳＰＲ－ＣＡＳタンパク質と複合体を形成してｇＲＮＡ－ＣＡＳ複合体を形成するためのｇＲＮＡを含む１つ又は複数のバイアル、及び前記ＣＲＩＳＰＲ－ＣＡＳタンパク質を含むさらなるバイアル；
１つ又は複数のエキソヌクレアーゼを含むさらなるバイアル
のうちの少なくとも１つを含み得る。

好ましくは、キットは、本明細書で定義した１つ又は複数のｇＲＮＡを含む少なくとも２、４、１０、２０、３０、又は５０個のバイアルを含む。好ましくは、キット内のいずれかのバイアルの容量は、１００ｍＬ、５０ｍＬ、２０ｍＬ、１０ｍＬ、５ｍＬ、４ｍＬ、３ｍＬ、２ｍＬ、又は１ｍＬを超えない。

試薬は、凍結乾燥された形態で存在していてもよく、又は適切なバッファー中に存在していてもよい。キットはまた、本発明を実施するのに必要な任意の他の構成要素、例えば、バッファー、ピペット、マイクロタイタープレート、及び書面の説明書を含むことができる。本発明のキットのためのそのような他の構成要素は、当業者には公知である。

一態様では、本発明は、
（ｉ）核酸分子ライブラリーの調製；
（ｉｉ）核酸分子ライブラリーの増幅；及び
（ｉｉｉ）サンプル中の目的の配列の分析
のうちの少なくとも１つのための本明細書で定義したプロテロメラーゼ認識配列を含むアダプターの使用に関する。

材料及び方法
ＴｅＩＮ認識部位を含むアダプターを、
オリゴ１９＿０４６２６（１００μＭ）：２μｌ
オリゴ１９＿０３０５３（１００μＭ）：２μｌ
を組み合わせることにより調製した。

オリゴの配列：
１９＿０４６２６５’－ＡＧＧＡＣＣＧＧＡＴＣＡＡＣＴＴＡＴＣＡＧＣＡＣＡＣＡＡＴＴＧＣＣＣＡＴＴＡＴＡＣＧＣＧＣＧＴＡＴＡＡＴＧＧＡＣＴＡＴＴＧＴＧＴＧＣＴＧＡＴＡＡＡＧＡＡＡＧＴＴＧＴＣＧＧＴＧＴＣＴＴＴＧＴＧＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧＴ－３’（配列番号１９）
１９＿０３０５３５’－ＣＴＧＴＣＴＣＴＴＡＴＡＣＡＣＡＴＣＴＣＡＣＡＡＡＧＡＣＡＣＣＧＡＣＡＡＣＴＴＴＣＴＴＴＡＴＣＡＧＣＡＣＡＣＡＡＴＡＧＴＣＣＡＴＴＡＴＡＣＧＣＧＣＧＴＡＴＡＡＴＧＧＧＣＡＡＴＴＧＴＧＴＧＣＴＧＡＴＡＡＧＴＴＧＡＴＣＣＧＧＴＣＣＴ－３’（配列番号２０）。５’末端は好ましくはリン酸化されている。

オリゴのハイブリダイゼーションを可能にするため、以下の熱プロファイルを使用した：
９５℃で１０分間
９０℃で１分間
温度を１℃／サイクルで６０回下降させる
４℃を維持
得られたアダプター溶液（５０μＭ）を１５μＭ濃度に希釈した。

この実施例のインプット材料は、ラムダＤＮＡに由来する１Ｋｂｐアンプリコンだった。
以下の設定を使用して増幅を実施した：
ラムダＤＮＡ５ｎｇ／μｌ５μｌ
ＭｉｌｌｉＱ水９．３μｌ
ＰＣＲバッファー４μｌ
２５ｍＭｄＮＴＰ（各々）０．２μｌ
Ｈｅｒｃｕｌａｓｅポリメラーゼ０．５μｌ
フォワードプライマー（１０μＭ）０．５μｌ
リバースプライマー（１０μＭ）０．５μｌ
フォワードプライマー：１８＿０３０２９：５’－ＴＣＡＣＧＣＴＧＡＴＴＴＡＣＡＧＣＧＧＣＡ－３’（配列番号２１）
リバースプライマー：１８＿０３０３２：５’－ＣＧＡＴＧＣＴＧＡＴＴＧＣＣＧＴＴＣＣＧ－３’（配列番号２２）

増幅のための熱プロファイルは、以下の通りだった：
９５℃で２分間
９５℃で３０秒間
６５℃で３０秒間－＞温度を０．７℃／サイクルで低減させる
７２℃で４分間
１３サイクル
９５℃で３０秒間
５６℃で３０秒間
７２℃で５分間
２５サイクル
７２℃で２分間
１２℃で維持

得られたアンプリコンを０．８×精製し、２０ｕｌＭＱで溶出した。ＱｕｂｉｔＢＲで濃度を測定した：５５４ｎｇ／μｌ
精製したアンプリコンを末端修復し、Ａ尾部化した。

末端修復（２つの反応を実施）：
２μｌの精製アンプリコン
７μｌのＮＥＢＮｅｘｔＵｌｔｒａＩＩＥｎｄＰｒｅｐ反応バッファー（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓＩｎｃ．）
３μｌのＮＥＢＮｅｘｔＵｌｔｒａＩＩＥｎｄＰｒｅｐ酵素混合物（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓＩｎｃ．）
４８μｌＭｉｌｌｉＱ水
総容積＝６０μｌ－＞２０℃で３０分間、６５℃で３０分間インキュベートし、さらなる使用まで４℃で維持。

アダプター連結：
６０μｌのＮＥＢＮｅｘｔＵｌｔｒａＩＩＥｎｄＰｒｅｐ反応混合物（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓＩｎｃ．）
３０μｌのＮＥＢＮｅｘｔＵｌｔｒａＩＩ連結マスター混合物（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓＩｎｃ．）
１μｌのＮＥＢＮｅｘｔ連結エンハンサー（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓＩｎｃ．）
２．５μｌアダプター（５０μＭ）
総容積＝９３．５μｌ－＞１５℃で２０分間インキュベート
得られた連結サンプルを、１：１のＡｍｐｕｒｅビーズを使用して精製し、２０μｌのＭｉｌｌｉＱ水で溶出した。

残留アダプターを除去するため、追加のＡｍｐｕｒｅ精製（０．７５×）を実施した。

アダプター連結産物の濃度は４０ｎｇ／μｌである。

アダプター連結産物をＴｅＩＮで処理して、末端を共有結合で閉端した。
アダプター連結産物４μｌ
ＴｈｅｒｍｏＰｏｌ反応バッファー（１０×）（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓＩｎｃ．）２μｌ
ＴｅＩＮプロテロメラーゼ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓＩｎｃ．）２μｌ
ＭｉｌｌｉＱ水１２μｌ

反応混合物をピペッティングによって穏やかに混合し、手短に遠心分離し、３０℃で３０分間インキュベートした。７５℃で５分間インキュベートすることによって酵素を不活性化した。

得られたサンプルを、１：１のＡｍｐｕｒｅビーズを使用して精製し、１５μｌのＭｉｌｌｉＱ水で溶出した。

エキソヌクレアーゼ保護を検証するため、ＴｅＩＮ処理サンプルをエキソヌクレアーゼＶと共にインキュベートした。
サンプル１０μｌ
ＮＥＢバッファー３．１（１０×）２．０μｌ
ＡＴＰ（１００ｍＭ）１．０μｌ
エキソヌクレアーゼＶ（１０ユニット）１．０μｌ
ＭｉｌｌｉＱ水６．０μｌ
反応混合物を３７℃で６０分間インキュベートした。エキソヌクレアーゼを７０℃で３０分間不活性化した。

サンプルを、Ａｍｐｕｒｅ（１×）を使用して精製し、１０ｕｌのＭｉｌｌｉＱ水で溶出した。

結果
バイオアナライザー分析の結果は図１に示されている。手短に言えば、
アンプリコン及びアダプター連結アンプリコンは、エキソヌクレアーゼＶを使用して容易に分解される。

アダプター連結アンプリコン及びＴｅＩＮ処理アンプリコンは、エキソヌクレアーゼ分解に耐性である。

結論
ＤＮＡ断片の末端をＴｅＩＮを使用して共有結合で閉端することによって、エキソヌクレアーゼＶ耐性断片がもたらされる。

Claims

少なくとも部分的に二本鎖であり、プロテロメラーゼ認識配列、好ましくはＴｅＩＮプロテロメラーゼ認識配列を含むアダプター。
識別子配列をさらに含む、請求項１に記載のアダプター。
少なくとも１つの付着末端を含む、請求項１又は２に記載のアダプター。
核酸分子ライブラリーを調製するための方法であって、
ａ）少なくとも第１及び第２の核酸分子を含むサンプルを用意するステップであり、前記第１の核酸分子が前記第２の核酸分子に存在しない第１の標的配列を含み、任意選択で前記第２の核酸分子が第２の標的配列を含む、ステップと；
ｂ）請求項１～３のいずれか一項で定義したアダプターを、前記第１及び第２の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと；
ｃ）前記アダプター連結核酸分子を、プロテロメラーゼ、好ましくはＴｅＩＮプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第１及び第２の核酸分子をもたらすステップと；
ｄ）前記閉端末端を含む前記第１の核酸分子を前記第１の標的配列にて切断して、１つの開端末端及び１つの閉端末端を含む第１の核酸を用意するステップと
を含む方法。
ステップａ）の前記サンプルが、前記第１及び第２の核酸分子、並びに複数のさらなる核酸分子を含む、請求項４に記載の方法。
ステップｄ）の前記第１の核酸分子が、プログラム可能なヌクレアーゼ又は制限エンドヌクレアーゼによって切断され、好ましくは、前記プログラム可能なヌクレアーゼが、ＲＮＡ誘導型ＣＲＩＳＰＲヌクレアーゼである、請求項４又は５に記載の方法。
ステップａ）の前記第１及び第２の核酸分子が、断片化、好ましくはゲノム核酸分子の断片化によって用意され、好ましくは、ステップｂ）の前記アダプターが、タグメンテーションによって連結される、請求項４～６のいずれか一項に記載の方法。
ステップｃ）において閉端末端を含む前記核酸分子を得た後だが、ステップｄ）において前記閉端末端を含む前記第１の核酸分子を切断する前に、前記サンプルをエキソヌクレアーゼに曝露するステップｃ１）を含む、請求項４～７のいずれか一項に記載の方法。
ステップｄ）において１つの開端末端及び１つの閉端末端を含む前記第１の核酸分子を得た後、前記サンプルをエキソヌクレアーゼに曝露するステップｅ）を含み、好ましくは、前記閉端末端を含む前記第２の核酸分子を前記第２の標的配列にて切断して、１つの開端末端及び１つの閉端末端を含む第２の核酸をもたらすステップｆ）を含む、請求項４～７のいずれか一項に記載の方法。
１つの開端末端及び１つの閉端末端を含む前記第１の核酸分子又は任意選択で前記第２の核酸分子の開端末端にさらなるアダプターを連結するステップｇ）を含み、前記さらなるアダプターが、増幅プライマー結合部位及び配列プライマー結合部位のうちの少なくとも１つ並びに任意選択で識別子配列を含む、請求項４～９のいずれか一項に記載の方法。
核酸分子ライブラリーが、複数のサンプルから調製され、好ましくは前記複数のサンプルが、好ましくはステップｃ）、ステップｄ）、ステップｅ）、ステップｆ）の前に、若しくはステップｇ）の前にプールされるか、又は好ましくは、前記サンプルが、ステップｇ）の後でプールされる、請求項４～１０のいずれか一項に記載の方法。
ステップｂ）において、前記アダプター連結核酸分子を、ステップｃ）において前記分子をＴｅＩＮプロテロメラーゼと接触させる前に修復して一本鎖切断を除去する、請求項４～１１のいずれか一項に記載の方法。
核酸分子ライブラリーを増幅するための方法であって、
請求項４～１２のいずれか一項で定義した核酸分子ライブラリーを調製するステップと；
ｉ）ステップｄ）において得られる１つの開端末端及び１つの閉端末端を含む前記第１の核酸分子にアニーリングする第１のプライマー及び任意選択で第２のプライマー；
ｉｉ）ステップｆ）において得られる１つの開端末端及び１つの閉端末端を含む前記第２の核酸分子にアニーリングする第１のプライマー及び任意選択で第２のプライマー；
ｉｉｉ）ステップｇ）で定義した前記さらなるアダプターにアニーリングする第１のプライマー及び任意選択で第２のプライマー；並びに
ｉｖ）ｉ）又はｉｉ）で定義した第１のプライマー及びｉｉｉ）で定義した第２のプライマーの組合せ
のうちの少なくとも１つを使用して前記核酸分子ライブラリーを増幅するステップと
を含む方法。
第１及び第２の核酸分子を含むサンプル中の目的の配列を分析するための方法であって、
請求項４～１２のいずれか一項で定義した核酸分子ライブラリーを調製するステップと；
任意選択で、請求項１３で定義した前記調製された核酸分子を増幅するステップと；
前記核酸分子ライブラリーを配列決定、好ましくはディープシーケンシングするステップと
を含む方法。
請求項１～３のいずれか一項で定義した１つ又は複数のアダプターと；
任意選択で、プロテロメラーゼ、好ましくはＴｅＩＮプロテロメラーゼと
を含むキットオブパーツ。
請求項４～１４のいずれか一項に記載の方法で使用するための、請求項１５に記載のキットオブパーツ。
請求項４～１４のいずれか一項に記載の方法で使用するための、請求項１～３のいずれか一項に記載のアダプター。