JP2023543602A

JP2023543602A - 標的化された配列付加

Info

Publication number: JP2023543602A
Application number: JP2023519825A
Authority: JP
Inventors: ルネコルネリスヨセフスホジャーズ，; ステファンジョンホワイト，; テオドルスフランクマリアルーロフス，
Original assignee: キージーンナムローゼフェンノートシャップ
Priority date: 2020-10-06
Filing date: 2021-10-06
Publication date: 2023-10-17
Also published as: EP4225914A1; WO2022074058A1; US20230407366A1

Abstract

本発明は、部位特異的ヌクレアーゼ及び逆転写酵素の組合せを使用して標的核酸断片を標識する方法に関する。標識化は、標的核酸断片の少なくとも１つの遊離３’末端への特定のヌクレオチド配列の付加を結果としてもたらす。本発明は、標的核酸断片の配列を決定する方法、並びに本発明の方法における使用のための構築物及びキットにさらに関する。【選択図】図１

Description

本発明は、遺伝子研究の分野にあり、より詳細には、例えば遺伝子研究におけるさらなる分析又は処理のためのライブラリー調製のための、標的化された核酸単離の分野にある。核酸試料の複雑性低減又は核酸試料内の標的核酸の富化のための新たな方法及び組成物が開示される。

遺伝子研究の意義深い構成要素は、定義されたＤＮＡ座位の配列分析である。これは、既知のバリアントを遺伝子型判定するか、又は配列変化若しくはバリアントを同定することであり得る。そのような分析は多くの場合にマルチプレックスの文脈において行われる必要があり、例えば、特有の座位のセットが多数の試料において分析される必要がある。これを行うための理想的なアッセイは、スクリーニングされる必要がある試料及び座位の数に関して柔軟であり、非常に正確であり、異なるシークエンシングプラットフォームに適する。理想的には増幅なしの富化ステップを含むアッセイを提供する試みが行われてきた。例えば、米国特許出願公開第２０１４／０１３４６１０号は、ＩＩ型制限酵素を使用して試料中の核酸を断片化し、続いて保護的なアダプターをライゲートし、その後にエキソヌクレアーゼを使用してすべての捕捉されなかった核酸を分解する複雑性低減方法を記載している。国際公開第２０１６／０２８８８７号において、この方法は、試料中の核酸を断片化するためにプログラム可能なエンドヌクレアーゼ、すなわちＣＲＩＳＰＲ－エンドヌクレアーゼを使用することにより補正されている。

ＣＲＩＳＰＲ（クラスター化規則的間隔短鎖回文反復配列）は、複数の短いダイレクトリピートを含有する座位であり、シークエンシングされた細菌の４０％及びシークエンシングされた古細菌の９０％において見出されている。ＣＲＩＳＰＲリピートは、遺伝学的病原体、例えばバクテリオファージ及びプラスミドに対する獲得された細菌免疫のシステムを形成する。細菌が病原体に負荷された場合に、病原体のゲノムの小片はＣＲＩＳＰＲ関連タンパク質（ＣＡＳ）によりプロセシングされ、細菌ゲノム中にＣＲＩＳＰＲリピートの間で組み込まれる。ＣＲＩＳＰＲ座位は次に転写及びプロセシングされて、病原体のゲノムと同一のおよそ３０ｂｐの配列を含むいわゆるｃｒＲＮＡを形成する。これらのＲＮＡ分子は、その後の感染時の病原体の認識のための基礎を形成し、病原体のゲノムの直接的な消化を通じて病原体の遺伝子エレメントのサイレンシングをもたらす。ＣＡＳタンパク質Ｃａｓ９は、Ｓ．ピオゲネス（Ｓ．ｐｙｏｇｅｎｅｓ）からのＩＩ型ＣＲＩＳＰＲ－ＣＡＳシステムの必須の構成要素であり、トランス活性化ｃｒＲＮＡ（ｔｒａｃｒＲＮＡ）と称される第２のＲＮＡと共にｃｒＲＮＡと組み合わせられた場合に、エンドヌクレアーゼを形成する。この複合体は、ｃｒＲＮＡにより定義されるゲノム中の位置におけるＤＮＡ二本鎖切断（ＤＳＢ）の導入により分解のために侵入性病原体ＤＮＡを標的化する。このＩＩ型ＣＲＩＳＰＲ－Ｃａｓ９システムは、二本鎖切断の標的化された導入及び内因性修復機構のその後の活性化を介して、目的の部位において真核ゲノム中に改変を導入することが可能である、生化学における簡便及び有効なツールであることが証明されている。Ｊｉｎｅｋら（２０１２、Ｓｃｉｅｎｃｅ３３７：８１６～８２０頁）は、ｃｒＲＮＡ及びｔｒａｃｒＲＮＡの必須の配列を単一のＲＮＡ分子中に組み合わせることにより生成される単鎖キメラＲＮＡ（シングルガイドＲＮＡ、ｓＲＮＡ、ｓｇＲＮＡ）は、Ｃａｓ９と組み合わせて機能的なエンドヌクレアーゼを形成できることを実証した。それ以来、多くの異なるＣＲＩＳＰＲ－ＣＡＳシステムが異なる細菌種から同定されている（Ｚｅｔｓｃｈｅら、２０１５Ｃｅｌｌ１６３、７５９～７７１頁；Ｋｉｍら、２０１７、Ｎａｔ．Ｃｏｍｍｕｎ．８、１～７頁；Ｒａｎら、２０１５．Ｎａｔｕｒｅ５２０、１８６～１９１頁）。

エンドヌクレアーゼを核酸分子中の特定の位置に方向付けるためにＲＮＡガイドが使用されるＣＲＩＳＰＲ－ＣＡＳシステムの他に、ＤＮＡ又はＲＮＡガイドを使用する他のエンドヌクレアーゼが当技術分野において公知である（Ｄｏｘｚｅｎら、２０１７、ＰＬＯＳＯＮＥ１２（５）：ｅ０１７７０９７；Ｋａｙａら、２０１６、ＰＮＡＳｖｏｌ．１１３ｎｏ．１５、４０５７～４０６２頁）。

最近、ＣＲＩＳＰＲシステムは、「プライム編集」と呼ばれるプロセスにおいてＤＮＡを特異的に編集するために使用された（ＡｎｚａｌｏｎｅＡＶら、Ｎａｔｕｒｅ．２０１９；５７６（７７８５）：１４９～１５７頁）。操作された逆転写酵素に融合された触媒的に不具合のあるＣａｓ９エンドヌクレアーゼを使用して、予め決定されたゲノム位置において特異的な編集を行うことができた。

核酸複雑性低減のための多用途の及び正確な方法に対する強い必要性が依然として当技術分野において存在する。特に、例えば遺伝子研究におけるその後の分析又は処理のための、核酸分子の柔軟な及び有効な標識化を可能とする方法に対する必要性が当技術分野において存在する。

以下に詳細に記載される本発明は、下流の処理及び／又は分析のためのライブラリー調製の多用途の方法を可能とする。

本発明は、以下の実施形態において要約され得る：
実施形態１．標的核酸断片を標識する方法であって、標的核酸断片が第１の鎖及び相補的な第２の鎖を含み、標的核酸断片が目的の配列を含み、方法が、
ａ）二本鎖核酸分子を含む試料を提供するステップであり、二本鎖核酸分子が目的の配列を含む、ステップ；
ｂ）二本鎖核酸分子を部位特異的ヌクレアーゼと接触させて二本鎖切断を生成するステップであり、二本鎖切断が標的核酸断片の第１の鎖の遊離３’末端を結果としてもたらす、ステップ；並びに
ｃ）切断された核酸分子を逆転写酵素及び鋳型ＲＮＡ分子と接触させ、それにより、１つ又は複数のヌクレオチドで標的核酸断片の第１の鎖の遊離３’末端を標識するステップ
を含み、
任意選択でステップｂ）における部位特異的ヌクレアーゼ及びステップｃ）における逆転写酵素が別々の実体である、方法。

実施形態２．方法が、
ｄ）二本鎖核酸分子を第２の部位特異的ヌクレアーゼと接触させて第２の二本鎖切断を生成するステップであり、第２の二本鎖切断が標的核酸断片の第２の鎖の遊離３’末端を結果としてもたらす、ステップをさらに含み、好ましくはステップｄ）がステップｂ）と同時に行われる、実施形態１に記載の方法。

実施形態３．方法が、
ｅ）標的核酸断片を逆転写酵素及び第２の鋳型ＲＮＡ分子と接触させ、それにより、１つ又は複数のヌクレオチドで遊離３’末端において標的核酸断片の第２の鎖を標識するステップをさらに含み、好ましくはステップｅ）がステップｃ）と同時に行われる、実施形態２に記載の方法。

実施形態４．ステップｂ）及び／又はステップｄ）における部位特異的ヌクレアーゼが、好ましくはＣａｓ９又はＣｐｆ１ヌクレアーゼのうちの少なくとも１つを含む、ＣＲＩＳＰＲ－ヌクレアーゼ複合体である、先行する実施形態のいずれか１つに記載の方法。

実施形態５．ＣＲＩＳＰＲ－ヌクレアーゼ複合体がｃｒＲＮＡ及び任意選択でｔｒａｃｒＲＮＡを含む、実施形態４に記載の方法。

実施形態６．ステップｃ）の鋳型ＲＮＡ分子が、標的核酸断片の第１の鎖の３’末端における配列にアニールできるその３’末端における配列を含み、任意選択で鋳型ＲＮＡ分子の３’末端における配列が、ステップｂ）における部位特異的ヌクレアーゼのｃｒＲＮＡの配列に部分的に又は全体的に相補的である、実施形態４又は５に記載の方法。

実施形態７．ステップｅ）の鋳型ＲＮＡ分子が、標的核酸断片の第２の鎖の３’末端における配列にアニールできるその３’末端における配列を含み、任意選択で鋳型ＲＮＡ分子の３’末端における配列が、ステップｄ）における部位特異的ヌクレアーゼのｃｒＲＮＡの配列に部分的に又は全体的に相補的である、実施形態４～６のいずれか１つに記載の方法。

実施形態８．鋳型ＲＮＡ及びｃｒＲＮＡ、及び任意選択でｔｒａｃｒＲＮＡが別々のＲＮＡ分子である、実施形態４～７のいずれか１つに記載の方法。

実施形態９．第１の鎖を伸長するヌクレオチドの配列が、標的核酸断片の第２の鎖を伸長するヌクレオチドの配列とは異なり、好ましくは第１及び第２の鎖を伸長する１つ又は複数のヌクレオチドが、９０％、８０％、６０％より低い、又は４０％より低いヌクレオチド配列同一性を有する、先行する実施形態のいずれか１つに記載の方法。

実施形態１０．方法が、
ｆ）第１のオリゴヌクレオチドを、標的核酸断片の第１の鎖の標識された３’末端にアニールするステップであり、任意選択で鋳型ＲＮＡ及びｃｒＲＮＡが、第１のオリゴヌクレオチドをアニールする前に分解される、ステップ
をさらに含む、先行する実施形態のいずれか１つに記載の方法。

実施形態１１．第１の鎖の標識された３’末端にアニールするオリゴヌクレオチドが、通常のハイブリダイズ条件下で第２の鎖の、任意選択で標識された３’末端にアニールすることが可能でない、実施形態１０に記載の方法。

実施形態１２．ステップｆ）が、第２のオリゴヌクレオチドを、第２の鎖の標識された３’末端にアニールすることをさらに含み、好ましくは第２の鎖の標識された３’末端にアニールするオリゴヌクレオチドが、通常のハイブリダイズ条件下で第１の鎖の、任意選択で標識された３’末端にアニールすることが可能でない、実施形態１０又は１１のいずれか１つに記載の方法。

実施形態１３．方法が、
ｇ）（１つ又は複数の）アニールされたオリゴヌクレオチドをライゲート及び／又は充填するステップ
をさらに含む、実施形態１０～１２のいずれか１つに記載の方法。

実施形態１４．第１及び第２のオリゴヌクレオチドのうちの少なくとも１つが、ＵＭＩ、バーコード及びプライマー結合部位のうちの少なくとも１つを含む、実施形態１０～１３のいずれか１つに記載の方法。

実施形態１５．１つ又は複数の標的核酸断片をシークエンシングする、好ましくはディープシークエンシングする方法であって、
（ｉ）実施形態１～１４のいずれか１つに定義される１つ又は複数の標識された標的核酸断片を得るステップ；
（ｉｉ）任意選択で１つ又は複数の標識された標的核酸断片を増幅する、好ましくは選択的に増幅するステップ；及び
（ｉｉｉ）任意選択で増幅された１つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップ
を含む、方法。

実施形態１６．１つ又は複数の標的核酸断片が１つ又は複数の核酸試料から得られ、任意選択で１つ又は複数の標的核酸断片がステップ（ｉ）の後及び／又はステップ（ｉｉ）の後にプールされる、実施形態１５に記載の方法。

実施形態１７．実施形態１～１４のいずれか１つに記載の方法により得ることが可能である標識された標的核酸断片又は実施形態１５若しくは１６に記載の方法により得ることが可能であるディープシークエンシングライブラリー。

実施形態１８．実施形態１～１６のいずれか１つに記載の方法における使用のための、部位特異的ヌクレアーゼ並びに逆転写酵素及び鋳型ＲＮＡ分子のうちの少なくとも１つをコードする構築物。

実施形態１９．ｃｒＲＮＡ及び任意選択でｔｒａｃｒＲＮＡをさらにコードする、実施形態１８に記載の構築物。

実施形態２０．実施形態１～１６のいずれか１つに記載の方法における使用のための、少なくとも第１、第２及び第３の構成要素を含むパーツのキットであって、
第１の構成要素が、部位特異的ヌクレアーゼ、又はそれをコードする構築物、及び任意選択でｃｒＲＮＡ、ｔｒａｃｒＲＮＡ及びｓｇＲＮＡのうちの少なくとも１つ、又はそれをコードする構築物であり；
第２の構成要素が、逆転写酵素、又はそれをコードする構築物であり；
第３の構成要素が、鋳型ＲＮＡ分子、又はそれをコードする構築物である、キット。
実施形態２１．キットが、第４、第５、第６及び第７の構成要素のうちの少なくとも１つをさらに含み、
第４の構成要素が、実施形態１０～１４のいずれか１つに定義される１つ又は複数のオリゴヌクレオチドであり、１つ又は複数のオリゴヌクレオチドが、ＵＭＩ、バーコード及びプライマー結合部位のうちの少なくとも１つを任意選択で含み；
第５の構成要素が、実施形態１５に定義される標識された標的核酸断片の増幅のための１つ又は複数のプライマーであり；
第６の構成要素が、標識された標的核酸断片の非選択的な増幅のための１つ又は複数のプライマーであり；
第７の構成要素が、標的核酸断片のサブセットの選択的な増幅のための１つ又は複数のプライマーである、実施形態２０に記載のパーツのキット。

本発明の一実施形態の概略図。ステップ１）標的化された位置、ステップ２）Ｃａｓ９結合、ステップ３）Ｃａｓ９ＤＮＡ切断、ステップ４）Ｃａｓ９結合及びアダプターＲＮＡ（本明細書において鋳型ＲＮＡとしてさらに指し示される）アニーリング、ステップ５）アニールしたＲＮＡの逆転写、並びにステップ６）ＲＮＡ分解（及びそのためＣａｓ９及びＲＴ放出）。ＤＮＡアダプターのアニーリングは、ステップ７Ａ）ＤＮＡアダプターアニーリング並びにステップ７Ｂ）ＤＮＡアダプター充填及びライゲーションを含んでもよい。代替的に、ＤＮＡアダプターのアニーリングは、ステップ７）ＤＮＡアダプターアニーリング及びライゲーションを含んでもよい。本発明の一実施形態の概略図。ステップ１）標的化された位置、ステップ２）Ｃａｓ９結合、ステップ３）Ｃａｓ９ＤＮＡ切断、ステップ４）Ｃａｓ９結合及びアダプターＲＮＡ（本明細書において鋳型ＲＮＡとしてさらに指し示される）アニーリング、ステップ５）アニールしたＲＮＡの逆転写、並びにステップ６）ＲＮＡ分解（及びそのためＣａｓ９及びＲＴ放出）。ＤＮＡアダプターのアニーリングは、ステップ７Ａ）ＤＮＡアダプターアニーリング並びにステップ７Ｂ）ＤＮＡアダプター充填及びライゲーションを含んでもよい。代替的に、ＤＮＡアダプターのアニーリングは、ステップ７）ＤＮＡアダプターアニーリング及びライゲーションを含んでもよい。本発明の一実施形態の概略図。ステップ１）標的化された位置、ステップ２）Ｃａｓ９結合、ステップ３）Ｃａｓ９ＤＮＡ切断、ステップ４）Ｃａｓ９結合及びアダプターＲＮＡ（本明細書において鋳型ＲＮＡとしてさらに指し示される）アニーリング、ステップ５）アニールしたＲＮＡの逆転写、並びにステップ６）ＲＮＡ分解（及びそのためＣａｓ９及びＲＴ放出）。ＤＮＡアダプターのアニーリングは、ステップ７Ａ）ＤＮＡアダプターアニーリング並びにステップ７Ｂ）ＤＮＡアダプター充填及びライゲーションを含んでもよい。代替的に、ＤＮＡアダプターのアニーリングは、ステップ７）ＤＮＡアダプターアニーリング及びライゲーションを含んでもよい。Ａ）ラムダゲノムの５０４３～６０７４位の配列（配列番号８）、Ｂ）上：Ｃａｓ９での制限、標識化及びオリゴヌクレオチドのアニーリング後に得られた断片、（配列番号：９～２４）。下：増幅後に得られた断片の長さ、異なる断片のサイズ及びプライマー配列が指し示されている。Ａ）ラムダゲノムの５０４３～６０７４位の配列（配列番号８）、Ｂ）上：Ｃａｓ９での制限、標識化及びオリゴヌクレオチドのアニーリング後に得られた断片、（配列番号：９～２４）。下：増幅後に得られた断片の長さ、異なる断片のサイズ及びプライマー配列が指し示されている。指し示される断片の増幅後の予想された（Ａ）及び得られた（Ｂ）結果。指し示される断片の増幅後の予想された（Ａ）及び得られた（Ｂ）結果。

［定義］
本発明の方法、組成物、使用及び他の態様に関する様々な用語が本明細書及び特許請求の範囲の全体を通じて使用される。そのような用語は、他に指し示されなければ、本発明が関する技術分野におけるそれらの普通の意味を与えられるべきである。他の特に定義される用語は、本明細書において提供される定義と合致する方式において解釈されるべきである。本明細書に記載されるものと類似又は同等の任意の方法及び材料が本発明の試験のための実施において使用され得るが、好ましい材料及び方法が本明細書に記載される。

本発明の方法において使用される従来技術を実行する方法は当業者に明らかであろう。分子生物学、生化学、計算化学、細胞培養、組換えＤＮＡ、バイオインフォマティクス、遺伝学、シークエンシング及び関連分野における従来技術の実施は当業者に周知であり、例えば、以下の参考文献：Ｓａｍｂｒｏｏｋら、ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ．ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ、２ｎｄＥｄｉｔｉｏｎ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ、Ｎ．Ｙ．、１９８９；Ａｕｓｕｂｅｌら、ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ、ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ、ＮｅｗＹｏｒｋ、１９８７及び定期的な更新；並びにシリーズＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌｏｇｙ、ＡｃａｄｅｍｉｃＰｒｅｓｓ、ＳａｎＤｉｅｇｏにおいて議論されている。

「ａ」、「ａｎ」、及び「ｔｈｅ」：これらの単数形の用語は、内容がそうでないことを明確に規定しなければ、複数の指示対象を含む。そのため、例えば、「細胞」（ａｃｅｌｌ）への言及は、２つ又はより多くの細胞の組合せを含む、などである。

本明細書において使用される場合、「約」という用語は、小さい変動を記載及び説明するために使用される。例えば、該用語は、±１０％未満又は±１０％、例えば±５％未満若しくは±５％、±４％未満若しくは±４％、±３％未満若しくは±３％、±２％未満若しくは±２％、±１％未満若しくは±１％、±０．５％未満若しくは±０．５％、±０．１％未満若しくは±０．１％、又は±０．０５％未満若しくは±０．０５％を指すことができる。追加的に、量、比、及び他の数値は、範囲の形式において本明細書において提示される場合がある。そのような範囲の形式は、簡便性及び簡潔性のために使用されていることが理解されるべきであり、範囲の限度として明示的に指定される数値を柔軟に含むが、各々の数値及び部分的範囲が明示的に指定されているかのようにその範囲内に包含されるすべての個々の数値又は部分的範囲もまた含むことが理解されるべきである。例えば、約１～約２００の範囲内の比は、約１及び約２００の明示的に記載される限度を含むが、個々の比、例えば約２、約３、及び約４、並びに部分的範囲、例えば約１０～約５０、及び約２０～約１００なども含むことが理解されるべきである。

「及び／又は」：「及び／又は」という用語は、記載されるケースの１つ又は複数が、単独で、又は、記載されるケースのすべてを用いるまで、記載されるケースの少なくとも１つと組み合わせて、起こり得る状況を指す。

本明細書において使用される場合、「アダプター」という用語は、他の核酸の末端に、例えば、二本鎖ＤＮＡ分子の単一の鎖又は両方の鎖に、取り付けられ得る、好ましくはライゲートされ得る、一本鎖、二本鎖、部分二本鎖、Ｙ形状又はヘアピン核酸分子であって、好ましくは限られた長さ、例えば、約１０～約２００、又は約１０～約１００塩基、又は約１０～約８０、又は約１０～約５０、又は約１０～約３０塩基対の長さを有し、好ましくは化学的に合成されるものである。アダプターの二本鎖構造は、互いと塩基対合した２つの別個のオリゴヌクレオチド分子により、又は単一のオリゴヌクレオチド鎖のヘアピン構造により形成されてもよい。明らかなように、アダプターの取付け可能な末端は、制限酵素及び／若しくはプログラム可能なヌクレアーゼによる切断により作られるオーバーハングと適合性であるように、及び任意選択で該オーバーハングにライゲートできるように設計されてもよいか、非鋳型伸長反応（例えば本明細書において定義されている方法を使用する）の付加後に作り出されるオーバーハングと適合性であるように設計されてもよいか、又は平滑末端を有してもよい。任意選択で、全体的に又は部分的に二本鎖のアダプターはオーバーハングを含み、好ましくはオーバーハングは３’オーバーハングである。好ましくは、末端ヌクレオチドの前にホスホロチオエート結合がある。任意選択で、オーバーハングを含む鎖に対して反対の鎖は、５’リン酸化されている。

核酸又は核酸反応に関して使用される「増幅」は、特定の核酸、例えば標的核酸断片又は標的核酸断片中に含まれる目的の配列のコピーを作るｉｎｖｉｔｒｏ方法を指す。核酸を増幅する多数の方法が当技術分野において公知であり、増幅反応は、ポリメラーゼ連鎖反応、リガーゼ鎖反応、鎖置換増幅反応、ローリングサークル増幅反応、転写媒介性増幅方法、例えばＮＡＳＢＡ（例えば、米国特許第５，４０９，８１８号）、ループ媒介性増幅方法（例えば、米国特許第６，４１０，２７８号に記載されている、例えば、ループ形成配列を使用する「ＬＡＭＰ」増幅）及び等温増幅反応を含む。増幅される核酸は、修飾されたＤＮＡ及び／又はＲＮＡを含む、ＤＮＡ又はＲＮＡ又はＤＮＡ及びＲＮＡの混合物を含むか、それからなるか、又はそれに由来するＤＮＡであり得る。１つ若しくは複数の核酸分子の増幅の結果としてもたらされる生成物（すなわち、「増幅生成物」）は、出発核酸がＤＮＡ、ＲＮＡ又は両方のいずれであれ、ＤＮＡ若しくはＲＮＡ、若しくはＤＮＡ及びＲＮＡヌクレオシド若しくはヌクレオチドの両方の混合物のいずれかであり得るか、又は該生成物は、修飾されたＤＮＡ若しくはＲＮＡヌクレオシド若しくはヌクレオチドを含むことができる。

「コピー」は、特定の配列に対して完全な配列相補性又は完全な配列同一性を有する配列であり得るが、これに限定されない。代替的に、コピーは、この特定の配列に対して完璧な配列相補性又は同一性を必ずしも有さず、例えばある特定の程度の配列バリエーションが許容される。例えば、コピーは、ヌクレオチドアナログ、例えばデオキシイノシン若しくはデオキシウリジン、意図的な配列変更（例えば特定の配列に対してハイブリダイズされ得るが相補的でない配列を含むプライマーを通じて導入される配列変更）、及び／又は増幅の間に起こる配列エラーを含むことができる。

「相補性」という用語は、完全に相補的な鎖（例えば第２の、又は逆転した、鎖）に対する配列の配列同一性として本明細書において定義される。例えば、１００％相補的な（又は完全に相補的な）配列は、相補鎖と１００％の配列同一性を有するとして本明細書において理解され、例えば８０％相補的な配列は、（完全に）相補的な鎖に対して８０％の配列同一性を有するとして本明細書において理解される。

「含む」：この用語は、包含的及びオープンエンドであり、排他的でないとして解釈される。特に、該用語及びそのバリエーションは、指定される特徴、ステップ又は構成要素が含まれることを意味する。これらの用語は、他の特徴、ステップ又は構成要素の存在を除外すると解釈されるべきではない。

「構築物」又は「核酸構築物」又は「ベクター」：これは、組換えＤＮＡ技術の使用の結果としてもたらされる、人間により作られた核酸分子であって、多くの場合に構築物上に含まれるＤＮＡ領域の宿主細胞中での発現の目的と共に、外因性ＤＮＡを宿主細胞中に送達するために使用され得るものを指す。構築物のベクター骨格は、例えば、（キメラ）遺伝子が組み込まれるか、又は、好適な転写調節配列（例えば（誘導性）プロモーター）が既に存在する場合に、所望されるヌクレオチド配列（例えば、コーディング配列）のみが転写調節配列の下流に組み込まれるプラスミドであってもよい。ベクターは、分子クローニングにおけるそれらの使用を促すためのさらなる遺伝子エレメント、例えば、選択マーカー及びマルチプルクローニングサイトなどを含んでもよい。

「二本鎖」及び「二重鎖」という用語は、本明細書において使用される場合、塩基対合した、すなわち、ハイブリダイズして一緒になった、２つの相補的なポリヌクレオチドを記載する。相補的なヌクレオチド鎖はまた、逆相補体として当技術分野において公知である。

「有効量」という用語は、本明細書において使用される場合、所望される生物学的効果を誘発するために十分な生物活性剤の量を指す。例えば、一部の実施形態において、部位特異的ヌクレアーゼの有効量は、二本鎖核酸分子の切断を誘導するために十分なヌクレアーゼの量を指すことができる。当業者により理解されるように、剤の有効量は、様々な要因、例えば使用されている剤、剤が使用される条件、及び所望される生物学的効果、例えば検出されるべき切断の程度に依存して変動し得る。

「例示的」：この用語は、「例、事例、又は実例として役立つ」ことを意味し、本明細書に開示される他の構成を除外するとして解釈されるべきではない。

「発現」：これは、適切な調節領域、特にはプロモーターに作動可能に連結された、ＤＮＡ領域がＲＮＡに転写され、該ＲＮＡが次いでタンパク質又はペプチドに翻訳され得るプロセスを指す。

「ガイド配列」は、ＲＮＡ又はＤＮＡにガイドされるエンドヌクレアーゼをＲＮＡ又はＤＮＡ分子中の特定の部位に方向付ける配列として本明細書において理解されるべきである。ｇＲＮＡ－ＣＡＳ複合体の文脈において、「ガイド配列」は、二重鎖ＤＮＡ中の特定の部位にｇＲＮＡ－ＣＡＳ複合体を標的化するために要求されるｓｇＲＮＡ又はｃｒＲＮＡの区画として本明細書においてさらに理解されるべきである。

「ｇＲＮＡ－ＣＡＳ複合体」は、ガイドＲＮＡに複合体化又はハイブリダイズされた、ＣＲＩＳＰＲ－エンドヌクレアーゼ又はＣＲＩＳＰＲ－ヌクレアーゼとも命名される、ＣＡＳタンパク質として本明細書において理解されるべきであり、ガイドＲＮＡは、ｃｒＲＮＡ及び／若しくはｔｒａｃｒＲＮＡ、又はｓｇＲＮＡであってもよい。

「同一性」及び「類似性」は、公知の方法により容易に算出され得る。「配列同一性」及び「配列類似性」は、２つの配列の長さに依存して、大域又は局所アライメントアルゴリズムを使用する２つのペプチド又は２つのヌクレオチド配列のアライメントにより決定され得る。類似した長さの配列は、好ましくは、最適には全長にかけて配列をアライメントする大域アライメントアルゴリズム（例えばＮｅｅｄｌｅｍａｎＷｕｎｓｃｈ）を使用してアライメントされ、実質的に異なる長さの配列は、好ましくは、局所アライメントアルゴリズム（例えばＳｍｉｔｈＷａｔｅｒｍａｎ）を使用してアライメントされる。配列は次に、それらが（例えばプログラムＧＡＰ又はＢＥＳＴＦＩＴによりデフォルトのパラメーターを使用して最適にアライメントされた場合に）少なくともある特定の最小パーセンテージの配列同一性（以下において定義される）を共有する場合に、「実質的に同一の」又は「本質的に類似の」として言及され得る。配列同一性のパーセントは、好ましくは、シークエンス・アナリシス・ソフトウェア・パッケージ（ＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓＳｏｆｔｗａｒｅＰａｃｋａｇｅ）（商標）（Ｖｅｒｓｉｏｎ１０；ＧｅｎｅｔｉｃｓＣｏｍｐｕｔｅｒＧｒｏｕｐ、Ｍａｄｉｓｏｎ、Ｗｉｓ．）の「ＢＥＳＴＦＩＴ」又は「ＧＡＰ」プログラムを使用して決定される。ＧＡＰは、Ｎｅｅｄｌｅｍａｎ及びＷｕｎｓｃｈの大域アライメントアルゴリズム（Ｎｅｅｄｌｅｍａｎ及びＷｕｎｓｃｈ、ＪｏｕｒｎａｌｏｆＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ４８：４４３～４５３頁、１９７０）を使用して、それらの全体の長さ（全長）にかけて２つの配列をアライメントして、マッチの数を最大化し、及びギャップの数を最小化する。大域アライメントは、好適には、２つの配列が類似した長さを有する場合に配列同一性を決定するために使用される。一般に、ＧＡＰのデフォルトのパラメーターが使用され、これはギャップ生成ペナルティ＝５０（ヌクレオチド）／８（タンパク質）及びギャップ伸長ペナルティ＝３（ヌクレオチド）／２（タンパク質）を用いる。ヌクレオチドのために使用されるデフォルトのスコアリングマトリックスはｎｗｓｇａｐｄｎａであり、タンパク質のために使用されるデフォルトのスコアリングマトリックスはＢｌｏｓｕｍ６２である（Ｈｅｎｉｋｏｆｆ及びＨｅｎｉｋｏｆｆ、１９９２、ＰＮＡＳ８９、９１５～９１９頁）。配列アライメント及び配列同一性パーセンテージのスコアは、コンピュータプログラム、例えばＡｃｃｅｌｒｙｓＩｎｃ．、９６８５ＳｃｒａｎｔｏｎＲｏａｄ、ＳａｎＤｉｅｇｏ、ＣＡ９２１２１－３７５２ＵＳＡから入手可能なＧＣＧＷｉｓｃｏｎｓｉｎＰａｃｋａｇｅ、Ｖｅｒｓｉｏｎ１０．３を使用して、又はオープンソースソフトウェア、例えばＥｍｂｏｓｓＷＩＮｖｅｒｓｉｏｎ２．１０．０におけるプログラム「ｎｅｅｄｌｅ」（大域的なＮｅｅｄｌｅｍａｎＷｕｎｓｃｈアルゴリズムを使用する）若しくは「ｗａｔｅｒ」（局所的なＳｍｉｔｈＷａｔｅｒｍａｎアルゴリズムを使用する）を使用して、上記のＧＡＰについてと同じパラメーターを使用して、又はデフォルトの設定（「ｎｅｅｄｌｅ」及び「ｗａｔｅｒ」の両方について、並びにタンパク質及びＤＮＡの両方のアライメントについて、デフォルトのギャップオープニングペナルティは１０．０、デフォルトのギャップ伸長ペナルティは０．５であり；デフォルトのスコアリングマトリックスはタンパク質についてはＢｌｏｓｕｍ６２、ＤＮＡについてはＤＮＡＦｕｌｌである）を使用して決定されてもよい。「ＢＥＳＴＦＩＴ」は、Ｓｍｉｔｈ及びＷａｔｅｒｍａｎの局所相同性アルゴリズム（Ｓｍｉｔｈ及びＷａｔｅｒｍａｎ、ＡｄｖａｎｃｅｓｉｎＡｐｐｌｉｅｄＭａｔｈｅｍａｔｉｃｓ、２：４８２～４８９頁、１９８１、Ｓｍｉｔｈら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ１１：２２０５～２２２０頁、１９８３）を使用して２つの配列の間の類似性の最良のセグメントの最適なアライメントを行い、ギャップを挿入してマッチの数を最大化する。配列が実質的に異なる全体的長さを有する場合、局所アライメント、例えばＳｍｉｔｈＷａｔｅｒｍａｎアルゴリズムを使用するものが好ましい。

本明細書において使用される場合、「配列同一性」は、２つの最適にアライメントされたポリヌクレオチド又はペプチド配列が、構成要素、例えば、ヌクレオチド又はアミノ酸のアライメントのウィンドウの全体を通じて不変である程度を指す。試験配列及び参照配列のアライメントされたセグメントについての「同一性比率」は、２つのアライメントされた配列により共有される同一の構成要素の数を、参照配列セグメント中の構成要素の総数、すなわち、参照配列全体又は参照配列のより小さい定義された部分で割ったものである。「同一性パーセント」は同一性比率に１００を掛けたものである。

配列同一性を決定する有用な方法はまた、ＧｕｉｄｅｔｏＨｕｇｅＣｏｍｐｕｔｅｒｓ、ＭａｒｔｉｎＪ．Ｂｉｓｈｏｐ編、ＡｃａｄｅｍｉｃＰｒｅｓｓ、ＳａｎＤｉｅｇｏ、１９９４、並びにＣａｒｉｌｌｏ，Ｈ．及びＬｉｐｔｏｎ，Ｄ．、ＡｐｐｌｉｅｄＭａｔｈ（１９８８）４８：１０７３において開示されている。より詳細には、配列同一性を決定するための好ましいコンピュータプログラムは、ＮａｔｉｏｎａｌＣｅｎｔｅｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ（ＮＣＢＩ）、ｔｈｅＮａｔｉｏｎａｌＬｉｂｒａｒｙｏｆＭｅｄｉｃｉｎｅ、ＮａｔｉｏｎａｌＩｎｓｔｉｔｕｔｅｏｆＨｅａｌｔｈ、Ｂｅｔｈｅｓｄａ、Ｍｄ．２０８９４から公開されているＢａｓｉｃＬｏｃａｌＡｌｉｇｎｍｅｎｔＳｅａｒｃｈＴｏｏｌ（ＢＬＡＳＴ）プログラムを含む；ＢＬＡＳＴＭａｎｕａｌ、Ａｌｔｓｃｈｕｌら、ＮＣＢＩ、ＮＬＭ、ＮＩＨ；Ａｌｔｓｃｈｕｌら、Ｊ．Ｍｏｌ．Ｂｉｏｌ．２１５：４０３～４１０頁（１９９０）を参照；バージョン２．０又はより高いバージョンのＢＬＡＳＴプログラムは、アライメント中へのギャップ（欠失及び挿入）の導入を許容し；ペプチド配列については、ＢＬＡＳＴＸが配列同一性を決定するために使用可能であり；ポリヌクレオチド配列については、ＢＬＡＳＴＮが配列同一性を決定するために使用可能である。

代替的に、類似性又は同一性パーセンテージは、アルゴリズム、例えばＦＡＳＴＡ、ＢＬＡＳＴなどを使用して、公的なデータベースに対して検索を行うことにより決定されてもよい。そのため、本発明の核酸及びタンパク質配列は、公的なデータベースに対して検索を行って、例えば、他のファミリーメンバー又は関連配列を同定するための、「クエリ配列」としてさらに使用され得る。そのような検索は、Ａｌｔｓｃｈｕｌら、（１９９０）Ｊ．Ｍｏｌ．Ｂｉｏｌ．２１５：４０３～１０頁のＢＬＡＳＴｎ及びＢＬＡＳＴｘプログラム（バージョン２．０）を使用して行われ得る。ＢＬＡＳＴヌクレオチド検索は、本発明の核酸分子に相同的なヌクレオチド配列を得るために、ＢＬＡＳＴｎプログラム、期待閾値＝０．０５、ワードサイズ＝２８を用いて行われ得る。ＢＬＡＳＴタンパク質検索は、本発明のタンパク質分子に相同的なアミノ酸配列を得るために、ＢＬＡＳＴｘプログラム、期待閾値＝０．０５、ワードサイズ＝６を用いて行われ得る。比較目的のためにギャップ付きアライメントを得るために、Ａｌｔｓｃｈｕｌら、（１９９７）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２５（１７）：３３８９～３４０２頁に記載されるようにＧａｐｐｅｄＢＬＡＳＴが利用され得る。ＢＬＡＳＴ及びＧａｐｐｅｄＢＬＡＳＴプログラムを利用する場合、それぞれのプログラム（例えば、ＢＬＡＳＴｘ及びＢＬＡＳＴｎ）のデフォルトのパラメーターが使用され得る。ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／におけるｔｈｅＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎのホームページを参照。

「ナノポア選択的シークエンシング」は、ナノポアシークエンシング技術、例えばＯｘｆｏｒｄＮａｎｏｐｏｒｅ又はＯｎｔｅｒａからのものを使用し、及び流れるナノポア電流シグナル又は塩基コールを参照配列に対してマッピングして非標的配列を拒絶する、リアルタイムでの単一の分子の選択的なシークエンシングとして本明細書において理解されるべきである。生成されているデータに応答して、シークエンサーは、核酸のシークエンシングを遂行するように操作されるか、又は中止して、非標的分子を排出するために十分なある特定の短い時間的期間にわたり特有のポアにわたる電圧の極性を逆転させることによりシークエンシングポアから核酸を除去し、ナノポアを新たなシークエンシングリードのために利用可能とすることを決定する。Ｎａｎｏｐｏｒｅ選択的シークエンシング方法の例は、Ｐａｙｎｅら、２０２０（Ｎａｎｏｐｏｒｅａｄａｐｔｉｖｅｓｅｑｕｅｎｃｉｎｇｆｏｒｍｉｘｅｄｓａｍｐｌｅｓ，ｗｈｏｌｅｅｘｏｍｅｃａｐｔｕｒｅａｎｄｔａｒｇｅｔｅｄｐａｎｅｌｓ、Ｆｅｂｒｕａｒｙ３、２０２０；ＤＯＩ：１０．１１０１／２０２０．０２．０３．９２６９５６）及びＫｏｖａｋａら、２０２０（Ｔａｒｇｅｔｅｄｎａｎｏｐｏｒｅｓｅｑｕｅｎｃｉｎｇｂｙｒｅａｌ－ｔｉｍｅｍａｐｐｉｎｇｏｆｒａｗｅｌｅｃｔｒｉｃａｌｓｉｇｎａｌｗｉｔｈＵＮＣＡＬＬＥＤ、Ｆｅｂｒｕａｒｙ３、２０２０；ｄｏｉ：１０．１１０１／２０２０．０２．０３．９３１９２３）（これらは参照により本明細書に組み込まれる）において記載されている。

「ヌクレオチド」という用語は、グアニン、シトシン、アデニン及びチミン（それぞれＧ、Ｃ、Ａ及びＴ）を含む、天然に存在するヌクレオチドを含むが、これらに限定されない。「ヌクレオチド」という用語は、公知のプリン及びピリミジン塩基だけでなく、修飾されている他の複素環式塩基も含有する部分を含むことがさらに意図される。そのような修飾は、メチル化されたプリン又はピリミジン、アシル化されたプリン又はピリミジン、アルキル化されたリボース又は他の複素環を含む。追加的に、「ヌクレオチド」という用語は、ハプテン又は蛍光標識を含有する部分を含み、従来のリボース及びデオキシリボース糖だけでなく、他の糖も含有することができる。修飾ヌクレオシド又はヌクレオチドはまた、糖部分上の修飾を含み、例えば、ヒドロキシル基の１つ若しくは複数はハロゲン原子若しくは脂肪族基で置き換えられているか、又はエーテル若しくはアミンなどとして官能化されている。

「核酸」、「ポリヌクレオチド」及び「核酸分子」という用語は、本明細書において交換可能に使用され、ヌクレオチド、例えば、デオキシリボヌクレオチド又はリボヌクレオチドから構成される任意の長さ、例えば、約２塩基より長い、約１０塩基より長い、約１００塩基より長い、約５００塩基より長い、１０００塩基より長い、最大約１０，０００又はより多くの塩基のポリマーを記載し、酵素的に又は合成的に生成されてもよい（例えば、米国特許第５，９４８，９０２号及び該文献において参照される参考文献に記載されているＰＮＡ）。核酸は、２つの天然に存在する核酸の方式に類似した配列特異的な方式において天然に存在する核酸とハイブリダイズしてもよく、例えば、ワトソン－クリック塩基対合相互作用に参加することができる。追加的に、核酸及びポリヌクレオチドは、細胞、組織及び／又は体液から単離（及び任意選択でその後に断片化）されてもよい。核酸は、例えば、ゲノムＤＮＡ（ｇＤＮＡ）、ミトコンドリア、セルフリーＤＮＡ（ｃｆＤＮＡ）、ライブラリーからのＤＮＡ及び／又はライブラリーからのＲＮＡであり得る。

「核酸試料」又は「二本鎖核酸分子を含む試料」という用語は、本明細書において使用される場合、核酸分子を含有する任意の試料を表し、試料は、１つ又は複数の目的のヌクレオチド配列を含有する、必ずしもそうではないが、典型的には液体形態の、材料又は材料の混合物に関する。本発明の方法において出発材料として使用される核酸試料は、任意の供給源からのもの、例えば、全ゲノム、染色体のコレクション、単一の染色体、１つ若しくは複数の染色体からの１つ若しくは複数の領域又は転写された遺伝子であり得、直接的に生物学的な供給源から又は実験室供給源、例えば、核酸ライブラリーから精製されてもよい。核酸試料は、ヒト若しくは他の種（例えば、植物、細菌、真菌、藻類、古細菌など）であり得る同じ個体から、又は同じ種の異なる個体、若しくは異なる種の異なる個体から得られ得る。例えば、核酸試料は、細胞、組織、生検、体液、ゲノムＤＮＡライブラリー、ｃＤＮＡライブラリー及び／又はＲＮＡライブラリーからのものであってもよい。

「目的の配列」という用語は、好ましくは細胞内に存在する任意の遺伝子配列、例えば遺伝子、遺伝子の部分、又は遺伝子内の若しくはそれに隣接する非コーディング配列などを含むが、これらに限定されない。目的の標的配列は、染色体、エピソーム、オルガネラゲノム、例えばミトコンドリア若しくは葉緑体ゲノム又は遺伝材料の主体部とは独立的に存在することができる遺伝材料、例えば感染性ウイルスゲノム、プラスミド、エピソーム、トランスポゾンなどに存在してもよい。目的の配列は、遺伝子のコーディング配列内、転写される非コーディング配列内、例えば、リーダー配列、トレイラー配列又はイントロン内などにあってもよい。目的の前記配列は、二本又は一本鎖核酸分子中に存在してもよい。核酸配列は好ましくは二本鎖核酸分子中に存在する。目的の配列は、多型、例えばＳＮＰを有するか、又は有することが疑われる配列であり得るが、これに限定されない。一部の実施形態において、目的の配列は、アレルバリアント、又はその逆相補体である。目的の配列は、試料核酸内の任意の配列、例えば、遺伝子、遺伝子複合体、座位、偽遺伝子、調節領域、高度反復領域、多型領域、又はこれらの部分であってもよい。目的の配列はまた、表現型又は疾患を指し示す遺伝子又はエピジェネティックバリエーションを含む領域であってもよい。好ましくは、目的の配列は、二重鎖ＤＮＡの一本鎖ＤＮＡ鎖のヌクレオチドの小さい又はより長い連続するストレッチ（すなわちポリヌクレオチド）であり、前記二重鎖ＤＮＡは、前記二重鎖ＤＮＡの相補鎖中の標的配列に相補的な配列をさらに含む。目的の配列及びその相補鎖からなる二重鎖ＤＮＡもまた、本明細書において標的核酸断片と命名される。

「標的核酸断片」は、好ましくはさらなる分析又は行為、以下に限定されないが例えばコピー生成、増幅、シークエンシング及び／又は核酸監視のための他の手順の目的のための、目的の配列を含むか又はからなる、好ましくは二本鎖の、核酸分子の小さい若しくはより長いストレッチ、又は選択された部分であってもよい。切断前に、標的核酸断片は、好ましくは、より大きい核酸分子内、例えば分析されるべき試料中に存在するより大きい核酸分子内に含まれる。標的核酸断片は好ましくは第１の鎖及び相補的な第２の鎖を含む。一部の態様において、１つ又は複数の目的の配列を含むか又はからなる標的核酸断片のセットは、富化されるために選択される。任意選択で、そのようなセットは、構造的に又は機能的に関連する標的核酸断片からなる。標的核酸断片、又は断片は、ＤＮＡ、ＲＮＡ、ＢＮＡ（ブリッジド核酸）、ＬＮＡ（ロックド核酸）、ＰＮＡ（ペプチド核酸）、モルホリノ核酸、グリコール核酸、トレオース核酸、エピジェネティックに修飾されたヌクレオチド、例えばメチル化ＤＮＡ、並びにこれらの模倣物及び組合せを含むが、これらに限定されない、天然及び非天然の両方の、人工的な、又は非標準的なヌクレオチドを含むことができる。好ましくは、標的核酸断片はゲノムＤＮＡ（ｇＤＮＡ）及び／又はセルフリーＤＮＡ（ｃｆＤＮＡ）である。

「オリゴヌクレオチド」という用語は、本明細書において使用される場合、好ましくは約２～２００ヌクレオチド、又は最大５００ヌクレオチドの長さの、ヌクレオチドの一本鎖多量体を表す。オリゴヌクレオチドは合成であってもよいか、又は酵素的に作られてもよく、一部の実施形態において、約１０～５０ヌクレオチドの長さである。オリゴヌクレオチドは、リボヌクレオチド単量体（すなわち、オリゴリボヌクレオチドであってもよい）又はデオキシリボヌクレオチド単量体を含有してもよい。オリゴヌクレオチドは、例えば、約１０～２０、２０～３０、３０～４０、４０～５０、５０～６０、６０～７０、７０～８０、８０～１００、１００～１５０、１５０～２００、又は約２００～２５０ヌクレオチドの長さであってもよい。

「植物」：これは、植物細胞、植物プロトプラスト、植物がそれから再生され得る植物細胞組織培養物、植物カルス、植物クランプ、並びに植物又は植物の部分、例えば胚、花粉、胚珠、種子、葉、花、枝、果実、仁、穂、穂軸、皮、柄、根、根端、葯、及び粒などにあるインタクトな植物細胞を含む。植物の非限定的な例は、作物及び栽培植物、例えばオオムギ、キャベツ、キャノーラ、キャッサバ、カリフラワー、チコリ、ワタ、キュウリ、ナス、ブドウ、トウガラシ、レタス、メイズ、メロン、アブラナ、ジャガイモ、カボチャ、コメ、ライ、ソルガム、カボチャ属植物（ｓｑｕａｓｈ）、サトウキビ、テンサイ、ヒマワリ、アマトウガラシ、トマト、スイカ、コムギ、及びズッキーニを含む。

「プロトスペーサー配列」は、ガイドＲＮＡ内のガイド配列、より詳細にはｃｒＲＮＡ、又は、ｓｇＲＮＡの場合、ガイドＲＮＡのｃｒＲＮＡ部分により認識されるか、又はそれにハイブリダイズし得る、標的核酸断片の中、その位置、又はその近くに位置する配列である。

「エンドヌクレアーゼ」は、その標的又は認識部位への結合で、二重鎖ＤＮＡの少なくとも１つの鎖又はＲＮＡ分子の鎖を加水分解する酵素である。エンドヌクレアーゼは、部位特異的エンドヌクレアーゼとして本明細書において理解されるべきであり、「エンドヌクレアーゼ」及び「ヌクレアーゼ」という用語は本明細書において交換可能に使用される。制限エンドヌクレアーゼは、二重鎖の両方の鎖を同時に加水分解してＤＮＡ中に二本鎖切断を導入するエンドヌクレアーゼとして本明細書において理解されるべきである。「ニック形成」エンドヌクレアーゼは、二重鎖の１つの鎖のみを加水分解して、切断ではなく「ニック形成」（ｎｉｃｋｅｄ）されたＤＮＡ分子を生成するエンドヌクレアーゼである。

「エキソヌクレアーゼ」は、ポリヌクレオチドの末端（エキソ）から１つ又は複数のヌクレオチドを切断する任意の酵素として本明細書において定義される。

「複雑性を低減させる」又は「複雑性低減」は、複雑な核酸試料、例えばゲノムＤＮＡに由来する試料、液体生検に由来するｃｆＤＮＡ、及び単離されたＲＮＡ試料などの低減として本明細書において理解されるべきである。複雑性の低減は、複雑な出発材料内に含まれる１つ若しくは複数の特定の標的配列及び／若しくは標的核酸断片の富化、並びに／又は、非標的配列又は断片の量が、出発材料、すなわち複雑性低減の前の材料中の非標的配列又は断片の量と比較して少なくとも２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％又は９９％低減されながらの、複雑な出発材料内に含まれる１つ若しくは複数の特定の標的配列若しくは断片を含むか若しくはからなる試料のサブセットの生成を結果としてもたらす。複雑性の低減は、さらなる分析又は方法ステップ、例えば増幅、バーコード付加、シークエンシング、エピジェネティックなバリエーションの決定などの前に一般に行われる。好ましくは、複雑性低減は、再現性のある複雑性低減であり、これは、同じ試料が同じ方法を使用して複雑性において低減される場合に、ランダムな複雑性低減とは対照的に、同じ、又は少なくとも同等の、サブセットが得られることを意味する。複雑性低減方法の例は、例えばＡＦＬＰ（登録商標）（ＫｅｙｇｅｎｅＮ．Ｖ．、ｔｈｅＮｅｔｈｅｒｌａｎｄｓ；例えば、ＥＰ０５３４８５８を参照）、任意プライムＰＣＲ増幅、捕捉プローブハイブリダイゼーション、Ｄｏｎｇ（例えば、国際公開第０３／０１２１１８号、国際公開第００／２４９３９号を参照）により記載された方法及びインデックス化連結（ＵｎｒａｕＰ．及びＤｅｕｇａｕＫ．Ｖ．（１９９４）Ｇｅｎｅ１４５：１６３～１６９頁）、国際公開第２００６／１３７７３３号；国際公開第２００７／０３７６７８号；国際公開第２００７／０７３１６５号；国際公開第２００７／０７３１７１号、米国特許出願公開第２００５／２６０６２８号、国際公開第０３／０１０３２８号、米国特許出願公開第２００４／１０１５３号に記載されている方法、ゲノムポーショニング（ｇｅｎｏｍｅｐｏｒｔｉｏｎｉｎｇ）（例えば国際公開第２００４／０２２７５８号を参照）、遺伝子発現連続分析（ＳＡＧＥ；例えばＶｅｌｃｕｌｅｓｃｕら、１９９５を参照、上記、及びＭａｔｓｕｍｕｒａら、１９９９、ＴｈｅＰｌａｎｔＪｏｕｒｎａｌ、ｖｏｌ．２０（６）：７１９～７２６頁を参照）並びにＳＡＧＥの改変（例えばＰｏｗｅｌｌ、１９９８、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ、ｖｏｌ．２６（１４）：３４４５～３４４６頁；並びにＫｅｎｚｅｌｍａｎｎ及びＭｕｈｌｅｍａｎｎ、１９９９、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ、ｖｏｌ．２７（３）：９１７～９１８頁を参照）、ＭｉｃｒｏＳＡＧＥ（例えばＤａｔｓｏｎら、１９９９、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ、ｖｏｌ．２７（５）：１３００～１３０７頁を参照）、超並列シグネチャーシークエンシング（ＭａｓｓｉｖｅｌｙＰａｒａｌｌｅｌＳｉｇｎａｔｕｒｅＳｅｇｕｅｎｃｉｎｇ）（ＭＰＳＳ；例えばＢｒｅｎｎｅｒら、２０００、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ、ｖｏｌ．１８：６３０～６３４頁及びＢｒｅｎｎｅｒら、２０００、ＰＮＡＳ、ｖｏｌ．９７（４）：１６６５～１６７０頁を参照）、セルフサブトラクテッドｃＤＮＡライブラリー（ｓｅｌｆ－ｓｕｂｔｒａｃｔｅｄｃＤＮＡｌｉｂｒａｒｉｅｓ）（Ｌａｖｅｄｅｒら、２００２、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ、ｖｏｌ．３０（９）：ｅ３８）、リアルタイムマルチプレックスライゲーション依存性プローブ増幅（ＲＴ－ＭＬＰＡ；例えばＥｌｄｅｒｉｎｇら、２００３、ｖｏｌ．３１（２３）：ｅｌ５３を参照）、高カバレッジ発現プロファイリング（ＨｉＣＥＰ；例えばＦｕｋｕｍｕｒａら、２００３、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ、ｖｏｌ．３１（１６）：ｅ９４を参照）、Ｒｏｔｈら（Ｒｏｔｈら、２００４、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ、ｖｏｌ．２２（４）：４１８～４２６頁）において開示されているユニバーサルマイクロアレイシステム、トランスクリプトームサブトラクション方法（例えばＬｉら、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ、ｖｏｌ．３３（１６）：ｅｌ３６を参照）、並びに断片ディスプレイ（例えばＭｅｔｓｉｓら、２００４、ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ、ｖｏｌ．３２（１６）：ｅｌ２７を参照）を含む。

「配列」又は「ヌクレオチド配列」：これは、核酸の、又は核酸内の、ヌクレオチドの順序を指す。換言すれば、核酸中のヌクレオチドの任意の順序は、配列又は核酸配列として参照され得る。例えば、標的配列は、ＤＮＡ二重鎖の単一の鎖中に含まれるヌクレオチドの順序である。

「シークエンシング」という用語は、本明細書において使用される場合、ポリヌクレオチドの少なくとも１０個の連続するヌクレオチドの素性（ｉｄｅｎｔｉｔｙ）（例えば、少なくとも２０、少なくとも５０、少なくとも１００又は少なくとも２００又はより多くの連続するヌクレオチドの素性）が得られる方法を指す。「次世代シークエンシング」、「ディープシークエンシング」又は「ハイスループットシークエンシング」という用語は、本明細書において交換可能に使用されることがあり、いわゆる並列化シークエンシングバイシンセシス（ｐａｒａｌｌｅｌｉｚｅｄｓｅｑｕｅｎｃｉｎｇ－ｂｙ－ｓｙｎｔｈｅｓｉｓ）又はシークエンシングバイライゲーション（ｓｅｑｕｅｎｃｉｎｇ－ｂｙ－ｌｉｇａｔｉｏｎ）プラットフォーム、例えば、Ｉｌｌｕｍｉｎａ、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ、ＰａｃＢｉｏ及びＲｏｃｈｅなどにより現行で用いられているものを指す。次世代シークエンシング方法はまた、ナノポアシークエンシング方法、例えばＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓにより商業化されているもの、又は電子検出ベースの方法、例えばＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓにより商業化されているＩｏｎＴｏｒｒｅｎｔ技術を含むことができる。好ましくは、次世代シークエンシング方法は、ナノポアシークエンシング方法、好ましくはナノポア選択的シークエンシング方法である。

「固有分子識別物」又は「ＵＭＩ」は、核酸分子に特異的な、例えば各々の単一のポリヌクレオチドのために独特の、実質的に独特の、好ましくは完全に独特の、タグ（例えばバーコード）である。「ＵＭＩ」という用語は、ポリヌクレオチドの配列情報及び物理的ポリヌクレオチドそれ自体の両方を指すために本明細書において使用される。ＵＭＩは、約２～１００個のヌクレオチド塩基又はより多くの長さの範囲内であり得、好ましくは約４～１６ヌクレオチド塩基の長さを有する。ＵＭＩは、連続する配列であり得るか、又はいくつかのサブユニットに分割されていてもよい。これらのサブユニットの各々は、別々のオリゴヌクレオチド及び／又はアダプター中に存在してもよい。これらのサブユニットは、単一のポリヌクレオチドのために実質的に独特のタグ、好ましくは完全に独特のタグを生成するために好ましくは一緒に使用される。例えば、ポリヌクレオチドが２つのオリゴヌクレオチドにより隣接される断片である場合、これらの２つのオリゴヌクレオチドの各々はＵＭＩのサブユニットを含んでもよい。ポリヌクレオチドが２つのオリゴヌクレオチドのライゲーション生成物である場合、これらの２つのオリゴヌクレオチドの各々はＵＭＩのサブユニットを含んでもよい。コンセンサス配列を得るために、本発明の方法において得られた配列リードは、２つのＵＭＩサブユニットの各々の情報に基づいてグループ化されてもよい。好ましくはＵＭＩは２つ又はより多くの連続する同一の塩基を含有しない。さらには、少なくとも２つ、好ましくは少なくとも３つの塩基のＵＭＩの間に好ましくは差異が存在する。ＵＭＩは、ランダムな、疑似ランダムな若しくは部分的にランダムな、又は非ランダムなヌクレオチド配列を有してもよい。ＵＭＩは、リードの由来となる起源分子を独特に同定するために使用され得るので、増幅されたポリヌクレオチドのリードは、各々の起源ポリヌクレオチドからの単一のコンセンサス配列にコラプス（ｃｏｌｌａｐｓｅｄ）され得る。ＵＭＩは、完全に又は実質的に独特であってもよい。完全に独特は、本発明の方法において提供されるあらゆるポリヌクレオチドが、本発明の方法におけるさらなるポリヌクレオチド中に含まれるすべての他のタグとは異なる独特のタグを含むこととして本明細書において理解されるべきである。実質的に独特は、本発明の方法、生成物、組成物又はキットにおいて提供される各々のポリヌクレオチドがランダムなＵＭＩを含むが、これらのポリヌクレオチドの低いパーセンテージが同じＵＭＩを含んでもよいこととして本明細書において理解されるべきである。好ましくは、同じＵＭＩを用いて目的の配列を含む正確な同じ分子にタグ付加する可能性がごくわずかである場合に、実質的に固有の分子識別物が使用される。好ましくは、ＵＭＩは、特定の目的の配列に関して完全に独特である。ＵＭＩは、好ましくは、この独特性を確実にするために十分な長さを有する。一部の実施態様において、各々のＤＮＡ分子がシークエンシングプロセスの間に独特に同定されることを確実にするために、より低い独特性の分子識別物（すなわち、上に指示されるように、実質的に独特の識別物）は他の同定技術と組み合わせて使用され得る。例えば、本発明のＵＭＩは、異なる目的の配列が同じ又は類似したＵＭＩに連結され得るようにより低い独特性であってもよい。後者の場合、ＵＭＩの配列情報の組合せは、目的の配列の配列情報と共に、起源となるポリヌクレオチドの同定を可能とする。ＵＭＩは、好ましくは、単一のクラスターからのすべてのリードが単一の分子に由来していると同定されることを決定するために使用される。

ＵＭＩは、特定の核酸分子を同定するために役立つ特定の種類のバーコードとして考えられ得る。例えば標的断片及び／又は試料の種類を同定するためにさらなるバーコードが役立ち得る。ＵＭＩのように、バーコードは、ＵＭＩについて本明細書において指し示されるものと類似した構造的特徴を有するヌクレオチドの定義された数及び配列のストレッチとして考えられ得る。バーコードが試料バーコードである場合、試料の各々のバーコード付加された核酸分子又は標的断片は同じバーコードを含んでもよい。バーコードが標的断片バーコードである場合、任意選択で、数多くの異なる試料中に存在し得る各々の特定の種類の標的断片は、同じ標的断片バーコードを用いてバーコード付加され得ると共に、各々の試料内で、異なる標的断片は、異なる標的断片バーコードを用いてバーコード付加され得る。そのような標的断片バーコードは、例えば本明細書に記載されるような方法により試料を処理した後にシークエンシングした後の配列データの容易なクラスタリングを可能とする。特定の標的断片の配列をそれらの起源となる試料に割り当てる脱マルチプレックスを可能とするために、バーコード付加される標的断片は、好ましくは、試料バーコード及び標的断片バーコードの両方を用いてバーコード付加される。

［詳細な説明］
本発明者らは、標的核酸断片が目的の配列を含んでもよい、標的核酸断片の標識化のための多用途の方法を発見した。より詳細には、本発明の方法において、標的核酸分子は、１つ又は両方の側において特定のヌクレオチド配列を用いて標識される。この新たに付加されたヌクレオチド配列はその後に、さらなる下流のプロセスにおいて、例えば特異的に付加された配列にプライマーをアニールするために、又は追加の配列、例えばディープシークエンシングのためのアダプター配列を標的核酸断片に連結させるために使用され得る。標的核酸断片のみへのアダプター配列の連結は、標的核酸断片の選択的なシークエンシングを結果としてもたらす。同様に、標識された核酸断片への保護的なアダプターのアニーリング及びその後のエキソヌクレアーゼ保護は、試料中の標的核酸断片の富化を結果としてもたらす。本明細書において以下に詳述されている方法はしたがってまた、
ｉ）標的核酸断片の富化方法；
ｉｉ）標的核酸断片を伸長する方法；
ｉｉｉ）ライブラリー調製方法；
ｉｖ）シークエンシング、好ましくは２方向性シークエンシング及び／又はコンビナトリアルバーコードシークエンシングの方法；並びに
ｖ）標的核酸断片を増幅する、好ましくは選択的に増幅する方法
のうちの少なくとも１つであり得る。
第１の態様において、本発明は、標的核酸断片を標識する方法であって、標的核酸断片が第１の鎖及び相補的な第２の鎖を含む、方法に関する。好ましくは、標的核酸断片は目的の配列を含む。方法は、好ましくは、
ａ）二本鎖核酸分子を含む試料を提供するステップであり、二本鎖核酸分子が目的の配列を含む、ステップ；
ｂ）二本鎖核酸分子を部位特異的ヌクレアーゼと接触させて二本鎖切断を生成するステップであり、二本鎖切断が標的核酸断片の第１の鎖の遊離３’末端を結果としてもたらす、ステップ；並びに
ｃ）切断された二本鎖核酸分子をＤＮＡポリメラーゼ及び鋳型分子、好ましくは逆転写酵素及び鋳型ＲＮＡ分子と接触させ、それにより１つ又は複数のヌクレオチドで標的核酸断片の第１の鎖の遊離３’末端を標識するステップ
を含む。

任意選択で、ステップｂ）における部位特異的ヌクレアーゼ及びステップｃ）における逆転写酵素は別々の実体である。例示的な実施形態は図１に図式的に描写されている。

本発明の方法はｉｎｖｉｔｒｏ方法であり得る。

任意選択で、本発明の方法は、複数の標的核酸断片の並列の又はその後の標識化を結果としてもたらす。好ましくは、本発明の方法は、１つ又は複数の核酸試料からの複数の標的核酸断片の標識化を含む。そのような方法は、下流の処理、例えばシークエンシングのために核酸ライブラリーを調製する方法と考えられ得る。

本発明の文脈における「標識化」という用語は、標的核酸断片への１つ又は複数のヌクレオチドの付加として理解されるべきである。これらの新たに付加されるヌクレオチドは、好ましくは、予め決定された配列において付加される。この配列は、好ましくは、本明細書において定義されている鋳型ＲＮＡ分子の配列の部分に相補的である。標識の配列は、好ましくは、鋳型ＲＮＡ分子の５’末端に位置する配列に相補的である。好ましくは、本発明の方法は、標的核酸断片の少なくとも１つの末端に少なくとも１つのヌクレオチドを付加することができる。好ましくは、本発明の方法は、標的核酸断片の少なくとも１つ又は両方の末端に少なくとも約１、２、５、１０、１５、２０、２５、３０個又はより多くのヌクレオチドを付加することができる。任意選択で、本発明の方法は、標的核酸断片の少なくとも１つ又は両方の末端に約１０～１５０、１１～１００、１２～９０、１３～８０、１４～７０、１５～６０、１６～５０、１７～２５、１８～１５０、１９～１００、２０～９０、２１～８０、２２～７０、２３～６０又は約２４～５０個のヌクレオチドを付加することができる。

試料の提供－ステップａ）
本発明の方法のステップａ）において試料が提供され、試料は二本鎖核酸分子を含む。二本鎖ＤＮＡ分子は好ましくは標的核酸断片を含み、標的核酸断片は好ましくは目的の配列を含む。好ましくは、二本鎖核酸分子はそのため目的の配列を含む。

本発明の方法の核酸試料は、任意の供給源、例えばヒト、動物、植物、微生物、細菌、ウイルスからのものであってもよく、任意の種類のもの、例えば細胞に対して内因性又は外因性のもの、例えばゲノムＤＮＡ、染色体ＤＮＡ、人工染色体、プラスミドＤＮＡ、又はエピソームＤＮＡ、ｃＤＮＡ、ＲＮＡ、ミトコンドリアのもの、又は人工ライブラリーのもの、例えばＢＡＣ若しくはＹＡＣなどであってもよい。ＤＮＡは核又はオルガネラＤＮＡであってもよい。好ましくは、ＤＮＡは染色体ＤＮＡ、好ましくは細胞に対して内因性の染色体ＤＮＡである。

ステップａ）の二本鎖核酸は、好ましくは生物学的供給源から、単離及び／又は精製されてもよい。任意選択で、ステップａ）の二本鎖核酸は合成によるものである。任意選択で、ステップａ）の二本鎖核酸は合成ＤＮＡ、任意選択でＲＮＡから逆転写された一本鎖又は二本鎖ＤＮＡである。

ステップａ）の二本鎖核酸分子は、ウイルス又は生きた生物、例えば生きたヒト、動物又は植物を起源としてもよい。任意選択で、前記二本鎖核酸は、ウイルス又は生きた生物から単離及び／又は精製される。ウイルス又は生きた生物からの、任意選択で単離及び／又は精製された、核酸は、その後に増幅及び／又は逆転写されて合成ＤＮＡを結果としてもたらしてもよい。ステップａ）の試料は、単一細胞、単一細胞のコレクション、組織（の部分）、臓器及び／又は流体（の部分）を起源としてもよい。細胞から単離された二本鎖核酸は、細胞を溶解するステップを含む方法により得られてもよい。ステップａ）の二本鎖核酸分子は、したがって、溶解された細胞の二本鎖核酸分子であってもよい。ステップａ）の二本鎖核酸分子は細胞外二本鎖核酸であってもよい。

好ましくは、試料がヒト又は動物起源の場合、前記試料は、非侵襲的な又は最小の侵襲性の方法により得られる。

核酸試料は少なくとも１つの標的核酸断片を含むことが本明細書において理解される。換言すれば、核酸試料はそのため、１、２、３、４、５、６、７、８、９、１０個又はより多くの標的核酸断片、例えば少なくとも約５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００個又はより多くの標的核酸断片を含んでもよく、好ましくは試料内の各々の標的核酸断片は別個の目的の配列を有する。

試料内の単一の二本鎖核酸分子は少なくとも１つの標的核酸断片を含み、少なくとも１つの標的核酸断片は目的の配列を含むことが本明細書においてさらに理解される。換言すれば、単一の二本鎖核酸分子は、１、２、３、４、５、６、７、８、９、１０個又はより多くの標的核酸断片、例えば少なくとも約５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００個又はより多くの標的核酸断片を含んでもよく、好ましくは二本鎖核酸分子内の各々の標的核酸断片は別個の目的の配列を有する。

二本鎖ＤＮＡ分子の切断－ステップｂ）及びステップｄ）
本発明の方法のステップｂ）において、二本鎖核酸分子は、二本鎖切断を生成するために部位特異的ヌクレアーゼと接触させる。そのため二本鎖切断は特異的な位置において生成される。好ましくは二本鎖切断は、目的の配列の近傍にある位置において生成される。好ましくは、生成される二本鎖切断は、目的の配列のすぐ隣に位置する。二本鎖切断は、目的の配列の上流又は下流において生成されてもよく、標的核酸断片の遊離３’又は５’末端を結果としてもたらすことができる。二本鎖切断は、標的核酸断片の第１の鎖の遊離３’末端を生成する。標的核酸断片の第１の鎖のこの遊離３’末端は、標的核酸断片の上又は下の鎖の遊離３’末端であり得ることが本明細書において理解される。部位特異的ヌクレアーゼは、少なくとも本明細書においてさらに定義されているその後の標識化ステップの全体を通じて目的の配列を含む切断された核酸分子の部分に結合したままであるように設計されてもよい。好ましくは、部位特異的ヌクレアーゼは、少なくともステップｃ）の全体を通じて標的核酸断片に結合したままであるように設計される。好ましくは、部位特異的ヌクレアーゼは、標識されるべき部位に位置したままであるように設計される。

ステップｂ）と同時に又はステップｂ）の後に、二本鎖核酸分子は、第２の二本鎖切断を生成するために第２の部位特異的ヌクレアーゼと接触させ得る。本発明の方法はそのため、第２の二本鎖切断を生成するために二本鎖核酸分子を第２の部位特異的ヌクレアーゼと接触させるステップｄ）を含んでもよい。好ましくは、第２の二本鎖切断は、標的核酸断片の第２の鎖の遊離３’末端を結果としてもたらす。

好ましくは、ステップｄ）はステップｂ）と同時に行われる。ステップｄ）は、ステップｂ）の後、及びステップｃ）の前に行われてもよい。代替的に又は追加的に、ステップｄ）はステップｃ）の後に行われてもよい。

好ましくは、この第２の二本鎖切断は、目的の配列の近傍にある位置において生成される。好ましくは、第２の生成された二本鎖切断は、目的の配列のすぐ隣に位置する。二本鎖切断は、目的の配列の上流又は下流において生成されてもよく、標的核酸断片の遊離３’又は５’末端を結果としてもたらすことができる。二本鎖切断は標的核酸断片の第２の鎖の遊離３’末端を生成する。標的核酸断片の第２の鎖のこの遊離３’末端は、標的核酸断片の上又は下の鎖の遊離３’末端であり得ることが本明細書において理解される。

２つの二本鎖切断が生成される場合、第１の二本鎖切断は標的核酸断片の第１の鎖の３’末端を生成してもよく、第２の二本鎖切断は標的核酸断片の第１の鎖の５’末端を生成してもよい。２つの二本鎖切断が生成される場合、第１の二本鎖切断は標的核酸断片の第２の鎖の５’末端を生成してもよく、第２の二本鎖切断は標的核酸断片の第２の鎖の３’末端を生成してもよい。

切断ステップｂ）、及び任意選択で切断ステップｄ）は、好ましくは、部位特異的ヌクレアーゼが二本鎖核酸分子に特異的に結合してそれを切断できる実験条件下で、すなわち部位特異的ヌクレアーゼが特異的な酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び／又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件は部位特異的ヌクレアーゼの種類に依存し得る。実験条件は、以下の実験セクションに記載される条件と同じ又は類似したものであり得る。

目的の配列は部位特異的ヌクレアーゼ（複数可）での切断前に二本鎖核酸分子中に存在することが本明細書において理解される。核酸分子の切断は、少なくとも２つ又はより多くの核酸断片を結果としてもたらし、少なくとも１つの核酸断片は標的核酸断片である。他の生成される核酸断片もまた、標的核酸断片であり得るか、若しくはそれを含んでもよいか、又は非標的核酸断片である。標的核酸断片は、目的の配列を含むか又はからなる。それゆえ、二本鎖核酸分子を切断する前に、標的核酸断片は二本鎖核酸分子内に包含され、標的核酸断片は少なくとも１つの部位特異的エンドヌクレアーゼでの切断で二本鎖核酸分子から放出されることは当業者に明らかである。

第１の、及び任意選択の第２の、二本鎖切断を生成する部位特異的ヌクレアーゼは、ＣＲＩＳＰＲ－ヌクレアーゼ複合体、核酸－アルゴノート複合体、ジンクフィンガーヌクレアーゼ、ＴＡＬＥＮ及びメガヌクレアーゼからなる群から選択され得る。好ましくは、ステップｂ）及び／又はステップｄ）における部位特異的ヌクレアーゼはＣＲＩＳＰＲ－ヌクレアーゼ複合体である。

ＣＲＩＳＰＲ－ヌクレアーゼ複合体
本発明による使用のためのＣＲＩＳＰＲ－ヌクレアーゼ複合体、又は複合体は、ガイドＲＮＡと複合体化したＣＲＩＳＰＲ関連（ＣＡＳ）タンパク質、又はＣＲＩＳＰＲ－ヌクレアーゼとして本明細書において理解されるべきである。

ＣＲＩＳＰＲ－ヌクレアーゼは、ヌクレアーゼドメイン、及びガイドＲＮＡと相互作用する少なくとも１つのドメインを含む。ガイドＲＮＡと複合体化した場合、ＣＲＩＳＰＲ－ヌクレアーゼは、ガイドＲＮＡにより特定の核酸配列に方向付けられる。ガイドＲＮＡは、ＣＲＩＳＰＲ－ヌクレアーゼの他に、特定の標的核酸配列と相互作用し、その結果、ガイド配列を介して特定の核酸配列を含む部位に一旦方向付けられると、ＣＲＩＳＰＲ－ヌクレアーゼは標的部位において切断を導入することができる。好ましくは、ＣＲＩＳＰＲ－ヌクレアーゼは、ヌクレアーゼの１つ又は両方のドメインが触媒的に活性である場合に、標的部位においてそれぞれ一本鎖又は二本鎖切断を導入することができる。ＣＲＩＳＰＲ－ヌクレアーゼと組み合わせられた場合に、ガイドＲＮＡが核酸分子中の予め定義された部位において一本鎖又は二本鎖切断の導入をもたらす方式においてガイドＲＮＡを設計する方法を当業者はよく認識している。好ましくは、ＣＲＩＳＰＲ－ヌクレアーゼは二本鎖切断（ｄｏｕｂｌｅ－ｓｔｒａｎｄｅｄｂｅａｋ）の導入をもたらす。

ＣＲＩＳＰＲ－ヌクレアーゼは、コアエレメント含有量及び配列に基づいて、サブタイプにさらに分けられる６つの主要なタイプ（Ｉ～ＶＩ型）に一般にカテゴライズされ得る（Ｍａｋａｒｏｖａら、２０１１、ＮａｔＲｅｖＭｉｃｒｏｂｉｏｌ９：４６７～７７頁及びＷｒｉｇｈｔら、２０１６、Ｃｅｌｌ１６４（１－２）：２９～４４頁）。一般に、ＣＲＩＳＰＲ－ＣＡＳシステム複合体の２つの鍵となるエレメントはＣＲＩＳＰＲ－ヌクレアーゼ及びガイドＲＮＡである。

ＩＩ型ＣＲＩＳＰＲ－ＣＡＳシステムは、二重鎖ＤＮＡを特異的に切断することが可能であるシグネチャーＣａｓ９タンパク質、単一タンパク質（約１６０ＫＤａ）を含む。Ｃａｓ９タンパク質は、典型的には、２つのヌクレアーゼドメイン、アミノ末端の近くのＲｕｖＣ様ヌクレアーゼドメイン及びタンパク質の中央の近くのＨＮＨ（又はＭｃｒＡ様）ヌクレアーゼドメインを含有する。Ｃａｓ９タンパク質の各々のヌクレアーゼドメインは、二重らせんの１つの鎖を切断するために専門化されている（Ｊｉｎｅｋら、２０１２、Ｓｃｉｅｎｃｅ３３７（６０９６）：８１６～８２１頁）。Ｃａｓ９タンパク質はＩＩ型ＣＲＩＳＰＲ／－ＣＡＳシステムのＣＡＳタンパク質の例であり、ｃｒＲＮＡ、及びトランス活性化ｃｒＲＮＡ（ｔｒａｃｒＲＮＡ）と称される第２のＲＮＡと組み合わせられた場合に、ＣＲＩＳＰＲ－ヌクレアーゼ複合体を形成する。ｃｒＲＮＡ及びｔｒａｃｒＲＮＡは一緒になってガイドＲＮＡとして機能する。ＣＲＩＳＰＲ－ヌクレアーゼ複合体は、ｃｒＲＮＡにより定義されるゲノム中の位置においてＤＮＡ二本鎖切断（ＤＳＢ）を導入する。ｃｒＲＮＡ及びｔｒａｃｒＲＮＡの必須の部分を融合することにより生成される単鎖キメラガイドＲＮＡ（「ｓｇＲＮＡ」）は、Ｃａｓ９タンパク質と組み合わせて機能的なＣＲＩＳＰＲ－ヌクレアーゼ複合体を形成できることをＪｉｎｅｋら（２０１２、Ｓｃｉｅｎｃｅ３３７：８１６～８２０頁）は実証した。

Ｖ型ＣＲＩＳＰＲ－ＣＡＳシステムは、プレボテラ（Ｐｒｅｖｏｔｅｌｌａ）及びフランシセラ（Ｆｒａｎｃｉｓｅｌｌａ）１からのＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔ又はＣＲＩＳＰＲ／Ｃｐｆ１を含む。Ｃｐｆ１遺伝子は、ＣＲＩＳＰＲ座位と関連付けられ、ｃｒＲＮＡを使用してＤＮＡを標的化するエンドヌクレアーゼをコードする。Ｃｐｆ１は、Ｃａｓ９よりも小さい及び単純なエンドヌクレアーゼである。Ｃｐｆ１は、ｔｒａｃｒＲＮＡを欠いたシングルＲＮＡにガイドされるエンドヌクレアーゼであり、好ましくはＴリッチプロトスペーサー隣接モチーフを利用する。Ｃｐｆ１は、スタッガードＤＮＡ二本鎖切断を介してＤＮＡを切断する（Ｚｅｔｓｃｈｅら、（２０１５）Ｃｅｌｌ１６３（３）：７５９～７７１頁）。Ｖ型ＣＲＩＳＰＲ－ＣＡＳシステムは、好ましくは、Ｃｐｆ１、Ｃ２ｃ１及びＣ２ｃ３のうちの少なくとも１つを含む。

本発明の方法における使用のためのＣＲＩＳＰＲ－ヌクレアーゼ複合体、又は複合体は、二本鎖切断を生成することが可能である任意のＣＲＩＳＰＲ－ヌクレアーゼを含んでもよい。好ましくは、本発明の方法における使用のためのＣＲＩＳＰＲ－ヌクレアーゼ複合体、又は複合体は、ＩＩ型ＣＲＩＳＰＲ－ヌクレアーゼ、例えば、Ｃａｓ９（例えば、配列番号２によりコードされる、配列番号１のタンパク質、若しくは配列番号３のタンパク質）若しくはＶ型ＣＲＩＳＰＲ－ヌクレアーゼ、例えばＣｐｆ１（例えば、配列番号５によりコードされる、配列番号４のタンパク質）若しくはＭａｄ７（例えば配列番号６若しくは７のタンパク質）、又は前記タンパク質に対してその全長にかけて好ましくは少なくとも約７０％、８０％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、若しくは９９％の配列同一性を有する、これらに由来するタンパク質を含む。好ましくは本発明の方法での使用のためのＣＲＩＳＰＲ－ヌクレアーゼ複合体、又は複合体は、ＩＩ型ＣＲＩＳＰＲ－ヌクレアーゼ、好ましくはＣａｓ９ヌクレアーゼを含む。

ＣＲＩＳＰＲ－ヌクレアーゼ複合体の異なる構成要素を調製する方法は当業者に公知である。先行技術において、多数の報告がその設計及び使用に関して利用可能である。例えば、ガイドＲＮＡの設計及びＣＡＳタンパク質（Ｓ．ピオゲネスから元々は得られた）とのその併用に関するＨａｅｕｓｓｌｅｒら（ＪＧｅｎｅｔＧｅｎｏｍｉｃｓ．（２０１６）４３（５）：２３９～５０頁．ｄｏｉ：１０．１０１６／ｊ．ｊｇｇ．２０１６．０４．００８）による総説、又はＬｅｅら（ＰｌａｎｔＢｉｏｔｅｃｈｎｏｌｏｇｙＪｏｕｒｎａｌ（２０１６）１４（２）４４８～４６２頁）による総説を参照。

好ましくは、ＣＲＩＳＰＲ－ヌクレアーゼ、例えばＣａｓ９は、２つの触媒的に活性のヌクレアーゼドメインを含む。例えば、Ｃａｓ９タンパク質は、ＲｕｖＣ様ヌクレアーゼドメイン及びＨＮＨ様ヌクレアーゼドメインを含むことができる。ＲｕｖＣ及びＨＮＨドメインは一緒に働き、両方とも単一の鎖を切断して、ＤＮＡ中に二本鎖切断を作る。（Ｊｉｎｅｋら、Ｓｃｉｅｎｃｅ、３３７：８１６～８２１頁）。

不活性（ｄｅａｄ）ＣＲＩＳＰＲ－ヌクレアーゼは、ヌクレアーゼドメインのいずれも切断活性を示さないような改変を含む。本発明の方法における使用のためのＣＲＩＳＰＲ－ヌクレアーゼは、ヌクレアーゼドメインのうちの１つがもはや機能的でなく（すなわち、ヌクレアーゼ活性が存在しない）、それによりニッカーゼを作り出すように突然変異しているＣＲＩＳＰＲ－ヌクレアーゼのバリアントであってもよい。例は、Ｄ１０Ａ又はＨ８４０Ａのいずれかの突然変異を有するＳｐＣａｓ９バリアントである。好ましくは、ＣＲＩＳＰＲ－ヌクレアーゼ複合体のヌクレアーゼは不活性ヌクレアーゼではない。好ましくは、ＣＲＩＳＰＲ－ヌクレアーゼ複合体、又は複合体のＣＲＩＳＰＲ－ヌクレアーゼは、ニッカーゼ又は（エンド）ヌクレアーゼのいずれか、好ましくは（エンド）ヌクレアーゼである。本発明の方法において使用されるＣＲＩＳＰＲ－ヌクレアーゼ複合体、又は複合体は、Ｃａｓ９タンパク質全体を含んでもよいか、又はその機能性断片を含んでもよい。

好ましくはＣＲＩＳＰＲ－ヌクレアーゼはＣａｓ９又はＣｐｆ１ヌクレアーゼ、好ましくはＣａｓ９ヌクレアーゼを含む。好ましくは、本発明における使用のためのＣＲＩＳＰＲ－ヌクレアーゼ複合体、又は複合体はＣａｓ９タンパク質を含む。Ｃａｓ９タンパク質は、細菌ストレプトコッカス・ピオゲネス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓ）（ＳｐＣａｓ９；ＮＣＢＩ参照配列ＮＣ＿０１７０５３．１；ＵｎｉＰｒｏｔＫＢ－Ｑ９９ＺＷ２）、ゲオバシラス・サーモデニトリフィカンス（Ｇｅｏｂａｃｉｌｌｕｓｔｈｅｒｍｏｄｅｎｉｔｒｉｆｉｃａｎｓ）（ＵｎｉＰｒｏｔＫＢ－Ａ０Ａ１７８ＴＥＪ９）、コリネバクテリウム・ウルセラス（Ｃｏｒｙｎｅｂａｃｔｅｒｉｕｍｕｌｃｅｒｏｕｓ）（ＮＣＢＩ参照：ＮＣ＿０１５６８３．１、ＮＣ＿０１７３１７．１）；コリネバクテリウム・ジフテリア（Ｃｏｒｙｎｅｂａｃｔｅｒｉｕｍｄｉｐｈｔｈｅｒｉａ）（ＮＣＢＩ参照：ＮＣ＿０１６７８２．１、ＮＣ＿０１６７８６．１）；スピロプラズマ・シルフィジコラ（Ｓｐｉｒｏｐｌａｓｍａｓｙｒｐｈｉｄｉｃｏｌａ）（ＮＣＢＩ参照：ＮＣ＿０２１２８４．１）；プレボテラ・インテルメディア（Ｐｒｅｖｏｔｅｌｌａｉｎｔｅｒｍｅｄｉａ）（ＮＣＢＩ参照：ＮＣ＿０１７８６１．１）；スピロプラズマ・タイワネンセ（Ｓｐｉｒｏｐｌａｓｍａｔａｉｗａｎｅｎｓｅ）（ＮＣＢＩ参照：ＮＣ＿０２１８４６．１）；ストレプトコッカス・イニアエ（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｉｎｉａｅ）（ＮＣＢＩ参照：ＮＣ＿０２１３１４．１）；ベリエラ・バルティカ（Ｂｅｌｌｉｅｌｌａｂａｌｔｉｃａ）（ＮＣＢＩ参照：ＮＣ＿０１８０１０．１）；サイクロフレクサス・トルクイスル（Ｐｓｙｃｈｒｏｆｌｅｘｕｓｔｏｒｑｕｉｓｌ）（ＮＣＢＩ参照：ＮＣ＿０１８７２１．１）；ストレプトコッカス・サーモフィラス（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）（ＮＣＢＩ参照：ＹＰ＿８２０８３２．１）；リステリア・イノキュア（Ｌｉｓｔｅｒｉａｉｎｎｏｃｕａ）（ＮＣＢＩ参照：ＮＰ＿４７２０７３．１）；カンピロバクター・ジェジュニ（Ｃａｍｐｙｌｏｂａｃｔｅｒｊｅｊｕｎｉ）（ＮＣＢＩ参照：ＹＰ＿００２３４４９００．１）；又はネイセリア・メニンギチジス（Ｎｅｉｓｓｅｒｉａｍｅｎｉｎｇｉｔｉｄｉｓ）（ＮＣＢＩ参照：ＹＰ＿００２３４２１００．１）に由来してもよい。包含されるのは、ＳｐＣａｓ９に対してホモログの不活性化されたＨＮＨ若しくはＲｕｖＣドメインを有するこれらからのＣａｓ９バリアント、例えばＳｐＣａｓ９＿Ｄ１０Ａ若しくはＳｐＣａｓ９＿Ｈ８４０Ａ、又はニッカーゼにする、ＳｐＣａｓ９タンパク質中のＤ１０若しくはＨ８４０に対応する位置における同等の置換を有するＣａｓ９である。好ましくは、本発明の方法における使用のためのＣａｓ９タンパク質は（エンド）ヌクレアーゼである。

プログラム可能なヌクレアーゼは、Ｃｐｆ１、例えば、アシッドアミノコッカス属菌（Ａｃｉｄａｍｉｎｏｃｏｃｃｕｓｓｐ）からのＣｐｆ１；ＵｎｉＰｒｏｔＫＢ－Ｕ２ＵＭＱ６に由来してもよい。バリアントは、ＲｕｖＣ又はＮＵＣドメインがもはやヌクレアーゼ活性を有しない、不活性化されたＲｕｖＣ又はＮＵＣドメインを有するＣｐｆ１ニッカーゼであってもよい。当業者は、不活性化されたヌクレアーゼ、例えば不活性化されたＲｕｖＣ又はＮＵＣドメインを可能とする当技術分野において利用可能な技術、例えば部位特異的突然変異誘発、ＰＣＲ媒介突然変異誘発、及び全遺伝子合成をよく認識している。不活性ＮＵＣドメインを有するＣｐｆ１ニッカーゼの例はＣｐｆ１Ｒ１２２６Ａである（Ｇａｏら、ＣｅｌｌＲｅｓｅａｒｃｈ（２０１６）２６：９０１～９１３頁、Ｙａｍａｎｏら、Ｃｅｌｌ（２０１６）１６５（４）：９４９～９６２頁を参照）。このバリアントにおいて、ＮＵＣドメインを不活性化する、ＮＵＣドメイン中のアルギニンからアラニンへの（Ｒ１２２６Ａ）変換がある。好ましくはＣｐｆ１タンパク質は、不活性化されたＣｐｆ１タンパク質ではない。好ましくは、本発明における使用のためのＣｐｆ１タンパク質は（エンド）ヌクレアーゼである。

本発明の方法は、核酸試料からのこれらの標的核酸断片の同時の富化を提供し得る。したがって任意選択で、本発明の方法のステップｂ）において、複数のＣＲＩＳＰＲ－ヌクレアーゼ複合体が、核酸試料からの複数の標的核酸断片の富化、単離又はシークエンシングのために加えられる。好ましくは、これらの複数のＣＲＩＲＰＲ－ヌクレアーゼ複合体は同じＣＲＩＳＰＲ－ヌクレアーゼを含んでもよいが、それらのガイドＲＮＡにおいて異なってもよい。例えば、各々の標的核酸断片のために、２つの別個のガイドＲＮＡ分子が使用されてもよく、例えば１つのガイドＲＮＡは第１のＣＲＩＳＰＲ－ヌクレアーゼ複合体に組み込まれ、別のガイドＲＮＡは第２のＣＲＩＳＰＲ－ヌクレアーゼ複合体に組み込まれる。例えば少なくとも約５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００個又はより多くの標的核酸断片のために、好ましくは少なくとも約５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００個又はより多くの、ガイドＲＮＡ分子のセット、好ましくは少なくとも約１００、２００、３００、４００、５００、６００、７００、８００、９００、１０００、１５００、２０００個又はより多くの異なるガイドＲＮＡ分子が本発明の方法において使用されてもよい。

ガイドＲＮＡ
本発明の方法における使用のためのＣＲＩＳＰＲ－ヌクレアーゼ複合体、又は複合体は、プロトスペーサー配列とも命名される、二本鎖核酸分子中の定義された標的部位に複合体を方向付けるＣＲＩＳＰＲ－ヌクレアーゼ関連ガイドＲＮＡをさらに含む。ガイドＲＮＡは、二本鎖核酸分子中の目的の配列の好ましくは近くに、該配列に又は該配列内にあるプロトスペーサー配列にＣＲＩＳＰＲ－ヌクレアーゼ複合体を標的化するためのガイド配列を含み、ｓｇＲＮＡ又はｃｒＲＮＡとｔｒａｃｒＲＮＡとの組合せ（例えばＣａｓ９のため）又はｃｒＲＮＡのみ（例えばＣｐｆ１の場合）であってもよい。本発明の方法における使用のためのＣＲＩＳＰＲ－ヌクレアーゼ複合体はそのためガイドＲＮＡを含んでもよく、ガイドＲＮＡはｃｒＲＮＡとｔｒａｃｒＲＮＡとの組合せであり、及び好ましくは（エンド）ヌクレアーゼはＣａｓ９である。ｃｒＲＮＡ及びｔｒａｃｒＲＮＡは任意選択でｓｇＲＮＡ（シングルガイドＲＮＡ）になるように組み合わせられる。代替的に、本発明の方法における使用のためのＣＲＩＳＰＲ－ヌクレアーゼ複合体は、ガイドＲＮＡを含んでもよく、ガイドＲＮＡはｃｒＲＮＡであり、及び好ましくは（エンド）ヌクレアーゼはＣｐｆ１である。

「ガイドＲＮＡ」という用語はそのため、二本鎖ＤＮＡ分子内の特定のヌクレオチド配列に（エンド）ヌクレアーゼを方向付けるＲＮＡ分子、又はＲＮＡ分子の組合せを指すことが本明細書において理解される。Ｃａｓ９（エンド）ヌクレアーゼの場合、「ガイドＲＮＡ」という用語はそのため、ｃｒＲＮＡとｔｒａｃｒＲＮＡとの組合せのみ、又はシングルガイドＲＮＡのみが意図されることが文脈から明らかである場合を除いて、ｃｒＲＮＡとｔｒａｃｒＲＮＡとの組合せの他に、シングルガイドＲＮＡ（ｓｇＲＮＡ）の両方を包含する。Ｃｐｆ１（エンド）ヌクレアーゼの場合、「ガイドＲＮＡ」という用語はｃｒＲＮＡを指す。

任意選択で、１つより多くの種類のガイドＲＮＡが同じ方法において使用されてもよく、これは例えば２つ若しくはより多くの異なる目的の配列を目的としているか、又は同じ目的の配列の２つの異なる位置を目的としており、例えば同じ目的の配列の上流の配列及び下流の配列を目的としている。非限定的な例として、第１のガイドＲＮＡは、核酸分子が目的の配列の上流で切断されるように二本鎖核酸中の配列に第１のＣＲＩＳＰＲ－ヌクレアーゼ複合体をガイドしてもよく、及び第２のガイドＲＮＡは、核酸分子が目的の配列の下流で切断されるように二本鎖核酸中の別の配列に第２のＣＲＩＳＰＲ－ヌクレアーゼ複合体をガイドしてもよい。

好ましくは、ＣＲＩＳＰＲ－ヌクレアーゼ複合体は、プロトスペーサー配列内で核酸を切断するＣＲＩＳＰＲ－ヌクレアーゼを含む。好ましいＣＲＩＳＰＲ－ヌクレアーゼはＣａｓ９である。

ＣＲＩＳＰＲ－ヌクレアーゼ複合体におけるｇＲＮＡ（ガイドＲＮＡ）としての使用のためのｃｒＲＮＡ及びｔｒａｃｒＲＮＡとして好適な分子は当技術分野において周知である（例えば、国際公開第２０１３１４２５７８号及びＪｉｎｅｋら、Ｓｃｉｅｎｃｅ（２０１２）３３７、８１６～８２１頁を参照）。

本発明の方法における使用のためのガイドＲＮＡのうちの少なくとも１つは、目的の配列、好ましくは本明細書において定義されている目的の配列に又はその近くにハイブリダイズすることができる配列を含んでもよい。好ましくは、ガイドＲＮＡのうちの少なくとも１つは、目的の配列中の配列に完全に相補的なヌクレオチド配列を含み、すなわち目的の配列はプロトスペーサー配列を含む。

代替的に又は追加的に、本発明の方法における使用のためのガイドＲＮＡのうちの少なくとも１つは、目的の配列、好ましくは本明細書において定義されている目的の配列の相補体に又はその近くにハイブリダイズすることができる配列を含んでもよい。好ましくは、ガイドＲＮＡのうちの少なくとも１つは、目的の配列と、又はその部分と完全な配列同一性を有するヌクレオチド配列を含む。

プロトスペーサー配列に相補的なｃｒＲＮＡ配列の部分は、プロトスペーサー配列とハイブリダイズするためにプロトスペーサー配列と十分な相補性を有するように、及び複合体化したヌクレアーゼの配列特異的な結合を指令するように設計される。プロトスペーサー配列は、好ましくは、プロトスペーサー隣接モチーフ（ＰＡＭ）配列に隣接し、ＰＡＭ配列は、本明細書において定義されているＲＮＡにガイドされるＣＲＩＳＰＲシステムヌクレアーゼ複合体のＣＲＩＳＰＲヌクレアーゼと相互作用し得る。例えば、ＣＲＩＳＰＲヌクレアーゼがＳ．ピオゲネスＣａｓ９である場合、ＰＡＭ配列は好ましくは５’－ＮＧＧ－３’であり、Ｎは、Ｔ、Ｇ、Ａ又はＣのうちのいずれか１つであり得る。当業者は、好ましくは配列を操作して、任意の所望されるプロトスペーサー配列にハイブリダイズするために該プロトスペーサー配列に少なくとも部分的に相補的となるようにすることにより、ｃｒＲＮＡを操作して任意の所望される配列を標的化させることができる。好ましくは、ｃｒＲＮＡ配列の部分とその対応するプロトスペーサー配列との間の相補性は、好適なアライメントアルゴリズムを使用して最適にアライメントされた場合に、少なくとも約７０％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％又は１００％である。プロトスペーサー配列に相補的なｃｒＲＮＡ配列の部分は、少なくとも約５、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３５、４０、４５、５０、７５個、又はより多くのヌクレオチドの長さであってもよい。一部の好ましい実施形態において、ＤＮＡ標的配列に相補的な配列は、約７５、５０、４５、４０、３５、３０、２５、２０個未満のヌクレオチドの長さである。好ましくは、ＤＮＡ配列に相補的な配列の長さは少なくとも１７ヌクレオチドである。好ましくは相補的なｃｒＲＮＡ配列は約１０～３０ヌクレオチドの長さ、約１７～２５ヌクレオチドの長さ又は約１５～２１ヌクレオチドの長さである。好ましくはプロトスペーサー配列に相補的なｃｒＲＮＡの部分は、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４又は２５ヌクレオチドの長さ、好ましくは２０又は２１ヌクレオチド、好ましくは２０ヌクレオチドである。

好ましくは、ｃｒＲＮＡ及びｔｒａｃｒＲＮＡが別々の分子であり、方法が、核酸分子中に２つの二本鎖切断を生成するためにステップｂ）及びステップｄ）を含む実施形態において、第１及び第２のＣＲＩＳＰＲ－ヌクレアーゼ複合体は、それぞれ第１及び第２のｃｒＲＮＡを含んでもよく、第１及び第２のｃｒＲＮＡは同一の配列を有しない。好ましくは、第１及び第２のｃｒＲＮＡは異なるプロトスペーサー配列を認識する。第１及び第２のＣＲＩＳＰＲ－ヌクレアーゼ複合体はしかしながら、同一の又はほぼ同一の配列を有するｔｒａｃｒＲＮＡを含んでもよい。

好ましくは、ｃｒＲＮＡ及びｔｒａｃｒＲＮＡは一緒になるように連結されてｓｇＲＮＡを形成する。ｃｒＲＮＡ及びｔｒａｃｒＲＮＡは、当技術分野において公知の任意の従来の方法を使用して連結され得る、好ましくは共有結合的に連結され得る。ｃｒＲＮＡ及びｔｒａｃｒＲＮＡの共有結合性連結は、例えばＪｉｎｅｋら（上掲）及び国際公開第１３／１７６７７２号（参照により本明細書に組み込まれる）に記載されている。ｃｒＲＮＡ及びｔｒａｃｒＲＮＡは、例えばリンカーヌクレオチドを使用して又はｃｒＲＮＡの３’末端とｔｒａｃｒＲＮＡの５’末端との直接的な共有結合性連結を介して、共有結合的に連結され得る。

好ましくは、ＣＲＩＳＰＲヌクレアーゼ複合体、又は複合体のガイドＲＮＡは、ＣＲＩＳＰＲ－ヌクレアーゼ複合体、又は複合体との核酸試料のインキュベーションで、核酸試料からの核酸分子内に含まれる標的核酸断片が前記核酸分子から切除されるように設計される。追加的に、好ましくは第１のガイドＲＮＡは、第１のＣＲＩＳＰＲ－ヌクレアーゼ複合体が核酸分子の切断後に標的核酸断片に結合したままとなるように設計される。追加的に好ましくは任意選択の第２のガイドＲＮＡは、第２のＣＲＩＳＰＲ－ヌクレアーゼ複合体が核酸分子の第２の切断後に標的核酸断片に結合したままとなるように設計される。

二本鎖核酸分子中に存在する場合の標的核酸断片は、少なくとも１つの非標的核酸断片により隣接され得る。二本鎖核酸分子中に存在する場合の標的核酸断片は、両側において非標的核酸断片に隣接されていてもよく、すなわち１つの非標的核酸断片が標的核酸断片の直接的に上流に存在してもよく、及び１つの非標的核酸断片が標的核酸断片の直接的に下流に存在してもよい。

本発明の方法のステップｂ）及びｄ）は、ＣＲＩＳＰＲ－ヌクレアーゼ複合体、又は複合体、及び核酸試料を一緒に、ＣＲＩＳＰＲ－ヌクレアーゼ複合体、又は複合体が二本鎖切断を誘導するために好適な条件及び時間、例えば、以下に限定されないが、本明細書において提供される実施例において詳述される条件においてインキュベートすることにより行われてもよい。任意選択で、インキュベーションは、約１分～約１８時間、好ましくは約６０分、約１０～９０℃、好ましくは約３７℃で行われる。

二本鎖切断を生成する部位特異的ヌクレアーゼがアルゴノートである場合、本明細書に詳述されている「ガイドＲＮＡ」という用語はガイド核酸に置き換えられてもよく、ガイド核酸は、好ましくは、低分子ＲＮＡ又は低分子ＤＮＡガイドのうちの少なくとも１つである。核酸アルゴノート複合体はそのため、好ましくはガイド核酸－アルゴノート複合体、好ましくはガイドＲＮＡ－アルゴノート複合体及びガイドＤＮＡ－アルゴノート複合体のうちの少なくとも１つである。

標的核酸断片の遊離３’末端の標識化－ステップｃ）及びｅ）
二本鎖核酸分子の切断は標的核酸断片の遊離３’末端を生成する。この遊離３’末端はその後に、１つ又は複数のヌクレオチドで標識又は「伸長」が可能であり、好ましくは標的核酸断片の３’末端を伸長するヌクレオチドは、予め決定された配列を有する。１つ又は複数のヌクレオチドでの標的核酸断片の３’末端の標識化のステップは、好ましくは、切断された二本鎖核酸分子を逆転写酵素及び鋳型ＲＮＡ分子と接触させることにより行われる。逆転写酵素は、核酸断片の遊離３’末端を伸長するための鋳型として鋳型ＲＮＡを使用し、それにより、鋳型ＲＮＡ分子に相補的な１つ又は複数のヌクレオチドを３’末端に付加する。換言すれば、逆転写酵素はそのため、鋳型ＲＮＡの部分を逆に転写する。

方法は、標的核酸断片をＤＮＡポリメラーゼ及び第２の鋳型分子と、好ましくは逆転写酵素及び第２の鋳型ＲＮＡ分子と接触させ、それにより、１つ又は複数のヌクレオチドで標的核酸断片の第２の鎖を遊離３’末端において標識するステップｅ）を含んでもよく、好ましくはステップｅ）はステップｃ）と同時に行われる。

好ましくは、ステップｄ）の第２の部位特異的ヌクレアーゼは、少なくとも本明細書においてさらに定義されているその後の標識化ステップの全体を通じて目的の配列を含む切断された核酸分子の部分に結合したままであるように設計されてもよい。好ましくは、ステップｄ）の部位特異的ヌクレアーゼは、少なくともステップｅ）の全体を通じて標的核酸断片に結合したままであるように設計される。好ましくは、部位特異的ヌクレアーゼは、標識されるべき部位に位置したままであるように設計される。

標識化ステップｃ）、及び任意選択でステップｅ）は、好ましくは、逆転写酵素が鋳型ＲＮＡ分子を逆転写できる実験条件下で、すなわち逆転写酵素が酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び／又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件は逆転写酵素の種類に依存し得る。実験条件は、以下の実験セクションに記載される条件と同じ又は類似したものであり得る。これらの実験条件は、好ましくは、少なくともヌクレオチド、好ましくは天然に存在するヌクレオチドの存在を含み、好ましくはこれらの実験条件は、ｄＮＴＰ、好ましくはアデニン、グアニン、シトシン及びチミジン及び任意選択でウラシルのうちの少なくとも１つの存在を含む。

本発明の方法はそのため、切断された標的核酸分子を逆転写酵素及び鋳型ＲＮＡ分子と接触させ、それにより、１つ又は複数のヌクレオチドで標的核酸断片の第１の鎖の遊離３’末端を標識するステップｃ）を含んでもよい。ステップｃ）と同時に又はステップｃ）の後に、方法は、標的核酸断片をＤＮＡポリメラーゼ及び第２の鋳型分子、好ましくは逆転写酵素及び第２の鋳型ＲＮＡ分子と接触させ、それにより、１つ又は複数のヌクレオチドで標的核酸断片の第２の鎖を遊離３’末端において標識するステップｅ）をさらに含んでもよい。好ましくは、前記ステップｅ）はステップｃ）と同時に行われる。第１及び第２の鎖の両方を標識することにより、標的核酸断片のいずれかの側において２つの標識を有する二本鎖断片が得られる。

ステップｃ）は好ましくはステップａ）の後及びステップｂ）の後に行われる。任意選択でステップｃ）はステップｄ）の後に行われる。ステップｅ）は好ましくはステップｄ）の後に行われる。そのため本発明の方法において、二本鎖核酸分子は、最初にすべての所望される（例えば１つ又は複数の）位置において切断されてもよく、続いて切断された分子をＲＮＡ鋳型分子及び逆転写酵素と接触させてもよい。代替的に、切断ステップ及び標識化ステップは交互の様式で行われてもよい。

本発明の方法はそのため、以下のステップの順序を含んでもよい：
ステップａ）、ｂ）及びｃ）
ステップａ）、ｂ）、ｃ）、及びｄ）
ステップａ）、ｂ）、ｃ）、ｄ）及びｅ）
ステップａ）、ｂ）、ｄ）ｃ）及びｅ）
ステップｂ）及びステップｃ）の接触は逐次的に及び同時に行われてもよい。換言すれば、ステップｂ）及びｃ）の反応成分は、反応混合物に逐次的に及び同時に加えられてもよいが、ステップｂ）の部位特異的ヌクレアーゼは遊離３’末端をステップｃ）の鋳型ＲＮＡが結合するために接近可能とするために役立ち得るので、部位特異的ヌクレアーゼは、好ましくは、本発明の方法のステップｃ）の全体を通じて存在し、標的断片に結合したままであるべきである。任意選択のステップｄ）は、後のステージにおいて別々に又はステップｂ）及びｃ）と同時に行われてもよい。

両方の側における標的断片の標識化の場合、本発明の方法はステップｄ）及びｅ）を含む。ステップｄ）及びステップｅ）の接触は逐次的に及び同時に行われてもよい。換言すれば、ステップｄ）及びｅ）の反応成分は反応混合物に逐次的に及び同時に加えられてもよいが、ステップｄ）の部位特異的ヌクレアーゼは遊離３’末端をステップｅ）の鋳型ＲＮＡが結合するために接近可能にするために役立ち得るので、前記複合体は、好ましくは、本発明の方法のステップｅ）の全体を通じて存在し、標的断片に結合したままであるべきである。

好ましい実施形態において、両方の側における標的断片の標識化の場合、ステップｂ）、ｃ）、ｄ）及びｅ）の反応成分はすべて反応混合物に同時に加えられてもよい。

二本鎖切断の生成及び標識化が同時に行われる場合、好ましくは前記反応容器内の実験条件は、部位特異的ヌクレアーゼによる切断及びＤＮＡポリメラーゼによる標識化の両方を可能とするようなものである。

本明細書に詳述されるように、本発明は、ステップｆ）及びｇ）のうちの少なくとも１つをさらに含んでもよく、並びに／又はステップ（ｉ）、（ｉｉ）及び（ｉｉｉ）のうちの少なくとも１つをさらに含んでもよい。

好ましくは、標的核酸断片の第１の鎖の遊離３’末端及び第２の鎖の遊離３’末端は、１つ又は複数のヌクレオチドの付加により伸長される。第１の鎖を伸長する１つ又は複数のヌクレオチドの配列は、標的核酸断片の第２の鎖を伸長するヌクレオチドの配列と同一又はほぼ同一であり得る。第１及び第２の鎖を伸長する１つ又は複数のヌクレオチドは、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％より高い又は１００％のヌクレオチド配列同一性を有してもよい。

好ましくは、第１の鎖を伸長する１つ又は複数のヌクレオチドの配列は、標的核酸断片の第２の鎖を伸長するヌクレオチドの配列とは異なる。好ましくは、第１及び第２の鎖を伸長する１つ又は複数のヌクレオチドは、９８％、９５％、９０％、８５％、８０％、７５％、７０％、６５％、６０％、５５％、５０％、４５％、４０％、３５％、３０％、２５％、２０％、１５％より低い又はさらには１０％より低いヌクレオチド配列同一性を有する。

第１の鎖の遊離３’末端を伸長するヌクレオチドの数は、標的核酸断片の第２の鎖の遊離３’末端を伸長するヌクレオチドの数と同一であり得る。代替的に、第１の鎖の遊離３’末端を伸長するヌクレオチドの数は、標的核酸断片の第２の鎖の遊離３’末端を伸長するヌクレオチドの数とは異なる。第１の鎖を伸長するヌクレオチドの数及び第２の鎖を伸長するヌクレオチドの数は、少なくとも約１、２、４、６、８、１０、２０個又はより多くのヌクレオチドだけ異なってもよい。

標的核酸断片の第１及び／又は第２の鎖を伸長する１つ又は複数のヌクレオチドの配列は、機能性ドメインを含んでもよく、該機能性ドメインは、好ましくは、制限部位ドメイン、捕捉ドメイン、シークエンシングプライマー結合部位、増幅プライマー結合部位、検出ドメイン、バーコード配列、転写プロモータードメイン及びＰＡＭ配列、又はこれらの任意の組合せからなる群から選択される。バーコードは、試料バーコード、アレル特異的識別物、座位特異的識別物又は固有分子識別物（ＵＭＩ）であり得るが、これらに限定されない。例えば特定の標的核酸の２つのアレルバリアントが試料中に存在する可能性があり、鋳型ＲＮＡ分子がそれらのうちの１つのみにアニールすることにより１つ又は複数の多型の間での識別が可能である場合、このＲＮＡ分子内の任意のバーコードはアレル特異的識別物として役立ち得る。

本発明の方法は、本明細書において定義されているステップｅ）を含んでもよく、該ステップｅ）において、結果としてもたらされた標的核酸断片は標的核酸断片のいずれかの側において標識される。第１の鎖の３’末端における標識（第１の標識）は機能性ドメインを含んでもよい。代替的に又は追加的に、第２の鎖の３’末端における標識（第２の標識）は機能性ドメインを含んでもよい。第１及び第２の標識中に位置する機能性ドメインは、同じ機能性ドメイン又は異なる機能性ドメインであってもよい。例えば、標的核酸断片の第１の鎖の３’末端における標識は第１のプライマー結合部位を含んでもよく、及び前記標的核酸断片の第２の鎖の３’末端における標識は第２のプライマー結合部位を含んでもよい。前記第１及び第２のプライマー結合部位は、それぞれ第１及び第２の増幅プライマーにアニールするため、並びに／又はそれぞれ第１及び第２のシークエンシングプライマーにアニールするための配列を含んでもよい。前記第１の（増幅及び／又はシークエンシング）プライマーはリバースプライマーとして指し示されてもよく、並びに前記第２の（増幅及び／又はシークエンシング）プライマーはフォワードプライマーとして指し示されてもよい。結果としてもたらされる二重標識された核酸断片の鎖のうちの少なくとも１つ、又は好ましくは両方は、増幅及び／又はシークエンシングのための鋳型分子として使用されてもよい。例えば第１及び第２の標識された鎖は２方向性シークエンシングのために使用されてもよい。

追加的に又は代替的に、標的核酸断片の第１の鎖の３’末端における標識は第１のバーコードを含んでもよく、及び前記標的核酸断片の第２の鎖における標識は第２のバーコードを含んでもよい。第１及び／又は第２のバーコードは任意選択で第１及び／又は第２のＵＭＩである。例えば国際公開第２０１１／１５５８３３号（参照により本明細書に組み込まれる）に記載されるように、これらの２つのバーコードは一緒になって、コンビナトリアルバーコード又はコンビナトリアル配列バーコードを形成してもよい。簡潔に述べれば、これらの２つのバーコードの組み合わせられた配列（すなわちコンビナトリアルバーコード又はコンビナトリアル配列バーコード）は識別物として使用される。任意選択で、これらの２つのバーコードの組み合わせられた配列は試料識別物として使用される。任意選択で、これらの２つのバーコードの組み合わせられた配列は、特定の標的核酸断片の識別物として使用される。

任意選択で、第１及び第２の標識のうちの少なくとも１つは、１つより多くのバーコード及び／又は１つより多くのＵＭＩを含む。

任意選択で、標的核酸断片の第１の鎖の３’末端における標識は第１のバーコード及び第１のプライマー結合部位を含んでもよく、並びに前記標的核酸断片の第２の鎖における標識は第２のバーコード及び第２のプライマー結合部位を含んでもよい。好ましくは、プライマー結合部位はシークエンシングプライマー結合部位である。２方向性シークエンシングのその後のステップの場合、標識された核酸断片の第１の一本鎖鋳型は、５’から３’方向に、目的の配列、第１のバーコード及び第１のシークエンシングプライマー結合部位を含んでもよい。標識された核酸断片の第２の一本鎖鋳型は、５’から３’方向に、目的の配列、第２のバーコード及び第２のシークエンシングプライマー結合部位を含んでもよい。第１及び第２のプライマー結合部位は、結果としてもたらされる標識された断片のバーコード及び目的の配列の両方が、独立したプライマー事象を使用して各々の一本鎖鋳型からシークエンシングされるように位置し、すなわちリバースプライマーは第１の鎖の第１のバーコード及び目的の配列をシークエンシングするために使用されてもよく、並びにフォワードプライマーは第２の鎖の第２のバーコード及び目的の配列をシークエンシングするために使用されてもよい。

標的核酸断片の第１の鎖の３’末端における標識は第１のバーコード及び第１の増幅プライマー結合部位を含んでもよく、並びに前記標的核酸断片の第２の鎖における標識は第２のバーコード及び第２の増幅プライマー結合部位を含んでもよい。任意選択で、標識はシークエンシングプライマー結合部位を含んでもよい。標識された核酸断片の第１の一本鎖鋳型は、５’から３’方向に、目的の配列、第１のバーコード、任意選択の第１のシークエンシングプライマー結合部位、及び増幅プライマー結合部位を含んでもよい。標識された核酸断片の任意選択の第２の一本鎖鋳型は、５’から３’方向に、目的の配列、第２のバーコード、任意選択の第２のシークエンシングプライマー結合部位、及び増幅プライマー結合部位を含んでもよい。好ましくは、プライマー結合部位は、標的核酸断片のバーコード及び配列の両方が、独立したプライマー事象を使用して増幅されるように位置し、すなわちリバースプライマーは第１の鎖の第１のバーコード及び目的の配列を増幅するために使用されてもよく、並びにフォワードプライマーは第２の鎖の第２のバーコード及び（相補的な）目的の配列を増幅するために使用されてもよい。

本明細書において指し示されている実施形態の標識された標的核酸断片を生成するために、ステップｃ）及び任意選択でステップｅ）の鋳型ＲＮＡ分子は、然るべく特異的に設計される。本発明の方法がハイスループットの方式において複数の試料に対して行われる場合、好ましくは各々の試料の各々の標的断片は、特定の試料バーコードを含む標識で標識され、その結果、下流の処理のために、異なる試料からの標識された標的断片は、一緒にプール及び処理が可能であると共に、シークエンシング後にそれぞれの配列はそのそれぞれの起源となる試料に割り当てられ得る。そのような試料バーコードに追加的に又は代替的に、標識は、特定の標的断片の同定のためのＵＭＩ及び／又はバーコードをさらに含んでもよい。

逆転写酵素（ＲＴ）
第１及び／又は第２の鎖の遊離３’末端を標識するタンパク質は、二本鎖ＤＮＡ分子の３’末端を伸長することが可能である任意の組換えタンパク質であってもよい。好ましくは、そのようなタンパク質はＤＮＡポリメラーゼである。

ポリメラーゼは、野生型ポリメラーゼ、機能性断片、突然変異体、バリアント、及び切断されたバリアントなどであってもよい。ポリメラーゼは、真核、原核、古細菌、若しくはウイルス生物からの野生型ポリメラーゼを含んでもよく、並びに／又はポリメラーゼは、遺伝子操作、突然変異誘発及び定向進化ベースの方法のうちの少なくとも１つにより改変されていてもよい。

ＤＮＡポリメラーゼは、ＤＮＡ依存性及び／又はＲＮＡ依存性ＤＮＡポリメラーゼであってもよい。本発明は任意の特定のＲＮＡ依存性ＤＮＡポリメラーゼ又は任意の特定のＤＮＡ依存性ＤＮＡポリメラーゼに限定されないことを当業者は理解する。本明細書において定義されている「ＲＮＡ依存性ＤＮＡポリメラーゼ」又は「逆転写酵素」という用語は、「逆転写酵素」という用語が意図されることがその文脈から明確である場合を除いて、「ＤＮＡ依存性ＤＮＡポリメラーゼ」という用語に置き換えられ得る。同様に「鋳型ＲＮＡ分子」という用語は、ＤＮＡ依存性ＤＮＡポリメラーゼと組み合わせて使用される場合に、「鋳型ＤＮＡ分子」に置き換えられ得る。

任意選択でステップｃ）及び／又はステップｅ）において２、３、４個又はより多くのＤＮＡポリメラーゼの組合せが使用され得る。

ポリメラーゼは、好ましくは、「鋳型依存性」ポリメラーゼ（すなわち、鋳型鎖のヌクレオチド塩基の順序に基づいてヌクレオチド鎖を合成するポリメラーゼ）である。ＤＮＡポリメラーゼはＤＮＡ依存性ＤＮＡポリメラーゼであってもよい。好ましいＤＮＡ依存性ＤＮＡポリメラーゼは鎖置換活性を含まない。鎖置換活性を欠いたＤＮＡポリメラーゼは、第１及び／又は第２の鎖の３’末端を標識し得るが、提供される鋳型ＤＮＡ分子を伸長することはできないか、又は実質的にできない。ＤＮＡ依存性ＤＮＡポリメラーゼは鎖置換活性を天然に欠いていてもよいか、又は鎖置換活性を欠くように改変されてもよい。鎖置換活性を欠いた好ましいＤＮＡ依存性ＤＮＡポリメラーゼは、Ｔ４、Ｔ７及びＴａｑＤＮＡポリメラーゼのうちの少なくとも１つである。

ポリメラーゼは、Ｔ７ＤＮＡポリメラーゼ、Ｔ５ＤＮＡポリメラーゼ、Ｔ４ＤＮＡポリメラーゼ、Ｋｌｅｎｏｗ断片ＤＮＡポリメラーゼ、及びＤＮＡポリメラーゼＩＩＩなどのうちの少なくとも１つを含んでもよい。ポリメラーゼは熱安定性であってもよく、並びに／又はＴａｑ、Ｔｎｅ、Ｔｍａ、Ｐｆｕ、Ｔｆｌ、Ｔｔｈ、Ｓｔｏｆｆｅｌ断片、ＶＥＮＴ（登録商標）及びＤＥＥＰＶＥＮＴ（登録商標）ＤＮＡポリメラーゼ、ＫＯＤ、Ｔｇｏ、ＪＤＥ３、並びにこれらの突然変異体、バリアント及び誘導体を含んでもよい（例えば米国特許第５，４３６，１４９号；米国特許第４，８８９，８１８号；米国特許第４，９６５，１８５号；米国特許第５，０７９，３５２号；米国特許第５，６１４，３６５号；米国特許第５，３７４，５５３号；米国特許第５，２７０，１７９号；米国特許第５，０４７，３４２号；米国特許第５，５１２，４６２号；国際公開第９２／０６１８８号；国際公開第９２／０６２００号；国際公開第９６／１０６４０号；Ｂａｒｎｅｓ，Ｗ．Ｍ．、Ｇｅｎｅ１１２：２９～３５頁（１９９２）；Ｌａｗｙｅｒ，Ｅ．Ｃ．ら、ＰＧＲＭｅｔｈ．Ａｐｐｌ．２：２７５～２８７頁（１９９３）；Ｅｌａｍａｎ，Ｊ．－Ｍら、Ｎｕｃ．ＡｃｉｄｓＲｅｓ．２２（１５）：３２５９～３２６０頁（１９９４）を参照；これらの各々は参照により組み込まれる）。

任意選択で、ＤＮＡポリメラーゼは３’エキソヌクレアーゼ活性を欠いている。ＤＮＡポリメラーゼはバクテリオファージからのものであり得る。バクテリオファージＤＮＡポリメラーゼは一般に５’→３’エキソヌクレアーゼ活性を欠いているが、これはこの活性が別々のポリペプチドによりコードされるためである。好適なＤＮＡポリメラーゼの例は、Ｔ４、Ｔ７、及びｐｈｉ２９ＤＮＡポリメラーゼである。

代替的に又は追加的に、ＤＮＡポリメラーゼは古細菌ポリメラーゼである。古細菌において同定されている２つの異なるクラスのＤＮＡポリメラーゼがある：１．ファミリーＢ／ｐｏｌＩ型（パイロコッカス・フリオサス（Ｐｙｒｏｃｏｃｃｕｓｆｕｒｉｏｓｕｓ）からのＰｆｕのホモログ）及び２．ｐｏｌＩＩ型（Ｐ．フリオサスＤＰ１／ＤＰ２２サブユニットポリメラーゼのホモログ）。両方のクラスからのＤＮＡポリメラーゼは、関連付けられる５’→３’エキソヌクレアーゼ活性を天然に欠いていること及び３’→５’エキソヌクレアーゼ（プルーフリーディング）活性を有することが示されている。好適なＤＮＡポリメラーゼ（ｐｏｌＩ又はｐｏｌＩＩ）は、所望されるアッセイ温度に類似した最適増殖温度を有する古細菌に由来することができる。

熱安定性古細菌ＤＮＡポリメラーゼは、パイロコッカス（Ｐｙｒｏｃｏｃｃｕｓ）種（フリオサス（ｆｕｒｉｏｓｕｓ）、種ＧＢ－Ｄ、オエシー（ｗｏｅｓｉｉ）、アビシー（ａｂｙｓｉｉ）、ホリコシー（ｈｏｒｉｋｏｓｈｉｉ））；サーモコッカス（Ｔｈｅｒｍｏｃｏｃｃｕｓ）種（コダカラエンシス（ｋｏｄａｋａｒａｅｎｓｉｓ）ＫＯＤｌ、リトラリス（ｌｉｔｏｒａｌｉｓ）、種９ｄｅｇｒｅｅｓＮｏｒｔｈ－７、種ＪＤＥ－３、ゴルゴナリウス（ｇｏｒｇｏｎａｒｉｕｓ））、パイロディクティウム・オカルタム（Ｐｙｒｏｄｉｃｔｉｕｍｏｃｃｕｌｔｕｍ）、及びアーケオグロブス・フルギダス（Ａｒｃｈａｅｏｇｌｏｂｕｓｆｕｌｇｉｄｕｓ）から単離され得る。

ＤＮＡポリメラーゼは真正細菌種から得られてもよい。３つのクラスの真正細菌ＤＮＡポリメラーゼ、ｐｏｌＩ、ＩＩ、及びＩＩＩがある。ＰｏｌＩＤＮＡポリメラーゼファミリーの酵素は５’→３’エキソヌクレアーゼ活性を有し、ある特定のメンバーはまた３’→５’エキソヌクレアーゼ活性を呈する。ＰｏｌＩＩＤＮＡポリメラーゼは５’→３’エキソヌクレアーゼ活性を天然に欠いているが、３’→５’エキソヌクレアーゼ活性を呈する。ＰｏｌＩＩＩＤＮＡポリメラーゼは、細胞の主要な複製性ＤＮＡポリメラーゼであり、複数のサブユニットから構成される。ｐｏｌＩＩＩ触媒サブユニットは５’→３’エキソヌクレアーゼ活性を欠いているが、一部の場合において、３’→５’エキソヌクレアーゼ活性が同じポリペプチド中に位置する。

様々な商業的に入手可能なＰｏｌＩＤＮＡポリメラーゼがあり、その一部は、５’→３’エキソヌクレアーゼ活性を低減又は消失させるために改変されている。

好適な熱安定性ｐｏｌＩＤＮＡポリメラーゼは、サーマス（Ｔｈｅｒｍｕｓ）種及びサーモトガ・マリティマ（Ｔｈｅｒｍｏｔｏｇａｍａｒｉｔｉｍａ）、例えばサーマス・アクアティカス（Ｔｈｅｒｍｕｓａｑｕａｔｉｃｕｓ）（Ｔａｑ）、サーマス・サーモフィラス（Ｔｈｅｒｍｕｓｔｈｅｒｍｏｐｈｉｌｕｓ）（Ｔｔｈ）及びサーモトガ・マリティマ（Ｔｈｅｒｍｏｔｏｇａｍａｒｉｔｉｍａ）（ＴｍａＵｌＴｍａ）を含む、様々な好熱性真正細菌から単離され得る。

好ましいＤＮＡ依存性ＤＮＡポリメラーゼは原核性又は真核性ＤＮＡ依存性ＤＮＡポリメラーゼであってもよい。好ましい原核性ＤＮＡ依存性ＤＮＡポリメラーゼは、ＰｏｌＩ、ＰｏｌＩＩ及びＰｏｌＩＩＩからなる群から選択される。好ましい真核性ＤＮＡ依存性ＤＮＡポリメラーゼは、Ｐｏｌａ、Ｐｏｌｂ、Ｐｏｌｇ、Ｐｏｌｄ、Ｐｏｌｅ、及びＰｏｌｚからなる群から選択される。

好ましくは、ＤＮＡポリメラーゼはＲＮＡ依存性ＤＮＡポリメラーゼ又は「逆転写酵素」である。本発明は、任意の種類の特有の逆転写酵素（ＲＴ）に限定されない。特に、逆転写酵素は、二本鎖ＤＮＡ分子の３’末端を伸長することが可能である任意の天然に存在する又は組換えタンパク質であってもよい。逆転写酵素は、好ましくは、鋳型ＲＮＡを使用してヌクレオチドの特有の配列を分子の３’末端に付加する、すなわちＲＮＡ依存性ＤＮＡポリメラーゼである。逆転写酵素は、例えばＢａｒａｎａｕｓｋａｓら（ＰｒｏｔｅｉｎＥｎｇＤｅｓＳｅｌ、２０１２；２５（１０）：６５７～６８頁）；ＡｒｅｚｉＢ及びＨｏｇｒｅｆｅＨ（ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ、２００９；３７（２）：４７３～８１頁）に記載されている、増加した忠実性、熱安定性、処理能力及びＤＮＡ－ＲＮＡ基質親和性のうちの少なくとも１つを有するように改変された天然に存在するタンパク質、並びに／又は、例えばＫｏｔｅｗｉｃｚら（ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ、１９８８；１６（１）：２６５～２７７頁）に記載されている、リボヌクレアーゼＨ活性を欠いた逆転写酵素であってもよい。本発明における使用のための逆転写酵素は中温性又は好熱性であってもよい。

本発明の方法における使用のための逆転写酵素は、ウイルス、好ましくはレトロウイルスに由来してもよい。逆転写酵素は、ＳｕｐｅｒｓｃｒｉｐｔＩＩ逆転写酵素、Ｍａｘｉｍａ逆転写酵素、ＰｒｏｔｏｓｃｒｉｐｔＩＩ逆転写酵素、モロニーマウス白血病ウイルス逆転写酵素（ＭＭＬＶ－ＲＴ）、ＨｉｇｈＳｃｒｉｂｅｒ逆転写酵素、トリ骨髄芽球症ウイルス（ＡＭＶ）逆転写酵素、ヒト免疫不全ウイルス１型逆転写酵素、ヒトＴ細胞白血病ウイルス１型逆転写酵素（ＨＴＬＶ－１－ＲＴ）、ウシ白血病ウイルス逆転写酵素（ＢＬＶ－ＲＴ）及びラウス肉腫ウイルス逆転写酵素（ＲＳＶ－ＲＴ）からなる群から選択されてもよい。好ましくは、逆転写酵素は、Ｍ－ＭＬＶＲＴ（モロニーマウス白血病ウイルスに由来する）、ＨＩＶ－１ＲＴ（ヒト免疫不全ウイルス１型に由来する）、ＡＭＶＲＴ（トリ骨髄芽球症ウイルスに由来する）、これらのバリアント、及びこれらの操作されたバージョンからなる群から選択される。逆転写酵素は、１つ又は複数の点突然変異を有するＭＭＬＶ－ＲＴであってもよい。好ましいＭＭＬＶ－ＲＴ点突然変異は、例えばＡｎｚａｌｏｎｅら（上掲）に記載されている、Ｄ２００Ｎ、Ｌ６０３Ｗ、Ｔ３３０Ｐ、Ｔ３０６Ｋ及びＷ３１３Ｆからなる群から選択されてもよい。

任意選択で、逆転写酵素は、サッカロミセス（Ｓａｃｃｈａｒｏｍｙｃｅｓ）を含む、酵母、ニューロスポラ（Ｎｅｕｒｏｓｐｏｒａ）、ドロソフィラ（Ｄｒｏｓｏｐｈｉｌａ）；霊長動物；及び齧歯動物から得ることが可能である。例えば、Ｗｅｉｓｓら、米国特許第４，６６３，２９０号（１９８７）；Ｇｅｒａｒｄ，Ｇ．Ｒ．、ＤＮＡ：２７１～７９頁（１９８６）；Ｋｏｔｅｗｉｃｚ，Ｍ．Ｌ．ら、Ｇｅｎｅ３５：２４９～５８頁（１９８５）；Ｔａｎｅｓｅ，Ｎ．ら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．（ＵＳＡ）：４９４４～４８頁（１９８５）；Ｒｏｔｈ，Ｍ．Ｊ．ら、Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２６０：９３２６～３５頁（１９８５）；Ｍｉｃｈｅｌ，Ｆ．ら、Ｎａｔｕｒｅ３１６：６４１～４３頁（１９８５）；Ａｋｉｎｓ，Ｒ．Ａ．ら、Ｃｅｌｌ４７：５０５～１６頁（１９８６）、ＥＭＢＯＪ．４：１２６７～７５頁（１９８５）；及びＦａｗｃｅｔｔ，Ｄ．Ｆ．、Ｃｅｌｌ４７：１００７～１５頁（１９８６）（これらの各々は参照により本明細書に全体が組み込まれる）を参照。

本発明における使用のための例示的な逆転写酵素は、以下を含むが、これらに限定されない：モロニーマウス白血病ウイルス（Ｍ－ＭＬＶ）；ヒト免疫不全ウイルス（ＨＩＶ）逆転写酵素、及び、ラウス肉腫ウイルス（ＲＳＶ）逆転写酵素を含むがこれに限定されない、トリ肉腫－白血症ウイルス（ＡＳＬＶ）逆転写酵素。トリ骨髄芽球症ウイルス（ＡＭＶ）逆転写酵素、トリ赤芽球症ウイルス（ＡＥＶ）、ヘルパーウイルスＭＣＡＶ逆転写酵素、トリ骨髄球腫症ウイルスＭＣ２９ヘルパーウイルスＭＣＡＶ逆転写酵素。トリ細網内皮症ウイルス（ＲＥＶ－Ｔ）ヘルパーウイルスＲＥＶ－Ａ逆転写酵素、トリ肉腫ＶｉｍｓＵＲ２ヘルパーウイルスＵＲ２ＡＶ逆転写酵素。トリ肉腫ウイルスＹ７３ヘルパーウイルスＹＡＶ逆転写酵素、ラウス関連ウイルス（ＲＡＶ）逆転写酵素、骨髄芽球症関連ウイルス（ＭＡＶ）逆転写酵素、ネコ白血病ウイルス逆転写酵素、カリフラワーモザイクウイルス逆転写酵素、クレブシエラ（Ｋｌｅｂｓｉｅｌｌａ）肺炎逆転写酵素、エシェリヒア・コリ（ＥｓｃｈｅｒｉｃｈｉａＣｏｌｉ）逆転写酵素、バシラス・サブチリス（ＢａｃｉｌｌｕｓＳｕｂｔｉｌｉｓ）逆転写酵素、ユーバクテリウム・レクタレ（ＥｕｂａｃｔｅｒｉｕｍＲｅｃｔａｌｅ）逆転写酵素及びゲオバチラス・ステアロサーモフィラス（Ｇｅｏｂａｃｉｌｌｕｓｓｔｅａｒｏｔｈｅｒｍｏｐｈｉｌｕｓ）逆転写酵素。

逆転写酵素は、野生型逆転写酵素のバリアントであってもよく、これは好ましくは、１つ又は複数の酵素活性（例えば、ＲＮＡ依存性ＤＮＡポリメラーゼ活性、ＲＮａｓｅＨ活性、若しくはＤＮＡ／ＲＮＡハイブリッド結合活性）及び／又は酵素特性（例えば、熱安定性、処理能力、若しくは忠実性）に影響するか又はそれを変化させる突然変異を含む。追加的に又は代替的に、逆転写酵素（ＲＴ）は、ＲＴをほぼ安定にする、凝集（ａｇｇｒｅｇｒａｔｉｏｎ）する傾向をより低くする、並びに／又は精製及び／若しくは検出、及び／若しくは他の特性若しくは特徴の改変を促す１つ又は複数の突然変異を含んでもよい。

好ましくは逆転写酵素は高い忠実性を有し、好ましくは、合成される１５，０００個のヌクレオチド中で１個未満のエラーであるエラー率を有する。

方法における使用のためのＣＲＩＳＰＲ－ヌクレアーゼ、好ましくは本明細書において定義されているＣＲＩＳＰＲ－ヌクレアーゼ、及び逆転写酵素、好ましくは本明細書において定義されている逆転写酵素は別々の実体であってもよい、すなわち別々のタンパク質であることが本明細書において理解される。代替的に、本発明の方法において使用されるＣＲＩＳＰＲ－ヌクレアーゼ及び逆転写酵素、好ましくは本明細書において定義されているＣＲＩＳＰＲヌクレアーゼ及び／又は逆転写酵素は、融合して一緒になっている、すなわち融合タンパク質を構成する。好ましくは、逆転写酵素は、好ましくはＣＲＩＳＰＲヌクレアーゼと逆転写酵素との間のリンカー、好ましくは柔軟性リンカーを使用して、ＣＲＩＳＰＲ－ヌクレアーゼのＣ末端に融合している。

鋳型ＲＮＡ分子
鋳型ＲＮＡ分子は、逆転写酵素が標的核酸断片の遊離３’末端を標識することを可能にする任意のＲＮＡ分子であり得る。この目的のために、鋳型ＲＮＡ分子は、逆転写酵素を標的核酸断片の遊離３’末端に方向付けてもよく、好ましくは遊離３’末端への追加のヌクレオチドの付加のための鋳型として機能する。

鋳型ＲＮＡ分子のサイズは様々であり得、標的核酸断片の３’末端に付加されるヌクレオチドの数に依存し得る。鋳型ＲＮＡ分子のサイズは、好ましくは、約５～５００ｎｔ、１０～２５０ｎｔ、１５～２００ｎｔ、２０～１５０ｎｔ、２５～１００ｎｔ、又は約３０～５０ｎｔである。鋳型ＲＮＡ分子のサイズは、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０個又はより多くのヌクレオチドであり得る。

本発明の方法における使用のための鋳型ＲＮＡは好ましくは結合ドメイン及び鋳型ドメインを含む。鋳型ＲＮＡ分子は、結合ドメイン及び鋳型ドメインからなるものであってもよい。好ましくは、結合ドメインは鋳型ＲＮＡ分子の３’末端に位置し、及び鋳型ドメインは鋳型ＲＮＡ分子の５’末端に位置する。

結合ドメインは二本鎖核酸分子に結合又は「ハイブリダイズ」し、逆転写酵素を標的核酸断片の遊離３’末端に方向付けることができる。結合ドメインのサイズは、鋳型ドメインのサイズに等しいか、又は実質的に等しいものであり得る。鋳型ＲＮＡの結合ドメインは、好ましくは、鋳型ＲＮＡを二本鎖核酸分子にハイブリダイズさせるために十分な数のヌクレオチドを含む。結合ドメインのサイズは、好ましくは、約５～２００ｎｔ、８～１００ｎｔ、１０～５０ｎｔ、１２～５０ｎｔ、１４～３０ｎｔ、又は約１５～２０ｎｔである。鋳型ＲＮＡ分子の結合ドメインのサイズは、好ましくは、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５個又はより多くのヌクレオチドである。鋳型ＲＮＡ分子の結合ドメインは、好ましくは、標的核酸断片の第１又は第２の鎖の３’末端における配列にアニールできる配列を含む。それゆえ、結合ドメインのヌクレオチド配列は好ましくは標的核酸断片中の配列に相補的である。ヌクレオチド配列は、好ましくは、標的核酸断片の遊離３’末端の上流に位置する、好ましくはすぐ上流に位置する配列に相補的である。好ましくは、結合ドメインのヌクレオチド配列は、標的核酸の遊離３’末端の上流に位置する、好ましくはすぐ上流に位置する配列に少なくとも６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％又は１００％相補的である。換言すれば、標的核酸断片の第１の鎖の遊離３’末端を標識するために使用される鋳型ＲＮＡ分子の結合ドメインは、好ましくは、標的核酸断片の第２の鎖の生成される５’末端のすぐ３’に位置する配列と少なくとも６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％又は１００％の配列同一性を有する配列を含む。代替的に又は追加的に、標的核酸断片の第２の鎖の遊離３’末端を標識するために使用される鋳型ＲＮＡ分子の結合ドメインは、好ましくは、標的核酸断片の第１の鎖の生成される５’末端のすぐ３’に位置する配列と少なくとも６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％又は１００％の配列同一性を有する配列を含む。標的ＲＮＡ分子の結合ドメインのヌクレオチド配列は、ｃｒＲＮＡ中の配列に部分的に又は完全に相補的な配列を含んでもよい。結合ドメインは、本明細書において定義されているＣＲＩＳＰＲ－ヌクレアーゼ複合体をガイドするために使用されるｃｒＲＮＡの配列に部分的に又は全体的に相補的な約１０、１１、１２、１３、１４、１５、１６、１７、１８、１９又は２０個のヌクレオチドの配列を含んでもよい。鋳型ＲＮＡの結合ドメインにより結合又は「標的化」され得る配列は、二本鎖核酸分子中に１回存在してもよい。代替的に、配列は、少なくとも２、３、４、５、１０回又はより多くの回数存在してもよい。

結合ドメインに加えて、鋳型ＲＮＡ分子はまた、好ましくは、結合ドメインに隣接する、好ましくは直接的に隣接する鋳型ドメインを含む。鋳型ドメインは、逆転写酵素のための鋳型として機能することにより標的核酸断片の遊離３’末端における１つ又は複数のヌクレオチドの付加を補助する。鋳型ドメインの配列は、そのため、標的核酸断片の遊離３’末端に付加されるヌクレオチドの配列及び数を決定する。新たに付加されるヌクレオチドの配列は、鋳型ドメインの配列の逆相補体であってもよい。鋳型ドメインのサイズは、好ましくは、約１～２００ｎｔ、５～１００ｎｔ、１０～５０ｎｔ、１２～４０ｎｔ、１４～３０ｎｔ、又は約１５～２０ｎｔである。鋳型ＲＮＡ分子の鋳型ドメインのサイズは、好ましくは、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５個又はより多くのヌクレオチドである。ＲＮＡ分子の鋳型ドメインは、好ましくはシークエンシングプライマー結合部位、増幅プライマー結合部位、バーコード及びＵＭＩ、又はこれらの組合せからなる群から選択される、機能性ドメインを含むか又はからなるものであってもよい。鋳型ドメインはシークエンシングプライマー結合部位及びバーコードを含んでもよい。代替的に又は追加的に、鋳型ドメインは、バーコード及びＵＭＩのうちの少なくとも１つに加えて、増幅プライマー結合部位及びシークエンシングプライマー結合部位のうちの少なくとも１つを含んでもよい。好ましくは（増幅及び／又はシークエンシング）プライマー結合部位は、鋳型ＲＮＡの鋳型ドメイン中のバーコードの５’に位置する。好ましくは（増幅及び／又はシークエンシング）プライマー結合部位は、鋳型ＲＮＡの鋳型ドメイン中のＵＭＩの５’に位置する。好ましくは、鋳型ドメインは、５’から３’方向に、増幅プライマー結合部位、シークエンシングプライマー結合部位並びにバーコード及び／又はＵＭＩを含む。

鋳型ＲＮＡは、５’から３’方向に以下の順序のエレメント：（増幅及び／又はシークエンシング）プライマー結合部位、バーコード、並びに結合ドメインを含んでもよく、プライマー結合部位及びバーコードは鋳型ドメイン中に含まれる。

代替的に又は追加的に、鋳型ＲＮＡは、５’から３’方向に以下の順序のエレメント：（増幅及び／又はシークエンシング）プライマー結合部位、ＵＭＩ、並びに結合ドメインを含んでもよく、プライマー結合部位及びＵＭＩは鋳型ドメイン中に含まれる。

鋳型ＲＮＡ分子及びガイドＲＮＡは別々の実体であってもよい。好ましくは、鋳型ＲＮＡ及びｃｒＲＮＡ、及び任意選択でｔｒａｃｒＲＮＡは別々のＲＮＡ分子である。非限定的な例として、核酸分子を含む複数の試料がステップａ）において提供され、ステップｂ）において、同じガイドＲＮＡを使用することにより二本鎖切断が各々の核酸分子中の同じ位置において生成される。ステップｄ）において複数の試料はその後に複数の鋳型ＲＮＡ分子により接触されてもよく、例えば各々の鋳型ＲＮＡ分子は各々の核酸分子の遊離３’末端において独特の標識を生成する。

代替的に、鋳型ＲＮＡ分子及びガイドＲＮＡ分子は共有結合しており、すなわち単一のＲＮＡ分子を形成する。好ましくは、鋳型ＲＮＡ分子はＲＮＡ分子の３’末端に位置し、及びガイドＲＮＡはＲＮＡ分子の５’末端に位置する。鋳型ＲＮＡは、単一の分子中のガイドＲＮＡに直接的に隣接して位置してもよい。代替的に、鋳型ＲＮＡは、１つ又は複数の、天然に存在する又は天然に存在しない、ヌクレオチドによりガイドＲＮＡから分離されていてもよい。

任意選択で、複数の試料は、好ましくは別々の反応容器中で、ステップａ）～ｅ）において並列で処理される。

ＲＮＡ分子の化学修飾
本発明の方法において使用されるＲＮＡ分子は、ガイドＲＮＡ及び鋳型ＲＮＡのうちの少なくとも１つを含む。ガイドＲＮＡは、ｓｇＲＮＡ、ｃｒＲＮＡ及びｔｒａｃｒＲＮＡのうちの少なくとも１つを含んでもよい。鋳型ＲＮＡはガイドＲＮＡに融合していてもよい。

本発明の方法において使用されるＲＮＡ分子のうちの少なくとも１つは、修飾されていない又は天然に存在するヌクレオチドを含むか又はからなるものであってもよい。任意選択で、本発明の方法において使用されるすべてのＲＮＡ分子は、修飾されていない又は天然に存在するヌクレオチドを含むか又はからなるものであってもよい。

代替的に又は追加的に、本発明の方法において使用されるＲＮＡ分子のうちの少なくとも１つは、修飾された又は天然に存在しないヌクレオチドを含むか又はからなるものであってもよい。任意選択で、本発明の方法において使用されるすべてのＲＮＡ分子は、修飾された又は天然に存在しないヌクレオチドを含むか又はからなるものであってもよい。そのような化学的に修飾されたヌクレオチドは、好ましくは、ＲＮＡ分子、又は分子を分解から保護する。任意選択で、ＲＮＡ分子のうちの少なくとも１つは、すなわち少なくともガイドＲＮＡ及び鋳型ＲＮＡのうちの少なくとも１つは、リボヌクレオチド及び非リボヌクレオチドを含む。ＲＮＡ分子のうちの少なくとも１つは、１つ又は複数のリボヌクレオチド及び１つ又は複数のデオキシリボヌクレオチドを含んでもよい。

任意選択で、ＲＮＡ分子のうちの少なくとも１つは、すなわち少なくともガイドＲＮＡ及び鋳型ＲＮＡのうちの少なくとも１つは、１つ又は複数の天然に存在しないヌクレオチド又はヌクレオチドアナログ、例えばホスホロチオエート連結を有するヌクレオチド、リボース環の２’炭素と４’炭素との間にメチレンブリッジを含むロックド核酸（ＬＮＡ）ヌクレオチド、ブリッジド核酸（ＢＮＡ）、２’－Ｏ－メチルアナログ、２’－デオキシアナログ、２’－フルオロアナログ又はこれらの組合せを含む。修飾されたヌクレオチドは、２－アミノプリン、５－ブロモ－ウリジン、シュードウリジン、イノシン、及び７－メチルグアノシンからなる群から選択されるが、これらに限定されない、修飾された塩基を含んでもよい。

ＲＮＡ分子のうちの少なくとも１つ、すなわちガイドＲＮＡ及び鋳型ＲＮＡのうちの少なくとも１つは、１つ又は複数の末端ヌクレオチドにおける２’－Ｏ－メチル（Ｍ）、２’－Ｏ－メチル３’ホスホロチオエート（ＭＳ）、２’－Ｏ－メチル３’チオＰＡＣＥ（ホスホノアセテート）（ＭＳＰ）、又はこれらの組合せの組込みにより化学的に修飾されていてもよい。そのような化学的に修飾されたＲＮＡは、非修飾のＲＮＡと比較して増加した安定性及び／又は増加した活性を含むことができる。（Ｈｅｎｄｅｌら、２０１５、ＮａｔＢｉｏｔｅｃｈｎｏｌ．３３（９）；９８５～９８９頁）。本発明の一実施形態において、デオキシリボヌクレオチド及び／又はヌクレオチドアナログは、操作されたＲＮＡ構造中に組み込まれ得る。

一実施形態において、第１の及び任意選択で第２の標識された鎖は、前記標識（複数可）がさらなる処理、例えば増幅及び／又はシークエンシングのために要求される機能性ドメイン、例えば増幅及び／又はシークエンシングプライマー結合部位を含む場合にそのようなさらなる処理、例えば増幅及び／又はシークエンシングのための鋳型（複数可）として直接的に役立ち得る。別の実施形態において、前記第１の及び任意選択で第２の標識された鎖は、以下において本明細書にさらに指し示されているさらなる処理、例えば増幅及び／又はシークエンシングのためにそのような機能性ドメインを導入するために最初に伸長及び／又はアニールされる。任意選択の実施形態において、標識された鎖は、機能的なエレメント、例えばＵＭＩ及び／又は（試料）バーコードを含む１つ又は複数のテイルドプライマーを使用して増幅される。追加的に又は代替的に、前記１つ又は複数のテイルドプライマーは、結果としてもたらされる（バーコード付加された）アンプリコンをシークエンシングするために１つ又は複数のシークエンシングプライマー結合部位を含んでもよい。

オリゴヌクレオチドのアニーリング－ステップｆ）
本発明の方法は、生成された標識をさらに伸長するステップを含んでもよい。そのような伸長は、そのため、標的核酸断片に取り付けられた標識のサイズをさらに増加させてもよい。好ましくは、このさらなる伸長ステップは、本明細書に詳述されているステップｃ）及び／又はステップｅ）において生成された標識を使用する。
このステップは任意の特定の方法に限定されず、当業者は、標的核酸断片をさらに伸長する任意の従来の方法を使用することができる。好ましくは、このさらなる伸長ステップは、
ｉ）標的核酸断片を増幅することであって、増幅プライマーのうちの少なくとも１つが、生成された標識に少なくとも部分的にアニールする、増幅すること；及び
ｉｉ）標的核酸断片の鎖の標識された３’末端にオリゴヌクレオチドをアニールすること
のうちの少なくとも１つを含んでもよい。

標的核酸断片をさらに伸長する前に、ＲＮＡ分子、例えば鋳型ＲＮＡ及び／又はガイドＲＮＡは分解されてもよい。そのため標的核酸断片の標識をさらに伸長する前に、鋳型ＲＮＡ及びガイドＲＮＡのうちの少なくとも１つは分解されてもよい。本発明は任意の特定のＲＮＡ分解ステップに限定されず、当業者は、ＲＮＡを分解するために任意の従来の手段を使用することができる。ＲＮＡは、好ましくは、リボヌクレアーゼ（ＲＮＡｓｅ）、好ましくはエンドヌクレアーゼ、以下に限定されないが例えばＲＮＡｓｅＨを使用して分解される。好ましくは、ＲＮＡはＲＮＡｓｅＨを使用して分解される。ＲＮＡ分解は、好ましくは、ＲＮＡｓｅがガイドＲＮＡ及び鋳型ＲＮＡのうちの少なくとも１つを分解することが可能である実験条件下で、すなわちＲＮＡｓｅが酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び／又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件はＲＮＡｓｅの種類に依存し得る。実験条件は、以下の実験セクションに記載される条件と同じ又は類似したものであり得る。

核酸断片の増幅のためのプライマーは、標識の少なくとも部分にのみハイブリダイズし得るか、又はプライマーのうちの少なくとも１つは、標識の少なくとも部分及び標的核酸断片の１つ若しくは複数のヌクレオチドの両方にハイブリダイズし得る。それゆえ、プライマーのうちの少なくとも１つは選択的な増幅のために使用されてもよい。

任意選択で、増幅プライマーのうちの少なくとも１つは、好ましくは制限部位ドメイン、捕捉ドメイン、シークエンシングプライマー結合部位、増幅プライマー結合部位、検出ドメイン、バーコード配列、転写プロモータードメイン及びＰＡＭ配列、又はこれらの任意の組合せからなる群から選択される、機能性ドメインを含んでもよい。バーコードは試料バーコードであり得るが、これに限定されない。

標識は、第１のオリゴヌクレオチドを、標的核酸断片の第１の鎖の標識された３’末端にアニールすることによりステップｆ）において伸長されてもよい。オリゴヌクレオチドは、好ましくは、標的核酸断片の第１の鎖の標識された３’末端に特異的にハイブリダイズする。ステップｆ）は、第２の鎖の標識された３’末端に第２のオリゴヌクレオチドをアニールすることをさらに含んでもよい。例えば第１の鎖の３’末端における標識の配列が第２の鎖の３’末端における標識のヌクレオチド配列に同一、又はほぼ同一である場合に、同じオリゴヌクレオチドは、第１の鎖の３’末端における標識及び第２の鎖の３’末端における標識の両方にアニールし得る。代替的に、第１の鎖の標識された３’末端にアニールするオリゴヌクレオチドは、通常のハイブリダイズ条件下で第２の鎖の、任意選択で標識された３’末端にアニールすることが可能でない。同様に、第２の鎖の標識された３’末端にアニールするオリゴヌクレオチドは、通常のハイブリダイズ条件下で第１の鎖の、任意選択で標識された３’末端にアニールすることが可能でない。そのため好ましくは、異なるオリゴヌクレオチドが標的核酸断片の各々の側においてアニールされ得るような程度まで第１の鎖の３’末端における標識の配列は第２の鎖の３’末端における標識のヌクレオチド配列とは異なる。そのため生成された標識の配列を変更することにより、特異的なオリゴヌクレオチドは標的核酸断片にアニールすることができる。

第１の鎖の標識された３’末端にアニールするオリゴヌクレオチドの配列は、第２の鎖の標識された３’末端にアニールするオリゴヌクレオチドの配列と同一であってもよい。この実施形態において、第１の鎖の３’末端を伸長する標識の配列はそのため、第２の鎖の３’末端を伸長する標識の配列と好ましくは同一、又はほぼ同一である。

任意選択で、第１の鎖の標識された３’末端にアニールするオリゴヌクレオチドの配列は、生成された標識にアニールできるオリゴヌクレオチドの部分の例外と共に、第２の鎖の標識された３’末端にアニールするオリゴヌクレオチドの配列と同一であってもよい。この実施形態において、第１の鎖の３’末端を伸長する標識の配列はそのため、第２の鎖の３’末端を伸長する標識の配列とは異なる。

代替的に、第１の鎖の３’末端において標識を伸長する配列及び第２の鎖の３’末端において標識を伸長する配列は１つ又は複数のヌクレオチドで異なる。

例えば、各々のＤＮＡ試料の特異的な標識を設計すること、並びに／又は各々の標的核酸断片の特異的な標識、及び／若しくは単一の標的核酸断片の各々の部位の特異的な標識、例えば第１の鎖の３’末端において生成される特異的な標識及び単一の標的核酸断片の相補鎖の３’末端において生成される別の標識を作り出すことが可能であることが本明細書において理解される。それゆえ、本明細書に詳述されている方法は、生成された標識が実験の特定の必要性に直接的にカスタマイズされ得る多用途のプラットフォームを提供する。

本発明の方法における使用のためのオリゴヌクレオチドは、好ましくは、ステップｃ）及び／又はステップｅ）において生成された標識にハイブリダイズ又は「アニール」できる少なくとも１つのドメインを有する。このドメインは、好ましくは、鋳型ＲＮＡ分子の鋳型ドメインと同じ、又は実質的に同じ、配列を有する。任意選択で、オリゴヌクレオチドは、標識にハイブリダイズ又はアニールする前記ドメインからなる。代替的に、オリゴヌクレオチドは、好ましくは制限部位ドメイン、捕捉ドメイン、シークエンシングプライマー結合部位、増幅プライマー結合部位、検出ドメイン、バーコード配列、転写プロモータードメイン及びＰＡＭ配列、又はこれらの任意の組合せからなる群から選択される、さらなる機能性ドメイン又は「テイル」を含む。好ましくは、オリゴヌクレオチドは、ＵＭＩ、バーコード及びプライマー結合部位のうちの少なくとも１つを含む。バーコードは、試料バーコード、又は固有分子識別物（ＵＭＩ）であり得るが、これらに限定されない。前記さらなる機能性ドメイン又は「テイル」は、ステップｃ）及び／又はステップｅ）において生成された標識にハイブリダイズ又はアニールしないオリゴヌクレオチドの部分として本明細書において理解されるべきである。任意選択で、第１及び第２のオリゴヌクレオチドは機能性ドメインを含む。第１及び第２のオリゴヌクレオチド中に位置する機能性ドメイン（複数可）は、同じ機能性ドメイン又は異なる機能性ドメインであってもよい。機能性ドメイン及びこれらのドメインの位置は、第１及び第２の標識中に任意選択で位置する機能性ドメインについて本明細書において上記されたものと同じであってもよい。非限定的な例として、第１及び第２のオリゴヌクレオチド中に位置する機能性ドメインは、増幅及び／又はシークエンシングのために使用されてもよく、例えば第１のオリゴヌクレオチド中に位置するバーコード及び第２のヌクレオチド中に位置するバーコードは一緒になってコンビナトリアルバーコードを形成してもよい。

任意選択で、標識にハイブリダイズ又はアニールするドメインは、一本鎖標識の長さと同じ長さを有する。標識へのオリゴヌクレオチドのアニーリングはそのため二本鎖標識を結果としてもたらす。

任意選択で、標識にハイブリダイズ又はアニールするドメインは、一本鎖標識の長さよりも長い１つ又は複数のヌクレオチドである。標識へのオリゴヌクレオチドのアニーリングは、１つ又は複数のヌクレオチドの一本鎖オーバーハング、好ましくはＡ－又はＴ－オーバーハングを結果としてもたらす。同様に、オリゴヌクレオチドは、一本鎖標識よりも短い１つ又は複数のヌクレオチドであってもよい。標識へのオリゴヌクレオチドのアニーリングは、反対鎖の１つ又は複数のヌクレオチドの一本鎖オーバーハング、好ましくはＡ－又はＴ－オーバーハングを結果としてもたらす。

任意選択で、標識にハイブリダイズ又はアニールするドメインは、標識よりも実質的に短く、充填又はＰＣＲ反応が、二本鎖標識を生成するために使用される。

好ましくは、オリゴヌクレオチドは、一本鎖アダプター、好ましくは本明細書において上記に定義されているアダプターである。アニールされたオリゴヌクレオチドは、部分的に又は全体的に二本鎖の配列に変換され得る。前記二本鎖配列は二本鎖アダプターであり得る。アダプターは、シークエンシングアダプターであってもよいか、又はそれにライゲートされてもよく、例えばＲｏｃｈｅ４５４Ａ及び４５４Ｂシークエンシング、ＩＬＬＵＭＩＮＡ（商標）ＳＯＬＥＸＡ（商標）シークエンシング、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓのＳＯＬＩＤ（商標）シークエンシング、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓのＳＭＲＴ（商標）シークエンシング、ＰｏｌｌｏｎａｔｏｒＰｏｌｏｎｙシークエンシング、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓ又はＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓシークエンシングを可能とする機能性ドメインを含む。

任意選択で、生成された１つ又は複数の標識にアニールするオリゴヌクレオチドは、部分的に又は全体的に二本鎖の構造を有することができ、例えばヘアピン又はステムループ構造を形成する。

代替的に又は追加的に、部分的に又は全体的に二本鎖の核酸分子は、生成された１つ又は複数の標識にアニールされてもよい。そのような二本鎖核酸は、二本鎖アダプター、又はクローニングプラスミドであってもよい。二本鎖アダプター又はクローニングプラスミドは、好ましくは、生成された標識にハイブリダイズできる一本鎖オーバーハングを含む。オーバーハングは好ましくは３’－オーバーハングである。二本鎖アダプター、又はクローニングプラスミドの他の末端、好ましくは５’末端は、好ましくは、生成された標識にハイブリダイズすることができない。追加的に又は代替的に、二本鎖アダプター、又はクローニングプラスミドの他の末端、好ましくは５’末端は、二本鎖アダプター若しくはクローニングプラスミドの３’末端にライゲートされることができず、及び／又は別のアダプターにライゲートされることができない。換言すれば、好ましくは二本鎖アダプターのオーバーハングは、アダプター－アダプター－ライゲーションを回避するように設計される。好ましくは、二本鎖アダプター、又はクローニングプラスミドは、生成された標識にライゲートされ得る３’末端、及び平滑末端であるか、又は単一ヌクレオチドオーバーハング、例えばＡ－オーバーハングを含む５’末端を含む。３’末端におけるオーバーハングは第１の鎖の３’－オーバーハングであってもよい。５’末端におけるオーバーハングは第２の鎖の３’－オーバーハングであってもよい。

オリゴヌクレオチドは、エキソヌクレアーゼ消化から保護する１つ又は複数の化学的部分を含んでもよい。そのような部分は、好ましくは、オリゴヌクレオチドの５’末端部分中に存在する。そのような保護的な部分は、ヌクレアーゼから保護することが当技術分野において公知である、ホスホロチオエートであってもよい。例えば５’末端におけるホスホロチオエートは、５’－３’エキソヌクレアーゼ、例えばＴ７又はラムダエキソヌクレアーゼによるエキソヌクレアーゼ分解を予防する。オリゴヌクレオチドの５’末端は、少なくとも１、２、３、４、５、６、７、８、９又は１０個のホスホロチオエート（ＰＳ）結合を含んでもよい。ＰＳ結合は、オリゴヌクレオチドのリン酸骨格中の非ブリッジ形成性酸素を硫黄原子で代用し、これはヌクレオチド間連結をヌクレアーゼ分解に対して抵抗性とする。代替的に又は追加的に、１つ又は複数の化学的部分は、ステップｃ）及び／又はステップｅ）の間に標識中に組み込まれてもよく、前記化学的部分はエキソヌクレアーゼ消化から核酸を保護する。

本発明の方法はそのため、エキソヌクレアーゼ処理のステップをさらに含んでもよい。好ましくはエキソヌクレアーゼ処理は、アニールされたオリゴヌクレオチド及び／又は標識がエキソヌクレアーゼ消化から保護する１つ又は複数の化学的部分を含む場合に本発明の方法において含まれてもよい。代替的に又は追加的に、エキソヌクレアーゼ処理ステップは、ステップｃ）における逆転写の後及び／又はステップｅ）の後に含まれてもよい。代替的に又は追加的に、エキソヌクレアーゼステップは、ステップｂ）における二本鎖核酸分子の切断の後及び／又はステップｄ）の後に含まれてもよい。好ましくはエキソヌクレアーゼはエキソヌクレアーゼ処理後に不活性化される。非限定的な例として、熱安定性Ｃａｓ９がステップｂ）及び／又はステップｄ）において使用されてもよく、これは好ましくは６０℃～７５℃の温度において安定なままである。その後のエキソヌクレアーゼ処理ステップは、上昇した温度において不安定な、例えば６０℃～７５℃の温度において不安定なエキソヌクレアーゼを用いて行われてもよい。好適な温度、例えば室温でのエキソヌクレアーゼ処理後に、温度は、エキソヌクレアーゼを不活性化するが（依然として結合した）熱安定性Ｃａｓ９を不活性化しないように上昇されてもよく、例えば温度を６０℃～７５℃に上昇させてもよい。エキソヌクレアーゼを不活性化した後に、その後の逆転写酵素ステップが行われてもよい。
ライゲーション及び／又は充填反応－ステップｇ）

本発明の方法は、アニールされたオリゴヌクレオチド（複数可）を標的核酸断片にライゲートする及び／又は一本鎖オーバーハング（複数可）を充填するステップｇ）をさらに含んでもよい。そのような一本鎖オーバーハング（複数可）は、標的核酸断片の遊離３’末端における標識の付加に起因して及び／又は生成された標識への一本鎖オリゴヌクレオチドのアニーリングに起因して生成されてもよい。

ライゲーションステップは、任意の従来の手段を使用して行われ得る。オリゴヌクレオチドは、任意の従来のリガーゼ酵素を使用して標的核酸断片にライゲートされてもよい。

ライゲーションステップｇ）は、好ましくは、リガーゼ酵素が、アニールされたオリゴヌクレオチド（複数可）を標的核酸断片にライゲートすることが可能である実験条件下で、すなわちリガーゼが酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び／又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件はリガーゼの種類に依存し得る。実験条件は、以下の実験セクションに記載される条件と同じ又は類似したものであり得る。

一本鎖オリゴヌクレオチドが、第１の鎖の３’末端において生成された標識にアニールされる場合、オリゴヌクレオチドは第２の鎖の５’末端にライゲートされる。同様に、一本鎖オリゴヌクレオチドが第２の鎖の３’末端において生成された標識にアニールされる場合、オリゴヌクレオチドは第１の鎖の５’末端にライゲートされる。

充填反応、すなわち二本鎖ＤＮＡ分子を生成する充填反応は、任意の従来の手段を使用して、例えばＤＮＡポリメラーゼを使用して行われ得る。

ステップｇ）における充填反応は、好ましくは、ポリメラーゼが、アニールされたオリゴヌクレオチド（複数可）により生成された一本鎖オーバーハングを充填することが可能である実験条件下で、すなわちポリメラーゼが酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び／又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件はポリメラーゼの種類に依存し得る。実験条件は、以下の実験セクションに記載される条件と同じ又は類似したものであり得る。これらの実験条件は、好ましくは、少なくともヌクレオチド、好ましくは天然に存在するヌクレオチドの存在を含み、好ましくはこれらの実験条件は、ｄＮＴＰ、好ましくはアデニン、グアニン、シトシン及びチミジン及び任意選択でウラシルのうちの少なくとも１つの存在を含む。

好ましくは、ライゲーション及び充填ステップは、例えば、ＤＮＡ修復ミックス、以下に限定されないが例えばＮＥＢＮｅｘｔ（登録商標）ＦＦＰＥＤＮＡＲｅｐａｉｒｍｉｘを使用することにより、単一の反応中に組み合わせられてもよい。

標識にアニール及びライゲートされた一本鎖オリゴヌクレオチド又は少なくとも部分的に二本鎖の核酸は、標的核酸断片のその後の増幅のためにプライマー結合部位を含んでもよい。

代替的に又は追加的に、標識にアニール及びライゲートされたオリゴヌクレオチドは、充填されて二本鎖配列を形成してもよい。代替的に、部分的に又は全体的に二本鎖の核酸分子は、生成された標識にアニール及びライゲートされてもよい。標識を伸長する、任意選択で二本鎖の、配列はアダプターであってもよい。

「伸長された標識」は、本明細書において定義されているステップｆ）及びｇ）の後に得ることが可能である標的核酸断片を伸長する配列として本明細書において理解される。文脈に依存して、「標識」という用語はそのため、ステップｃ）及び／又はステップｅ）の後に得ることが可能である標識、並びにステップｆ）及びｇ）の後に得ることが可能である標識を含むことができる。その後のステップｈ）においてシークエンシングアダプターは、伸長された標識にライゲートされてもよい。当技術分野において公知の任意の従来のシークエンシングアダプターは、本発明における使用のために好適であり得る。好ましくは、シークエンシングアダプターは、伸長された１つ又は複数の標識の遊離３’及び／又は遊離５’末端にライゲートされ得る末端を含む。シークエンシングアダプターはそのため、好ましくは、伸長された１つ又は複数の標識の遊離３’及び／又は遊離５’末端に適合性の末端を含む。シークエンシングアダプターは、１つ又は複数のヌクレオチドの平滑末端又は一本鎖オーバーハングを含んでもよい。非限定的な例として、伸長された標識の遊離末端が３’－Ａオーバーハングを含む場合、シークエンシングアダプターは好ましくは３’－Ｔオーバーハングを含む。シークエンシングアダプターは、伸長された標識の遊離末端と適合性の１つの末端、並びに伸長された標識及びシークエンシングアダプターのうちの少なくとも１つにライゲートされ得ない１つの末端を含んでもよい。

一実施形態において、任意選択で伸長された、標識は、プロテロメラーゼ認識配列、好ましくはＴｅｌＮプロテロメラーゼ認識配列を含む。

プロテロメラーゼ認識配列は、ＤＮＡ鋳型中のその存在が、プロテロメラーゼの酵素活性による閉じた直鎖状ＤＮＡへのその変換を可能とする任意のＤＮＡ配列である。換言すれば、プロテロメラーゼ認識配列は、共有結合的に閉じた直鎖状ＤＮＡを形成するためのプロテロメラーゼによる二本鎖ＤＮＡの切断及び再ライゲーションのために要求される。典型的には、プロテロメラーゼ認識配列は、完璧なパリンドローム配列、すなわち２回回転対称性を有する二本鎖ＤＮＡ配列を含む。

完璧な逆位反復の長さは、特有の生物に依存して異なる。ボレリア・ブルグドルフェリ（Ｂｏｒｒｅｌｉａｂｕｒｇｄｏｒｆｅｒｉ）において、完璧な逆位反復は１４塩基対の長さである。様々な中温性バクテリオファージにおいて、完璧な逆位反復は２２塩基対又はより大きい長さである。また、一部の場合、例えばＥ．コリＮ１５において、中心の完璧な逆位パリンドロームは逆位反復配列により隣接され、すなわちより大きい完璧でない逆位パリンドロームの部分を形成する。

本発明において使用されているプロテロメラーゼ認識配列は、好ましくは、少なくとも１４塩基対の長さの二本鎖パリンドローム（完璧な逆位反復）配列を含む。

好ましい完璧な逆位反復配列は、配列ＮＣＡＴＮＮＴＡＮＮＣＧＮＮＴＡＮＮＡＴＧＮ（配列番号３７）及びそのバリアントを含む。この配列は２２塩基コンセンサス配列である。例えば国際公開第２０１０／０８６６２６号に開示されるように、完璧な逆位反復の塩基対はある特定の位置において保存されていると共に、配列における柔軟性は他の位置において可能である。そのため好ましくは、この配列は、本発明の方法におけるプロテロメラーゼとの使用のための完璧な逆位反復配列のための最小コンセンサス配列である。プロテロメラーゼ認識配列は、国際公開第２０１０／０８６６２６号（参照により本明細書に組み込まれる）に記載されている配列を有してもよい。

好ましくは、プロテロメラーゼ認識配列は、配列番号３８と少なくとも８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％又は１００％の配列同一性を有する。配列番号３８の配列：
5'-TATCAGCACACAATTGCCCATTATACGCGCGTATAATGGACTATTGTGTGCTGATA-3'
好ましくは、プロテロメラーゼは、認識配列中の２８～２９位において、任意選択で伸長された、標識を切断し、切断された末端を閉じる。

任意選択で伸長された、標識に導入されたプロテロメラーゼ認識部位がある場合、方法は、標識された標的核酸断片をプロテロメラーゼ、好ましくはＴｅＩＮプロテロメラーゼと接触させて、末端を切断し及び切断された末端を共有結合的に閉じて、閉じた末端を含む標的核酸断片を結果としてもたらすステップをさらに含んでもよい。

一実施形態において、標的核酸断片は、プロテロメラーゼ認識部位を有する単一の標識、すなわち第１の鎖の３’末端のみにおける又は第２の鎖の３’末端のみにおける標識を含む。二本鎖標識を生成した後に、プロテロメラーゼは標的核酸断片の１つの末端を切断し、及び閉じる。任意選択で標識された、標的核酸断片の他の末端は開いたままである。非限定的な例として、シークエンシングアダプターは、この開いた末端にアニール及び／又はライゲートされ得る。

別の実施形態において、標的核酸断片は、３’末端における標識及び５’末端における標識を含み、両方の標識はプロテロメラーゼ認識部位を含む。二本鎖標識の生成後に、プロテロメラーゼは、標的核酸断片の両方の末端を切断し、及び閉じることができる。閉じた核酸断片はエキソヌクレアーゼ分解から保護される。

本発明における使用のための好ましいプロテロメラーゼはバクテリオファージプロテロメラーゼである。プロテロメラーゼは、ハロモナス・アクアマリナ（Ｈａｌｏｍｏｎａｓａｑｕａｍａｒｉｎａ）からのｐｈｉＨＡＰ－１、エルシニア・エンテロリティカ（Ｙｅｒｓｉｎｉａｅｎｔｅｒｏｌｙｔｉｃａ）からのＰＹ５４、クレブシエラ・オキシトカ（Ｋｌｅｂｓｉｅｌｌａｏｘｙｔｏｃａ）からのｐｈｉＫＯ２、ビブリオ（Ｖｉｂｒｉｏ）属菌からのＶＰ８８２及びエシェリヒア・コリからのＮｌ５、又はこれらのいずれかのバリアントからなる群から選択され得る。プロテロメラーゼは、国際公開第２０１０／０８６６２６号（参照により本明細書に組み込まれる）に開示されているアミノ酸配列を有してもよい。

バクテリオファージＮｌ５（ＴｅＩＮ）プロテロメラーゼ又はそのバリアントの使用は特に好ましい。好ましいプロテロメラーゼは、配列番号３９と少なくとも８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％又は１００％の配列同一性の配列を有する。バリアントは、そのホモログ又は突然変異体を含む。突然変異体は、ネイティブな配列に関して切断、置換又は欠失を含む。バリアントは、好ましくは、本明細書において上記されているプロテロメラーゼ認識配列を含む鋳型から閉じた直鎖状ＤＮＡを生成する。

任意選択で、試料は、標識された標的核酸断片をプロテロメラーゼと接触させた後にエキソヌクレアーゼに曝露される。閉じた標的核酸断片はエキソヌクレアーゼ消化から保護され、閉じていない非標的核酸断片は分解される。

本発明の方法は、標的核酸断片、任意選択でそのサブセットが、第１のプログラム可能なヌクレアーゼ又は第１の制限エンドヌクレアーゼにより切断され、好ましくはプログラム可能なヌクレアーゼがＲＮＡにガイドされるＣＲＩＳＰＲヌクレアーゼであり、任意選択でアダプターがライゲート又はアニールされる開いた核酸断片を得るステップをさらに含んでもよい。
シークエンシング方法－ステップ（ｉ）、（ｉｉ）及び（ｉｉｉ）

さらなる態様において、本発明の方法は、１つ又は複数の標的核酸断片をシークエンシングする方法に関する。シークエンシング方法は好ましくはディープシークエンシング方法である。シークエンシング方法は、好ましくは、

本明細書において定義されている１つ又は複数の標識された標的核酸断片を得るステップ；及び
１つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップ
を少なくとも含む。

一実施形態において、１つ又は複数の標的核酸断片をシークエンシングする方法は、
（ｉ）ａ）二本鎖核酸分子を含む試料を提供するステップであり、二本鎖核酸分子が目的の配列を含む、ステップ；
ｂ）二本鎖核酸分子を部位特異的ヌクレアーゼと接触させて二本鎖切断を生成するステップであり、二本鎖切断が標的核酸断片の第１の鎖の遊離３’末端を結果としてもたらす、ステップ；
ｃ）切断された核酸分子を逆転写酵素及び鋳型ＲＮＡ分子と接触させ、それにより、１つ又は複数のヌクレオチドで標的核酸断片の第１の鎖の遊離３’末端を標識するステップであり、任意選択でステップｂ）における部位特異的ヌクレアーゼ及びステップｃ）における逆転写酵素が別々の実体である、ステップ
により１つ又は複数の標識された標的核酸断片を得るステップ；並びに
（ｉｉｉ）１つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップ
を含む。

それゆえ、ステップ（ｉ）における標識された標的核酸断片は、本明細書に詳述されている少なくともステップａ）、ｂ）及びｃ）を行うことにより得られてもよい。ステップ（ｉ）の標識された標的核酸断片は、
ステップａ）、ｂ）、及びｃ）；
ステップａ）、ｂ）、ｃ）、ｄ）及びｅ）；
ステップａ）、ｂ）、ｄ）、ｃ）及びｅ）；
ステップａ）、ｂ）、ｃ）；ｆ）、及び任意選択でステップｇ）
ステップａ）、ｂ）、ｃ）、ｄ）及びｅ）；ｆ）、及び任意選択でステップｇ）；並びに／又は
ステップａ）、ｂ）、ｄ）、ｃ）及びｅ）；ｆ）、及び任意選択でステップｇ）
を行うことにより得られてもよい。

ステップｂ）及びｄ）は実質的に同時に行われてもよく、並びに／又はステップｃ）及びｅ）は実質的に同時に行われてもよいことが本明細書においてさらに理解される。

ステップ（ｉ）において得られる標識された標的核酸断片はそのため、標識された標的核酸断片にアニールされた１つ又は複数のオリゴヌクレオチドを含んでもよい。追加的に、これらのアニールされたオリゴヌクレオチドは、任意選択で標的核酸断片にライゲートされていてもよく、及び／又は二本鎖とされていてもよい。本明細書に詳述されるように、オリゴヌクレオチドは一本鎖又は二本鎖アダプターであってもよい。

シークエンシング方法は、１つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップをさらに含む。ステップ（ｉ）において得られる標的核酸断片（複数可）は、単分子、リアルタイムシークエンシング反応、例えば、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ、ＭｅｎｌｏＰａｒｋ、ＣａｌｉｆからのＳＭＲＴ（登録商標）Ｓｅｑｕｅｎｃｉｎｇにおいて使用されてもよい。他のシークエンシング技術の使用もまた想定され、これは例えば、ナノポアシークエンシング（例えば、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ又はＯｎｔｅｒａからのもの）、Ｓｏｌｅｘａ（登録商標）シークエンシング（Ｉｌｌｕｍｉｎａ）、ｔＳＭＳ（商標）シークエンシング（Ｈｅｌｉｃｏｓ）、ＩｏｎＴｏｒｒｅｎｔ（登録商標）シークエンシング（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）、パイロシークエンシング（例えば、Ｒｏｃｈｅ／４５４からのもの）、ＳＯＬｉＤ（登録商標）シークエンシング（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）、マイクロアレイシークエンシング（例えば、Ａｆｆｙｍｅｔｒｉｘからのもの）、Ｓａｎｇｅｒシークエンシング、ＤＮＢｓｅｑ（商標）（ＭＧＩＴｅｃｈＣｏ．，Ｌｔｄ）などがある。シークエンシング方法は、例えば、＞２００ｎｔ又はより多くをシークエンシングすることが可能であり得る。シークエンシング方法は、長い鋳型分子、例えば、＞１０００～１０，０００塩基又はより多くをシークエンシングすることが可能であり得る。シークエンシング方法は、例えば、シークエンシング反応の動態をモニターすることにより、シークエンシング反応の間に塩基修飾を検出することが可能であり得る。シークエンシング方法は、例えば、リアルタイムで、単一の鋳型分子の配列を分析してもよい。好ましい実施形態において、調製された核酸分子ライブラリーは、ナノポア選択的シークエンシングによりシークエンシングされる。ナノポア選択的シークエンシングにおいて、リアルタイムシークエンシングの間に、生成されたデータ（直接的な電流シグナル又はこれらの電流シグナルから翻訳された塩基コールのいずれか）は１つ又は複数の参照配列（複数可）と比較される。標的配列のヌクレオチドのセット数又はシグナルの量が参照配列と整合している場合、シークエンシングは進行され、そうでない場合、電流は逆転され、それにより、核酸はポアから除去され、ポアは新たな核酸のシークエンシングのために利用可能とされる。ヌクレオチドのセット数は、核酸リードの少なくとも最初の５０、６０、７０、８０、９０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、又は５００ヌクレオチドであってもよい。１つ又は複数の参照配列は数多くの異なる配列であってもよい。好ましくは、参照配列は、本発明の方法のステップａ）～ｃ）、並びに任意選択でステップｄ）及びｅ）において得られる標的核酸断片の配列に対して少なくとも５０、６０、７０、８０、９０、９２、９３、９４、９５、９６、９７、９８、９９又は１００％同一である。一実施形態において、参照配列は、本発明の方法のステップａ）～ｃ）、並びに任意選択でステップｄ）及びｅ）において得られる標的核酸断片の１つ又は複数の配列の特定のサブセットに対して少なくとも５０、６０、７０、８０、９０、９２、９３、９４、９５、９６、９７、９８、９９又は１００％同一である。ナノポア選択的シークエンシングにより特定のサブセットを選択的にシークエンシングすることの利益の１つは、異なるシークエンシングランにおいて、異なるサブセットが、調製された核酸分子ライブラリーを使用してシークエンシングされ得ることである。

本発明のシークエンシング方法は、１つ又は複数の標識された標的核酸断片を増幅する、好ましくは選択的に増幅するステップ（ｉｉ）をさらに含んでもよい。

ステップ（ｉｉ）における増幅反応は、好ましくは、（ＤＮＡ）ポリメラーゼが１つ又は複数の標識された標的核酸断片を増幅することが可能である実験条件下で、すなわちポリメラーゼが酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び／又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件はポリメラーゼの種類に依存し得る。これらの実験条件は、好ましくは、少なくともヌクレオチド、好ましくは天然に存在するヌクレオチドの存在を含み、好ましくはこれらの実験条件は、ｄＮＴＰ、好ましくはアデニン、グアニン、シトシン及びチミジン及び任意選択でウラシルのうちの少なくとも１つの存在を含む。

増幅は、標識にのみアニールする及び／又はアニールされたオリゴヌクレオチドの少なくとも部分にのみアニールする１つ又は複数のプライマーを使用して行われ得る。追加的に又は代替的にプライマーのうちの少なくとも１つは、標的核酸断片中に存在するヌクレオチドにアニールできる、すなわち選択的な増幅のための、１つ又は複数のヌクレオチドをその３’末端において含んでもよい。それゆえ後者の場合、プライマーのうちの少なくとも１つは、標的核酸断片中に存在する配列にアニールできるその３’末端における１つ又は複数のヌクレオチドに加えて、標識にアニールできる及び／又はアニールされたオリゴヌクレオチドの少なくとも部分にアニールできる配列を含んでもよい。追加的に又は代替的に、プライマー対のプライマーのうちの１つは、標的核酸断片中に存在する配列にのみアニールしてもよく、すなわちいわゆる「ネステッド」プライマーである。

任意選択でプライマー対のプライマーのうちの少なくとも１つは、好ましくは制限部位ドメイン、捕捉ドメイン、シークエンシングプライマー結合部位、増幅プライマー結合部位、検出ドメイン、バーコード配列、転写プロモータードメイン及びＰＡＭ配列、又はこれらの任意の組合せからなる群から選択される、機能性ドメインを含む。バーコードは試料バーコードであり得るが、これに限定されない。

１つ又は複数の標的核酸断片をシークエンシングする方法はしたがって、
（ｉ）ａ）二本鎖核酸分子を含む試料を提供するステップであり、二本鎖核酸分子が目的の配列を含む、ステップ；
ｂ）二本鎖核酸分子を部位特異的ヌクレアーゼと接触させて二本鎖切断を生成するステップであり、二本鎖切断が標的核酸断片の第１の鎖の遊離３’末端を結果としてもたらす、ステップ；
ｃ）切断された核酸分子を逆転写酵素及び鋳型ＲＮＡ分子と接触させ、それにより、１つ又は複数のヌクレオチドで標的核酸断片の第１の鎖の遊離３’末端を標識するステップであり、任意選択でステップｂ）における部位特異的ヌクレアーゼ及びステップｃ）における逆転写酵素が別々の実体である、ステップ；
ｄ）任意選択で二本鎖核酸分子を第２の部位特異的ヌクレアーゼと接触させて第２の二本鎖切断を生成するステップであり、第２の二本鎖切断が標的核酸断片の第２の鎖の遊離３’末端を結果としてもたらし、好ましくはステップｄ）がステップｂ）と同時に行われる、ステップ；
ｅ）任意選択で標的核酸断片を逆転写酵素及び第２の鋳型ＲＮＡ分子と接触させ、それにより、１つ又は複数のヌクレオチドで標的核酸断片の第２の鎖を遊離３’末端において標識するステップであり、好ましくはステップｅ）がステップｃ）と同時に行われる、ステップ；
ｆ）任意選択で第１のオリゴヌクレオチドを、標的核酸断片の第１の鎖の標識された３’末端にアニールするステップであり、任意選択で鋳型ＲＮＡ及びｃｒＲＮＡが、第１のオリゴヌクレオチドをアニールする前に分解される、ステップ；
ｇ）任意選択でアニールされたオリゴヌクレオチド（複数可）をライゲート及び／又は充填するステップ
により１つ又は複数の標識された標的核酸断片を得るステップ；
（ｉｉ）任意選択で１つ又は複数の標識された標的核酸断片を増幅する、好ましくは選択的に増幅するステップ；並びに
（ｉｉｉ）任意選択で増幅された、１つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップ
を含んでもよい。

任意選択で、本発明の方法は、マルチプレックスである、すなわち複数の核酸試料のために、例えば少なくとも約５、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、５００、１０００個又はより多くの核酸試料のために同時に応用される。方法は、複数の試料のために並列で行われてもよく、「並列で」は、実質的に同時であるが、各々の試料が別々の反応チューブ又は容器中で処理されることとして本明細書において理解されるべきである。

追加的に又は代替的に、本発明の方法の１つ又は複数のステップは、プールされた試料に対して行われてもよい。プールするステップは、例えば、ステップａ）、ｂ）、ｃ）、ｄ）、ｅ）、ｆ）及びｇ）のうちのいずれか１つの後、並びに／又はステップ（ｉ）及び（ｉｉ）のうちのいずれか１つの後であってもよい。好ましくは、プールするステップは、ステップｆ）及びステップｇ）のうちの少なくとも１つの後、並びに／又はステップ（ｉ）及びステップ（ｉｉ）のうちの少なくとも１つの後である。好ましくは、プールするステップは、ステップｇ）の後並びに／又はステップ（ｉ）及び（ｉｉ）のうちの少なくとも１つの後である。

富化、単離及び／又はシークエンシングされた断片を、起源となる試料にトレースバックするために、断片は、試料をプールする前に識別物でタグ付加されてもよい。そのような識別物は、任意の検出可能な実体であり得、以下に限定されないが例えば放射性又は蛍光標識であるが、好ましくは特定のヌクレオチド配列又はヌクレオチド配列の組合せ、好ましくは定義された長さのものである。識別物は、好ましくは、標識、標識にアニールするオリゴヌクレオチド及び標的核酸断片を増幅するためのプライマーのうちの少なくとも１つにおいて存在する。

追加的に又は代替的に、試料は、巧妙なプーリング戦略、以下に限定されないが例えば、プールした後に、各々の試料が少なくともそれぞれ２つ又は３つのプール中に包含される２Ｄ及び３Ｄプーリング戦略を使用してプールされ得る。特定の標的核酸断片は、特定の富化、単離及び／又はシークエンシングされた標的断片を含むそれぞれのプールの座標を使用することにより、起源となる試料にトレースバックされ得る。

さらなる態様
一態様において、本発明は、標識された標的核酸断片に関する。標識された標的核酸断片は本発明の方法により得ることが可能であり得る。標識された標的核酸断片は、
ステップａ）、ｂ）、及びｃ）；
ステップａ）、ｂ）、ｃ）、ｄ）及びｅ）；
ステップａ）、ｂ）、ｄ）、ｃ）及びｅ）；
ステップａ）、ｂ）、ｃ）；ｆ）、及び任意選択でステップｇ）
ステップａ）、ｂ）、ｃ）、ｄ）及びｅ）；ｆ）、及び任意選択でステップｇ）；並びに／又は
ステップａ）、ｂ）、ｄ）、ｃ）及びｅ）；ｆ）、及び任意選択でステップｇ）
のうちの少なくとも１つを行うことにより得ることが可能であるものであってもよい。

別の態様において、本発明は、本発明の方法により得ることが可能であるシークエンシングライブラリー、好ましくはディープシークエンシングライブラリーに関する。ディープシークエンシングライブラリーは、
ステップａ）、ｂ）、及びｃ）；
ステップａ）、ｂ）、ｃ）、ｄ）及びｅ）；
ステップａ）、ｂ）、ｄ）、ｃ）及びｅ）；
ステップａ）、ｂ）、ｃ）；ｆ）、及び任意選択でステップｇ）
ステップａ）、ｂ）、ｃ）、ｄ）及びｅ）；ｆ）、及び任意選択でステップｇ）；並びに／又は
ステップａ）、ｂ）、ｄ）、ｃ）及びｅ）；ｆ）、及び任意選択でステップｇ）
のうちの少なくとも１つを行うことにより得ることが可能であるものであってもよい。

追加的に、ステップ（ｉｉ）が、本発明の方法により得ることが可能であるシークエンシングライブラリーを増幅するために行われてもよい。

追加的に、シークエンシングライブラリーは、好ましくは本明細書において定義されているプーリング戦略を使用する、プールされた標識された標的核酸断片の収集物を含む。標識された標的核酸断片は、好ましくは、バーコード、好ましくは試料バーコードを含む。

別の態様において、本発明は、本発明の方法における使用のための構築物に関する。構築物は、好ましくは、本明細書において定義されている部位特異的ヌクレアーゼをコードする配列並びに本明細書において定義されている逆転写酵素及び鋳型ＲＮＡ分子のうちの少なくとも１つをコードする配列を含む。代替的に、構築物は、本明細書において定義されている逆転写酵素をコードする配列及び鋳型ＲＮＡ分子をコードする配列を含んでもよい。

構築物は、ガイドＲＮＡをコードする配列をさらに含んでもよい。好ましくは、構築物は、ｓｇＲＮＡ、ｃｒＲＮＡ及び任意選択でｔｒａｃｒＲＮＡのうちの少なくとも１つをコードする配列をさらに含んでもよい。構築物は、少なくとも２、３、４、５、６、７、８、９、１０個又はより多くの鋳型ＲＮＡ分子を含んでもよい。追加的に又は代替的に、構築物は、少なくとも２、３、４、５、６、７、８、９、１０個又はより多くのガイドＲＮＡを含んでもよい。鋳型ＲＮＡ分子及び／又はガイドＲＮＡ分子は、例えば鋳型ＲＮＡ分子の間、ガイドＲＮＡの間及び／又は鋳型ＲＮＡとガイドＲＮＡとの間に切断部位を組み込むことにより、転写後に切断されてもよい。好ましい切断部位は、ｔＲＮＡ切断部位、例えば国際公開第２０１６／０６１４８１号（参照により本明細書に組み込まれる）に記載されるものである。

一態様において、本発明は、本発明の方法を実行するためのキットに関する。好ましくは、キットは、少なくとも３つの構成要素を含み、
第１の構成要素は、本明細書において定義されている部位特異的ヌクレアーゼ、又はそれをコードする構築物、並びに任意選択でｃｒＲＮＡ、ｔｒａｃｒＲＮＡ及びｓｇＲＮＡのうちの少なくとも１つ、又はそれをコードする構築物、好ましくは本明細書において定義されている構築物であり；
第２の構成要素は、本明細書において定義されているＤＮＡポリメラーゼ、好ましくは逆転写酵素、又はそれをコードする構築物であり；
第３の構成要素は、本明細書において定義されている鋳型ＲＮＡ分子、又はそれをコードする構築物である。

好ましい実施形態において、キットは、試料の二本鎖核酸分子からの少なくとも１つの標的断片の切除のための少なくとも２つの異なるｃｒＲＮＡ及び／又はｓｇＲＮＡを含む。さらなる好ましい実施形態において、キットは、試料の二本鎖核酸分子からの標的断片のセットの切除のためのｃｒＲＮＡ及び／又はｓｇＲＮＡの対のセットを含み、対のセットは、２、３、４、５、６、７、８、９、１０個又はより多く、例えば少なくとも約５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００個又はより多くであってもよい。

任意選択で、前記キットは、前記少なくとも１つの標的断片の１つの側を標識するための少なくとも１つの鋳型ＲＮＡ分子を含む。キットは、標的断片のセットを標識するための鋳型ＲＮＡ分子のセットをさらに含んでもよく、鋳型ＲＮＡ分子のセットは、２、３、４、５、６、７、８、９、１０個又はより多く、例えば少なくとも約５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００個又はより多くであってもよい。

代替的に又は追加的に、前記キットは、前記少なくとも１つの標的断片の両方の側を標識するための少なくとも２つの鋳型ＲＮＡ分子を含む。キットは、標的断片のセットの両方の側を標識するための鋳型ＲＮＡ分子の対のセットをさらに含んでもよく、鋳型ＲＮＡ分子の対のセットは、２、３、４、５、６、７、８、９、１０個又はより多く、例えば少なくとも約５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００個又はより多くであってもよい。

追加的に、キットは、第４、第５、第６及び第７の構成要素のうちの少なくとも１つをさらに含んでもよく、
第４の構成要素は、本明細書において定義されている１つ又は複数のオリゴヌクレオチドであり、好ましくは、１つ又は複数のオリゴヌクレオチドは、ＵＭＩ、バーコード及びプライマー結合部位のうちの少なくとも１つを含み；
第５の構成要素は、標識された標的核酸断片の選択的な増幅のための１つ又は複数のプライマー、好ましくは本明細書において定義されている１つ又は複数のプライマーであり；
第６の構成要素は、標識された標的核酸断片の非選択的（ユニバーサル）な増幅のための１つ又は複数のプライマー、好ましくは本明細書において定義されている１つ又は複数のプライマーであり；
第７の構成要素は、標的核酸断片のサブセットの選択的な増幅のための１つ又は複数のプライマー、好ましくは本明細書において定義されている１つ又は複数のプライマーである。

キットは、好ましくは、複数の試料及び／又は複数の標的核酸断片を処理するための少なくとも２つ若しくはより多くのガイドＲＮＡ及び／又は少なくとも２つ若しくはより多くの鋳型ＲＮＡを含む。キットは、好ましくは、複数の試料及び／又は複数の標的核酸断片を処理するための少なくとも２、３、４、５、６、７、８、９、１０個若しくはより多くのガイドＲＮＡ及び／又は少なくとも２、３、４、５、６、７、８、９、１０個若しくはより多くの鋳型ＲＮＡを含む。

構成要素は、別々のバイアル中に存在してもよいか、又は１つ若しくは複数のバイアル中に組み合わせられてもよい。

好ましくは、キット内のバイアルのいずれかの体積は、１００ｍＬ、５０ｍＬ、２０ｍＬ、１０ｍＬ、５ｍＬ、４ｍＬ、３ｍＬ、２ｍＬ又は１ｍＬを超えない。

試薬は、凍結乾燥形態で、又は適切な緩衝剤中に存在してもよい。キットはまた、本発明を実行するために必要な任意の他の構成要素、例えば緩衝剤、ピペット、マイクロタイタープレート及び書面による使用説明書を含有してもよい。本発明のキットのためのそのような他の構成要素は当業者に公知である。

実施例１
材料及び方法
標的核酸分子のＣａｓ９切断
配列番号２５又は配列番号２６を有するプライマーを使用してラムダゲノムの５０４３～６０７４位を増幅することにより二本鎖核酸分子を得た。増幅されたλ ＤＮＡ断片（約１０３０ｂｐ）をその後に、以下の反応条件：
ヌクレアーゼ非含有水：２．７μｌ
１０ｘＢｕｆｆｅｒ３．１（ＮＥＢ）：２μｌ
３ｕＭＲｅｖｓｇＲＮＡ：１．３μｌ
３ｕＭｓｇＲＮＡ３：１．３μｌ
１ｕＭＣａｓ９ヌクレアーゼ（ＮＥＢ）：７．７μｌ
基質ＤＮＡ（１００ｎｇ／ｕｌ）：５μｌ
総体積：２０μｌ
３７℃で１時間インキュベート
を使用して、図２に指し示されている２つの選択された位置においてＣａｓ９で切断した。
５’から３’方向のＲｅｖｓｇＲＮＡの配列（標的配列に下線を引いている）：
AGUGUCUCCCGGACGUCAUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU（配列番号２７）
５’から３’方向のｓｇＲＮＡ３の配列（標的配列に下線を引いている）：
GCUCAUACCGCAACCGCGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU（配列番号２８）
切断後に、ＤＮＡを３回精製し、Ｂｉｏａｎａｌｙｚｅｒシステム（Ａｇｉｌｅｎｔ）で分析したか、又は以下に指し示されるようにさらに処理した：
切断されたＤＮＡの逆転写
切断されたＤＮＡをその後に、選択されたヌクレオチド配列を用いてその３’末端において伸長した。この目的のために、ＤＮＡを以下の反応条件：
切断されたＤＮＡ：１５μｌ
１１１．２μＭＲｅｖｓｇＲＮＡ－ＲＮＡ－Ａｄ：０．７μｌ
１２６．６ｕＭｓｇＲＮＡ３－ＲＮＡ－Ａｄ：０．６μｌ
５ｘＰｒｏｔｏｓｃｒｉｐｔＩＩ緩衝剤（ＮＥＢ）：６μｌ
ＰｒｏｔｏｓｃｒｉｐｔＩＩＲＴ（２００Ｕ／ｕｌ）（ＮＥＢ）：１μｌ
１ＭＤＴＴ：０．３μｌ
１０ｍＭｄＮＴＰ：１μｌ
ＭＱ：５．４μｌ
総体積：３０μｌ
４２℃で１時間インキュベート、続いて６５℃で２０分間のインキュベーション
を使用して逆転写酵素並びに第１及び第２の鋳型ＲＮＡに曝露した。

５’から３’方向の第１の鋳型ＲＮＡ（ＲｅｖｓｇＲＮＡ－ＲＮＡ－Ａｄ）の配列、（標的ＤＮＡ配列にハイブリダイズする配列に下線を引いており、ＰＡＭ配列は斜体であり、鋳型配列は太字である）：

５’から３’方向の第２の鋳型ＲＮＡ（ｓｇＲＮＡ３－ＲＮＡ－Ａｄ）の配列、（標的ＤＮＡ配列にハイブリダイズする配列に下線を引いており、ＰＡＭ配列は斜体であり、鋳型配列は太字である）：

ＲＮＡ分解
切断されたＤＮＡへの新たな配列の付加後に、ＲＮＡｓｅＨ処理を使用してＲＮＡを分解した：
伸長されたＤＮＡ：１０μｌ
１０ｘＲＮＡｓｅＨ反応緩衝剤（ＮＥＢ）：１０μｌ
ＲＮＡｓｅＨ（５Ｕ／ｕｌ）（ＮＥＢ）：１μｌ
ＭＱ：７９μｌ
総体積：１００μｌ
３７℃で２０分間インキュベート、続いて１μｌ０．５ＭＥＤＴＡの追加。

アダプターアニーリング、充填及びライゲーション
最後に、オリゴヌクレオチドをＤＮＡ分子の生成された一本鎖オーバーハングにアニールした。第１の鋳型ＲＮＡを使用して作り出されるオーバーハングは、第２の鋳型ＲＮＡを使用して作り出されるオーバーハングとは異なるので、２つの異なるオリゴヌクレオチドを使用した。アニールされたオリゴヌクレオチドをその後にＤＮＡ分子にライゲートし、充填した（すなわち二本鎖ＤＮＡ分子を生成した）。

５’から３’方向のオリゴヌクレオチド（ＲｅｖｓｇＲＮＡ－ＢＣ２）の配列（バーコードに下線を引いており、オーバーハングにアニールする配列を太字で指し示している）。このオリゴヌクレオチドは、鋳型ＲＮＡ分子としてＲｅｖｓｇＲＮＡ－ＲＮＡ－Ａｄを使用して生成されたオーバーハングにアニールすることができる：

５’から３’方向のオリゴヌクレオチド（ｓｇＲＮＡ３－ＢＣ１）の配列（バーコードに下線を引いており、オーバーハングにアニールする配列を太字で指し示している）。このオリゴヌクレオチドは、鋳型ＲＮＡ分子としてｓｇＲＮＡ３－ＲＮＡ－Ａｄを使用して生成されたオーバーハングにアニールすることができる：

以下の反応条件：
伸長されたＤＮＡ：１０μｌ
１００ｕＭｓｇＲＮＡ３－ＢＣ１：２．５μｌ
１００ｕＭＲｅｖｓｇＲＮＡ－ＢＣ２：２．５μｌ
ＦＦＰＥＤＮＡＲｅｐａｉｒＢｕｆｆｅｒ（ＮＥＢ）：３．２５μｌ
ＮＥＢＮｅｘｔＦＦＰＥＤＮＡｒｅｐａｉｒＭｉｘ（ＮＥＢ）：１μｌ
ＭＱ：１１．７５μｌ
総体積：３１μｌ
２０℃で１５分間インキュベート
を使用して、生成されたオーバーハングにオリゴヌクレオチドをアニールした。

増幅
生成されたＤＮＡ生成物を可視化するために、標準的な条件を使用するＰＣＲ反応において図２に指し示されるように異なるプライマーセットを使用した。逆転写酵素反応後に生成された生成物を、プライマー対を用いて増幅し、第１のプライマーはλ ＤＮＡ断片中の配列にアニールし、第２のプライマーは新たに生成されたオーバーハングにのみアニールする。それゆえ、第２のプライマーの配列はＧＡＣＧＡＴＧＡＧＴＣＣＴＧＡＧ（配列番号３３）又はＣＴＣＧＴＡＧＡＣＴＧＣＧＴＡＣＣ（配列番号３４）であり、それぞれ３３７ｂｐ又は２０４ｂｐのアンプリコンを生成した。

追加的にオリゴヌクレオチドのアニーリング後に、プライマー対と共に標準的なＰＣＲ反応を使用して生成物を可視化し、第１のプライマーは第１のオリゴヌクレオチド（ＲｅｖｓｇＲＮＡ－ＢＣ２）中に存在する配列にのみアニールすることができ、第２のプライマーは第２のオリゴヌクレオチド（ｓｇＲＮＡ３－ＢＣ１）中に存在する配列にのみアニールすることができるものであった。これらのプライマーの配列はＡＣＧＡＣＴＡＣＡＡＡＣＧＧＡＡＴＣＧＡＡ（配列番号３５）及びＣＡＣＡＡＡＧＡＣＡＣＣＧＡＣＡＡＣＴＴＴＣ（配列番号３６）であり、生成されるアンプリコンは８２２ｂｐの予想されるサイズを有する。

結果及び結論
図３に示されるように、明確な増幅生成物が、Ｃａｓ９複合体及び逆転写酵素で処理されたＤＮＡ断片の増幅後に見られた。増幅生成物は３３７ｂｐ又は２０４ｂｐの予想されるサイズを示し、本明細書に詳述されている方法は実際に、選択的な予め決定された配列を用いて目的のＤＮＡ断片の３’末端を伸長できることが確認された。

生成された一本鎖オーバーハングは、下流の処理において、例えばその後のディープシークエンシングのためにＤＮＡ断片にオリゴヌクレオチドをアニールするために、使用され得る。実際に、オリゴヌクレオチドは、生成された３’オーバーハングに直接的にアニールすることができ、生成された生成物は増幅され、８２２ｂｐの予想されるサイズを有する適用生成物を生成した（図３を参照）。

新たに付加される一本鎖ＤＮＡの配列を変更することにより、特異的なオリゴヌクレオチドは、生成されたオーバーハングにアニールすることができる。実際に、２つの異なる一本鎖オーバーハングが、切断されたＤＮＡ断片の各々の部位において作り出され得ること、続いて断片の１つの部位において１つのオリゴヌクレオチド及びＤＮＡ断片の他の部位において別のオリゴヌクレオチドをアニールし得ることをこの実験は示す。

例えば、各々のＤＮＡ試料の特異的なオーバーハングを設計すること、並びに／又は各々の目的の遺伝子の特異的なオーバーハング、及び／若しくは単一の遺伝子の各々の部位の特異的なオーバーハング（そのため第１の鎖の３’末端において生成される特異的なオーバーハング及び単一の遺伝子の相補鎖の３’末端において生成される別の一本鎖オーバーハング）を作り出すことが可能であり得る。それゆえ、方法は、生成された３’－オーバーハングが実験の特定の必要性に直接的にカスタマイズされ得る多用途のプラットフォームを提供する。

Claims

標的核酸断片を標識する方法であって、前記標的核酸断片が第１の鎖及び相補的な第２の鎖を含み、前記標的核酸断片が目的の配列を含み、前記方法が、
ａ）二本鎖核酸分子を含む試料を提供するステップであり、前記二本鎖核酸分子が目的の前記配列を含む、ステップ；
ｂ）前記二本鎖核酸分子を部位特異的ヌクレアーゼと接触させて二本鎖切断を生成するステップであり、前記二本鎖切断が前記標的核酸断片の前記第１の鎖の遊離３’末端を結果としてもたらす、ステップ；並びに
ｃ）前記切断された核酸分子をＤＮＡポリメラーゼ及び鋳型分子と接触させ、好ましくは前記切断された核酸分子を逆転写酵素及び鋳型ＲＮＡ分子と接触させ、それにより、１つ又は複数のヌクレオチドで前記標的核酸断片の前記第１の鎖の前記遊離３’末端を標識するステップ
を含み、
任意選択でステップｂ）における前記部位特異的ヌクレアーゼ及びステップｃ）における前記逆転写酵素が別々の実体である、方法。
前記方法が、
ｄ）前記二本鎖核酸分子を第２の部位特異的ヌクレアーゼと接触させて第２の二本鎖切断を生成するステップであり、前記第２の二本鎖切断が前記標的核酸断片の前記第２の鎖の遊離３’末端を結果としてもたらす、ステップをさらに含み、好ましくはステップｄ）がステップｂ）と同時に行われる、請求項１に記載の方法。
前記方法が、
ｅ）前記標的核酸断片をＤＮＡポリメラーゼ及び第２の鋳型分子と、好ましくは逆転写酵素及び第２の鋳型ＲＮＡ分子と接触させ、それにより、１つ又は複数のヌクレオチドで前記標的核酸断片の前記第２の鎖を前記遊離３’末端において標識するステップをさらに含み、好ましくはステップｅ）がステップｃ）と同時に行われる、請求項２に記載の方法。
ステップｂ）及び／又はステップｄ）における前記部位特異的ヌクレアーゼが、好ましくはＣａｓ９又はＣｐｆ１ヌクレアーゼのうちの少なくとも１つ及びガイドＲＮＡを含む、ＣＲＩＳＰＲ－ヌクレアーゼ複合体である、請求項１～３のいずれか一項に記載の方法。
ステップｃ）の前記鋳型ＲＮＡ分子が、前記標的核酸断片の前記第１の鎖の前記３’末端における配列にアニールできるその３’末端における配列を含み、任意選択でステップｅ）の前記鋳型ＲＮＡ分子が、前記標的核酸断片の前記第２の鎖の前記３’末端における配列にアニールできるその３’末端における配列を含む、請求項１～４のいずれか一項に記載の方法。
前記鋳型ＲＮＡ及び前記ガイドＲＮＡが別々のＲＮＡ分子である、請求項４又は５に記載の方法。
前記第１の鎖を伸長するヌクレオチドの配列が、前記標的核酸断片の前記第２の鎖を伸長するヌクレオチドの配列とは異なり、好ましくは前記第１及び第２の鎖を伸長する前記１つ又は複数のヌクレオチドが、９０％、８０％、６０％より低い、又は４０％より低いヌクレオチド配列同一性を有する、請求項１～６のいずれか一項に記載の方法。
前記方法が、
ｆ）第１のオリゴヌクレオチドを、前記標的核酸断片の前記第１の鎖の前記標識された３’末端にアニールするステップであり、任意選択で前記鋳型ＲＮＡ及びガイドＲＮＡが前記第１のオリゴヌクレオチドをアニールする前に分解される、ステップ
をさらに含み、
好ましくは前記第１の鎖の前記標識された３’末端にアニールする前記オリゴヌクレオチドが、通常のハイブリダイズ条件下で前記第２の鎖の、任意選択で標識された前記３’末端にアニールすることが可能でない、請求項１～７のいずれか一項に記載の方法。
ステップｆ）が、第２のオリゴヌクレオチドを、前記第２の鎖の前記標識された３’末端にアニールすることをさらに含み、好ましくは前記第２の鎖の前記標識された３’末端にアニールする前記オリゴヌクレオチドが、通常のハイブリダイズ条件下で前記第１の鎖の、任意選択で標識された前記３’末端にアニールすることが可能でない、請求項８に記載の方法。
前記方法が、
ｇ）１つ又は複数の前記アニールされたオリゴヌクレオチドをライゲート及び／又は充填するステップ
をさらに含む、請求項８又は９に記載の方法。
前記第１及び第２のオリゴヌクレオチドのうちの少なくとも１つが、ＵＭＩ、バーコード及びプライマー結合部位のうちの少なくとも１つを含む、請求項８～１０のいずれか一項に記載の方法。
１つ又は複数の標的核酸断片をシークエンシングする、好ましくはディープシークエンシングする方法であって、
（ｉ）請求項１～１１のいずれか一項に定義される１つ又は複数の標識された標的核酸断片を得るステップ；
（ｉｉ）任意選択で前記１つ又は複数の標識された標的核酸断片を増幅する、好ましくは選択的に増幅するステップ；及び
（ｉｉｉ）任意選択で増幅された前記１つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップ
を含み、
好ましくは前記１つ又は複数の標的核酸断片が１つ又は複数の核酸試料から得られ、任意選択で前記１つ又は複数の標的核酸断片がステップ（ｉ）の後及び／又はステップ（ｉｉ）の後にプールされる、方法。
請求項１～１１のいずれか一項に記載の方法により得ることが可能である標識された標的核酸断片又は請求項１２に記載の方法により得ることが可能であるディープシークエンシングライブラリー。
請求項１～１２のいずれか一項に記載の方法における使用のための、部位特異的ヌクレアーゼ並びに逆転写酵素及び鋳型ＲＮＡ分子のうちの少なくとも１つをコードする構築物であって、好ましくはガイドＲＮＡをさらにコードする、構築物。
請求項１～１２のいずれか一項に記載の方法における使用のための、少なくとも第１、第２及び第３の構成要素を含むパーツのキットであって、
前記第１の構成要素が、部位特異的ヌクレアーゼ、又はそれをコードする構築物、及び任意選択でガイドＲＮＡ、又はそれをコードする構築物であり；
前記第２の構成要素が、逆転写酵素、又はそれをコードする構築物であり；
前記第３の構成要素が、鋳型ＲＮＡ分子、又はそれをコードする構築物であり、
前記キットが、好ましくは、第４、第５、第６及び第７の構成要素のうちの少なくとも１つをさらに含み、
前記第４の構成要素が、請求項８、９及び１１のいずれか一項に定義される１つ又は複数のオリゴヌクレオチドであり、前記１つ又は複数のオリゴヌクレオチドが、ＵＭＩ、バーコード及びプライマー結合部位のうちの少なくとも１つを任意選択で含み；
前記第５の構成要素が、請求項１２に定義される標識された標的核酸断片の増幅のための１つ又は複数のプライマーであり；
前記第６の構成要素が、前記標識された標的核酸断片の非選択的な増幅のための１つ又は複数のプライマーであり；
前記第７の構成要素が、標的核酸断片のサブセットの選択的な増幅のための１つ又は複数のプライマーである、キット。