JP2023503395A

JP2023503395A - １種以上の標的特異的プログラム可能ヌクレアーゼの細胞におけるオフターゲット活性を明らかにするための、ｉｎｖｉｔｒｏでの真の不偏的なアッセイ（Ａｂｎｏｂａ－Ｓｅｑ）

Info

Publication number: JP2023503395A
Application number: JP2022523081A
Authority: JP
Inventors: カトメントニー; ハースシモン・アレクサンドラ; ヒルデンボイテルマーカス; モスリンクラウディオ; べリスメラニー; アンドリュージェフリー
Original assignee: アルベルト－ルートヴィヒ－ウニヴェルズィテートフライブルク
Priority date: 2019-10-21
Filing date: 2020-10-16
Publication date: 2023-01-30
Also published as: KR20220084322A; EP3812472A1; EP3812472B1; DK3812472T3; LT3812472T; WO2021078645A1; ES2938896T3

Abstract

本発明は、1 μg未満のゲノムDNAのインプット試料中の非特異的部位の検出を可能にする、ゲノム中の1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的部位をin vitroで検出する方法に関する。本発明はまた、ゲノム中の1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的部位を検出するためのin vitro法を用いて、非特異的部位をin vitroで検出する方法に関する。

Description

発明の技術分野

本発明は、ゲノム中の1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的部位をin vitroで検出する方法であって、1 μg未満のゲノムDNAのインプット試料中の非特異的部位の検出を可能にする方法に関する。本発明はまた、ゲノム中の1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的部位を検出するためのin vitro法を用いて、非特異的部位をin vivoで検出する方法に関する。

背景

クラスター化して規則的な配置の短い回文配列リピート(CRISPR)/Cas型のヌクレアーゼだけではなく、転写活性化因子様エフェクターヌクレアーゼ(TALEN)やZnフィンガーヌクレアーゼ(ZFN)によるゲノム編集は、臨床研究において既に治療的に使用されている。これらのカスタム化された標的特異的プログラム可能ヌクレアーゼは、ゲノム中の特定の領域に標的化されることができ、そこで、それらは、細胞DNA修復機構を誘発する二本鎖DNA(dsDNA)切断を導入する。導入されたdsDNA切断は、2つの主要な細胞修復経路である非相同末端結合(NHEJ)または相同性指向性修復(HDR)のいずれかによって修復される(Hustedt及びDurocher, 2016, Nat Cell Biol 19(1):1-9)。

ZFN、TALEN、及びメガヌクレアーゼのような標的特異的プログラム可能ヌクレアーゼは、タンパク質-DNA認識に依存するが、CRISPR/Cas RNAガイドヌクレアーゼ(CRISPR/Cas RGN)の特異性は、RNA-DNA認識に依存する。CRISPR/Cas RGNにおいて、ガイドRNA(gRNA)は、プロトスペーサー隣接モチーフ(PAM)の隣の約20ヌクレオチド長の配列(標的配列)とハイブリッド形成し、Casエンドヌクレアーゼが標的部位を切断することを可能にする(Wiedenheftら, 2012, Nature 482, 331-38；Termら, 2011, Curr Opin Microbiol 14,321-327)。gRNAの5'末端のヌクレオチド配列を変更することにより、CRISPR/Cas RGNが標的とする部位が改変される。その活性形態において、CRISPR/Cas RGNはリボ核タンパク質(RNP)であり、ここで、CasエンドヌクレアーゼはガイドRNA(gRNA)に結合している。一般的に使用されるCasエンドヌクレアーゼは、Cas9、Cpf1、及びそれらの変異体を含む。例えば、ゲノム編集ツールを開発するために、Streptococcus pyogenes、Neisseria meningitidis、Staphylococcus aureus、Streptococcus thermophilus、及びTreponema denticolaに由来する異なるCas9エンドヌクレアーゼは使用されている。

実際の標的配列(特異的部位)に加えて、標的特異的プログラム可能ヌクレアーゼは、実際の標的配列、いわゆる非特異的部位からある程度異なるゲノム内の部位で活性化され、それにより、特異的部位から数ヌクレオチドまで異なる非特異的部位でdsDNA切断突然変異を産生することができる。例えば、CRISPR-Cas9ヌクレアーゼはgRNAと標的DNAとの間で、特に標的部位のPAM-遠位領域で、最大で6つの不適正塩基対に耐えられることが示された（例えば、Tsaiら, 2015, Nat Biotechnol 33(2):187-197)。

ヒト細胞におけるオフターゲット活性は、潜在的に有害な結果をもたらすことができる。ゲノム中の非特異的部位でのdsDNA切断の産生は、注意深く監視する必要がある挿入及び欠失(挿入欠失)並びに転座を産生することができる。例えば、非特異的部位がコード領域または調節エレメント内に位置する場合、最悪の場合には、細胞の発癌性変性を誘発しうる。従って、標的特異的プログラム可能ヌクレアーゼのオフターゲット活性を測定しなければならず、必要に応じて、ゲノム編集ツールが臨床セッティングに使用され得る前に、使用される標的特異的プログラム可能ヌクレアーゼの特異性を最適化しなければならない。従って、標的特異的プログラム可能ヌクレアーゼの治療的使用に関連して、オフターゲット効果の理解及び予防が重要である。

重要なことに、一塩基多型(SNP)のようなゲノムにおける個体差、ならびに細胞型特異的染色質状態は、任意の標的特異的プログラム可能ヌクレアーゼのオン及びオフターゲットプロフィールを変化させることができる(Lessardら, 2017, Proc Natl Acad Sci USA 114((52):E11257-E11266; Verkuijl及びRots, 2019, Curr Opin Biotechnol 55:68-73.)。これは、特定の標的特異的プログラム可能ヌクレアーゼを治療的に適用する前に、潜在的な非特異的部位を細胞型特異的かつ個別的に同定する必要性をさらに強調している。

標的特異的プログラム可能ヌクレアーゼのオフターゲット活性を測定するために、それぞれ利点及び欠点を有する様々な方法が開発されてきた(Kimら, 2019, Annu Rev Biochem 88:191-220に要約されている)。一方で、潜在的な非特異的部位は、そのような潜在的な非特異的部位の実際の標的配列への配列類似性に基づいて生体情報アルゴリズムを用いてin silicoで予測することができ、次いで、例えば、次世代シークエンシング(NGS)を用いて、標的増幅産物配列決定によって調査することができる。オンターゲット配列と比較して既に単一の不適正塩基対の影響は、必ずしも予測可能ではない。また、ゲノムまたはエピゲノムの文脈、またはその両方はまた、切断頻度に影響を与えるかもしれない。このため、潜在的な非特異的部位を識別できるアルゴリズムを開発することは非常に困難である。このようなin silicoベースの方法は、高速で比較的安価である。

しかし、これらのin silicoでの方法は、真陽性率が低い傾向(低感度)がある。このようなアルゴリズムによって見過ごされた部位でのオフターゲット活動は検出されない。

代替として、オフターゲット活性を実験的に測定することができる。これは、該検出がコンピュータ支援予測によって惹起されないことを意味する。実験的方法は、より手間がかかり、高価である。これらはまた、克服しなければならない技術的及び生体情報的な制限を受ける。特異性を測定するための異なる実験アプローチとして、例えば、GUIDE-Seq、DISCOVER-Seq、HTGTS、TEG-Seq、Digenome-Seq、CIRCLE-Seq、及びSITE-Seqが公知である。これらは、細胞ベースの方法及びin vitroでの方法に大別することができる。

細胞ベースのアッセイ/方法GUIDE-Seq(Tsaiら, 2015, Nat Biotechnol 33(2):187-197)、TEG-Seq (US 2018/0016572 A1)、DISCOVER-Seq (Wienertら, 2019, Science 364(6437):286-289)、及びHTGTS(WO 2016/081798 A1)は、標的特異的プログラム可能ヌクレアーゼ活性によって誘発される細胞修復メカニズムを利用することによって、生きた細胞中の非標的部位を標識する。GUIDE-Seqは、標的特異的プログラム可能ヌクレアーゼに加えて、短鎖二本鎖オリゴデソキシヌクレオチド(dsODN)を細胞内に導入する細胞ベースの方法である。ヌクレアーゼがゲノムを切断すると、短いdsODNが二本鎖切断の部位でDNAに組み込まれ、その後、ハイスループットシークエンシングのための出発点として作用する。該方法は良く機能するが、ゲノムの重要な部位で異なる個体に由来する細胞とは区別できる特定の細胞株にのみ機能する。

Target Enriched GUIDE-Seq("TEG-Seq 1"；US 2018/0016572 A1)は、細胞株内で、標的特異的プログラム可能ヌクレアーゼによって産生されたオンターゲット及びオフターゲットDNA二本鎖切断を検出するための別の細胞ベースの方法である。TEG-Seqにおいて、GUIDE-Seqのように、該方法の最初のステップは細胞内で行われ、CRISPR-Casと二本鎖DNA"タグ"との細胞株への同時遺伝子導入を含む。これは、細胞DNA修復機構を利用して、ゲノムDNAが切断された"タグ"を挿入する。TEG-Seqは、GUIDE-Seqの最適化されたバージョンであり、NGS機器のイオントレントファミリーに適応し、シーケンシングの前に関連する増幅産物を濃縮し、バーコードによる実験の多重化を可能にすることで、非特異的配列の読み取りを減少させる。

重要なことに、TEG-Seqは、GUIDE-Seqのように、細胞株におけるCRISPR-Cas及び二本鎖DNA"タグ"の同時遺伝子導入の効率、また、"タグ"を切断されたゲノムDNAに挿入するための細胞DNA修復機構の効率に依存している。これらは、固有の変異性の供給源（例えば、遺伝子導入効率及び選択された細胞型/細胞株の細胞DNA修復機構械の効率)である。また、GUIDE-Seqのように、一次細胞における二本鎖DNA"タグ"の毒性が観察されたため、TEG-Seqが特定の細胞（例えば、患者由来の一次細胞)に簡単に転送できないか、まったく転送できない。さらに、TEG-Seq及びGUIDE-Seqの両方は、偽陽性を最小にするために、ガイド及びPAM配列との類似性に基づいて、可能なオフターゲットの配列及びゲノム位置を同定することに依存しているため、標的部位との相同性が最も小さい非特異的部位を見逃す可能性がある。

DISCOVER-Seq(Wienertら, 2019, Science 364(6437):286-289)は、ChIP-seq法に基づく別の細胞ベースの方法である。遺伝物質が標的特異的プログラム可能ヌクレアーゼにより切断される場合、これは細胞修復機構を誘発し、MRE11のようなDNA修復タンパク質はDNA二本鎖切断に補充される。次いで、DNAを、それに結合したタンパク質と架橋固定する。得られた"染色質DNA"を断片化し、MRE11に対する抗体を用いて、結合されたMRE11タンパク質を有する全てのDNA断片を沈殿させる。最後に、単離されたDNA断片のNGSにより、オフターゲット活性を有する部位を同定することができる。該方法は、細胞内の実際のdsDNA切断を測定するが、標的特異的プログラム可能ヌクレアーゼに誘導されないものも測定する。また、該方法は、細胞固定時にまだ修復されていないDNA二本鎖切断のみを検出することができる。従って、想定できるように、偽陽性と少数の真陽性の結果によって、該方法の適用可能性が制限される。

HTGTS、またはハイスループット、ゲノムワイド転座配列決定(WO 2016/081798 A1)は、また別の細胞ベースのアッセイである。HTGTS は、細胞株にオンターゲット及びオフターゲットDNA二本鎖切断(DSB)を産生する標的特異的プログラム可能ヌクレアーゼの発現により誘導された転座の検出に基づいている。HTGTS は、例えば、細胞の中、特異部位で、DSB が別の付随的に誘導されたDSB に、例えば非特異的部位で連結され得るという観察に基づいている。該2つのDSB が異なる染色体上に位置する場合、その結果は染色体転座である。このような事象を同定するために、標的特異的プログラム可能ヌクレアーゼで遺伝子導入された細胞のゲノムDNAを抽出し、断片化し、産生されたDNA断片にアダプターを連結させる。次いで、標的部位に近接して結合するベイトプライマー結合を用いて、直線増幅媒介(LAM)-PCRにより転座を増幅する。一本鎖PCR産物を精製した後、連結によりアダプターを添加する。アダプター及び遺伝子座に特異的なプライマーを有するネステッドPCRは、ベイト-プレ接合部を囲む核酸配列を増幅し、該2次PCRの産物は、配列決定され、DNA二重鎖切断の染色体位置及び転座を同定するため、参照配列に対して配列される。

一般に、これらの細胞ベースの方法は、ある細胞株において非常に良く機能する。しかし、例えば、一次細胞におけるdsODNの毒性が観察されたため、GUIDE-Seq及びTEG-Seqは、ある種の細胞（例えば、患者由来の一次細胞)に簡単に転送できないか、まったく転送できない。他方、DISCOVER-Seq及びHTGTSは、低い特異性と感度の両方を示すので、多くのインプット材料を必要とする。例えば、DISCOVER-Seqは、実験インプットとして2～10百万個の細胞を必要とする(Wienertら, 2019, Science 364(6437):286-289)一方、HTGTSは、20～100 μgのゲノムインプット(3～15百万個の細胞に相当)を必要とする(WO 2016/081798 A1)。従って、これらの方法は、個別化された標的特異的プログラム可能ヌクレアーゼの特異性分析、特に試料量及び利用可能性が制限された細胞の分析にはあまり適していない。

in vitro方法Digenome-Seq(Kimら, 2015, Nat Methods 2(3):237-243)、CIRCLE-Seq(Tsaiら, 2017, Nat Methods 14(6)：607-614)、及びSITE-Seq (Cameronら, 2017, Nat Methods 14(6):600-606)は、in vitroでCRISPR-Cas RGNによって単離されたゲノムDNA中で切断される部位を標識することによって、非特異的部位を同定する。

Digenome-Seqでは、ゲノムDNAは、標的特異的プログラム可能ヌクレアーゼを用いて試験管内で切断される。DNAアダプターは、プライマーが結合し得る破壊部位に連結され、次に、これはハイスループットシークエンシングのために使用される。このアプローチの主な欠点として、参照ゲノムも配列決定されなければならず、濃縮ステップがないために、高価な高性能シーケンサ（例えば、HiSeq）で行う必要がある。そのため。該アプローチは非常に高価になる。また、比較的に大量のゲノムインプットDNAを使用しなければならない。該方法について、公開された欧州特許出願EP 3 219 810 A1を参照できる。

CIRCLE-Seqでは、まず、ゲノムDNAを超音波により断片化し、個々の断片をリング状分子に連結する。次のステップでは、該環状DNAをCRISPR-Cas RGNで切断して直鎖化された分子を得る。これらの直鎖化された分子の末端にアダプターを連結させ、その後、非特異的部位の配列決定及び同定のために使用することができる。該方法の主な欠点として、大量のゲノムインプットDNAを使用しなければならない。該方法について、米国特許第9,850,484号を参照できる。

SITE-Seqでは、ゲノムDNAは、標的特異的プログラム可能ヌクレアーゼを用いて試験管内で切断される。ビオチン化されたアダプターは、切断された部位に連結され、これにより、酵素断片化後に分子を濃縮することができる。その後、アダプターは、それらの末端で連結され、これは、オフターゲットの配列決定及び同定に使用することができる。また、該方法は、比較的大量のゲノムインプットDNAを必要とする。

これらのin vitro法の主な欠点として、比較的大量のゲノムインプットDNAを使用しなければならない(方法によって約8～25 μg)。これにより、限られた試料量の貴重な細胞試料でのオフターゲット分析が困難であるか、または不可能でさえある。さらに、in vitro法の特徴として、一般に、偽陽性率が高い(低い特異性)。即ち、in vitroで切断された非特異的部位の多くは、細胞では切断されていない。これは、例えば、細胞内の標的特異的プログラム可能ヌクレアーゼの濃度が低いか、または、これらの部位が染色質構成のためにアクセスできないためである(Kimら, 2019, Annu Rev Biochem 88：191-220)。

要約すると、主に、現在のin vitroアッセイに大量のインプットDNAが必要であり、または、細胞ベースの方法がある種の細胞、例えば一次細胞に簡単に転送できない。そのため、限られた試料量で細胞上に個別化された方法で上記方法を使用することは制限されている。

限られた試料量及び利用可能性の、貴重な細胞試料のゲノムDNA中の非特異的部位の個別化された方法で検出できる、ゲノム中の1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的部位を検出する方法が必要とされている。

本発明者らは、限られた試料量の貴重な細胞試料中、ゲノム編集の分野における非特異的部位の検出を可能にする、ゲノム(Abnoba-Seq)中の1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的部位をin vitroで検出する方法を見出した。Digenome-Seq、CIRCLE-Seq、及びSITE-Seqのような確立されたin vitroでの方法とは対照的に、本発明の方法は、最少量のゲノムインプットDNA(<1 μg、約150,000個以下の細胞に相当)を必要とする。これは、制限された供給量の非常に少ない細胞試料、例えば、一次細胞、生検物質または遺伝子編集された移植片から誘導されたゲノムDNA上の1種以上の標的特異的プログラム可能ヌクレアーゼの試験を可能にする。また、本発明の方法は、基本的な(低コストの)NGSシーケンサを用いて実施することができ、HiSeq配列決定システムのような高価な高性能シーケンサを必要としない。最後に、本法は、既に確立されたin vitroでの方法と同等の感度で、かつ、匹敵する方法よりも有意に優れた特異性を意味するより低い偽陽性率で、非特異的部位を同定することができる。

第2態様では、本発明はまた、in vitroのゲノム(二重-Abnoba-Seq)中の1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的部位を検出する方法を用いて、in vivoで非特異的部位を検出する方法を提供する。従って、該方法は、限られた試料量と利用可能性の貴重な細胞試料中の1種以上の標的特異的プログラム可能ヌクレアーゼのin vivo特異性の測定を可能にし、換言すれば、特定の少ない試料量の細胞における1種以上の標的特異的プログラム可能ヌクレアーゼの実際のオフターゲット活性を測定できる。これは、本発明の第2態様による方法を用いて、in vivoで標的特異的プログラム可能ヌクレアーゼ活性を試験し、特定の組織または限られた試料量と利用可能性の特定の標的特異的プログラム可能ヌクレアーゼの実際のin vivo活性を実証できることを意味する。第3態様では、本発明は、本発明の第1態様による方法または本発明の第2態様による方法を実施するためのキットを提供する。

従って、本発明は、以下の[1]～[84]項で定義される主題に関する。

[1]ゲノム中の1種以上の標的特異的プログラム可能ヌクレアーゼの標的外部位をin vitroで検出する方法であって、以下のステップを含む方法。
(a)ゲノムDNAを含むインプット試料を準備し、前記ゲノムDNAをdsDNA断片に無作為に断片化し、前記dsDNA断片の末端にブロッキングアダプターを連結し、末端がブロックされていない末端を含むdsDNA断片を除去して、精製された末端ブロックdsDNA断片を調製するステップ；
(b)切断及び増幅されたdsDNA断片のDNAライブラリーを調製するステップであって、以下により行われるステップ；
b1)前記精製された末端ブロックdsDNA断片を、1種以上の標的特異的プログラム可能ヌクレアーゼで切断して、切断されたdsDNA断片を得る；
b2)切断されたdsDNA断片の開裂部位にアフィニティーアダプターを連結して、アフィニティーアダプター修飾dsDNA断片を得る；
b3)アフィニティーアダプター修飾dsDNA断片を、前記アフィニティーアダプターを用いて濃縮して、濃縮されたアフィニティーアダプター修飾dsDNA断片を得る；及び
b4)濃縮されたアフィニティーアダプター修飾dsDNA断片を、PCR増幅により増幅して、切断及び増幅されたdsDNA断片のDNAライブラリーを得る。
(c)前記切断及び増幅されたdsDNA断片のDNAライブラリーの配列決定を行い、配列読み取りを得るステップ；
(d)前記配列読み取りを参照ゲノムに整列させて、整列された配列読み取りを得るステップ；及び
(e)推定開裂部位を決定し、偽陽性開裂部位を除外することにより開裂部位を同定するステップであって、推定開裂部位は、前記参照ゲノムにおいて、整列された配列読み取りの配列読み取り開始部分及び配列読み取り終了部分が共に一致する配列領域を探し出すこと、ならびに、推定開裂部位を、これらの配列領域において、配列読み取り開始部分及び配列読み取り終了部分が一致する部位として同定することによって決定するステップ。

[2]ステップ(a)で準備されたインプット試料中のゲノムDNAが、ヒトゲノムDNAである、1項に記載の方法。

[3]前記ゲノムDNAが、単離されたゲノムDNAである、前記いずれか1項に記載の方法。

[4]前記インプット試料が、1 μg未満、好ましくは900 ng未満、より好ましくは800 ng未満、より好ましくは約700 ng以下、さらに好ましくは約650 ng、さらに好ましくは約600 ng、あるいは好ましくは約500 ng、あるいは好ましくは約400 ng、あるいは好ましくは約300 ngのゲノムDNAを含む、前記いずれか1項に記載の方法。

[5]前記ゲノムDNAが、超音波処理、音響剪断、遠心剪断、ポイントシンク剪断、ニードル剪断、または酵素ベースの断片化によって、好ましくは超音波処理によって断片化される、前記いずれか1項に記載の方法。

[6]ステップa1)において、前記ゲノムDNAが、断片サイズの平均または中央値、好ましくは中央値、100～2000 bp、好ましくは200～800 bp、より好ましくは約300～600 bp、さらに好ましくは約400～500 bp、さらに好ましくは約400 bp、さらに好ましくは400 bpのdsDNA断片に無作為に断片化される、前記いずれか1項に記載の方法。

[7]ステップa)が、
a1)前記ゲノムDNAを規定された長さに無作為に断片化して、dsDNA断片を提供するステップ；
a2)ブロッキングアダプターを連結することにより前記dsDNA断片の末端を保護し、末端ブロックdsDNA断片を得るステップ；及び
a3)末端ブロックdsDNA断片を含む試料を1種以上のエキソヌクレアーゼと接触させて、末端がブロックされていないdsDNA断片を除去して、精製され、末端ブロックDNA断片を得るステップ
を含む、前記いずれか1項に記載の方法。

[8]ステップa)において、前記ブロッキングアダプターが、酵素的または化学的な連結、好ましくは酵素的連結によって連結される、前記いずれか1項に記載の方法。

[9]ステップa)において、前記dsDNA断片の末端にブロッキングアダプターを連結することが、
e1)ブロッキングアダプター連結のために前記dsDNA断片を調製し；そして、
e2)dsDNA断片の末端にブロッキングアダプターを連結して、末端ブロックdsDNA断片を得ること
を含む、前記いずれか1項に記載の方法。

[10]ブロッキングアダプター連結のために前記dsDNA断片を調製することは、断片化されたdsDNAを末端修復すること及びdAテーリングすることのうちの一方または両方を含む、9項に記載の方法。

[11]ステップa)において、前記ブロッキングアダプターが、DNAベースのアダプター、好ましくはdsDNAベースのアダプターである、前記いずれか1項に記載の方法。

[12]前記ブロッキングアダプターが、前記ブロッキングアダプターがdsDNA断片に連結された後、前記ブロッキングアダプターが該dsDNA断片に連結された末端の連結を防止する1つ以上の修飾、及び前記ブロッキングアダプターがdsDNA断片に連結された後、前記ブロッキングアダプターが該dsDNA断片に連結された末端から該dsDNA断片のエキソヌクレアーゼ切断を防止する、1つ以上の修飾を含む、前記いずれか1項に記載の方法。

[13]前記dsDNAベースのブロッキングアダプターが、好ましくは該dsDNAベースのブロッキングアダプターの各鎖上に、好ましくは前記dsDNAベースのブロッキングアダプターを前記dsDNA断片に連結するために使用されないdsDNAベースのブロッキングアダプターの末端に、1つ以上のホスホロチオエート結合、1つ以上の内部デオキシウリジン、1つ以上のC3-スペーサー、1つ以上のジデオキシ-G/ジデオキシ-C、または他のスペーサー、及びそれらの組み合わせ、好ましくは1つ以上のC3-スペーサーと好ましくは2つのホスホロチオエート結合との組み合わせを含む、11または12項に記載の方法。

[14]前記dsDNAベースのブロッキングアダプターが、好ましくは該dsDNAベースのブロッキングアダプターの各鎖上に、好ましくは前記dsDNAベースのブロッキングアダプターを前記dsDNA断片に連結するために使用されないdsDNAベースのブロッキングアダプターの末端に、1つ以上のC3-スペーサー、1つ以上のジデオキシ-G/ジデオキシ-C、または他のスペーサー、好ましくは1つ以上のC3-スペーサーを含む、11～13項に記載の方法。

[15]前記dsDNAベースのブロッキングアダプターが、好ましくは前記dsDNAベースのブロッキングアダプターを前記dsDNA断片に連結するために使用されないdsDNAベースのブロッキングアダプターの末端に、2つ以上のホスホロチオエート結合、好ましくは前記dsDNAベースのブロッキングアダプターの各鎖に少なくとも1つ、より好ましくは前記dsDNAベースのブロッキングアダプターの各鎖に少なくとも2つ含む、11～14項に記載の方法。

[16]ステップa)において、前記ブロッキングアダプターが、PCRプライミングに使用するのに適合するプライマー部位を含む、前記いずれか1項に記載の方法。

[17]ステップa2)において、前記ブロッキングアダプターが、配列番号:01に定義された順方向配列及び配列番号:02の逆方向配列を含むか、またはそれらからなるdsDNAベースのアダプターである、12または16項に記載の方法。

[18]前記方法は、ステップa)において、末端がブロックされていない末端を含むdsDNA断片を除去することは、前記末端がブロックされたdsDNA断片を含む試料を、1種以上のエキソヌクレアーゼと接触させて、dsDNA断片を除去し、精製され、末端ブロックDNA断片を得ることを含む、前記いずれか1項に記載の方法。

[19]ステップa)において、前記1種以上のエキソヌクレアーゼが、1種以上のエキソヌクレアーゼIII、エキソヌクレアーゼV、エキソヌクレアーゼVIII、λエキソヌクレアーゼ、T5エキソヌクレアーゼ、T7エキソヌクレアーゼ、ヌクレアーゼBAL-31、及びそれらの組み合わせ、好ましくはエキソヌクレアーゼIII、λエキソヌクレアーゼ、またはそれらの組み合わせ、場合によって、さらに、エキソヌクレアーゼI、熱安定性エキソヌクレアーゼI、エキソヌクレアーゼT、エキソヌクレアーゼVII、RecJf、リョクトウヌクレアーゼ、ヌクレアーゼP1、及びそれらの組み合わせから選択される1つ以上を含む、前記いずれか1項に記載の方法。

[20]ステップa)において、前記1種以上のエキソヌクレアーゼが、例えば、2：20：5の酵素単位比で、混合エキソヌクレアーゼI、エキソヌクレアーゼIII、及びλエキソヌクレアーゼからなる、前記いずれか1項に記載の方法。

[21]ステップa)において、好ましくは、前記末端ブロックdsDNA断片を含む試料を1種以上のエキソヌクレアーゼで接触させた後、残りの末端がブロックされていないDNA断片の自由末端が脱リン酸化試薬で脱リン酸化される、前記いずれか1項に記載の方法。

[22]ステップa)において、前記脱リン酸化試薬が、1種以上のホスファターゼからなり、該1種以上のホスファターゼが、好ましくは、南極ホスファターゼ、ウシ腸アルカリホスファターゼ、Quick-CIP、エビアルカリホスファターゼ、及びそれらの組み合わせのうちの1つ以上を含むか、それらからなる、21項に記載の方法。

[23]ステップb1)において、400 ng未満、好ましくは300 ng未満、より好ましくは200 ng未満、さらに好ましくは100 ng未満、例えば約90 ng、約80 ng、約70 ng、約60 ng、または約50 ng、または約50 ng未満、例えば、約40 ngの、精製された末端ブロックdsDNA断片を、1種以上の標的特異的プログラム可能ヌクレアーゼで切断して、切断されたdsDNA断片を得る、前記いずれか1項に記載の方法。

[24]ステップb1)において、1,500,000個未満の単数体ゲノム、好ましくは1,500,000個未満の単数体ゲノム、より好ましくは80,000個未満の単数体ゲノム、より好ましくは60,000個未満の単数体ゲノム、さらに好ましくは50,000個未満の単数体ゲノム、例えば約45,000、約30,000、約20,000、または約15,000個の単数体ゲノムに相当する、精製された末端ブロックdsDNA断片が使用される、前記いずれか1項に記載の方法。

[25]前記精製された末端ブロックdsDNA断片が、前記精製された末端ブロックdsDNA断片を含む試料を1種以上の標的特異的プログラム可能ヌクレアーゼと接触させることによって切断される、前記いずれか1項に記載の方法。

[26]ステップb1)において、前記1種以上の標的特異的プログラム可能ヌクレアーゼが、TALEN、ZFN、メガヌクレアーゼ、メガTAL、Fokl-dCaas9、CRISPR/Cas RNAガイドヌクレアーゼ(CRISPR/Cas RGN)、アルゴノート-ファミリータンパク質ベースのDNAガイドDNAヌクレアーゼ、またはそれらの変異体、またはそれらの組み合わせから選択される、前記いずれか1項に記載の方法。

[27]ステップb1)において、前記1種以上の標的特異的プログラム可能ヌクレアーゼが、それぞれが好ましくは予め組み立てられたリボヌクレオチド(RNP)として使用される1つ上のCRISPR/Cas RGN（ここで、Casエンドヌクレアーゼが例えば1：3のモル比でガイドRNA(gRNA)に結合される）を含み、好ましくはそれからなる、26項に記載の方法。

[28]前記gRNAが、成分として、1つのRNAを含む単一gRNA(sgRNA)または2つのRNAを含む二重gRNA(dgRNA)であり、好ましくはcrRNA(CRISPR RNA)及びtracrRNA(トランス活性化crRNA)、好ましくはsgRNAである、27項に記載の方法。

[29]前記CRISPR/Cas RGNのCasエンドヌクレアーゼが、Cas9エンドヌクレアーゼまたはCas9エンドヌクレアーゼの変異体、またはCpf1エンドヌクレアーゼまたはCpf1エンドヌクレアーゼの変異体である、26～28項に記載の方法。

[30]前記1種以上の標的特異的プログラム可能ヌクレアーゼが、Cas9エンドヌクレアーゼまたはCas9エンドヌクレアーゼの変異体、Cpf1エンドヌクレアーゼまたはCpf1エンドヌクレアーゼの変異体、及びそれらの組み合わせから選択されるCasエンドヌクレアーゼを有するCRISPR/Cas RGN（ここで、好ましくは、該Cas9エンドヌクレアーゼまたはその変異体が、Streptococcus属、Neisseria属、Pasteurella属、Francisella属、及びCampylobacter属、例えば、S. pyogenes、Staphylococcus aureus、Neisseria meningitidis、Streptococcus thermophilus、またはTreponema denticolaからなる群より選択される1種から由来し、また、好ましくは、該Cpf1エンドヌクレアーゼまたはその変異体が、Lachnospira属、Butyrivibrio属、Peregrinibacteria, Acidominococcus属、Porphyromonas属、Prevotella属、Francisella属、Candidatus methanoplasma、及びEubacterium属、例えば、Candidatus Paceibacter、Acidaminococcus sp. BV3L6 またはLachnospiraceae bacterium ND2006からなる群から選択される1種に由来する）を含み、好ましくはそれからなる、26～29項に記載の方法。

[31]前記メガヌクレアーゼが、l-Scel、l-Ceul、Pl-Pspl、Pl-Scel、l-SceIV、l-Csml、l-Panl、l-Scell、I-Ppol、l-Scelll、l-Crel、l-Tevl、l-Tevll、及びl-Tevlllからなる群より選択される、26項に記載の方法。

[32]アフィニティーアダプターを連結して、アフィニティーアダプター修飾dsDNA断片を得るステップb2)が、
e1)連結のために切断されたdsDNA断片の開裂部位を調製し；そして
e2)切断されたdsDNA断片の開裂部位にアフィニティーアダプターを連結すること
を含む、前記いずれか1項に記載の方法。

[33]連結のために切断されたdsDNA断片の開裂部位を調製することが、前記断片化されたdsDNAを末端修復すること及びdAテーリングすることのうちの一方または両方を含む、32項に記載の方法。

[34]ステップb2)において、前記アフィニティーアダプターが、PCRプライミングに使用するのに適合するプライマー部位を含む、前記いずれか1項に記載の方法。

[35]ステップb2)において、前記アフィニティーアダプターが、dsDNAベースのアダプター、好ましくはアフィニティー精製のための1つ以上の修飾を含むdsDNAベースのアダプターである、前記いずれか1項に記載の方法。

[36]前記アフィニティー精製のための1つ以上の修飾が、ビオチン、ビオチンdT(ビオチン化デオキシチミジン)、ビオチンTEG(15原子トリエチレングリコールスペーサー)デスチオビオチン、二重ビオチン、光切断可能(PC)なビオチン、ビオチンアジド、ニトリロ三酢酸(NTA)、DNP TEG(2,4-ジニトロフェニル)、ジゴキシゲニン、タンパク質タグ、及びそれらの組み合わせを含むビオチン及びビオチンベースの修飾、好ましくはビオチン及びビオチンベースの修飾、及びそれらの組み合わせから選択される、35項に記載の方法。

[37]前記アフィニティーアダプターが、切断されたdsDNA断片の開裂部位にアフィニティーアダプターを連結した後に、アフィニティーアダプター修飾dsDNA断片の特異的な濃縮を可能にする1つ以上の修飾を含む、前記いずれか1項に記載の方法。

[38]ステップb3)において、固相支持体上に固定できるアフィニティーアダプター結合分子を用いて、アフィニティーアダプター修飾dsDNA断片を濃縮する、前記いずれか1項に記載の方法。

[39]ステップb3)において、ビーズ、好ましくは磁気ビーズが固体支持体として使用される、38項に記載の方法。

[40]前記磁気ビーズが、ポリマーで被覆された磁気ビーズであり、好ましくは、ダイナビーズMyoneストレプトアビジンC1、ダイナビーズM-270、ダイナビーズM-280、またはダイナビーズMyOneストレプトアビジンT1からなる群から選択される、39項に記載の方法。

[41]ステップb3)において、前記アフィニティーアダプター結合分子が、タンパク質であり、好ましくはストレプトアビジン、アビジン、アフィニティーアダプターの一部に特異的な抗体またはその機能的断片（例えば抗ジゴキシゲニン抗体）、ジゴキシゲニン結合タンパク質、またはそれらの変異体から選択され；より好ましくはストレプトアビジン、アビジン、またはそれらの変異体である、38～40項に記載の方法。

[42]ステップb3)において、前記アフィニティーアダプター結合分子が、好ましくは磁気ビーズ、好ましくはポリマーで被覆された磁気ビーズ、より好ましくはダイナビーズ上に固定されているストレプトアビジンである、38～41項に記載の方法。

[43]前記アフィニティーアダプターが、1つ以上のビオチンまたはビオチンベースの修飾を含むdsDNAベースのアダプターであり、前記アフィニティーアダプター結合分子が、好ましくは磁気ビーズ、好ましくはポリマーで被覆された磁気ビーズ上に固定されているストレプトアビジンまたはその変異体である、前記いずれか1項に記載の方法。

[44]ステップb4)において、切断及び増幅されたdsDNA断片のDNAライブラリーを得るステップは、
e1)線形PCR増幅のために、鋳型としてのアダプター結合分子を介して固体支持体に結合した、濃縮されたアフィニティーアダプターに修飾されたdsDNA断片及びアフィニティーアダプターに特異的なプライマーを使用する、第1のPCR増幅ステップ；及び
e2)該第1ステップの後、アダプター結合分子を介して固体支持体に結合した、濃縮されたアフィニティーアダプターに修飾されたdsDNA断片を反応混合物から除去した後、ブロッキングアダプターに特異的なプライマーを第2プライマーとして添加する、第2のPCR増幅ステップ
の2段階PCR増幅を含む、前記いずれか1項に記載の方法。

[45]ステップc)において、切断及び増幅されたdsDNA断片のDNAライブラリーの配列決定のために、
c1)配列決定のために、必要に応じて、配列決定アダプターを該dsDNA断片の両端に連結することにより、切断及び増幅されたdsDNA断片のDNAライブラリーを製作し；
c2)製作された切断及び増幅されたdsDNA断片のDNAライブラリーを、好ましくは次世代シークエンシング(NGS)により配列決定し、前記配列読み取りを得る、前記いずれか1項に記載の方法。

[46]ステップc1)において、配列決定のために、切断及び増幅されたdsDNA断片のDNAライブラリーを製作することは、配列決定アダプターを両端に連結するために、切断及び増幅されたdsDNA断片のDNAライブラリーを調製すること、好ましくは、切断及び増幅されたdsDNA断片のDNAライブラリーを末端修復すること及びdAテーリングすることのうちの一方または両方によって、切断及び増幅されたdsDNA断片のDNAライブラリーを調製することを含む、45項に記載の方法。

[47]ステップc1)において、配列決定アダプターを前記dsDNA断片の両端に連結され、該配列決定アダプターが、例えば、イルミナ配列決定アダプターである、45または46項に記載の方法。

[48]ステップc2)において、ドロップレットデジタルPCR（ddPCR）、好ましくはイルミナTruSeq用のddPCRライブラリー定量キットを備えたものを使用する、45～47項に記載の方法。

[49]ステップc2)において、イルミナ配列決定を、例えば、MiSeq試薬キットv2を用いて、例えば、MiSeq機器(イルミナ)上で実行する、45～48項に記載の方法。

[50]ステップb4)において、PCR増幅に用いる各プライマーが、配列決定用に適合するプライマー部位を含む、1～44項に記載の方法。

[51]前記PCR増幅に用いる各プライマーにおけるプライマー部位が、配列決定プライマー結合配列、好ましくは配列決定用に適合するNGSプライマー結合配列を含む、50項に記載の方法。

[52]ステップd)において、まず、
d1)配列読み取りからブロッキングアダプター、アフィニティーアダプター、及び任意の配列決定アダプター配列を除去し、トリミングされた配列読み取りを得て；そして、
d2)前記トリミングされた配列読み取りを参照ゲノムに位置づけて、整列された配列読み取りを得ることにより、
前記配列読み取りを参照ゲノムに整列させ、整列された配列読み取りを得る、前記いずれか1項に記載の方法。

[53]前記ゲノムDNAが、ヒトゲノムDNAであり、前記参照ゲノムが、例えば、hg16、hg17、hg1、hg19、及びhg38、好ましくはhg19またはhg38から選択されるヒト参照ゲノムである、前記いずれか1項に記載の方法。

[54]前記開裂部位の測定が、前記1種以上の標的特異的プログラム可能ヌクレアーゼのオンターゲット開裂部位に対する配列相同性に基づくものではない、前記いずれか1項に記載の方法。

[55]推定開裂部位が、前記参照ゲノム中の特定の部位に定義された短いDNA配列からなる、前記いずれか1項に記載の方法。

[56]推定開裂部位が、異なる推定開裂部位の間で相違しないように、設定された配列長を有する、前記いずれか1項に記載の方法。

[57]開裂部位が、前記参照ゲノム中の特定の部位に定義された短いDNA配列からなる、前記いずれか1項に記載の方法。

[58]開裂部位が、異なる開裂部位の間で相違しないように、設定された配列長を有する、前記いずれか1項に記載の方法。

[59]推定開裂部位及び/または開裂部位が、設定された配列長、好ましくは4 ntの配列長を有する、56または58項に記載の方法。

[60]ステップe)において、各配列領域が、定義された配列長、好ましくは約20～1000 nt、より好ましくは約50～500 nt、さらに好ましくは少なくとも約50 nt、さらに好ましくは少なくとも約80 nt、さらに好ましくは少なくとも約100 ntの配列長の配列群である、前記いずれか1項に記載の方法。

[61]ステップe)において、各配列領域は、定義された配列長さ、好ましくは約100 ntまたはその倍数、より好ましくは100 ntまたはその倍数の配列長の配列群である、60項に記載の方法。

[62]ステップe)において、推定開裂部位は、整列された配列読み取り開始部分と末端が一致する配列領域の特定部位として測定し、また、整列された配列読み取り開始部分と末端の合計の局所最大が発生するこれらの配列領域内の部位として測定される、前記いずれか1項に記載の方法。

[63]ステップe)において、非ゼロの読み取り開始部分及び読み取り終了部分被覆を有する各配列領域において、1つ以上の推定開裂部位が、整列された配列読み取り開始部分と配列読み取り終了部分が一致し、かつ、配列読み取り開始部分と配列読み取り終了部分の数の合計が局所最大を有する部位として測定される、前記いずれか1項に記載の方法。

[64]ステップe)において、推定開裂部位が、
- 整列された配列読み取りを含む参照ゲノム（のDNA配列）を、定義された長さ、好ましくは少なくとも約100 ntの配列群に分割し；そして
- 少なくとも1つの配列読み取り開始部分と少なくとも1つの配列読み取り終了部分を含む各配列群について、1つ以上の推定開裂部位を配列読み取り開始部分と配列読み取り終了部分の合計の局所的な最大値を有する部位として測定し、任意に、該配列群の中心までの距離を最小化すること
（ここで、配列読み取り開始部分が、整列された配列読み取りの最初の1～5 nt、好ましくは最初の2～4 nt、より好ましくは最初の3 ntからなり、また、配列読み取り終了部分が、その最後の1～5 nt、好ましくは最後の2～4 nt、より好ましくは最後の3 ntからなる。）
によって測定される、前記いずれか1項に記載の方法。

[65]ステップe)において、開裂部位が、
e1)整列された配列読み取りを含む参照ゲノム（のDNA配列）を、設定された配列長、好ましくは長さ約100 ntの配列群に分割し；
e2)好ましくは、各配列群について読み取りデータの被覆を測定し、読み取りデータの被覆が0の配列群を廃棄し、好ましくは、参照ゲノム中の配列順序に基づいて、読み取りデータの被覆が連続的に>0の配列群を配列群の連続的なセットに結合し；
e3)各配列群を、ウィンドウ幅以下、好ましくはそれより小さい設定されたステップサイズ、好ましくは2 ntで、幅が設定されたウィンドウ、好ましくは4 ntに分割し;
e4)以下のように群分けすることにより、各ウィンドウの開始、末端、及び背景被覆を測定し、
- 前記ウィンドウ領域に入る配列読み取り開始部分を開始被覆群に群分け；
- 前記ウィンドウ領域に入る配列読み取り終了部分を末端被覆群に群分け；
- 前記ウィンドウ領域に入るが、前記開始被覆群及び前記末端被覆群に属さない配列読み取りを背景被覆群に群分け；
ウィンドウ毎について、開始被覆群、末端被覆群、及び背景被覆群における読み取りデータの数をそれぞれ加算し；
e5)少なくとも1つの配列読み取り開始部分及び少なくとも1つの配列読み取り終了部分を含む各配列群について、開始被覆と末端被覆の合計を最大化し、該配列群の中心までの距離を最小化することにより、1つ以上の推定開裂部位を決定し、そして
e6)偽陽性開裂部位を除外すること
（ここで、配列読み取り開始部分が、好ましくは整列された配列読み取りの最初の1～5 nt、好ましくは最初の2～4 nt、より好ましくは最初の3 ntからなり、また、配列読み取り終了部分が、その最後の1～5 nt、好ましくは最後の2～4 nt、より好ましくは最後の3 ntからなる。）
によって同定される、前記いずれかに1項に記載の方法。

[66]前記配列群幅が、約20～1000 nt、好ましくは約50～500 nt、より好ましくは少なくとも約50 nt、さらに好ましくは少なくとも約80 nt、最も好ましくは少なくとも約100 ntである、64または65項に記載の方法。

[67]ステップe)において、各配列領域は、定義された配列長、好ましくは約100 ntまたはその倍数、より好ましくは100 ntまたはその倍数の配列長の配列群である、64～66項に記載の方法。

[68]ステップe1)は、整列された配列読み取りを含む参照ゲノム(のDNA配列)を、配列長が設定された、好ましくは約100 ntの長さの配列群に分割することを含み；また、
ステップe2)は、ステップe1)の各配列群について、読み取りデータの被覆を測定し、読み取りデータの被覆が0の配列群を廃棄し、好ましくは、連続的に>0の読み取りデータの被覆を有する配列群を、参照ゲノムの配列順序に基づいて、連続セットの配列群に結合することを含む
(ここで、該連続セットの配列群において、好ましくは、各配列群が、1つ以上のステップe1）の配列群からなる。)、65～67項に記載の方法。

[69]ステップe2)の連続セットの配列群において、各配列群の幅が、e2)の各配列群が、ステップe1)の配列群を有する参照ゲノムの配列で開始し、ステップe2)で廃棄された最初の配列群の直後に続き、そして、参照ゲノムの配列におけるステップe2)で廃棄された次の配列群の直前にあるステップe1)の配列群で終了するように、参照ゲノムの配列で互いに最も近いステップe2)の2つの廃棄された配列群間のステップe1)の連続する配列群の合計によって定義される、65～68項に記載の方法。

[70]ステップe4)がまた、以下のように群分けすることにより、各配列群の開始、末端、及び背景被覆を測定し、
- 配列群領域に入る配列読み取り開始部分を開始被覆群に群分け；
- 配列群領域に入る配列読み取り終了部分を末端被覆群に群分け；
- 配列群領域に入るが、前記開始被覆群及び前記末端被覆群に属さない配列読み取りを背景被覆群に群分け；
配列群毎について、開始被覆群、末端被覆群、及び背景被覆群における読み取りデータの数をそれぞれ加算することを含む、65～66項に記載の方法。

[71]配列読み取り開始部分は、整列された配列読み取り終了部分のnt no.1～nt no. 5またはnt no.2～nt no. 6、好ましくはnt no.1～nt 4またはnt no. 2～nt 5、より好ましくはnt no.1～nt no.3またはnt no.2～nt no.4からなり、
配列読み取り終了部分は、好ましくは、参照ゲノムの同じ連続配列に整列された整列された配列読み取りの任意の配列読み取り終了部分が、整列された配列読み取りの任意の配列読み取り開始部分とは反対の方向を指すように、整列された配列読み取り終了部分のnt no.1～nt no.5またはnt no.2～nt no.6、好ましくはnt no.1～nt no.4またはnt no.2～nt no.5、より好ましくはnt no.1～nt no.3またはnt no.2～nt no.4からなる、63～70項に記載の方法。

[72]ステップe)で測定された推定開裂部位が、設定された配列幅の特定のウィンドウ、好ましくは(約)4 ntのウィンドウのntからなる、前記いずれか1項に記載の方法。

[73]ステップe)で測定された推定開裂部位が、ステップe3)の設定された幅の特定のウィンドウのntに対応し、好ましくは4 ntのウィンドウのntに対応する、64～72項に記載の方法。

[74]偽陽性開裂部位が、推定開裂部位における信号被覆に対する背景被覆の比、及び/または推定開裂部位における末端被覆に対する開始被覆の比、及び/または部位被覆率、及び/または配列群被覆率に基づいて除外される、前記いずれか1項に記載の方法。

[75]1.信号被覆に対する背景被覆の比が許容限界、好ましくは約0.5を超えていなく；及び/または、
2.前記推定開裂部位における末端被覆に対する開始被覆の比がある数値範囲内、好ましくは約1/5～5/1内に入り；及び/または、
3.部位被覆率が最小で、好ましくは6以上であり；及び/または、
4.配列群被覆率が最小で、好ましくは10以上である、
推定開裂部位のみを選択することにより、偽陽性開裂部位を除外する、前記いずれか1項に記載の方法。

[76]偽陽性開裂部位が、
1.該推定開裂部位における信号被覆に対する背景被覆の比が0.5以下であり；及び
2.該推定開裂部位における末端被覆に対する開始被覆の比が1/5～5であり；及び
3.部位被覆率が6以上であり；及び
4.配列群被覆率が10以上である
推定開裂部位のみを選択することにより除外される、前記いずれか1項に記載の方法。

[77]偽陽性開裂部位は、好ましくは、61～63項の方法によって除外される偽陽性部位について訓練され、好ましくは、信号被覆に対する背景被覆の比、末端被覆に対する開始被覆の比、配列群の幅、偽陽性部位間の相対距離、及び/または配列群に対する偽陽性部位の比を特徴として用いて訓練された機械学習モデルを使用することによって除外されるか、またはさらに排外される、前記いずれか1項に記載の方法。

[78]例えば、3倍10反復のクロスバリデーションを用いて、曲線1下面積を得ることにより、ランダムフォレストモデルを構築する、77項に記載の方法。

[79]非特異的開裂部位が、1種以上の標的特異的プログラム可能ヌクレアーゼの特異的開裂部位ではないステップe)の開裂部位として同定される、前記いずれか1項に記載の方法。

[80]i)1種以上の標的特異的プログラム可能ヌクレアーゼで処理された細胞のゲノムDNAを含む第1試料、及び関連する遺伝的背景の細胞、好ましくは同一の遺伝的背景を有し、該1種以上の標的特異的プログラム可能ヌクレアーゼで処理されていない細胞のゲノムDNA含む第2試料を準備するステップ；
ii)該2つの試料について、1～79項の方法で、ステップi)の1種以上の標的特異的プログラム可能ヌクレアーゼを使用することにより、非特異的部位をin vitroでそれぞれ検出するステップ；及び
iii)該2つの試料の非特異的部位を比較して、該1種以上の標的特異的プログラム可能ヌクレアーゼで処理されていない細胞のゲノムDNAを含む試料のみに同定されるが、該1種以上の標的特異的プログラム可能ヌクレアーゼで処理された細胞のゲノムDNAを含む試料には同定されない非特異的部位を、該1種以上の標的特異的プログラム可能ヌクレアーゼのin vivo非特異的部位として同定するステップ
を含む、ゲノム中の非特異的部位をin vivoで検出するための方法。

[81]関連する遺伝的背景の細胞が、同じ遺伝的背景の細胞、好ましくは同じ遺伝子コードを有する細胞、好ましくは同じ組織に由来する細胞である、80項に記載の方法。

[82]関連する遺伝的背景の細胞が、同じ細胞系列の細胞である、80または81項に記載の方法。

[83]両方の試料で使用される細胞が、真核細胞、例えばヒト細胞である、80～82項に記載の方法。

[84]1～79項の方法または80～83項の方法を実施するためのキット。

Abnoba-Seqワークフローの概要ゲノムDNAを、断片サイズの中央値が約400 bpに無作為に剪断し、ブロッキングアダプター(グレー色)の連結で末端を保護し、エキソヌクレアーゼ処理により保護されていない断片を除去した。次いで、末端ブロックDNA断片をCRISPR-Cas9で切断し、ゲノムを特異的部位のPCR増幅によって、ステップ内制御(IPC)としてうまく切断した。切断された断片を、ストレプトアビジン(StA)ビーズに濃縮されたビオチン-アダプター(淡いグレー色)の連結によりタグ付け、次いで以下のようにPCRにより増幅した：最初に、該ビオチン-アダプターに結合する単一プライマーを有するStAビーズ上での線形PCRを行い、次に、ブロッキングアダプターに結合する第2プライマーを添加した後に指数関数的PCRを行い、最後に、ライブラリーを製作し、次世代シークエンシング(NGS)に供した。

DNA断片の末端ブロック試験ブロッキングアダプターとDNA断片(PCR増幅産物)との連結、その後のエキソヌクレアーゼ処理、及びその後のキャピラリー電気泳動を上に示し、末端ブロックDNA断片(PCR増幅産物)の百分率をこれらのグラフの下の表に示している。A：エキソヌクレアーゼ処理：189 bp PCR増幅産物(400 ng）へのブロッキングアダプター(75 pmol）の連結、その後、エキソヌクレアーゼIII(200 U）、λエキソヌクレアーゼ(10 U）、及びエキソヌクレアーゼI(20 U)との2段階反応でのエキソヌクレアーゼの組み合わせによる30分間の消化。B：ブロッキングアダプター濃度の滴定：189 bpのPCR増幅産物(400 ng)に異なる濃度のブロッキングアダプターの連結。PCR増幅産物のみ、一端にブロッキングアダプターと連結したもの、両端にブロッキングアダプターと連結したものはそれぞれ189 bpのピーク、215 bpのピーク、または241 bpのピークで表され、中間は225 bpピークで表される。15 bp及び5,000 bpのピーク(最初及び最後のピーク)、整列マーカーの断片；百分率はAUCの平均値で計算した。

ステップ内制御 A：U20S細胞。RNF2、FANCF、VEGFA、及びHEKs4を標的とするCRISPR-Casヌクレアーゼで末端ブロックゲノムDNAをin vitroで切断した後のゲノム特異的部位を増幅するためのPCR。B：HSC。CRISPR-Casヌクレアーゼを標的とするVEGFAで末端ブロックゲノムDNAをin vitroで切断した後のゲノム特異的部位を増幅するためのPCR。+RNPは、切断された試料；-RNPは、未処理の試料；tは、予想されるPCR増幅産物の位置。

生体情報パイプライン標的部位を同定するため、生体情報パイプラインは次のステップで行われた：(1)配列群被覆率を計算し、(2)空の配列群を廃棄し、(3)配列群を2 ntステップで4 ntのスライディングウィンドウに分割し、(4)同じ部位に読み取り開始部分または読み取り終了部分を有する推定開裂部位を同定し、(5)背景被覆対信号被覆のフィルター比が≦0.5、開始被覆対末端被覆の比が≧1/5～≦5、部位被覆率(開始と終了読み取りの合計)が≧6、及び配列群被覆率が≧10であることを適用することにより、偽陽性部位を除外する。

特異的部位におけるNGS読み取りデータの整列パターン NGS読み取りデータをヒト参照ゲノム(hg19)に整列し、統合ゲノミクスゲノムビューワ(IGV)で可視化した。各標的部位の染色体位置をバーで示す。単一の読み取りデータを矢印として表し、それらの方向を示す。下部には注釈された遺伝子(エキソンはボックスとして、イントロンは線として)が示されている。A：U20S細胞のゲノムDNA。B：HSCのゲノムDNA。

（図６-１、図６-２）試験された標的のうちのトップ20の標的部位 FANCF、RNF2、VEGFA、及びHEKs4を標的とするCRISPR-Casヌクレアーゼについて同定された特異的部位(*)を含む、トップ20の同定された標的部位の配列を示す整列図（図６-１、図６-２）。被覆(読み取りデータの数)を該配列の次に示す。上の列は、PAM (NGG)を含む特異的部位の配列を示す。下の列では、それぞれの該特異的部位との差がグレー色で強調されている。正数及び負数は、DNAまたはgRNAにおけるバルジをそれぞれ示す。Nは任意のヌクレオチドである。

Abnoba-SeqとGUIDE-Seq及びCIRCLE-Seqとの比較 Abnoba-Seq、GUIDE-Seq、及びCIRCLE-Seq間の、同定された標的部位の重複部分を示すベン図。

（図８-１、図８-２）ヒト造血幹細胞に適用されるAbnoba-Seq A：トップ20の(非)特異的部位。VEGFAを標的とするCRISPR-Casヌクレアーゼについて同定された特異的部位(*)を含む、トップ20の同定された標的部位の配列を示す整列図。被覆(読み取りデータの数)を該配列の次に示す。上の列は、PAM を含む特異的部位の配列を示す。下の列では、該特異的部位との差がグレー色で強調されている。正数または負数は、DNAまたはgRNAにおけるバルジをそれぞれ示す。N：任意のヌクレオチド。B：共有の及び別個の非特異的部位。U20S細胞とHSCとの間の、同定された非特異的部位の重複部分を示すベン図（図８-１）。C、D：定性的な比較。U20SとHSC との間の、同定されたトップ20またはトップ50の標的部位の重複部分を示すベン図（図８-２）。

トップ20の非特異的部位の標的増幅産物配列決定 U20S細胞及びHSCを、VEGFAまたはHEKs4を標的とするRNPで遺伝子導入した。特異的部位及びトップ20の非特異的部位の標的増幅産物配列決定により、編集を評価した。A：VEGFAを標的とするRNPによる編集効率。各(非)特異的部位(y軸)について、バーは、U20S細胞(黒色)またはHSC(グレー色)のいずれかにおける対数スケール(x軸)上の編集された対立遺伝子の百分率を示す。各部位の染色体位置は示されている。ON、特異的部位；OT、非特異的部位。B：HEKs4を標的とするRNPによる編集効率。各(非)特異的部位(y軸)について、バーは、HSC(グレー色)における対数スケール(x軸)上の編集された対立遺伝子の百分率を示す。各部位の染色体位置を右側に示す。ON、特異的部位；OT、非特異的部位；n.d.、配列決定に失敗したため、未測定。

発明の詳細な説明

Abnoba-Seq
第1態様では、本発明は、ゲノム中の1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的部位をin vitroで検出する方法に関する。該方法は、ゲノム中の1種以上の標的特異的プログラム可能ヌクレアーゼの全ての開裂部位をin vitroで検出することを可能にする。特に限定されない限り、本明細書で使用される全ての技術用語及び科学用語は、当業者に一般的に理解されるものと同じ意味を有する。

本発明の第1態様の方法は、標的特異的プログラム可能ヌクレアーゼの非特異的部位を決定するための既知の方法と比較して、いくつかの利点を有する。該方法は、非特異的部位を同定するために、例えば、既知のin vitro法によって使用されるように、特異的部位/配列との相同性を使用せず、特に、実際の標的配列との類似性は、非特異的部位の検出の役割を果たしておらず、この点での該方法は完全に不偏である。これは、他の既知のin vitro法と比較して、匹敵する感度を有するが、より高い選択性を有する方法をもたらす。

有利には、本発明の方法は少量のインプットゲノムDNAで実施することができる。これは、例えば、一次細胞、生検材料、または遺伝子編集された移植片における標的特異的プログラム可能ヌクレアーゼの特異性の測定によって、限定された試料量及び入手可能性の貴重な細胞試料についての1種以上の標的特異的プログラム可能ヌクレアーゼの試験を可能にする。また、HiSeqのような高価な高性能シーケンサを必要とせず、基本的な(低コストの)NGSシーケンサを用いて実施することができる。

用語"標的特異的プログラム可能ヌクレアーゼ"は、当業者に公知である。好ましくは、本発明の文脈で使用される用語"標的特異的プログラム可能ヌクレアーゼ"とは、所望のゲノム上の特定の部位を認識し、切断することができる全ての形のヌクレアーゼを指す。特に、これは、ZFN、TALEN、メガヌクレアーゼ、アルゴノート-ファミリータンパク質ベースのDNAガイドDNAヌクレアーゼ、及びCRISPR/Cas RGNを含むことができるが、これらに限定されるものではない。用語"CRISPR/Cas RGN"、"ZFN"、及び"TALEN"とは、そのタイプの1種のヌクレアーゼまたは2種以上のヌクレアーゼを指すことができ、例えば、CRISPR/Cas RGNは、1種のCRISPR/CasRNAガイドヌクレアーゼまたは2種以上（2種、3種等)のCRISPR/CasRNAガイドヌクレアーゼを指すことができ、同様に、ZFN は、1種のZnフィンガーヌクレアーゼまたは2種以上のZnフィンガーヌクレアーゼ等を指すことができる。好ましい実施形態では、標的特異的プログラム可能ヌクレアーゼは、二本鎖DNA (dsDNA)の標的を特異的に切断するヌクレアーゼである。即ち、これは、切断のために特定の標的部位または配列（特異的部位上)を標的とし、好ましくは、DNAにdsDNA切断を導入する。

本発明の文脈で使用される用語"標的部位"は、当業者に公知であり、好ましくは、特異的部位及び非特異的部位を指すことができる。本発明の文脈で使用される用語"特異的部位"は、当業者に公知である。これは、好ましくは、核酸切断、好ましくはDNA切断のための標的特異的プログラム可能ヌクレアーゼにより標的化され、目的に応じて、ヌクレオチド配列、好ましくはゲノムDNA配列のようなDNA配列内で自由に選択され得る特定の部位または配列を指すことができる。

当然のことながら、当業者には理解されるように、標的特異的プログラム可能ヌクレアーゼは、特異的部位に加えて、特異的部位以外の１つ以上の部位で、切断のために核酸、好ましくはゲノムDNAのようなDNAを標的とし得る。これらの他の部位は非特異的部位である。本発明の文脈で使用される用語"非特異的部位"は、当業者に公知である。好ましくは、用語"非特異的部位"とは、標的特異的プログラム可能ヌクレアーゼの標的部位または配列(特異的部位)に対する核酸配列において同一ではない部位を指す。即ち、標的特異的プログラム可能ヌクレアーゼによる切断の標的となる特異的部位以外の部位を指すことができる。

好ましくは、非特異的部位は、特異的部位への核酸配列において同一ではなく、in vitroで標的特異的プログラム可能ヌクレアーゼによる切断を標的とする部位である。特定の実施形態では、非特異的部位は、特異的部位への核酸配列において同一ではなく、in vitro及びin vivo（即ち、細胞内)における標的特異的プログラム可能ヌクレアーゼによる切断を標的とする部位である。切断を標的とすることにより、好ましくは、標的特異的プログラム可能ヌクレアーゼが、特定の部位または配列を使用して、核酸、例えば、DNAに直接的または間接的に結合し、次いで、該特定の部位または配列の中またはその近くで該核酸を切断することを意味する。

ステップa)精製された末端ブロックdsDNA断片の調製
本発明の第1態様の方法は、ステップ(a)を含む。これは、ゲノムDNAを含むインプット試料を準備し、該ゲノムDNAをdsDNA断片に無作為に断片化し、ブロッキングアダプターを該dsDNA断片の末端に連結し、末端がブロックされていない末端を含むdsDNA断片を除去し、精製された末端ブロックdsDNA断片を調製するステップである。

前記インプット試料中のゲノムDNAは、本発明の方法に使用するのに適している限り、特に限定されない。好ましくは、前記ゲノムDNAは、単離されたゲノムDNAであり、これは、ゲノムDNAが細胞から抽出され、好ましくは精製される。即ち、抽出中に使用されるタンパク質及び他の細胞成分及び/または試薬からある程度、好ましくは可能な限り分離されることを意味する。前記ゲノムDNAの供給源は特に限定されない。該ゲノムDNAは、特定の生物の細胞、例えば、単一または多細胞生物から、特定の組織の細胞からの多細胞生物、または特定の細胞型に由来してもよい。一実施形態では、該ゲノムDNAは、真核生物細胞（例えば、動物、哺乳動物、昆虫、植物、真菌、昆虫、鳥、魚、水陸両用生物、虫類、または刺胞動物)に由来する少なくとも1種である。

好ましい実施形態では、ステップ(a)で提供されるインプット試料に含まれるゲノムDNAは、例えば、一次細胞または生検材料からのヒトゲノムDNAである。このような細胞は、特定の組織の細胞、または特定の組織の特定の細胞型の細胞であってもよく、そうでなくてもよい。

インプット試料中のゲノムDNAの量は特に制限されない。本発明の好ましい実施態様では、ゲノムDNAのインプット試料は、1 μg未満、好ましくは900 ng未満、より好ましくは800 ng未満、さらに好ましくは約700 ng未満、さらに好ましくは約650 ng以下、さらに好ましくは約600 ng以下、あるいは好ましくは約500 ng、あるいは好ましくは約400 ngのゲノムDNAを含む。

本明細書で値または範囲と組み合わせて使用される"約"という用語は、所定量の値または範囲が、規定された値または範囲の10%以内の量、または任意選択的に値または範囲の5%以内、またはいくつかの実施形態では、値または範囲の1%以内の量を含むことができることを示す。もちろん、"約"という用語は、該用語が組み合わされた値または範囲の精確な値または精確な範囲も含む。

本発明に従って、ゲノムDNAを無作為にdsDNA断片に断片化する方法は、特に限定されない。ゲノムDNAを無作為に断片化する方法は当該技術分野で公知である。ゲノムDNAは、例えば、剪断により無作為に断片化することができ、即ち、DNAの機械的破壊、または酵素による断片化によって、無作為に断片化することができる。本発明の一実施形態によれば、ゲノムDNAは、超音波処理(超音波処理)、音響剪断、遠心剪断、ポイントシンク剪断、ニードル剪断、または酵素ベースの断片化によって、好ましくは超音波処理によって断片化される。好ましくは、ゲノムDNAは、規定された長さ(中央値または平均)に断片化される。ゲノムDNAをdsDNA断片にする具体的な長さは限定されない。本発明の第1態様の特定の実施形態では、ゲノムDNAは、平均または中央値、好ましくは中央値、100～2000 bp、好ましくは200～800 bp、より好ましくは約300～600 bp、より好ましくは300～600 bp、さらに好ましくは約400～500 bp、さらに好ましくは約400 bpのdsDNA断片に無作為に断片化される。本発明の好ましい実施態様では、ゲノムDNAは、約300～600 bp、より好ましくは300～600 bp、より好ましくは約400 bp、さらに好ましくは400 bpの中央値の断片サイズを有するdsDNA断片に無作為に断片化される。用語"bp"とは、1つ以上の塩基対、即ち、dsDNAまたはdsRNAのような二本鎖(ds)核酸中の相補的なヌクレオチドの1つ以上の対を指す。インプット試料中のゲノムDNAを無作為に断片化してdsDNA断片を得た後、dsDNA断片の末端にブロッキングアダプターを連結し、末端がブロックされていない末端を含むdsDNA断片を除去して、精製された末端ブロックdsDNA断片を調製する。

本明細書で使用される"ブロッキングアダプター"という用語は、分子、好ましくはdsDNAを含む分子を意味し、該分子は、ブロッキングアダプターをdsDNA断片の末端に連結した後、その末端からのエキソヌクレアーゼによる切断(消化)と同様に、さらなる連結をブロックする。dsDNA断片についての用語"末端ブロック"とは、両方の末端にブロッキングアダプターブロッキングアダプターが連結されたdsDNA断片を指す。

ブロッキングアダプターは、上述した役割を果たす限り特に限定されない。ブロッキングアダプターを調製する方法は、当該技術分野で公知である。即ち、連結後、それが連結されるDNA断片の末端からのさらなる連結及びエキソヌクレアーゼ切断をブロックする。好ましくは、ブロッキングアダプターは、DNAベースのアダプターであり、より好ましくは、dsDNAベースのアダプター（即ち、dsDNAベースのブロッキングアダプター)であり、これは、dsDNAを含むことを意味する。このようなdsDNAベースのブロッキングアダプターは、修飾ヌクレオチド及びヌクレオチドではない他の分子を含む他の修飾を含むことができる。このようなdsDNAベースのブロッキングアダプターは、好ましくは、PCR増幅のために、プライマー部位をブロッキングアダプターに組み込むことを可能にする配列長を有する。

本発明の好ましい実施形態によれば、ブロッキングアダプター、好ましくはdsDNAベースのブロッキングアダプターは、1つ以上の修飾を含む。これらの修飾は、ブロッキングアダプターをdsDNA断片に連結した後、ブロッキングアダプターがdsDNA断片に連結される末端の連結及び1つ以上の修飾を防止し、ブロッキングアダプターをdsDNA断片に連結した後、前記dsDNA断片に前記ブロッキングアダプターが連結された末端からのdsDNA断片のエキソヌクレアーゼ切断(消化)を防止する。

当該技術分野で公知であるように、ブロッキングアダプターをdsDNA断片に連結した後のブロッキングアダプターの修飾は、ブロッキングアダプターがdsDNA断片に連結される末端の連結を防止し、dsDNAベースのブロッキングアダプターでは、好ましくは1つ以上のC3-スペーサーを、好ましくはdsDNAベースのブロッキングアダプターの各鎖上で、好ましくは、dsDNAをベースとしたブロッキングアダプターをdsDNA断片に連結するために使用されない（即ち、連結後、ブロッキングアダプターが連結されたdsDNA断片の末端に直接隣接していないブロッキングアダプターの末端) dsDNAベースのブロッキングアダプターの末端に、1つ以上のC3-スペーサー、1つ以上のジデオキシ-G/ジデオキシ-C、または他のスペーサーを含む。

ブロッキングアダプターをdsDNA断片に連結した後のブロッキングアダプターの修飾は、ブロッキングアダプターがdsDNA断片に連結される末端からのdsDNA断片のエキソヌクレアーゼ切断を防止することも当該技術分野で公知である。dsDNAベースのブロッキングアダプターでは、1つ以上のホスホロチオエート結合、1つ以上のC3-スペーサー、及びそれらの組み合わせを含む。好適な実施形態では、ブロッキングアダプターは、DSDNAベースのブロッキングアダプターの各鎖には、好ましくは末端の近く、例えば、DSDNAベースのブロッキングアダプターをDSDNA断片に連結するのに使用されない（即ち、連結後、ブロッキングアダプターが連結されたdsDNA断片の末端に直接隣接していないブロッキングアダプターの末端)DSDNAベースのブロッキングアダプターの最後の3～5ヌクレオチドの間に、1つ以上、好ましくは2つ以上、好ましくは少なくとも2つ（例えば2つ、3つ、4つ等）のホスホロチオエート結合、及び、好ましくは少なくともDSDNAベースのブロッキングアダプターの各鎖に、好ましくはDSDNAベースのブロッキングアダプターをDSDNA断片に連結するために使用されないDSDNAベースのブロッキングアダプターの末端に、1つ以上のC3スペーサーを含むdsDNAベースのブロッキングアダプターである。

dsDNAベースの形態のブロッキングアダプターは、さらに、例えば、好ましくは各鎖上に少なくとも2つの、好ましくは、dsDNAベースのブロッキングアダプターをdsDNA断片に連結するために使用されないアダプターの末端に近接して、例えば1つ以上の内部デオキシウリジンを含む修飾を含んでもよい。好ましいブロッキングアダプターは、少なくとも1つがdsDNAベースのブロッキングアダプターの各鎖上、好ましくはdsDNAベースのブロッキングアダプターをdsDNA断片に連結するために使用されないdsDNAベースのブロッキングアダプターの末端に、1つ以上のC3-スペーサーと1つ以上のホスホロチオエート結合との組み合わせ、及び任意に1つ以上の内部デソキシルインを含むdsDNAベースのブロッキングアダプターである。

さらに、ブロッキングアダプターは、好ましくは、PCRプライミングに使用するのに適合するプライマー部位を含み、これは、PCRプライマーが徐冷して、ブロッキングアダプターが連結されたdsDNA断片を増幅することができるヌクレオチド配列を意味する。好ましくは、ブロッキングアダプターにおけるdsDNAベースのブロッキングアダプター及び/またはプライマー部位の配列は、標的ゲノム（即ち、インプット試料及び/または参照ゲノム中のゲノムDNAの配列)に存在しない。本発明の特定の実施形態では、ブロッキングアダプターは、配列番号:01に定義された順方向配列及び配列番号:02の逆方向配列を含むdsDNAベースのブロッキングアダプターである。本発明のさらに特定の実施形態では、ブロッキングアダプターは、配列番号:01及び配列番号:02の配列からなるdsDNAベースのブロッキングアダプターである。

ブロッキングアダプターは、当該技術分野で公知である方法によってdsDNA断片の末端に連結される。例えば、ブロッキングアダプターは、当該技術分野で公知である連結プロトコルを用いて、酵素的または化学的な連結によってdsDNA断片の末端に連結され得る。酵素的な連結は、既知のDNAリガーゼを用いて行うことができ、これは、ホスホジエステル結合の形成を触媒することによってDNA鎖の結合を容易にし、平滑性末端及び粘着性末端の連結を含む。好ましい実施形態では、ブロッキングアダプターは、酵素的な連結によってdsDNA断片の末端に連結される。

好ましくは、ブロッキングアダプターをdsDNA断片の末端に連結することは、1.アダプター連結をブロックするためのdsDNA断片を調製すること、及び2.ブロッキングアダプターをdsDNA断片の末端に連結して、末端ブロックdsDNA断片を得ることを含む。アダプター連結をブロックするためのdsDNA断片を調製する方法は当業者に公知である。アダプター連結をブロックするためのdsDNA断片を調製することは、末端修復及びdAテーリング(非鋳型化デオキシアデノシン5'-モノリン酸(dAMP)の平滑性末端DNA断片の3'末端への組み込み)の一方または両方を含むことができる。

本発明の特定の実施態様では、末端修復によりアダプター連結をブロックするためにdsDNA断片を調製し、オーバーハングがなく、5'ホスフェート基及び3'ヒドロキシル基、及びこうして調製された平滑性末端DNA断片のdAテーリングを含有するdsDNA断片を調製する。このようにして調製したdsDNA断片の末端に、アダプターの一端の3'末端にdTオーバーハングを有するdsDNAベースのブロッキングアダプターを連結することができる。

ブロッキングアダプターをdsDNA断片の末端に連結した後、末端がブロックされていない末端を含むdsDNA断片を除去して、精製された末端ブロックdsDNA断片を調製する。末端がブロックされていない末端を有するdsDNA断片では、一方または両方の末端がブロッキングアダプターに連結されていない。ブロックされていない末端を有するこのようなdsDNA断片を除去する方法は当業者に公知である。

好ましい実施態様では、末端がブロックされていない末端を含むdsDNA断片を除去することは、(ブロッキングアダプターのdsDNA断片への連結の後)、1種以上のエキソヌクレアーゼを用いて、試料を接触させて、dsDNA断片を除去し、精製され、末端ブロックDNA断片を得ることを含む。適切なエキソヌクレアーゼは、当該技術分野で公知であり、例えば、1種以上のエキソヌクレアーゼIII、エキソヌクレアーゼV、エキソヌクレアーゼVIII、λエキソヌクレアーゼ、T5エキソヌクレアーゼ、T7エキソヌクレアーゼ、ヌクレアーゼBAL-31、及びそれらの組み合わせ、好ましくはエキソヌクレアーゼIII、λエキソヌクレアーゼ、またはそれらの組み合わせを含む。場合によって、例えば、エキソヌクレアーゼI、耐熱性エキソヌクレアーゼI、エキソヌクレアーゼT、エキソヌクレアーゼVII、RecJf、リョクトウヌクレアーゼ、ヌクレアーゼP1、及びそれらの組み合わせから選択される1種以上の一本鎖DNA(ssDNA)エキソヌクレアーゼが使用される。

特定の実施形態では、1種以上のエキソヌクレアーゼは、例えば、2：20：5の酵素単位比でのエキソヌクレアーゼI、エキソヌクレアーゼIII、及びλエキソヌクレアーゼの混合物からなる。

本発明の第1態様の方法の好ましい実施形態では、ステップa)は、a1)ゲノムDNAを規定の長さに無作為に断片化して、dsDNA断片を提供するステップ、a2)ブロッキングアダプターを連結することにより該dsDNA断片の末端を保護し、末端ブロックdsDNA断片を得るステップ、及びa3)末端ブロックdsDNA断片を含む試料を1種以上のエキソヌクレアーゼで接触させて、末端がブロックされていないdsDNA断片を除去し、精製され、末端ブロックDNA断片を得るステップを含む。

本発明の第1態様の方法の別の特定の実施形態では、ステップa)において、好ましくは、末端ブロックdsDNA断片を含む試料を１種以上のエキソヌクレアーゼと接触させて、dsDNA断片を除去した後に、残りの末端がブロックされていないDNA断片の遊離型の末端は、脱リン酸化試薬で脱リン酸化される。該実施形態では、好ましくは、ステップa)において、前記脱リン酸化試薬は、1種以上のホスファターゼからなり、好ましくは、制酸ホスファターゼ、ウシ腸アルカリホスファターゼ、Quick-CIP、エビアルカリホスファターゼ、及びそれらの組み合わせのうちの1種以上のホスファターゼを含むか、それらからなる。

ステップb)切断及び増幅されたdsDNA断片のDNAライブラリーの調製
本発明の第1態様の方法は、第2ステップ、即ち、b1)精製された末端ブロックdsDNA断片を1種以上の標的特異的プログラム可能ヌクレアーゼで切断して、切断されたdsDNA断片を得て、b2)アフィニティーアダプターを切断されたdsDNA断片の開裂部位に連結して、アフィニティーアダプター修飾dsDNA断片を得て、b3)アフィニティーアダプターを用いて、アフィニティーアダプター修飾dsDNA断片を濃縮して、濃縮されたアフィニティーアダプター修飾dsDNA断片を得て、そしてb4)PCR増幅により、濃縮されたアフィニティーアダプター修飾dsDNA断片を増幅し、切断及び増幅されたdsDNA断片のDNAライブラリーを得ることにより、切断及び増幅されたdsDNA断片のDNAライブラリーを調製するステップ(b)を含む。

本発明によれば、ステップb1)における精製された末端ブロックdsDNA断片の量は、特に制限されない。特定の実施形態によれば、ステップb1)において、400 ng未満、好ましくは300 ng未満、より好ましくは200 ng未満、さらに好ましくは100 ng未満、例えば、約90 ng、約80 ng、約70 ng、約60 ng、60 ng未満、約50 ng、または50 ngの、精製された末端ブロックdsDNA断片を、代替的に50 ng未満、例えば40 ngの、精製された末端ブロックdsDNA断片を、1種以上の標的特異的プログラム可能ヌクレアーゼで切断して、切断されたdsDNA断片を得る。好ましい実施態様では、100 ng未満、好ましくは例えば約50 ngの、精製された末端ブロックdsDNA断片がステップb1)で使用される。

本発明の別の特定の実施形態によれば、ステップb1)において、1,500,000個未満の単数体ゲノム、好ましくは1,500,000個未満の単数体ゲノム、より好ましくは80,000個未満の単数体ゲノム、さらに好ましくは60,000個未満の単数体ゲノム、さらに好ましくは50,000個未満の単数体ゲノム、例えば約45,000、約30,000、約20,000、または約15,000個の単数体ゲノムに相当する、精製された末端ブロックdsDNA断片が使用される。

精製された末端ブロックdsDNA断片を、1種以上の標的特異的プログラム可能ヌクレアーゼで切断し、精製された末端ブロックdsDNA断片を含む試料を、1種以上の標的特異的プログラム可能ヌクレアーゼと接触させることによって、切断されたdsDNA断片を得ることができる。

ステップb1)で使用される1種以上の標的特異的プログラム可能ヌクレアーゼは、本発明の方法に使用できる限り、即ち、ゲノムDNAの標的特異的切断のための標的特異的プログラム可能ヌクレアーゼとしての使用に、例えば、ゲノム編集用に、そして、本発明の方法を使用して、好ましくはin vitro及びin vivoでの非特異的部位の検出に使用するのに適すれば、特に限定されない。適切な標的特異的プログラム可能ヌクレアーゼには、TALEN、ZFN、メガヌクレアーゼ、メガTAL、Fokl-dCas9、アルゴノート-ファミリータンパク質ベースのDNAヌクレアーゼ、CRISPR/Cas RGN、またはそれらの変異体、またはそれらの組み合わせが含まれる。

本発明の方法で使用できるTALENは、本発明の方法に用いることができる限り、特に限定されない。TALENは、転写活性化因子様エフェクター(TALE)タンパク質に由来するDNA結合ドメイン及びヌクレオチド切断ドメイン、好ましくはFokl切断ドメインを含む1種以上の融合タンパク質を指す。TALEタンパク質には、それぞれが単一の塩基対を認識する複数の33～35アミノ酸リピートドメイン（TALEリピートアレイ）が含まれている（例えば、Gajら, 2013, Trends Biotechnol. 31(7)：397-405を参照)。遺伝子操作されたTALEリピートアレイを産生し、それらをヌクレアーゼに融合させる方法は、当該技術分野で公知である（例えば、Reyonら, 2012, Nature Biotechnology 30, 460-465；Bogdanove及びVoytas, 2011, Science 333, 1843-1846, Bogdanoveら, 2010, Curr Opin Plant Biol 13, 394-401；Scholze及びBoch, 2011, J. Curr Opin Microbiol 2011；Bochら,2009,Science 326, 1509-1512；Cermakら, 2011, Nucleic Acids Res 39,e82；Tessonら, 2011, Nat Biotechnol 29,695-696；Sanderら, 2011, Nat Biotechnol 29, 697-698；及びZhangら, 2011, Nat Biotechnol 29, 149-153を参照)。

本発明の方法で使用できるメガヌクレアーゼは、本発明の方法に使用できる限り、特に限定されない。メガヌクレアーゼは、細菌、酵母、藻類、及び植物小器官のような種々の生物に由来する配列特異的エンドヌクレアーゼである。内因性メガヌクレアーゼは、約12～30 bpの認識部位；18 bp及び24 bp長のメガヌクレアーゼ認識部位を有するカスタマイズされたDNA結合部位を有することが記載されており、本法に使用することができる（例えば、Silvaら, 2011, Current Gene Therapy,11:11-27；Arnuldら, 2011, Protein Engineering Design & Selection, 24:27-31を参照)。メガヌクレアーゼは、例えば、LAGLIDADGファミリー、GIY-YIGファミリー、His-Cystボックスファミリー、及びHNHファミリーのメガヌクレアーゼから選択することができる。代表的なメガヌクレアーゼには、l-Scel、l-Ceul、Pl-Pspl、Pl-Scel、l-Scelv、l-Csml、l-Panl、l-Scell、l-Ppol、l-Scelll、l-Crel、l-Tevl、l-Tevll、及びl-Tevllが含まれる。

本発明の方法で使用できるZFNは、本発明の方法に使用するのに適する限り、特に限定されない。ZFNは、Zn-フィンガーDNA結合ドメイン及びDNA切断ドメインを含む人工的に操作されたヌクレアーゼである。DNA結合に関与するα-ヘリカル位置でのアミノ酸のランダム化により、また、ファージディスプレイ等の選択方法論を用いて、目的のDNA標的部位に結合できる所望の変異体を同定することにより、個々のZn-フィンガーDNA結合ドメインのDNA結合特性を人為的に操作することができる（Rebarら, 1994, Science, 263:671;Chooら, 1994 Proc Natl Acad Sci. USA, 91:1163; Jamiesonら, 1994, Biochemistry 33:5689; Wuら, 1995 Proc Natl. Acad. Sci. USA, 92:344)。ヌクレアーゼのような機能ドメインにこのような組換えZn-フィンガーDNA結合ドメインを融合し、標的化された改変をモデルの生物、植物及びヒト細胞のゲノムに導入することができる(Carroll, 2008, Gene Ther., 15:1463-68, Cathomen, 2008, Mol. Ther. 16:1200-07; Wuら, 2007, Cell. Mol. Life Sci., 64：2933-44)。

特定の標的部位/配列の選択及びZFNの設計及び構築は、当業者には周知であり、例えば、米国特許第7,888,121号、同8,409,861号、同6,479,626号、同6,903,185号、及び同7,153,949号に詳細に記載されている。ZFNは、タンパク質の各Zn-フィンガー間に適切なリンカーの任意の組み合わせを含むことができる。Zn-フィンガーDNA結合ドメインは、選択された配列に結合するように操作することができる(Beerliら, 2002, Nat. Biotechnol., 20:135-141；Segalら, 2003, Biochemistry, 42:2137-48；Mandellら, 2006, Nucleic Acids Res., 34：W516-523; Carrollら, 2006, Nat. Protoc. 1:1329-41; Baeら, 2003, Nat. Biotechnol., 21：275-280；Wrightら, 2006, Nat.Protoc. 1:1637-52; Maederら, 2008, Mol. Cell, 31:294-301; Joungら, 2010, Nat. Methods, 7:91-92)。好ましい実施形態では、ZFNは、WO 2011/017293及びWO 2004/099366に記載されているように調製された。さらなる適切なZn-フィンガーDNA結合ドメインは、米国特許第6,511,808号、第6,013,453号、第6,007,988号、及び第6,503,717号に記載されている。

本発明の方法で使用できるメガTAL及びFokl-dCas9は、本発明の方法に使用するのに適する限り、特に限定されない。メガTALは、TAL エフェクターを有するメガヌクレアーゼの人工の融合タンパク質である（例えば、Boisselら, 2014, Nucl. Acids Res. 42(4):2591-2601；Boissel及びScharenberg, 2015, Methods Mol Biol. 2015; 1239:171-96を参照)。Fokl-dCas9は、配列標的化のための不活化Cas9及びFoklヌクレアーゼを含む融合タンパク質である(Guilingerら, 2014, Nat Biotechnol. Jun；32(6)：577-582；WO 2014/144288；及びWO 2014/204578)。

本発明の方法に使用できるアルゴノート-ファミリータンパク質ベースのDNAガイドDNAヌクレアーゼは、本発明の方法に使用できる限り、特に限定されない。ゲノム編集のためのアルゴノート-ファミリータンパク質ベースのDNAガイドDNAヌクレアーゼを使用する方法は、当該技術分野で公知である（例えば、WO 2017139264A1；Weiら, 2016, Genes &；Diseases, Vol.3, Iss. 3, p. 169-170を参照)。

本発明の方法で使用できるCRISPR/Cas RNAガイドヌクレアーゼ(CRISPR/Cas RGN)は、本発明の方法に使用できる限り、特に限定されない。即ち、これらは、例えば、ゲノムDNAの標的特異的切断のための標的特異的プログラム可能ヌクレアーゼとしての使用に少なくとも適し、ゲノム編集のために、本発明の方法を使用して、好ましくはin vitro及びin vivoで、非特異的部位の検出に使用するのに適していることを意味する。CRISPR/Cas RGNは、Cas9エンドヌクレアーゼとgRNAとの組み合わせを指す。Cas9エンドヌクレアーゼは、gRNAに結合して、Cas9-gRNAリボヌクレオチドタンパク質(RNP)を形成することができる。標的配列に特異的なCRISPR/Cas RGNを調製する方法は、当該技術分野で周知である。

本発明の方法で使用されるCRISPR/Cas RGNのCasエンドヌクレアーゼは、ゲノム編集のためのCRISPR/Cas RGNに使用するのに適し、本発明の方法を用いて、好ましくはin vitro及びin vivoで、非特異的部位の検出に使用するのに適する限り、特に限定されない。本発明の特定の実施態様では、CRISPR/Cas RGNのCasエンドヌクレアーゼは、Cas9エンドヌクレアーゼまたはその変異体、またはCpf1エンドヌクレアーゼまたはその変異体である。Casエンドヌクレアーゼは、遺伝子操作されたgRNAと、PAM に隣接する標的ゲノムDNA配列の相補鎖との間で、約20ヌクレオチドの単純なヌクレオチド(nt)相補性を介して誘導され得る。本明細書で使用される用語"nt"とは、DNAまたはRNA分子の1種以上(例えば、1種、2種、3種、及び4種等)のヌクレオチドを指す。

Cas9エンドヌクレアーゼ、例えばS.pyogenes (以下、SpyCas9)を使用することができる(Shenら, 2013, Cell Res；Jinekら, 2013, Elife 2, e00471；Hwangら, 2013, Nat Biotechnol 31, 227-2229(2013)；Congら, 2013, Science 339, 819-823；Maliら, 2013, Science 339, 823-826；Choら, 2013, Nat Biotechnol 31, 230-223)。Prevotella及びFrancisella 1 Cpf1に由来の遺伝子操作されたCRISPRエンドヌクレアーゼ(Prevotella及びFrancisella 1におけるCRISPR関連エンドヌクレアーゼ)を使用することもできる(Zetscheら, 2015, Cell 163, 759-771；及びMakarovaら, 2015, Nat Rev Microbiol 13, 722-736)。

いくつかの実施形態では、本発明の方法は、Streptococcus属、Neisseria属、Pasteurella属、Francisella属、Campylobacter属(例えば、S.pyogenes、Staphylococcus aureus、Neisseria meningitidis、Streptococcus thermophilus、またはTreponema denticolaから)に由来のCas9エンドヌクレアーゼの野生型または変異体;またはLachnospira属、Butyrivibrio属、Peregrinibacteria属、Acidominococcus属、Porphyromonas属、Prevotella属、Francisella属、Candidatus methanoplasma、及びEubacterium属(例えば、Candidatus Paceibacter, Acidaminococcus sp. BV3L6またはLachnospiraceae bacterium ND2006から）に由来のCpf1エンドヌクレアーゼの野生型または変異体を、細菌中でコードされるか、または、例えば、哺乳動物細胞における発現のためにコドン-最適化されるか、及び/またはそのPAM認識特異性及び/またはそのゲノム上の特異性において改変されるかのいずれかの状態で使用する。多数の変異体が記載されている（例えば、WO 2016/141224、PCT/US2016/049147、Kleinstiverら, 2016, Nat Biotechnol., 34(8)：869-74；Tsai及びJung, 2016, Nat Rev Genet., 17(5)：300-12；Kleinstiverら, 2016, Nature., 529(7587):490-5；Shmakovら, 2015, Mol Cell., 5;60(3):385-97;及びTsaiら, 2014, Nat Biotechnol., 32(6):569-76)。

本明細書で使用する用語"gRNA"または"ガイドRNA"とは、Casエンドヌクレアーゼに結合してCRISPR/Cas RGNリボヌクレオチドタンパク質(RNP)を形成し、Casタンパク質を標的部位/配列に誘導することができる標的DNA特異的RNAを指す。任意のタイプのgRNAは、ゲノム編集のためのCRISPR/Cas RGNでの使用に適しており、また、本発明の方法を用いて、好ましくは、in vitro及びin vivoで、非特異的部位の検出に使用するのに適する限り、本発明の方法で使用することができる。gRNAは、例えば、単一のガイドRNA (sgRNA)、またはRNA分子のcrRNA(CRISPR RNA)/tracrRNA(トランス活性化crRNA)対を含む二重gRNA(dgRNA)であってもよい。本発明の特定の実施形態によれば、gRNAは、成分として、1つのRNAを含むsgRNA、または2つのRNA、好ましくは1つのcrRNA及び1つのtracrRNAを含むdgRNAである。

1種以上の標的特異的プログラム可能ヌクレアーゼは、特定の部位またはヌクレオチド配列(特異的部位)を標的とする。特異的部位は、特に限定されず、1つ以上の特定の部位または配列を含んでいてもよい。

本発明の一実施形態によれば、ステップb1)において、1種以上の標的特異的プログラム可能ヌクレアーゼは、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、Zn-フィンガーヌクレアーゼ(ZFN)、メガヌクレアーゼ、メガTAL、Fokl-dCas9、クラスター化して規則的な配置の短い回文配列リピート(CRISPR)/Cas RNAガイドヌクレアーゼ(CRISPR/Cas RGN)、またはその変異体、またはそれらの組み合わせから選択される。

本発明の特定の実施形態では、ステップb1)において、1種以上の標的特異的プログラム可能ヌクレアーゼは、好ましくは、1種以上のCRISPR/Cas RGNを含み、好ましくは、それからなり、それぞれが、好ましくは、1：3のモル比で、CasエンドヌクレアーゼがgRNAに結合している、予め組み立てられたリボヌクレオチド(RNP)として使用される。Casエンドヌクレアーゼは、例えば、組換えタンパク質であってもよい。例示的な実施形態によれば、約1.6 pmolのCasエンドヌクレアーゼ及び約4.8 pmolのsgRNAを、好ましくは、Casエンドヌクレアーゼ/gRNA RNP に予め組み込まれた状態で用いて、約50 ngの、精製された末端ブロックdsDNA断片を切断する。より大量または少量の、精製された末端ブロックdsDNA断片については、使用されるCasエンドヌクレアーゼ及びsgRNAを、例えば、比例的に適合させることができる。

1種以上の標的特異的プログラム可能ヌクレアーゼのオンターゲット活性を監視するために、ステップ内制御を使用してもよい。本発明の一実施形態によれば、1種以上の標的特異的プログラム可能ヌクレアーゼの特異的部位のための、特異的部位に特異的なプライマーを用いたPCR増幅がステップ内制御として使用される。

本発明の第1態様の方法のステップb2)で使用されるアフィニティーアダプターは、このように調製されたアフィニティーアダプター修飾dsDNA断片の特異的濃縮のために、アフィニティーアダプターを用いて、1種以上の標的特異的プログラム可能ヌクレアーゼ（即ち、切断されたdsDNA断片)によって切断された、精製された末端ブロックdsDNA断片の開裂部位へのアフィニティーアダプターの連結を可能にする限り、特に限定されない。このようなアフィニティーアダプターは、当該技術分野で公知である。好ましくは、アフィニティーアダプターは、切断されたdsDNA断片の開裂部位にアフィニティーアダプターを連結した後、アフィニティーアダプター修飾dsDNA断片を特異的に濃縮することを可能にする1つ以上の修飾を含む。

本発明の方法で使用されるアフィニティーアダプターは、好ましくは、アフィニティー精製に適した1つ以上の修飾を含む、DNAベースのアダプター、好ましくはdsDNAベースのアダプター（即ち、dsDNAベースのアフィニティーアダプター)である。このようなdsDNAベースのアフィニティーアダプターは、好ましくは、PCR増幅のためのプライマー部位をアフィニティーアダプターに組み込むことを可能にする配列長を有する。

アフィニティー精製に適した修飾は、当該技術分野で公知であり、例えば、ビオチン及びビオチンベースの修飾を含み、ここで、ビオチンまたはビオチンベースの修飾は、DNAベースのアフィニティーアダプターの5'または3'末端に、またはDNAベースのアフィニティーアダプターの特定のヌクレオチド(またはヌクレオチド誘導体)、例えばデオキシチミジンに結合される。適切なビオチン及びビオチンベースの修飾には、例えば、ビオチン、ビオチンdT(ビオチン化デオキシチミジン塩基)、ビオチンTEG(15原子トリエチレングリコールスペーサー)、デスチオビオチンTEG、二重ビオチン、光切断性(PC)ビオチン、ビオチンアジド、ニトリロ三酢酸(NTA)、DNP、TEG(2,4-ジニトロフェニル)、及びそれらの組み合わせが含まれる。他の適切な修飾には、ジゴキシゲニン、タンパク質タグ、及びそれらの組み合わせが含まれる。好ましくは、1つ以上の修飾は、ビオチン及びビオチンベースの修飾、及びそれらの組み合わせからの1つ以上の、好ましくは少なくとも2つの修飾が選択される。特定の実施態様では、ビオチン修飾は、dsDNAベースのアフィニティーアダプターの1本鎖のみに添加される。

さらに、アフィニティーアダプターは、好ましくは、PCRプライミングに使用するのに適合したプライマー部位を含む。これは、PCRプライマーが、アフィニティーアダプターが連結された切断されたdsDNA断片を増幅するために徐冷できるヌクレオチド配列を意味する。好ましくは、アフィニティーアダプターにおける、好ましくはdsDNAベースのアフィニティーアダプター、及び/またはプライマー部位の配列は、標的ゲノム（即ち、インプット試料及び/または参照ゲノム中のゲノムDNAの配列) 中に存在しない。

好ましい実施形態では、アフィニティーアダプターは、1つ以上のビオチンまたはビオチンベースの修飾を含むdsDNAベースのアフィニティーアダプターである。特定の好ましい実施形態では、アフィニティーアダプターは、1つ以上、好ましくは少なくとも2つの内部ビオチンdTを含むDNAベースのアダプターである。本発明のさらなる特定の実施形態では、アフィニティーアダプターは、配列番号:03に定義された配列及び配列番号:04の配列を含むdsDNAベースのアフィニティーアダプターである。本発明のさらなる特定の実施形態では、アフィニティーアダプターは、配列番号:03及び配列番号:04の配列からなる。

アフィニティーアダプターは、当該技術分野で公知の方法により、切断されたdsDNAの開裂部位に連結される。切断されたdsDNA断片の開裂部位は、1種以上の標的特異的プログラム可能ヌクレアーゼにより切断されたdsDNA断片中の開裂部位を指す。例えば、当該技術分野で公知の連結プロトコルを用いて、酵素的または化学的な連結により、切断されたdsDNA断片の開裂部位にアフィニティーアダプターを連結することができる。公知のDNAリガーゼを用いて酵素的な連結を行うことができる。好ましい実施態様では、アフィニティーアダプターは、酵素的な連結によって切断されたdsDNAの開裂部位に連結される。

好ましくは、切断されたdsDNA断片の開裂部位にアフィニティーアダプターを連結することは、1.アフィニティーアダプター連結のために切断されたdsDNA断片を調製すること；及び2.アフィニティーアダプターを切断されたdsDNA断片の開裂部位に連結して、アフィニティーアダプター修飾dsDNA断片を得ることを含む。アフィニティーアダプター連結のための切断されたdsDNA断片を調製する方法は、当該技術分野で公知である。アフィニティーアダプター連結のために切断されたdsDNA断片を調製することは、切断されたdsDNAを末端修復すること及びdAテーリングすることの一方または両方を含んでもよい。

本発明の特定の実施形態では、アフィニティーアダプター連結のために、切断されたdsDNA断片の開裂部位は、末端修復により調製され、オーバーハングがなく、5'ホスフェート基及び3'ヒドロキシル基、及びdAテーリングを含有する切断されたdsDNA断片を調製する。このようにして調製された切断されたdsDNA断片の末端に、アダプターの一端の3'末端にdTオーバーハングを有するdsDNAベースのアフィニティーアダプターを連結することができる。

連結後、アフィニティーアダプターを使用して、アフィニティーアダプター修飾dsDNA断片を濃縮し、濃縮されたアフィニティーアダプター修飾dsDNA断片を得る。この文脈において"アフィニティーアダプター修飾dsDNA断片を濃縮する"ことは、アフィニティーアダプターを介して、アフィニティーアダプター修飾dsDNA断片への、特異的、一過性または永続的な結合、及びアフィニティーアダプター修飾されていない、好ましくは任意に他の成分のdsDNA断片からの分離を指す。従って、アフィニティーアダプター修飾dsDNA断片がどのように濃縮されるのは、使用されるアフィニティーアダプター（即ち、アフィニティーアダプターに使用される親和性タグのタイプ)に依存する。特定のアフィニティーアダプターを用いてアフィニティーアダプター修飾dsDNA断片を濃縮するためのプロトコルは、当該技術分野で公知である。

好ましい実施形態によれば、アフィニティーアダプター結合分子は、好ましくは固体支持体上に固定可能であり、アフィニティーアダプター修飾dsDNA断片を濃縮するために使用される。アフィニティーアダプター結合分子は、アフィニティーアダプターに特異的に(可逆的または不可逆的に)結合する分子、例えば、タンパク質、抗体等を指す。アフィニティーアダプター結合分子は、アフィニティーアダプターへ結合する前または後に、固相支持体上に固定することができる。アフィニティーアダプター結合分子の性質は、使用されるアフィニティーアダプターに依存する。アフィニティーアダプター結合分子は、例えば、タンパク質であってもよい。前記固体支持体は、特に限定されず、例えば、磁気ビーズ等のビーズを含む。好ましい実施形態では、固体支持体として、磁気ビーズ、好ましくはダイナビーズのようなポリマーで被覆された磁気ビーズが使用される。

一実施形態によれば、アフィニティーアダプター結合分子は、好ましくはストレプトアビジン、アビジン；アフィニティーアダプターの一部に特異的な抗体またはその機能的断片、例えば、抗ジゴキシゲニン抗体；ジゴキシゲニン結合タンパク質；またはそれらの変異体；より好ましくはストレプトアビジン、アビジン、またはそれらの変異体から選択されるタンパク質である。アフィニティーアダプターの一部に特異的な抗体またはその機能的断片は、好ましくは、アフィニティーアダプター、例えばジゴキシゲニンまたはタンパク質タグ上のアフィニティー精製に適した1つ以上の修飾に特異的に結合する。

好適な実施形態によれば、アフィニティーアダプターは、1つ以上のバイオリンまたはビオチンベースの修飾を含み、アフィニティーアダプター結合分子は、ストレプトアビジン、アビジンまたはその変異体、好ましくはストレプトアビジンまたはその変異体である。1つ以上のビオチンまたはビオチンベースの修飾で修飾されたDNAを濃縮するプロトコルは、当該技術分野で公知である。ストレプトアビジンまたはその変異体は、ポリマーで被覆された磁気ビーズの上に固定されて使用していてもよい。例えば、ダイナビーズMyoneストレプトアビジンC1、ダイナビーズM-270、ダイナビーズM-280、またはダイナビーズMyoneストレプトアビジンT1を用いてもよい。

濃縮されたアフィニティーアダプター修飾dsDNA断片をPCR増幅により増幅し、切断及び増幅されたdsDNA断片のDNAライブラリーを得る。本明細書に記載の、アフィニティーアダプター修飾dsDNA断片を含むdsDNA断片のPCR増幅は、当該技術分野で公知である。好ましい実施形態では、ブロッキングアダプター及び/またはアフィニティーアダプターの部分に特異的なPCRプライマー（即ち、ブロッキングアダプター及び/またはアフィニティーアダプターの配列の一部に相補的である)が、PCR増幅に使用される。

アフィニティーアダプター修飾dsDNA断片が固相支持体上に固定されたアフィニティーアダプター結合分子を用いて濃縮された場合、アフィニティーアダプター結合分子を介して固相支持体に結合したアフィニティーアダプター修飾dsDNA断片は、PCR増幅のための鋳型として機能することができる。あるいは、濃縮されたアフィニティーアダプター修飾dsDNA断片を、PCR増幅の前に、アフィニティーアダプター結合分子及び/または固体支持体から分離（例えば、放出)する。好ましい実施形態では、PCR増幅は、少なくとも最初に、アフィニティーアダプター結合分子を介して固相支持体に結合したアフィニティーアダプター修飾dsDNA断片を鋳型として用いて行われる。本明細書において、用語"鋳型"とは、PCR増幅中に他のDNAまたはRNAを直接に合成するためのDNA鋳型として機能する濃縮されたアフィニティーアダプター修飾dsDNA断片の機能を指す。

本発明の好ましい実施形態によれば、ステップb4)において、切断及び増幅されたdsDNA断片のDNAライブラリーを得ることは、2段階のPCR増幅を含み、好ましくは、1. 第1のPCR増幅ステップ：アダプター結合分子を介して固相支持体に結合した濃縮されたアフィニティーアダプター修飾dsDNA断片を鋳型とし、アフィニティーアダプターに特異的なプライマーを用いて、線形PCR増幅を行うステップ、そして、2.第1ステップの後の第2のPCR増幅ステップ：反応混合物からアダプター結合分子を介して固相支持体に結合した、濃縮されたアフィニティーアダプター修飾dsDNA断片を除去し、ブロッキングアダプターに特異的なプライマーを第2プライマーとして添加するステップを含む。

ステップc)配列決定
本発明の第1態様の方法は、さらに、切断及び増幅されたdsDNA断片のDNAライブラリーの配列決定を行い、配列の読み取りデータを得るステップ(c)を含む。dsDNA断片のDNAライブラリーの配列決定をどのように行うかについては、当該技術分野で公知である。

本明細書で使用する場合、"配列決定"は、核酸の配列を決定する任意の方法を含む。本法で使用するための配列決定方法は、特に限定されず、例えば、連鎖停止剤(Sanger)配列決定及び色素停止剤配列決定を含む。好ましい実施形態では、次世代シークエンシング(NGS)が使用される。異なるNGSプラットフォームは様々なアッセイ化学を使用するが、それらは一般に、多数の鋳型上で同時に実行される多数の配列決定反応から配列データを産生する。典型的には、配列データは、スキャナを使用して収集され、その後、組み立てられ、生物情報学的に解析される。このようにして、配列決定反応が行われ、読み取られ、組み立てられ、並行して分析される（例えば、US 2014/0162897；及びMacLeanら, 2009 Nature Rev. Microbiol. 7:287-296を参照)。

NGS法は、一部が鋳型増幅を必要とするが、他の一部がそれを必要としない。増幅を必要とする方法には、パイロシークエンス法、Solexa/Illuminaプラットフォーム、または担持されたオリゴヌクレオチド連結及び検出(SOLiD)が含まれる（例えば、EP 0 946 752；EP 1634 963；EP 0 777 749；EP 1 117 827；及びEP 0 777 749；及び米国特許第6,969,488号及び6,130,073号を参照)。増幅を必要としない方法としては、例えば、ナノポア配列決定のような単一分子配列決定法、HeliScope単一分子配列決定、及びゼロモード導波路を用いた合成単一分子リアルタイム(SMRT)DNA配列決定法によるリアルタイム配列決定が含まれる（例えば、EP 2 007 908；EP 1 848 829；EP 2 100 971；及び米国特許第7,169,560号；第7,501,245号；第6,818,395号；第7,501,245号；及び第7,170,050号を参照)。好ましい実施形態では、イルミナ配列決定が使用される。

好ましい実施態様では、切断及び増幅されたdsDNA断片のDNAライブラリーを配列決定するためのステップc)では、ステップc1)において、切断及び増幅されたdsDNA断片のDNAライブラリーが、配列決定のために、必要に応じて、dsDNA断片の両端に配列決定アダプターを連結することによって調製され、また、ステップc2)において、調製された切断及び増幅されたdsDNA断片のDNAライブラリーが、好ましくはNGSにより配列決定され、配列の読み取りデータが得られる。特定の実施態様では、ステップc1)において、配列決定のため、切断及び増幅されたdsDNA断片のDNAライブラリーを調製することは、好ましくは、切断及び増幅されたdsDNA断片のDNAライブラリーの末端修復及びdAテーリングの一方または両方によって、続いて、配列決定アダプターを、好ましくは、dsDNA断片の両端に連結することによって、配列決定アダプターを両端に連結するための、切断及び増幅されたdsDNA断片のDNAライブラリーの調製を含み、ここで、前記配列アダプターは、例えば、イルミナ配列アダプターである。ステップc2)において、好ましくは、例えば、Illumina TruSeq 用のddPCRライブラリー定量キットを用いたドロップレットデジタルPCR(ddPCR)を使用してもよい。

ステップ(c)での配列決定は、例えばHiSeqのような高性能シーケンサを必要としない。代わりに、例えば、MiSeq試薬キットv2を備えたMiSeq機器(Illumina)のような基本的なNGSシーケンサを使用することができる。

ステップd)配列読み取りの参照ゲノムへの整列
本発明の第1態様の方法は、配列を参照ゲノムに整列させて、整列された配列を読み取りデータを得るステップ(d)をさらに含む。この文脈上の整列は、参照ゲノム中の対応する配列に配列読み取りを位置づけることを意味し、その結果、特定の配列については、参照ゲノム中の対応する配列が、配列読み取りの配列と最も一致する（即ち、不完全な一致から配列同一性までの範囲で)。配列読み取りを参照ゲノムに整列させる方法は、当該技術分野で公知である。例えば、配列読み取りが上記のように整列され得る限り、任意のコンピュータプログラムを使用してもよい。それらは、関連技術で既に知られる既知のプログラム、または目的に合わせたプログラムであってもよい。本開示の特定の実施形態では、配列読み取りは、Bowtie2を用いて参照ゲノムに配列される。

本発明の好ましい実施形態によれば、ゲノムDNAは、ヒトゲノムDNAであり、参照ゲノムは、例えば、hg16(NCBI Build 34)、hg17(NCBI Build 35)、hg18(NCBI Build 36.1)、hg19(GRCh37)、及びhg38(GRCh38)から選択され、好ましくは、hg19及びhg38から選択されるヒト参照ゲノムである。

特定の好ましい実施形態では、ステップd)において、配列読み取りは、まず、ステップd1)において、配列読み取りからブロッキングアダプター配列、アフィニティーアダプター配列、及び任意の配列決定アダプター配列をトリミングして、トリミングされた配列読み取りを得て；次に、ステップd2)において、トリミングされた配列読み取りを参照ゲノムに位置づけて、整列された配列読み取りを得ることによって、参照ゲノムに整列され、整列された配列読み取りを得る。

ステップe)開裂部位の同定
本発明の第1態様の方法は、以下のように開裂部位を同定するステップ(e)をさらに含む。即ち、推定開裂部位を決定し、偽陽性開裂部位を除外し、（ここで、推定開裂部位は、整列された配列読み取り開始部分と終了部分の両方が一致する参照ゲノム内の配列領域を探し出すことによって測定する）、そして、推定開裂部位を、配列読み取り開始部分と終了部分が一致するこれらの配列領域の部位として特定する。

従って、開裂部位の測定は、1種以上の標的特異的プログラム可能ヌクレアーゼの特異的な開裂部位に対する配列相同性に基づいていない。

"推定開裂部位"という用語は、in vitroで1種以上の標的特異的プログラム可能ヌクレアーゼにより切断された任意の開裂部位、ならびに偽陽性開裂部位を含んでもよい。偽陽性開裂部位は、開裂部位の検出中に、in vitroで1種以上の標的特異的プログラム可能ヌクレアーゼによって切断される部位ではなく、推定開裂部位として測定され、従って、誤って同定された部位、即ち、偽陽性である。本明細書で使用される用語"推定開裂部位"とは、短いntの配列（即ち、参照ゲノムにおける短いDNA配列)、好ましくは設定された長さのもの（即ち、1つの推定開裂部位から他の開裂部位までは変化しない)を指す。好ましい実施形態では、ステップe)で測定される推定開裂部位は、設定された配列幅の特定のウィンドウ（即ち、ウィンドウごとに変化しない、参照ゲノムの定義された配列長をカバーするウィンドウ）のntの配列からなり、好ましくは約6 nt以下のウィンドウ、より好ましくは(約)4 ntのウィンドウのntの配列からなる。換言すれば、該好ましい実施形態では、推定開裂部位は、特定のウィンドウによってカバーされた参照ゲノム中のDNA配列に対応する。

整列された配列の読み取り開始部分及び配列読み取り終了部分の両方が一致する参照ゲノム中の配列領域は、配列読み取り開始部分及び配列読み取り終了部分の両方を含む整列された配列読み取りを含む可変または設定された配列長の参照ゲノム中の領域である。即ち、参照ゲノムに整列された前記領域内の全ての整列された配列読み取りのうち、1つ以上の整列された配列読み取りが開始し、1つ以上の配列読み取りがその配列領域で終了する配列領域である。好ましい実施形態では、各配列領域は、定義された配列長、好ましくは約20～1000 nt、より好ましくは約50～500 nt、さらに好ましくは少なくとも約50 nt、さらに好ましくは少なくとも約80 ntである。最も好ましくは少なくとも(約)100 ntの配列群である。別の好ましい実施形態では、ステップe)において、各配列領域は、定義された配列長、好ましくは約100 ntまたはその倍数、より好ましくは100 ntまたはその倍数（即ち、100 nt、200 nt、300 nt、400 nt等)の配列群である。

配列読み取り開始部分とは、配列読み取り終了部分とは反対側に位置する整列された配列読み取りの1つの末端を指す。参照ゲノムの同一のヌクレオチド鎖に整列された配列読み取りについては、全ての配列読み取り開始部分が同じ方向に指し、全ての配列読み取り終了部分が参照ゲノム配列のヌクレオチド鎖の反対方向に指す。即ち、好ましくは、参照ゲノムの第１の一本鎖配列に相補的な第１の整列された配列読み取りの場合、配列読み取り開始部分は、該第１の整列された配列読み取りの3'末端にあり、該第1の整列された配列読み取りと正確に同じ長さで、かつ正確に相補的である仮想の第2の整列された配列読み取りの場合、配列読み取り開始部分は、該第2の整列された配列読み取りの5'末端にある。これによって、両方の整列された配列読み取りが参照ゲノムの同じ空間位置で開始する。従って、本発明の特定の実施形態によれば、参照ゲノムの同じ連続配列に整列された配列読み取りの任意の配列読み取り開始部分は、参照ゲノムの同じ連続配列に整列された配列読み取りの任意の配列読み取り終了部分とは反対の方向を指す。即ち、参照ゲノムの同じ連続配列に整列された、整列された配列読み取りの全ての配列読み取り開始部分は、個々の整列された配列読み取りのそれぞれの配列中心の片側の整列された配列読み取り配列に空間的に位置し、そして、参照ゲノムの同じ連続配列に整列された、整列された配列読み取りの全ての配列読み取り終了部分は、（配列読み取り開始部分と比較して）個々の整列された配列読み取りのそれぞれの配列中心の反対側の整列された配列読み取り配列に空間的に位置する。

このようにして同定された配列領域では、推定開裂部位が、これらの配列領域内の、配列読み込み開始部分と配列読み込み終了部分が一致する部位として同定される。この文脈において"一致する"という用語は、互いに指している配列読み取り開始部分と配列読み取り終了部分が近接することを意味する。即ち、数nt以内、または接触し、つまり、読み取り先の参照ゲノム配列上でそれらを分離しないように、または数ntだけオーバーラップするように、きちんと整列する。次いで、これらの配列領域における推定開裂部位は、例えば、整列された配列読み取り開始部分と終了部分との合計の局所的な最大値を求めることによって識別され得る。

本発明の特定の実施形態では、ステップe)において、非ゼロの読み取り開始部分と読み取りデータ終了部分の被覆を有する各配列領域では、1つ以上の推定開裂部位（例えば、配列領域ごとに正確に１つの推定開裂部位、あるいは配列領域ごとに2つの推定開裂部位等）が、整列された配列読み取りの配列読み取り開始部分及び配列読み取り終了部分が一致する部位、また配列読み取り開始部分の数と配列読み取り終了部分の数の合計が局所的な最大値となる部位として測定される。非ゼロの読み取り開始部分と読み取り終了部分の被覆は、そのような配列領域が、整列された配列読み取りの１つ以上の配列読み取り開始部分及び１つ以上の配列読み取り終了部分が整列する領域であることを意味する。

本発明の好ましい実施形態によれば、ステップe)において、推定開裂部位は、次のように測定される：まず、整列された配列読み取りを含む参照ゲノム（のDNA配列）を定義された長さの配列群に分割して、次に、読み取り開始部分と読み取り終了部分の被覆が非ゼロの各配列群について、1つ以上の推定切断サイトを配列読み取り開始部分と配列読み取り終了部分の合計の局所的な最大値を有する部位として測定する。また、任意に、配列群の中心までの距離を最小化する。ここで、配列読み取り開始部分は、整列された配列読み取りの最初の1～5 nt、好ましくは最初の2～4 nt、より好ましくは最初の3 ntからなり、配列読み取り終了部分は、整列された配列読み取りの最後の1～5 nt、好ましくは最後の2～4 nt、より好ましくは最後の3 ntからなる。本発明の特定の実施形態では、1つの推定開裂部位は、各配列群について測定される。

本発明の好ましい実施形態では、ステップe)において測定される推定開裂部位は、設定された配列幅の特定のウィンドウ（即ち、推定される開裂部位ごとに変化しない参照ゲノムの設定された配列長をカバーするウィンドウ)のnt、好ましくは4 ntのウィンドウからなる。換言すれば、該好ましい実施形態では、推定開裂部位は、特定のウィンドウによってカバーされた参照ゲノム中のDNA配列に対応する。好ましくは、このようなウィンドウは、配列群内で定義された幅、例えば、4 ntのウィンドウであり、(該ウィンドウ内で整列された)配列読み取りの開始及び配列読み取り終了部分の合計のための局所的な最大値を有する。任意に、前記ウィンドウの測定は、前記配列群の中心までの距離を最小化することを追加のステップとして含む。

非ゼロの読み取り開始部分及び読み取り終了部分被覆を有する配列群は、整列された配列の1つ以上の配列読み取り開始部分及び1つ以上の配列読み取り終了部分が整列する配列群を指す。上記の実施形態では、配列群幅（即ち、配列群によってカバーされるヌクレオチド配列長)は、特に限定されず、例えば、約20～1000 nt、好ましくは約50～500 nt、より好ましくは少なくとも約50 nt、さらに好ましくは少なくとも約80 ntであり得る。好ましい実施形態では、配列群幅は、少なくとも約100 nt、好ましくは少なくとも100 ntである。別の実施形態では、配列群幅は、約100 ntまたはその倍数、より好ましくは100 ntまたはその倍数（即ち、100 nt、200 nt、300 nt、400 nt等)である。

本発明の特定の実施形態によれば、ステップe)において、開裂部位は、以下のように同定される：
e1)整列された配列読み取りを含む参照ゲノムを、設定された配列長、好ましくは約100 ntの長さの配列群に分割し；
e2)好ましくは、各配列群について、読み取りデータの被覆を測定し、読み取りデータの被覆が0の配列群を廃棄し、好ましくは、参照ゲノムにおける配列順序に基づいて、読み取りデータの被覆が>0の配列群を連続した配列群のセットに結合し；
e3)各配列群を、設定された、ウィンドウの幅と等しいかそれよりも小さい、好ましくは小さい、好ましくは2 ntのステップサイズを有する設定された（配列）幅、好ましくは4 ntのウィンドウに分割し；
e4)以下のように群分けすることにより、各ウィンドウの開始、末端、及び背景被覆を測定し；
- ウィンドウ領域内に入る配列読み取り開始部分を開始被覆群に群分け；
- ウィンドウ領域内に入る配列読み取り終了部分を末端被覆群に群分け；
- ウィンドウ領域内に入るが、開始被覆群及び末端被覆群に属さない配列読み取りを背景被覆群に群分けする。
e5)少なくとも1つの配列読み取り開始部分及び少なくとも1つの配列読み取り終了部分を含む各配列群について、開始被覆と末端被覆の合計を最大化し、該配列群の中心までの距離を最小化することによって、1つ以上の推定開裂部位を決定し；そして
e6)配列読み取り開始部分が、整列された配列読み取りの最初の1～5 nt、好ましくは最初の2～4 nt、より好ましくは最初の3 ntからなり、配列読み取り終了部分が、整列された配列読み取りの最後の1～5 nt、好ましくは最後の2～4 nt、より好ましくは最後の3 ntからなる偽陽性開裂部位を除外する。

好ましくは、ステップe5)で測定された1つ以上の推定開裂部位の各々は、設定された配列幅の特定のウィンドウ（即ち、推定開裂部位ごとに変化しない参照ゲノムの定義された配列長をカバーするウィンドウ)のnt、好ましくはステップe3)で設定された4 ntのウィンドウのntからなる。ここで使用されるステップサイズは、好ましくは、最初のウィンドウの最初のntと2番目のウィンドウの最初のntとのntでの差を指す。これは、参照ゲノムの配列に沿って最初のウィンドウのすぐ隣に配置されたウィンドウ（即ち、参照ゲノムの配列に沿って最初のウィンドウから一方向へ移動したときに最初のウィンドウに最も近くに位置するウィンドウ)である。設定されたステップサイズとは、互いに最も近くに位置する異なるウィンドウ間で変化しないステップサイズ、例えば、2 ntのステップサイズを指す。

本発明の特定の好ましい実施態様では、ステップe1)は、配列された配列からなる参照ゲノムを、設定された配列長の配列群(予備配列群)に、好ましくは約100 ntの長さの配列群に分割することを含み、ステップe2)は、e1)の各(予備)配列群について、読み取りデータの被覆を測定し、読み取りデータの被覆が0の配列群を廃棄し、好ましくは、参照ゲノムの配列順序に基づいて、読み取りデータの被覆が>0の配列群を、連続的な配列群セット(最終配列群)に結合することを含む。ここで、ステップe2)の連続的な配列群セットにおいて、好ましくは、各(最終)配列群は、ステップe1)の1つ以上（即ち、1つ、2つ、3つ、4つ、及び5つ等の予備配列群）の配列群からなる。

好ましくは、該特定の好ましい実施形態では、ステップe2)の連続的な配列群セットにおいて、各(最終)配列群は、参照ゲノムの配列で互いに最も近い、ステップe2）の2つの廃棄された配列群間のステップe1）の連続する配列群の合計によって定義された配列群幅を有する。これにより、ステップe2）の各(最終)配列群は、ステップe1）の配列群(予備配列群)を含む参照ゲノムの配列(即ち、該配列群の開始)で開始し、ステップe2）で廃棄された最初の配列群の直後に続き、そして、ステップe2）で廃棄された次の配列群(即ち、参照ゲノムの配列の次)の直前にあるステップe1）の配列群(即ち、該配列群の末端)で終了する。即ち、該実施形態では、ステップe2）の個々の(最終的な)配列群は、異なる長さを有しうる(参照ゲノムの配列上で異なる長さをカバーする)。しかし、これは常に1つ以上のステップe1）の配列群(即ち、1つ、2つ、3つ、4つ、及び5つ等のステップe1)の配列群)である。

本発明の別の特定の実施形態では、ステップe4)は、以下のように群分けすることにより、各配列群の開始、末端、及び背景被覆を測定し、
- 配列群領域に入る配列読み取り開始部分を開始被覆群に群分け；
- 配列群領域に入る配列読み取り終了部分を末端被覆群に群分け；
- 配列群領域に入るが、前記開始被覆群及び前記末端被覆群に属さない配列読み取りを背景被覆群に群分けする；
そして、配列群毎に、開始被覆群、末端被覆群及び背景被覆群における読み取りデータの数をそれぞれ加算することをさらに含む。

ステップe3)において、設定されたウィンドウ幅（即ち、設定された長さ及び各ウィンドウによってカバーされる参照ゲノムのヌクレオチド配列の一定の長さ)及び設定されたステップサイズは、特に制限されない。好ましい実施形態では、全てのウィンドウについて一定の、設定されたウィンドウ幅は、8 nt以下、好ましくは6 nt以下、最も好ましくは4 ntであり、設定されたステップサイズは、ウィンドウ幅以下、好ましくはウィンドウ幅よりも小さく、例えば、6 nt以下、好ましくは4 nt以下（例えば、4、3、2、または1 nt)、最も好ましくは2 ntである。特定の実施形態では、推定開裂部位が、各配列群についてステップe5)で測定される。本発明の好ましい実施形態では、ステップe)で測定された推定開裂部位は、ステップe3)で定義された特定のウィンドウ（即ち、特定のウィンドウによってカバーされる配列）のnt、好ましくは4 ntのウィンドウからなる。

特定の推定開裂部位において、該推定開裂部位の、整列された配列読み取り開始部分及び配列読み取り終了部分は、それぞれ、参照ゲノム配列中の特定の位置で完全に整列しなくてもよい。一実施形態によれば、推定開裂部位において、整列された配列読み取り開始部分は、参照ゲノム配列中の特定の1番目の位置の+/-2 nt以下、好ましくは+/-1 nt以下で開始し、また、整列された配列読み取り終了部分は、参照ゲノム配列中の特定の2番目の位置の+/-2 nt以下、好ましくは+/-1 nt以下で終了する。好ましくは、該2つの特定の位置は、参照ゲノムの配列において互いに数ntだけ(例えば、1、2または3 ntのみ)離れていて、または互いに直接に隣接している。

推定開裂部位を決定した後、推定開裂部位のリストから偽陽性開裂部位(本明細書では"偽陽性の部位"とも称する)を除外し、開裂部位を同定する。本明細書で使用される用語"開裂部位"とは、ntの短い配列（即ち、参照ゲノム中の短い配列)、好ましくは設定された長さのもの（即ち、推定開裂部位ごとに変化しない)を指す。好ましい実施形態では、開裂部位は、配列長が(約)4 ntである。特定の実施形態では、ステップe)で同定された開裂部位は、設定された配列幅の特定のntのウィンドウ（即ち、ウィンドウごとに変化しない、参照ゲノムの設定された配列長をカバーするウィンドウ)、好ましくは約6 nt以下のウィンドウ、より好ましくは(約)4 ntのウィンドウからなる。本発明の好ましい実施形態では、偽陽性開裂部位は、推定開裂部位での信号被覆に対する背景被覆の比、推定開裂部位における末端被覆に対する開始被覆の比、部位被覆率、及び/または配列群被覆率に基づいて除外される。好ましくは、1種以上の標的特異的プログラム可能ヌクレアーゼによるステップe)の開裂部位の実際の切断は、その特定の開裂部位の配列内、即ち、該特定のウィンドウによってカバーされた配列のどこに、設定された配列幅の特定のウィンドウのntからなる開裂部位の配列内で起こる。

推定開裂部位における開始被覆率は、該推定開裂部位の配列領域において整列された配列読み取り開始部分の合計、即ち、該推定開裂部位によって定義される参照ゲノムの配列領域に整列された配列読み取り開始部分を有する整列された配列読み取りの合計である。好ましい実施形態では、推定開裂部位における開始被覆率は、該推定開裂部位の配列領域において整列された配列読み取り開始部分の合計であり、該推定開裂部位は、配列幅が設定された特定のウィンドウ（即ち、該ウィンドウが異なる推定開裂部位に対して異なるウィンドウで変化せず)、好ましくは配列幅が4 ntのウィンドウによって定義される。換言すれば、該好ましい実施形態では、推定開裂部位における開始被覆率は、推定開裂部位を表す特定のウィンドウ（即ち、好ましくは上記のステップe3）で設定されたウィンドウ)、例えば、4 ntのウィンドウによって定義される参照ゲノムの配列領域に整列された配列読み取り開始部分を有する、整列された配列読み取りの合計である。

同様に、推定開裂部位における末端被覆率は、該推定開裂部位の配列領域において整列された配列読み取り終了部分の合計、即ち、該推定開裂部位によって定義される参照ゲノムの配列領域に整列された配列読み取り終了部分を有する整列された配列読み取りの合計である。好ましい実施形態では、推定開裂部位における末端被覆率は、該推定開裂部位の配列領域において整列された配列読み取り終了部分の合計であり、該推定開裂部位は、配列幅が設定された特定のウィンドウ（即ち、該ウィンドウが、異なる推定開裂部位に対して、異なるウィンドウで変化せず)、好ましくは配列幅が4 ntのウィンドウによって定義される。換言すれば、該好ましい実施形態では、推定開裂部位における末端被覆率は、推定開裂部位を表す特定のウィンドウ（即ち、好ましくは上記のステップe3）で設定されたウィンドウ)、例えば、4 ntのウィンドウによって定義される参照ゲノムの配列領域に整列された配列読み取り終了部分を有する、整列された配列読み取りの合計である。

好ましくは、特定の推定開裂部位を定義する特定のウィンドウの開始被覆率はまた、特定のウィンドウで定義された参照ゲノムの配列領域にある配列読み取り開始部分の配列の一部とのみ整列する全ての配列読み取り開始部分も含む。即ち、配列読み取り開始部分は、特定のウィンドウの開始被覆群に含まれるために、例えば、（配列読み取り開始部分の長さに応じて）1 ntまたは2 nt等の配列読み取り開始部分が、特定のウィンドウの配列領域に整列することが十分である。同様に、好ましくは、特定の推定開裂部位を定義する特定のウィンドウの末端被覆率はまた、特定のウィンドウで定義された参照ゲノムの配列領域にある配列読み取り終了部分の配列の一部とのみ整列する全ての配列読み取り終了部分も含む。即ち、配列読み取り終了部分は、特定のウィンドウの末端被覆群に含まれるために、例えば、（配列読み取り終了部分の長さに応じて）1 ntまたは2 nt等の配列読み取り終了部分が、特定のウィンドウの配列領域に整列することが十分である。

推定開裂部位における背景被覆率は、該推定開裂部位の配列領域において整列された配列読みデータの合計であるが、開始被覆群及び末端被覆群に属さず、即ち、該推定開裂部位によって定義された参照ゲノムの配列領域に整列された配列読み取り開始部分または配列読み取り終了部分を持たずに、推定開裂部位によって定義された参照ゲノムの配列領域に整列された整列配列読み取りの合計である。該推定開裂部位は、任意選択で、設定された配列幅の特定のウィンドウ（即ち、幅は、異なる推定開裂部位に対応する異なるウィンドウで変化しない）、好ましくは配列幅が4 ntのウィンドウ（即ち、好ましくは、上記のステップe3）で設定されたウィンドウ）によって定義される。

本明細書で使用される用語"部位被覆率"とは、推定開裂部位における開始被覆と末端被覆との合計を指し、即ち、推定開裂部位で見合う/一致する整列された配列読み取り開始部分と配列読み取り終了部分の合計である。好ましい実施形態では、用語"部位被覆率"とは、推定開裂部位における開始被覆と末端被覆との合計を指し、即ち、該推定開裂部位は、設定された配列幅の特定のウィンドウ（即ち、幅は異なる推定切断部位に対応する異なるウィンドウで変化しない）、好ましくは4 ntの配列幅のウィンドウによって定義される。換言すれば、用語"部位適用範囲"とは、例えば4 ntの、特定の推定開裂部位を表す、設定された配列幅の特定のウィンドウ（即ち、好ましくは、上述したステップe3)で設定されたウィンドウ）の配列領域内の参照ゲノムに位置合わせされた配列読み取り開始部分及び配列読み取り終了部分の合計を指す。本明細書で使用される用語"配列群被覆率"とは、配列群内の全ての整列された配列読み取りの合計（即ち、特定の配列群の参照ゲノムの配列領域に整列する全ての整列された配列読み取りの合計）を指す。

本発明の別の好ましい実施形態では、偽陽性開裂部位は、次の推定開裂部位のみを選択することによりを除外される：1)ある閾値、好ましくは約0.5を超えない信号被覆に対する背景被覆の比、かつ/または2)ある数値範囲内の、好ましくは約1/5～5/1内にある推定開裂部位における末端被覆に対する開始被覆の比、かつ/または3)最小の部位被覆率、好ましくは約6以上、かつ/または4)最小の配列群被覆率、好ましくは10以上。

本発明の特定の実施形態では、偽陽性開裂部位は、次の推定開裂部位のみを選択することによりを除外される：1)推定開裂部位における信号被覆に対する背景被覆の比が0.5以下であり、かつ2)推定開裂部位における末端被覆に対する開始被覆の比が1/5～5/1であり、かつ3)部位被覆率が6以上であり、かつ4)配列群被覆率が10以上である。

本発明のさらに別の特定の代替実施形態によれば、偽陽性開裂部位は、機械学習モデルを使用して、除外されるか、またはさらに除外される。ここで、機械学習モデルは、好ましくは、上記実施形態に記載された手順によって除外される偽陽性部位について訓練され、好ましくは、信号被覆に対する背景被覆の比、末端被覆に対する開始被覆の比、配列群幅、偽陽性部位間の相対距離、及び/または配列群に対する偽陽性部位の比を特徴として用いて訓練されている。適切なモデルの選択、特徴の選択、及び訓練を含む機械学習モデルの使用方法は、当該技術分野で公知である。例えば、3倍10反復のクロスバリデーション用いて、そして、曲線1下面積を得ることにより、ランダムフォレストモデルを構築することができる。

本発明の一実施形態では、ステップe)の各開裂部位は、1種以上の標的特異的プログラム可能ヌクレアーゼの1つの標的部位（即ち、1つの特異的部位または1つの非特異的部位)を構成し、これにより、好ましくは、各標的部位（即ち、特異的部位または非特異的部位)は、各標的部位（ステップe）で同定された個々の開裂部位の1つ）では異なる1つ特定の開裂部位からなる。特定の実施形態では、ステップe)の特定の開裂部位が、設定された配列幅の特定のウィンドウのntからなる場合、各標的部位（即ち、特異的部位または非特異的部位)は、1つの特定の開裂部位を定義する設定された配列幅の特定のウィンドウの配列からなり、これにより、ステップe）で同定された1つの特定の開裂部位を定義する各特定のウィンドウは、1つの標的部位をもたらす。

本発明の別の実施形態によれば、ステップe)の開裂部位は、1種以上の標的特異的プログラム可能ヌクレアーゼの標的部位（即ち、特異的部位または非特異的部位)に含まれ、これにより、各標的部位（即ち、特異的部位または非特異的部位)は、1つの開裂部位を含む。当業者に理解されるように、本実施形態では、ステップe)の設定された配列幅の特定のウィンドウのntから構成されてもよいステップe)で測定された開裂部位は、必ずしも標的部位配列全体（即ち、特異的部位または非特異的部位の配列)を構成する必要はない。なぜなら、例えば、特異的部位は、例えば、標的配列（即ち、特定の標的特異的プログラム可能ヌクレアーゼが認識するように設計されている配列)及び/またはヌクレアーゼ結合配列(CRISPR/Cas RGN、例えばPAM 配列)をさらに含んでもよく、同様に、非特異的部位は、該実施形態では、例えば、標的配列及び/またはヌクレアーゼ結合配列とある程度(非常に小さい程度でも、例えば、1 nt、または2 nt、または3 nt等)に相当する配列をさらに含んでもてよい。

CRISPR/Cas RGN標的部位は、この他の実施形態では、開裂部位に加えて、標的配列及びPAM配列を含んでいてもよい。例えば、ステップb)で使用される1種以上の標的特異的プログラム可能ヌクレアーゼが、1つ以上のCRISPR/Cas RGNからなる場合、標的部位は、この他の実施形態では、例えば、約18～23 nt、好ましくは約20 ntの、ステップb)で使用される1種以上の標的特異的プログラム可能ヌクレアーゼの標的配列と同一であるか、または少なくとも非常に低い程度（即ち、例えば、1 nt、または2 nt、または3 nt、または4 nt、または5 nt、または6 nt、または7 nt、または8 nt等の配列相同性）で相同である標的配列及び、該標的配列に直接隣接して、例えば2～6 ntの、好ましくは3 ntのPAM配列を含んでもってよく、またはそれらからなる。従って、この他の実施形態では、1種以上の標的特異的プログラム可能ヌクレアーゼが1つ以上のCRISPR/Cas RGNからなる特定の好ましい実施態様では、標的部位、好ましくは、非特異的部位は、例えば、約20～29 nt長、好ましくは約23 ntの配列を含むか、またはそれからなる。このような、例えば、23 ntの配列は、次のような配列に近接しているかまたは重複しているステップe）の開裂部位を同定することによって同定できる:1)2～6 nt、好ましくは3 ntのPAM配列、及び2)ステップb)で使用される１つまたは複数のCRISPR/Cas RGNのうちの１つの標的配列と少なくともある程度、好ましくは非常に低い程度で相同である標的配列(例えば、少なくとも1 nt、または少なくとも2 nt、または少なくとも3 nt、または少なくとも4 nt、または少なくとも5 nt、または少なくとも6 nt、または少なくとも7 nt、または少なくとも8 nt、または少なくとも9 nt、または少なくとも10 nt、または少なくとも11 nt、または少なくとも12 nt、または少なくとも13 nt等の配列相同性)。開裂部位は、好ましくは、例えば、長さ23 ntの、PAM配列に直接隣接する標的配列の末端に近く、例えば、PAM配列に直接隣接する標的配列の末端の最初の約1～7 nt、及び、標的配列に直接隣接するPAM配列の末端の最初の約1～2 ntとからなる配列範囲内にある標的部位（即ち、特異的部位または非特異的部位)に位置する。

本発明の第1態様の方法の特定の実施形態によれば、1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的開裂部位は、1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的開裂部位ではないステップe)の開裂部位として同定される。本発明の第1態様の方法の別の特定の実施形態によれば、1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的開裂部位は、1種以上の標的特異的プログラム可能ヌクレアーゼの特異的部位ではないステップe)の開裂部位を含む特異的部位として同定される。実際に、これは、ステップe)で同定された開裂部位のリスト（これは、1種以上の標的特異的プログラム可能ヌクレアーゼを設計した結果として公知である。）の中に1種以上の標的特異的プログラム可能ヌクレアーゼの標的部位を同定することによって（例えば、標識することによって）行うことができる。これは、当該技術分野で公知の手段によって行うことができる。

二重-Abnoba-Seq
第2態様では、本発明は、第1態様(二重-Abnoba-Seq)のゲノム中の1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的部位をin vitroで検出するための方法を用いて、in vivoで非特異的部位を検出する方法に関する。特に、本発明の第2態様は、次のステップを含むin vivoでのゲノム中の特異的部位を検出するための方法に関する：i)1種以上の標的特異的プログラム可能ヌクレアーゼで処理された細胞のゲノムDNAを含む第1試料、及び、関連する遺伝的背景の細胞のゲノムDNAを含み、好ましくは同一の遺伝的背景の細胞であって、1種以上の標的特異的プログラム可能ヌクレアーゼで処理されない第2試料を準備するステップ、ii)該2つの試料について、上記実施形態のいずれか1つに定義される本発明の第1態様の方法を用いて、かつ、1種以上の標的特異的プログラム可能ヌクレアーゼを用いて、in vivoで非特異的部位をそれぞれ検出するステップ、及び3)該2つの試料の間の非特異的部位を比較して、1種以上の標的特異的プログラム可能ヌクレアーゼで処理されていない細胞のゲノムDNAを含む試料のみに同定され、1種以上の標的特異的プログラム可能ヌクレアーゼで処理された細胞のゲノムDNAを含む試料に同定されない非特異的部位を、該1種以上の標的特異的プログラム可能ヌクレアーゼのin vivo非特異的部位として同定するステップ。

本発明の第2態様による方法は、1種以上の標的特異的プログラム可能ヌクレアーゼのin vivo特異性の個別化された測定を可能にし、換言すれば、特定の細胞における1種以上の標的特異的プログラム可能ヌクレアーゼの実際のオフターゲット活性を測定する能力を実現する。即ち、本発明の第2態様による方法を用いて、in vivoでの、例えば特定の細胞型における標的特異的プログラム可能ヌクレアーゼ活性を実証することができる。

本発明者が見出したように、遺伝子編集された細胞及び未処理細胞からゲノムDNAを単離し、ゲノムDNAのこれらの試料について、本発明の第1態様に従って、遺伝子編集された細胞における遺伝子編集に用いられる標的特異的プログラム可能ヌクレアーゼを用いて、ゲノム中の1種以上の標的特異的プログラム可能ヌクレアーゼの非特異的部位をin vitroで検出する方法を実施することにより、細胞における実際のオフターゲット活性の測定が可能となる。

ゲノムDNAの遺伝子編集試料で同定された非特異的部位を未処理の細胞からのゲノムDNAの試料の非特異的部位と比較することにより、最小量のゲノムDNA、例えば、サンプルあたり1 μg未満を使用して、特定の細胞型または組織の細胞における1種以上の標的特異的プログラム可能ヌクレアーゼの実際のin vivo活性を、遺伝子編集された細胞由来のゲノムDNAの試料においてもはや同定されない部位として測定することができる。これは、例えば1試料あたり1 μg未満の非常に少ない試料量の貴重な、かつ利用可能性が制限される細胞試料におけるin vivoでのオフターゲット活性の試験を可能にする。

1種以上の標的特異的プログラム可能ヌクレアーゼで細胞を処理する方法は、当該技術分野で公知である（例えば、Yinら,2017, ゲノム編集のための送達技術. Nat Rev Drug Discov 16,387-399を参照)。1種以上の標的特異的プログラム可能ヌクレアーゼは、当該技術分野で公知の手段により、そしてin vivoでのゲノム編集に適した濃度及び形態で細胞内に導入される。例えば、1種以上の標的特異的プログラム可能ヌクレアーゼが、1つ以上のCRISPR/Cas RGNを含む場合、例えば、gRNA、Casエンドヌクレアーゼ、またはその両方は、当該技術分野で公知の方法を用いて、細胞内に精製タンパク質及び/または核酸として導入することができ、または細胞内で一過性または安定的に発現させることができる。前記1種以上の標的特異的プログラム可能ヌクレアーゼは、本発明の第1の実施形態において上記したものうちの1つであってもよい。

特に、本発明の第2態様は、次のステップを含むin vivoでのゲノム中の非特異的部位を検出するための方法に関する：i)1種以上の標的特異的プログラム可能ヌクレアーゼで処理された細胞のゲノムDNAを含む第1試料、及び、関連する遺伝的背景の細胞のゲノムDNAを含み、好ましくは同一の遺伝的背景の細胞であって、1種以上の標的特異的プログラム可能ヌクレアーゼで処理されない第2試料を準備するステップ。好ましくは、関連する遺伝的背景は、そのような細胞が同じ遺伝的背景を有することを意味し、これは、可能な限りわずかな差を有することを意味し、理想的には、これらの細胞のゲノムDNAは、例えば、無作為の突然変異のために、ある細胞から別の細胞に生じる可能性のあるわずかな変異を除いて同じである。好ましくは、細胞に関連する遺伝的背景は、好ましくは、多細胞生物（例えば、人体）中の同じ解剖学的領域、例えば、同じ組織及び/または同じ細胞型に由来する細胞である。

本発明の第2態様の方法の好ましい実施態様では、関連する遺伝的背景の細胞は、同じ遺伝的背景の細胞、好ましくは同じ遺伝子コード、好ましくは同じ解剖学的起源、好ましくは同じ組織及び/または細胞型に由来する細胞である。別の実施形態では、関連する遺伝的背景の細胞は、同じ細胞系列の細胞である。本明細書で使用されるものとしての細胞系列の細胞は、非常に一般的に、分裂細胞の分裂結果であり、任意に、細胞分化の結果である共通の祖先細胞から誘導された細胞を指す。好ましくは、同じ細胞系列の細胞は、同じ組織に由来する細胞であり、好ましくは同じ細胞型の細胞である。

好ましくは、関連する遺伝的背景の細胞は、同一の個体の生物に由来する細胞である。第1及び第2試料の細胞が由来する生物の種類は、本発明の第2態様の方法で使用するのに適する限り、特に限定されない。一実施形態では、前記細胞は、真核細胞（例えば、動物、哺乳動物、昆虫、植物、真菌、昆虫、鳥、魚、水陸両用生物、虫類、または刺胞動物)である。特定の実施形態では、前記細胞は、ヒト細胞である。例えば、前記細胞は、一次細胞であってもよい。

両方の試料について、本発明の第1態様の方法を用いて、ステップi)の1種以上の標的特異的プログラム可能ヌクレアーゼを用いて、独立に非特異的部位をin vitroで検出する。最後に、2つの試料の間の非特異的部位を比較して、1種以上の標的特異的プログラム可能ヌクレアーゼで処理されていない細胞のゲノムDNAを含む試料のみに同定され、1種以上の標的特異的プログラム可能ヌクレアーゼで処理された細胞のゲノムDNAを含む試料に同定されない非特異的部位を、該1種以上の標的特異的プログラム可能ヌクレアーゼのin vivo非特異的部位として同定する。2つの試料の間の非特異的部位を比較する方法は、当該技術分野で公知である。好ましくは、これは、既存の、または本目的のために特製されたコンピュータプログラムを使用して行われる。例えば、配列群幅による配列群被覆率の正規化後、ゲノム内のそれらの位置及び未処理の細胞の結果の次に書き込まれた編集された細胞の結果によって、開裂部位を選別することができる。

さらなる態様において、本発明は、上記実施形態のいずれかに記載される本発明の第1態様に係る方法を実施するためのキット、及び、上記実施形態のいずれかに記載される本発明の第2態様に係る方法を実施するためのキットに関する。このようなキットを調製する方法は、当該技術分野で公知である。

以下の実施例を用いて本発明をさらに説明する。

実施例に適用された材料及び方法
リボヌクレオチド複合体の形成
in vitro実験のために、HiScribe T7高収量RNA Syntesisキット(NEB)を用いて、続いてMEGAclearキット(Thermo Fisher Scientific)で洗浄することにより、in vitroでgRNAをPCR増幅産物から転写した。細胞系実験では、化学的に修飾されたgRNA(Synthego)を購入した。Cas9タンパク質は、以前に公表されたプロトコル(Jinekら, 2012, Science 337(6096):816-821)に従って自家製造した。RNP複合体を形成するために、Cas9及びgRNAを1：3のモル比で、室温で10分間インキュベートした。

細胞培養及び遺伝子導入
10%FBS及び1%ペニシリン/ストレプトマイシン(Sigma-Aldrich)を補充した低グルコース及びピルビン酸塩(Gibco)を含むDMEM中でU20S細胞を培養した。産婦人科からインフォームドコンセントの上で得られたヒト臍帯血から、Ficollベースの密度勾配遠心分離、次に、ヒトCD34 MicroBead Kit UltraPure (Miltenyi Biotec)を用いた陽性選択により、CD34+細胞を精製した。該CD34+細胞を、20 ng/μl TPO、60 ng/μl SCF、及び60 ng/μl Flt-3L(CellGenix(登録商標))を補充したCellGro SCGM(CellGenix(登録商標))中で培養した。電気穿孔の前に、CD34+細胞培地に12 ng/μlのIL-3を添加した。U2OS細胞用のSEキットとプログラムDN-100、及び、CD34+細胞用P3キットとプログラムCA-136のいずれかを使用したNucleofector 4D（Lonza Group AG）を用いて、メーカーの取扱説明書に従って、細胞をRNPで遺伝子導入した。

ゲノムDNAの単離及び断片化
QIAamp DNA血液ミニキット(Qiagen)を用いて、細胞のゲノムDNAを単離した。M220合焦超音波処理装置(Covaris)を用いて、メーカーの取扱説明書に従って、ゲノムDNAを長さ（中央値）400 bpに剪断した。

Abnoba-Seqワークフロー
使用された全てのプライマーを表1に示す。ワークフロー全体を通して、NEBNext Ultra IIキット(NEB)及びAMPure XPビーズ(Beckman Coulter)を使用した。末端がブロックされたDNA断片のバッチの製作：剪断されたゲノムDNA(反応あたり600 ng)の末端を調製し、NEBNext Ultra IIキット(NEB)を用いて、ブロッキングアダプター(112.5 pmol)を20℃で30分間連結した。エキソヌクレアーゼIII(200 U, NEB)、エキソヌクレアーゼI(20 U, NEB)、及びλエキソヌクレアーゼ(50 U, NEB)でエキソヌクレアーゼ処理により、末端がブロックされていない断片を除去した。

in vitro切断：50 ngの末端ブロックゲノムDNA断片を、1.6 pmolのCas9タンパク質(lab-made)及び4.8 pmolのgRNAを25 μlの容量で、1x NEB緩衝液3及び1x BSAを用いて37℃で1時間反応して、in vitroで切断した。4 μgのRNase及び50%EDTA 0.5M pH8.0、30%グリセロール、及び1%SDSを含む停止溶液を添加し、反応を停止させ、37℃で15分間インキュベートした。Q5ポリメラーゼ(NEB)を用いて品質管理PCRを行い、該特異的部位を増幅した。

切断されたDNA断片のビオチン化：切断されたDNA断片の末端を調製し、NEBNext Ultra IIキットを用いて、ビオチン-アダプター(75 pmol)を連結した。ダイナビーズ MyOneストレプトアビジンC1(Thermo Fisher Scientific)を介して、メーカーのプロトコルに従って、ビオチン化された断片を濃縮した。その後、ビオチン-アダプター特異的プライマーのみを用いて、ストレプトアビジン結合ビオチン化DNA断片を鋳型として線形PCR増幅にアプライした。10サイクル後、4℃でPCR反応を停止し、線形PCR産物とのPCR反応を新たなチューブに移し、ブロッキングアダプターに特異的なプライマーを添加し、PCRをさらに10サイクル継続した。増幅産物をDNAライブラリー調製物にアプライして、次世代シークエンシングのために、これらを調製した。

次世代シークエンシング：イルミナTruSeq（Bio-Rad）用のddPCRライブラリー定量キットを備えたddPCRを使用して、DNAライブラリーを定量した。配列決定は、MiSeq試薬キットv2を備えたMiSeq機器（Illumina）で実施した（300サイクル）。

オフターゲット分析：配列決定データ分析の最初のステップ、及び後のいくつかステップは、usegalaxy.eu (Afganら, 2018, Nucleic Acids Res 46(W1):W537-W544)におけるGalaxyを用いて行われた。最初に、初期設定を備えたTrim Galoreを用いて、イルミア-アダプター、ブロッキングアダプター、及びビオチン-アダプターからのアダプター配列を読み取りデータから除去した。初期設定を備えたBowtie2でヒト参照ゲノム(hg19)に除去された読み取りデータを位置づけた。その後、ベッドツール(Quinlan及びHall, 2010, Bioinformatics 26(6)：841-842)を用いて、ヒトゲノム上の100 ntスライディングウィンドウ内の全読み取りデータ被覆を最初に定量することにより、整列された配列読み取りをさらに分析した。被覆率が>0の非空の連続したウィンドウを配列群に合併し、空のウィンドウを廃棄した。次に、配列群を2 ntのステップで4 ntの重複ウィンドウに分割した。各読み取りデータの最初と最後のヌクレオチド(nt)を、それぞれ開始及び末端被覆率の計算用とした。開始被覆群に属しておらず、かつ、末端被覆群に属していない読み取りデータを、背景被覆率の計算用とした。非0の開始及び終了被覆を有する各配列群について、開始及び末端被覆を最大化し、配列群の中心までの距離を最小化することにより、推定開裂部位を検索した。偽陽性部位は、次の基準に適用することによって濾別した：背景対信号比≦0.5、開始対末端比≧1/5～≦5、部位被覆率(開始及び末端被覆率)≧6、及び配列群被覆率≧10。残りの偽陽性部位をさらに除去するために、機械学習モデルを、開始対末端比、背景対信号比、配列群幅、相対距離、及び部位対配列群比の特徴に基づいて、RNF2で注釈を付けた部位上で訓練した。文献及び先行知識に基づいて、使用されたパイプラインによって同定されたRNF2部位を真または偽の陽性として分類した。これらの部位の3分の2について、3倍10反復のクロスバリデーションを用いて、ランダムフォレストモデルを構築し、訓練セット及び試験セットの両方について、曲線1下面積を得た。次いで、訓練されたモデルを用いて、他の標的部位を分類し、予測された偽陽性部位を濾別した。

可視化：同定された標的部位を可視化するために、Integrative Genomics Viewer(IGV)を使用した(Robinsonら, 2011, Nat Biotechnol 29(1):24-26；Thorvaldsdottirら, 2013、Brief Bioinform 14(2):178-192)。

標的増幅産物の配列決定
臍帯血から単離されたU20S細胞及びCD34+細胞を、VEGFA及びHEK4を標的とするRNPで核形成し、遺伝子導入後7日目に処理及び未処理の細胞のゲノムDNAを採取した。Q5ポリメラーゼ(NEB)を用いて、特異的部位、ならびにCRISPR-Cas9ヌクレアーゼのトップ20の非特異的部位をPCRで約300 bpの増幅産物サイズに増幅した。QIAquick PCR精製キット(Qiagen)を用いてPCR増幅産物を精製し、Qubit Fluorometer(Thermo Fisher Scientific)を用いて濃度を測定した。20 ngの各21個の増幅産物を群ごとに混合し(未処理/遺伝子編集されたもの、U20S/HSC)、NEBNext Ultra IIキット(NEB)を用いてDNAライブラリー調製物にアプライした。Illumina TruSeq(Bio Rad)用のddPCRライブラリー定量キットを備えたddPCRを用いて、DNAライブラリーを定量し、MiSeq試薬キットv2を用いてMiSeq(Illumina)上で配列決定を行った(500サイクル)。NGSの後、CRISPResso((Pinelloら, 2016, Nat Biotechnol 34(7):695-97)を用いて、次の設定で読み取りデータを分析した：最小平均品質スコアを30（q 30）に設定し、phred33品質スコアに基づいて読み取りデータを濾別し、該読み取りデータからイルミナアダプター配列をトリミングし、予測される開裂部位（w 40）の周囲40 ntのウィンドウ内の挿入欠失を定量し、SNPを考慮しないための定量のために、置換イベントを無視する。次式を用いて編集効率を算出した：
編集効率％=(遺伝子編集された細胞における挿入欠失の読み取りデータ％)-(未処理細胞における挿入欠失の読み取りデータ％)。

表1: オリゴヌクレオチド
配列は5'から3'への方向で示されている。修飾：*=ホスホロチオエート結合、/5'Phos/=5'リン酸化、/5SpC3/=5'C3スペーサー、/3SpC3/=3'C3スペーサー、/iBiodT/=内部ビオチン-デオキシチミジン、/ideoxyU/=内部デオキシウリジン

結果
実施例1：Abnoba-Seqワークフロー
本発明者らは次のように仮定した：in vitroでCRISPR-Casを用いて、断片化され、末端ブロックゲノムDNAを切断することにより、ビオチン化アダプターによる開裂部位のその後のタグ付けが可能になり、次に、切断されたDNA断片を容易に濃縮し、ハイスループットシークエンシング後の標的部位の最終同定を可能にする(図1)。断片化され、末端ブロックゲノムDNAライブラリーを製作するために、ゲノムDNAをサイズ（中央値）約400 bpに無作為に剪断し、両鎖にC3-スペーサーを有する二本鎖(ds)DNAアダプターを、末端が修復され、dAテーリングのDNA断片に連結した。末端ブロック断片と呼ばれる両端に連結されたブロッキングアダプターを有するDNA断片は、エキソヌクレアーゼIII、エキソヌクレアーゼI、及びλエキソヌクレアーゼの組み合わせで断片を処理した後99%以上を占めた(図2)。次いで、約15,000の単数体のゲノムに対応する50 ngの末端ブロックDNA断片を、1.6 pmolのRNP(1：3のモル比でgRNAと複合体化したSpyCas9タンパク質)で切断した。該切断反応は、2つの内部ビオチン化dT塩基を有するdsDNAベースのアフィニティーアダプターが、末端修復とdAテーリング後に連結する全ての標的部位で遊離DNA末端を産生した。ステップ内制御として、特異的部位に特異的なプライマーを用いたPCR増幅により、CRISPR-Cas9オンターゲット活性をモニターした。該特異的部位が有効に切断された場合には、PCRは弱いバンドのみを戻すべきである(図3)。該試料がステップ内制御を合格した場合、ビオチンに対して高い親和性を有するストレプトアビジンを装填したビーズを用いて、CRISPR-Cas切断DNA断片を濃縮した。これらのアダプターはまた、次のように使用されるPCRステップのための標的配列を追加した：最初に、線形増幅によりストレプトアビジンビーズからビオチン化DNA断片を放出し、次に、dsDNAを再び産生し、最後に、イルミナアダプターを有する配列決定ライブラリーを製作し、対端の次世代シークエンシング(NGS)に供した。重要なことに、Abnoba-Seqパイプラインは、配列相同性駆動のアルゴリズムに基づいていない。その結果、gRNAとPAM 配列とは全く独立している。生体情報パイプラインは、パターン認識アルゴリズムに依存し、整列された配列読み取りの特定の配列、即ち、重複開始(最初の3塩基)と末端(最後の3塩基)が含まれる読み取りデータを検索する。簡単に述べると、ゲノム全体を走査して、末端配列群で、推定開裂部位を含むゲノム領域を同定した。これらの部位は、同じ位置(+/-3 nt)で開始または終了するいずれかである複数の読み取りデータの存在によって定義される。最後的に、ランダムフォレストに基づく機械学習アルゴリズムを導入して、偽陽性開裂部位を除去した。選択された配列群を、最終的に、それらの被覆率に従って選別した(詳細については、方法の項及び図4を参照)。

実施例2：Abnoba-Seqワークフローのバリデーション
本法を検証にするために、Abnoba-Seqをヒト細胞株U20SのゲノムDNAにアプライし、GUIDE-Seq及びCIRCLE-Seq(Tsaiら, 2015; Tsaiら, 2017)によって以前に評価された4つの異なるCRISPR-Casヌクレアーゼを使用した。予想されるように、NGS読み取りデータのヒト参照ゲノムへの整列は、ヒトゲノムにおけるPAMの上流の3つのヌクレオチドを開始または終了する最も多くの読み取りデータを有する開裂部位の位置を示した(図5)。該開裂部位では開始または終了しなかったが、標的部位を含む読み取りデータのクラスターの一部であった他の読み取りデータを観察した。これらのDNA断片は、該開裂部位で開始または終了する可能性があるが、最大の配列読み取り長さが150 ntのため、完全長で配列決定されなかった。

生体情報分析から、FANCFを標的とするCRISPR-Cas9ヌクレアーゼの42個の標的部位、RNF2標的化ヌクレアーゼの51個の部位、VEGFA標的ヌクレアーゼの307個の標的部位、及びHEK部位4(HEK4)を標的とするCRISPR-Cas9ヌクレアーゼの233個の標的部位が明らかになった(図6)。なお、GUIDE-Seq及びCIRCLE-SeqのようなAbnoba-Seqについては、特異的部位は、最も多くの読み取りデータを返却しなかったことが多かった。最も同定された非特異的部位は、特異的部位に対して高度の配列相同性を示した。しかし、興味深いことに、ヌクレオチドの単純な誤対合に加えて、Abnoba-Seqは、gRNAまたはDNA標的部位のいずれかにバルジを有する多数の非特異的部位を同定した。

Abnoba-Seqにより同定された非特異的部位と、GUIDE-Seq及びCIRCLE-Seqにより以前に見出された非特異的部位との平行比較は、RNF2を標的とするヌクレアーゼではなく、FANCF、VEGFA、及びHEK4について妥当な程度の重複をそれぞれ示した(図3)。発見された58%～100%のGUIDE-Seq及び11%～21%のCIRCLE-Seqの間に、Abnoba-Seqにより非特異的部位がそれぞれ同定された(表2)。特異的部位は、3つの方法の全てによって同定された。一方、より定性的に比較した結果、同定されたトップ20の非特異的部位の大部分が、3つの方法の全てによって検出された。これは、これら3つのアッセイは、頻繁に切断された非特異的部位を確実に検出できることを示唆している。

要約すると、Abnoba-Seqは、実質的に少ないゲノムインプットDNAで共通に切断された非特異的部位を同定することができ、限られた試料量及び利用可能性の貴重な細胞試料において標的特異的プログラム可能ヌクレアーゼの特異性を評価するのに適した方法である。

実施例3：限られた試料量及び利用可能性の細胞試料におけるAabnoba-Seq分析
表2

既存のオフターゲット分析方法の1つの主要な欠点は、限られた試料量及び利用可能性の細胞試料に容易に適用できないことである。入手の可能性が限られた臨床関連の細胞型のゲノムDNA上でAbnoba-Seqを行うことができるという概念実証として、臍帯血由来CD34陽性造血幹細胞及び前駆細胞(HSC)から単離されたゲノムDNAにAbnoba-Seqを適用した。ステップ内制御において可視化されたように(図3B)、VEGFAを標的とするCRISPR-Cas9ヌクレアーゼは、高いオンターゲット切断活性を示し、HSCについてのAbnoba-Seq結果は、U20S細胞のゲノムDNA上で行った以前のものに匹敵した(図6)。より詳細な比較は、同定された部位の大部分が2つの試料の間で共通であることを明らかにした(図8B)。HSCのゲノムDNA上で同定されたトップ20またはトップ50の標的部位を考慮すると、95%(19/20)または92%(46/50)がそれぞれU20S細胞のゲノムDNA上で同定され(図8C、D)、本アッセイの再現性は高いことが示された。要約すると、Abnoba-Seqは、限られた試料量及び利用可能性の貴重な細胞試料から単離されたゲノムDNAにうまく適用できる堅牢な方法である。

実施例4：細胞におけるCRISPR-Casオフターゲット活性の検証
(i)in vitroで全ての潜在的なゲノム非特異的部位がCRISPR-Cas9に容易にアクセス可能であり、そして(ii)ヌクレアーゼ濃度が遺伝子導入された細胞の核の中よりもin vitroではるかに高くなりうることから、標的特異的プログラム可能ヌクレアーゼのin vitro活性の分析は、最悪の場合のシナリオに戻る。従って、トップ20のAbnoba-Seq予測された非特異的部位を、U20S細胞または一次HSCの遺伝子導入の7日後に標的増幅産物の配列決定によって、CIRPSR-Casヌクレアーゼを標的とするVEGFA及びHEKs4について分析した。全体の編集効率は、挿入欠失頻度によって示されるように、U20S細胞内のVEGFA特異的部位では96%、HSCにおけるVEGFA特異的部位では61%、また、HSC内のHEKs4特異的部位では69%であった(図9)。これらの細胞における全体的なオフターゲット活性は比較的低かった。VEGFA非特異的部位(OT)8（U20S細胞では編集された対立遺伝子が20%で、HSCでは編集された対立遺伝子が10%であった）及びVEGFA OT-13（HSCでは編集された対立遺伝子が5%であった）で最高のオフターゲット活性が観察された。他の予測された非特異的部位でのオフターゲット活性は、低いかまたは存在しなかった。非特異的部位のいくつかは、U20S細胞においてのみ切断され、一次HSC(OT-12、OT-14、OT-16)では切断されなかった。これは、細胞型に対する特異性を示唆した。要約すれば、in vitroで同定された非特異的部位の約半分のみが実際に細胞内で切断された。なお、これらの調べた部位の大部分も、CIRLCE-Seq及びGUIDE-Seqによる非特異的部位であると予測された。また、重要なことに、全ゲノムでかつ不偏的に非特異的部位を検出するためのin vitroでの方法は、複雑であるが、単なる予測ツールである。

CRISPR-Cas関連のオフターゲット活性を同定する多くの全ゲノム方法は、外見的に不偏であるが、NGSデータを分析するための生物情報学パイプラインは、特に許容される不適正な塩基対の最大数またはPAMの要件に関して、いくつかの偏見を導入しない。重要なことに、非特異的部位を同定するAbnoba-Seqは、非特異的部位の性質、特異的部位への相同性の程度、特定のPAMの存在についてのいかなる仮定も行わない。従って、Abnoba-Seqは、7つの不適正塩基対と2つのバルジを有するRNF2 OT7、9つの不適正塩基対を有するRNF2 OT37、3つの不適正塩基対と1つのTGA PAMを有するVEGFA OT2、3つの不適正塩基対と1つのTGA PAMを有するVEGFA OT26、または2つの不適正塩基対と1つのTTG PAMを有するVEGFA OT75を含む他の方法によって除外される非特異的部位を同定する。まとめとして、Abnoba-Seqは、in vitro及びin vivoでCRISPR-Cas非特異活性を明らかにするために、真の不偏的なin vitroアッセイである。該アッセイを行うために最小限のゲノムDNAしか必要としないため、Abnoba-Seqは、限られた試料量及び入手可能性の貴重な細胞試料に細胞型特異的に適用することができる。

Claims

ゲノム中の1種以上の標的特異的プログラム可能ヌクレアーゼの標的外部位をin vitroで検出する方法であって、以下のステップを含む方法。
(a) ゲノムDNAを含むインプット試料を準備し、前記ゲノムDNAをdsDNA断片に無作為に断片化し、前記dsDNA断片の末端にブロッキングアダプターを連結し、末端がブロックされていない末端を含むdsDNA断片を除去して、精製された末端ブロックdsDNA断片を調製するステップ；
(b) 切断及び増幅されたdsDNA断片のDNAライブラリーを調製するステップであって、以下により行われるステップ；
b1) 前記精製された末端ブロックdsDNA断片を、1種以上の標的特異的プログラム可能ヌクレアーゼで切断して、切断されたdsDNA断片を得る；
b2) 切断されたdsDNA断片の開裂部位にアフィニティーアダプターを連結して、アフィニティーアダプター修飾dsDNA断片を得る；
b3) アフィニティーアダプター修飾dsDNA断片を、前記アフィニティーアダプターを用いて濃縮して、濃縮されたアフィニティーアダプター修飾dsDNA断片を得る；及び
b4) 濃縮されたアフィニティーアダプター修飾dsDNA断片を、PCR増幅により増幅して、切断及び増幅されたdsDNA断片のDNAライブラリーを得る。
(c) 前記切断及び増幅されたdsDNA断片のDNAライブラリーの配列決定を行い、配列読み取りを得るステップ；
(d) 前記配列読み取りを参照ゲノムに整列させて、整列された配列読み取りを得るステップ；及び
(e) 推定開裂部位を決定し、偽陽性開裂部位を除外することにより開裂部位を同定するステップであって、推定開裂部位は、前記参照ゲノムにおいて、整列された配列読み取りの配列読み取り開始部分及び配列読み取り終了部分が共に一致する配列領域を探し出すこと、ならびに、推定開裂部位を、これらの配列領域において、配列読み取り開始部分及び配列読み取り終了部分が一致する部位として同定することによって決定するステップ。
前記インプット試料が、1 μg未満、好ましくは800 ng未満、より好ましくは700 ng未満、さらに好ましくは約600 ngのゲノムDNAを含む、請求項１に記載の方法。
ステップ（a)が、
a1)前記ゲノムDNAを規定された長さに無作為に断片化して、dsDNA断片を提供するステップ；
a2)ブロッキングアダプターを連結することにより前記dsDNA断片の末端を保護し、末端がブロックされたdsDNA断片を得るステップであって、好ましくは
1)ブロッキングアダプター連結のためにdsDNA断片を調製するステップ；及び
2)前記dsDNA断片の末端にブロッキングアダプターを連結し、末端がブロックされたdsDNA断片を得るステップ
を含み；及び
a3)末端がブロックされたdsDNA断片を含む試料を1種以上のエキソヌクレアーゼと接触させて、末端がブロックされていないdsDNA断片を除去して、精製された末端がブロックされたDNA断片を得るステップ
を含む、前記請求項のいずれか1項に記載の方法。
前記ブロッキングアダプターが、前記ブロッキングアダプターがdsDNA断片に連結された後、前記ブロッキングアダプターが該dsDNA断片に連結された末端の連結を防止する1つ以上の修飾、及び前記ブロッキングアダプターがdsDNA断片に連結された後、前記ブロッキングアダプターが該dsDNA断片に連結された末端から該dsDNA断片のエキソヌクレアーゼ切断を防止する1つ以上の修飾を含む、前記請求項のいずれか1項に記載の方法。
ステップb1)において、前記1種以上の標的特異的プログラム可能ヌクレアーゼが、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、Znフィンガーヌクレアーゼ(ZFN)、メガヌクレアーゼ、メガTAL、Fokl-dCas9、クラスター化して規則的な配置の短い回文配列リピート(CRISPR)/Cas RNAガイドヌクレアーゼ(CRISPR/Cas RGN)またはその変異体、アルゴノート-ファミリータンパク質ベースのDNAガイドDNAヌクレアーゼまたはその変異体、またはそれらの組み合わせから選択され、好ましくは1種以上のCRISPR/Cas RGNであり、ここで、該CRISPR/Cas RGNのCasエンドヌクレアーゼが、好ましくはCas9エンドヌクレアーゼまたはCas9エンドヌクレアーゼの変異体、またはCpf1エンドヌクレアーゼまたはCpf1エンドヌクレアーゼの変異体である、前記請求項のいずれか1項に記載の方法。
前記ブロッキングアダプター及び/または前記アフィニティーアダプターが、dsDNAベースのアダプターであり、PCRプライミングに使用するのに適合するプライマー部位を含む、前記請求項のいずれか1項に記載の方法。
前記アフィニティーアダプターが、1つ以上のビオチンまたはビオチンベースの修飾を含むdsDNAベースのアダプターであり、前記ステップb3)において、好ましくは磁気ビーズ上に固定されたストレプトアビジンまたはその変異体が、切断され、アフィニティーアダプター修飾dsDNA断片を濃縮するためのアフィニティーアダプター結合分子として使用される、前記請求項のいずれか1項に記載の方法。
前記切断及び増幅されたdsDNA断片のDNAライブラリーを得るためのステップb4)が、
1. 線形PCR増幅のために、鋳型としてのアダプター結合分子を介して固体支持体に結合した、濃縮されたアフィニティーアダプターに修飾されたdsDNA断片及びアフィニティーアダプターに特異的なプライマーを使用する、第1のPCR増幅ステップ；及び、
2. 該第1ステップの後、アダプター結合分子を介して固体支持体に結合した、濃縮されたアフィニティーアダプターに修飾されたdsDNA断片を反応混合物から除去した後、ブロッキングアダプターに特異的なプライマーを第2プライマーとして添加する、第2のPCR増幅ステップ
の2段階PCR増幅を含む、前記請求項のいずれか1項に記載の方法。
ステップ（d)において、まず、
d1)配列読み取りからブロッキングアダプター、アフィニティーアダプター、及び任意の配列決定アダプター配列を除去し、トリミングされた配列読み取りを得て；次に、
d2)前記トリミングされた配列読み取りを参照ゲノムに位置づけて、整列された配列読み取りを得ることにより、
前記配列読み取りを参照ゲノムに整列させ、整列された配列読み取りを得る、前記請求項のいずれか1項に記載の方法。
前記ゲノムDNAが、ヒトゲノムDNAであり、前記参照ゲノムが、ヒト参照ゲノム、好ましくはhg19またはhg38である、前記請求項のいずれか1項に記載の方法。
ステップ（e)において、推定開裂部位が、
- 整列された配列読み取りを含む参照ゲノムを、定義された長さ、好ましくは少なくとも約100 ntの配列群に分割し；そして
- 少なくとも1つの配列読み取り開始部分と少なくとも1つの配列読み取り終了部分を含む各配列群について、1つ以上の推定開裂部位を配列読み取り開始部分と配列読み取り終了部分の合計の局所的な最大値を有する部位として測定し、任意に、該配列群の中心までの距離を最小化すること
によって測定され、配列読み取り開始部分が、整列された配列読み取りの最初の1～5 nt、好ましくは最初の2～4 nt、より好ましくは最初の3 ntからなり、また、配列読み取り終了部分が、その最後の1～5 nt、好ましくは最後の2～4 nt、より好ましくは最後の3 ntからなる、前記請求項のいずれか1項に記載の方法。
ステップ（e)において、開裂部位が、
e1)整列された配列読み取りを含む参照ゲノムを、設定された配列長、好ましくは長さ約100 ntの配列群に分割し；
e2)好ましくは、各配列群について読み取りデータの被覆を測定し、読み取りデータの被覆が0の配列群を廃棄し、好ましくは、参照ゲノム中の配列順序に基づいて、読み取りデータの被覆が連続的に>0の配列群を配列群の連続的なセットに結合し；
e3) 各配列群を、ウィンドウ幅以下、好ましくはそれより小さい設定されたステップサイズ、好ましくは2 ntで、幅が設定されたウィンドウ、好ましくは4 ntに分割し;
e4)以下のように群分けすることにより、各ウィンドウの開始、末端、及び背景被覆を測定し、
- 前記ウィンドウ領域に入る配列読み取り開始部分を開始被覆群に群分け；
- 前記ウィンドウ領域に入る配列読み取り終了部分を末端被覆群に群分け；
- 前記ウィンドウ領域に入るが、前記開始被覆群及び前記末端被覆群に属さない配列読み取りを背景被覆群に群分け；
ウィンドウ毎について、開始被覆群、末端被覆群及び背景被覆群における読み取りデータの数をそれぞれ加算し；
e5)少なくとも1つの配列読み取り開始部分及び少なくとも1つの配列読み取り終了部分を含む各配列群について、開始被覆と末端被覆の合計を最大化し、該配列群の中心までの距離を最小化することにより、1つ以上の推定開裂部位を決定し、そして
e6)偽陽性開裂部位を除外し、配列読み取り開始部分が、整列された配列読み取りの最初の1～5 nt、好ましくは最初の2～4 nt、より好ましくは最初の3 ntからなり、また、配列読み取り終了部分が、その最後の1～5 nt、好ましくは最後の2～4 nt、より好ましくは最後の3 ntからなること
によって同定される、前記請求項のいずれか1項に記載の方法。
偽陽性開裂部位が、
1.信号被覆に対する背景被覆の比がある閾値、好ましくは約0.5を超えていなく；及び/または
2.前記推定開裂部位における末端被覆に対する開始被覆の比がある数値範囲内の、好ましくは約1/5～5/1内にあり；及び/または
3.部位被覆率が最小で、好ましくは6以上であり；及び/または
4.配列群被覆率が最小で、好ましくは10以上である、
推定開裂部位のみを選択することにより、除外される、前記請求項のいずれか1項に記載の方法。
以下のステップを含む、ゲノム中の非特異的部位をin vivoで検出する方法。
i)1種以上の標的特異的プログラム可能ヌクレアーゼで処理された細胞のゲノムDNAを含む第1試料、及び関連する遺伝的背景の細胞、好ましくは同一の遺伝的背景を有し、該1種以上の標的特異的プログラム可能ヌクレアーゼで処理されていない細胞のゲノムDNA含む第2試料を準備するステップ；
ii)該2つの試料について、請求項１～１３の方法で、ステップi)の1種以上の標的特異的プログラム可能ヌクレアーゼ標的特異的プログラム可能ヌクレアーゼを使用することにより、非特異的部位をin vitroでそれぞれ検出するステップ；及び
iii)該2つの試料の非特異的部位を比較して、該1種以上の標的特異的プログラム可能ヌクレアーゼで処理されていない細胞のゲノムDNAを含む試料のみに同定されるが、該1種以上の標的特異的プログラム可能ヌクレアーゼで処理された細胞のゲノムDNAを含む試料には同定されない非特異的部位を、該1種以上の標的特異的プログラム可能ヌクレアーゼのin vivo非特異的部位として同定するステップ。