JP2018529353A - 配列決定法による切断事象の包括的生体外報告(CIRCLE−seq) - Google Patents

配列決定法による切断事象の包括的生体外報告(CIRCLE−seq) Download PDF

Info

Publication number
JP2018529353A
JP2018529353A JP2018516489A JP2018516489A JP2018529353A JP 2018529353 A JP2018529353 A JP 2018529353A JP 2018516489 A JP2018516489 A JP 2018516489A JP 2018516489 A JP2018516489 A JP 2018516489A JP 2018529353 A JP2018529353 A JP 2018529353A
Authority
JP
Japan
Prior art keywords
seq
dna
nuclease
circle
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018516489A
Other languages
English (en)
Inventor
ジョン,ジェイ.キース
サイ,シェンダー
Original Assignee
ザ ジェネラル ホスピタル コーポレイション
ザ ジェネラル ホスピタル コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ ジェネラル ホスピタル コーポレイション, ザ ジェネラル ホスピタル コーポレイション filed Critical ザ ジェネラル ホスピタル コーポレイション
Publication of JP2018529353A publication Critical patent/JP2018529353A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1031Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

細胞型特異的ゲノムDNAサンプルからの潜在的なCRISPR−Cas9オフターゲット切断部位のゲノムワイド検出のための高感度で偏りのない方法。

Description

優先権の主張
本出願は、2015年9月30日に出願された米国特許出願第62/235,154号明細書の優先権を主張する。上記の全内容は、参照により本明細書に組み込まれる。
連邦支援の研究開発
本発明は、国立衛生研究所(National Institutes of Health)によって交付された助成金番号DP1 GM105378の下で、政府支援によってなされた。米国政府は、本発明に一定の権利を有する。
本明細書に記載されるのは、CRISPR−Cas9ヌクレアーゼなどの遺伝子操作されたヌクレアーゼのゲノムワイド切断特異性を定義するためのインビトロ法である。
ジンクフィンガー、TALEN、CRISPR−Cas9ヌクレアーゼをはじめとする遺伝子操作されたヌクレアーゼ技術は、生物医学研究に革新をもたらし、遺伝子ベースの疾患の治療に重要な新たな様式を提供する。これらの方法をヒトの治療学に翻訳するには、オフターゲット効果を高感度に検出することが重要である。オフターゲットを発見するための生体外生化学法は、生きている細胞の培養および操作を必要とするストラテジーに関連する制限を回避しながら、より大きな再現性および拡張性がある潜在的利点を提供する。
本発明は、細胞型特異的ゲノムDNAサンプルからの潜在的な遺伝子操作されたヌクレアーゼ(例えばCRISPR−Cas9)オフターゲット切断部位のゲノムワイド検出のための高感度で偏りのない方法の開発に、少なくとも部分的に基づいている。本発明の方法は、共有結合的に閉じたDNA分子のエキソヌクレアーゼ選択を用いて、切断特異的濃縮および配列決定のための出発集団として、非常に少ない遊離DNA末端を有するゲノムDNA分子の集団を生成する。ヒトゲノムDNAからのこれらの切断された断片の500,000倍を超えると推定される濃縮は、全ゲノム配列決定法に依存してはるかに高いバックグラウンドを有する、Digenome−Seq(Kim et al.,Nat Methods.2015 Mar;12(3):237−43)などの方法とは対照的に、生体外で切断されたDNA断片の非常に配列決定効率の高い発見を可能にする。最適化後に、本生体外アッセイは、ヒトU2OS細胞内で実施されて、Tsai et al.,Nat Biotechnol.2015 Feb;33(2):187−97に記載されている、VEGFA部位1およびEMX1標的部位における、細胞内GUIDE−seqアッセイによって検出されたオフターゲット切断部位の100%、ならびにGUIDE−seq実験では発見されなかった追加的な新規オフターゲット部位を検出した(換言すれば、本生体外アッセイは、GUIDE−seqで検出された切断部位の上位集合を検出する)。
本明細書に記載されるのは、ステムループまたはヘアピンアダプターのライゲーション、エキソヌクレアーゼ選択、ステムループの酵素的開口および末端修復、および分子内ライゲーションによって、最小数のDNA二本鎖切断(DSB)を有する、共有結合的に閉じた完全環状化DNA断片ライブラリーを酵素的に作成する方法である。これらの環は、次に配列決定法によって操作され、この酵素的に精製された共有結合的に閉じた完全環状化DNA断片のライブラリーのヌクレアーゼ誘導切断が検出され得る。総合して、これらの2つの方法は、DNAの複合混合物中のヌクレアーゼ誘導切断部位を効率的に採掘するためのストラテジーを構成する。したがって、この方法は、末端のないDNA分子の集団を作成するステップと、その集団をヌクレアーゼで処理するステップと、この集団において、ヌクレアーゼ誘導切断の結果として新たに生成された末端を有するDNA分子を発見するステップとを含み得る。
したがって、本明細書で提供されるのは、共有結合的に閉じた環状化二本鎖DNA断片のライブラリーを作成する方法である。方法は、例えば、目的の細胞型または生物に由来するゲノムDNA(gDNA)または合成DNAなどのdsDNAを提供するステップと;DNAを例えば約200〜500bp、例えば約300bpの平均長さなどの規定の平均長さに無作為に剪断して、DNA断片の集団を提供するステップと;任意選択的に、例えば剪断されたDNAの末端修復および/またはAテーリングによって、末端ライゲーションのために断片を調製するステップと;回文配列を含んでなるループ配列に隣接するまたはその中にある、少なくとも1つのデオキシウリジンを含んでなる、ステムループアダプターを断片の末端にライゲートして、ライゲートされた直鎖dsDNA断片の集団を作成するステップと;ライブラリーを(例えば、λエキソヌクレアーゼおよび/または大腸菌(E.coli)エキソヌクレアーゼIの混合物などの)エキソヌクレアーゼに接触させて、末端がライゲートされていないあらゆる残留直鎖断片を分解し、ライゲートされた直鎖dsDNA断片の精製集団を生成するステップと;ライブラリーを、例えば、デオキシウリジンにおいてDNAにニックを生じさせるウラシルDNAグリコシラーゼ(UDG)および/またはDNAグリコシラーゼ−リアーゼであるエンドヌクレアーゼVIIIや、3’末端リン酸を除去するT4ポリヌクレオチドキナーゼなどの、デオキシウリジンにおいてライゲートされたdsDNA断片にニックを生じて、3’末端リン酸を除去する酵素に接触させるステップと;分子内ライゲーションおよび環状DNA分子形成を促進するのに十分な条件下で、ニックの入った直鎖dsDNA断片をインキュベートするステップと;エキソヌクレアーゼを使用してライゲート断片を精製し、それによって共有結合的に閉じた完全環状化二本鎖DNA断片のライブラリーを作成するステップとを含み得る。
いくつかの実施形態では、方法は、共有結合的に閉じた完全環状化dsDNA断片のライブラリーをヌクレアーゼ(例えば、本明細書に記載されるような遺伝子操作されたヌクレアーゼ)に接触させて、部位特異的切断を誘導するステップと;任意選択的に、例えば、剪断されたDNAの末端修復および/またはAテーリングによって、末端ライゲーションのための切断断片を作成するステップと;切断部位において、少なくとも1つの(好ましくは唯一の)デオキシウリジンを含んでなる配列決定アダプターを、PCRプライミングおよび/または配列決定法における使用に適合するプライマー部位にライゲートするステップと;ライブラリーを例えば、デオキシウリジンにおいてニックを生じる、ウラシルDNAグリコシラーゼ(UDG)および/またはDNAグリコシラーゼ−リアーゼであるエンドヌクレアーゼVIIIなどの酵素に接触させるステップと;配列決定アダプターを使用して、これらの断片を配列決定するステップとを含む。
本明細書でまた提供されるのは、例えば、ゲノムDNA(gDNA)などのdsDNA中に、ヌクレアーゼ誘導二本鎖切断を含んでなる断片のライブラリーを作成する方法である。方法は、例えば、目的の細胞型または生物に由来するgDNAなどのdsDNAを提供するステップと;例えば約200〜500bp、例えば約300bpの平均長さの規定の平均長さに、dsDNAを無作為に剪断するステップと;任意選択的に、剪断されたDNAを末端修復および/またはAテーリングするステップと;好ましくは、例えば約10〜15、例えば約12ヌクレオチドなどの第1の領域と、1つまたは複数のループを形成して分子内ライゲーションのための回文配列に隣接する、1つのデオキシウリジンヌクレオチドを含んでなる、好ましくは約5ヌクレオチドの第2の領域と、1つの追加的なヌクレオチドがある第1の領域に相補的な例えば約13ヌクレオチドなどの第3の領域とを含んでなる、第1のステムループアダプターをライゲートするステップと;ライブラリーをウラシルDNAグリコシラーゼ(UDG)および/またはDNAグリコシラーゼ−リアーゼであるエンドヌクレアーゼVIIIに接触させ、デオキシウリジンおよびT4ポリヌクレオチドキナーゼにおいてdsDNAにニックを生じさせ、分子的にライゲーションと不適合である末端3’リン酸を除去するステップと;分子内ライゲーションおよび環状化dsDNA分子を含んでなるサンプル形成を促進するのに十分な条件下で、ニックの入ったdsDNAをインキュベートするステップと;サンプルを環状でないあらゆるdsDNA分子を分解するのに十分な、1つまたは複数のエキソヌクレアーゼ(例えば、バクテリオファージλエキソヌクレアーゼ、大腸菌(E.coli)ExoI、PlasmidSafe(商標)ATP依存性エキソヌクレアーゼ)に接触させるステップと;サンプルをヌクレアーゼで処理し、部位(例えば、オンおよび/またはオフターゲット部位)特異的切断を誘導し(例えば、平滑型またはねじれ型/オーバーハング末端を誘導し)、任意選択的に、得られた末端を末端修復し、次にAテーリングするステップと;約12ヌクレオチドの第1の領域と、例えば1つまたは複数のヘアピンループなどのループを形成してPCRプライミングおよび/または例えば次世代配列決定法(NGS)などの配列決定法における使用に適合する第2のプライマーを含んでなる、約40ヌクレオチドの第2の領域と、第1の領域に相補的な約13ヌクレオチドの第3の領域(例えば第1の領域より長いもの)と、第2および第3の領域の間の1つのデオキシウリジンヌクレオチドとを含んでなる配列決定アダプターをライゲートし、ヌクレアーゼによって切断されたDNA断片が、末端にライゲートされた配列決定アダプターを有する、集団を生成するステップと;それによって例えば、各末端がdsDNA中のヌクレアーゼ誘導二本鎖切断によって生じ、次にアダプターにライゲートされるなど、ヌクレアーゼ切断アダプターにライゲートされた断片が濃縮された、断片のライブラリーを作成するステップとを含み得る。
いくつかの実施形態では、方法は、ライブラリーをウラシルDNAグリコシラーゼ(UDG)および/またはDNAグリコシラーゼ−リアーゼであるエンドヌクレアーゼVIIIに接触させ、デオキシウリジンにおいてDNAにニックを生じさせるステップと;配列決定アダプターを保有する断片を配列決定するステップとを含む。
いくつかの実施形態では、末端がライゲートされていないあらゆる残留直鎖断片を分解するのに使用されるエキソヌクレアーゼは、バクテリオファージλエキソヌクレアーゼ、大腸菌(E.coli)エキソヌクレアーゼI、およびATP依存性エキソヌクレアーゼの1つまたは複数を含んでなるヌクレアーゼの混合物である。
いくつかの実施形態では、遺伝子操作されたヌクレアーゼは、メガヌクレアーゼ、MegaTAL、ジンクフィンガーヌクレアーゼ、転写アクチベーターエフェクター様ヌクレアーゼ(TALEN)、規則的な間隔をもってクラスター化された短鎖反復回文配列(CRISPR)/Cas RNA誘導ヌクレアーゼ(CRISPR/Cas RGN)、およびFokI−dCas9融合タンパク質からなる群から選択される。
本明細書に記載の方法のいくつかの実施形態では、例えば、オンおよびオフターゲット部位などの部位特異的切断を誘導する、ヌクレアーゼによるサンプルの処理は、サンプルを特異的ガイドRNA(gRNA)と複合体形成するCas9ヌクレアーゼに接触させるステップを含んでなる。
いくつかの実施形態では、ヘアピン中のプライマー部位は、次世代配列決定プライマー部位、無作為化DNAバーコードまたは固有の分子識別子(UMI)を含んでなる。
いくつかの実施形態では、方法は、ライブラリーをウラシルDNAグリコシラーゼ(UDG)および/またはDNAグリコシラーゼ−リアーゼであるエンドヌクレアーゼVIIIに接触させ、デオキシウリジンにおいてDNAにニックを生じさせるステップと;第1のおよび第2のヘアピンアダプターを保有する断片を配列決定するステップとを含む。
いくつかの実施形態では、遺伝子操作されたヌクレアーゼは、メガヌクレアーゼ、MegaTAL、ジンクフィンガーヌクレアーゼ、転写アクチベーターエフェクター様ヌクレアーゼ(TALEN)、規則的な間隔をもってクラスター化された短鎖反復回文配列(CRISPR)/Cas RNA誘導ヌクレアーゼ(CRISPR/Cas RGN)、およびFokI−dCas9融合物(RNA誘導性FokIヌクレアーゼ)からなる群から選択される。
いくつかの実施形態では、例えば、オンおよびオフターゲット部位などの部位特異的切断を誘導する、ヌクレアーゼによるサンプルの処理は、サンプルを特異的ガイドRNA(gRNA)と複合体形成するCas9ヌクレアーゼに接触させるステップを含んでなる。
いくつかの実施形態では、DNAは、哺乳類、植物、細菌、または真菌細胞(例えばgDNA)から単離される。
いくつかの実施形態では、DNAは合成される。
いくつかの実施形態では、遺伝子操作されたヌクレアーゼは、TALEN、ジンクフィンガー、メガヌクレアーゼ、megaTAL、FokI−dCas9融合体またはCas9ヌクレアーゼまたはCpf1ヌクレアーゼ、例えば、その野生型または変異体である。
遺伝子操作されたヌクレアーゼがCas9ヌクレアーゼであるいくつかの実施形態では、方法は、Cas9ヌクレアーゼをゲノム中の標的配列に誘導するガイドRNAを使用するステップもまた含む。いくつかの実施形態では、遺伝子操作されたヌクレアーゼはCas9ヌクレアーゼであり、方法は、細胞内で、Cas9ヌクレアーゼをゲノム中の標的配列に誘導するガイドRNAを発現させるステップもまた含む。
いくつかの実施形態では、ヘアピン中のプライマー部位は、次世代配列決定プライマー部位、無作為化DNAバーコードまたは固有の分子識別子(UMI)を含んでなる。
本方法は、遺伝子操作されたヌクレアーゼのオフターゲット部位を発見するための以前記載したアプローチに優る、いくつかの利点を有する。例えば、本方法は、二本鎖オリゴデオキシヌクレオチド(dsODN)の導入、ならびにヌクレアーゼまたはヌクレアーゼをコードする成分の発現または細胞への導入が必要である、細胞ベースの方法(GUIDE−seq(国際公開第2015/200378号パンフレットおよびTsai et al.,Nature Biotechnology 33:187−197(2015)などを参照されたい)とは対照的に、インビトロ法である。全ての細胞がdsODNおよび/またはヌクレアーゼまたはヌクレアーゼをコードする成分を導入させるとは限らず、場合によってはこれらの試薬は有毒であり得る。特に興味のある細胞型が、dsODN、ヌクレアーゼ、またはヌクレアーゼをコードする構成要素の導入を受け入れにくい場合、代理細胞型が使用され得るが、細胞特異的効果は検出されないことがある。本方法は、細胞内へのdsODN、ヌクレアーゼ、またはヌクレアーゼをコードする成分の送達を必要とせず、クロマチン状態の影響を受けず、毒性の問題を引き起こさず、細胞株の成長および増殖を必要とせず、目的の細胞型から得られたゲノムDNAを切断することによって、特定の細胞ゲノムの調査ができるようにする。さらに、エキソヌクレアーゼは二本鎖直鎖DNAに対して活性を有するが、環状DNAに対しては本質的に活性を有しないので、バックグラウンドは非常に低く、非常に高い信号対雑音比が提供される。
特に断りのない限り、本明細書で用いられる全ての技術的および科学的用語は、本発明が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。本発明における使用のために、方法および材料が本明細書に記載され;当該技術分野で公知のその他の適切な方法および材料もまた使用され得る。材料、方法、および実施例は例証のみを意図し、限定的であることは意図されない。本明細書で言及される、全ての刊行物、特許出願、特許、配列、データベース項目、およびその他の参考文献は、その内容全体を参照により援用する。矛盾する場合は、定義を含めて本明細書が優先される。
本発明の他の特徴および利点は、以下の詳細な説明および図面、そして特許請求の範囲から明らかになるであろう。
図1A−D オフターゲット切断のゲノムワイド検出のためのCRISPR−Cas9ヌクレアーゼ生体外Digenome−seqおよびCIRCLE−seq法の概要である。(A)消化ゲノム配列決定(Digenome−seq)法の図式的概観である。ゲノムDNAは、生体外でCas9ヌクレアーゼを用いて切断され、精製されて剪断され、次に全ゲノム配列決定のためにアダプターにライゲートされる。均一な開始マッピング位置が濃縮されている候補オフターゲット部位は、格付けアルゴリズムによって同定される。(B)配列決定法による切断効果の生体外報告(circularization for in vitro reporting of cleavage effects by sequencing)(CIRCLE−seq)のための環状化の図式的概観である。ゲノムDNAは剪断されて環状化され、望まれない直鎖DNA分子は、エキソヌクレアーゼ処理によって分解される。Cas9切断部位(網掛け)を含有する環状DNA分子は、Cas9によって直線化され、アダプターライゲーション、PCR増幅、および対末端ハイスループット配列決定のために、それらのDNA末端が遊離され得る。Cas9切断によって生成される各読み取り対が、単一のオフターゲット部位に関する完全な配列情報をどのように含むかに留意されたい。(C)例示的なCIRCLE−seq法の図式的概観である。ゲノムDNAは、平均で約300bpに無作為に剪断され、末端修復され、Aテール付加され、ウラシル含有ステムループアダプターにライゲートされる。λエキソヌクレアーゼと大腸菌(E.coli)エキソヌクレアーゼとの混合物による処理のために、ステムループアダプターが両端にライゲートされた、共有結合的に閉じたDNA分子が選択される。4bpオーバーハングは、USER酵素とT4PNKとの混合物によって遊離され、DNA分子は、分子内ライゲーションに有利な低濃度で環状化される。望まれない直鎖DNAは、Plasmid−SafeATP依存性DNaseによって分解される。環状DNAはCas9−gRNA複合体で処理されて切断され、直線化DNAは配列決定アダプターにライゲートされ、ハイスループット配列決定法のために増幅される。(D)CIRCLE−seq読み取り数は、独立したCIRCLE−seq実験間で非常に高い再現性があった。同一起源のゲノムDNA(ヒトU2OS細胞)から作成された、2つの独立したCIRCLE−seqライブラリー間のCIRCLE−seq読み取り数の散布図である。CIRCLE−seq読み取り数は、強く相関した。 図1A−D オフターゲット切断のゲノムワイド検出のためのCRISPR−Cas9ヌクレアーゼ生体外Digenome−seqおよびCIRCLE−seq法の概要である。(B)配列決定法による切断効果の生体外報告(circularization for in vitro reporting of cleavage effects by sequencing)(CIRCLE−seq)のための環状化の図式的概観である。ゲノムDNAは剪断されて環状化され、望まれない直鎖DNA分子は、エキソヌクレアーゼ処理によって分解される。Cas9切断部位(網掛け)を含有する環状DNA分子は、Cas9によって直線化され、アダプターライゲーション、PCR増幅、および対末端ハイスループット配列決定のために、それらのDNA末端が遊離され得る。Cas9切断によって生成される各読み取り対が、単一のオフターゲット部位に関する完全な配列情報をどのように含むかに留意されたい。 図1A−D オフターゲット切断のゲノムワイド検出のためのCRISPR−Cas9ヌクレアーゼ生体外Digenome−seqおよびCIRCLE−seq法の概要である。(C)例示的なCIRCLE−seq法の図式的概観である。ゲノムDNAは、平均で約300bpに無作為に剪断され、末端修復され、Aテール付加され、ウラシル含有ステムループアダプターにライゲートされる。λエキソヌクレアーゼと大腸菌(E.coli)エキソヌクレアーゼとの混合物による処理のために、ステムループアダプターが両端にライゲートされた、共有結合的に閉じたDNA分子が選択される。4bpオーバーハングは、USER酵素とT4PNKとの混合物によって遊離され、DNA分子は、分子内ライゲーションに有利な低濃度で環状化される。望まれない直鎖DNAは、Plasmid−SafeATP依存性DNaseによって分解される。環状DNAはCas9−gRNA複合体で処理されて切断され、直線化DNAは配列決定アダプターにライゲートされ、ハイスループット配列決定法のために増幅される。 図1A−D オフターゲット切断のゲノムワイド検出のためのCRISPR−Cas9ヌクレアーゼ生体外Digenome−seqおよびCIRCLE−seq法の概要である。(D)CIRCLE−seq読み取り数は、独立したCIRCLE−seq実験間で非常に高い再現性があった。同一起源のゲノムDNA(ヒトU2OS細胞)から作成された、2つの独立したCIRCLE−seqライブラリー間のCIRCLE−seq読み取り数の散布図である。CIRCLE−seq読み取り数は、強く相関した。 図2A−D CIRCLE−seqとDigenome−seqの比較。(A)CIRCLE−seqおよびDigenome−seqによって検出された、HBB遺伝子を標的とするCas9のオフターゲット部位およびgRNAの交差を示すベン図である。(B)CIRCLE−seqによって見いだされたが、Digenome−seqによって見いだされなかった、オフターゲット切断位置における、ヌクレアーゼ処理(網掛けバー)および対照(白抜きバー)HAP1ゲノムDNAのDigenome−seq読み取り数の棒グラフである。(C)HBB遺伝子座を標的化するgRNAのオンターゲット部位における、CIRCLE−seqおよびDigenome−seqの配列決定読み取りのマッピングを比較するプロットである。ヌクレアーゼ処理サンプルおよび対照サンプルの双方が示される。薄い灰色の線は、予測切断部位の位置を示し;前方読取りの読取りカバー範囲は黒色、逆読込みは白色に着色される。(D)(C)で使用されたHBB gRNAのオンターゲット部位における、CIRCLE−seq開始マッピング位置プロットである。(+)鎖マッピング読み取りは白色バーで示され、(−)鎖マッピング読み取りは網掛けバーで着色される。 図2A−D CIRCLE−seqとDigenome−seqの比較。(B)CIRCLE−seqによって見いだされたが、Digenome−seqによって見いだされなかった、オフターゲット切断位置における、ヌクレアーゼ処理(網掛けバー)および対照(白抜きバー)HAP1ゲノムDNAのDigenome−seq読み取り数の棒グラフである。 図2A−D CIRCLE−seqとDigenome−seqの比較。(C)HBB遺伝子座を標的化するgRNAのオンターゲット部位における、CIRCLE−seqおよびDigenome−seqの配列決定読み取りのマッピングを比較するプロットである。ヌクレアーゼ処理サンプルおよび対照サンプルの双方が示される。薄い灰色の線は、予測切断部位の位置を示し;前方読取りの読取りカバー範囲は黒色、逆読込みは白色に着色される。 図2A−D CIRCLE−seqとDigenome−seqの比較。(D)(C)で使用されたHBB gRNAのオンターゲット部位における、CIRCLE−seq開始マッピング位置プロットである。(+)鎖マッピング読み取りは白色バーで示され、(−)鎖マッピング読み取りは網掛けバーで着色される。 図3A−E CIRCLE−seqと細胞ベースGUIDE−seqおよびHTGTS法との比較である。(A)CIRCLE−seq(白色バー)によって排他的に同定された、およびCIRCLE−seqおよびGUIDE−seq(網掛けバー)の双方によって同定された、部位の数を示すヒストグラムである。(B)CIRCLE−seqで検出されたオフターゲット部位のマンハッタンプロットであり、バーの高さはCIRCLE−seq読み取り数(読み取り数が最も多い部位に対して正規化された)に相当し、染色体の位置によってまとめられる。(C)CIRCLE−seqおよびGUIDE−seqで検出されたゲノムのオフターゲット切断部位の交差を示す、ベン図である。(D)CIRCLE−seqによって排他的に検出された、またはCIRCLE−seqおよびHTGTSの双方によって検出された、部位の数を示すヒストグラムである。(E)CIRCLE−seq、GUIDE−seq、およびHTGTSの間で検出された、オフターゲット切断部位の組の重なりを示すベン図である。CIRCLE−seqは、GUIDE−seqおよびHTGT)の双方によって検出された、実質的に全てのオフターゲット切断部位を検出する。 図3A−E CIRCLE−seqと細胞ベースGUIDE−seqおよびHTGTS法との比較である。(B)CIRCLE−seqで検出されたオフターゲット部位のマンハッタンプロットであり、バーの高さはCIRCLE−seq読み取り数(読み取り数が最も多い部位に対して正規化された)に相当し、染色体の位置によってまとめられる。 図3A−E CIRCLE−seqと細胞ベースGUIDE−seqおよびHTGTS法との比較である。(B)CIRCLE−seqで検出されたオフターゲット部位のマンハッタンプロットであり、バーの高さはCIRCLE−seq読み取り数(読み取り数が最も多い部位に対して正規化された)に相当し、染色体の位置によってまとめられる。 図3A−E CIRCLE−seqと細胞ベースGUIDE−seqおよびHTGTS法との比較である。(B)CIRCLE−seqで検出されたオフターゲット部位のマンハッタンプロットであり、バーの高さはCIRCLE−seq読み取り数(読み取り数が最も多い部位に対して正規化された)に相当し、染色体の位置によってまとめられる。 図3A−E CIRCLE−seqと細胞ベースGUIDE−seqおよびHTGTS法との比較である。(B)CIRCLE−seqで検出されたオフターゲット部位のマンハッタンプロットであり、バーの高さはCIRCLE−seq読み取り数(読み取り数が最も多い部位に対して正規化された)に相当し、染色体の位置によってまとめられる。 図3A−E CIRCLE−seqと細胞ベースGUIDE−seqおよびHTGTS法との比較である。(B)CIRCLE−seqで検出されたオフターゲット部位のマンハッタンプロットであり、バーの高さはCIRCLE−seq読み取り数(読み取り数が最も多い部位に対して正規化された)に相当し、染色体の位置によってまとめられる。 図3A−E CIRCLE−seqと細胞ベースGUIDE−seqおよびHTGTS法との比較である。(C)CIRCLE−seqおよびGUIDE−seqで検出されたゲノムのオフターゲット切断部位の交差を示す、ベン図である。 図3A−E CIRCLE−seqと細胞ベースGUIDE−seqおよびHTGTS法との比較である。(D)CIRCLE−seqによって排他的に検出された、またはCIRCLE−seqおよびHTGTSの双方によって検出された、部位の数を示すヒストグラムである。 図3A−E CIRCLE−seqと細胞ベースGUIDE−seqおよびHTGTS法との比較である。(E)CIRCLE−seq、GUIDE−seq、およびHTGTSの間で検出された、オフターゲット切断部位の組の重なりを示すベン図である。CIRCLE−seqは、GUIDE−seqおよびHTGT)の双方によって検出された、実質的に全てのオフターゲット切断部位を検出する。 図4A−G CIRCLE−seqで検出されたオフターゲット切断部位は、ヒト細胞内部でもまた切断され得る。(A)以前にGUIDE−seqによって分析された10個のgRNAについての、CIRCLE−seq読み取り数の幹葉プロットである。オンターゲットおよびオフターゲット部位が示される。(B)標的化標識配列決定アプローチの図式的概観である。プライマーは、ヌクレアーゼおよび二本鎖オリゴデオキシヌクレオチド(dsODN)標識で処理された細胞のゲノムDNAから、ヌクレアーゼ誘導DSBの側方のゲノム領域を増幅するように設計される。(c−d)EMX1およびVEGFA部位1を標的化するgRNAの、CIRCLE−seqおよびGUIDE−seq(パネル上部)の双方によって検出された対照オフターゲット部位、およびCIRCLE−seqによって検出されたがGUIDE−seq)によって検出されなかったオフターゲット部位における、標的化標識組み込み頻度。オフターゲット部位は、示される意図された標的配列とのミスマッチを伴うCIRCLE−seq読み取り数によって、上から下に順序付けられる。対照およびヌクレアーゼ処理細胞について観察された標識組み込み頻度が、対数目盛りでプロットされる。(E)分析され、標的化標識配列決定法によっても検出された、CIRCLE−seq部位の画分を示す円グラフである。(F)標的化標識配列決定法によって観察された、組込み位置のプロットである。PAM塩基は、右から3つ目までのヌクレオチドである。組み込みは、予測されたDSBの位置に近接した位置で起こる(PAMから3塩基対離れている)。(G)HEK293、K562、およびU2OSゲノムDNA中の非反復部位を標的化するgRNAを用いて実施されたCIRCLE−seq実験で、参照非依存性部位発見アルゴリズムを用いて見いだされ得る、固有の切断部位の百分率である。 図4A−G CIRCLE−seqで検出されたオフターゲット切断部位は、ヒト細胞内部でもまた切断され得る。(B)標的化標識配列決定アプローチの図式的概観である。プライマーは、ヌクレアーゼおよび二本鎖オリゴデオキシヌクレオチド(dsODN)標識で処理された細胞のゲノムDNAから、ヌクレアーゼ誘導DSBの側方のゲノム領域を増幅するように設計される。 図4A−G CIRCLE−seqで検出されたオフターゲット切断部位は、ヒト細胞内部でもまた切断され得る。(c−d)EMX1およびVEGFA部位1を標的化するgRNAの、CIRCLE−seqおよびGUIDE−seq(パネル上部)の双方によって検出された対照オフターゲット部位、およびCIRCLE−seqによって検出されたがGUIDE−seq)によって検出されなかったオフターゲット部位における、標的化標識組み込み頻度。オフターゲット部位は、示される意図された標的配列とのミスマッチを伴うCIRCLE−seq読み取り数によって、上から下に順序付けられる。対照およびヌクレアーゼ処理細胞について観察された標識組み込み頻度が、対数目盛りでプロットされる。 図4A−G CIRCLE−seqで検出されたオフターゲット切断部位は、ヒト細胞内部でもまた切断され得る。(c−d)EMX1およびVEGFA部位1を標的化するgRNAの、CIRCLE−seqおよびGUIDE−seq(パネル上部)の双方によって検出された対照オフターゲット部位、およびCIRCLE−seqによって検出されたがGUIDE−seq)によって検出されなかったオフターゲット部位における、標的化標識組み込み頻度。オフターゲット部位は、示される意図された標的配列とのミスマッチを伴うCIRCLE−seq読み取り数によって、上から下に順序付けられる。対照およびヌクレアーゼ処理細胞について観察された標識組み込み頻度が、対数目盛りでプロットされる。 図4A−G CIRCLE−seqで検出されたオフターゲット切断部位は、ヒト細胞内部でもまた切断され得る。(E)分析され、標的化標識配列決定法によっても検出された、CIRCLE−seq部位の画分を示す円グラフである。 図4A−G CIRCLE−seqで検出されたオフターゲット切断部位は、ヒト細胞内部でもまた切断され得る。(F)標的化標識配列決定法によって観察された、組込み位置のプロットである。PAM塩基は、右から3つ目までのヌクレオチドである。組み込みは、予測されたDSBの位置に近接した位置で起こる(PAMから3塩基対離れている)。 図4A−G CIRCLE−seqで検出されたオフターゲット切断部位は、ヒト細胞内部でもまた切断され得る。(G)HEK293、K562、およびU2OSゲノムDNA中の非反復部位を標的化するgRNAを用いて実施されたCIRCLE−seq実験で、参照非依存性部位発見アルゴリズムを用いて見いだされ得る、固有の切断部位の百分率である。 図5A−E CIRCLE−seqを用いて、オフターゲット部位分析に対する個別化SNPの影響が評価される。(A)2つの異なる細胞型由来のゲノムDNAに対して実施された実験からの、CIRCLE−seq読み取り数の散布図である。1つの細胞型のみに非参照遺伝的変異を有する部位は黒色であり、双方の細胞型において非参照変異を有する部位は網掛けされる。(B)非参照遺伝的変異を有するオフターゲット部位における、対立遺伝子特異的CIRCLE−seq読み取り数の例である。意図された標的配列に対するミスマッチが色付きヌクレオチドで示される一方、マッチする塩基はドットで示される。細胞型間の示差的遺伝的変化を保有する塩基の位置は、小さな矢印で示される。(C)その中で、アフリカ人(AFR)、米国人混合集団(AMR)、東アジア人(EAS)、欧州人(EUR)、東南アジア人(SAS)超母集団、および合わせた集団平均の1000人ゲノムプロジェクトからの遺伝子型が同定された個人において、非参照遺伝的変異が同定された、CIRCLE−seqオフターゲット部位の比率である。(D)参照ヒトゲノム配列(縞模様バー)中の、および1000人ゲノムプロジェクトデータからのオフターゲット部位ハプロタイプ(白色バー)中のミスマッチ数によって、CIRCLE−seqオフターゲット部位の分布を示すヒストグラムである。(E)CIRCLE−seqによって同定されたオフターゲット部位におけるミスマッチの数が増加している、減少している、または同数である、1000人ゲノムプロジェクトからのハプロタイプの比率である。 図5A−E CIRCLE−seqを用いて、オフターゲット部位分析に対する個別化SNPの影響が評価される。(B)非参照遺伝的変異を有するオフターゲット部位における、対立遺伝子特異的CIRCLE−seq読み取り数の例である。意図された標的配列に対するミスマッチが色付きヌクレオチドで示される一方、マッチする塩基はドットで示される。細胞型間の示差的遺伝的変化を保有する塩基の位置は、小さな矢印で示される。 図5A−E CIRCLE−seqを用いて、オフターゲット部位分析に対する個別化SNPの影響が評価される。(C)その中で、アフリカ人(AFR)、米国人混合集団(AMR)、東アジア人(EAS)、欧州人(EUR)、東南アジア人(SAS)超母集団、および合わせた集団平均の1000人ゲノムプロジェクトからの遺伝子型が同定された個人において、非参照遺伝的変異が同定された、CIRCLE−seqオフターゲット部位の比率である。 図5A−E CIRCLE−seqを用いて、オフターゲット部位分析に対する個別化SNPの影響が評価される。(D)参照ヒトゲノム配列(縞模様バー)中の、および1000人ゲノムプロジェクトデータからのオフターゲット部位ハプロタイプ(白色バー)中のミスマッチ数によって、CIRCLE−seqオフターゲット部位の分布を示すヒストグラムである。 図5A−E CIRCLE−seqを用いて、オフターゲット部位分析に対する個別化SNPの影響が評価される。(E)CIRCLE−seqによって同定されたオフターゲット部位におけるミスマッチの数が増加している、減少している、または同数である、1000人ゲノムプロジェクトからのハプロタイプの比率である。
遺伝子操作ゲノム編集ヌクレアーゼは、科学研究および人間医学の双方にとって変革技術である。この技術の使用に関わる重要な問題は、オフターゲット切断事象が、生きている細胞のゲノム中の意図されない標的部位で起こる度合いである。10,24-27これは、特に、ほぼ全ての細胞型において、非相同末端結合によるヌクレアーゼ誘導切断の修復が、挿入または欠失突然変異(インデル)の効率的な導入をもたらし得ることから、重大である。その中で数百万〜数十億の細胞がこれらのヌクレアーゼで治療されてもよい研究および治療用途のどちらにとっても、低頻度の変異でさえ、望ましくない細胞表現型または望ましくない臨床結果をもたらす可能性がある。
最近、多数のゲノムワイドアプローチが開発されており、ゲノム編集ヌクレアーゼによって誘導されるオフターゲット切断事象の状況が定義されている。例えば、このような変異体のゲノムワイド検出のための様々な細胞ベースの方法が記載されている。28-32これらとしては、配列決定法によって可能になるDSBのゲノムワイド不偏性同定(GUIDE−seq)と、ハイスループットのゲノムワイド移行配列決定法(HTGTS)とが挙げられる。例えば、生きている細胞におけるヌクレアーゼ誘導DSB中への短い二本鎖オリゴヌクレオチド「標識」の取り込みに依存するGUIDE−seq法は、ゲノム全域の規模で、オフターゲット部位を画定することが示されており、細胞集団において0.1%程度に低い頻度で変異誘発される部位が同定される(Tsai et al.,Nat Biotechnol.2015)。ヌクレアーゼ誘導オフターゲット切断を画定するためのその他の細胞ベースの方法としては、オンターゲット部位への移行融合をマッピングする方法、および組み込み欠損レンチウイルス(IDLV)ゲノムのDSB部位への取り込みに依存する別の方法が挙げられる。しかし、細胞の効率的な操作のためのこれらの方法の要件は、特に治療に最も妥当かつ有用であるが難しい非形質転換細胞型を取り扱う場合、それらの実現可能性、拡張性、および再現性を制限し得る。
この最近の進歩にもかかわらず、オフターゲット決定のための細胞ベースの方法には、(1)ヌクレアーゼ成分とdsODNまたはIDLVゲノムなどの標識との双方が細胞に導入できるという必要条件;(2)特定タイプのオフターゲット変異を保有する細胞の増殖を支援するまたは支援しないことがある、生物学的選択圧;(3)ヌクレアーゼオフターゲット活性/効果に対する、クロマチン、DNAメチル化、遺伝子発現、および核構造などの細胞型特異的パラメータの潜在的交絡効果;および/または(4)目的の細胞を培養中で増殖させることができるという必要条件をはじめとする、いくつかの制限がある。
精製されたゲノムDNAを使用するインビトロ法は、細胞ベースのアプローチのこれらの様々な制限を回避することから、魅力的な代案を提供する。(この説明において、インビトロは、無細胞反応において精製された成分を用いて実施される実験を指すことに留意されたい)。オフターゲット切断部位を検出するためのインビトロ法は、以下をはじめとする、細胞ベースの方法に優る利点を有する。a)それらは精製されたタンパク質非含有DNA上で実施されることから、クロマチン状況、遺伝子発現レベル、または核内局在による影響を受けない、b)それらは、部位を検出するために、a)に列挙した要素ならびに配列依存性効果によって影響され得る、誤りがちな細胞DNA修復に依存しない、c)ヌクレアーゼ濃度、ゲノムDNA濃度、および切断時間の長さは全て変更させ得ることから、それらは、低頻度の切断事象の検出のために非常に高感度である可能性を提供する。定義され精製された成分を使用する生化学的アッセイは、再現性を改善して、効率的な細胞形質導入または形質移入に対する必要性を回避し、細胞適合性に対する陽性または陰性の影響によって引き起こされる潜在的なバイアスを回避する。重要なことには、活性ヌクレアーゼ濃度およびゲノムDNA濃度は、生体外で非常に高レベルに上昇させ得て、細胞において非常に稀な頻度で、および/または細胞において発現され得るヌクレアーゼの最大濃度で、切断されてもよい配列の同定を潜在的に可能にする。特定の標的DNA部位に偏った、部分的縮重DNAライブラリーのCas9切断特異性を特性解析するインビトロ法は、以前記載されているが、Cas9ヌクレアーゼおよび様々なgRNAと共に用いた場合、同定された部位の大部分は実際にヒトゲノムには存在しなかった33
しかし、インビトロ法は、単離されたゲノムDNAが、実験上の必要性により無作為に剪断され(または壊れて)、より小さな断片になるという課題に直面する。ヌクレアーゼによるDNAの生体外処理によって誘導される、DSBからの剪断によって誘導されるDSBを示差的に同定することは容易でないため、これは課題を提起する。今日までに、ヒトゲノムDNAでの使用については、Digenome−seq34として知られている、生体外ゲノムワイドオフターゲット同定法が、唯一記載されている。このアプローチは、バルクゲノムDNAのヌクレアーゼ切断、全ての自由端への配列決定アダプターのライゲーション(ヌクレアーゼ誘導性および非ヌクレアーゼ誘導性)、ハイスループット配列決定法、およびシグネチャの均一なマッピング端を有するヌクレアーゼ切断部位の生物情報学的同定に依存する。しかし、Digenome−seqによって配列決定された無作為に剪断されたゲノムDNA断片の極めて高いバックグラウンドは、より頻度の低いヌクレアーゼ誘導切断事象の同定を極めて困難にし、必要な読み取り数(>4億)を生成し得る、生産規模のヒトゲノム再配列決定に用いられる、HiSeqまたはHiSeq X10装置へのアクセスが必要になる。
Digenome−seq法は、ヌクレアーゼオフターゲット活性に関する情報価値がない、配列決定読み取りの高いバックグラウンドに悩まされ、それは配列決定資源に関して非効率的であり、したがってオフターゲット部位を検出する能力の感度が低い。無作為に剪断された遺伝子操作されたゲノムDNAは、Digenome−seqによってヌクレアーゼ消化され、次にこれらの断片は全ゲノム再配列決定法に供される。無作為に切断された断片が、ゲノムに無作為に整列するのに対し、ヌクレアーゼによって消化された断片は、ゲノムにマッピングされると、同一ゲノム塩基位置に整列する均一な末端を有する。この方法の最初の検証は、それがCRISPR−Cas9ヌクレアーゼのオフターゲット切断部位を検出する、いくらかの能力を有することを示した。しかし、Digenome−seqでは、100万個の配列決定読み取り当たり1個未満が、ヌクレアーゼオフターゲット部位にマッピングされる。この高いバックグラウンドは、この方法に、いくつかの不都合を引き起こす。(A)これは、配列決定法に関して方法の費用対効果を極めて低くし、HiSeqやHiSeqx10プラットフォームなどの方法の使用が必要となる;(B)ゲノムにマッピングされる無作為に切断されたDNA断片の高いバックグラウンドは、信号対雑音比問題から、低頻度のヌクレアーゼ誘導切断の同定を困難にする;(C)情報の低い収率は、HiSeqx10プラットフォームのような最先端技術法によって得られ得る、多数の配列決定読み取りによってさえも、低頻度のヌクレアーゼオフターゲット部位を見いだすことを困難にする。実際に、Digenomeは、特定のgRNAについてGUIDE−seqによって見いだされたいくつかのオフターゲット部位を同定できなかった(しかし、2つの実験は異なる細胞株由来のゲノムDNAを用いて実施されたという、但し書きを付け加えなくてはならない)。
本明細書に記載されるのは、任意の対象ゲノムDNA上で、ヌクレアーゼによって誘導されたDSBの包括的判定を可能にする、インビトロ法である。この方法は、ゲノムDNAの剪断によって誘導されるランダムDSBに対する、ヌクレアーゼ誘導DSBの濃縮を可能にする。
配列決定法による切断効果の生体外報告の環状化(CIRCLE−seq)として本明細書に記載される例示的方法は、新しい無細胞ストラテジーであり、それはヌクレアーゼ切断されたゲノムDNAの高効率選択濃縮を可能にし、ハイスループット配列決定法およびゲノムオフターゲット切断部位の発見に用いられ得る。配列決定法によるヌクレアーゼDSBの完全な照会(FIND−seq)法(米国特許出願第62/217,690号明細書に記載される)と同様に、CIRCLE−seqは、そのDNA末端が、配列決定アダプターの引き続くライゲーションを防ぐような様式で保護される、無作為に剪断されたゲノムDNA断片の出発ライブラリーを作成する原理に基づく。しかし、CIRCLE−seqでは、この分子集団は新規の不偏性分子内環状化法によって生じ、エキソヌクレアーゼ処理がそれに続いて、あらゆる残りの残留直鎖断片を分解する(図2)。この共有結合的に閉じた環状化ゲノムDNA分子の酵素的に精製された集団は、次に、選択された遺伝子操作されたヌクレアーゼによって処理される。このヌクレアーゼによって切断された部位を保有するあらゆるDNAフラグメントは直線化され、それによって2つの利用可能なDNA末端が解放され、配列決定アダプターがそれにライゲートされ得る。直線化され、アダプターにライゲートされた断片は、引き続いて、ハイスループット配列決定法のためにPCRによって増幅された(図2を参照されたい)。したがって、CIRCLE−Seqは、Digenome−seqによって観察されるランダムゲノム読み取りの非常に高いバックグラウンドを実質的に排除する。
低濃度のDNAにおけるgDNA分子の効率的な分子内環状化のための生体外条件が最適化されたが、それはこのプロセスが、この方法の成功と低いバックグラウンドにとって重要なためである。ヌクレアーゼ切断断片のCIRCLE−seq濃縮(CRISPR−Cas9ヌクレアーゼによる実験に基づく)は、バックグラウンドをほぼ6倍超えると推定され、その結果、Digenome−seqのような総当たり生体外オフターゲット切断部位発見方法によって配列決定される、無作為に剪断されたDNA断片の高いバックグラウンドを相当に減少させる(図1A)。濃縮係数は、予測された切断点から得られた読み取り数を、実験の配列決定深度で偶発的に期待される、それらの位置における読み取り数で除算することによって、(そこでほぼ100%の断片が生体外で切断されると予測される)オンターゲット部位で計算された。
重要なことには、バックグラウンドを減少させると、CIRCLE−seq法の結果として得られる信号対雑音比が劇的に増加し、Digenome−seqで偶発的に存在し得る均一な末端の読み取りに起因する誤検出の確率が減少した。ゲノムDNA断片の初期環状化はまた、単一のDNA分子中のDSBの両端の同時回収(したがって、単一のDNA配列決定読み取り)を可能にし、それは次に、オフターゲット切断部位の参照非依存性発見を可能にし、これはヌクレアーゼ誘導性オフターゲット効果の同定について前述の全ての方法よりも改善されており、ゲノム配列が事前に分かっているかどうかにかかわらず、このアプローチを任意の生物由来のゲノムDNAと共に使用することが可能になる。さらに、(DNA修復経路が末端を切除または分解し得る、細胞内とは対照的に)生体外では、末端のプロセシングが最小限であるため、この方法はまた、ヌクレアーゼ誘導切断の位置を割り当てるヌクレオチドレベルの精度も大幅に改善する。
CRISPR−Cas9ヌクレアーゼを使用したCIRCLE−seqの最初の検証実験では、Cas9ヌクレアーゼ切断断片の濃縮は、FIND−seq法と比較して、CIRCLE−seqでほぼ20倍であった(米国特許出願第62/217,690号明細書および図1に記載される)。これらの2つの方法の根本的な違いは、FIND−seqが、ステムループアダプターで共有結合的に閉じた直鎖DNA基質に基づくのに対し、CIRCLE−seqは、共有結合的に閉じた完全環状化DNA基質に基づくことである(図1A)。好ましいエキソヌクレアーゼの1つ(Epicentreから商業的に入手可能なPlasmidSafe ATP依存性DNase)は、FIND−seqステムループにライゲートされたDNA基質の露出したssDNA部分に対して、いくらかの活性を保持してもよく、これが、CIRCLE−seq法が、直鎖DNA断片と共有結合的に閉じたDNA断片との間のより高い酵素的識別、およびより低い全体的バックグラウンドをもたらす理由を説明してもよい。
したがって、提供された結果は、CIRCLE−seq法が、CRISPR−Cas9ヌクレアーゼのゲノムワイドオフターゲット切断部位を判定するために、今までに記載されている最も高感度で配列決定効率の高い生体外アプローチであることを示す。CIRCLE−seqは、Digenome−seqと比較して、観察されたバックグラウンド読み取りの比率が相当に低下しており、Digenome−seqで必要とされる配列決定読み取りの総数のわずかな部分(約1.7%)を使用して、オフターゲット部位を高感度で識別できるようにする。より控えめな数の読み取り(例えば、Illumina MiSeqなどの卓上配列決定装置で得られるもの)だけが必要なことから、方法は、ほとんどの実験室で利用でき、経費の観点から自動化および規模変更を受け入れられるようになる。
CIRCLE−seqは、Cas9オフターゲット切断のより正確な予測アルゴリズムの訓練を可能にする、より大きなデータセットを作成できるようにする。方法は、高い費用対効果で自動化および規模変更され得て、したがって、数千のgRNAのオフターゲット切断部位および相対的インビトロ切断効率(CIRCLE−seq読み取り数による測定)を同定するデータを生成することが、実現可能なはずである。さらに、GUIDE−seqなどの方法で、ENCODE特性決定細胞株において判定された大規模な細胞ベースのオフターゲットデータセットと結合された場合39、DNA DSBを誘導するヌクレアーゼの能力に対するクロマチンおよびエピジェネティックな修飾の影響を、より良く理解し定量化することが可能であってもよい。
治療用途では、GUIDE−seqやHTGTSなどの最高感度の細胞ベースのゲノムワイドオフターゲット検出法と比べてさえも、CIRCLE−seqがより優れていることから、この方法を初期スクリーニングとして用いて、潜在的オフターゲット部位を同定し得て、それは次に、実際のヌクレアーゼ修飾細胞における直交アプローチによって確認され得る。この研究では、標的配列決定法を用いてGUIDE−seq dsODN標識を検索し、次世代配列決定法に伴うインデル誤り率(典型的に約0.1%)のために標準的なアンプリコン配列決定法による同定が困難な低頻度部位(<0.1%)が検証された。しかし、このアプローチは、GUIDE−seq dsODN標識で形質移入され得る細胞に限定され、これは、全ての細胞で実行可能でないこともある。したがって、将来の研究のための重要かつ緊急な領域は、現在のハイスループット配列決定技術の誤差率未満のオフターゲット変異誘発をより感度良く測定する、代案の直交細胞ベース法の開発であろう。CIRCLE−seqはまた、遺伝子操作されたジンクフィンガーヌクレアーゼ(ZFN)および転写アクチベーター様エフェクターヌクレアーゼ(TALEN)などの、ヒト治療薬のために既に用いられている、その他のヌクレアーゼプラットフォームのオフターゲット効果を分析するために、拡張され得る。
本明細書中のCIRCLE−seqデータは、その他の研究者らによって最初に提起された概念である、オフターゲット切断に対するヒト遺伝的変異の潜在的な影響に、より大きな支持を提供する36。本発明者らの知見は、オフターゲットリスクを評価する際に遺伝子型を検討することの重要性を強調し、ヌクレアーゼの安全性評価に、患者特異的様式で実施される特異性プロファイルを含めるべきであると主張する。代案としては、遺伝的に多様な細胞の大規模パネルからのゲノムDNAに対して実施されたCIRCLE−seqが、任意の所与のヌクレアーゼについて大部分の共通およびSNP特異的オフターゲット効果を定義する、有効な方法を提供してもよい。この点において、CIRCLE−seqが、皮膚生検から得られるであろう一次線維芽細胞から単離されたゲノムDNA上で実施され、標準的な採血からの軟膜もまた、アッセイを行うのに十分な量のDNAを提供するであろう。CIRCLE−seqの単純さ、拡張性、および再現性は、大規模な一連のゲノムDNAサンプル上で、ゲノムワイドオフターゲットプロファイルを定義するのに理想的に適する。
ステムループアダプターおよび配列決定アダプター
本方法は、分子内ライゲーションによって断片を環状化するための、天然に存在しないステムループアダプターの使用を含む。ステムループアダプターは、(5’から3’方向に)例えば約10〜15、例えば12ヌクレオチドなどの第1の領域、少なくとも1つの(好ましくは1つのみの)ヘアピンループを形成し、分子内ライゲーションに適した回文配列を含み、少なくとも1つの(好ましくは1つのみの)ウラシルが側面にある、例えば約4から6、例えば5ヌクレオチドの第2の領域;および第1の領域に相補的な例えば約10から15、例えば13ヌクレオチドの第3の領域を含む。
本方法はまた、プライミングPCRまたは配列決定法で使用するためのヌクレオチド配列を含む、配列決定アダプターの使用も含む。配列決定アダプターは、典型的に(5’から3’方向に)例えば約10〜15、例えば12ヌクレオチドなどの第1の領域、少なくとも1つの(好ましくは1つのみの)ヘアピンループを形成し、PCRプライミングおよび/または例えば次世代配列決定法(NGS)などの配列決定法で使用するのに適した配列を含み、少なくとも1つの(好ましくは1つのみの)ウラシルが側面にある、例えば約20から60、例えば40ヌクレオチドの第2の領域;および第1の領域に相補的な例えば約10から15、例えば13ヌクレオチドの第3の領域を含む。第1、第2、および第3の領域の長さは、選択されたNGSプラットフォームで使用するためのプライミングに必要な配列に依存するので、選択されるNGS法次第で変動し得る。いくつかの実施形態では、標準的なアダプターの変種である市販のアダプター(例えば、IlluminaまたはNEBからの)が使用され得る。
ステムループおよび配列決定アダプターは、USER(Uracil−Specific Excision Reagent)酵素混合物(New England BioLabs)などの、ウラシルDNAグリコシラーゼ(UDG)とDNAグリコシラーゼ−リアーゼであるエンドヌクレアーゼVIIIとによって、アダプターが開かれるようにする、少なくとも1つ、好ましくは唯一のウラシルを含む。UDGは、ウラシル塩基の切除を触媒して脱塩基部位を形成するが、リン酸ジエステル骨格は無傷のまま残す(例えば、Lindhal et al.,J.Biol.Chem.252:3286−3294(1977);Lindhal,Annu.Rev.Biochem.51:61−64(1982)を参照されたい)。エンドヌクレアーゼVIIIは、脱塩基部位の3’および5’側で、リン酸ジエステル骨格を切断する(例えば、Melamede et al.,Biochemistry 33:1255−1264(1994);Jiang et al.,J.Biol.Chem.272:32230−32239(1997)を参照されたい)。この組み合わせは、ウラシルの位置に単一のヌクレオチドギャップを生成する。いくつかの実施形態では、ウラシルは、PCRプライミングおよび/または配列決定法における使用に適合する配列の、または回文配列の、3’または5’末端に、またはその1、2、3、または4ヌクレオチド以内に配置される。
本方法において、アダプターの全ての部分は、好ましくは、細胞のゲノムに直交する(すなわち、細胞ゲノム中に存在せず、または細胞ゲノム中に存在する配列と相補的でなく、すなわち細胞ゲノム中に存在する配列と10%、20%、30%、40%、または50%以下の同一性を有する)。
配列決定アダプターは、好ましくは、例えば、無作為化DNAバーコードであるプライマー部位(例えば、SHAPE−SEQ,Lucks et al.,Proc Natl Acad Sci USA 108:11063−11068)、固有の分子識別子(UMI)(例えば、Kivioja et al.,Nature Methods 9,72−74(2012);Islam et al.,Nature Methods 11,163−166(2014);Karlsson et al.,Genomics.2015 Mar;105(3):150−8を参照されたい)、または固有のPCRプライミング配列および/または配列決定法における使用に適合する固有の配列(例えばNGS)などの、PCRプライミングおよび/または配列決定法における使用に適合する配列を含むべきである。配列決定法における使用に適合する配列は、例えば次世代配列決定法、例えば、Illumina、イオントレント、またはRoche/454のようなライブラリー作成法、lllumina Solexa Genome Analyzer、Applied Biosystems SOLiD(商標)システム、イオントレント(商標)半導体配列分析器、PacBio(登録商標)リアルタイム配列決定法、およびHelicos(商標)単一分子配列決定法(SMS)などの所望の配列決定法での使用について選択され得る。例えば、国際公開第2014020137号パンフレット、Voelkerding et al.,Clinical Chemistry 55:4 641−658(2009)およびMetzker,Nature Reviews Genetics 11:31−46(2010)を参照されたい)。ThruPLEX DNA−seqキット(Rubicon;米国特許第7,803,550号明細書;米国特許第8,071,312号明細書;米国特許第8,399,199号明細書;米国特許第8,728,737号明細書を参照されたい)、およびNEBNext(登録商標)(New England BioLabs;例えば、米国特許第8,420,319号明細書を参照されたい))をはじめとする、NGS用DNAを調製するためのいくつかのキットが市販されている。例示的なステムループアダプター配列は、/5Phos/CGGTGGACCGATGATC/ideoxyU/ATCGGTCCACCG*T(配列番号1;星印はホスホロチオエート結合を示す)である。いくつかの実施形態では、配列決定アダプターは、例えば、NEBNextキットからなどの市販の配列決定アダプターである。
いくつかの実施形態では、アダプターは、好ましくは細胞ゲノムに相対的に稀である部位などの制限酵素認識部位を含む。
アダプターは、好ましくは修飾され;いくつかの実施形態では、ヘアピンアダプターの5’末端がリン酸化され、および/または3’末端がホスホロチオエート結合を含む。いくつかの実施形態では、アダプターは平滑末端化される。いくつかの実施形態では、アダプターは、5’または3’末端に、1、2、3、4個またはそれ以上のヌクレオチドオーバーハングのランダム変種を含み、あるいは5’または3’末端に単一のTを含む。
アダプターは、例えば、技術分野で公知の、またはPCT/US2011/060493号明細書に記載されるような、1つまたは複数の追加的な修飾もまた含み得る。例えば、いくつかの実施形態では、ヘアピンアダプターはビオチン化される。ビオチンは、ヘアピンアダプター内部の任意の場所にあり得る(例えば、修飾チミジン残基(ビオチン−dT)、またはビオチンアジドを使用)が、5’または3’末端上にはない。これは、ライゲートされた配列決定アダプターを含有する断片を回収する、代替方法を提供する。いくつかの実施形態では、これらの配列は、PCRによって取得され増幅されるに対し、このアプローチでは、それらは例えば、ストレプトアビジン被覆磁気ビーズとの結合によって、または溶液ハイブリッド捕捉を用いて、ビオチンを使用して物理的に引き寄せられ濃縮される;例えば、Gnirke et al.,Nature Biotechnology 27,182−189(2009)を参照されたい。
遺伝子操作されたヌクレアーゼ
現在のところ、以下の4つの主なクラスの遺伝子操作されたヌクレアーゼが存在する:1)メガヌクレアーゼ、2)ジンクフィンガーヌクレアーゼ、3)転写アクチベーターエフェクター様ヌクレアーゼ(TALEN)、および4)規則的な間隔をもってクラスター化された短鎖反復回文配列(CRISPR)Cas RNA誘導ヌクレアーゼ(RGN)。これらのプラットフォームの様々な構成要素はまた、融合して、Mega−TALsおよびFokI−dCas9融合物などの追加的なヌクレアーゼが生成され得る。例えば、Gaj et al.,Trends Biotechnol.2013 Jul;31(7):397−405を参照されたい。ヌクレアーゼは、当該分野で公知の方法を用いて、細胞内で一過性にまたは安定して発現され得て;典型的に、発現が得られ、タンパク質をコードする配列が、転写を誘導するプロモーターを含有する発現ベクターにサブクローニングされる。適切な真核発現系は、当該技術分野で周知であり、例えば、Sambrook et al.,Molecular Cloning,A Laboratory Manual(4th ed.2013);Kriegler,Gene Transfer and Expression:A Laboratory Manual(2006);およびCurrent Protocols in Molecular Biology(Ausubel et al.,eds.,2010)に記載される。真核細胞および原核細胞の形質転換は、標準技術に従って実施される(例えば、上記の参考文献およびMorrison,1977,J.Bacteriol.132:349−351;Clark−Curtiss & Curtiss,Methods in Enzymology 101:347−362(Wu et al.,eds,1983)を参照されたい。
ホーミングメガヌクレアーゼ
メガヌクレアーゼは、細菌、酵母、藻類、および植物細胞小器官などの様々な生物に由来する、配列特異的エンドヌクレアーゼである。内因性メガヌクレアーゼは、12〜30塩基対の認識部位を有し;18bpおよび24bp長のメガヌクレアーゼ認識部位があるカスタマイズされたDNA結合部位が記載されており、どちらも本方法およびコンストラクトで使用され得る。例えば、Silva,G.,et al.,Current Gene Therapy,11:11−27,(2011);Arnould et al.,Journal of Molecular Biology,355:443−58(2006);Arnould et al.,Protein Engineering Design & Selection,24:27−31(2011);およびStoddard,Q.Rev.Biophys.38,49(2005);Grizot et al.,Nucleic Acids Research,38:2006−18(2010)を参照されたい。
CRISPR−Casヌクレアーゼ
最近の研究により、クラスター化され規則的に間隔を置いた短い回文構造の反復配列(CRISPR)/CRISPR関連(Cas)システム(Wiedenheft et al.,Nature 482,331−338(2012);Horvath et al.,Science 327,167−170(2010);Terns et al.,Curr Opin Microbiol 14,321−327(2011))は、細菌、酵母、およびヒト細胞内で、ならびにショウジョウバエ、ゼブラフィッシュ、およびマウスなどの生物全体の生体内で、ゲノム編集を実施するための単純かつ高効率な方法の基礎の役割を果たし得る(Wang et al.,Cell 153,910−918(2013);Shen et al.,Cell Res(2013);Dicarlo et al.,Nucleic Acids Res(2013);Jiang et al.,Nat Biotechnol 31,233−239(2013);Jinek et al.,Elife 2,e00471(2013);Hwang et al.,Nat Biotechnol 31,227−229(2013);Cong et al.,Science 339,819−823(2013);Mali et al.,Science 339,823−826(2013c);Cho et al.,Nat Biotechnol 31,230−232(2013);Gratz et al.,Genetics 194(4):1029−35(2013))ことが実証されている。S.ピオゲネス(S.pyogenes)に由来するCas9ヌクレアーゼ(以下、単にCas9)は、例えば、シングルガイドRNAまたはcrRNA/tracrRNA対などの遺伝子操作されたガイドRNA(gRNA)の17〜20個のヌクレオチドと、例えば、NGGまたはNAG配列にマッチするPAMなどのプロトスペーサー隣接モチーフ(PAM)の隣に位置する標的ゲノムDNA配列の相補鎖との間の単純な塩基対相補性を通じて、誘導され得る(Shen et al.,Cell Res(2013);Dicarlo et al.,Nucleic Acids Res(2013);Jiang et al.,Nat Biotechnol 31,233−239(2013);Jinek et al.,Elife 2,e00471(2013);Hwang et al.,Nat Biotechnol 31,227−229(2013);Cong et al.,Science 339,819−823(2013);Mali et al.,Science 339,823−826(2013c);Cho et al.,Nat Biotechnol 31,230−232(2013);Jinek et al.,Science 337,816−821(2012))。例えば、Zetsche et al.,Cell 163,759−771(2015);Schunder et al.,Int J Med Microbiol 303,51−60(2013);Makarova et al.,Nat Rev Microbiol 13,722−736(2015);Fagerlund et al.,Genome Biol 16,251(2015)に記載されるように、プレボテラ属(Prevotella)およびフランシセラ属(Francisella)1(Cpf1)ヌクレアーゼに由来する遺伝子操作されたCRISPRもまた使用され得る。SpCas9とは異なり、Cpf1は、標的DNA配列のプロトスペーサーに相補的な3’末端に23ntを有する、単一の42ntのcrRNAのみを必要とする(Zetsche et al.,2015)。さらに、SpCas9が、プロトスペーサーの3’であるNGG PAM配列を認識するのに対して、AsCpf1およびLbCp1は、プロトスペーサーの5’に見いだされるTTTN PAMを認識する(同書)。
いくつかの実施形態では、本システムは、細菌においてコードされているか、または哺乳類細胞における発現のためにコドン最適化されているか、および/またはそのPAM認識特異性および/またはそのゲノムワイド特異性が改変されているかのいずれかとして、S.ピオゲネス(S.pyogenes)またはスタフィロコッカス・アウレウス(Staphylococcus aureus)に由来する野生型または変異型Cas9タンパク質、またはアシダミノコッカス属(Acidaminococcus)種BV3L6またはラクノスピラ科(Lachnospiraceae)細菌ND2006に由来する野生型Cpf1タンパク質を利用する。いくつかの変法が記載されており、例えば、特に、国際公開第2016/141224号パンフレット、PCT/US2016/049147号明細書、Kleinstiver et al.,Nat Biotechnol.2016 Aug;34(8):869−74;Tsai and Joung,Nat Rev Genet.2016 May;17(5):300−12;Kleinstiver et al.,Nature.2016 Jan 28;529(7587):490−5;Shmakov et al.,Mol Cell.2015 Nov 5;60(3):385−97;Kleinstiver et al.,Nat Biotechnol.2015 Dec;33(12):1293−1298;Dahlman et al.,Nat Biotechnol.2015 Nov;33(11):1159−61;Kleinstiver et al.,Nature.2015 Jul 23;523(7561):481−5;Wyvekens et al.,Hum Gene Ther.2015 Jul;26(7):425−31;Hwang et al.,Methods Mol Biol.2015;1311:317−34;Osborn et al.,Hum Gene Ther.2015 Feb;26(2):114−26;Konermann et al.,Nature.2015 Jan 29;517(7536):583−8;Fu et al.,Methods Enzymol.2014;546:21−45;およびTsai et al.,Nat Biotechnol.2014 Jun;32(6):569−76を参照されたい。ガイドRNAは、Cas9またはCpf1と共に、細胞内で発現され、または細胞内に存在する。ガイドRNAまたはヌクレアーゼのどちらか、またはその双方は、細胞内で一過性にまたは安定して発現され得るか、または精製されたタンパク質または核酸として導入され得る。
いくつかの実施形態では、ヌクレアーゼは、FokI−dCas9融合、RNA誘導FokIヌクレアーゼであり、その中でCas9ヌクレアーゼは、変異(例えばdCas9)によって触媒的に不活性化されており、FokIヌクレアーゼは、フレーム内で任意選択的に介在性リンカーによって、dCas9に融合する。例えば、国際公開第2014/144288号パンフレット、および国際公開第2014/204578号パンフレットを参照されたい。
TALエフェクターリピートアレイ
キサントモナス属(Xanthomonas)の植物病原菌のTALエフェクターは、宿主DNAに結合し、エフェクター特異的宿主遺伝子を活性化することによって、疾病において重要な役割を果たすか、または防御を始動する。特異性は、不完全な、典型的に約33〜35個のアミノ酸反復である、エフェクター可変数に依存する。多型性は、本明細書では反復可変二残基(RVD)と称される、反復位置12および13に主に存在する。TALエフェクターのRVDは、1つのRVDと1つのヌクレオチドとの直接的な直線様式で、それらの標的部位のヌクレオチドに対応し、いくらかの縮重があるが明らかな文脈依存はない。いくつかの実施形態では、ヌクレオチド特異性を付与する多型性領域は、三残基または三つ組として発現されてもよい。
各DNA結合反復は、標的DNA配列中の塩基対の認識を決定するRVDを含み得て、その中では各DNA結合反復は、標的DNA配列中の1つの塩基対の認識に関与する。いくつかの実施形態では、RVDは、Cを認識するためのHA;Cを認識するためのND;Cを認識するためのHI;Gを認識するためのHN;Gを認識するためのNA;GまたはAを認識するためのSN;Tを認識するためのYG;Gを認識するためのNKの1つまたは複数、およびCを認識するためのHD;Tを認識するためのNG;Aを認識するためのNI;GまたはAを認識するためのNN;AまたはCまたはGまたはTを認識するためのNS;CまたはTを認識するためのN**はRVDの第2の位置におけるギャップを表す);Tを認識するためのHG;Tを認識するためのH**はRVDの第2の位置におけるギャップを表す);およびTを認識するためのIGの1つまたは複数を含んでなり得る。
TALEタンパク質は、ゲノム編集における相同組換えを容易にし得る標的キメラヌクレアーゼとして、(例えば、植物において、バイオ燃料または再生可能なエネルギーに有用な形質を追加しまたは増強する)研究および生物工学において有用であってもよい。これらのタンパク質はまた、特に、非限定的例として、病原体(例えばウイルス)に対する治療薬などの非常に高い特異性を要する治療用途のために、例えば、転写因子として有用であってもよい。
遺伝子操作されたTALEアレイを生成する方法は当該技術分野で公知であり、例えば、全てそれらの内容全体が参照により本明細書に援用される、米国特許出願第61/610,212号明細書およびReyon et al.,Nature Biotechnology 30,460−465(2012)に記載される高速ライゲーションベースの自動化可能固相ハイスループット(fast ligation−based automatable solid−phase high−throughput)(FLASH)システム、ならびにBogdanove & Voytas,Science 333,1843−1846(2011);Bogdanove et al.,Curr Opin Plant Biol 13,394−401(2010);Scholze & Boch,J.Curr Opin Microbiol(2011);Boch et al.,Science 326,1509−1512(2009);Moscou & Bogdanove,Science 326,1501(2009);Miller et al.,Nat Biotechnol 29,143−148(2011);Morbitzer et al.,T.Proc Natl Acad Sci USA 107,21617−21622(2010);Morbitzer et al.,Nucleic Acids Res 39,5790−5799(2011);Zhang et al.,Nat Biotechnol 29,149−153(2011);Geissler et al.,PLoS ONE 6,e19509(2011);Weber et al.,PLoS ONE 6,e19722(2011);Christian et al.,Genetics 186,757−761(2010);Li et al.,Nucleic Acids Res 39,359−372(2011);Mahfouz et al.,Proc Natl Acad Sci USA 108,2623−2628(2011);Mussolino et al.,Nucleic Acids Res(2011);Li et al.,Nucleic Acids Res 39,6315−6325(2011);Cermak et al.,Nucleic Acids Res 39,e82(2011);Wood et al.,Science 333,307(2011);Hockemeye et al.Nat Biotechnol 29,731−734(2011);Tesson et al.,Nat Biotechnol 29,695−696(2011);Sander et al.,Nat Biotechnol 29,697−698(2011);Huang et al.,Nat Biotechnol 29,699−700(2011);およびZhang et al.,Nat Biotechnol 29,149−153(2011)に記載される方法を参照されたい。
メガヌクレアーゼとTALエフェクターとの融合物であるMegaTALもまた、本方法で使用するのに適し;例えば、Boissel et al.,Nucl.Acids Res.42(4):2591−2601(2014);Boissel and Scharenberg,Methods Mol Biol.2015;1239:171−96を参照されたい。
ジンクフィンガー
ジンクフィンガータンパク質は、独立して折りたたまれた亜鉛含有ミニドメインである、1つまたは複数のジンクフィンガーを含有するDNA結合タンパク質であり、その構造は当該技術分野で周知であり、例えば、Miller et al.,1985,EMBO J.,4:1609;Berg,1988,Proc.Natl.Acad.Sci.USA,85:99;Lee et al.,1989,Science.245:635;およびKlug,1993,Gene,135:83で定義される。ジンクフィンガータンパク質Zif268の、およびDNAに結合したその変異体の結晶構造は、半保存パターンの相互作用を示し、その中では、ジンクフィンガーのαらせんに由来する典型的に3つのアミノ酸は、3つの隣接する塩基対、またはDNA中の「サブサイト」に接触する(Pavletich et al.,1991,Science,252:809;Elrod−Erickson et al.,1998,Structure,6:451)。したがって、Zif268の結晶構造は、ジンクフィンガーとDNA配列中の3塩基対「サブサイト」との間の1対1の相互作用で、ジンクフィンガーDNA結合ドメインが、モジュラー様式で機能するかもしれないことを示唆した。天然に存在するジンクフィンガー転写因子中では、複数のジンクフィンガーが、典型的に、タンデムアレイで共に連結し、連続DNA配列の配列特異的認識を達成する(Klug,1993,Gene 135:83)。
複数の研究により、DNA結合に関与するαらせん位置でアミノ酸を無作為化することによって、そして目的のDNA標的部位に結合できる所望の変異体を同定するためのファージディスプレイなどの選択法を用いることによって、個々のジンクフィンガーのDNA結合特性を人工的に操作できることが示されている(Rebar et al.,1994,Science,263:671;Choo et al.,1994 Proc.Natl.Acad.Sci.USA,91:11163;Jamieson et al.,1994,Biochemistry 33:5689;Wu et al.,1995 Proc.Natl.Acad.Sci.USA,92:344)。このような組換えジンクフィンガータンパク質は、転写活性化因子、転写抑制因子、メチル化ドメイン、およびヌクレアーゼなどの機能ドメインに融合されて、遺伝子発現を調節し、DNAメチル化を改変し、モデル生物、植物、およびヒト細胞のゲノムに標的改変を導入し得る(Carroll,2008,Gene Ther.,15:1463−68;Cathomen,2008,Mol.Ther.,16:1200−07;Wu et al.,2007,Cell.Mol.LifeSci.,64:2933−44)。
「モジュラーアセンブリー」として知られているジンクフィンガーアレイを遺伝子操作する1つの既存の方法は、事前に選択されたジンクフィンガーモジュールをアレイに単純に共に結合することを提唱する(Segal et al.,2003,Biochemistry,42:2137−48;Beerli et al.,2002,Nat.Biotechnol.,20:135−141;Mandell et al.,2006,Nucleic Acids Res.,34:W516−523;Carroll et al.,2006,Nat.Protoc.1:1329−41;Liu et al.,2002,J.Biol.Chem.,277:3850−56;Bae et al.,2003,Nat.Biotechnol.,21:275−280;Wright et al.,2006,Nat.Protoc.,1:1637−52)。この方法は、いかなる研究者でも実施するのに十分に簡単ではあるが、最近の報告では、特にジンクフィンガーヌクレアーゼの文脈で、失敗率が高いことが示されており(Ramirez et al.,2008,Nat.Methods,5:374−375;Kim et al.,2009,Genome Res.19:1279−88)、これは、任意の所与の標的遺伝子に対する非常に多数のジンクフィンガータンパク質の構築および細胞ベースの試験を典型的に必要とする限界である。(Kim et al.,2009,Genome Res.19:1279−88)。
無作為化されたライブラリーからジンクフィンガーアレイを同定するコンビナトリアル選択ベースの方法は、モジュラーアセンブリーよりさらに高い成功率を有することが示されている(Maeder et al.,2008,Mol.Cell,31:294−301;Joung et al.,2010,Nat.Methods,7:91−92;Isalan et al.,2001,Nat.Biotechnol.,19:656−660)。好ましい実施形態では、ジンクフィンガーアレイは、国際公開第2011/017293号パンフレットおよび国際公開第2004/099366号パンフレットに記載されており、または国際公開第2011/017293号パンフレットおよび国際公開第2004/099366号パンフレットに記載されているように生成される。追加的な適切なジンクフィンガーDBDは、米国特許第6,511,808号明細書、米国特許第6,013,453号明細書、米国特許第6,007,988号明細書、および米国特許第6,503,717号明細書、および米国特許出願第2002/0160940号明細書に記載される。
DNA
本明細書に記載の方法は生体外で実施されるため、例えば、任意の細胞から単離されたゲノムDNA、人工的に作成されたDNA集団、またはその任意の他のDNAプールなどのDNAに適用され得る。
配列決定法
本明細書の用法では、「配列決定法」は、核酸配列を決定する任意の方法を含む。本方法では、連鎖停止剤(Sanger)配列決定法および色素ターミネーター配列決定法をはじめとする、任意の配列決定法が用いられ得る。好ましい実施形態では、数千のまたは数百万の配列決定反応を並行して遂行するハイスループット配列決定技術である、次世代配列決定法(NGS)が用いられる。異なるNGSプラットフォームは様々なアッセイ化学反応を用いるが、それらは全て、多数の鋳型上で同時に実行される、多数の配列決定反応からの配列データを生成する。典型的には、配列データはスキャナーを用いて収集され、次にアセンブルされて、生物情報学的に分析される。したがって、配列決定反応は、並行して実施され、読み取られ、アセンブルされ、分析され;例えば、米国特許第20140162897号明細書、ならびにVoelkerding et al.,Clinical Chem.,55:641−658,2009;およびMacLean et al.,Nature Rev.Microbiol.,7:287−296(2009)を参照されたい。いくつかのNGS法は鋳型増幅を必要とし、いくつかは増幅を必要としない。増幅が必要な方法としては、ピロシーケンス(例えば、米国特許第6,210,89号明細書および米国特許第6,258,568号明細書を参照されたい;Rocheによって商品化されている);Solexa/Illuminaプラットフォーム(例えば、米国特許第6,833,246号明細書、米国特許第7,115,400号明細書、および米国特許第6,969,488号明細書を参照されたい);およびSupported Oligonucleotide Ligation and Detection(SOLiD)プラットフォーム(Applied Biosystems;例えば、米国特許第5,912,148号明細書および米国特許第6,130,073号明細書を参照されたい)が挙げられる。例えば、単一分子配列決定法などの増幅を必要としない方法としては、ナノポア配列決定法、HeliScope(米国特許第7,169,560号明細書;米国特許第7,282,337号明細書;米国特許第7,482,120号明細書;米国特許第7,501,245号明細書;米国特許第6,818,395号明細書;米国特許第6,911,345号明細書;および米国特許第7,501,245号明細書);合成によるリアルタイム配列決定法(例えば、米国特許第7,329,492号明細書を参照されたい);ゼロモード導波路(ZMW)を用いた単一分子リアルタイム(SMRT)DNA配列決定法;および米国特許第7,170,050号明細書;米国特許第7,302,146号明細書;米国特許第7,313,308号明細書;および米国特許第7,476,503号明細書)に記載されるものをはじめとするその他の方法が挙げられる。例えば、米国特許第20130274147号明細書;米国特許第20140038831号明細書;Metzker,Nat Rev Genet 11(1):31−46(2010)を参照されたい。
代案としては、例えば、マイクロアレイ分析、NANOSTRING、ILLUMINA、またはその他の配列決定プラットフォームなどの、ハイブリダイゼーションに基づく配列方法またはその他のハイスループット法もまた用いられ得る。
キット
本明細書でまた提供されるのは、本明細書に記載の方法で使用するためのキットである。キットは、以下の1つまたは複数を含み得る:ヘアピンアダプター;末端修復およびAテーリングのための試薬および/または酵素(例えば、T4ポリメラーゼ、クレノウ断片、T4ポリヌクレオチドキナーゼ(PNK)、および/またはTaqDNAポリメラーゼ);エキソヌクレアーゼ;例えば、USER(Uracil−Specific Excision Reagent)酵素混合物(New England BioLabs)などのウラシルDNAグリコシラーゼ(UDG)および/またはDNAグリコシラーゼ−リアーゼであるエンドヌクレアーゼVIII;例えばcas9タンパク質などの精製されたヌクレアーゼ;ガイドRNA(例えば、対照gRNA);gDNA鋳型(例えば、対照gDNA鋳型);および/または本明細書に記載の方法で使用するための使用説明書。
本発明は、特許請求の範囲に記載された本発明の範囲を限定するものではない、以下の実施例においてさらに記載される。
材料と方法
以下の材料および方法を以下の実施例1〜6で使用した。
細胞培養および形質移入
細胞培養実験は、ヒトU2OS(T.Cathomenからの寄贈)、HEK293(Thermo−Fisher)、K562、およびPGP1線維芽細胞(G.Churchからの寄贈)上で実施した。U2OSおよびHEK293細胞を、10%FBS、2mMのGlutaMax(Life Technologies)およびペニシリン/ストレプトマイシンが添加されたAdvanced DMEM(Life Technologies)中で、5%CO2と共に37℃で培養した。K562細胞は、10%FBS、2mMのGlutaMax、およびペニシリン/ストレプトマイシンが添加されたRPMI 1640(Life Technologies)中で、5%CO2と共に37℃で培養した。ヒトPGP1線維芽細胞は、10%FBS、2mMのGlutaMax、およびペニシリン/ストレプトマイシンを添加したイーグルDMEM(ATCC)中で、5%CO2と共に37℃で培養した。CIRCLE−seq実験では、Gentra Puregene Tissueキット(Qiagen)を使用してゲノムDNAを単離し、Qubit(Thermo Fisher)によって定量化した。標的化標識組み込みディープシーケンシング実験のために、Lonza Nucleofector 4−D上で、U2OS細胞(プログラムDN−100)、HEK293細胞(プログラムCM−137)、およびK562細胞(プログラムFF−120)を20μlのSolution SE(Lonza)溶液中で、製造会社の使用説明書に従って形質移入した。U2OS細胞において、500ngのpCAG−Cas9(pSQT817)、250ngのgRNAコードプラスミド、および100pmolのGUIDE−seq末端保護dsODNを同時形質移入した。Agencourt DNAdvancedゲノムDNA単離キット(Beckman Coulter Genomics)を使用して、形質移入のおよそ72時間後に、標的化標識組み込み配列決定法のためのゲノムDNAを収穫した。
gRNAの生体外転写
アニールされたオリゴヌクレオチド含有gRNA標的部位は、T7 RNAポリメラーゼプロモーター部位を含有するプラスミドNW59にクローン化した。gRNA発現プラスミドはHindIII制限酵素(NEB)で直線化し、MinElute PCR精製キット(Qiagen)で精製した。直線化プラスミドは、MEGAshortscriptキットを使用して、製造会社(Thermo Fisher)の使用説明書に従って、gRNAの生体外転写のためのDNA鋳型として使用した。
CIRCLE−seqライブラリーの作成
GUIDE−seqによって以前に評価されたgRNAを用いた実験では、その中でそれらがGUIDE−seqによって評価されたのと同じ細胞(U2OSまたはHEK293細胞のいずれか)に由来するゲノムDNA上で、CIRCLE−seq実験を実施した。精製ゲノムDNAは、Covaris S200装置によって300bpの平均長さに剪断し、末端修復してAテールを付加し、ウラシル(デオキシウリジン)含有ステムループアダプターoSQT1288 5’−P−CGGTGGACCGATGATCUATCGGTCCACCG*T−3’(配列番号1)にライゲートした(*はホスホロチオエート結合を示す)。アダプターにライゲートされたDNAは、λエキソヌクレアーゼ(NEB)と大腸菌(E.coli)エキソヌクレアーゼI(NEB)との混合物で処理し、次にUSER酵素(NEB)およびT4ポリヌクレオチドキナーゼ(NEB)で処理した。DNAをT4DNAリガーゼを用いて5ng/μlの濃度で環状化し、Plasmid−SafeATP依存性DNase(Epicentre)で処理して、残りの直鎖DNA分子を分解した。生体外切断反応は、Cas9ヌクレアーゼ緩衝液(NEB)、90nMのSpCas9タンパク質、90nMの生体外転写gRNA、および250ngのPlasmid−Safe処理環状化DNAを使用して、100μlで実施した。消化産物をAテールテール付加し、ヘアピンアダプターにライゲートして、USER酵素(NEB)で処理し、Kapa HiFiポリメラーゼ(Kapa Biosystems)を使用してPCRで増幅した。完成したライブラリーは液滴デジタルPCR(Bio−Rad)によって定量化し、Illumina MiSeq装置上において、150bpの対末端読み取りで配列決定した。CIRCLE−seqライブラリー構築の詳細なユーザープロトコルは、実施例7に記載されている。
標的化ディープシーケンシング
U2OS細胞は、上記のGUIDE−seq dsODNに加えて、Cas9およびgRNA発現プラスミドで形質移入した。Phusion Hot Start Flex DNAポリメラーゼ(New England Biolabs)を使用して単離されたU2OSゲノムDNAから、CIRCLE−seqによって同定されるオフターゲット部位を増幅させた。各PCRのための投入量として100ngのゲノムDNAを用いて、各形質移入条件から三連のPCR産物を生成した。PCR産物の濃度を標準化し、異なる形質移入条件に対応する異なるライブラリーにプールして、Ampure XP磁気ビーズ(Agencourt)を用いて精製した。500ngの各プールされたサンプル(KAPA Biosystems)を使用して、Illumina Tru−seqディープシーケンシングライブラリーを構築し、リアルタイムPCR(KAPA Biosystems)によって定量化して、Illumina MiSeq機器で配列決定した。
CIRCLE−seqデータ解析
対末端読み取りをマージさせ、次にデフォルトパラメータでbwa40memを用いてマッピングした。≧50のマッピング品質で予測される方向でマッピングされた読み取りの開始マッピング位置を表にして、ヌクレアーゼ処理されたサンプル中で濃縮されたゲノム間隔を同定した。ギャップを考慮して、6以下の編集距離を有する潜在的なヌクレアーゼ誘導オフターゲット部位について、どちらかの側の参照配列の間隔および20bpを検索した。
samtools41,42mpileupを使用して、オフターゲット部位における非参照遺伝的変異を同定した。平均品質スコアが20を超える位置を可能な変種と見なし、目視検査によって確認した。
オフターゲット切断部位の参照非依存性発見は、対の一方の読み取りの配列を逆補完し、それを対のもう一方に連結することによって実施した。同定された部位に対応するギャップおよび読み取り数を考慮して、≦6の編集距離を有する潜在的なオフターゲット切断部位について、接合部のどちらかの側で開始する20bpの間隔を直接検索した。
CIRCLE−seqオープンソース解析ソフトウェア
ヌクレアーゼオフターゲット部位のゲノムワイド検出のためのCIRCLE−seqの幅広い利用を可能にするために、本発明者らは、CIRCLE−seq実験データを解析するための自由に利用できるオープンソースのPythonパッケージcircleseqを開発した。単純なサンプルマニフェストを提供すると、circleseqソフトウェアは、CIRCLE−seq配列決定データの完全なエンドツーエンド解析を1つのコマンドで実行し、オフターゲットの切断部位の候補位置の表、ならびにオフターゲット配列の視覚的アラインメントを返す。
Digenome−seqデータ解析
CIRCLE−seqによって同定された切断部位周辺の狭い範囲(+/−3bp)のマッピング位置の読み取り数は、元のDigenome−seq配列決定アラインメントから表にした。負の二項分布を適合させることによって、0.01の有意水準での切断の有意な証拠を評価し、この基準による統計的に有意な部位を図2bに含めた。
実施例1.CIRCLE−seq法の概要と最適化
本発明者らは、Digenome−seqによって生じるランダムゲノムDNAの交絡したバックグラウンド読み取り(図1A)が、Cas9ヌクレアーゼ切断ゲノムDNA断片の選択濃縮によって実質的に減少すると推論した。これを達成するために、本発明者らは、制限酵素非依存的ストラテジーを設計し、無作為に剪断された直鎖ゲノムDNAを環状化し、残る非環状DNAの酵素分解がそれに続いた(図1B〜C)。本発明者らは、オンターゲットおよびオフターゲット部位における、部位特異的ヌクレアーゼによるこのゲノムDNA環集団の切断が、線形化DNA末端を遊離させ、それに次世代配列決定アダプターがライゲートされ得ることを想定した。本発明者らは、これらの工程が集合的に、ヌクレアーゼ誘導DNA末端の選択濃縮および配列決定を可能にし、ランダムに分布した末端剪断ゲノムDNA調製物の望まれない配列決定を抑止すると仮定した。重要なことには、ヌクレアーゼオフターゲット切断部位発見のための全てのその他のゲノムワイド法とは対照的に、本発明者らのストラテジーは、対末端配列決定法を用いて、1つのDNA分子の単一切断部位の両側の配列決定を独自に可能にする。
本発明者らがCIRCLE−seqと称するこの方法の最適化、およびその技術的再現性の特徴付け(図1D)は、次のようにして実施した。ゲノムDNAの制限酵素独立環状化を達成するために、本発明者らは、末端修復されたAテール付加PCRアンプリコンへのウラシル含有ステムループアダプターのライゲーションに基づく、ストラテジーを試験した。本発明者らは、λエキソヌクレアーゼと大腸菌(E.coli)エキソヌクレアーゼIとの混合物を用いて、両側にライゲートされたステムループアダプターを有する、共有結合的に閉じたDNA分子を酵素的に選択した。USER酵素とT4PNKとの混合物を用いて4bpのオーバーハングを遊離させ、分子内ライゲーションに有利な条件下で、T4DNAリガーゼを用いてライゲーションを実施し、キャピラリー電気泳動によって環状化を成功させた。最も高い環状化効率をもたらす条件(400UのT4DNAリガーゼ、5ng/μlのDNA濃度)を後続する実験のために用いた。CIRCLE−seqの技術的再現性を特性解析するために、本発明者らはU2OSゲノムDNAの同一起源から、独立したライブラリー作成を実施した。本発明者らは、独立した技術的複製において、強いCIRCLE−seq読み取り数相関を観察した(図1D)。
実施例2.CIRCLE−seqは、CRISPR−Cas9ゲノムワイドオフターゲット切断部位の高感度の生体外検出を可能にする
CIRCLE−seqの有効性と感度を試験するために、本発明者らは、それを用いて、これまでのところ最も新しく正確なDigenome−seqバージョンでプロファイリングされている、単一の公開されたgRNAによって誘導された、Cas9のオフターゲット切断部位を同定した35。ヒトK562細胞ゲノムDNA上のこのgRNA(ヒトHBB遺伝子を標的とする)を用いたSpCas9のCIRCLE−seq評価は、GUIDE−seqによって以前に同定された29個のオフターゲット部位のうち26個を同定しただけでなく、156個の新たなオフターゲット部位もまた同定した(図2A)。Digenome−seqで見いだされたが、CIRCLE−seqでは見いだされなかった3つのオフターゲット部位について、本発明者らは、支持的な読み取りをCIRCLE−seqデータで観察し、これらの部位が単にこれらの特定の実験でアンダーサンプリングされたことが実証された。本発明者らは、CIRCLE−seqによってのみ検出された156個の新たなオフターゲット切断部位のうち、29個が元のDigenome−seqデータでもまた切断の証拠を示すことを見いだし34(図2B);Digenome−seqがこれらの部位を呼び出せないことは、この方法によって生成された豊富なゲノムワイドバックグラウンドの読み取りに対抗するために要求される、厳密な情報科学のスコアリング基準に起因する可能性が高い。対照的に、本発明者らは、このようなバックグラウンド読み取りが、CIRCLE−seqでは稀であることを見いだした(図2C)。実際に、本発明者らは、2つの方法でオンターゲット部位の調査および配列決定深度に対する補正調整に基づいて、ランダムバックグラウンド読み取りに対するヌクレアーゼ切断配列読み取りのCIRCLE−seqの濃縮係数は、Digenome−seqよりも約18,000倍優れていると推定する(図2C)。双方向性CIRCLE−seq読み取りの開始マッピング位置は、SpCas9の予測切断部位(PAM配列の3bp前)に一致し、この方法が、ヌクレオチドレベル精度で切断位置を正確にマッピングする能力を実証する(図2D)。総合すると、これらの結果は、CIRCLE−seqがDigenome−seqと比較して、より高い信号対雑音比を有することを実証しており、これがゲノムワイドオフターゲット部位を同定するその高感度の原因である可能性が高い。
実施例3.CIRCLE−seqと細胞ベースのオフターゲット判定法の直接比較
本発明者らは次に、CIRCLE−seqの性能を、ゲノムワイドオフターゲット変異同定に現在利用可能な最も高感度の細胞ベースのアプローチの1つである、GUIDE−seqと比較した30。最初の比較では、本発明者らは、CIRCLE−seqを用いて、以前、2つの異なるヒト細胞系にわたりGUIDE−seqによって特徴付けられていた、標準的な非反復配列を標的とする6つの異なるgRNAを有するSpCas9を評価した。CIRCLE−seqは、これらの6つの様々なgRNAのオフターゲット切断部位の可変数を同定し、それは21程度の少数から124程度の多数に至る数であり(図3A;EMX1標的化実験の1つの複製の例示的データは下の表2に示される;EMX1標的部位配列:GAGTCCGAGCAGAAGAAGAANGG(配列番号2))、ヒトゲノム全体に分布する(図3B)。重要なことには、6つのgRNAの全てで、CIRCLE−seqは、GUIDE−seqによって以前に見いだされたのよりも多くのオフターゲット部位を同定し、本発明者らが、以前GUIDE−seqを用いてオフターゲット部位を同定できなかった、RNF2を標的化するgRNAなどが挙げられる。6つのgRNAのうち4つでは、CIRCLE−seqは、GUIDE−seqによって同定された全てのオフターゲット部位を検出し(図3C)、他の2つのgRNAでは、それぞれ1つのオフターゲット以外は全て検出した(図3C)。これらの実験のCIRCLE−seqデータのより詳細な調査は、実際に、これら2つのオフターゲット部位に対するいくつかの支持的な読取りの証拠を明らかにしたが、本発明者らのこれらの実験における検出の統計学的閾値を満たすのに十分な数ではなかった。さらに、予期されたように、これら2つの非検出部位は、本発明者らのGUIDE−seq実験における検出の端にあった。総合すると、これらの知見もまた、本発明者らがCIRCLE−seq配列決定深度を適度に増加させたなら、これら2つのオフターゲット部位が検出されたであろうことを示唆する。
CIRCLE−seqのより難易度の高い試験を提供するために、本発明者らはまた、反復配列を標的化する4つの追加的なgRNAを有するSpCas9をプロファイリングしたが、これは以前はGUIDE−seqによって特徴付けられていた。それらの標的の反復的性質により、これらの4つのgRNAは、ヒトゲノムにおいて比較的多数の厳密に一致する部位を有し(表1)、当然のことながら、GUIDE−seqによって、ヒト細胞において多数のオフターゲット効果を誘導することが示されている30。予測されたように、CIRCLE−seqは、4つのgRNAのそれぞれについて、496〜2503の範囲の数のより多くのオフターゲット部位を同定し(図3Aおよび表2)、ヒトゲノム全体に分布していた(図3B)。これらには、GUIDE−seq実験によって以前に同定された364個のオフターゲット部位のうち、353個(図3C)が含まれていた。GUIDE−seqで見いだされたが、CIRCLE−seqでは同定されなかった11部位のうち9部位については、CIRCLE−seqデータに支持的な読み取りの証拠が認められ得たが、統計的カットオフのために十分に高い数値でなく、より大きな読み取り深度が、これらの部位の検出を可能にすることが再度示唆される。
次に本発明者らは、CIRCLE−seqを用いて、以前に細胞ベースのHTGTS法により特徴付けられているSpCas9および2つのgRNAをプロファイリングした。これらの実験は、(EMX1およびVEGFA遺伝子中の部位を標的化する)双方のgRNAについて、CIRCLE−seqが、HTGTSによって以前に同定された53個のオフターゲット部位のうち50個(94%)を見いだしたことを明らかにした(図3E)。CIRCLE−seqによって検出されなかった3つのHTGTS部位のうち、2つは追加の反復試験が実施された際に見いだされ、3つめは低いHTGTSスコアを有し、これらの3つの部位が、より大きなCIRCLE−seq配列決定深度によって検出されるであろうことが示唆される。重要なことには、CIRCLE−seqはまた、HTGTSによって以前に同定されたよりもはるかにより多数のオフターゲット部位を見いだした(図3D)。
実施例4.ヒト細胞内でCIRCLE−seqによって同定されたオフターゲット部位の変異
本発明者らの実験によって提起された重要な疑問は、(GUIDE−seqまたはHTGTSではなく)CIRCLE−seqによって、生体外で同定された新規のオフターゲット切断部位が、実際にCas9/gRNA複合体によって細胞内で変異しているかどうかである。CIRCLE−seqとGUIDE−seqの双方で検出されたオフターゲット部位の多くが、高いCIRCLE−seq配列決定読み取り数を有することを考慮すると(図4A)、これはGUIDE−seqが、生体外で効率的に切断される部位を主に検出することを強く示唆する。対照的に、CIRCLE−seqのみによって見いだされるオフターゲット部位は、より低いCIRCLE−seq読み取り数を有し(図4A)、これらがより低い頻度で切断されるため、GUIDE−seqによって見逃される可能性があることが示唆される。これが正しいとすれば、本発明者らは、標準的な標的化アンプリコン配列決定法を用いて細胞内のこれらの部位を検証することは困難であると予測するが、これは、次世代配列決定法の誤り率がインデル変異検出の床(floor)を約0.1%にするからである。
CIRCLE−seqのみによって明らかにされた(しかし、本発明者らの元のGUIDE−seq実験では検出されなかった)新規のオフターゲット部位が、ヒト細胞内で切断されるかどうかを判定するために、本発明者らは、細胞ベースのGUIDE−seq実験から得られたゲノムDNAを使用して、オフターゲットCas9切断の証拠としての標識組み込みを探すことで、高深度の標的化アンプリコン配列決定を実施し得ると推論した(図4B)。このストラテジーは、ディープシーケンシングに伴うインデル誤り率の問題を回避するが、これは、標識組み込みが、無視できるバックグラウンド頻度で起こるからである。この標的化標識組み込み配列決定アプローチを用いて、本発明者らは、CIRCLE−seqによって見いだされた(しかしGUIDE−seqでは見いだされなかった)合計98のオフターゲット部位をSpCas9を用いて、EMX1およびVEGFA部位1gRNAについて調べた。本発明者らは、オンターゲット部位と比較して、一連のCIRCLE−seq読み取り数および/またはミスマッチ数を有する部位を選択した。標識組み込みアッセイの陽性対照として、本発明者らは、可変CIRCLE−seq読み取り数を示してCIRCLE−seqおよびGUIDE−seqの双方によって見いだされる、オフターゲット部位のより小さなセットもまた選択した。標的化アンプリコン配列決定法は、GUIDE−seq読み取り数と良好に相関する頻度で、対照オフターゲット部位の全てにおけるdsODN標識の検出を明らかにした(図4Cおよび4D)。注目すべきことに、本発明者らはまた、CIRCLE−seq〜によってのみ同定された98個の新しいオフターゲット部位のうち24個で、dsODNタグの組込みを予想どおりの低範囲(0.003〜0.2%)の頻度で検出した(図4C〜E)。これらの24個の標識組込みの位置は全て、プロトスペーサー相補性領域内の予測された位置にマッピングされ、これはPAM配列から3bp離れており、真正のオフターゲット切断部位に相当する部位に一致する(図4F)。
実施例5.CIRCLE−seqによって発見された参照ゲノム非依存性オフターゲット部位
単一DNA分子からのCIRCLE−seq読み取りの各対は、CRISPR−Cas9ヌクレアーゼ切断部位の両側からの配列をもたらすので、本発明者らは、この方法を用いて、参照ゲノム配列なしでもオフターゲット部位を同定し得ると推論した。この目的を達成するために、本発明者らは、エンドツーエンド方向で対末端の読み取りをマージしてオンターゲット部位と似ているオフターゲット切断部位を直接検索する、マッピング非依存性オフターゲット部位発見アルゴリズムを開発した(材料と方法を参照されたい)。このアルゴリズムを用いて、本発明者らは、平均で約99.5%のCIRCLE−seq部位を同定し、10個を超えるCIRCLE−seq読み取りが、本発明者らの標準的な参照ベースのマッピングアルゴリズムによって検出された(図4G)。この結果は、CIRCLE−seqを参照非依存様式で用いて、そのゲノム配列が良好に特性解析されておらず、および/または高い遺伝的変動性(例えば、野生の非同系交配種)を示す、生物のオフターゲット切断部位を同定し得ることを実証する。
実施例6.CIRCLE−seqオフターゲット部位とSNPとの関連性
CIRCLE−seqなどのインビトロ法は、スループットがより高く、再現性が容易であるため、任意の所与のCas9/gRNAヌクレアーゼに対して、患者特異的オフターゲットプロファイルを定義する機会を提供する。以前の研究は、オフターゲット切断に影響を及ぼすSNPの単一の例を同定したA36。遺伝的差異がヌクレアーゼ誘導オフターゲット切断に影響し得るかどうかをより広く試験するために、本発明者らは、ヒトHEK293ゲノムDNAおよびU2OSゲノムDNA上で本発明者らが既に評価した6つのgRNAを用いて、ヒトK562ゲノムDNA上で追加的なCIRCLE−seq実験を実施した(HEK293上の3つのgRNAおよびU2OS上の3つのgRNA)。これらのgRNAの多くのオフターゲット部位は、試験した双方の細胞型由来のDNA上で、相関するCIRCLE−seq読み取りカウントを示したが、本発明者らは、1つの細胞型または他の細胞型においてのみ優先的に切断される、55個の部位もまた観察した(図5A)。調査は、8個のオフターゲット切断部位が、非参照一塩基多型(SNP)を保有することを明らかにし、これが、切断効率における、これらの観察された細胞型特異的差異のいくつかを説明し得る(図5B)。興味深いことに、これらのSNPは、プロトスペーサー相補性領域内ならびにPAM内で観察されて、参照ゲノム配列と比較して、部位の切断を増加または減少させると予測された(図5B)。
SNPがオフターゲット部位で切断効率に影響を及ぼすように見える追加的な例を同定した後、本発明者らは次に、SNPがオフターゲット切断効率に影響を及ぼすと予測される頻度の推定を試みた。これを行うために、本発明者らは、本発明者らがCIRCLE−seqによって評価した6つのgRNA(標準的な非反復配列を標的化する)について本発明者らが検出した、1247個のオフターゲット部位の全てにおいて、1000人ゲノムプロジェクト37からの2504人の遺伝子型を試験した。本発明者らは、平均して、これらのオフターゲット部位の約2.5%で非参照遺伝的変異を見いだした(図5C)。集団レベルでは、本発明者らは、超母集団が、これらのオフターゲット部位の平均約20%で、遺伝的変異を含むことを見いだした(図5C)。さらに、これらのオフターゲット部位の50%は、1000人ゲノムプロジェクトにおいて配列決定された少なくとも1つの個々の非参照遺伝的変異を含んだ(図5C)。これらの頻度は、最新バージョンのdbSNP38に、約1億個の検証されたヒトSNPが存在すれば、ヒトゲノムのSpCas9オフターゲット部位の約69%にSNPが存在するという予想に一致する。予期されたように、1000人ゲノムプロジェクトの多様な個々の遺伝子型を考慮すると、本発明者らが調査したオフターゲット部位で観察されたミスマッチの範囲が増加する(図5D)。興味深いことに、オフターゲット部位ハプロタイプの約9%では、参照ゲノムと比較してミスマッチ数が減少し、これらの部位におけるオフターゲット切断リスクの潜在的増加が予測される(図5E)。総合すると、これらの結果は、オフターゲット分析に対する個々の遺伝的変異の重要性を強調し、個別化ゲノムワイドオフターゲットプロファイルを生成するために、CIRCLE−seqがどのように使用されるかを強調する。
実施例7.例示的CIRCLE−seqプロトコル
本明細書に記載されるのは、複合ゲノムDNA混合物からCRISPR/Cas9ヌクレアーゼの切断部位を見いだすための生体外アッセイのための例示的プロトコルである。
材料
プロトコル1では、以下の材料を使用した。
CIRCLE−seqヘアピンアダプター
oSQT1288 /5Phos/CGGTGGACCGATGATC/ideoxyU/ATCGGTCCACCG*
アニーリングプログラム:95℃で5分間、−1℃/分で70サイクル、4℃で保持する。
投入定量化および剪断
1.Covaris S2の標準操作プロトコルに従って、ゲノムDNAを300bpの平均長さに剪断する。
2.剪断されたDNAを、製造業者のプロトコルに従って1.8×Ampure XP SPRIビーズを用いて洗浄し、35μlの1×TE緩衝液で溶出する。
末端修復
2.1.7×SPRIクリーンアップ(120μlのAgencourt Ampure XPビーズ)、42μlの1×TE緩衝液で溶出する。
Aテーリング
2.1.8×SPRIクリーンアップ(90μlのPEG/NaCl SPRI溶液)、30μlの1×TE緩衝液中で溶出する。
アダプターライゲーション
2.1×SPRIクリーンアップ(50μlのPEG/NaCl SPRI溶液)、30μlの1×TE緩衝液中で溶出する。
酵素処理
λエキソヌクレアーゼ/エキソヌクレアーゼI(大腸菌(E.coli))処理
2.1.8×SPRIクリーンアップ(90μlのAgencourt Ampure XPビーズ)、40μlの1×TE緩衝液で溶出する。
USER/T4PNK処理
2.1.8×SPRIクリーンアップ(90μlのPEG/NaCl SPRI溶液)、35μlの1×TE緩衝液中で溶出する。
分子内環状化
2.1×SPRIクリーンアップ(100μlのAgencourt Ampure XPビーズ)、38μlの1×TE緩衝液で溶出する。
Plasmid−Safe ATP依存性DNase処理
2.1×SPRIクリーンアップ(50μlのAgencourt Ampure XPビーズ)、15μlの1×TE緩衝液で溶出する。
Cas9およびgRNAを用いた生体外消化
2.1×SPRIクリーンアップ(100μlのAgencourt Ampure XPビーズ)、42μlの1×TE緩衝液で溶出する。
Aテーリング
2.1.8×SPRIクリーンアップ(90μlのPEG/NaCl SPRI溶液)、30μlの1×TE緩衝液中で溶出する。
アダプターライゲーション
2.1×SPRIクリーンアップ(50μlのPEG/NaCl SPRI溶液)、47μlの1×TE緩衝液中で溶出する。
USER酵素処理
1.3μlのUSER酵素(1U/μl)をビーズと共に、(ステップ22からの)アダプターにライゲートされたDNAに添加する。
2.0.7×SPRIクリーンアップ(35μlのPEG/NaCl SPRI溶液)、20μlの1×TE緩衝液中で溶出する。
PCR
2.0.7×SPRIクリーンアップ(35μlのAgencourt Ampure XPビーズ)、30μlの1×TE緩衝液で溶出する。
ライブラリー定量化
1.製造会社の使用説明書に従って、QX200 Droplet Digital PCR装置上で、Illumina TruSeq(Bio−Rad)のためのddPCRライブラリー定量化キットを使用して、ライブラリーを定量化する。代案の定量法は、製造会社の使用説明に従って、次世代配列決定のためのKAPAライブラリー定量化キット(KAPA Biosystems)を使用する。
参考文献
1.Cong,L.et al.Multiplex genome engineering using CRISPR/Cas systems.Science 339,819−823(2013).
2.Hwang,W.Y.et al.Efficient genome editing in zebrafish using a CRISPR−Cas system.Nat Biotechnol 31,227−229(2013).
3.Jinek,M.et al.RNA−programmed genome editing in human cells | eLife.Elife 2,e00471(2013).
4.Mali,P.et al.RNA−guided human genome engineering via Cas9.Science 339,823−826(2013).
5.Jinek,M.et al.A Programmable Dual−RNA−Guided DNA Endonuclease in Adaptive Bacterial Immunity.Science 337,816−821(2012).
6.Doudna,J.A.& Charpentier,E.Genome editing.The new frontier of genome engineering with CRISPR−Cas9.Science 346,1258096(2014).
7.Bolukbasi,M.F.,Gupta,A.& Wolfe,S.A.Creating and evaluating accurate CRISPR−Cas9 scalpels for genomic surgery.Nat Meth 13,41−50(2016).
8.Mali,P.,Esvelt,K.M.& Church,G.M.Cas9 as a versatile tool for engineering biology.Nat Meth 10,957−963(2013).
9.Sander,J.D.& Joung,J.K.CRISPR−Cas systems for editing,regulating and targeting genomes.Nat Biotechnol 32,347−355(2014).
10.Maeder,M.L.& Gersbach,C.A.Genome−editing Technologies for Gene and Cell Therapy.Mol Ther 24,430−446(2016).
11.Lin,J.& Musunuru,K.Genome Engineering Tools for Building Cellular Models of Disease.FEBS J(2016).doi:10.1111/febs.13763
12.Hsu,P.D.,Lander,E.S.& Zhang,F.Development and applications of CRISPR−Cas9 for genome engineering.Cell 157,1262−1278(2014).
13.Brandsma,I.& Gent,D.C.Pathway choice in DNA double strand break repair:observations of a balancing act.Genome Integr 3,9(2012).
14.Symington,L.S.& Gautier,J.Double−strand break end resection and repair pathway choice.Annu.Rev.Genet.45,247−271(2011).
15.Kass,E.M.& Jasin,M.Collaboration and competition between DNA double−strand break repair pathways.FEBS Letters 584,3703−3708(2010).
16.Wyman,C.& Kanaar,R.DNA double−strand break repair:all’s well that ends well.Annu.Rev.Genet.40,363−383(2006).
17.Rouet,P.,Smih,F.& Jasin,M.Introduction of double−strand breaks into the genome of mouse cells by expression of a rare−cutting endonuclease.Mol Cell Biol 14,8096−8106(1994).
18.Sternberg,S.H.,LaFrance,B.,Kaplan,M.& Doudna,J.A.Conformational control of DNA target cleavage by CRISPR−Cas9.Nature 527,110−113(2015).
19.Kiani,S.et al.Cas9 gRNA engineering for genome editing,activation and repression.Nat Meth 1−6(2015).doi:10.1038/nmeth.3580
20.Dahlman,J.E.et al.Orthogonal gene knockout and activation with a catalytically active Cas9 nuclease.Nat Biotechnol 1−4(2015).doi:10.1038/nbt.3390
21.Fu,Y.,Sander,J.D.,Reyon,D.,Cascio,V.M.& Joung,J.K.Improving CRISPR−Cas nuclease specificity using truncated guide RNAs.Nat Biotechnol(2014).doi:10.1038/nbt.2808
22.Anders,C.,Niewoehner,O.,Duerst,A.& Jinek,M.Structural basis of PAM−dependent target DNA recognition by the Cas9 endonuclease.Nature(2014).doi:10.1038/nature13579
23.Shah,S.A.,Erdmann,S.,Mojica,F.J.M.& Garrett,R.A.Protospacer recognition motifs:mixed identities and functional diversity.RNA Biol 10,891−899(2013).
24.Tsai,S.Q.& Joung,J.K.Defining and improving the genome− wide specificities of CRISPR−Cas9 nucleases.Nature 17,300−312(2016).
25.Bolukbasi,M.F.,Gupta,A.& Wolfe,S.A.Creating and evaluating accurate CRISPR−Cas9 scalpels for genomic surgery.Nat Meth 13,41−50(2015).
26.Gori,J.L.et al.Delivery and Specificity of CRISPR−Cas9 Genome Editing Technologies for Human Gene Therapy.Hum Gene Ther 26,443−451(2015).
27.Cox,D.B.T.,Platt,R.J.& Zhang,F.Therapeutic genome editing:prospects and challenges.Nat Med 21,121−131(2015).
28.Gabriel,R.et al.An unbiased genome−wide analysis of zinc−finger nuclease specificity.Nat Biotechnol 29,816−823(2011).
29.Ran,F.A.et al.In vivo genome editing using Staphylococcus aureus Cas9.Nature 520,186−191(2015).
30.Tsai,S.Q.et al.GUIDE−seq enables genome−wide profiling of off−target cleavage by CRISPR−Cas nucleases.Nat Biotechnol 33,187−197(2015).
31.Frock,R.L.et al.Genome−wide detection of DNA double−stranded breaks induced by engineered nucleases.Nat Biotechnol 33,179−186(2015).
32.Crosetto,N.et al.Nucleotide−resolution DNA double−strand break mapping by next−generation sequencing.Nat Meth 10,361−365(2013).
33.Pattanayak,V.et al.High−throughput profiling of off−target DNA cleavage reveals RNA−programmed Cas9 nuclease specificity.Nat Biotechnol 31,839−843(2013).
34.Kim,D.et al.Digenome−seq:genome−wide profiling of CRISPR−Cas9 off−target effects in human cells.Nat Meth(2015).doi:10.1038/nmeth.3284
35.Kim,D.,Kim,S.,Kim,S.,Park,J.& Kim,J.−S.Genome−wide target specificities of CRISPR−Cas9 nucleases revealed by multiplex Digenome−seq.Genome Res gr.199588.115(2016).doi:10.1101/gr.199588.115
36.Yang,L.et al.Targeted and genome−wide sequencing reveal single nucleotide variations impacting specificity of Cas9 in human stem cells.Nature Communications 5,5507(2014).
37.1000 Genomes Project Consortium et al.A global reference for human genetic variation.Nature 526,68−74(2015).
38.Sherry,S.T.et al.dbSNP:the NCBI database of genetic variation.Nucleic Acids Res 29,308−311(2001).
39.ENCODE Project Consortium.An integrated encyclopedia of DNA elements in the human genome.Nature 489,57−74(2012).
40.Li,H.& Durbin,R.Fast and accurate long−read alignment with Burrows−Wheeler transform.Bioinformatics 26,589−595(2010).
41.Li,H.A statistical framework for SNP calling,mutation discovery,association mapping and population genetical parameter estimation from sequencing data.Bioinformatics 27,2987−2993(2011).
42.Li,H.et al.The Sequence Alignment/Map format and SAMtools.Bioinformatics 25,2078−2079(2009).
その他の実施形態
本発明は、その詳細な説明を参照して説明されているが、前述の説明は、添付の特許請求の範囲によって定義される本発明の範囲の例示を意図し、添付の特許請求の範囲によって定義される本発明の範囲を限定するものではないと理解される。その他の態様、利点、および修正は、以下の請求項の範囲内である。

Claims (20)

  1. 共有結合的に閉じた環状化二本鎖DNA(dsDNA)断片のライブラリーを作成する方法であって、
    dsDNAを含んでなるサンプルを提供するステップと;
    前記dsDNAを定義された平均長さまで無作為に剪断し、dsDNA断片の集団を提供するステップと;
    任意選択的に、末端ライゲーションのために前記断片を調製するステップと;
    回文配列を含んでなるループ配列に隣接するまたはその中にある、少なくとも1つのデオキシウリジンを含んでなる、ステムループアダプターを前記断片の末端にライゲートして、ライゲートされた直鎖dsDNA断片の集団を作成するステップと;
    前記ライゲートされた直鎖dsDNA断片の集団をエキソヌクレアーゼに接触させ、末端がライゲートされていないあらゆる残留直鎖断片を分解し、ライゲートされた直鎖dsDNA断片の精製集団を生成するステップと;
    前記ライゲートされた直鎖dsDNA断片の精製集団を、前記デオキシウリジンにおいて前記ライゲートされたdsDNA断片にニックを生じる酵素に接触させ、3’末端リン酸を除去するステップと;
    分子内ライゲーションおよび環状化dsDNA分子形成を促進するのに十分な条件下で、前記ニックの入った直鎖dsDNA断片をインキュベートするステップと;
    エキソヌクレアーゼを使用して、前記ライゲートされた環状化dsDNA断片を精製し、それによって共有結合的に閉じた完全環状化dsDNA断片のライブラリーを作成するステップと
    を含んでなる、方法。
  2. 前記共有結合的に閉じた完全環状化dsDNA断片のライブラリーを、遺伝子操作されたヌクレアーゼに接触させ、部位特異的切断を誘導するステップと;
    任意選択的に、末端ライゲーションのための切断断片を調製するステップと;
    前記切断部位において、少なくとも1つのデオキシウリジンを含んでなる配列決定アダプターを、PCRプライミングまたは配列決定法における使用に適合するプライマー部位にライゲートするステップと;
    前記ライブラリーを前記デオキシウリジンにおいてニックを生じる酵素に接触させるステップと;
    前記配列決定アダプターに結合するプライマーを使用して、得られた断片を配列決定するステップと
    をさらに含んでなる、請求項1に記載の方法。
  3. 二本鎖DNA(dsDNA)分子中の遺伝子操作されたヌクレアーゼ誘導二本鎖切断部位を含んでなる、断片のライブラリーを作成する方法であって、
    dsDNAを提供するステップと;
    前記dsDNAを規定の平均長さに無作為に剪断するステップと;
    任意選択的に、前記剪断されたdsDNAを末端修復および/またはAテーリングするステップと;
    ステムループアダプターをライゲートするステップであって、好ましくは、
    約12ヌクレオチドの第1の領域と、
    1つまたは複数のループを形成して分子内ライゲーションのための回文配列に隣接する、1つのデオキシウリジンヌクレオチドを含んでなる、好ましくは約5ヌクレオチドの第2の領域と、
    1つの追加的なヌクレオチドがある前記第1の領域に相補的な第3の領域と
    を含んでなる、ステップと;
    前記ライブラリーを前記デオキシウリジンにおいて前記dsDNAにニックを生じる酵素に接触させ、末端3’リン酸を除去するステップと;
    分子内ライゲーションおよび環状化dsDNA分子を含んでなるサンプル形成を促進するのに十分な条件下で、前記ニックの入ったdsDNAをインキュベートするステップと;
    前記サンプルを、環状でないあらゆるDNA分子を分解するのに十分な1つまたは複数のエキソヌクレアーゼに接触させるステップと;
    前記サンプルを遺伝子操作されたヌクレアーゼで処理し、部位特異的切断を誘導するステップと;
    任意選択的に、得られた末端を末端修復し、次にAテーリングするステップと;
    配列決定アダプターであって、
    約12ヌクレオチドの第1の領域と、
    1つまたは複数のヘアピンループプライマー部位を形成してPCRプライミングおよび/または配列決定法における使用に適合するプライマー部位を含んでなる、約40ヌクレオチドの第2の領域と、
    1つの追加的なヌクレオチドがある前記第1の領域に相補的な約13ヌクレオチドの第3の領域と、
    前記第2および第3の領域の間の1つのデオキシウリジンヌクレオチドと
    を含んでなる配列決定アダプターをライゲートするステップであって、ヌクレアーゼによって切断された前記DNA断片が、末端にライゲートされた配列決定アダプターを有する、集団を生成するステップと;
    それによってヌクレアーゼ切断アダプターにライゲートされた断片が濃縮されたライブラリーを作成するステップと
    を含んでなる、方法。
  4. 前記dsDNAを無作為に剪断するステップが、前記dsDNAを約200〜500bp、好ましくは約300bpの平均長さに無作為に剪断するステップを含んでなる、請求項1〜3のいずれか一項に記載の方法。
  5. 末端がライゲートされていないあらゆる残留直鎖断片を分解するのに使用される前記エキソヌクレアーゼが、バクテリオファージλエキソヌクレアーゼ、大腸菌(E.coli)エキソヌクレアーゼI、およびATP依存性エキソヌクレアーゼの1つまたは複数を含んでなるヌクレアーゼの混合物である、請求項1〜3のいずれか一項に記載の方法。
  6. 末端ライゲーションのために前記断片を調製するステップが、前記剪断されたDNAの末端修復および/またはAテーリングの片方または双方を含んでなる、請求項1〜3のいずれか一項に記載の方法。
  7. 前記デオキシウリジンにおいてDNAにニックを生じる酵素が、ウラシルDNAグリコシラーゼ(UDG)および/またはエンドヌクレアーゼVIIIの片方または双方を含んでなり、前記末端3’リン酸を除去する前記酵素が、T4ポリヌクレオチドキナーゼを含んでなる、請求項1〜3のいずれか一項に記載の方法。
  8. 前記DNAがゲノムDNA(gDNA)または合成DNAである、請求項1〜3のいずれか一項に記載の方法。
  9. 前記遺伝子操作されたヌクレアーゼが、オンおよび/またはオフターゲット部位を切断する、請求項2または3に記載の方法。
  10. 前記遺伝子操作されたヌクレアーゼが、平滑型またはねじれ型/オーバーハング末端を誘導する、請求項2または3に記載の方法。
  11. 前記ライブラリーを酵素に接触させて、前記配列決定アダプター中の前記デオキシウリジンにおいてニックを生じさせるステップと;
    任意選択的にPCR増幅を用いて、アダプターにライゲートされた断片を濃縮し、完全配列決定アダプターに追加するステップと;
    配列決定アダプターを保有する断片を配列決定するステップと
    をさらに含んでなる、請求項3に記載の方法。
  12. 前記DNAにニックを生じる前記酵素が、ウラシルDNAグリコシラーゼ(UDG)および/またはエンドヌクレアーゼVIIIを含んでなる、請求項11に記載の方法。
  13. 前記遺伝子操作されたヌクレアーゼが、メガヌクレアーゼ、MegaTAL、ジンクフィンガーヌクレアーゼ、転写アクチベーターエフェクター様ヌクレアーゼ(TALEN)、規則的な間隔をもってクラスター化された短鎖反復回文配列(CRISPR)/Cas RNA誘導されるヌクレアーゼ(CRISPR/Cas RGN)、およびFokI−dCas9融合タンパク質からなる群から選択される、請求項2または3に記載の方法。
  14. 前記CRISPR/Cas RGNがCas9またはCpf1である、請求項13に記載の方法。
  15. 前記サンプルを遺伝子操作されたヌクレアーゼで処理して部位特異的切断を誘導するステップが、前記サンプルを特異的ガイドRNA(gRNA)と複合体形成するCas9ヌクレアーゼに接触させるステップを含んでなる、請求項2または3に記載の方法。
  16. 前記遺伝子操作されたヌクレアーゼがCas9ヌクレアーゼであり、前記方法が、前記Cas9ヌクレアーゼを前記ゲノム中の標的配列に誘導するガイドRNAを使用するステップもまた含む、請求項15に記載の方法。
  17. 前記プライマー部位が、次世代配列決定プライマー結合配列、無作為化されたDNAバーコードまたは固有の分子識別子(UMI)を含んでなる、請求項2または3に記載の方法。
  18. 前記断片が、末端ライゲーションのために調製される、請求項1に記載の方法。
  19. 前記切断断片が、末端ライゲーションのために調製される、請求項2に記載の方法。
  20. 前記得られた末端を末端修復して、次にAテーリングするステップをさらに含んでなる、請求項3に記載の方法。
JP2018516489A 2015-09-30 2016-09-30 配列決定法による切断事象の包括的生体外報告(CIRCLE−seq) Pending JP2018529353A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562235154P 2015-09-30 2015-09-30
US62/235,154 2015-09-30
PCT/US2016/054912 WO2017059313A1 (en) 2015-09-30 2016-09-30 Comprehensive in vitro reporting of cleavage events by sequencing (circle-seq)

Publications (1)

Publication Number Publication Date
JP2018529353A true JP2018529353A (ja) 2018-10-11

Family

ID=58408546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018516489A Pending JP2018529353A (ja) 2015-09-30 2016-09-30 配列決定法による切断事象の包括的生体外報告(CIRCLE−seq)

Country Status (7)

Country Link
US (2) US9850484B2 (ja)
EP (1) EP3356526B1 (ja)
JP (1) JP2018529353A (ja)
KR (1) KR20180053748A (ja)
AU (1) AU2016331185A1 (ja)
CA (1) CA3000762A1 (ja)
WO (1) WO2017059313A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018530536A (ja) 2015-09-11 2018-10-18 ザ ジェネラル ホスピタル コーポレイション ヌクレアーゼDSBの完全照合およびシーケンシング(FIND−seq)
WO2018035062A1 (en) * 2016-08-16 2018-02-22 The Regents Of The University Of California Method for finding low abundance sequences by hybridization (flash)
ES2889585T3 (es) * 2017-04-23 2022-01-12 Illumina Cambridge Ltd Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas
AU2018259206A1 (en) 2017-04-23 2019-11-07 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
DK3872187T3 (da) 2017-04-23 2022-12-05 Illumina Cambridge Ltd Sammensætninger og fremgangsmåder til forbedring af prøveidentificering i indekserede nukleinsyrebiblioteker
DK3615691T3 (da) 2017-04-23 2021-07-26 Illumina Inc Sammensætninger og fremgangsmåder til forbedring af prøveidentifikation i indekserede nukleinsyrebiblioteker
WO2018217912A1 (en) * 2017-05-23 2018-11-29 President And Fellows Of Harvard College Multiplex end-tagging amplification of nucleic acids
CN108823202A (zh) * 2017-06-15 2018-11-16 中山大学 用于特异性修复人hbb基因突变的碱基编辑系统、方法、试剂盒及其应用
CN109136272A (zh) * 2017-06-15 2019-01-04 中山大学 用于特异性修复人hbb基因突变的碱基编辑系统、方法、试剂盒及其在人生殖系中的应用
US11286468B2 (en) 2017-08-23 2022-03-29 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases with altered PAM specificity
WO2019075197A1 (en) 2017-10-11 2019-04-18 The General Hospital Corporation METHODS OF DETECTION OF INDIVIDUAL SITE-SPECIFIC PARASITE GENOMIC DEAMINATION BY BASE EDITING TECHNOLOGIES
CN112313241A (zh) 2018-04-17 2021-02-02 总医院公司 核酸结合、修饰、和切割试剂的底物偏好和位点的灵敏体外试验
WO2019217785A1 (en) 2018-05-10 2019-11-14 St. Jude Children's Research Hospital, Inc. High-throughput method for characterizing the genome-wide activity of editing nucleases in vitro
CN108753922A (zh) * 2018-06-04 2018-11-06 广州微芯生物科技有限公司 一种构建转录组测序文库的方法及相应的接头序列和试剂盒
CN108753923A (zh) * 2018-06-04 2018-11-06 广州微芯生物科技有限公司 一种构建甲基化测序文库的方法及相应的接头序列和试剂盒
EP3884064A4 (en) * 2018-11-19 2022-08-10 The Regents of The University of California METHODS FOR DETECTING AND SEQUENCING A TARGET NUCLEIC ACID
WO2020264220A1 (en) * 2019-06-25 2020-12-30 The Translational Genomics Research Institute Detection and treatment of residual disease using circulating tumor dna analysis
WO2021007177A1 (en) * 2019-07-08 2021-01-14 The Regents Of The University Of California Variant type v crispr/cas effector polypeptides and methods of use thereof
DK3812472T3 (da) 2019-10-21 2023-02-20 Univ Freiburg Albert Ludwigs Virkelig uvildig in vitro-undersøgelse til profilering af off-target-aktivitet af en eller flere målspecifikke programmerbare nukleaser i celler (abnoba-seq)
CN111893170B (zh) * 2020-08-07 2022-08-19 珠海舒桐医疗科技有限公司 一种在全基因组范围内体外检测CRISPR-Cas脱靶效应的方法
CN111979226B (zh) * 2020-09-01 2022-11-08 广州鼓润医疗科技有限公司 一种可批量进行体外脱靶检测及sgRNA筛选的方法
EP4365303A1 (en) * 2022-11-02 2024-05-08 4basebio, S.L.U. Purification of linear dna products
WO2024094793A1 (en) * 2022-11-02 2024-05-10 4Basebio, S.L.U. Purification of linear dna products

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3102800B2 (ja) 1994-08-19 2000-10-23 パーキン−エルマー コーポレイション 増幅及び連結反応の共役法
USRE45721E1 (en) 1994-08-20 2015-10-06 Gendaq, Ltd. Relating to binding proteins for recognition of DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6503717B2 (en) 1999-12-06 2003-01-07 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7501245B2 (en) 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
WO2001023610A2 (en) 1999-09-29 2001-04-05 Solexa Ltd. Polynucleotide sequencing
US6511808B2 (en) 2000-04-28 2003-01-28 Sangamo Biosciences, Inc. Methods for designing exogenous regulatory molecules
DE60131194T2 (de) 2000-07-07 2008-08-07 Visigen Biotechnologies, Inc., Bellaire Sequenzbestimmung in echtzeit
AU2003304086A1 (en) 2002-10-23 2004-11-26 Massachussetts Institute Of Technlogy Context sensitive parallel optimization of zinc finger dna binding domains
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
CA2902980A1 (en) 2004-03-08 2005-09-29 Rubicon Genomics, Inc. Methods and compositions for generating and amplifying dna libraries for sensitive detection and analysis of dna methylation
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
AU2005296200B2 (en) 2004-09-17 2011-07-14 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
DK1924704T3 (da) 2005-08-02 2011-09-05 Rubicon Genomics Inc Sammensætninger og fremgangsmåder til bearbejdning og mangfoldiggørelse af DNA, herunder ved anvendelse af flere enzymer i en enkelt reaktion
ES2398918T3 (es) 2005-08-26 2013-03-22 Dupont Nutrition Biosciences Aps Un método y una ordenación para soportar verticalmente elementos de resistencia eléctrica pendientes
BRPI0618473A2 (pt) 2005-11-11 2011-08-30 Pfizer combinações e métodos de uso de um oligodeoxinucleotìdeo imunomodulador
US7282337B1 (en) 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
ES2719789T3 (es) 2007-03-02 2019-07-16 Dupont Nutrition Biosci Aps Cultivos con resistencia mejorada a fagos
WO2009027978A1 (en) 2007-08-30 2009-03-05 Hadasit Medical Research Services & Development Ltd. NUCLEIC ACID SEQUENCES COMPRISING NF-ϰB BINDING SITE WITHIN O(6)-METHYLGUANINE-DNA-METHYLTRANSFERASE (MGMT) PROMOTER REGION AND USES THEREOF FOR THE TREATMENT OF CANCER AND IMMUNE-RELATED DISORDERS
WO2009133466A2 (en) 2008-04-30 2009-11-05 Population Genetics Technologies Ltd. Asymmetric adapter library construction
WO2010011961A2 (en) 2008-07-25 2010-01-28 University Of Georgia Research Foundation, Inc. Prokaryotic rnai-like system and methods of use
WO2010021580A1 (en) 2008-08-19 2010-02-25 Telefonaktiebolaget L M Ericsson (Publ) Harq process continuation after cqi-only report
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
CN102264895B (zh) 2008-12-12 2015-01-28 杜邦营养生物科学有限公司 用于乳品发酵的具有独特流变性质的嗜热链球菌菌株的遗传簇
US20120178647A1 (en) 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
JP5387839B2 (ja) 2009-09-04 2014-01-15 アイシン・エィ・ダブリュ株式会社 ナビゲーション装置、ナビゲーション方法、及びナビゲーションプログラム
US9023769B2 (en) * 2009-11-30 2015-05-05 Complete Genomics, Inc. cDNA library for nucleic acid sequencing
WO2011086118A1 (en) 2010-01-14 2011-07-21 Deutsches Krebsforschungszentrum In vivo determination of the lokalization of dna double-stand breaks and application thereof
WO2011100058A1 (en) 2010-02-09 2011-08-18 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
US10087431B2 (en) 2010-03-10 2018-10-02 The Regents Of The University Of California Methods of generating nucleic acid fragments
EP2566985A4 (en) 2010-05-06 2014-08-06 Ibis Biosciences Inc INTEGRATED SAMPLE PREPARATION SYSTEMS AND MIXTURES OF STABILIZED ENZYMES
MX2012013037A (es) 2010-05-10 2013-07-29 Univ California Composiciones de endorribonucleasa y metodos de uso de las mismas.
AU2011325956B2 (en) 2010-11-12 2016-07-14 The General Hospital Corporation Polycomb-associated non-coding RNAs
WO2012164565A1 (en) 2011-06-01 2012-12-06 Yeda Research And Development Co. Ltd. Compositions and methods for downregulating prokaryotic genes
WO2013078470A2 (en) 2011-11-22 2013-05-30 MOTIF, Active Multiplex isolation of protein-associated nucleic acids
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US9528107B2 (en) 2012-01-31 2016-12-27 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
US9487828B2 (en) 2012-05-10 2016-11-08 The General Hospital Corporation Methods for determining a nucleotide sequence contiguous to a known target nucleotide sequence
DE202013012242U1 (de) 2012-05-25 2016-02-02 Emmanuelle Charpentier Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription
US20140024542A1 (en) 2012-07-17 2014-01-23 Counsyl, Inc. Methods and compositions for enrichment of target polynucleotides
US10155941B2 (en) 2012-08-01 2018-12-18 Bernhard Suter High throughput yeast two-hybrid screening method and reagent kit
US20150197787A1 (en) 2012-08-02 2015-07-16 Qiagen Gmbh Recombinase mediated targeted dna enrichment for next generation sequencing
SG10201707569YA (en) 2012-12-12 2017-10-30 Broad Inst Inc Delivery, Engineering and Optimization of Systems, Methods and Compositions for Sequence Manipulation and Therapeutic Applications
WO2014093701A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
JP6552965B2 (ja) 2012-12-12 2019-07-31 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のための改善された系、方法および酵素組成物のエンジニアリングおよび最適化
US20140186843A1 (en) 2012-12-12 2014-07-03 Massachusetts Institute Of Technology Methods, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
MX2015007549A (es) 2012-12-12 2017-01-20 Broad Inst Inc Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias.
PL2931898T3 (pl) 2012-12-12 2016-09-30 Le Cong Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi
US20140189896A1 (en) 2012-12-12 2014-07-03 Feng Zhang Crispr-cas component systems, methods and compositions for sequence manipulation
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
RU2678001C2 (ru) 2012-12-13 2019-01-22 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Способы обнаружения днк для сайт-специфической нуклеазной активности
CN105142396A (zh) 2013-01-14 2015-12-09 重组股份有限公司 缺角家畜
US20140212869A1 (en) 2013-01-25 2014-07-31 Agilent Technologies, Inc. Nucleic Acid Proximity Assay Involving the Formation of a Three-way junction
EP2958996B1 (en) 2013-02-25 2019-10-16 Sangamo Therapeutics, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
WO2014150624A1 (en) 2013-03-14 2014-09-25 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
KR102210319B1 (ko) 2013-03-15 2021-02-01 더 제너럴 하스피탈 코포레이션 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
US20140349400A1 (en) 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
WO2014204578A1 (en) 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
CN105263312A (zh) 2013-04-05 2016-01-20 美国陶氏益农公司 用于在植物基因组内整合外源序列的方法和组合物
HUE040575T2 (hu) 2013-04-16 2019-03-28 Regeneron Pharma A patkány genom célzott módosítása
US10604771B2 (en) 2013-05-10 2020-03-31 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
WO2015010114A1 (en) 2013-07-19 2015-01-22 Larix Bioscience, Llc Methods and compositions for producing double allele knock outs
ES2888976T3 (es) 2014-06-23 2022-01-10 Massachusetts Gen Hospital Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.)
EP3858990A1 (en) 2015-03-03 2021-08-04 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
WO2017040348A1 (en) 2015-08-28 2017-03-09 The General Hospital Corporation Engineered crispr-cas9 nucleases

Also Published As

Publication number Publication date
US20170088833A1 (en) 2017-03-30
WO2017059313A1 (en) 2017-04-06
US9850484B2 (en) 2017-12-26
CA3000762A1 (en) 2017-04-06
EP3356526A4 (en) 2019-03-20
AU2016331185A1 (en) 2018-04-26
KR20180053748A (ko) 2018-05-23
US20180245071A1 (en) 2018-08-30
EP3356526A1 (en) 2018-08-08
EP3356526B1 (en) 2021-08-25
US10738303B2 (en) 2020-08-11

Similar Documents

Publication Publication Date Title
US10738303B2 (en) Comprehensive in vitro reporting of cleavage events by sequencing (CIRCLE-seq)
AU2021212165B2 (en) Genomewide unbiased identification of dsbs evaluated by sequencing (guide-seq)
US11028429B2 (en) Full interrogation of nuclease DSBs and sequencing (FIND-seq)
EP3812472B1 (en) A truly unbiased in vitro assay to profile off-target activity of one or more target-specific programmable nucleases in cells (abnoba-seq)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200721

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210309