JP2017519508A - シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE−Seq) - Google Patents

シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE−Seq) Download PDF

Info

Publication number
JP2017519508A
JP2017519508A JP2016575174A JP2016575174A JP2017519508A JP 2017519508 A JP2017519508 A JP 2017519508A JP 2016575174 A JP2016575174 A JP 2016575174A JP 2016575174 A JP2016575174 A JP 2016575174A JP 2017519508 A JP2017519508 A JP 2017519508A
Authority
JP
Japan
Prior art keywords
dsodn
cells
cell
genomic dna
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016575174A
Other languages
English (en)
Other versions
JP6784601B2 (ja
Inventor
キース ジョン,ジェイ.
キース ジョン,ジェイ.
ツァイ,シェンダー
Original Assignee
ザ ジェネラル ホスピタル コーポレイション
ザ ジェネラル ホスピタル コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ ジェネラル ホスピタル コーポレイション, ザ ジェネラル ホスピタル コーポレイション filed Critical ザ ジェネラル ホスピタル コーポレイション
Publication of JP2017519508A publication Critical patent/JP2017519508A/ja
Application granted granted Critical
Publication of JP6784601B2 publication Critical patent/JP6784601B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/113Modifications characterised by incorporating modified backbone
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/204Modifications characterised by specific length of the oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

改変ヌクレアーゼによって誘発される変異、例えば、オフターゲット変異を検出するための、バイアスのないゲノムワイドかつ高感度な方法。

Description

優先権の主張
本出願は、2014/06/23に出願された、米国仮特許出願第62/015,911号明細書;2014/11/10に出願された、第62/077,844号明細書;2014/11/12に出願された、第62/078,923号明細書;および2014/12/5に出願された、第62/088,223号明細書の利益を主張する。前述のものの全内容は、参照により本明細書によって組み込まれている。
連邦政府による資金提供を受けた研究または開発
本発明は、National Institutes of Healthによって与えられた助成金第DP1GM105378号の下で、政府の支援を受けて行われた。政府は、本発明において一定の権利を有する。
技術分野
生細胞において改変ヌクレアーゼの切断部位の位置を同定するための、高感度なバイアスのないゲノムワイドな方法が提供される。
ヒトの薬の長い間保持されてきた目標は、遺伝性の遺伝疾患を治療することである。ゲノム編集は、疾患を治癒させるまたは予防するために内在性遺伝子内の変異を直接に修正するという強力な概念を包含する。このアプローチの新しい例は、HIVのコレセプターである、CCR5を破壊するように改変されたジンクフィンガーヌクレアーゼ(ZFN)治療薬の臨床試験である(1)。このex vivo自己細胞療法アプローチは、CCR5におけるホモ変異を有する個体からの骨髄細胞を移植された「ベルリンの患者」、Timothy BrownにおけるHIVの治癒の成功を再現することを試みるものである。もう1つの最近の例は、6ヶ月齢の対象に由来する造血幹細胞におけるZFNでの遺伝子ターゲティングによるX連鎖重症複合免疫不全症の修正である(2)。
以下の4つの主なクラスの改変ヌクレアーゼがある:1)メガヌクレアーゼ、2)ジンクフィンガーヌクレアーゼ、3)転写活性化因子エフェクター様ヌクレアーゼ(TALEN)、および4)クラスター化された規則的な間隔の短鎖反復回文配列(CRISPR)Cas RNA誘導型ヌクレアーゼ(RGN)。
しかし、これらの新しい治療および研究のツールの採用は、それらの特異性の実証に依存しうる。ヒトおよび他の真核細胞におけるオフターゲット作用を理解および同定することは、これらのヌクレアーゼが研究および治療的適用のために広範に使用される場合には決定的に不可欠であろう。
GUIDE−Seqは、改変ヌクレアーゼによって誘発される変異、例えば、オフターゲット変異を検出するための、バイアスのないゲノムワイドかつ高感度な方法を可能にする。したがって、該方法は、哺乳動物生細胞においてゲノムワイドな規模で変異を評価するための最も包括的でバイアスのない方法を可能にする。該方法は、ヌクレアーゼで誘発されたDSBの中にdsODNが効率良く捕捉されうるいかなる細胞型において利用されてもよい。
したがって、一態様では、本発明は、細胞のゲノムDNA内の、二本鎖切断(DSB)、例えば、外来性の改変ヌクレアーゼによって誘発された、例えば、オフターゲットDSBを検出するための方法を提供する。該方法は、細胞を二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであって、好ましくは、dsODNが15および75ntの間の長さ、例えば、15〜50nt、50〜75nt、30〜35nt、60〜65nt、または50〜65ntの長さであり、dsODNの両鎖が細胞のゲノムにオルソロガスであり、好ましくは、dsODNの5’末端がリン酸化されており、さらにまた好ましくは、ホスホロチオエート結合が両方の3’末端に存在する、または2つのホスホロチオエート結合が両方の3’末端および両方の5’末端に存在する、ステップ、
細胞内で外来性の改変ヌクレアーゼを、ヌクレアーゼが細胞のゲノムDNA内にDSBを誘発するのに十分な時間、かつ細胞がDSBを修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化させるステップ、
組み込まれたdsODNを含むゲノムDNAの一部を増幅するステップ、および
ゲノムDNAの増幅された部分をシークエンスするステップ
を含み、それによって細胞のゲノムDNA内のDSBを検出する。
一部の実施形態では、ゲノムDNAの一部を増幅するステップは、
例えば切断によって、DNAを断片化すること、
細胞からの断片化されたゲノムDNAの末端をユニバーサルアダプターでライゲーションすること、
組み込まれたdsODNと相補的なプライマー(プライマーA)およびユニバーサルアダプターと相補的なプライマー(プライマーB)を用いて、ライゲーションされたDNAに対して1回目のポリメラーゼ連鎖反応(PCR)を行うこと、
次いで、プライマーAと相補的な3’ネステッドプライマー(プライマーC)、プライマーBと相補的な3’ネステッドプライマー(プライマーD)、およびプライマーDと相補的なプライマー(プライマーE)を使用して2回目のPCRを行うこと
を含む。一部の実施形態では、プライマーEは、
精製または結合配列、例えば、フローセル結合配列、および
同定配列、例えば、バーコードまたは無作為の分子インデックス
のうちの1つまたは複数を含む。
一部の実施形態では、改変ヌクレアーゼは、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ、転写活性化因子エフェクター様ヌクレアーゼ(TALEN)、およびクラスター化された規則的な間隔の短鎖反復回文配列(CRISPR)/Cas RNA誘導型ヌクレアーゼ(CRISPR/Cas RGN)からなる群から選択される。
別の態様では、本発明は、複数のガイドRNAのうちのいずれが最も特異的であるか、すなわち、最も少ないオフターゲットDSBを誘発するかを決定するための方法を提供する。該方法は、第1の細胞の集団を第1のガイドRNAおよび二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであって、好ましくは、dsODNが15および75ntの間の長さ、例えば、15〜50nt、50〜75nt、60〜65nt、30〜35ntまたは50〜65ntの長さであり、dsODNの両鎖が細胞のゲノムにオルソロガスであり、好ましくは、dsODNの5’末端がリン酸化されており、さらにまた好ましくは、ホスホロチオエート結合が両方の3’末端に存在する、または2つのホスホロチオエート結合が両方の3’末端および両方の5’末端に存在する、ステップ、
第1の細胞の集団内で外来性のCas9改変ヌクレアーゼを、ヌクレアーゼが細胞のゲノムDNA内にDSBを誘発するのに十分な時間、かつ細胞がDSBを修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化させるステップ、
組み込まれたdsODNを含む、第1の細胞の集団からのゲノムDNAの一部を増幅するステップ、および
第1の細胞の集団からのゲノムDNAの増幅された部分をシークエンスするステップ、
dsODNが第1の細胞の集団のゲノムDNA内に組み込まれた部位の数を決定するステップ、
第2の細胞の集団を第2のガイドRNAおよび二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであって、好ましくは、dsODNが15および75ntの間の長さ、例えば、15〜50nt、50〜75nt、30〜35nt、60〜65nt、または50〜65ntの長さであり、dsODNの両鎖が細胞のゲノムにオルソロガスであり、好ましくは、dsODNの5’末端がリン酸化されており、さらにまた好ましくは、2つのホスホロチオエート結合が両方の3’末端および両方の5’末端に存在する、ステップ、
第2の細胞の集団内で外来性のCas9改変ヌクレアーゼを、ヌクレアーゼが第2の細胞の集団のゲノムDNA内にDSBを誘発するのに十分な時間、細胞がDSBを修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化させるステップ、
組み込まれたdsODNを含む、第2の細胞の集団からのゲノムDNAの一部を増幅するステップ、および
第2の細胞の集団からのゲノムDNAの増幅された部分をシークエンスするステップ、
dsODNが第2の細胞の集団のゲノムDNA内に組み込まれた部位の数を決定するステップ、
dsODNが第1の細胞の集団のゲノムDNA内に組み込まれた部位の数を、dsODNが第2の細胞の集団のゲノムDNA内に組み込まれた部位の数と比較するステップ
を含み、より少ない(オフターゲット)部位で組み込まれたdsODNがより特異的である。該方法は、第3、第4、第5、第6、またはそれより多種の細胞の集団について繰り返されてもよい。「より少ない」オフターゲット部位とは、より少ない数のDSB部位および/または(1つまたは複数の)個別の部位におけるDSBの発生の頻度の低下の両方を含みうる。
本明細書においてさらに、本明細書に記載の末端保護されたdsODNの使用によって目的の短鎖dsDNAをDSBの部位の中に効率良く組み込むための方法が提供される。
一部の実施形態では、細胞は、哺乳動物細胞である。
一部の実施形態では、改変ヌクレアーゼはCas9ヌクレアーゼであり、方法は、Cas9ヌクレアーゼをゲノム内の標的配列に導くガイドRNA、例えば、単一のガイドまたはtracrRNA/crRNA対を細胞内で発現させるステップも含む。
一部の実施形態では、dsODNはビオチン化され、例えば、共有結合でdsODNに付加されたビオチンを含む、かつ/または無作為化されたDNAバーコードまたはCreもしくはLox部位を含む。dsODNがビオチン化される、上記の請求項のいずれかの方法。
一部の実施形態では、本明細書に記載の方法は、ゲノムgDNAを断片に切断するステップ、およびdsODNを含む断片をビオチンへの結合によって単離するステップを含む。
一部の実施形態では、dsODNは、平滑末端であるまたは5’末端に1、2、3、もしくは4ntのオーバーハンギングを有する、5’末端でリン酸化されている、および/または3’末端でホスホロチオエート化されている。
一部の実施形態では、dsODNは、平滑末端であり、5’末端でリン酸化されており、3’末端でホスホロチオエート化されている。
一部の実施形態では、dsODNは、無作為化されたDNAバーコード、Lox認識部位、制限酵素認識部位、および/またはタグ配列を含む。
一部の実施形態では、方法は、ゲノムgDNAを断片に切断するステップ、および断片を、末端修復/aテーリング/シークエンシングアダプター、例えば、単一テールのシークエンシングアダプターのライゲーションによってシークエンシング、例えば、ハイスループットシークエンシング用に調製するステップを含む。
一部の実施形態では、DSBは、(例えば、脆弱な部位での)バックグラウンドのゲノムのDSBまたは鍵となる細胞タンパク質の小分子阻害因子によって引き起こされるDSBである。
他に定めがない限り、本明細書中で使用されるすべての技術的および科学的な用語は、本発明が属する当技術分野の当業者によって一般的に理解されるのと同じ意味を有する。方法および材料は、本発明における使用のために本明細書に記載されている;他の、当技術分野において知られている好適な方法および材料も使用されうる。材料、方法、および例は、単に例示的なものであって限定することを意図するものではない。本明細書中で言及されているすべての刊行物、特許出願、特許、配列、データベースエントリー、および他の参照は、参照によりその全体が組み込まれている。矛盾する場合には、定義を含めて、本明細書が優先されることになる。
本発明の他の特徴および利点は、以下の発明を実施するための形態および図面から、ならびに特許請求の範囲から明らかであろう。
図1A−B.CRISPR−Casヌクレアーゼを介したdsODN捕捉の最適化を示した図である。(a)使用される短鎖オリゴヌクレオチドタグの配列が示されている。使用されるすべてのオリゴヌクレオチドは、5’リン酸化される。タグオリゴヌクレオチドは、RFLPによる組み込み頻度の評価を可能にする診断用のNdeI制限部位も含む。(b)下のグラフは、RFLPによる短鎖dsODNの組み込み(%)を示す。5’および3’ホスホロチオエート結合の両方を有するdsODN(各セットにおける左側のバー)についての組み込み率が、5’ホスホロチオエート結合のみを有するdsODN(各セットにおける中央のバー)およびdsODNなしの対照(各セットにおける右側のバー)と比較される。 図2A.VEGF部位1についての組み込みの特徴付けを示した図である。(a)RFLPアッセイは、VEGF部位1について示されており、Qiaxcelキャピラリー電気泳動機器上で解析されるように、NdeI制限部位を有するdsODNの好結果の組み込みを実証している。 図2B.VEGF部位1についての組み込みの特徴付けを示した図である。(b)サンガーシークエンシングデータは、目的のVEGF部位1標的部位でのdsODN組み込みについて示されている。dsODN配列は、灰色で強調されている。VEGFA部位1を標的としたガイドRNA/Cas9複合体によって認識される部位は太字で、隣接したプロトスペーサー隣接モチーフ(PAM)配列は下線で強調されている。この部位でCas9によって誘発される、予想される二本鎖切断の位置は、小さな黒色の矢印で示されている。 例示的なGUIDE−seq法の概要を示した図である。 図4A.1GUIDE−Seq法によって発見されたCRISPR−Casオフターゲット切断部位を示した図である。データは、4つの部位、VEGF部位1〜3、およびEMX1について示されている。標的部位配列に対するミスマッチが強調されている。小さな中実の黒色の矢印は、目的のオンターゲット部位を示すために使用されているのに対して、小さな破線の矢印は、以前の研究(Fu et al., 2013)において検出されていた既知のオフターゲット部位に印をつけるために使用されている。 図4B.GUIDE−Seq法によって発見されたCRISPR−Casオフターゲット切断部位を示した図である。データは、4つの部位、VEGF部位1〜3、およびEMX1について示されている。標的部位配列に対するミスマッチが強調されている。小さな中実の黒色の矢印は、目的のオンターゲット部位を示すために使用されているのに対して、小さな破線の矢印は、以前の研究(Fu et al., 2013)において検出されていた既知のオフターゲット部位に印をつけるために使用されている。 図4C.GUIDE−Seq法によって発見されたCRISPR−Casオフターゲット切断部位を示した図である。データは、4つの部位、VEGF部位1〜3、およびEMX1について示されている。標的部位配列に対するミスマッチが強調されている。小さな中実の黒色の矢印は、目的のオンターゲット部位を示すために使用されているのに対して、小さな破線の矢印は、以前の研究(Fu et al., 2013)において検出されていた既知のオフターゲット部位に印をつけるために使用されている。 図4D.GUIDE−Seq法によって発見されたCRISPR−Casオフターゲット切断部位を示した図である。データは、4つの部位、VEGF部位1〜3、およびEMX1について示されている。標的部位配列に対するミスマッチが強調されている。小さな中実の黒色の矢印は、目的のオンターゲット部位を示すために使用されているのに対して、小さな破線の矢印は、以前の研究(Fu et al., 2013)において検出されていた既知のオフターゲット部位に印をつけるために使用されている。 図4E.GUIDE−Seq法によって発見されたCRISPR−Casオフターゲット切断部位を示した図である。データは、4つの部位、VEGF部位1〜3、およびEMX1について示されている。標的部位配列に対するミスマッチが強調されている。小さな中実の黒色の矢印は、目的のオンターゲット部位を示すために使用されているのに対して、小さな破線の矢印は、以前の研究(Fu et al., 2013)において検出されていた既知のオフターゲット部位に印をつけるために使用されている。 図5A−B.例示的なGUIDE−Seq法の設計、最適化および適用を示した図である。 (a)例示的なGUIDE−Seq法の図式的概要。 (b)ヒト細胞におけるRGNで誘発されたDSBの中へのdsODN組み込みの最適化。RFLPアッセイによって測定されるような、異なる修飾オリゴヌクレオチドについての組み込みの割合が示されている。対照反応物は、RGNをコードしているプラスミドのみでトランスフェクトされた(すなわち、dsODNなし)。 図5C.例示的なGUIDE−Seq法の設計、最適化および適用を示した図である。 (c)ゲノム配列の読みのマッピングによりDSB部位の同定が可能とされる方法の図式的例示。二方向のマッピングの読みまたは同じ方向へのマッピングであるが異なるプライマーによって増幅された読みは、GUIDE−seqアッセイにおけるDSBのサインである。図1Aも参照されたい。 図5D−1.例示的なGUIDE−Seq法の設計、最適化および適用を示した図である。(d1〜d3)GUIDE−Seqに基づいた、RGNで誘発されたDSBの同定。ゲノムにマップされたGUIDE−Seqの読みの開始部位により、数塩基対以内までのDSBのマッピングが可能とされる。本発明者らがGUIDE−Seqによって評価した10種のRGNのオンターゲット部位についてのマップされた読みが示されている。すべての場合において、標的部位配列は、20bpのプロトスペーサー配列がx軸上の左側に、かつPAM配列が右側に示されている。すべての場合において、最も高いピークが、RGN切断事象の予想される部位である、NGG PAM配列の5’端の3から4bp以内に入る方法に留意されたい。 図5D−2.例示的なGUIDE−Seq法の設計、最適化および適用を示した図である。(d1〜d3)GUIDE−Seqに基づいた、RGNで誘発されたDSBの同定。ゲノムにマップされたGUIDE−Seqの読みの開始部位により、数塩基対以内までのDSBのマッピングが可能とされる。本発明者らがGUIDE−Seqによって評価した10種のRGNのオンターゲット部位についてのマップされた読みが示されている。すべての場合において、標的部位配列は、20bpのプロトスペーサー配列がx軸上の左側に、かつPAM配列が右側に示されている。すべての場合において、最も高いピークが、RGN切断事象の予想される部位である、NGG PAM配列の5’端の3から4bp以内に入る方法に留意されたい。 図5D−3.例示的なGUIDE−Seq法の設計、最適化および適用を示した図である。(d1〜d3)GUIDE−Seqに基づいた、RGNで誘発されたDSBの同定。ゲノムにマップされたGUIDE−Seqの読みの開始部位により、数塩基対以内までのDSBのマッピングが可能とされる。本発明者らがGUIDE−Seqによって評価した10種のRGNのオンターゲット部位についてのマップされた読みが示されている。すべての場合において、標的部位配列は、20bpのプロトスペーサー配列がx軸上の左側に、かつPAM配列が右側に示されている。すべての場合において、最も高いピークが、RGN切断事象の予想される部位である、NGG PAM配列の5’端の3から4bp以内に入る方法に留意されたい。 図5E−F.例示的なGUIDE−Seq法の設計、最適化および適用を示した図である。 (e)本研究において解析された10種のRGNについてのGUIDE−Seqによって同定された既知および新規のオフターゲット切断部位の数。4種のRGNについてのすべての既知のオフターゲット切断は、GUIDE−seqによって同定された。 (f)本報告の10種のRGNについてのGUIDE−Seqによって検出されたオフターゲット部位の総数に対するヒトゲノム(y軸)に直交性のオンターゲット部位の散乱プロット。直交性は、オンターゲット部位に対して相対的に1から6つのミスマッチを有するヒトゲノム内の部位の総数として算出された。 図5G.例示的なGUIDE−Seq法の設計、最適化および適用を示した図である。 (g)本報告の10種のRGNについてのGUIDE−Seqによって検出されるオフターゲット部位の総数に対するオンターゲット部位GC含量(y軸)の散乱プロット。 図5H−I.例示的なGUIDE−Seq法の設計、最適化および適用を示した図である。 (h)EMX1を標的とするRGNについてのCRISPR/Cas9オンターゲットおよびオフターゲット部位の染色体イデオグラム。残りのRGNについてのさらなるイデオグラムは、図13の中で見出すことができる。 (i)本研究において調査された10種のRGNについてのGUIDE−Seqによって同定されたオフターゲット切断部位のゲノム位置。 図6A.10種のRGNについてのGUIDE−Seqによって同定されたオフターゲット部位の配列を示した図である。各RGNについて、目的の標的配列が一番上の行に示され、切断された部位が下に示され、オンターゲット部位に対するミスマッチが示されかつ色で強調されている。GUIDE−Seqシークエンシングの読み数は、それぞれの部位の右側に示されている。オンターゲット部位は四角形でかつ既知のオフターゲット部位はひし形で印がつけられている。データは、以下の部位を標的とするRGNについて示されている:(a)VEGFA部位1。オフターゲット部位は、RNF2部位を標的とするRGNでは見出されなかった。 図6B.10種のRGNについてのGUIDE−Seqによって同定されたオフターゲット部位の配列を示した図である。各RGNについて、目的の標的配列が一番上の行に示され、切断された部位が下に示され、オンターゲット部位に対するミスマッチが示されかつ色で強調されている。GUIDE−Seqシークエンシングの読み数は、それぞれの部位の右側に示されている。オンターゲット部位は四角形でかつ既知のオフターゲット部位はひし形で印がつけられている。データは、以下の部位を標的とするRGNについて示されている:(b)VEGFA部位2。オフターゲット部位は、RNF2部位を標的とするRGNでは見出されなかった。 図6C−E.10種のRGNについてのGUIDE−Seqによって同定されたオフターゲット部位の配列を示した図である。各RGNについて、目的の標的配列が一番上の行に示され、切断された部位が下に示され、オンターゲット部位に対するミスマッチが示されかつ色で強調されている。GUIDE−Seqシークエンシングの読み数は、それぞれの部位の右側に示されている。オンターゲット部位は四角形でかつ既知のオフターゲット部位はひし形で印がつけられている。データは、以下の部位を標的とするRGNについて示されている:(c)VEGFA部位3、(d)EMX1、(e)FANCF。オフターゲット部位は、RNF2部位を標的とするRGNでは見出されなかった。 図6F−J.10種のRGNについてのGUIDE−Seqによって同定されたオフターゲット部位の配列を示した図である。各RGNについて、目的の標的配列が一番上の行に示され、切断された部位が下に示され、オンターゲット部位に対するミスマッチが示されかつ色で強調されている。GUIDE−Seqシークエンシングの読み数は、それぞれの部位の右側に示されている。オンターゲット部位は四角形でかつ既知のオフターゲット部位はひし形で印がつけられている。データは、以下の部位を標的とするRGNについて示されている:(f)HEK293部位1、(g)HEK293部位2、(h)HEK293部位3、(i)HEK293部位4、(j)RNF2。オフターゲット部位は、RNF2部位を標的とするRGNでは見出されなかった。 図7A.GUIDE−Seq切断部位が真正のRGNオフターゲット変異部位であることを示した図である。 (a)GUIDE−Seq切断部位におけるインデル変異を確認するために使用される、AMPに基づいたシークエンシング法の図式的概要が、図の上半分に示されている。マップされたインデル変異のヒストグラムプロットは、3種のRGNオンターゲット部位について示されている。欠失はX軸の上に示されているのに対して、挿入は下に示されている。標的部位全体(すなわち、プロトスペーサーおよびPAM配列)の境界は点線で示され、かつプロトスペーサーとPAM配列との間の境界は他の2本の間の点線として示されている。RGN切断は、プロトスペーサーの5’端から3から4bpに生じると予測される。 図7B−F.GUIDE−Seq切断部位が真正のRGNオフターゲット変異部位であることを示した図である。 (b)〜(f)以下を標的としたRGNについてのGUIDE−Seqによって同定された切断部位についてのインデル頻度(x軸)およびGUIDE−Seqシークエンシングの読み数(y軸)の散乱プロット:VEGFA部位1、VEGFA部位2、VEGFA部位3、EMX1、およびFANCF。 図8A−E.RGNで誘発されるオフターゲット配列特性の解析を示した図である。 (a)(GUIDE−Seqによって検出されるように)切断される特定の数のミスマッチを有する潜在的なRGNオフターゲット部位の画分。 (b)特定の数のミスマッチを有するRGNオフターゲット切断部位についてのGUIDE−Seqの読み数のプロット(対数目盛) (c)RGNオフターゲット部位についてのGUIDE−Seqの読み数に対する、プロトスペーサー内のミスマッチ部位の影響。塩基は、1から20の番号が付けられ、20はPAMに隣接した塩基である。 (d)線形回帰解析によって推定される、ゆらぎトランジション、非ゆらぎトランジション、およびトランスバージョンのミスマッチの影響。 (e)ミスマッチ数、ミスマッチ型、ミスマッチ部位、PAM密度、発現レベル、およびゲノム位置(遺伝子間/エクソン/イントロン)の影響についての個別の一変量解析によって説明されるGUIDE−Seqの読み数相違の割合。 図9A.RGNオフターゲット部位を同定するためのGUIDE−Seqとコンピュータ予測またはChIP−Seq法との比較を示した図である。 (a)9種のRGNについてのMIT CRISPR Design ToolおよびGUIDE−Seqによって予測されるオフターゲット部位間の重複を例示しているベン図。 図9B.RGNオフターゲット部位を同定するためのGUIDE−Seqとコンピュータ予測またはChIP−Seq法との比較を示した図である。 (b)9種のRGNについてのE−CRISPコンピュータ予測プログラムおよびGUIDE−Seqによって予測されるオフターゲット部位間の重複を例示しているベン図。 図9C−D.RGNオフターゲット部位を同定するためのGUIDE−Seqとコンピュータ予測またはChIP−Seq法との比較を示した図である。 (c)MIT CRISPR Design Toolによって予測される、予測されない、および考慮されない、GUIDE−Seqによって同定される真正のRGNオフターゲット部位の数を示しているヒストグラム。MIT CRISPR Design Toolによって予測される部位は、プログラムによって提供されるスコアに基づく五分位群に分けられる。各バーは、オンターゲット部位に対してミスマッチの数に基づいて細分類された部位を有する。バルジ部位は、スキップされた塩基部位をgRNA−プロトスペーサーDNA境界面に有するものである。 (d)E−CRISPコンピュータ予測ツールによって予測される、予測されない、および考慮されない、GUIDE−Seqによって同定される真正のRGNオフターゲット部位の数を示しているヒストグラム。部位は、(c)に記載のように再分割される。 図9E−F.RGNオフターゲット部位を同定するためのGUIDE−Seqとコンピュータ予測またはChIP−Seq法との比較を示した図である。 (e)ChIP−Seqによって同定されたdCas9結合部位とGUIDE−Seqによって同定されたRGNオフターゲット切断部位との間の重複を例示しているベン図。 (f)目的のオンターゲット部位に対して配列におけるミスマッチの数によって分類された、GUIDE−Seqによって同定されたRGNオフターゲット部位およびChIP−Seqによって同定されたdCas9結合部位のヒストグラムプロット。GUIDE−SeqおよびChIP−Seqミスマッチのカーネル密度評価が示されている。点線は、各クラスの部位についてのミスマッチの平均数を示す。 図10A.RGNによって誘発される大規模な構造変化を示した図である。 (a)転座を検出するためのAMP戦略の図式的概要。さらなる詳細は方法に。 図10B.RGNによって誘発される大規模な構造変化を示した図である。 (b)RGNによって誘発される構造的バリエーションのCircosプロット。5種のRGNおよび細胞の対照についてのデータが示されている。染色体は円に配置されており、転座は2つの染色体位置間の弧として示されている。長さが1kbを超える欠失または逆位は、直線として示される。オンターゲット、オフターゲット、または切断点ホットスポット以外の部位は、「その他」として分類されている。 図10C.RGNによって誘発される大規模な構造変化を示した図である。 (c)第6染色体上のVEGFA部位1オンターゲット部位と第17染色体上のオフターゲット部位との間で検出される転座の例。4つすべての可能な相互転座が、AMPを使用して検出された。 図10C−D.RGNによって誘発される大規模な構造変化を示した図である。 (d)AMPによって検出されるVEGFA部位2における2つのオフターゲット部位間の大きな欠失および逆位の例。 (e)5種のRGNで観察される、RGN誘発性およびRGN非依存性の異なる構造的バリエーションのまとめの表。Cas9のみ、dsODNオリゴのみ、および細胞のみでの対照も示されている。 図10F.RGNによって誘発される大規模な構造変化を示した図である。 (f)U2OSおよびHEK293細胞における切断点ホットスポットの位置を例示している染色体イデオグラム。2つのホットスポットは染色体1および10のセントロメア領域において重複する。 図11A−B.tru−gRNAによって指向されるRGNのGUIDE−Seqプロファイルを示した図である。 (a)適合された全長gRNAおよびトランケートされたgRNAによってVEGFA部位1、VEGFA部位3、およびEMX1標的部位に指向されるRGNについて同定された既知および新規のオフターゲット切断部位の数。全長gRNAによって指向されるRGNについてのデータは、図1eに示されているものと同じであり、比較の容易性のためにここにまた示されていることに留意されたい。 (b)適合された全長gRNAおよびトランケートされたgRNAによってVEGFA部位1、VEGFA部位3、およびEMX1標的部位に指向されるRGNについてのオンターゲットおよびオフターゲット部位を示している染色体イデオグラム。全長gRNAによって指向されるRGNについてのイデオグラムは、図1hおよび図13A〜Bに示されているものと同じであり、比較の容易性のためにここにまた示されていることに留意されたい。 図11C−D.tru−gRNAによって指向されるRGNのGUIDE−Seqプロファイルを示した図である。 (c)〜(d)適合された全長gRNAおよびトランケートされたgRNAによってVEGFA部位1、VEGFA部位3、およびEMX1標的部位に指向されるRGNについてのオンターゲットおよびオフターゲット部位を示している染色体イデオグラム。全長gRNAによって指向されるRGNについてのイデオグラムは、図1hおよび図13A〜Bに示されているものと同じであり、比較の容易性のためにここにまた示されていることに留意されたい。 図11E.tru−gRNAによって指向されるRGNのGUIDE−Seqプロファイルを示した図である。 (e)tru−gRNAによって指向されるRGNによって誘発されるDSBのGUIDE−Seqに基づいた同定。本発明者らがGUIDESeqによって評価したtru−gRNAによって指向される3種のRGNのオンターゲット部位についてのマップされた読みが示されている。すべての場合において、標的部位配列は、20bpのプロトスペーサー配列がx軸上の左側に、かつPAM配列が右側に示されている。RGNが全長gRNAによって指向されるので、最も高いピークが、RGN切断事象の予想される部位である、NGG PAM配列の5’端の3から4bp以内に入る方法に留意されたい。 図11F−H.tru−gRNAによって指向されるRGNのGUIDE−Seqプロファイルを示した図である。 (f)〜(h)tru−gRNAによって指向されるRGNについてのGUIDE−Seqによって同定されたオフターゲット部位の配列。各RGNについて、目的の標的配列が一番上の行に示され、切断された部位が下に示され、オンターゲット部位に対するミスマッチが示されかつ色で強調されている。GUIDESeqシークエンシングの読み数は、それぞれの部位の右側に示されている。目的のオンターゲット部位は四角形で印がつけられており、全長gRNAおよびtru−gRNAの両方によって指向されるRGNの既知のオフターゲット部位は濃い灰色のひし形で印がつけられており、かつtru−gRNAによって指向されるRGNのみで見出される既知のオフターゲット部位は薄い灰色のひし形で印がつけられている。既知のオフターゲット部位は、以前の報告FU et al., Nat Biotechnol 32, 279-284 (2014))において0.1%以上の変異生成頻度を有することが示されていたものであった。データは、tru−gRNAによって(f)VEGFA部位1、(g)VEGFA部位3、および(h)EMX1標的部位に指向されるRGNについて示されている。 dsODN挿入およびインデル変異の検証のためのGUIDE−SeqおよびAMPに基づいたシークエンシングの詳細な図式的概要を示した図である。両方のプロトコールについての詳細は、方法の中で見出すことができる。 図A−C.GUIDE−Seqによって評価された10種すべてのRGNについてのCRISPR/Cas9オンターゲットおよびオフターゲット部位の染色体イデオグラムを示した図である。 図D−F.GUIDE−Seqによって評価された10種すべてのRGNについてのCRISPR/Cas9オンターゲットおよびオフターゲット部位の染色体イデオグラムを示した図である。 図G−I.GUIDE−Seqによって評価された10種すべてのRGNについてのCRISPR/Cas9オンターゲットおよびオフターゲット部位の染色体イデオグラムを示した図である。 図J.GUIDE−Seqによって評価された10種すべてのRGNについてのCRISPR/Cas9オンターゲットおよびオフターゲット部位の染色体イデオグラムを示した図である。 GUIDE−Seqの読み数に対する因子の独立した影響を示すための多重因子線形回帰モデルを示した図である。 図15A.オフターゲット切断部位として以前に特徴付けされた7つのChIP−Seq結合部位についてのマップされたインデル変異のヒストグラムプロットである。実験試料および対照試料が各部位について並べて示されている。 図15B.オフターゲット切断部位として以前に特徴付けされた7つのChIP−Seq結合部位についてのマップされたインデル変異のヒストグラムプロットである。実験試料および対照試料が各部位について並べて示されている。 図15C.オフターゲット切断部位として以前に特徴付けされた7つのChIP−Seq結合部位についてのマップされたインデル変異のヒストグラムプロットである。実験試料および対照試料が各部位について並べて示されている。 図15D.オフターゲット切断部位として以前に特徴付けされた7つのChIP−Seq結合部位についてのマップされたインデル変異のヒストグラムプロットである。実験試料および対照試料が各部位について並べて示されている。 図16A.EGFPに対して標的化されたTALEN、ZFN、およびRFNを使用した、3つの型のdsODNの組み込み頻度を示しているグラフである。dsODNのすべてが5’リン酸化されていた。dsODNは、表示されている通り、無作為化された5’もしくは3’の4bpのオーバーハングを有していたまたは平滑末端であった。 図16B−C.U2OS細胞における2つの内在性標的部位、CCR5およびAPCでTALENによって誘発される二本鎖切断(DSB)の中への、平滑末端の、5’リン酸化された、34bpの二本鎖オリゴデオキシヌクレオチド(dsODN)(oSQT685/686)の効率的な組み込みを示しているグラフである。(16B)RFLP解析により、2つの内在性部位、CCR5およびAPCでTALENによって誘発されるDSBの中へのdsODNタグoSQT685/686の組み込み(%)が示されている。(16C)累積の変異生成頻度は、これらの2つの内在性標的部位におけるT7E1アッセイによって測定される。 図17A−B.異なるdsODN末端保護の比較を示している棒グラフである;この実験において使用されたdsODNは、リン酸化されかつ平滑末端であって、かつ5’および3’ホスホロチオエート修飾の両方、または3’ホスホロチオエート修飾のみのいずれかを有していた。17A、ヒトU2OS細胞におけるRFN;17B、マウスES細胞におけるCas9。 図18A−B.マウスES細胞における3’ホスホロチオエート修飾されたオリゴの異なる濃度での実験を示しているグラフである。18A、Nanog sgRNA/Cas9;18B、Phc1 sgRNA/Cas9。dsODNは、リン酸化されかつ平滑末端であって、かつ5’および3’ホスホロチオエート修飾の両方、または3’ホスホロチオエート修飾のみのいずれかを有していた。実験は、ヒトU2OS細胞においてダイマーRNA誘導型FokIヌクレアーゼで(図18A)、またはマウスES細胞において標準Cas9で(図18B)行われた。 図18C.マウスES細胞における3’ホスホロチオエート修飾されたオリゴの存在下での破壊の割合のT7E1解析を示しているグラフである。 図19A−B.U2OS細胞における3つの内在性標的部位、VEGFA3、EMX1、およびFANCF1でCas9によって誘発される二本鎖切断(DSB)の中へのビオチン化されたdsODNタグの効率的な組み込みを示す図である。(19A)RFLP解析により、U2OS細胞における3つの内在性標的部位、VEGFA3、EMX1、およびFANCF1でCas9によって誘発されるDSBの中への標準dsODN(oSQT685/686)と比較した、ビオチン化されたdsODN(oSQT1261/1262)の組み込み率(%)が示される。(19B)T7EIにより、U2OS細胞における3つの内在性標的部位、VEGFA3、EMX1、およびFANCF1での標準dsODN(oSQT685/686)と比較した、ビオチン化されたdsODN(oSQT1261/1262)での推定される変異生成頻度(%)が示される。 図20A−B.より長いdsODNタグは、CRISPR−Cas9で誘発されるDSBの部位において効率良く組み込むために最適化されうることを示す図である。(20A)RFLP解析により、75、50、または25pmolでトランスフェクトされるときの60bpのdsODN(oSQT1255/1256、oSQT1257/1258、およびoSQT1259/1260)の組み込み率(%)が示される。U2OS細胞において2つの内在性部位、EMX1およびFANCF1で試験された。(20B)T7EIにより、75、50、または25pmolでトランスフェクトされるときの60bpのdsODN(oSQT1255/1256、oSQT1257/1258、およびoSQT1259/1260の推定NHEJ率(%)が示される。U2OS細胞において2つの内在性部位、EMX1およびFANCF1で試験された。 異なるsgRNAを使用した改変VQRおよびVRER SpCas9バリアントについてのGUIDE−seqによって同定されたオフターゲット切断部位の数を示しているグラフである。 オフターゲット部位での野生型およびD1135E SpCas9バリアントの間の特異性における、GUIDE−seqで検出される変化をまとめているグラフである。D1135Eについての読み数のない部位での特異性における推定される増加(倍)は、プロットされていない。 図23A−B.以下を示しているグラフである。(23A)制限断片長多型解析によって推定される、オンターゲット部位でのGUIDE−seqオリゴタグ組み込みの平均頻度。エラーバーは、平均値の標準誤差、n=4を表す;(23B)GUIDE−seq実験のためにT7E1によって検出されるオンターゲット部位における平均変異生成頻度。エラーバーは、平均値の標準誤差、n=4を表す。
本明細書に記載のシークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE−Seq)法は、生細胞、例えば、非相同末端結合(NHEJ)修復経路が有効な細胞において改変ヌクレアーゼ切断部位の位置を同定するための高感度な、バイアスのない、かつゲノムワイドな方法を可能にする。一部の実施形態では、該方法は、ヌクレアーゼで誘発された切断の中への短い二本鎖オリゴデオキシヌクレオチド(dsODN)の捕捉(NHEJ経路によって媒介されると推定されるプロセス)および次いでゲノムの挿入の部位を同定するための挿入されたdsODN配列の使用、例えば、挿入されたdsODN配列を使用してハイスループットシークエンシングのためのゲノム挿入の部位を選択的に増幅する、PCRに基づいたディープシークエンシングアプローチを使用すること、または、例えば、溶液ハイブリッド捕捉を使用して、付加されたタグ、例えば、ビオチンなどを使用して、挿入されたdsODNを含むゲノム断片を選択的にプルダウンすること、に依存する。本明細書に記載されているのは、培養ヒト細胞におけるGUIDE−Seq法の開発および検証である;本明細書に記載されている一般的なアプローチは、すべての哺乳動物細胞においておよびNHEJ経路が活性であるまたは活性であると推定されるあらゆる細胞型または生物において有効なはずである。
この最初のシークエンシングプロセスによって同定される潜在的なオフターゲット部位は、ヌクレアーゼ成分だけが発現される細胞におけるNHEJ修復のインデル変異特性について解析される可能性もある。これらの実験は、増幅およびその後のディープシークエンシングを使用して行われてもよく、それぞれのヌクレアーゼによって誘発されるオフターゲット変異の頻度のさらなる確認および定量を可能にするはずである。
二本鎖オリゴデオキシヌクレオチド(dsODN)
本明細書に記載の方法において、天然に存在しないdsODNは、細胞内で発現される。本方法において、dsODNの両鎖は、細胞のゲノムにオルソロガスである(すなわち、細胞のゲノム内に存在しないまたは細胞のゲノム内に存在する配列に相補的である、すなわち、細胞のゲノム内に存在する配列に10%、20%、30%、40%、または50%以下の同一性を有する)。dsODNは、好ましくは15および75ntの間の長さ、例えば、15〜50nt、50〜75nt、30〜35nt、60〜65nt、もしくは50〜65ntの長さ、または15および50ntの間の長さ、例えば、20〜40もしくは30〜35、例えば、32〜34ntの長さでありうる。dsODNの各鎖は、固有のPCRプライミング配列を含んでいなければならない(すなわち、dsODNは、それぞれの鎖上に1つずつ、2つのPCRプライマー結合部位を含む)。一部の実施形態では、dsODNは、制限酵素認識部位、好ましくは、細胞のゲノムにおいて相対的にまれな部位を含む。
dsODNは、好ましくは修飾される;好ましくは、dsODNの5’末端は、リン酸化される;さらにまた好ましくは、2つのホスホロチオエート結合が、両方の3’末端および両方の5’末端上に存在する。好ましい実施形態では、dsODNは、平滑末端である。一部の実施形態では、dsODNは、5’または3’末端上に無作為な多様な1、2、3、4つまたはそれより多くのヌクレオチドオーバーハングを含む。
dsODNは、1つまたは複数のさらなる修飾、例えば、当技術分野において知られているまたはPCT/US2011/060493に記載されているようなものも含んでいてもよい。例えば、一部の実施形態では、dsODNは、ビオチン化される。GUIDE−seq dsODNタグのビオチン化バージョンは、ゲノムのDSBの部位の中への組み込みのための基質として使用される。ビオチンは、dsODNに対して内側のどこにあってもよいが(例えば、修飾されたチミジン残基(ビオチン−dT)、またはビオチンアジドを使用する)、5’または3’末端上にあってはならない。実施例4に示されているように、こうしたオリゴを効率良く組み込むことが可能である。これは、GUIDE−seq dsODNタグを含む断片を回収する代替の方法を可能にする。一方、一部の実施形態では、これらの配列は、ネステッドPCRによって検索および同定され、このアプローチでは、これらは、ビオチンを使用することによって、例えば、ストレプトアビジンコーティング付き磁気ビーズに結合させることによって、または溶液ハイブリッド捕捉を使用して、物理的にプルダウンされる;例えば、Gnirke et al., Nature Biotechnology 27, 182 - 189 (2009)を参照されたい。主な利点は、両方のフランキング配列の検索であり、これは、オフターゲット切断部位を同定するために参照ゲノムに配列をマップすることへの依存性を低下させる。
改変ヌクレアーゼ
以下の4つの主なクラスの改変ヌクレアーゼがある:1)メガヌクレアーゼ、2)ジンクフィンガーヌクレアーゼ、3)転写活性化因子エフェクター様ヌクレアーゼ(TALEN)、および4)クラスター化された規則的な間隔の短鎖反復回文配列(CRISPR)Cas RNA誘導型ヌクレアーゼ(RGN)。例えば、Gaj et al., Trends Biotechnol. 2013 Jul;31(7):397-405を参照されたい。ヌクレアーゼは、当技術分野において知られている方法を使用して、細胞内で一過的にまたは安定に発現されてもよい;典型的には、発現を得るために、タンパク質をコードしている配列は、直接的な転写のためのプロモーターを含む発現ベクター中にサブクローニングされる。好適な真核発現系は、当技術分野においてよく知られかつ、例えば、Sambrook et al., Molecular Cloning, A Laboratory Manual (4th ed. 2013);Kriegler, Gene Transfer and Expression: A Laboratory Manual (2006);およびCurrent Protocols in Molecular Biology (Ausubel et al., eds., 2010)に、記載されている。真核細胞および原核細胞の形質転換は、標準的な技術(例えば、上記の参考文献およびMorrison, 1977, J. Bacteriol. 132:349-351;Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds, 1983)を参照されたい)によって行われる。
ホーミングメガヌクレアーゼ
メガヌクレアーゼは、多様な生物、例えば、細菌、酵母、藻類および植物の細胞小器官などに由来している配列特異的エンドヌクレアーゼである。内在性メガヌクレアーゼは、12から30塩基対の認識部位を有する;18bpおよび24bpの長さのメガヌクレアーゼ認識部位を有するカスタマイズされたDNA結合部位が記載されており、いずれかが本方法およびコンストラクトにおいて使用されてもよい。例えば、Silva, G., et al., Current Gene Therapy, 11:11-27, (2011);Arnould et al., Journal of Molecular Biology, 355:443-58 (2006);Arnould et al., Protein Engineering Design & Selection, 24:27-31 (2011);およびStoddard, Q. Rev. Biophys. 38, 49 (2005);Grizot et al., Nucleic Acids Research, 38:2006-18 (2010)を参照されたい。
CRISPR−Casヌクレアーゼ
近年の研究は、クラスター化された、規則的な間隔の、短鎖反復回文配列(CRISPR)/CRISPR関連(Cas)システム(Wiedenheft et al., Nature 482, 331-338 (2012);Horvath et al., Science 327, 167-170 (2010);Terns et al., Curr Opin Microbiol 14, 321-327 (2011))が、細菌、酵母およびヒト細胞において、ならびに全生物、例えば、ショウジョウバエ、ゼブラフィッシュおよびマウスなどにおいてin vivoで、ゲノム編集を行うための簡単かつきわめて効率的な方法の基礎として役に立ちうることを実証している(Wang et al., Cell 153, 910-918 (2013);Shen et al., Cell Res (2013);Dicarlo et al., Nucleic Acids Res (2013);Jiang et al., Nat Biotechnol 31, 233-239 (2013);Jinek et al., Elife 2, e00471 (2013);Hwang et al., Nat Biotechnol 31, 227-229 (2013);Cong et al., Science 339, 819-823 (2013);Mali et al., Science 339, 823-826 (2013c);Cho et al., Nat Biotechnol 31, 230-232 (2013);Gratz et al., Genetics 194(4):1029-35 (2013))。化膿レンサ球菌(S. pyogenes)からのCas9ヌクレアーゼ(以下、簡単にCas9)は、17〜20ヌクレオチドの改変ガイドRNA(gRNA)(例えば、単一ガイドRNAまたはcrRNA/tracrRNA対)とプロトスペーサー隣接モチーフ(PAM)(例えば、PAMは配列NGGまたはNAGに合致している)の隣にある目的の標的ゲノムDNA配列の相補鎖との間の単純な塩基対相補性を介して誘導されうる(Shen et al., Cell Res (2013);Dicarlo et al., Nucleic Acids Res (2013);Jiang et al., Nat Biotechnol 31, 233-239 (2013);Jinek et al., Elife 2, e00471 (2013);Hwang et al., Nat Biotechnol 31, 227-229 (2013);Cong et al., Science 339, 819-823 (2013);Mali et al., Science 339, 823-826 (2013c);Cho et al., Nat Biotechnol 31, 230-232 (2013);Jinek et al., Science 337, 816-821 (2012))。
一部の実施形態では、本システムは、細菌においてコードされるようなまたは哺乳動物細胞における発現のためにコドン最適化されたいずれかの、化膿レンサ球菌(S. pyogenes)または黄色ブドウ球菌(Staphylococcus aureus)からの野生型またはバリアントのCas9タンパク質を利用する。ガイドRNAは、細胞内でCas9と一緒に発現される。ガイドRNAまたはヌクレアーゼのいずれか、または両方は、細胞内で一過的にまたは安定に発現されうる。
TALエフェクター反復配列
キサントモナス属(Xanthomonas)の中の植物病原性細菌のTALエフェクターは、宿主DNAを結合することおよびエフェクター特異的宿主遺伝子を活性化することによって、疾患において重要な役割を果たす、または防御を始動させる。特異性は、エフェクター可変数の、不完全な、典型的には約33〜35アミノ酸の反復に依存する。多型は、主にリピート部位12および13に存在し、これは、本明細書において反復可変二残基(RVD)と呼ばれる。TALエフェクターのRVDは、それらの標的部位においてヌクレオチドに、直接的、直線的な様式で、1つのRVDが1つのヌクレオチドに、一部は縮重で、かつ見かけ上の前後関係の依存性なく、対応する。一部の実施形態では、ヌクレオチド特異性を付与する多型領域は、三残基またはトリプレットとして発現されうる。
それぞれのDNA結合反復は、標的DNA配列において塩基対の認識を決定するRVDを含みうる。ここで、それぞれのDNA結合反復は、標的DNA配列内の1つの塩基対を認識する役割を果たす。一部の実施形態では、RVDは、以下のうちの1つまたは複数:Cを認識するためのHA;Cを認識するためのND;Cを認識するためのHI;Gを認識するためのHN;Gを認識するためのNA;GまたはAを認識するためのSN;Tを認識するためのYG;およびGを認識するためのNK、ならびに以下のうちの1つまたは複数を含みうる:Cを認識するためのHD;Tを認識するためのNG;Aを認識するためのNI;GまたはAを認識するためのNN;AまたはCまたはGまたはTを認識するためのNS;CまたはTを認識するためのN、ここで、は、RVDの第2の部位内のギャップを表す;Tを認識するためのHG;Tを認識するためのH、ここで、は、RVDの第2の部位内のギャップを表す;およびTを認識するためのIG。
TALEタンパク質は、ゲノム工学において(例えば、植物において生物燃料または生物再生可能材料に有用な形質を付加または促進するために)相同組換えを促進することができる標的化されたキメラヌクレアーゼとして研究およびバイオテクノロジーにおいて有用でありうる。これらのタンパク質は、例えば、転写因子としても有用でありえ、かつ特に、非限定的な例として病原体(例えば、ウイルス)に対する療法のように、きわめて高いレベルの特異性を必要とする治療的適用のためにも有用でありうる。
改変TALE配列を作製するための方法は、当技術分野において知られており、例えば、米国特許出願公開第61/610,212号明細書、およびReyon et al., Nature Biotechnology 30,460-465 (2012)に記載されている高速のライゲーションに基づいた自動化可能な固相ハイスループット(FLASH)システム;ならびにBogdanove & Voytas, Science 333, 1843-1846 (2011);Bogdanove et al., Curr Opin Plant Biol 13, 394-401 (2010);Scholze & Boch, J. Curr Opin Microbiol (2011);Boch et al., Science 326, 1509-1512 (2009);Moscou & Bogdanove, Science 326, 1501 (2009);Miller et al., Nat Biotechnol 29, 143-148 (2011);Morbitzer et al., T. Proc Natl Acad Sci U S A 107, 21617-21622 (2010);Morbitzer et al., Nucleic Acids Res 39, 5790-5799 (2011);Zhang et al., Nat Biotechnol 29, 149-153 (2011);Geissler et al., PLoS ONE 6, e19509 (2011);Weber et al., PLoS ONE 6, e19722 (2011);Christian et al., Genetics 186, 757-761 (2010);Li et al., Nucleic Acids Res 39, 359-372 (2011);Mahfouz et al., Proc Natl Acad Sci U S A 108, 2623-2628 (2011);Mussolino et al., Nucleic Acids Res (2011);Li et al., Nucleic Acids Res 39, 6315-6325 (2011);Cermak et al., Nucleic Acids Res 39, e82 (2011);Wood et al., Science 333, 307 (2011);Hockemeye et al. Nat Biotechnol 29, 731-734 (2011);Tesson et al., Nat Biotechnol 29, 695-696 (2011);Sander et al., Nat Biotechnol 29, 697-698 (2011);Huang et al., Nat Biotechnol 29, 699-700 (2011);およびZhang et al., Nat Biotechnol 29, 149-153 (2011)に記載されている方法を参照されたい;これらのすべては、参照により本明細書にその全体が組み込まれている。
ジンクフィンガー
ジンクフィンガータンパク質は、独立に折りたたまれた亜鉛を含むミニドメインである、1つまたは複数のジンクフィンガーを含むDNA結合タンパク質であり、その構造は、当技術分野においてよく知られており、かつ、例えば、Miller et al., 1985, EMBO J., 4:1609;Berg, 1988, Proc. Natl. Acad. Sci. USA, 85:99;Lee et al., 1989, Science. 245:635;およびKlug, 1993, Gene, 135:83に定義されている。DNAに結合したジンクフィンガータンパク質Zif268およびそのバリアントの結晶構造は、半分保存された相互作用のパターンを示し、そこでは、典型的にはジンクフィンガーのアルファヘリックスからの3つのアミノ酸が、DNA内の3つの隣接した塩基対すなわち「サブサイト」と接触する(Pavletich et al., 1991, Science, 252:809;Elrod-Erickson et al., 1998, Structure, 6:451)。したがって、Zif268の結晶構造により、ジンクフィンガーDNA結合ドメインが、ジンクフィンガーとDNA配列内の3塩基対「サブサイト」との間の1対1の相互作用を有するモジュールの様式で機能する可能性があることが示唆される。天然に存在するジンクフィンガー転写因子において、複数のジンクフィンガーは、典型的には、直列の配列内に一緒に結合されて、連続したDNA配列の配列特異的認識を達成する(Klug, 1993, Gene 135:83)。
複数の研究は、DNA結合に関与するアルファヘリックスの部位においてアミノ酸を無作為化することおよびファージディスプレイのような選択方法を使用して目的のDNA標的部位に結合する能力のある望ましいバリアントを同定することによって個々のジンクフィンガーのDNA結合特性を人為的に改変することが可能であることを示している(Rebar et al., 1994, Science, 263:671;Choo et al., 1994 Proc. Natl. Acad. Sci. USA, 91:11163;Jamieson et al., 1994, Biochemistry 33:5689;Wu et al., 1995 Proc. Natl. Acad. Sci. USA, 92: 344)。こうした組換えジンクフィンガータンパク質は、機能ドメイン、例えば、転写活性化因子、転写抑制因子、メチル化ドメイン、およびヌクレアーゼと融合させて、遺伝子発現を調節し、DNAメチル化を変化させ、モデル生物、植物、およびヒト細胞のゲノム内に標的とする変化を導入することができる(Carroll, 2008, Gene Ther., 15:1463-68;Cathomen, 2008, Mol. Ther., 16:1200-07;Wu et al., 2007, Cell. Mol. Life Sci., 64:2933-44)。
「モジュール集合体」として知られている、ジンクフィンガー配列を改変するための1つの既存の方法は、予め選択されたジンクフィンガーモジュールを配列内に単純に一緒に連結することを提唱している(Segal et al., 2003, Biochemistry, 42:2137-48;Beerli et al., 2002, Nat. Biotechnol., 20:135-141;Mandell et al., 2006, Nucleic Acids Res., 34:W516-523;Carroll et al., 2006, Nat. Protoc. 1:1329-41;Liu et al., 2002, J. Biol. Chem., 277:3850-56;Bae et al., 2003, Nat. Biotechnol., 21:275-280;Wright et al., 2006, Nat. Protoc., 1:1637-52)。いかなる研究者によって実施されるのにも十分に簡単であるにもかかわらず、近年の報告は、この方法のために、特に、ジンクフィンガーヌクレアーゼの文脈において、高い失敗率(Ramirez et al., 2008, Nat. Methods, 5:374-375;Kim et al., 2009, Genome Res. 19:1279-88)、いずれの所与の標的遺伝子のためにもきわめて多数のジンクフィンガータンパク質の構築および細胞に基づいた試験を典型的には必要とするという制限(Kim et al., 2009, Genome Res. 19:1279-88)を示している。
無作為化されたライブラリーからジンクフィンガー配列を同定する、組合せの選択に基づいた方法は、モジュール集合体よりも高い成功率を有することが示されている(Maeder et al., 2008, Mol. Cell, 31:294-301;Joung et al., 2010, Nat. Methods, 7:91-92;Isalan et al., 2001, Nat. Biotechnol., 19:656-660)。好ましい実施形態では、ジンクフィンガー配列は、国際公開第2011/017293号パンフレットおよび国際公開第2004/099366号パンフレットに記載されている、またはこれらに記載されているように作製される。さらなる好適なジンクフィンガーDBDは、米国特許第6,511,808号明細書、第6,013,453号明細書、第6,007,988号明細書、および第6,503,717号明細書ならびに米国特許出願公開第2002/0160940号明細書に記載されている。
細胞
本明細書に記載の方法は、ゲノムDNAにおいてDSBを修復する能力のあるいかなる細胞においても使用されうる。真核細胞における2つの主要なDSB修復経路は、相同組換え(HR)および非相同末端結合(NHEJ)である。好ましくは、該方法は、NHEJの能力のある細胞において行われる。NHEJ活性を検出するための方法は、当技術分野において知られている;NHEJの標準経路および副経路の概要については、Liu et al., Nucleic Acids Res. Jun 1, 2014; 42(10):6106-6127を参照されたい。
シークエンシング
本明細書中で使用される場合、「シークエンシング」は、核酸の配列を決定するいかなる方法をも含む。鎖終結(サンガー)シークエンシングおよび色素終結シークエンシングを含む、シークエンシングのいかなる方法も本方法において使用されうる。好ましい実施形態では、何千または何百万ものシークエンシング反応を並行に行うハイスループットシークエンシング技術である、次世代シークエンシング(NGS)が使用される。異なるNGSプラットフォームは異なるアッセイ化学を使用するが、これらはすべて、多数の鋳型上で同時に行われる多数のシークエンシング反応から配列データを生成する。典型的には、配列データは、スキャナーを使用して収集され、次いで、バイオインフォマティクス的に集結および解析される。したがって、シークエンシング反応は、並行に、実施、読み取り、集結、および解析される;例えば、米国特許第20140162897号明細書、ならびにVoelkerding et al., Clinical Chem., 55: 641-658, 2009;およびMacLean et al., Nature Rev. Microbiol., 7: 287-296 (2009)を参照されたい。NGS法には、鋳型増幅を必要とするものもあり、必要としないものもある。増幅を必要とする方法は、ピロシークエンシング(例えば、米国特許第6,210,89号明細書および第6,258,568号明細書を参照されたい;Rocheによって商品化されている);Solexa/Illuminaプラットフォーム(例えば、米国特許第6,833,246号明細書、第7,115,400号明細書、および第6,969,488号明細書を参照されたい);ならびに補助されたオリゴヌクレオチドライゲーションおよび検出(SOLiD)プラットフォーム(Applied Biosystems;例えば、米国特許第5,912,148号明細書および第6,130,073号明細書を参照されたい)を含む。増幅を必要としない方法(例えば、一分子シークエンシング法)は、ナノポアシークエンシング、HeliScope(米国特許第第7,169,560号明細書;第7,282,337号明細書;第7,482,120号明細書;第7,501,245号明細書;第6,818,395号明細書;第6,911,345号明細書;および第7,501,245号明細書);合成によるリアルタイムシークエンシング(例えば、米国特許第7,329,492号明細書を参照されたい);ゼロモード導波路(ZMW)を使用した一分子リアルタイム(SMRT)DNAシークエンシング法;ならびに、米国特許第7,170,050号明細書;第7,302,146号明細書;第7,313,308号明細書;および第7,476,503号明細書に記載されているものを含む)、他の方法。例えば、米国特許出願公開第2013/0274147号明細書;米国特許出願公開第2014/0038831号明細書;Metzker, Nat Rev Genet 11(1): 31-46 (2010)を参照されたい。
代替的に、ハイブリダイゼーションに基づいたシークエンス法または他のハイスループットな方法、例えば、マイクロアレイ解析、NANOSTRING、ILLUMINA、または他のシークエンシングプラットフォームも使用されてもよい。
実施例
本発明は、以下の実施例においてさらに記載されるが、これは、特許請求の範囲に記載の本発明の範囲を限定するものではない。
最初の実験では、ヌクレアーゼで誘発された二本鎖切断(DSB)の中にdsODNカセットを組み込むプロセスを最適化した。以前に公表された実験は、5’末端に2つのホスホロチオエート結合修飾を有しているdsODNを、哺乳動物細胞においてジンクフィンガーヌクレアーゼ(ZFN)で誘発されたDSBの中に捕捉できたことを実証している(Orlando et al., Nucleic Acids Res. 2010 Aug;38(15):e152)。しかし、こうしたssODNの捕捉を使用してきわめて低頻度のDSBでも同定するために、こうした切断の中へのその捕捉の割合を改良するためにdsODNの特性を最適化した。当初の努力は、化膿レンサ球菌(Streptococcus pyogenes)からのクラスター化された規則的な間隔の短鎖反復回文配列(CRISPR)RNA誘導型ヌクレアーゼCas9によって誘発されたDSB中にdsODNを捕捉することに焦点を当てた。Cas9は、平滑末端を有するDSBを誘発することが報告されており、したがって、dsODNバリアントは、平滑末端化されるように設計した。最適化実験は、両方の5’末端のリン酸化および(5’末端上のものに加えて)両方の3’末端上の2つのホスホロチオエート結合の導入により、Cas9で誘発されたDSBの中へのdsODNの捕捉の割合の大幅な上昇が導かれたことを示した(図1A〜B)。サンガーシークエンシングより、この特定のDSB中にdsODNを成功裏に捕捉したことが検証された(図2A〜B)。
Cas9で誘発されたDSB中にdsODNが効率良く組み込まれうることが確立されたので、次の実験では、次世代ディープシークエンシング法を哺乳動物細胞のゲノム内のdsODN組み込み部位の捕捉、増幅および同定に使用し得るかどうかを決定することが求められた。これを行うために、(それぞれの鎖上に1つの)2つのPCRプライマー結合部位を含む34bpのdsODNを利用した;これらの配列が選択された理由は、それらがヒトゲノムにそれぞれオルソロガスであるためである。
使用しdsODNの配列を、表1に示す:
このdsODNを、Cas9をコードするプラスミド、および異なる内在性ヒト遺伝子配列(EMX1およびVEGFA部位1、2、および3)にそれぞれ標的化された、4種の異なる標的特異的gRNAのうちの1種をコードするプラスミドと共にヒトU2OS細胞内にトランスフェクトした。これら4種の特定gRNAは、これらのそれぞれについて真正のオフターゲット部位が以前に同定されていた(Fu et al., Nat Biotechnol. 2013; Table 1)という理由で選択した。トランスフェクションは、以下のように行った:dsODNを、STE(100mM TrisHcl、500mM NaCl、10mM EDTA)中でそれぞれ100uMの濃度でアニールさせる。U2OS細胞では、2E5細胞を溶液SEおよびプログラムDN−100でヌクレオフェクトするために、500ngのCas9発現プラスミド、250ngのgRNA発現プラスミド、および100pmolのdsODNを使用した。
トランスフェクション3日後にゲノムDNAを採取し(Agencourt Ampure XP)、dsODNにコードされた制限部位の存在に基づいて、dsODNがこれらの細胞内のオンターゲット部位の中に効率良く組み込まれていることを検証するために、PCRベースの制限断片長多型(RFLP)アッセイを使用した。
トランスフェクトされた細胞のゲノム内のdsODN組み込みの位置を包括的に同定するために、これらの挿入部位を選択的に増幅してさらにそれらが次世代シークエンシング技術を使用してシークエンスされるのを可能にするPCRベースの方法を使用した。この戦略の一般的な概要を図3に示す。ゲノムDNAは、Covaris Adaptive Focused Acoustic(AFA)焦点式超音波発生装置で500bpの平均長に切断した。切断されたgDNAを末端修復し(Enzymatics)、Aテール付加して(Enzymatics)、切断されたDNAの末端に半機能的シークエンシングアダプター(米国特許第20130303461号明細書)を連結した(Enzymatics)。これらの酵素的ステップのそれぞれを精製するために、固相可逆固定法(SPRI)磁気ビーズ精製を使用した(Agencourt XP)。
dsODN配列を有するDNA断片は、次いで、dsODNに特異的なプライマーを、シークエンシングアダプターにアニールするプライマーと一緒に使用して増幅した。(上記のようにそれぞれの鎖上に1つの)2つの潜在的なプライミング部位がdsODN内にあるので、望ましい配列を選択的に増幅するために以下のように2つの独立したPCR反応を行った。
標的化されたシークエンシングライブラリーを作製するために、2ラウンドのネステッドPCRを行った。第一ラウンドのPCRは、組み込みdsODNと相補的なプライマー(プライマーA)およびユニバーサルアダプターと相補的なプライマー(プライマーB)を使用して行った。第二ラウンドのPCRは、プライマーAと相補的な3’ネステッドプライマー(プライマーC)、プライマーBと相補的な3’ネステッドプライマー(プライマーD)、ならびに、シークエンシングのために用意のできた「完全な」分子を作製するためにフローセル結合配列および無作為な分子インデックスを付加した、プライマーDと相補的なプライマー(プライマーE)を使用して行った。各ラウンドのPCRを精製するために、SPRI磁気ビーズを使用した。(Agencourt Ampure XP)
このアプローチによるdsODN含有ゲノム配列の増幅は、ゲノムDNAの無作為な切断によって誘発された切断にシークエンシングアダプターがライゲーションされるので、挿入地点に隣接したフランキング配列に依存することもそれによってバイアスされることもない。dsODNに最も近い末端上に次世代シークエンシングアダプター配列およびインデクシングバーコードを付加するためにさらなるラウンドのPCRを行い、結果として、次世代シークエンシング用に準備できた断片のライブラリーを得た。この一般的な方法は、本明細書において、シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(Genomewide Unbiased Identification of DSBs Evaluated by Sequencing)として、GUIDE−Seqと呼ぶ。
GUIDE−Seqを使用して構築されたライブラリーのディープシークエンシングにより、共発現された4種のgRNA/Cas9ヌクレアーゼのそれぞれの存在下においてdsODNが挿入されるようになった広範囲のゲノム座位が明らかにされた。生のディープシークエンシングデータの解析において、挿入の真正の部位が、両方向での少なくとも1つの読みによってカバーされたゲノム座位として同定されうることは理にかなっていた。dsODNがいずれの方向においても挿入できたためおよびdsODN配列内の一方または他方のいずれかの鎖に特異的なプライマーを使用して増幅が行われたためという両方の理由により、両方向での読みが可能であった。調査した4種のgRNAについて、この基準を満たした合計465のゲノム座位を同定した。これらの465座位のうちの36%では、使用したgRNAのオンターゲット部位と同様であり、かつ、オンターゲット部位に対して相対的に6つものミスマッチを有する、挿入地点の25bp以内の配列も同定された(図4A〜E)。この方法は、ここで調査された4種すべてのgRNAについて、すべての既知の真正オフターゲット部位(図4に示されている既知のオフターゲット部位のすべては、Fu et al., Nat Biotechnol. 2013からの表1にも示されている)ならびにこれまでに知られていない多くのさらなるオフターゲット部位の発見にも成功した。
カスタマイズ可能なCRISPR−Cas RNA誘導型ヌクレアーゼ(RGN)は、広範囲の研究および潜在的な臨床の適用を有する強力な、カスタマイズ可能なゲノム編集試薬である1、2;しかし、ヒトにおけるRGNの治療的使用には、有害な結末のリスクを最小限にするためにこれらのオフターゲット作用についての完全な知識が必要とされることになる。化膿レンサ球菌(S. pyogenes)Cas9ヌクレアーゼによるDNA切断は、プログラム可能な約100ntのガイドRNA(gRNA)によって指向される。ターゲティングは、gRNAの5’末端にある17〜20ntによって介され、これは、5’−NGG型のプロトスペーサー隣接モチーフ(PAM)の隣にある「プロトスペーサー」DNA部位と相補的である。非相同末端結合(NHEJ)による、プロトスペーサー内のCas9で誘発されたDNA二本鎖切断(DSB)の修復は、可変長の挿入/欠失変異(インデル)を誘発しうる。本発明者らのグループおよび他は、RGNで誘発された意図されていないインデルが、プロトスペーサー内の5つもの部位によって異なるオフターゲット切断部位で生じうること、または代替のPAM配列を有することを以前に示している4〜7。染色体転座は、RGNで誘発されたオンターゲットおよびオフターゲットの切断事象の連結によって生じうる8〜11。RGNを使用するex vivoおよびin−vivoでの治療戦略には、きわめて大きな細胞集団の修飾が必要とされることが予想されるので、臨床的適用では、低頻度であっても変化の同定は、決定的に重要であろう。こうした変化は好ましくない臨床的結末をもたらしうるので、細胞クローンのたとえまれなサブセットにおいてでも癌化の誘導(例えば、腫瘍抑制遺伝子の変異を不活性化することまたは腫瘍形成性染色体転座の形成)が特に懸念される。
ゲノム内のどこにでも生じうるインデルまたは高次ゲノム再配列の包括的な同定は、簡単には対処されない課題であり、残念なことに、生細胞におけるバイアスのない、ゲノムワイドな、RGNで誘発されたオフターゲット変異の同定のための高感度の方法はまだ記載されていない12、13。全ゲノム再シークエンシングは、編集された単一細胞クローンにおけるRGNオフターゲット変化を同定するための試みに使用されてきた14、15。しかし、きわめて多数のゲノムをシークエンスする高いコストにより、この方法は、細胞集団における低頻度の事象を見つけるのには非実用的とされる12。本発明者らおよび他者は、オンターゲット部位に対する配列類似性4、5または部分的に変性した結合部位ライブラリーからのin vitro選択のいずれかによって同定される潜在的なオフターゲット部位におけるインデル変異を同定するために、焦点式ディープシークエンシングを使用してきた。しかし、これらのアプローチは、オフターゲット配列の性質についての仮定を作るものであり、したがって、ゲノム内の他の場所の他の変異部位を見落とす可能性がある。ChIP−Seqも、触媒的に不活性の(dead)Cas9(dCas9)と複合体形成したgRNAについてのオフターゲット結合部位を同定するために使用されてきたが、公表された研究の大多数は、これらの部位のうち、活性Cas9ヌクレアーゼによる切断のオフターゲット部位であるものは、たとえあるとしても、きわめて少ないことを示唆している16〜19
ここで、本発明者らは、ヒト生細胞における異なる10種のRGNについての最初の包括的な特異性ランドスケープの作製を可能にする、シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE−Seq)のための新規な方法の開発を記載する。これらのプロファイルにより、オフターゲットDSBの総数は、個々のRGNについて広範に変化したことが明らかにされ、化膿レンサ球菌(S. pyogenes)または他の種からのRGNの特異性についての広い結論は、大規模な調査に基づいていなければならず、少数のgRNAだけに基づいていてはならないことが示唆された。本発明者らの発見は、オフターゲット作用がそこで生じうる配列の範囲および性質を拡大もさせた。直接的な比較により、GUIDE−Seqは、RGNオフターゲット部位を同定するための2つの広範に使用されるコンピュータのアプローチおよびChIP−Seq法よりも実質的に優れていたことが実証された。予想外なことに、GUIDE−Seqは、RGNで誘発されたDSBと一緒に、転座などの高次ゲノム変化に関与しうるRGN非依存性のDNA切断点ホットスポットも同定した。最後に、本発明者らは、直接的な比較において、gRNAの相補性領域をトランケートすることにより、それらのゲノムワイドなオフターゲットDSBプロファイルが大きく改良されることを示しており、RGNの特異性を改良するために設計された向上を評価するためのGUIDE−Seqの有用性を実証している。ここに概説される実験は、RGNの特異性を評価するためにこれまでに記載された中で、ならびに、治療的使用のために考慮されうる、プラットフォームに対するあらゆる改良の中で、最も精密な戦略を提供する。
方法
以下の材料および方法がこの実施例において使用された。
ヒト細胞培養およびトランスフェクション
U2OSおよびHEK293細胞は、10% FBS、2mM GlutaMax(Life Technologies)、およびペニシリン/ストレプトマイシンを補ったAdvanced DMEM(Life Technologies)中で5%のCOと共に37℃で培養した。U2OS細胞(プログラムDN−100)およびHEK293細胞(プログラムCM−137)は、Lonza Nucleofector 4−D上で製造業者の説明書に従って20μlの溶液SE中でトランスフェクトした。dsODN組み込み率は、NdeIを使用した制限断片長多型(RFLP)アッセイによって評価した。切断産物は、以前に記載されているように(Tsai et al., Nat. Biotechnol 32, 569-576 (2014))、Qiaxcelキャピラリー電気泳動機器(Qiagen)によって泳動および定量化した。
GUIDE−SeqのためのゲノムDNAの単離および調製
ゲノムDNAは、固相可逆固定法磁気ビーズ(Agencourt DNAdvance)を使用して単離し、Covaris S200超音波発生装置で500bpの平均長に切断し、末端修復し、Aテール付加し、8ntの無作為な分子インデックスを組み込んでいる半機能的アダプターにライゲーションした。標的濃縮のために、オリゴタグと相補的なプライマーでの、2ラウンドのネステッドアンカードPCRを使用した。例示的なGUIDE−Seqプロトコールの全詳細は、本明細書中で見出すことができる。
シークエンシングの読みの加工および統合
配列の最初の6つの同じ塩基ならびに同一の8ntの分子インデックスを共有する読みは、それらが同じ起源のプレPCR鋳型断片に由来するとみなされるので、一緒にビニングされる。これらの読みは、各部位において大多数の塩基を選択することによって単一のコンセンサスの読みに統合した。ノーコール(N)塩基は、10%より高い不一致の読みを有する状況で割り当てた。塩基クオリティスコアは、予め統合された読みの間で最も高くなるようにした。統合された読みは、BWA−MEM(Li and Durbin, Bioinformatics 26, 589-595 (2010))を使用してヒトゲノム参照(GrCh37)にマップした。
オフターゲット切断部位の同定
マッピングのクオリティ≧50を有する読みの開始マッピング部位を表にし、10bpのスライド式ウィンドウを使用して近くに開始マッピング部位を有する領域をグループ化した。組み込まれたdsODNを有するゲノムウィンドウは、以下の判定基準のうちの1つによって同定した:1)参照配列内の逆鎖に位置する2つ以上の固有の分子インデックス付加された読み、または2)フォワードおよびリバースプライマーによって増幅された2つ以上の固有の分子インデックス付加された読み。推定された切断点の両側の側方の25bpの参照配列を目的の標的部位に対してアライメントし、目的の標的配列から8つ以下のミスマッチを有するRGNオフターゲット部位を判定した。SNPおよびインデルは、これらの部位において、分子インデックスおよびSAMtoolsに基づいたカスタムビンコンセンサスバリアント判定アルゴリズムによって判定し、参照配列と異なったオフターゲット配列は、対応する細胞特異的な配列と置き換えた。
AMPに基づいたシークエンシング
GUIDE−Seqで検出されたDSBのAMP検証のために、プライマーは、以前に記載されているように(Zheng, Z. et al. Anchored multiplex PCR for targeted next-generation sequencing. Nat Med 2014 Nov 10. doi: 10.1038/nm.3729 (2014))、推定された二本鎖切断点の側方の領域に設計し、8ntの分子インデックスを付加した。可能な場合には、本発明者らは、各DSBの側方に位置するように2つのプライマーを設計した。
AMP検証データの解析
平均クオリティスコア>30を有する読みは、GUIDE−Seqで推定されたDSB部位とオーバーラップした挿入、欠失、および組み込みについてPythonを使用して解析した。PCRまたはシークエンシングの誤りからのノイズが入るのを最小限にするために、1bpのインデルは、それらが予測されたDSB部位の1bp以内であった場合のみに含めた。組み込みおよびインデルの頻度は、統合された分子インデックス付加された読みに基づいて算出した。
構造的バリエーション
転座、大きな欠失、および逆位は、スプリットBWA−MEMアライメントに基づいたカスタムアルゴリズムを使用して同定した。同一染色体上の50塩基以内の候補の融合切断点は、Cas9切断部位の周囲の潜在的な切断を含むようにグループ化した。融合事象は、独自にマップされた少なくとも3つのスプリットの読みで判定し、パラメーターもsegemehlツールにより使用した(Hoffmann, Genome biology, 2014))。マッピングストランデッドネスは、2つの関与しているDSBの間の相互融合の同定のため、および欠失または逆位を決定するために維持した。1kbの染色体部位内にDSBを含む融合は、単一のCas9切断によって引き起こされる大きなインデルが考えられるために無効とした。残りの融合DSBは、以下の4つのカテゴリーに分類した:GUIDE−seqに基づく「オンターゲット」、「オフターゲット」もしくは「バックグラウンド」、または他に「その他」。
GUIDE−SeqおよびChIP−Seqによって検出される部位ならびにコンピュータ上での予測の比較
本発明者らは、MIT CRISPR Design Toolを使用して、10種すべてのRGNについての潜在的なオフターゲット部位を同定した。このツールは、それぞれの潜在的なオフターゲット部位に、対応する百分位数を定める。本発明者らは、次いで、これらの百分位数を可視化目的で五分位群にグループ化した。E−CRISPツールはオフターゲットをランク付けしないので、本発明者らは、単純に、E−CRISPによって正確に予測されたGUIDE−seqオフターゲットを見つけた。これらのGUIDE−Seq対コンピュータ上での予測の両方について、本発明者らは、さらに、コンピュータ上での方法によって予測されなかったGUIDE−Seq結果を、MITツール(最大4つ)およびECRISPR(最大3つ)の範囲内のミスマッチ数を有するオフターゲット、ならびにこれらの予測ツールの閾値を超えるミスマッチ数を有するものに分割した。ChIP−Seq予測とのGUIDE−Seqオフターゲットの比較において、同じ技術を使用し、ChIP−Seqによって正確に予測されたGUIDE−Seqオフターゲットを見つけた。これらの比較のそれぞれについて、なされたすべてのグループ化は、オフターゲットミスマッチ数によって再分割し、正しくおよび誤って予測されたRGNオフターゲットの特性をより良好に特徴付けした。
オフターゲット切断率に対する、ミスマッチ、DNAアクセシビリティおよび局所的PAM密度の影響の解析
本発明者らは、推定される切断率に適合した線形回帰モデルを使用して、4つ以下のミスマッチを有する潜在的なオフターゲット部位において特異性に対する、ミスマッチ部位、ミスマッチ型およびDNAアクセシビリティの影響を評価した。ミスマッチ部位の共変動は、PAMの上流のオーバーラップしていない5つの4bpのウィンドウのそれぞれの中のミスマッチされた塩基の数として定義した。ミスマッチ型の共変動は、i)(標的TがCによって置き換えられ、標的GがAによって置き換えられた)ゆらぎ対形成を結果として生じるミスマッチの数、ii)(標的CがTによって置き換えられ、標的AがGによって置き換えられた)非ゆらぎプリン−ピリミジン塩基対形成を結果として生じるミスマッチの数、およびiii)プリン−プリンまたはピリミジン−ピリミジン対形成を結果として生じるミスマッチとしての数と定義した。
3つの因子のそれぞれは、別々のモデルにおいて、log(1+GUIDE−Seq読み数)によって推定される、相対切断率の予測因子として使用した。作用の大きさの推定は、標的部位間変動性のために調整した。各因子によって説明されるサイト内切断率変動性の比率は、回帰平方和(SS)に基づく偏イータ二乗統計:η =SSfactor/(SSfactor+SSerror)によって評価した。一因子モデルに加えて、本発明者らは、3つすべての因子、発現レベル、および1kbのウィンドウ内のPAM密度を含む組み合わされた線形回帰モデルも適合させて、オフターゲット切断可能性に対するそれらの独立した寄与を評価した。
Guide−seqライブラリー調製のための例示的な試薬および装置
室温で保存
品目 販売会社
Covaris S220マイクロチューブ、 Covaris
エタノール、200プルーフ(100%) Sigma Aldrich
MicroAmp Optical 96ウェルプレート Applied Biosystems
ヌクレアーゼ非含有HO Promega
Qubitアッセイチューブ、500チューブ/パック Invitrogen
Qubit dsDNA BRキット−500アッセイ Invitrogen
TMACバッファー、5M Sigma Aldrich
− 塩化テトラメチルアンモニウム
1×TEバッファー/10mM トリス−HCl、pH8.0 Invitrogen
UltraPure 0.5M EDTA、pH8.0(Gibco)(4×100mL) Life Technologies
4℃で保存
品目 販売会社
Agencourt AMPure XPビーズ − 60mL Beckman Coulter
−20℃で保存
品目 カタログ#
25mM dNTP溶液ミックス Enzymatics,Inc.
Slowライゲーションバッファー Enzymatics,Inc.
末端修復ミックス(低濃度) Enzymatics,Inc.
T4 DNAリガーゼ Enzymatics,Inc.
− 10× T4 DNAリガーゼバッファー(Slowライゲーションバッファー)
Platinum(登録商標)Taq DNAポリメラーゼ Life Technologies
− 10× PCRバッファー(MgClなし)
− 50mM MgCl
qPCR Illuminaライブラリー定量化キット KAPA Biosystems,Inc.
機器
96ウェルプレート磁気スタンド Invitrogen
Qubit蛍光光度計2.0 Life Technologies
Covaris S−2 Focused Ultra−sonicator(商標)機器 Covaris
卓上遠心分離機 Thermo Scientific
卓上ボルテクサー Thermo Scientific
サーモサイクラー Eppendorf
Miseq Illumina
GUIDE−seqライブラリー調製のための例示的なプロトコール
Yアダプター調製
Yアダプターは、Miseq共通オリゴを試料バーコードアダプター(A01からA16、表3を参照されたい)のそれぞれとアニールすることによって作製される。アダプターは、8merのNNWNNWNN(N=A、C、T、またはG;W=AまたはT)分子インデックスも含む。
1×TEバッファー 80.0μL
A##(100μM) 10.0μL
MiSeq Common Adapter_MI(100μM) 10.0μL
合計 100.0μL
アニーリングプログラム:95℃1秒間;60℃1秒間;4℃まで緩徐な傾斜の低下(約−2℃/分);4℃で維持する。−20℃で保存する。
インプット定量化および切断
1. dsDNAは、Qubitによって定量化され、1×TEバッファーを使用して400ngが120ulの最終容量にされる。
2. 各試料は、Covaris S2のための標準操作プロトコールに従って500bpの平均長に切断される。
3. 120ulのAMPure XP SPRIビーズ(1×比率)での精製は、製造業者のプロトコールに従って行い、15ulの1×TEバッファー中に溶出される。
末端修復、A−テーリングおよびライゲーション
末端修復
4. 200μLのPCRチューブまたは96プレート中のウェルに、以下を(反応ごとに)添加する:
ヌクレアーゼ非含有HO 0.5μL
dNTPミックス、5mM 1.0μL
SLOWライゲーションバッファー、10× 2.5μL
末端修復ミックス(低濃度) 2.0μL
Taqポリメラーゼ用のバッファー、10×(Mg2+なし) 2.0μL
Taqポリメラーゼ(非ホットスタート) 0.5μL
合計 8.5μL
+(前のステップからの)DNA試料 14.0μL
合計 22.5μL
末端修復サーモサイクラープログラム:12℃15分間、37℃15分間;72℃15分間;4℃で維持する
アダプターライゲーション
5. 試料反応チューブまたはウェルに、以下の試薬を順番に添加する(ピペッティングによって混合する):
アニールされたY adapter_MI(10μM) 1.0μL
T4 DNAリガーゼ 2.0μL
+(前のステップからの)DNA試料 22.5μL
合計 25.5μl
アダプターライゲーションサーモサイクラープログラム:16℃30分間、22℃30分間、4℃で維持する
6. 0.9× SPRI clean(22.95ul Ampure XPビーズ)、12uLの1×TEバッファー中に溶出
PCR
PCR1(オリゴタグプライマー[発見]または大規模なプライマープール[ディープシークエンシング検証])
7. 以下のマスターミックスを調製する:
ヌクレアーゼ非含有HO 11.9μL
Taqポリメラーゼ用のバッファー、10×(MgClなし) 3.0μL
dNTPミックス、10mM 0.6μL
MgCl、50mM 1.2μL
Platinum Taqポリメラーゼ、5U/μl 0.3μL
GSP1プライマー(10uM)/プライマープール() 1.0μL
TMAC(0.5M) 1.5μL
P5_1、10μM 0.5μL
合計 20.0μL
+(ステップ6からの)DNA試料 10.0μL
合計 30.0μL
発見用には、+/(センス)および−/(アンチセンス)反応について別々のマスターミックスを作製して、別々のPCR反応を行う。
ディープシークエンシング検証用には、1種のマスターミックスが作製されうる。プライマープールは、30ulの反応物中に30pmolの総量に標準化されるべきである。
発見サーモサイクラープログラム(タッチダウン):
95℃5分間、
15サイクルの[95℃30秒間、70℃(−1℃/サイクル)2分間、72℃30秒間]、
10サイクルの[95℃30秒間、55℃1分間、72℃30秒間]、
72℃5分間、
4℃維持
検証サーモサイクラープログラム:
95℃5分間、
14サイクルの[95℃30秒間、20%の傾斜で65℃まで下げる、65℃5分間]、
72℃5分間、
4℃維持
8. 1.2× SPRI clean(36.0uL)、15ulの1×TEバッファー中に溶出
PCR2(オリゴタグプライマー[発見]または大規模なプライマープール[ディープシークエンシング検証])
9. 以下のマスターミックスを調製する:
ヌクレアーゼ非含有HO 5.4μL
Taqポリメラーゼ用のバッファー、10×(Mg2+なし) 3.0μL
dNTPミックス、10mM 0.6μL
MgCl、50mM 1.2μL
Platinum Taqポリメラーゼ、5U/μL 0.3μL
GSP2プライマー(10uM)/プライマープール() 1.0μL
TMAC(0.5M) 1.5μL
P5_2、10μM 0.5μL
合計 13.5μL
+P7_#(10uM) 1.5μL
+(ステップ8からの)ビーズ付きのDNA試料 15.0μL
合計 30.0μL
プライマー濃度は、PCR1に記載の詳細に従うべきである
P7_#では、Illuminaシークエンサー上での良好な画像記録のために、1つのシークエンシング泳動において少なくとも4種は使用されるべきである(例えば、P701〜P704またはP705〜P708)
発見サーモサイクラープログラム(タッチダウン):
PCR1用と同じ
検証サーモサイクラープログラム:
PCR1用と同じ
10. 0.7× SPRI clean(21.0uL)、30uLの1×TEバッファー中に溶出
qPCRによるライブラリー定量化およびシークエンシング
qPCR定量化
11. 製造業者の説明書に従って、Illuminaライブラリー定量化キット用のKapa Biosystemsキットを使用してライブラリーを定量化する。
標準化およびシークエンシング
12. 各試料についてqPCR操作によって得られる1uLあたりの分子の数の平均量推定値を使用して、全セットのライブラリーを1.2×10^10分子に標準化することを行ない、シークエンシング用に一緒にプールされるライブラリーの数によって分割する。これは、各試料についての分子によるインプット、およびさらに、各試料についての容量によるインプットを与えることになる。
プーリング後、Vacufugeでライブラリーをシークエンシング用に10uLの最終容量までSpeedvac(乾燥減量)する。
ライブラリーを変性させ、Illumina Miseq試薬キットV2−300サイクル(2×150bp対末端)でのシークエンシングのために、以下を除き、Illumina標準プロトコールに従ってMiseq上にロードする:
1)3ulの100μMのカスタムシークエンシングプライマーIndex 1をMiseq試薬カートリッジ部位13に添加する(Indexプライマーミックス)。3ulの100μMのカスタムシークエンシングプライマーRead 2をMiseq試薬カートリッジ部位14に添加する(Read 2プライマーミックス)。
2)対末端Nexteraシークエンシングプロトコールで以下の数のサイクル「151|8|16|151」でシークエンスする。
下流のバイオインフォマティクス解析のために関連する管路に対してbclまたはfastqフォーマットのいずれかでシークエンシングデータを出す。
結果
例示的なGUIDE−Seq法の概要
一部の実施形態では、GUIDE−Seqは、2つのステージからなる(図5B):ステージIでは、ヒト生細胞のゲノム内のDSBが、これらの切断における平滑末端二本鎖オリゴデオキシヌクレオチド(dsODN)の組み込みによってタグ付けされる。ステージIIでは、バイアスのない増幅および次世代シークエンシングを使用して、ゲノムDNA内のdsODN組み込み部位がヌクレオチドレベルで正確にマップされる。
ステージIのために、本発明者らは、ヒト細胞においてRGNで誘発されたDSBの中に平滑末端の、5’リン酸化されたdsODNを組み込む条件を最適化した。最初の実験では、本発明者らは、こうしたdsODNがRGNで誘発されたDSB中に組み込まれるのを観察するのに失敗した。細胞内でオリゴを安定させるために設計された両方のDNA鎖の5’末端に2つのホスホチオレート結合を有するdsODN20を使用して、本発明者らは、適度な検出可能な組み込み頻度だけを観察した(図5B)。しかし、両鎖の3’末端でのホスホチオレート結合の付加は、強力な組み込み効率をもたらした(図5B)。これらの組み込み率は、これらの部位においてRGNのみによって(すなわち、dsODNの非存在下で)誘発されるインデルの頻度よりも2分の1から3分の1低いだけであった。
ステージIIのために、本発明者らは、組み込まれたdsODNを有する断片のみを、バイアスのない様式で、選択的に増幅およびシークエンスすることを可能にする新規戦略を開発した(図5A)。本発明者らは、dsODN、およびRGN成分をコードしているプラスミドがトランスフェクトされた細胞からの無作為に切断されたゲノムDNAに最初に「単一テール」次世代シークエンシングアダプターをライゲーションすることによって、これを達成した。本発明者らは、次いで、dsODNに特異的にアニールする1つのプライマーおよびシークエンシングアダプターにアニールするもう1つのプライマーによって開始される一連のPCR反応を行った(図5Aおよび図12)。シークエンシングアダプターが単一テールのみ付加されているので、これは、他の方法、例えば直線的増幅を介する(LAM)−PCR21、22などに特有のバイアスなしで、dsODNに隣接した配列の特異的な一方向の増幅を可能にする。本発明者らは、我々の戦略を単一テールアダプター/タグ(single-tail adapter/tag:STAT)−PCR法と称する。dsODN鎖のそれぞれにアニールするプライマーを使用してSTAT−PCR反応を行うことにより、本発明者らは、それぞれの組み込まれたタグの両側上の隣接ゲノム配列の読みを得ることができた(図5C)。増幅プロセス中の無作為な8bpの分子バーコードの組み込み(図12)により、PCRバイアスの修正が可能となり、それによって、ハイスループットシークエンシングから得られた固有のシークエンシングの読みの正確な定量化が可能となる。
ヒト細胞におけるCRISPR RGNのゲノムワイドなオフターゲット切断プロファイル
本発明者らは、U2OSまたはHEK293ヒト細胞系のいずれかにおいて、Cas9、および多様な内在性ヒト遺伝子を標的とする異なる10種のgRNAでGUIDE−Seqを行った(表1)。dsODN組み込み部位を解析すること(方法)によって、本発明者らは、ヌクレオチドレベルまでマップされた、10種のRGNのそれぞれによって誘発されたDSBの正確なゲノム部位を同定することができた(図5D)。これらのゲノムウィンドウのうちの>80%については、本発明者らは、オンターゲット部位であるまたはそれに関連するいずれかの重複標的配列を同定することができた(方法)。興味深いことに、各RGNについて本発明者らが同定したオフターゲット部位の総数は広範に変化し、ゼロから>150までの範囲に及び(図5E)、いずれの特定のRGNについても望ましくない切断のゲノムワイドな程度が極端に多くまたは少なくなりうることが示された。本発明者らは、(1から6つのミスマッチを有するゲノム部位の総数によって測定されるような)ヒトゲノムに対するgRNAプロトスペーサー配列の直交性と、GUIDE−Seqによって本発明者らが観察したオフターゲット部位の総数との間にいかなる明らかな相関も観察しなかった(図5F)。オフターゲット配列は、ゲノムの全体にわたって分散して見出され(図5Ggおよび図13A〜J)、エクソン、イントロン、および非コード遺伝子間領域において減少する(図5H)。本発明者らが同定したオフターゲット配列の中に含まれていたのは、すべてRGNのうちの4種についての既知の真正のオフターゲット部位4、5であった(図6A〜J)。さらに重要なことには、GUIDE−Seqは、ヒトゲノムの全体にわたって位置する、多数の新しい、これまでに知られていないオフターゲット部位を同定した(図5E、5G、6A〜Jおよび13A〜J)。
本発明者らは、次に、(図6A〜Jに示される)GUIDE−Seqによって同定された各オフターゲット部位についてのシークエンシングの読みの数が、RGNのみによって(すなわち、dsODNの非存在下で)誘発されるはずであったインデルの相対頻度の代わりになっているかどうかを試験した。ヌクレアーゼ成分が発現されたヒトU2OS細胞における5種のRGNについての、アンカードマルチプレックスPCR(AMP)に基づいた次世代シークエンシング(方法)によるこれらの部位の試験より、>80%(132からの106)がRGN切断に特徴的な可変長のインデルを有していたことが示され、GUIDE−Seqが真正のRGNオフターゲット部位を同定するという本発明者らの結論がさらに支持される(図7A)。検出されたインデル頻度の範囲は、0.03%から60.1%までの範囲に及んだ。重要なことに、本発明者らは、5つすべてのRGNオフターゲット部位についてGUIDE−Seqの読み数とインデル変異頻度との間に陽性の直線的相関を認めた(図7A〜F)。したがって、本発明者らは、所与の部位についてのGUIDE−Seqの読み数が、RGNによるその配列の切断効率の定量的尺度を表すと結論する。
RGNで誘発されるオフターゲット配列特性の解析
10種すべてのRGNについてのGUIDE−Seqによって本発明者らが同定したオフターゲット部位の視覚的検査により、RGNがそこで切断可能なバリアント配列の多様性が強調される。これらの部位は、プロトスペーサー配列内の6つものミスマッチ(最大7つのミスマッチを有する部位のin vitroの切断を示している以前の報告と一致する)、非標準PAM(以前に記載されているNAGおよびNGA配列5、23だけでなく、新規なNAA、NGT、NGC、およびNCG配列も)、およびgRNA/プロトスペーサー境界面での1bpの「バルジ」型ミスマッチ24を有しうる(図6A〜J)。プロトスペーサーミスマッチは、標的部位の5’末端に生じる傾向にあるが、特定の3’末端部位でも見出されることがあり、部位に基づいてミスマッチ作用を予測するための簡単な法則はないという考えが支持される。興味深いことに、一部のオフターゲット部位は、実際に、それらの適合したオンターゲット部位よりも高いシークエンシング読み数を有し(図6A〜D、6J)、オフターゲット変異頻度は、特定の場合において、目的のオンターゲット部位でのものよりも高くなりうるという本発明者らの以前の知見と一致している。特に、RGNのうちの4種についての既知のオフターゲット部位の多くは、高い読み数を有し(図6A〜D)、以前の解析は、最も効率良く切断される部位を主に同定していたことが示唆される。
10種すべてのRGNにおける本発明者らのGUIDE−Seqデータの定量的解析は、本発明者らが異なる可変のもの、例えば、オフターゲット部位切断におけるミスマッチ数、位置、および型などの寄与および影響を定量化するのを可能にした。本発明者らは、RGNによって切断される特定の数のプロトスペーサーミスマッチを有する全ゲノム部位の割合は、ミスマッチの数の増大と共に低下することを見出した(図8A)。さらに、シークエンシングの読み数は、ミスマッチの数の増大と共に全体的な下降傾向を示す(図8B)。一般に、標的部位の5’末端のより近くに位置するプロトスペーサーミスマッチは、3’末端のより近くのものよりもGUIDE−Seqの読み数におけるより小さい減少と関連する傾向にあるが、PAMから1から4bp離れて位置するミスマッチは、驚くべきことに、5から8bp離れて位置するものよりもいくらか良好な耐容性を示す(図8C)。興味深いことに、ミスマッチの性質も、GUIDE−Seqの読み数に対する影響に関連する。ゆらぎミスマッチは、オフターゲット部位において頻繁に生じ、本発明者らの解析は、それらが、他の非ゆらぎミスマッチよりもより小さい、GUIDE−Seqの読み数に対する影響に関連することを示唆している(図8D)。これらの結果と一致して、本発明者らは、一変量回帰分析においてオフターゲット切断における最も程度の大きいバリエーションを説明する単一因子が、ミスマッチ数、部位、および型であることを見出している。対照的に、近位PAM配列の密度、遺伝子発現レベル、またはゲノム位置(遺伝子間/イントロン/エクソン)などの他の因子は、GUIDE−Seq切断読み数においてきわめてより小さな割合の相違を説明する(図8E)。ミスマッチ部位、ミスマッチ型、遺伝子発現レベル、および近位PAM配列の密度を含む複数の因子を考慮した組み合わされた線形回帰モデルは、一変量分析と一致した結果を得た(図14)。この分析により、本発明者らは、それぞれのさらなるゆらぎミスマッチがオフターゲット切断率を、平均において、かつそれらの部位に依存して、約2分の1〜3分の1だけ低下させるのに対して、さらなる非ゆらぎミスマッチは切断率を約3分の1だけ低下させることを独立的に推定することも可能となった(図14)。
既存のオフターゲット予測法でのGUIDE−Seqの比較
GUIDE−Seqの効力が確立されたので、本発明者らは、次に、オフターゲット変異部位を予測するための以下の2つの普及している既存のコンピュータの方法との本発明者らの新しい方法の直接的な比較を行った:MIT CRISPR Design Tool25(crispr.mit.edu)およびE−CRISPプログラム26(www.e−crisp.org/E−CRISP/)。これらの両方のプログラムは、ミスマッチ数および部位についての特定の「法則」に基づいて潜在的なオフターゲット部位を同定することを試みるものであり、これまでの刊行物においてオフターゲット部位を同定するために使用されてきた。GUIDE−Seqによって本発明者らが特徴付けした10種のRGNを使用した本発明者らの比較において、本発明者らは、両方のプログラムが、実験的に検証されたオフターゲット部位のきわめて大多数を同定できなかったことを見出した(図9A〜B)。これらの部位の多くは、E−CRISPおよびMITプログラムが、単に、それぞれ3つおよび4つを超えるミスマッチを有するオフターゲットを考慮しないので見落とされた(図9C〜D)。考慮された配列の中でも、これらのプログラムは、依然として真正のオフターゲット部位の大多数を同定することができず(図9C〜D)、切断が生じることになるまたは生じないことになるか否かを決定する因子を説明するためのこれらの現在限られた能力を強調している。MITプログラムによって割り当てられたランク付けスコアは、それが正確に同定する部位の中でいくらかの予測的能力を有するが、特に、見落とされた部位が、わずか1つのミスマッチを有するものを含むことは留意すべきことである(図9C〜D)。最後に、両方のプログラムが、GUIDE−Seqによって同定されない多くの「偽陽性」部位を出すことに留意することは重要である(図9A〜B)。本発明者らは、MITおよびE−CRISPの両方が、真正のRGNオフターゲット部位の同定において本発明者らのGUIDE−Seq法よりも実質的に低い有効性で機能すると結論する。
dCas9結合部位の決定についてのChIP−Seq法とのGUIDE−Seqの比較
本発明者らは、RGNオフターゲット部位の同定について、GUIDE−Seqを、以前に記載されているChIP−Seq法と直接に比較することも探求した。本発明者らがGUIDE−Seqによって評価したRGNのうちの4つは、オフターゲット結合部位の大規模なセットの同定につながった、触媒的に不活性なCas9(dCas9)でのChIP−Seq実験において以前に特徴付けされていたgRNA18を使用した。直接的な比較により、GUIDE−Seqによって同定されたCas9オフターゲット切断部位と、ChIP−Seqによって同定されたdCas9オフターゲット結合部位との間できわめて少ない重複しか示されない;4種のgRNAについて本発明者らが同定した、RGNで誘発された149個のオフターゲット切断部位の中で3つだけが、以前に公表された同じgRNAを使用したdCas9 ChIP−Seq実験によって以前に同定されているものであった(図9E)。この重複の欠如は、dCas9オフターゲット結合部位がCas9オフターゲット切断部位とは基本的に異なるからである可能性が高く、本発明者らのデータによって支持される仮説は、GUIDE−Seqによって同定されたこれらの4種のgRNAについてのCas9オフターゲット切断部位が、ChIP−Seq(図9F)および、きわめて少ないdCas9結合部位が活性Cas9の存在下でインデルの証拠を示すことを示している、以前の研究の結果16〜19によって同定されたそれらの結合部位よりも平均ではるかに少ないミスマッチを有することを示している。GUIDE−Seqは、ChIP−Seqによって以前に同定された4つのオフターゲット部位を同定することができず、かつ次いで、Cas9による変異生成の標的であることが示されたが、本発明者らは、これは、それらの部位がその以前の研究18において真正のオフターゲット切断部位として誤って同定されたからであると考えている。その研究からのシークエンシングデータの注意深い解析により、それらの部位において見出されたインデル変異のきわめて大多数は、RGN切断活性によってではなく、PCRまたはシークエンシングの誤りによって代わりに生じた可能性が高いことが示唆される(図15A〜D)。まとめると、これらの発見により、GUIDE−Seqが、真正のオフターゲット切断部位の同定についてChIP−Seqよりも実質的に優れていることが実証され、ChIP−Seqによって発見された(たとえあるとしても)きわめて少ないdCas9オフターゲット結合部位が実際のCas9オフターゲット切断部位を表すという考えについての実験的支持が得られる。
GUIDE−Seqによるヒト細胞におけるRGN非依存性DSBホットスポットの同定
本発明者らのGUIDE−Seq実験は、本発明者らの研究のために使用されたU2OSおよびHEK293細胞における合計30個の固有のRGN非依存性DSBホットスポットの存在も予想外に明らかにした(表2)。本発明者らは、RGNをコードしているプラスミドなしでdsODNのみをトランスフェクトしたU2OSおよびHEK293細胞での対照実験からのゲノムDNAを解析するときには、これらの部位を明らかにした(方法)。特異的な塩基対部位に正確に位置するRGNで誘発されたDSBとは対照的に、RGN非依存性DSBは、それらが生じるそれぞれの座位においてより広く分散したdsODN組み込みパターンを有する(方法)。これらの30個の切断点ホットスポットは、多くの染色体にわたって分布していて、セントロメアもしくはテロメア領域にまたはその近くに存在するように見えた(図10F)。興味深いことに、少数のこれらのDSB(2つ)のみが両方の細胞系に共通であって、大多数は細胞系特異的であるようであった(U2OSにおける25つおよびHEK293細胞における7つ;図10Fおよび表2)。知る限りでは、GUIDE−Seqは、ヒト生細胞において、直接的でかつバイアスのない、切断点ホットスポットの同定を、それらの存在を明らかにするために潜在的に有毒な薬剤(例えば、アフィジコリンなどのDNA複製阻害剤)を必要とすることなく、可能にする最初の方法である。
大規模なゲノム再編成におけるRGNで誘発されたDSBおよびRGN非依存性DSBの両方の関与
RGNで誘発されたDSBおよびRGN非依存性DSBにおけるインデルを同定するために設計された本発明者らの次世代シークエンシング実験の結果を解析する過程において、本発明者らは、これらの切断の一部が、転座、逆位および大きな欠失に関与しうることも発見した。使用されたAMP法により、本発明者らがこれらの大規模なゲノムの変化を観察することが可能となった。これは、調査される各DSB部位について、この方法では、1対の隣接座位特異的なプライマーではなく、ただ1つの固定された末端にアンカーされる、座位特異的なネステッドプライマーのみが使用されるからである(図10A)。したがって、AMPに基づいたシークエンシングは、DSBにおいてインデル変異が生じているかどうかを同定するだけでなく、DSBが別の配列に結合されているかどうかも検出することができる。
本発明者らが調査した5種のRGNについて、AMPシークエンシングにより、RGNで誘発されるオンターゲットおよびオフターゲットのDSBが多様な転座に関与しうることが明らかにされた(図10B)。少なくとも1つの場合において、本発明者らは、1対のDSBから結果として生じる4種すべての起こりうる転座事象を観察することができた(図10C)。2つのDSBが同じ染色体上に存在した場合に、本発明者らは、大きな欠失および逆位も観察した(図10B)。少なくとも1つの場合では、本発明者らは、RGNで誘発された2つの切断間の大きな欠失ならびに同じ介在性配列の逆位の両方を観察した(図10D)。重要なことに、本発明者らの結果は、RGNで誘発されたDSBとRGN非依存性DSBとの間の転座(および欠失または逆位)も明らかにし(図10B)、細胞ゲノムに対するRGNのオフターゲット作用を評価するときに、これらの2つの型の切断の間の相互作用が考慮される必要があることが示唆された。本発明者らのデータは、これらの大規模なゲノム再編成の頻度がきわめて低くなる可能性が高いことを示唆しているが、正確な定量化は、本発明者らの既存のデータセットのシークエンシングの深さではできなかった。シークエンシングの読みの数を増やすことにより、検出の感度が高められ、これらの重要なゲノムの変化のより良好な定量化が可能となるはずである。
トランケートされたgRNAによって指向されるRGNのGUIDE−Seqプロファイル
本発明者らのグループによる以前の研究は、全長gRNAs27によって指向されるRGNの既知のオフターゲット部位におけるトランケートされた17または18ntの相補性領域を有するgRNAの使用により、変異頻度が低下されうることを示している27。しかし、この解析は少数の既知のオフターゲット部位に限定されていたので、これらのトランケートされたgRNA(tru−gRNA)のゲノムワイドな特異性は、本発明者らの以前の実験では不明確なままであった。本発明者らは、3種のtru−gRNAによって指向されるRGNのゲノムワイドなDSBプロファイルを得るためにGUIDE−Seqを使用したが、そのそれぞれは、本発明者らが上記でアッセイした10種の全長gRNAのうちの1つのより短いバージョンである。
本発明者らの結果は、3つのすべての場合において、GUIDESeqによって同定されるオフターゲット部位の総数は、tru−gRNAの使用で実質的に減少されたことを示している(図11A〜D)。GUIDE−Seqの読みのマッピングにより、本発明者らが、オンターゲット(図11E)およびオフターゲット(図示せず)部位の切断位置を正確に同定することが可能となった。予想されたように、かつ本発明者らが全長gRNAで観察したように、オフターゲット部位のリストに含まれていたのは、3種のtru−gRNAによって指向されるRGNについての12個の既知のオフターゲット部位のうちの10個であった(図11F〜H)。本発明者らが同定したオフターゲット部位の配列は、プロトスペーサー内に1つまたは2つのミスマッチを主に有していたが、一部の部位は、4つも有していた(図11F〜H)。さらに、一部の部位は、NAG、NGA、およびNTGの形態の代替のPAM配列を有していた(図11F〜H)。これらのデータは、gRNAのトランケーションがRGNのオフターゲット作用を実質的に低減できることのゲノムワイドな規模での確認を可能にし、RGNプラットフォームについての特異性の向上を評価するためにGUIDESeqが使用されうる方法を示す。
考察
GUIDE−Seqは、RGNで誘発されたDSBを検出するための、バイアスのない、高感度、かつゲノムワイドな方法を可能にする。該方法は、オフターゲット部位の性質についての仮説をたてること(例えば、オフターゲット部位が配列においてオンターゲット部位に密接に関連すると推定すること)なくDSBを検出するのでバイアスがない。GUIDE−Seqは、エクソン、イントロン、および遺伝子間領域内を含む、オフターゲット部位をゲノムワイドに同定し、最大6つのプロトスペーサーミスマッチおよび/または、以前の研究5、23に記載されている代替のNAGおよびNGA配列以外の、新しいミスマッチのPAM部位を有していた。この実施例において本発明者らが調査したRGNでは、GUIDE−Seqにより、すべての既知のオフターゲット部位の同定が成功しただけでなく、何百もの新しい部位も同様に明らかにされた。
ヒト細胞においてすべてのRGNオフターゲット部位を包括的に同定するための実際的な黄金標準方法が現在ないことにより、本発明者らはGUIDE−Seqの確実性を有する感度を知ることができなくなっているが、本発明者らは、以下の理由で、それが低い偽陰性率を有する可能性がきわめて高いと考えている:第一に、RGNで誘発された平滑末端化されたすべてのDSBは、平滑末端化されたdsODNをNHEJによって取り込むはずであり、仮説は、GUIDE−Seqの読み数(これはdsODNの取り込みを測定する)とRGNの存在下におけるインデル頻度(これはDSB形成およびそれらのうちの変異誘発性修復の率を測定する)との間で本発明者らが観察する強い相関によって支持された(図7B〜F)。本発明者らは、これらの相関が、広範囲のインデル変異生成頻度を示す130を超える部位を含むことを注記する。第二に、以前に同定されたオフターゲット部位をベンチマークとして使用して(これは、現在、成功を判断する唯一の方法である)、GUIDE−Seqは、0.12%の低さまで広がっている一範囲の変異生成頻度を示す40個のこれらの部位のうちの38個を検出することができた。この方法は、4種の全長gRNAについての28個すべての既知のオフターゲット部位および3種のtru−gRNAについての12個の既知のオフターゲット部位のうちの10個を検出した。検出されなかった2つのオフターゲット部位のうちの1つは、本発明者らの生のデータにおいて捕捉の証拠を示したが、シークエンシングの読みが一方向だけであってかつただ1つのプライマーに由来していたので本発明者らの読みの判定アルゴリズムによって除かれた(方法)。(この部位についての二方向のマッピングの読みがないのは、読みを正確にマップすることを難しくさせている片側のオフターゲット部位上の反復領域が原因である可能性があった。)他の検出されないオフターゲット部位は以前に記載されている。
重要なことに、本発明者らが評価したRGNのうちの1つは、(GUIDE−Seq法の現在の検出限界で)いかなる検出可能なオフターゲット作用も生じず、一部のgRNAがきわめて少ない望ましくない変異を誘導する、またはおそらく全く誘導しない、という興味深い可能性を高めた。
本発明者らの検証実験は、GUIDE−Seqが、0.1%という低い頻度でRGNによって変異誘発されるオフターゲット部位を感度良く検出できることを示しているが、その検出能力は、いくらかの簡単な変更でさらに改良されうる。インデルを検出するために次世代シークエンシングを使用する戦略は、プラットフォームの誤り率(典型的には約0.1%)によって制限される。対照的に、GUIDE−Seqは、インデルではなくdsODN挿入部位を同定するためにシークエンシングを使用し、したがって、誤り率によって制限されるのではなく、シークエンシングの深さによって制限される。例えば、本発明者らは、本発明者らのシークエンシング検証実験において本発明者らがインデルを見出さなかった本発明者らのGUIDE−Seq実験において検出される少数の部位が、0.1%未満のインデル変異頻度を有する可能性の高い部位を実際に表すと考えている。これと一致して、本発明者らは、これらの26部位のうち3つ以外のすべては、100未満のGUIDE−Seq読み数を有したことを注記する。まとめると、これらの知見により、本発明者らが、単にシークエンシングの読みの数を増加させることによって(および増幅のために鋳型として使用されるゲノムの数を増大させることによって)GUIDE−Seqの感度を増大させることができうることが示唆される。例えば、1000倍多くの読みが得られるシークエンシングプラットフォームの使用により、検出が可能となるはずである。
本発明者らのGUIDE−Seq実験によって可能となった直接的な比較により、RGNオフターゲット部位を予測するための2つの既存のコンピュータプログラムの限界が示される。これらのプログラムは、GUIDE−Seqによって見出される真正のオフターゲット部位を同定するのに失敗していただけでなく、切断を示さない多くの部位を過判定もしていた。これは、これらのプログラムによって使用されるパラメーターが、本発明者らのGUIDE−Seq実験によって同定されたより多数のプロトスペーサーミスマッチおよび代替のPAM配列を説明しないというオフターゲット部位の性質についてのより限定的な仮定に基づいていたのであれば全く驚くべきことではない。より良好な予測的プログラムが将来開発されうる可能性があるが、そうするためには、より多数のRGNについての実験的に決定されたゲノムワイドなオフターゲット部位が必要とされることになる。こうしたプログラムが開発されうるまで、オフターゲット部位の同定は、GUIDE−Seqなどの実験法によって最も効果的に対処されることになる。
本発明者らの実験結果は、dCas9のオフターゲット結合部位とCas9のオフターゲット切断部位との間の明らかな相違を詳しく説明する。4種の異なるgRNAについてのdCas9のChIP−SeqおよびCas9のGUIDE−Seqのデータの比較により、2セットの部位間でごくわずかな直接的な重複があることおよび2クラスの部位におけるミスマッチの平均数が実際に実質的に異なることが示される。さらに、本発明者らは、Cas9によって変異誘発されると以前に報告されている少数のdCas9結合部位でさえも、RGNで誘発される真正の切断部位ではない可能性がきわめて高いことを示している。まとめると、本発明者らの結果は、ChIP−Seqで捕捉されているDNA部位に対するdCas9の結合が、Cas9ヌクレアーゼによるDNA部位の切断というよりも異なる生物学的プロセスを表していることを示し、プロトスペーサーとのgRNAの5’末端の結合が効率的な切断に必要とされることを示している近年の研究の結果19と一致している。ChIP−Seqアッセイは、dCas9融合タンパク質のゲノムワイドな結合の特徴付けにおける役割を疑いなく有するであろうが、その方法は、触媒的に活性なRGNのゲノムワイドなオフターゲット切断部位を決定するのには明らかに有効でない。
GUIDE−Seqは、細胞内のDSB部位を同定するための以前に記載されている他のゲノムワイドな方法を超えるいくつかの重要な利点を有する。最近記載されたBLESS(breaks labeling, enrichment on streptavidin and next-generation sequencing:切断標識、ストレプトアビジン上での濃縮および次世代シークエンシング)オリゴヌクレオチドタギング法は、固定され、浸透性にされた細胞上でin situで行われる27。細胞固定に伴う人為的結果を生じやすいことに加えて、BLESSは、一瞬存在する切断物だけを捕捉することになる。対照的に、GUIDE−Seqは、生細胞上で行われ、より長期間の時間(日)にわたって生じるDSBを捕捉し、それによって感度がより高くかつ包括的なアッセイとなっている。DSBの近くの領域内への組み込み欠損レンチウイルス(IDLV)DNAの捕捉およびLAM−PCRによるそれらの座位の同定は、ヒト細胞において改変ジンクフィンガーヌクレアーゼ(ZFN)22および転写活性化因子様エフェクターヌクレアーゼ(TALEN)28についての少数のオフターゲット部位を同定するために使用されてきた。しかし、IDLV組み込み事象は、一般に数が少なく、かつ実際のオフターゲットDSBから500bpも遠くの距離にわたって広範に分散しており22、28、切断事象の位置を正確にマップすることおよび実際のオフターゲット部位の配列を推定することの両方を難しくさせている。さらに、LAM−PCRは、配列のバイアスおよび/またはシークエンシングの読みの低い効率を欠点としている。まとめると、これらの制約により、IDLV捕捉によるより低頻度のZFNオフターゲット切断部位を検出するのは明らかに不可能であることも説明されうる29。対照的に、dsODNは、GUIDE−SeqでDSB内にきわめて効率良くかつ正確に組み込まれ、単一ヌクレオチド分解能での切断のマッピングおよびヌクレアーゼオフターゲット切断部位の簡単で直接的な同定を可能にする。さらに、LAM−PCRとは対照的に、本発明者らのSTAT−PCR法は、効率的な、バイアスのない増幅、およびdsODNが組み込まれているゲノムDNA断片のシークエンシングを可能にする。本発明者らは、STAT−PCRが、GUIDE−Seqにおけるその使用を超えたより一般的な有用性を有しうることを注記する;例えば、ゲノムワイドな規模でウイルスの組み込み部位をマップしようとすることは研究に有用でありうる。
GUIDE−Seqは高感度であるが、その検出能力は、いくらかの簡単な変更でさらに改良しうる。インデルを検出するために次世代シークエンシングを使用する戦略は、プラットフォームの誤り率(典型的には約0.1%)によって制限される。対照的に、GUIDE−Seqは、インデルではなくdsODN挿入部位を同定するためにシークエンシングを使用し、したがって、誤り率によって制限されるのではなく、シークエンシングの深さによって制限される。例えば、本発明者らは、本発明者らのシークエンシング検証実験において本発明者らがインデルを見出さなかった本発明者らのGUIDE−Seq実験において検出される少数の部位が、0.1%未満の変異頻度を有する可能性の高い部位を実際に表すと考えている。これと一致して、本発明者らは、これらの26部位のうち3つ以外のすべては、100未満のGUIDE−Seq読み数を有したことを注記する。まとめると、これらの知見により、本発明者らが、単にシークエンシングの読みの数を増加させることによって(および増幅のために鋳型として使用されるゲノムの数を増大させることによって)GUIDE−Seqの感度を増大させることができうることが示唆される。例えば、1000倍多くの読みが得られるシークエンシングプラットフォームの使用により、位の3桁低い(すなわち、0.0001%の)変異生成頻度を有する部位の検出が可能となるはずであり、本発明者らは、技術における継続した改良でさらなる増大が生じるのを期待する。
本発明者らの実験の予想外の結果は、GUIDE−Seqが、RGNの非存在下でも細胞内で生じる切断点ホットスポットも同定することができたという認識であった。本発明者らのAMPに基づいたシークエンシング実験は、dsODNの捕捉だけでなくこれらの部位におけるインデルの形成も検証したので、本発明者らは、これらのDSBはGUIDE−Seqのただの人為的結果ではないと考えている。重要なことに、多くのホットスポットは本発明者らの研究において調査された2種の細胞系のそれぞれに固有であるが、いくつかは両方に共通しているようである。将来の研究において、1つの細胞型においていくつかの部位が切断点ホットスポットであるが別の細胞型ではそうではない理由を律するパラメーターを定義することは興味深いであろう。さらに、本発明者らの結果は、これらの切断点ホットスポットが転座に関与しうることを示しているので、細胞型特異的な切断点ホットスポットの存在は、特定のゲノム再編成が特定の細胞型のみに生じて他では生じない理由を説明するための一助となる可能性がある。知る限りでは、GUIDE−Seqは、ヒト生細胞において、DNA複製を阻害する薬剤の添加を必要とすることなく、切断点ホットスポットを同定できることが記載される最初の方法である27。したがって、本発明者らは、それが、これらの切断を同定および試験するための有用なツールを提供することになると予想する。
本発明者らの研究は、RGNによって誘発される転座を同定するためのこれまでに記載された最も包括的な定性的アプローチを確立する。GUIDE−Seqによって発見されたRGN誘発性およびRGN非依存性のDSB部位のAMPに基づいた標的化されたシークエンシングは、両クラスの部位に関与する転座、欠失、および逆位を含む大規模なゲノム再編成を見出すことができ、大規模なゲノム再編成を同定するときに両クラスの切断を考慮することの重要性を強調している。さらに、おそらく必ずしもすべてのRGN誘発性またはRGN非依存性のDSBが大規模な変化に関与するわけではないであろうし、いくつかの部位がそれらの再編成に寄与して他の部位はしない理由を理解することは、さらなる研究のために重要な領域となるであろう。
GUIDE−Seqは、ゲノムワイドな規模におけるRGNプラットフォームに対する特異性の改良を評価する重要な手段も提供することになる。この報告において、本発明者らは、トランケートされたgRNAの導入によってどのようにゲノム規模でオフターゲット作用を低減させることができるかを示すためにGUIDE−Seqを使用し、このアプローチが、適合された全長gRNAの既知のオフターゲット部位における変異を低減させうるという本発明者らのグループによる以前の結果30を拡張した。これは、他の細菌もしくは古細菌からの代替のCas9ヌクレアーゼの、または5’オーバーハングを生成する二量体ZFN、TALEN、およびCRISPR RNA誘導型FokIヌクレアーゼ31、32または5’もしくは3’オーバーハングを生成する対になったCas9ニッカーゼ33、34などのヌクレアーゼの、ゲノムワイドな特異性を評価するように適合されてもよい;しかし、GUIDE−Seqを拡張してこれらの他の型のDSBを検出するためには、こうした切断の中へのその効率的な捕捉を確実にするためのdsODNのさらなる修飾および最適化が疑いなく必要となるであろう。この方法は、他の細菌または古細菌からの代替のCas9ヌクレアーゼ35の特異性を評価するためにも使用されうる。本発明者らは、本発明者らが評価した10種のgRNAについてのオフターゲット部位の数におけるきわめて広い変動性を見出したので、1つの重要な注意は、任意の新しいCas9プラットフォームの特異性についての結論を広く出す前に多数のgRNAを調査する必要性である。
GUIDE−SeqおよびAMPに基づいたシークエンシングを使用する本発明者らの例示的なアプローチは、RGNによって誘発されるオフターゲット変異およびゲノム再編成の評価のための新しい黄金標準を確立する。本発明者らは、GUIDE−Seqが、NHEJが活性でありかつ必要とされる成分が効率良く導入されうるあらゆる細胞における使用のために拡張されうることを期待する;例えば、本発明者らは、ヒトK562およびマウス胚性幹細胞において効率的なdsODN組み込みをすでに達成している(データは示されていない)。最も重要なことに、ここに概説されている戦略は、厳しい前臨床経路の一部として、治療的使用のために提唱されるあらゆるRGNの潜在的なオフターゲット作用を客観的に評価して、それによって診療所におけるこれらの試薬の使用のための見込みを実質的に改善するために使用しうる。
本方法の一部の実施形態において使用されうるdsODNについての必要条件を探索するために、さらなる実験を行った。
以下のdsODNsを、実施例3の実験において使用した:
最初に、EGFPに対して標的化されたTALEN、ZFN、およびRFNを使用して、3つの型のdsODNの組み込み頻度を評価した。2E5 U2OS−EGFP細胞は、500ngの各TALENモノマー(合計1ug)、500ngの各ZFNモノマー(合計1ug)、または325ngのマルチプレックスgRNAプラスミドおよび975ngのFokI−dCas9発現プラスミドならびに100pmolのdsODNでヌクレオフェクトした。使用された3種のdsODNは、5’ホスホロチオエート結合を有する4bpの5’オーバーハング、3’ホスホロチオエート結合を有する4bpの3’オーバーハングのいずれかを有していた、または5’および3’ホスホロチオエート結合を有する平滑末端であった。すべてのdsODNは、5’リン酸化されていた。組み込み頻度は、NdeI制限断片長多型(RFLP)アッセイで推定し、キャピラリー電気泳動を使用して定量化した;簡単に説明すると、標的部位は、単離されたゲノムDNAからPCRによって増幅した。PCRは、NdeI制限酵素(20U)で37℃で3時間消化し、1.8× Ampure XPで精製した。精製された切断産物は、Qiaxcelキャピラリー電気泳動機器(Qiagen)によって泳動および定量化した。図16Aは、5’リン酸化され、かつ3’ホスホロチオエート化された、平滑末端化したdsODNが最も高い組み込み率を有していたことを示している。
上記で使用された同じオリゴ(配列番号1および2)を、Lonza Nucleofector 4−D上で製造業者の説明書に従って20μlの溶液SE(Lonza)中でU2OS細胞内にトランスフェクトした(プログラムDN−100)。500ngの各TALENモノマー(CCR5についてはTAL1252/TAL1301かつAPCについてはTAL2294/2295)および100pmolのdsODNをトランスフェクトした。図16B〜Cは、(上記の)NdeI制限断片長多型(RFLP)解析またはT7E1アッセイによって決定されるような、U2OS細胞における2つの内在性標的部位、CCR5およびAPCでTALENによって誘発される二本鎖切断(DSB)の中への、平滑末端の、5’リン酸化された、34bpの二本鎖オリゴデオキシヌクレオチド(dsODN)(oSQT685/686)の効率的な組み込みの証拠を示している(簡単に説明すると、標的部位は、単離されたゲノムDNAからPCRによって増幅した。PCRは、1.8× Ampure XPで精製した。精製されたPCR産物(200ng)は、以下のプロトコールに従ってハイブリダイズした:95℃5分間、−2℃/秒で95〜85℃、−1℃/10秒で85〜25℃;10℃で維持する。T7エンドヌクレアーゼI(10U)を反応物に添加し、これを37℃で15分間インキュベートした。反応物は、EDTA(25mM)の添加によって停止し、1.8× Ampure XPで精製した。精製された切断産物は、Qiaxcelキャピラリー電気泳動機器(Qiagen)によって泳動および定量化した)。
さらなる実験を行い、2E5 U2OS−EGFP細胞を、325ngのマルチプレックスgRNAプラスミドおよび975ngのFokI−dCas9発現プラスミドならびに100pmolのdsODNでヌクレオフェクトした。さらに、3E5マウスES細胞を、200ngの単一gRNAプラスミドおよび600ngのCas9発現プラスミド、ならびに100pmolのdsODNでヌクレオフェクトした。2種のdsODNについて以下を比較した:1)平滑末端、リン酸化、5’および3’ホスホロチオエート修飾および2)平滑末端、リン酸化、3’ホスホロチオエート修飾のみ。組み込み頻度は、NdeI制限断片長多型(RFLP)アッセイで推定し、キャピラリー電気泳動を使用して定量化した。
実験は、ヒトU2OS細胞においてダイマーRNA誘導型FokIヌクレアーゼで(図17A)、またはマウスES細胞において標準Cas9で(図17B)行い、3’ホスホロチオエート修飾のみを有するdsODNが最も高い割合の組み込みを有していたことが示された。
マウスES細胞において異なる濃度の3’ホスホロチオエート修飾されたオリゴを試験するために、さらなる実験を行った。3E5マウスES細胞は、200ngの単一gRNAプラスミドおよび600ngのCas9発現プラスミド、ならびに下記のような異なる量のdsODNでヌクレオフェクトした。平滑末端の、リン酸化された、3’のみホスホロチオエート修飾されたdsODNをこの実験において使用した。精製dsODNと未精製dsODNとの間の比較では、アニールされたオリゴは、Sephadex G−25カラムを使用して精製した。dsODNは、1、2、5、10、25、50、および100pmolの濃度で試験した。組み込み頻度は、NdeI制限断片長多型(RFLP)アッセイで推定し、キャピラリー電気泳動を使用して定量化した。結果は、図18Aおよび18Bに示されており、50pmolまたは100pmolが最高の活性をもたらしたことを示した。Sephadex G−25カラムを通してのオリゴの精製は、割合を有意に高めなかった(図18Aおよび18Bを参照されたい)。変異生成頻度はT7E1アッセイによって推定し、これにより、3’修飾されたdsODNの存在下であっても、破壊の一般的な割合が高かったことが示された。
dsODNの長さも評価した。図20A〜Bは、より長い(例えば、60bp)dsODNタグが、CRISPR−Cas9で誘発されたDSBの部位で効率良く組み込まれたことを示している。これらのより長いdsODNは、PCR増幅の人為的結果のバイオインフォマティクス的選別を可能にすることによってGUIDE−seqの精度を向上させるために使用されうる。これらの配列は、より長いタグ内に存在する配列が含まれていなかったすべてのものとして認識されうる。
これらの実験により、dsODNタグ取り込みの効率は、5’および3’末端の両方よりもむしろ3’上のみで修飾されている、より長い、オリゴを使用することによって高められうること、および形質転換したがん細胞系由来ではない細胞(例えば、マウスES細胞)を含む多様な細胞系においてdsODNタグの効率的な捕捉が生じることが示される。
この実施例では、GUIDE−seq dsODNタグのビオチン化バージョンを、ゲノムのDSBの部位の中への組み込みのための基質として使用した。実施例4に示されているように、こうしたオリゴを効率良く組み込むことが可能であった。実験は、IDT DNAから得られた、ビオチン化dsODNを使用して、上記のように行った。
図19A〜Bは、U2OS細胞における3つの内在性標的部位、VEGFA3、EMX1、およびFANCF1でCas9によって誘発される二本鎖切断(DSB)の中へのビオチン化されたdsODNタグの効率的な組み込みについての証拠を提供する。この向上により、ビオチンとストレプトアビジンの強固な結合親和性を利用することによるタグ付き断片の直接的な物理的捕捉を可能にしうる。(A)RFLP解析により、U2OS細胞における3つの内在性標的部位、VEGFA3、EMX1、およびFANCF1でCas9によって誘発されるDSBの中への標準dsODN(oSQT685/686)と比較した、ビオチン化されたdsODN(oSQT1261/1262)の組み込み率(%)が示される。(b)T7EIにより、U2OS細胞における3つの内在性標的部位、VEGFA3、EMX1、およびFANCF1での標準dsODN(oSQT685/686)と比較した、ビオチン化されたdsODN(oSQT1261/1262)での推定変異生成頻度(%)が示される。
ビオチン化が細胞内で維持されるとすると、これを使用して、ビオチン化されたssODNを含むDNA断片を物理的にプルダウンすること、ならびに捕捉された断片をシークエンスおよびマップすることができる。
本実施例では、例示的なGUIDE−Seq法を、バリアントCas9タンパク質と共に使用する。
バリアントの化膿レンサ球菌(Streptococcus pyogenes)Cas9(SpCas9)および黄色ブドウ球菌(Staphylococcus aureus)Cas9(SaCas9)タンパク質は、参照により本明細書に組み込まれている、米国特許出願公開第61/127,634号明細書および第62/165,517号明細書、ならびにKleinstiver et al., "Engineered CRISPR-Cas9 nucleases with altered PAM specificities." Nature (2015) doi:10.1038/nature14592に記載のように作製した。オフターゲット作用は、上記のように評価した。
図21は、EMX1、FANCF、RUNX1、VEGFA、またはZNF629を標的とするsgRNA(配列については表4を参照されたい)を使用した、D1135V/R1335Q/T1337R(VQRバリアント)またはD1135V/G1218R/R1335E/T1337R(VRERバリアント)における変異を含む改変SpCas9バリアントについてのGUIDE−seqによって同定されたオフターゲット切断部位の数を示している。これは、GUIDE−seqが、Cas9の改変バージョンのゲノムワイドな特異性をプロファイルするのにも使用されうることを実証している。GUIDE−seqは、ヒト細胞においてNGAまたはNGCG PAMを含む内在性部位を標的とすることによってVQRおよびVRER SpCas9バリアントの特異性プロファイルを決定するためにも使用した。
図22は、本明細書に記載の例示的なGUIDE−seq法を使用して検出されたオフターゲット部位での野生型とD1135E SpCas9バリアントとの間の特異性における変化を示している。GUIDE−seqは、3つの内在性のヒト細胞の部位での野生型SpCas9とD1135Eとの間の読み数の相違を決定するためにも使用した。
GUIDE−seq dsODNタグ組み込みも、野生型および改変Cas9 D1135Eバリアントで3つの遺伝子において行った。結果は、図23A〜Bに示されているが、GUIDE−seqが改変Cas9バリアントのプロファイルに使用されうるというさらなる証拠を示している。
参考文献
1. Sander, J.D. & Joung, J.K. CRISPR-Cas systems for editing, regulating and targeting genomes. Nat Biotechnol 32, 347-355 (2014).
2. Hsu, P.D., Lander, E.S. & Zhang, F. Development and applications of CRISPR-Cas9 for genome engineering. Cell 157, 1262-1278 (2014).
3. Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).
4. Fu, Y. et al. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells. Nat Biotechnol 31, 822-826 (2013).
5. Hsu, P.D. et al. DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol 31, 827-832 (2013).
6. Pattanayak, V. et al. High-throughput profiling of off-target DNA cleavage reveals RNA-programmed Cas9 nuclease specificity. Nat Biotechnol 31, 839-843 (2013).
7. Cradick, T.J., Fine, E.J., Antico, C.J. & Bao, G. CRISPR/Cas9 systems targeting beta-globin and CCR5 genes have substantial off-target activity. Nucleic Acids Res 41, 9584-9592 (2013).
8. Cho, S.W. et al. Analysis of off-target effects of CRISPR/Cas-derived RNA-guided endonucleases and nickases. Genome Res 24, 132-141 (2014).
9. Ghezraoui, H. et al. Chromosomal translocations in human cells are generated by canonical nonhomologous end-joining. Mol Cell 55, 829-842 (2014).
10. Choi, P.S. & Meyerson, M. Targeted genomic rearrangements using CRISPR/Cas technology. Nat Commun 5, 3728 (2014).
11. Gostissa, M. et al. IgH class switching exploits a general property of two DNA breaks to be joined in cis over long chromosomal distances. Proc Natl Acad Sci U S A 111, 2644-2649 (2014).
12. Tsai, S.Q. & Joung, J.K. What's changed with genome editing? Cell Stem Cell 15, 3-4 (2014).
13. Marx, V. Gene editing: how to stay on-target with CRISPR. Nat Methods 11, 1021-1026 (2014).
14. Veres, A. et al. Low incidence of off-target mutations in individual CRISPR-Cas9 and TALEN targeted human stem cell clones detected by whole-genome sequencing. Cell Stem Cell 15, 27-30 (2014).
15. Smith, C. et al. Whole-genome sequencing analysis reveals high specificity of CRISPR/Cas9 and TALEN-based genome editing in human iPSCs. Cell Stem Cell 15, 12-13 (2014).
16. Duan, J. et al. Genome-wide identification of CRISPR/Cas9 off-targets in human genome. Cell Res 24, 1009-1012 (2014).
17. Wu, X. et al. Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells. Nat Biotechnol 32, 670-676 (2014).
18. Kuscu, C., Arslan, S., Singh, R., Thorpe, J. & Adli, M. Genome-wide analysis reveals characteristics of off-target sites bound by the Cas9 endonuclease. Nat Biotechnol 32, 677-683 (2014).
19. Cencic, R. et al. Protospacer Adjacent Motif (PAM)-Distal Sequences Engage CRISPR Cas9 DNA Target Cleavage. PLoS One 9, e109213 (2014).
20. Orlando, S.J. et al. Zinc-finger nuclease-driven targeted integration into mammalian genomes using donors with limited chromosomal homology. Nucleic Acids Res 38, e152 (2010).
21. Schmidt, M. et al. High-resolution insertion-site analysis by linear amplification-mediated PCR (LAM-PCR). Nat Methods 4, 1051-1057 (2007).
22. Gabriel, R. et al. An unbiased genome-wide analysis of zinc-finger nuclease specificity. Nat Biotechnol 29, 816-823 (2011).
23. Jiang, W., Bikard, D., Cox, D., Zhang, F. & Marraffini, L.A. RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol 31, 233-239 (2013).
24. Lin, Y. et al. CRISPR/Cas9 systems have off-target activity with insertions or deletions between target DNA and guide RNA sequences. Nucleic Acids Res 42, 7473-7485 (2014).
25. Ran, F.A. et al. Genome engineering using the CRISPR-Cas9 system. Nat Protoc 8, 2281-2308 (2013).
26. Heigwer, F., Kerr, G. & Boutros, M. E-CRISP: fast CRISPR target site identification. Nat Methods 11, 122-123 (2014).
27. Crosetto, N. et al. Nucleotide-resolution DNA double-strand break mapping by next-generation sequencing. Nat Methods 10, 361-365 (2013).
28. Osborn, M.J. et al. TALEN-based gene correction for epidermolysis bullosa. Mol Ther 21, 1151-1159 (2013).
29. Sander, J.D. et al. In silico abstraction of zinc finger nuclease cleavage profiles reveals an expanded landscape of off-target sites. Nucleic Acids Res (2013).
30. Fu, Y., Sander, J.D., Reyon, D., Cascio, V.M. & Joung, J.K. Improving CRISPR-Cas nuclease specificity using truncated guide RNAs. Nat Biotechnol 32, 279-284 (2014).
31. Tsai, S.Q. et al. Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing. Nat Biotechnol 32, 569-576 (2014).
32. Guilinger, J.P., Thompson, D.B. & Liu, D.R. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat Biotechnol 32, 577-582 (2014).
33. Mali, P. et al. CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nat Biotechnol 31, 833-838 (2013).
34. Ran, F.A. et al. Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity. Cell 154, 1380-1389 (2013).
35. Fonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic Acids Res 42, 2577-2590 (2014).
他の実施形態
本発明は、その詳細な説明と併せて記載されているが、上記の記載は、例示することが意図されるものであり、添付の特許請求の範囲の範囲によって定義される、本発明の範囲を制限するものではないことは理解されるべきである。他の態様、利点および改変は、添付の特許請求の範囲の範囲内である。

Claims (19)

  1. 細胞のゲノムDNA内の二本鎖切断(DSB)を検出するための方法であって、
    前記細胞を二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであって、前記dsODNが好ましくは15および50ntの間の長さであり、前記dsODNの両鎖が前記細胞のゲノムにオルソロガスであり、好ましくは、前記dsODNの5’末端がリン酸化されており、さらにまた好ましくは、ホスホロチオエート結合が両方の3’末端に存在する、または2つのホスホロチオエート結合が両方の3’末端および両方の5’末端に存在する、ステップ、
    前記細胞内で外来性の改変ヌクレアーゼを、前記ヌクレアーゼが前記細胞の前記ゲノムDNA内にDSBを誘発するのに十分な時間、かつ前記細胞が前記DSBを修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化させるステップ、
    組み込まれたdsODNを含むゲノムDNAの一部を増幅するステップ、および
    前記ゲノムDNAの増幅された部分をシークエンスするステップ
    を含み、それによって前記細胞の前記ゲノムDNA内のDSBを検出する、方法。
  2. 細胞のゲノムDNA内の二本鎖切断(DSB)を検出するための方法であって、
    前記細胞を二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであって、前記dsODNが好ましくは50および75ntの間の長さであり、前記dsODNの両鎖が前記細胞のゲノムにオルソロガスであり、好ましくは、前記dsODNの5’末端がリン酸化されており、さらにまた好ましくは、ホスホロチオエート結合が両方の3’末端に存在する、または2つのホスホロチオエート結合が両方の3’末端および両方の5’末端に存在する、ステップ、
    前記細胞内で外来性の改変ヌクレアーゼを、前記ヌクレアーゼが前記細胞の前記ゲノムDNA内にDSBを誘発するのに十分な時間、かつ前記細胞が前記DSBを修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化させるステップ、
    組み込まれたdsODNを含むゲノムDNAの一部を増幅するステップ、および
    前記ゲノムDNAの増幅された部分をシークエンスするステップ
    を含み、それによって前記細胞の前記ゲノムDNA内のDSBを検出する、方法。
  3. ゲノムDNAの一部を増幅するステップが、
    前記DNAを断片化すること、
    前記細胞からの断片化されたゲノムDNAの末端をユニバーサルアダプターでライゲーションすること、
    前記組み込まれたdsODNと相補的なプライマー(プライマーA)および前記ユニバーサルアダプターと相補的なプライマー(プライマーB)を用いて、ライゲーションされたDNAに対して1回目のポリメラーゼ連鎖反応(PCR)を行うこと、
    次いで、プライマーAと相補的な3’ネステッドプライマー(プライマーC)、プライマーBと相補的な3’ネステッドプライマー(プライマーD)、およびプライマーDと相補的なプライマー(プライマーE)を使用して2回目のPCRを行うこと
    を含む、請求項1または2に記載の方法。
  4. プライマーEが、
    精製もしくは結合配列、および/または同定配列
    のうちの1つまたは複数を含む、請求項3に記載の方法。
  5. 前記改変ヌクレアーゼが、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ、転写活性化因子エフェクター様ヌクレアーゼ(TALEN)、およびクラスター化された規則的な間隔の短鎖反復回文配列(CRISPR)/Cas RNA誘導型ヌクレアーゼ(CRISPR/Cas RGN)からなる群から選択される、請求項1または2に記載の方法。
  6. 前記DSBがオフターゲットDSBである、請求項1〜5に記載の方法。
  7. 前記DSBが、外来性の改変ヌクレアーゼによって誘発された、請求項1〜5に記載の方法。
  8. 複数のガイドRNAのうちのいずれが最も特異的であるか、すなわち、最も少ないオフターゲットDSBを誘発するかを決定する方法であって、
    第1の細胞の集団を第1のガイドRNAおよび二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであって、前記dsODNが好ましくは15および50ntの間の長さであり、前記dsODNの両鎖が前記細胞のゲノムにオルソロガスであり、好ましくは、前記dsODNの5’末端がリン酸化されており、さらにまた好ましくは、ホスホロチオエート結合が両方の3’末端に存在する、または2つのホスホロチオエート結合が両方の3’末端および両方の5’末端に存在する、ステップ、
    前記第1の細胞の集団内で外来性のCas9改変ヌクレアーゼを、前記ヌクレアーゼが前記細胞のゲノムDNA内にDSBを誘発するのに十分な時間、かつ前記細胞が前記DSBを修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化させるステップ、
    組み込まれたdsODNを含む、前記第1の細胞の集団からのゲノムDNAの一部を増幅するステップ、および
    前記第1の細胞の集団からの前記ゲノムDNAの増幅された部分をシークエンスするステップ、
    前記dsODNが前記第1の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を決定するステップ、
    第2の細胞の集団を第2のガイドRNAおよび二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであって、前記dsODNが好ましくは15および50ntの間の長さであり、前記dsODNの両鎖が前記細胞のゲノムにオルソロガスであり、好ましくは、前記dsODNの5’末端がリン酸化されており、さらにまた好ましくは、ホスホロチオエート結合が両方の3’末端に存在する、または2つのホスホロチオエート結合が両方の3’末端および両方の5’末端に存在する、ステップ、
    前記第2の細胞の集団内で外来性のCas9改変ヌクレアーゼを、前記ヌクレアーゼが前記第2の細胞の集団のゲノムDNA内にDSBを誘発するのに十分な時間、かつ前記細胞が前記DSBを修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化させるステップ、
    組み込まれたdsODNを含む、前記第2の細胞の集団からのゲノムDNAの一部を増幅するステップ、および
    前記第2の細胞の集団からの前記ゲノムDNAの増幅された部分をシークエンスするステップ、
    前記dsODNが前記第2の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を決定するステップ、
    前記dsODNが前記第1の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を、前記dsODNが前記第2の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数と比較するステップ
    を含み、より少ない(オフターゲット)部位で組み込まれた前記dsODNがより特異的である、方法。
  9. 複数のガイドRNAのうちのいずれが最も特異的であるか、すなわち、最も少ないオフターゲットDSBを誘発するかを決定する方法であって、
    第1の細胞の集団を第1のガイドRNAおよび二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであって、前記dsODNが好ましくは50および75ntの間の長さであり、前記dsODNの両鎖が前記細胞のゲノムにオルソロガスであり、好ましくは、前記dsODNの5’末端がリン酸化されており、さらにまた好ましくは、ホスホロチオエート結合が両方の3’末端に存在する、または2つのホスホロチオエート結合が両方の3’末端および両方の5’末端に存在する、ステップ、
    前記第1の細胞の集団内で外来性のCas9改変ヌクレアーゼを、前記ヌクレアーゼが前記細胞のゲノムDNA内にDSBを誘発するのに十分な時間、かつ前記細胞が前記DSBを修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化させるステップ、
    組み込まれたdsODNを含む、前記第1の細胞の集団からのゲノムDNAの一部を増幅するステップ、および
    前記第1の細胞の集団からの前記ゲノムDNAの増幅された部分をシークエンスするステップ、
    前記dsODNが前記第1の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を決定するステップ、
    第2の細胞の集団を第2のガイドRNAおよび二本鎖オリゴデオキシヌクレオチド(dsODN)と接触させるステップであって、前記dsODNが好ましくは50および75ntの間の長さであり、前記dsODNの両鎖が前記細胞のゲノムにオルソロガスであり、好ましくは、前記dsODNの5’末端がリン酸化されており、さらにまた好ましくは、ホスホロチオエート結合が両方の3’末端に存在する、または2つのホスホロチオエート結合が両方の3’末端および両方の5’末端に存在する、ステップ、
    前記第2の細胞の集団内で外来性のCas9改変ヌクレアーゼを、前記ヌクレアーゼが前記第2の細胞の集団のゲノムDNA内にDSBを誘発するのに十分な時間、かつ前記細胞が前記DSBを修復して、1つまたは複数のDSBにおいてdsODNを組み込むのに十分な時間、発現または活性化させるステップ、
    組み込まれたdsODNを含む、前記第2の細胞の集団からのゲノムDNAの一部を増幅するステップ、および
    前記第2の細胞の集団からの前記ゲノムDNAの増幅された部分をシークエンスするステップ、
    前記dsODNが前記第2の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を決定するステップ、
    前記dsODNが前記第1の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数を、前記dsODNが前記第2の細胞の集団の前記ゲノムDNA内に組み込まれた部位の数と比較するステップ
    を含み、より少ない(オフターゲット)部位で組み込まれた前記dsODNがより特異的である、前記方法。
  10. 前記細胞が哺乳動物細胞である、請求項1〜9のいずれかに記載の方法。
  11. 前記改変ヌクレアーゼがCas9ヌクレアーゼであり、前記方法が、前記Cas9ヌクレアーゼを前記ゲノム内の標的配列に導くガイドRNAを前記細胞内で発現させるステップも含む、請求項1〜10のいずれかに記載の方法。
  12. 前記dsODNが30〜35ntの長さまたは60〜65ntの長さである、上記の請求項のいずれかに記載の方法。
  13. 前記dsODNがビオチン化される、上記の請求項のいずれかに記載の方法。
  14. 前記ゲノムgDNAを断片に切断するステップ、および
    dsODNを含む断片を前記ビオチンへの結合によって単離するステップ
    を含む、請求項13に記載の方法。
  15. 前記dsODNが平滑末端である、上記の請求項のいずれかに記載の方法。
  16. 前記dsODNが前記5’末端に1、2、3、または4ntのオーバーハンギングを有する、上記の請求項のいずれかに記載の方法。
  17. 前記dsoDNが、5’末端でリン酸化されており、3’末端でホスホロチオエート化されている、上記の請求項のいずれかに記載の方法。
  18. 前記dsODNが、無作為化されたDNAバーコードを含む、上記の請求項のいずれかに記載の方法。
  19. 上記の請求項のいずれかに記載の方法であって、
    前記ゲノムgDNAを断片に切断するステップ、および
    前記断片を、末端修復/aテーリング/単一テールのシークエンシングアダプターのライゲーションによってシークエンシング用に調製するステップ
    を含む方法。
JP2016575174A 2014-06-23 2015-06-23 シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE−Seq) Active JP6784601B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201462015911P 2014-06-23 2014-06-23
US62/015,911 2014-06-23
US201462077844P 2014-11-10 2014-11-10
US62/077,844 2014-11-10
US201462078923P 2014-11-12 2014-11-12
US62/078,923 2014-11-12
US201462088223P 2014-12-05 2014-12-05
US62/088,223 2014-12-05
PCT/US2015/037269 WO2015200378A1 (en) 2014-06-23 2015-06-23 Genomewide unbiased identification of dsbs evaluated by sequencing (guide-seq)

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020126325A Division JP7095031B2 (ja) 2014-06-23 2020-07-27 シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE-Seq)

Publications (2)

Publication Number Publication Date
JP2017519508A true JP2017519508A (ja) 2017-07-20
JP6784601B2 JP6784601B2 (ja) 2020-11-11

Family

ID=54938752

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2016575174A Active JP6784601B2 (ja) 2014-06-23 2015-06-23 シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE−Seq)
JP2020126325A Active JP7095031B2 (ja) 2014-06-23 2020-07-27 シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE-Seq)
JP2022100619A Active JP7550816B2 (ja) 2014-06-23 2022-06-22 シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE-Seq)

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2020126325A Active JP7095031B2 (ja) 2014-06-23 2020-07-27 シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE-Seq)
JP2022100619A Active JP7550816B2 (ja) 2014-06-23 2022-06-22 シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE-Seq)

Country Status (10)

Country Link
US (3) US9822407B2 (ja)
EP (2) EP3158066B1 (ja)
JP (3) JP6784601B2 (ja)
KR (2) KR102598819B1 (ja)
CN (1) CN106604994B (ja)
AU (3) AU2015280069B2 (ja)
CA (1) CA2953362A1 (ja)
ES (1) ES2888976T3 (ja)
IL (2) IL286474B2 (ja)
WO (1) WO2015200378A1 (ja)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2853829C (en) 2011-07-22 2023-09-26 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
CA2953362A1 (en) 2014-06-23 2015-12-30 The General Hospital Corporation Genomewide unbiased identification of dsbs evaluated by sequencing (guide-seq)
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
AU2015355546B2 (en) 2014-12-03 2021-10-14 Agilent Technologies, Inc. Guide RNA with chemical modifications
WO2016141224A1 (en) 2015-03-03 2016-09-09 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
EP3280803B1 (en) 2015-04-06 2021-05-26 The Board of Trustees of the Leland Stanford Junior University Chemically modified guide rnas for crispr/cas-mediated gene regulation
WO2017044843A1 (en) 2015-09-11 2017-03-16 The General Hospital Corporation Full interrogation of nuclease dsbs and sequencing (find-seq)
CA3000762A1 (en) 2015-09-30 2017-04-06 The General Hospital Corporation Comprehensive in vitro reporting of cleavage events by sequencing (circle-seq)
IL294014B2 (en) 2015-10-23 2024-07-01 Harvard College Nucleobase editors and their uses
US10961573B2 (en) 2016-03-28 2021-03-30 Boreal Genomics, Inc. Linked duplex target capture
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
EP3875603A1 (en) * 2016-07-12 2021-09-08 Life Technologies Corporation Compositions and methods for detecting nucleic acid regions
IL308426A (en) 2016-08-03 2024-01-01 Harvard College Adenosine nuclear base editors and their uses
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
CN110114461A (zh) * 2016-08-17 2019-08-09 博德研究所 新型crispr酶和系统
EP3500670B1 (en) * 2016-08-17 2024-07-10 The Broad Institute, Inc. Method for selecting target sequences for guide rna of crispr systems
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
SG11201903089RA (en) 2016-10-14 2019-05-30 Harvard College Aav delivery of nucleobase editors
CN108070610B (zh) * 2016-11-08 2021-11-09 中国科学院分子植物科学卓越创新中心 植物基因组定点敲入方法
CA3048420A1 (en) 2016-12-09 2018-06-14 Boreal Genomics, Inc. Linked ligation
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
EP4095263A1 (en) 2017-01-06 2022-11-30 Editas Medicine, Inc. Methods of assessing nuclease cleavage
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
JP7191388B2 (ja) 2017-03-23 2022-12-19 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN106939303B (zh) * 2017-05-16 2021-02-23 上海交通大学 一种Cas9核酸酶R919P及其用途
KR102634727B1 (ko) * 2017-06-14 2024-02-07 위스콘신 얼럼나이 리서어치 화운데이션 변형된 가이드 rna, crispr-리보뉴클레오프로테인 복합체 및 사용 방법
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
BR112020003596A2 (pt) 2017-08-23 2020-09-01 The General Hospital Corporation nucleases de crispr-cas9 engenheiradas com especificidade de pam alterada
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
EP3694993A4 (en) 2017-10-11 2021-10-13 The General Hospital Corporation METHOD OF DETECTING A SITE-SPECIFIC AND UNDESIRED GENOMIC DESAMINATION INDUCED BY BASE EDITING TECHNOLOGIES
CN111757937A (zh) 2017-10-16 2020-10-09 布罗德研究所股份有限公司 腺苷碱基编辑器的用途
WO2019165168A1 (en) 2018-02-23 2019-08-29 Pioneer Hi-Bred International, Inc. Novel cas9 orthologs
WO2019204378A1 (en) 2018-04-17 2019-10-24 The General Hospital Corporation Sensitive in vitro assays for substrate preferences and sites of nucleic acid binding, modifying, and cleaving agents
WO2019217785A1 (en) 2018-05-10 2019-11-14 St. Jude Children's Research Hospital, Inc. High-throughput method for characterizing the genome-wide activity of editing nucleases in vitro
WO2020039261A1 (en) 2018-08-23 2020-02-27 Boreal Genomics, Inc. Linked target capture and ligation
WO2020076976A1 (en) 2018-10-10 2020-04-16 Readcoor, Inc. Three-dimensional spatial molecular indexing
CN113166744A (zh) 2018-12-14 2021-07-23 先锋国际良种公司 用于基因组编辑的新颖crispr-cas系统
US11473136B2 (en) 2019-01-03 2022-10-18 Ncan Genomics, Inc. Linked target capture
WO2020191243A1 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
CN114072522A (zh) * 2019-06-10 2022-02-18 博雷亚尔基因组学有限公司 连接的靶标捕获
EP3999651A4 (en) * 2019-08-26 2023-07-26 PACT Pharma, Inc. METHODS FOR PERFORMING GUIDED SEQUENCING ON PRIMARY HUMAN T LYMPHOCYTES
US20220340966A1 (en) * 2019-09-09 2022-10-27 Oregon Health & Science University Crispr-mediated capture of nucleic acids
DE112021002672T5 (de) 2020-05-08 2023-04-13 President And Fellows Of Harvard College Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz
JP2023526267A (ja) * 2020-05-13 2023-06-21 エフ. ホフマン-ラ ロシュ アーゲー プログラニュリン標的オリゴヌクレオチドアゴニスト
JP2023535407A (ja) * 2020-07-23 2023-08-17 インテグレーティッド ディーエヌエイ テクノロジーズ インコーポレーティッド 「CTL-seq」(CRISPR Tag Linear-seq)と称するヌクレアーゼオン/オフターゲット編集位置を指定するための方法
CN112159838B (zh) * 2020-09-30 2022-07-01 南方医科大学 一种检测脱靶效应方法及其应用
CN112501165A (zh) * 2020-11-12 2021-03-16 珠海舒桐医疗科技有限公司 一种生物素化的dsODN及其构建GUIDE-pro库的方法
CN113512535A (zh) * 2021-04-30 2021-10-19 华东师范大学 改变细胞内基因组序列的方法、基因编辑细胞及应用
CN113403309B (zh) * 2021-05-24 2022-08-16 珠海舒桐医疗科技有限公司 非同源双链寡聚核苷酸片段在基因敲除系统中的应用
CN113564227A (zh) * 2021-07-29 2021-10-29 翌圣生物科技(上海)股份有限公司 基于CRISPR/dcas9的宿主与病原微生物DNA快速分离方法
JP2024534945A (ja) 2021-09-10 2024-09-26 アジレント・テクノロジーズ・インク 化学修飾を有するプライム編集のためのガイドrna
EP4321630A1 (en) * 2022-08-09 2024-02-14 Institute of Molecular Biology gGmbH (IMB) Method of parallel, rapid and sensitive detection of dna double strand breaks
WO2024033378A1 (en) * 2022-08-09 2024-02-15 Institute Of Molecular Biology Ggmbh (Imb) Method of parallel, rapid and sensitive detection of dna double strand breaks
CN115851720A (zh) * 2022-09-29 2023-03-28 细胞生态海河实验室 基因敲入方法及其在构建内源性融合基因和原代细胞基因敲入中的应用
CN116206684B (zh) * 2022-12-26 2024-01-30 纳昂达(南京)生物科技有限公司 一种评估基因组重复区探针捕获安全性的方法及其装置
WO2024157194A1 (en) * 2023-01-25 2024-08-02 Crispr Therapeutics Ag Methods and assays for off-target analysis

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013518602A (ja) * 2010-02-09 2013-05-23 サンガモ バイオサイエンシーズ, インコーポレイテッド 部分的に一本鎖のドナー分子による標的化ゲノム改変
US20130143204A1 (en) * 2010-01-14 2013-06-06 Ospedale San Raffaele Srl Determination of in vivo dna double-strand break localization and application thereof

Family Cites Families (112)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2195562A1 (en) 1994-08-19 1996-02-29 Pe Corporation (Ny) Coupled amplification and ligation method
USRE39229E1 (en) 1994-08-20 2006-08-08 Gendaq Limited Binding proteins for recognition of DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6503717B2 (en) 1999-12-06 2003-01-07 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
CA2364267A1 (en) * 1999-02-19 2000-08-24 Athersys, Inc. Compositions and methods for non-targeted activation of endogenous genes
US7501245B2 (en) 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
WO2001083819A2 (en) 2000-04-28 2001-11-08 Sangamo Biosciences, Inc. Methods for designing exogenous regulatory molecules
US20030064366A1 (en) 2000-07-07 2003-04-03 Susan Hardin Real-time sequence determination
WO2004099366A2 (en) 2002-10-23 2004-11-18 The General Hospital Corporation Context sensitive parallel optimization of zinc finger dna binding domains
US7575865B2 (en) 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
WO2005039389A2 (en) 2003-10-22 2005-05-06 454 Corporation Sequence-based karyotyping
EP1526177A1 (en) * 2003-10-24 2005-04-27 Institut Curie Nucleic acids useful for triggering tumor cell lethality
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
CA2559209C (en) 2004-03-08 2016-06-07 Rubicon Genomics, Inc. Methods and compositions for generating and amplifying dna libraries for sensitive detection and analysis of dna methylation
WO2006044078A2 (en) 2004-09-17 2006-04-27 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
ATE510930T1 (de) 2005-08-02 2011-06-15 Rubicon Genomics Inc Zusammensetzungen und verfahren zur bearbeitung und amplifikation von dna mit verwendung mehrerer enzyme in einer einzigen reaktion
US10066233B2 (en) 2005-08-26 2018-09-04 Dupont Nutrition Biosciences Aps Method of modulating cell resistance
JP2009515896A (ja) * 2005-11-11 2009-04-16 ファイザー・インク 免疫調節性オリゴデオキシヌクレオチドを使用する併用療法
US7282337B1 (en) 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
TR201905633T4 (tr) 2007-03-02 2019-05-21 Dupont Nutrition Biosci Aps İyileştirilmiş faj direnci olan kültürler.
CA2691440A1 (en) * 2007-06-29 2009-01-08 Pioneer Hi-Bred International, Inc. Methods for altering the genome of a monocot plant cell
US8299237B2 (en) * 2007-08-30 2012-10-30 Hadasit Medical Research Services & Development Ltd. Nucleic acid sequences comprising NF-κB binding site within O(6)-methylguanine-DNA-methyltransferase (MGMT) promoter region and uses thereof for the treatment of cancer and immune-related disorders
US8029993B2 (en) 2008-04-30 2011-10-04 Population Genetics Technologies Ltd. Asymmetric adapter library construction
US8546553B2 (en) 2008-07-25 2013-10-01 University Of Georgia Research Foundation, Inc. Prokaryotic RNAi-like system and methods of use
EP2334802A4 (en) * 2008-09-09 2012-01-25 Life Technologies Corp METHODS OF GENERATING SPECIFIC LIBRARIES OF GENES
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
WO2010054108A2 (en) 2008-11-06 2010-05-14 University Of Georgia Research Foundation, Inc. Cas6 polypeptides and methods of use
EP2367938B1 (en) 2008-12-12 2014-06-11 DuPont Nutrition Biosciences ApS Genetic cluster of strains of streptococcus thermophilus having unique rheological properties for dairy fermentation
CN102301009B (zh) * 2009-02-03 2015-09-30 新英格兰生物实验室公司 使用酶在dna中产生随机双链断裂
WO2011017293A2 (en) 2009-08-03 2011-02-10 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
JP5387839B2 (ja) 2009-09-04 2014-01-15 アイシン・エィ・ダブリュ株式会社 ナビゲーション装置、ナビゲーション方法、及びナビゲーションプログラム
US9404099B2 (en) * 2009-11-27 2016-08-02 Basf Plant Science Company Gmbh Optimized endonucleases and uses thereof
US9023769B2 (en) 2009-11-30 2015-05-05 Complete Genomics, Inc. cDNA library for nucleic acid sequencing
US10087431B2 (en) 2010-03-10 2018-10-02 The Regents Of The University Of California Methods of generating nucleic acid fragments
CN103003449A (zh) 2010-05-06 2013-03-27 艾比斯生物科学公司 集成样品制备系统和稳定的酶混合物
BR112012028805A2 (pt) 2010-05-10 2019-09-24 The Regents Of The Univ Of California E Nereus Pharmaceuticals Inc composições de endorribonuclease e métodos de uso das mesmas.
WO2012040387A1 (en) 2010-09-24 2012-03-29 The Board Of Trustees Of The Leland Stanford Junior University Direct capture, amplification and sequencing of target dna using immobilized primers
US8829171B2 (en) 2011-02-10 2014-09-09 Illumina, Inc. Linking sequence reads using paired code tags
EP3702460A1 (en) 2010-11-12 2020-09-02 The General Hospital Corporation Polycomb-associated non-coding rnas
JP6017458B2 (ja) 2011-02-02 2016-11-02 ユニヴァーシティ・オブ・ワシントン・スルー・イッツ・センター・フォー・コマーシャリゼーション 大量並列連続性マッピング
EP2714928B1 (en) * 2011-05-27 2017-08-02 Life Technologies Corporation Methods for manipulating biomolecules
US20140113376A1 (en) 2011-06-01 2014-04-24 Rotem Sorek Compositions and methods for downregulating prokaryotic genes
CA2853829C (en) 2011-07-22 2023-09-26 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
WO2013078470A2 (en) * 2011-11-22 2013-05-30 MOTIF, Active Multiplex isolation of protein-associated nucleic acids
CN102373288B (zh) 2011-11-30 2013-12-11 盛司潼 一种对目标区域进行测序的方法及试剂盒
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
EP4026912A1 (en) 2012-05-10 2022-07-13 The General Hospital Corporation Methods for determining a nucleotide sequence
DK2800811T3 (en) 2012-05-25 2017-07-17 Univ Vienna METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION
CN104619894B (zh) 2012-06-18 2017-06-06 纽亘技术公司 用于非期望核酸序列的阴性选择的组合物和方法
WO2014008447A1 (en) 2012-07-03 2014-01-09 Integrated Dna Technologies, Inc. Tm-enhanced blocking oligonucleotides and baits for improved target enrichment and reduced off-target selection
US20140024542A1 (en) 2012-07-17 2014-01-23 Counsyl, Inc. Methods and compositions for enrichment of target polynucleotides
KR101890466B1 (ko) 2012-07-24 2018-08-21 내테라, 인코포레이티드 고도의 다중 pcr 방법 및 조성물
US10155941B2 (en) 2012-08-01 2018-12-18 Bernhard Suter High throughput yeast two-hybrid screening method and reagent kit
WO2014071070A1 (en) 2012-11-01 2014-05-08 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
CN104903466B (zh) 2012-11-05 2016-11-23 鲁比康基因组学公司 条形编码核酸
EP3031921A1 (en) 2012-12-12 2016-06-15 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
WO2014093655A2 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
EP4286402A3 (en) 2012-12-12 2024-02-14 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP2931899A1 (en) * 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
KR20150105633A (ko) 2012-12-12 2015-09-17 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작을 위한 시스템, 방법 및 최적화된 가이드 조성물의 조작
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
SG11201504523UA (en) 2012-12-12 2015-07-30 Broad Inst Inc Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
DK3064585T3 (da) 2012-12-12 2020-04-27 Broad Inst Inc Konstruering og optimering af forbedrede systemer, fremgangsmåder og enzymsammensætninger til sekvensmanipulation
JP6473419B2 (ja) 2012-12-13 2019-02-20 ダウ アグロサイエンシィズ エルエルシー 部位特異的ヌクレアーゼ活性のdna検出方法
CA2897932A1 (en) 2013-01-14 2014-07-17 Recombinetics, Inc. Hornless livestock
US20140212869A1 (en) 2013-01-25 2014-07-31 Agilent Technologies, Inc. Nucleic Acid Proximity Assay Involving the Formation of a Three-way junction
US10227610B2 (en) 2013-02-25 2019-03-12 Sangamo Therapeutics, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
EP2971167B1 (en) 2013-03-14 2019-07-31 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
US20140349400A1 (en) 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
IL289396B2 (en) 2013-03-15 2023-12-01 The General Hospital Coporation Using tru-grnas to increase the specificity of RNA-guided genome editing
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
KR102192599B1 (ko) 2013-04-05 2020-12-18 다우 아그로사이언시즈 엘엘씨 식물의 게놈 내의 외인성 서열의 통합을 위한 방법 및 조성물
RS62263B1 (sr) 2013-04-16 2021-09-30 Regeneron Pharma Ciljana modifikacija genoma pacova
AU2014262867B2 (en) 2013-05-10 2019-12-05 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
CN105392885B (zh) 2013-07-19 2020-11-03 赖瑞克斯生物科技公司 用于产生双等位基因敲除的方法和组合物
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US20160257985A1 (en) 2013-11-18 2016-09-08 Rubicon Genomics, Inc. Degradable adaptors for background reduction
ES2908644T3 (es) 2014-01-31 2022-05-03 Swift Biosciences Inc Procedimientos mejorados para el procesamiento de sustratos de ADN
CA2953362A1 (en) 2014-06-23 2015-12-30 The General Hospital Corporation Genomewide unbiased identification of dsbs evaluated by sequencing (guide-seq)
WO2016039377A1 (ja) 2014-09-11 2016-03-17 タカラバイオ株式会社 耐熱性のミスマッチエンドヌクレアーゼの利用方法
US10640820B2 (en) 2014-11-20 2020-05-05 Children's Medical Center Corporation Methods relating to the detection of recurrent and non-specific double strand breaks in the genome
US10233490B2 (en) 2014-11-21 2019-03-19 Metabiotech Corporation Methods for assembling and reading nucleic acid sequences from mixed populations
WO2016141224A1 (en) 2015-03-03 2016-09-09 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
CA2996888A1 (en) 2015-08-28 2017-03-09 The General Hospital Corporation Engineered crispr-cas9 nucleases
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
WO2017044843A1 (en) 2015-09-11 2017-03-16 The General Hospital Corporation Full interrogation of nuclease dsbs and sequencing (find-seq)
CA3000762A1 (en) 2015-09-30 2017-04-06 The General Hospital Corporation Comprehensive in vitro reporting of cleavage events by sequencing (circle-seq)
IL294014B2 (en) 2015-10-23 2024-07-01 Harvard College Nucleobase editors and their uses
EP3368688B1 (en) 2015-10-30 2021-01-27 New England Biolabs, Inc. Compositions and methods for determining modified cytosines by sequencing
WO2017079593A1 (en) 2015-11-04 2017-05-11 Atreca, Inc. Combinatorial sets of nucleic acid barcodes for analysis of nucleic acids associated with single cells
WO2017217768A1 (ko) 2016-06-15 2017-12-21 주식회사 툴젠 온타겟 및 오프타겟의 다중 타겟 시스템을 이용하는, 표적 특이적 유전자 가위 스크리닝 방법 및 이의 용도
WO2017218979A1 (en) 2016-06-17 2017-12-21 The Broad Institute, Inc. Unbiased detection of nucleic acid modifications
IL308426A (en) 2016-08-03 2024-01-01 Harvard College Adenosine nuclear base editors and their uses
EP3530737A4 (en) 2016-09-13 2020-04-29 Toolgen Incorporated METHOD FOR IDENTIFYING DNA BASE EDITING USING CYTOSINE DEAMINASE
AU2018273968A1 (en) 2017-05-25 2019-11-28 The General Hospital Corporation Using split deaminases to limit unwanted off-target base editor deamination
BR112020003596A2 (pt) 2017-08-23 2020-09-01 The General Hospital Corporation nucleases de crispr-cas9 engenheiradas com especificidade de pam alterada
EP3694993A4 (en) 2017-10-11 2021-10-13 The General Hospital Corporation METHOD OF DETECTING A SITE-SPECIFIC AND UNDESIRED GENOMIC DESAMINATION INDUCED BY BASE EDITING TECHNOLOGIES
WO2019204378A1 (en) 2018-04-17 2019-10-24 The General Hospital Corporation Sensitive in vitro assays for substrate preferences and sites of nucleic acid binding, modifying, and cleaving agents

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130143204A1 (en) * 2010-01-14 2013-06-06 Ospedale San Raffaele Srl Determination of in vivo dna double-strand break localization and application thereof
JP2013518602A (ja) * 2010-02-09 2013-05-23 サンガモ バイオサイエンシーズ, インコーポレイテッド 部分的に一本鎖のドナー分子による標的化ゲノム改変

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CELL, vol. 154, JPN6019026088, 29 August 2013 (2013-08-29), pages 1380 - 1389, ISSN: 0004260294 *

Also Published As

Publication number Publication date
EP3158066A1 (en) 2017-04-26
KR102425438B1 (ko) 2022-07-27
CN106604994B (zh) 2021-12-14
IL286474B1 (en) 2023-07-01
AU2015280069B2 (en) 2021-08-12
EP3919621A1 (en) 2021-12-08
US10501794B2 (en) 2019-12-10
JP2022137097A (ja) 2022-09-21
CN106604994A (zh) 2017-04-26
AU2023216790A1 (en) 2023-09-07
CA2953362A1 (en) 2015-12-30
JP6784601B2 (ja) 2020-11-11
KR20170020470A (ko) 2017-02-22
IL286474A (en) 2021-10-31
US20180087104A1 (en) 2018-03-29
IL286474B2 (en) 2023-11-01
JP7550816B2 (ja) 2024-09-13
ES2888976T3 (es) 2022-01-10
EP3158066A4 (en) 2017-11-22
AU2021212165A1 (en) 2021-08-26
US12104207B2 (en) 2024-10-01
IL249555B (en) 2021-10-31
US9822407B2 (en) 2017-11-21
EP3158066B1 (en) 2021-05-12
US20160304950A1 (en) 2016-10-20
JP7095031B2 (ja) 2022-07-04
IL249555A0 (en) 2017-02-28
JP2020191885A (ja) 2020-12-03
KR102598819B1 (ko) 2023-11-03
US20200199665A1 (en) 2020-06-25
KR20220108199A (ko) 2022-08-02
WO2015200378A1 (en) 2015-12-30
AU2015280069A1 (en) 2017-01-12
AU2021212165B2 (en) 2023-05-18

Similar Documents

Publication Publication Date Title
JP7550816B2 (ja) シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE-Seq)
US10738303B2 (en) Comprehensive in vitro reporting of cleavage events by sequencing (CIRCLE-seq)
US11028429B2 (en) Full interrogation of nuclease DSBs and sequencing (FIND-seq)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190709

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191009

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191206

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200727

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20200908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201006

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201023

R150 Certificate of patent or registration of utility model

Ref document number: 6784601

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250