ES2888976T3 - Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.) - Google Patents

Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.) Download PDF

Info

Publication number
ES2888976T3
ES2888976T3 ES15812186T ES15812186T ES2888976T3 ES 2888976 T3 ES2888976 T3 ES 2888976T3 ES 15812186 T ES15812186 T ES 15812186T ES 15812186 T ES15812186 T ES 15812186T ES 2888976 T3 ES2888976 T3 ES 2888976T3
Authority
ES
Spain
Prior art keywords
dsodn
sites
cells
dsbs
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15812186T
Other languages
English (en)
Inventor
J Keith Joung
Shengdar Tsai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
General Hospital Corp
Original Assignee
General Hospital Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Hospital Corp filed Critical General Hospital Corp
Application granted granted Critical
Publication of ES2888976T3 publication Critical patent/ES2888976T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/113Modifications characterised by incorporating modified backbone
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/204Modifications characterised by specific length of the oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Un método ex vivo o in vitro para detectar roturas bicatenarias (DSB) de una célula, comprendiendo el método: poner en contacto la célula con un oligodesoxinucleótido bicatenario (dsODN) de extremo romo, donde el dsODN tiene entre 15 y 50 nts de longitud, donde ambas cadenas del dsODN son ortogonales al genoma de la célula; los extremos ' del dsODN están fosforilados; y los enlaces fosforotioato están presentes en ambos extremos 3' o hay dos enlaces fosforotioato presentes en ambos extremos 3' y en ambos extremos 5'; expresar o activar la nucleasa modificada por ingeniería exógena en la célula, durante un tiempo suficiente para que la nucleasa induzca DSB en el ADN genómico de la célula, y para que la célula repare las DSB, integrando un dsODN en una o más DSB; amplificar una porción de ADN genómico que comprende un dsODN integrado; y secuenciar la porción amplificada del ADN genómico, detectando de este modo una DSB en el ADN genómico de la célula.

Description

DESCRIPCIÓN
identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.)
Campo técnico
Se plantean métodos altamente sensibles, no sesgados y pangenómicos para identificar las ubicaciones de los sitios de corte de nucleasas modificadas genéticamente en células vivas.
Antecedentes
Uno de los objetivos de la medicina humana desde hace mucho tiempo ha sido el tratamiento de los trastornos genéticos heredados. La edición genómica abarca el poderoso concepto de corregir directamente mutaciones en genes endógenos para curar o prevenir enfermedades. Un ejemplo emergente de este enfoque es el ensayo clínico de una terapia de nucleasas con dedos de zinc (ZFN) modificadas genéticamente para alterar CCR5, un correceptor del VIH (1). Este enfoque de terapia de células autólogas ex vivo pretende recapitular la exitosa cura del VIH en Timothy Brown, el "Paciente de Berlín", que fue trasplantado con células de médula ósea procedentes de un individuo portador de mutaciones homocigotas en CCR5. Otro ejemplo reciente es la corrección del trastorno de inmunodeficiencia combinada grave ligada al cromosoma X mediante la selección de genes con ZFN en células madre hematopoyéticas derivadas de un sujeto de 6 meses de edad (2).
Hay cuatro clases principales de nucleasas modificadas genéticamente: 1) meganucleasas, 2) nucleasas con dedos de zinc, 3) nucleasas de efectores similares a activadores de transcripción (TALEN) y 4) nucleasas guiadas por ARN Cas (RGN) de repeticiones palindrómicas cortas, agrupadas y regularmente interespaciadas (CRISPR).
Sin embargo, la adopción de estas nuevas herramientas terapéuticas y de investigación puede depender de una demostración de su especificidad. Comprender e identificar los efectos inespecíficos en células humanas y otras células eucariotas será fundamental para que estas nucleasas se utilicen ampliamente para la investigación y para aplicaciones terapéuticas.
Síntesis
GUIDE-Seq proporciona un método no sesgado, pangenómico y altamente sensible para detectar mutaciones, por ejemplo, mutaciones inespecíficas, inducidas por nucleasas modificadas genéticamente. Por tanto, el método proporciona el método no sesgado más completo para evaluar mutaciones a escala pangenómica en células vivas de mamíferos. El método se puede utilizar en cualquier tipo de célula en la que los dsODN se puedan capturar eficazmente en las DSB inducidas por nucleasas.
Por tanto, en un aspecto, la invención proporciona métodos para detectar roturas bicatenarias (DSB), por ejemplo, DSB inespecíficas, por ejemplo, inducidas por nucleasas modificadas genéticamente exógenas en el ADN genómico de una célula. Los métodos incluyen poner en contacto la célula con un oligodesoxinucleótido bicatenario (dsODN), donde el dsODN tiene entre 15 y 50 nts de longitud, donde ambas cadenas del dsODN son ortogonales al genoma de la célula; los extremos 5' del dsODN están fosforilados; y los enlaces de fosforotioato están presentes en ambos extremos 3' o hay dos enlaces de fosforotioato presentes en ambos extremos 3' y en ambos extremos 5';
expresar o activar las nucleasas modificadas exógenas en la célula, durante un tiempo suficiente para que las nucleasas induzcan la DSB en el ADN genómico de la célula, y para que la célula repare las DSB, integrando un dsODN en una o más DSB; amplificar una porción de ADN genómico comprendiendo un dsODN integrado; y secuenciar la porción amplificada del ADN genómico,
detectando, de este modo, una DSB en el ADN genómico de la célula.
En algunas realizaciones, amplificar una porción del ADN genómico comprende: fragmentar el ADN, por ejemplo, por cizallamiento;
ligar los extremos del ADN genómico fragmentado de la célula con un adaptador universal; realizar una primera ronda de reacción en cadena de la polimerasa (PCR) en el ADN ligado con un cebador complementario al dsODN integrado (cebador A) y un cebador complementario al adaptador universal (cebador B);
a continuación, se realiza una segunda ronda de PCR utilizando un cebador anidado en 3' complementario al cebador A (cebador C), un cebador anidado en 3' complementario al cebador B (cebador D) y un cebador complementario al cebador D (cebador E). En algunas realizaciones, el cebador E comprende una o más de:
una secuencia de purificación o unión, por ejemplo, una secuencia de unión a celda de circulación; y una secuencia de identificación, por ejemplo, un código de barras o un índice molecular aleatorio.
En algunas realizaciones, las nucleasas modificadas se seleccionan del grupo que consta de meganucleasas, nucleasas con dedos de zinc, nucleasas de efectores similares a activadores de transcripción (TALEN) y nucleasas guiadas por ARN Cas de repeticiones palindrómicas cortas, agrupadas y regularmente interespaciadas (CRISPR) (RGN CRISPR/Cas).
En otro aspecto, la invención proporciona métodos para determinar cuál de una pluralidad de ARN guía es más específico, es decir, induce la menor cantidad de DSB inespecíficas. Los métodos incluyen poner en contacto una primera población de células con un primer ARN guía y un oligodesoxinucleótido bicatenario (dsODN) de extremo romo, donde el dsODN tiene entre 15 y 50 nts de longitud, donde ambas cadenas de dsODN son ortogonales al genoma de la célula; los extremos 5' del dsODN están fosforilados; y los enlaces de fosforotioato están presentes en ambos extremos 3' o hay dos enlaces de fosforotioato presentes en ambos extremos 3' y en ambos extremos 5';
expresar o activar una nucleasa modificada Cas9 exógena en la primera población de células, durante un tiempo suficiente para que la nucleasa induzca la DSB en el ADN genómico de las células, y para que las células reparen las DSB, integrando un dsODN en una o más DSB; amplificar una porción de ADN genómico de la primera población de células que comprende un dsODN integrado; y
secuenciar la porción amplificada del ADN genómico de la primera población de células; determinar un número de sitios en los que se integró el dsODN en el ADN genómico de la primera población de células;
poner en contacto una segunda población de células con un segundo ARN guía y un oligodesoxinucleótido bicatenario (dsODN) de extremo romo, donde el dsODN tiene 15-50 nts de longitud, donde ambas cadenas del dsODN son ortogonales al genoma de la célula; los extremos 5' del dsODN están fosforilados; y los enlaces de fosforotioato están presentes en ambos extremos 3' o hay dos enlaces de fosforotioato presentes en ambos extremos 3' y en ambos extremos 5';
expresar o activar una nucleasa modificada Cas9 exógena en la segunda población de células, durante un tiempo suficiente para que la nucleasa induzca la DSB en el ADN genómico de la segunda población de células, y para que las células reparen las DSB, integrando un dsODN en una o más DSB; amplificar una porción de ADN genómico que comprende un dsODN integrado de la segunda población de células; y secuenciar la porción amplificada del ADN genómico de la segunda población de células;
determinar un número de sitios en los que se integró el dsODN en el ADN genómico de la segunda población de células; comparar el número de sitios en los que se integró el dsODN en el ADN genómico de la primera población de células con el número de sitios en los que se integró el dsODN en el ADN genómico de la segunda población de células; en donde el dsODN que se integró en menos sitios (inespecíficos) es más específico. Los métodos pueden repetirse para una tercera, cuarta, quinta, sexta o más poblaciones de células. "Menos" sitios inespecíficos pueden incluir tanto un número menor de sitios de DSB y/o una frecuencia reducida de aparición de una DSB en (uno o más) sitios individuales.
En el presente documento también se proporcionan métodos para integrar eficazmente un dsDNA corto de interés en el sitio de una DSB mediante el uso de un dsODN protegido en los extremos como se describe a continuación en el presente documento.
En algunas realizaciones, la célula es una célula de mamífero.
En algunas realizaciones, donde la nucleasa modificada es una nucleasa Cas9, y los métodos también incluyen la expresión en las células de un ARN guía, por ejemplo, una guía única o un par de tracrRNA/crRNA, que dirige la nucleasa Cas9 a una secuencia diana en el genoma.
En algunas realizaciones, el dsODN está biotinilado, por ejemplo, comprende biotina unida covalentemente al dsODN y/o comprende un código de barras de ADN aleatorizado o un sitio Cre o Lox. El método de cualquiera de las reivindicaciones anteriores, en donde el dsODN está biotinilado.
En algunas realizaciones, los métodos descritos en el presente documento incluyen cizallar el ADNg genómico en fragmentos; y aislar fragmentos que comprenden un dsODN uniéndose a la biotina.
En algunas realizaciones, el dsODN tiene extremos romos o tiene 1,2, 3 o 4 nts que sobresalen en el extremo 5'; está fosforilado en los extremos 5'; y está fosforotioado en los extremos 3'.
El dsODN tiene extremos romos, está fosforilado en los extremos 5' y está fosforotioado en los extremos 3'.
En algunas realizaciones, el dsODN contiene un código de barras de ADN aleatorizado, un sitio de reconocimiento de Lox, un sitio de reconocimiento de enzimas de restricción y/o una secuencia marcada.
En algunas realizaciones, los métodos incluyen cizallar el ADNg genómico en fragmentos; y preparar los fragmentos para la secuenciación, por ejemplo, secuenciación de alto rendimiento, mediante reparación de extremos/A-tailing/ligación de un adaptador de secuenciación, por ejemplo, un adaptador de secuenciación de una sola cola. En algunas realizaciones, la DSB es una DSB genómica de fondo (por ejemplo, en un sitio frágil) o una DSB causada por inhibidores de moléculas pequeñas de proteínas celulares clave.
Salvo que se defina de otro modo, todos los términos técnicos y científicos utilizados en el presente documento tienen el mismo significado que el que comúnmente comprendería un experto en la técnica a la que pertenece la presente invención. Se describen los métodos y materiales para el uso en la presente invención; también pueden utilizarse otros métodos y materiales adecuados conocidos en la técnica. Los materiales, métodos y ejemplos son únicamente ilustrativos y no pretenden ser restrictivos. En caso de conflicto, prevalecerá la presente especificación, incluyendo las definiciones.
Otras características y ventajas de la invención resultarán evidentes a partir de la siguiente descripción detallada y las figuras, así como a partir de las reivindicaciones.
Descripción de las figuras
Figuras 1A-B. Optimización de captura de dsODN mediada por nucleasas CRISPR-Cas. (a) Se muestra la secuencia de la etiqueta del oligonucleótido corto. Todos los oligonucleótidos utilizados están fosforilados en 5'. El oligonucleótido de etiqueta también contiene sitios de restricción NdeI de diagnóstico que permiten la estimación de las frecuencias de integración mediante RFLP. (b) El gráfico inferior muestra la integración (%) del dsODN corto mediante RFLP. La tasa de integración para dsODN con enlaces de fosforotioato en 5 'y 3' (barra de la izquierda en cada conjunto) se compara con dsODN con solo enlace de fosforotioato en 5' (barra central en cada conjunto) y control sin dsODN (barra de la derecha en cada conjunto).
Figuras 2A-B. Caracterización de la integración para el sitio 1 de VEGF. (a) Se muestra el ensayo RFLP para el sitio 1 de VEGF, como se analizó en un instrumento de electroforesis capilar Qiaxcel, lo que demuestra la incorporación exitosa del dsODN portador del sitio de restricción Ndel. (b) Se muestran los datos de secuenciación de Sanger para las integraciones de dsODN en el sitio diana del sitio 1 de VEGF previsto. La secuencia de dsODN está resaltada en gris. El sitio reconocido por el complejo guía ARN/Cas9 dirigido al sitio 1 de VEGFA está resaltado en negrita con la secuencia del motivo adyacente de protoespaciador (PAM) subrayada. La ubicación de la rotura bicatenaria esperada inducida por Cas9 en este sitio se indica con una pequeña flecha negra.
Figura 3. Descripción general del método ejemplar de GUIDE-seq.
Figuras 4A-E. Sitios de escisión inespecíficos de CRISPR-Cas descubiertos por el método GUIDE-Seq. Los datos se muestran para cuatro sitios, los sitios 1-3 de VEGF y EMX1. Se resaltan las discrepancias con la secuencia del sitio diana. Se usa una pequeña flecha negra continua para indicar el sitio específico previsto, mientras que se usa una pequeña flecha discontinua para marcar sitios conocidos inespecíficos que se habían detectado en un estudio anterior (Fu et al., 2013).
Figuras 5A-4G. Diseño, optimización y aplicación de un método ejemplar de GUIDE-Seq.
(a) Descripción esquemática de un método ejemplar de GUIDE-Seq.
(b) Optimización de la integración de dsODN en DSB inducidas por RGN en células humanas. Se muestran las tasas de integración para distintos oligonucleótidos modificados, medidas mediante el ensayo de RFLP. Las reacciones de control se transfectaron solo con los plásmidos que codifican RGN (es decir, sin dsODN).
(c) Esquema que ilustra cómo el mapeado de las lecturas de la secuencia genómica permitió la identificación de la posición de DSB. Las lecturas de mapeado bidireccional o las lecturas que mapean en la misma dirección pero amplificadas por distintos cebadores son distintivos de DSB en el ensayo de GUIDE-seq. Ver también la figura 1A. (d) Identificación basada en GUIDE-Seq de las DSB inducidas por RGN. Los sitios de inicio de las lecturas de GUIDE-Seq mapeados del genoma permiten el mapeado de la DSB dentro de unos pocos pares de bases. Se muestran las lecturas mapeadas para los sitios específicos de las diez RGN que evaluamos mediante GUIDE-Seq. En todos los casos, la secuencia del sitio diana se muestra con la secuencia del protoespaciador de 20 pb a la izquierda y la secuencia del PAM a la derecha en el eje x. Cabe destacar cómo en todos los casos que el pico más alto cae dentro de 3 a 4 pb del borde 5' de la secuencia del PAM de NGG, la posición esperada de un evento de escisión de RGN. (e) Número de sitios de escisión inespecíficos nuevos y previamente conocidos identificados por GUIDE-Seq para las diez RGN analizadas en este estudio. Todas las escisiones inespecíficas conocidas anteriormente para 4 RGN se identificaron mediante GUIDE-seq.
(f) Diagrama de dispersión de la ortogonalidad del sitio específico con respecto al genoma humano (eje y) frente al número total de sitios inespecíficos detectados por GUIDE-Seq para las diez RGN de este informe. La ortogonalidad se calculó como el número total de sitios en el genoma humano que tienen de 1 a 6 desajustes en relación con el sitio específico.
(g) Diagrama de dispersión del contenido de GC del sitio específico (eje y) frente al número total de sitios inespecíficos detectados por GUIDE-Seq para las diez RGN de este informe.
(h) Ideograma cromosómico de sitios específicos e inespecíficos de CRISPR/Cas9 para la RGN que focaliza a EMX1. En la figura 13 se pueden encontrar ideogramas adicionales para las RGN restantes.
(i) Localizaciones genómicas de sitios de escisión inespecíficos identificados por GUIDE-Seq para las diez RGN examinadas en este estudio.
Figuras 6A-J. Secuencias de sitios inespecíficos identificados por GUIDE-Seq para diez RGN. Para cada RGN, la secuencia diana deseada se muestra en la línea superior con los sitios escindidos que se muestran debajo y con desajustes con el sitio específicos mostrado y resaltado en color. Los recuentos de lecturas de secuenciación de GUIDE-Seq se muestran a la derecha de cada sitio. Los 45 sitios específicos están marcados con un cuadrado y los sitios inespecíficos previamente conocidos con un rombo. Se muestran datos para RGN
dirigidas a los siguientes sitios: (a) sitio 1 de VEGFA, (b) sitio 2 de VEGFA, (c) sitio 3 de VEGFA, (d) EMX1, (e) FANCF, (f) sitio 1 de HEK293, (g) sitio 2 de HEK293, (h) sitio 3 de HEK293, (i) sitio 4 de HEK293, (j) RNF2. No se encontraron sitios inespecíficos para la RGN dirigida al sitio de RNF2.
Figuras 7A-F. Los sitios de escisión de GUIDE-Seq son sitios de mutación inespecíficos de RGN auténticos.
(a) En la mitad superior de la figura se muestra una descripción esquemática del método de secuenciación basado en AMP utilizado para confirmar mutaciones indel en los sitios de escisión de GUIDE-Seq. Se muestran gráficos de histograma de mutaciones indel mapeadas para tres sitios de RGN específicos. Las eliminaciones se muestran encima del eje X, mientras que las inserciones se muestran debajo. Los límites del sitio diana en conjunto (es decir, el protoespaciador y la secuencia del PAM) se muestran con líneas discontinuas y el límite entre el protoespaciador y la secuencia del PAM se muestra como una línea discontinua entre los otros dos. Se prevé que la escisión de RGN se produzca de 3 a 4 pb desde el borde 5' del protoespaciador.
(b) -(f) Diagramas de dispersión de frecuencias indel (eje x) y recuentos de lectura de secuenciación de GUIDE-Seq (eje y) para sitios de escisión identificados por GUIDE-Seq para RGN dirigidos a: sitio 1 de VEGFA, sitio 2 de VEGFA, sitio 3 de VEGFA, EMX1 y FANCF.
Figura 8A-E Análisis de características de secuencia inespecífica inducida por RGN
(a) Fracción de posibles sitios inespecíficos de RGN que tienen un determinado número de desajustes que se escinden (detectados por GUIDE-Seq).
(b) Gráficos de recuentos de lectura de GUIDE-Seq (escala logarítmica) para sitios de escisión inespecíficos de RGN que tienen un determinado número de desajustes
(c) Efectos de la posición de desajuste dentro del protoespaciador en los recuentos de lectura de GUIDE-Seq para sitios de RGN inespecíficos. Las bases están numeradas del 1 al 20, siendo 20 la base adyacente al PAM
(d) Efectos de la transición oscilante, transición no oscilante y desajustes de transversión estimados por análisis de regresión lineal.
(e) Fracción de la varianza del recuento de lecturas de GUIDE-Seq explicada por análisis univariados individuales para el efecto del número de desajustes, el tipo de desajuste, la posición de desajuste, la densidad del PAM, el nivel de expresión y la posición genómica (intergénica/exón/intrón).
Figuras 9A-F. Comparaciones de GUIDE-Seq con la predicción computacional o los métodos de ChIP-Seq para identificar sitios inespecíficos de RGN
(a) Diagramas de Venn que ilustran la superposición entre sitios inespecíficos previstos por la herramienta de diseño CRISPR del MIT y GUIDE-Seq para nueve RGN.
(b) Diagramas de Venn que ilustran la superposición entre sitios inespecíficos previstos por el programa de predicción computacional E-CRISP y GUIDE-Seq para nueve RGN.
(c) Histograma que muestra el número de sitios inespecíficos de RGN auténticos identificados por GUIDE-Seq que están previstos, no previstos y no considerados por la herramienta de diseño CRISPR del MIT. Los sitios previstos por la herramienta de diseño de CRISPR de MIT se dividen en quintiles según la puntuación proporcionada por el programa. Cada barra tiene los sitios subclasificados según el número de desajustes en relación con el sitio específico. Los sitios de protuberancia son aquellos que tienen una posición de base omitida en la interfaz de ADN del protoespaciador de ARNg.
(d) Histograma que muestra el número de sitios inespecíficos de RGN auténticos identificados por GUIDE-Seq que están previstos, no previstos y no considerados por la herramienta de predicción computacional E-CRISP.
Los sitios se subdividen como se describe en (c).
(e) Diagramas de Venn que ilustran la superposición entre los sitios de unión de dCas9 identificados por ChIP-Seq y los sitios de escisión inespecíficos de RGN identificados por GUIDE-Seq.
(f) Gráficos de histograma de sitios inespecíficos de RGN identificados por GUIDE-Seq y sitios de unión de dCas9 identificados por ChIP-Seq clasificados por el número de desajustes en la secuencia en relación con el sitio específico previsto.
Se representa la estimación de densidad de núcleo de los desajustes de GUIDE-Seq y ChIP-Seq. Las líneas punteadas indican el número medio de desajustes para cada clase de sitios.
Figura 10A-F. Alteraciones estructurales a gran escala inducidas por RGN
(a) Descripción esquemática de la estrategia AMP para detectar translocaciones. Detalles adicionales en los Métodos. (b) Gráficos de circo de variación estructural inducida por RGN. Se muestran los datos de cinco RGN y un control de celdas. Los cromosomas están dispuestos en un círculo con translocaciones que se muestran como arcos entre dos ubicaciones cromosómicas. Las deleciones o inversiones superiores a 1 kb de longitud se muestran como líneas rectas. Los sitios que no son puntos calientes específicos, inespecíficos o de interrupción se clasifican como "otros". (c) Ejemplo de una translocación detectada entre el sitio específico del sitio 1 de VEGFA en el cromosoma 6 y un sitio inespecífico en el cromosoma 17. Las cuatro posibles translocaciones recíprocas se detectaron utilizando AMP (d) Ejemplos de grandes deleciones e inversiones entre dos sitios inespecíficos en el sitio 2 de VEGFA detectados por AMP
(e) Tabla resumen de las diferentes variaciones estructurales inducidas por RGN e independientes de RGN observadas con cinco RGN. También se muestran los controles solo con Cas9, solo con oligo dsODN y solo con células.
(f) Ideograma cromosómico que ilustra las ubicaciones de puntos calientes de interrupción en células U2OS y HEK293. Se superponen dos puntos calientes en las regiones centroméricas de los cromosomas 1 y 10.
Figura 11A-H. Perfiles de GUIDE-Seq de RGN dirigidas por tru-ARNg
(a) Número de sitios de escisión inespecíficos nuevos y previamente conocidos identificados para las RGN dirigidas al sitio 1 de VEGFA, sitio 3 de VEGFA y sitios diana de EMX1 mediante ARNg de longitud completa coincidentes y ARNg truncados. Cabe destacar que los datos de las RGN dirigidas por los ARNg de longitud completa son los mismos que los presentados en la figura 1e y se muestran de nuevo aquí para facilitar la comparación.
(b) -(d) Ideogramas cromosómicos que muestran sitios específicos e inespecíficos para las RGN dirigidas al sitio 1 de VEGFA, sitio 3 de VEGFA y sitios diana de EMX1 mediante ARNg de longitud completa coincidentes y ARNg truncados. Cabe destacar que los ideogramas para las RGN dirigidas por los ARNg de longitud completa son los mismos que los presentados en la figura 1h y las figuras 13A-B y se muestran de nuevo aquí para facilitar la comparación.
(e) Identificación basada en GUIDE-Seq de DSB inducidas por RGN dirigidas por tru-ARNg. Se muestran las lecturas mapeadas para los sitios específicos de las tres RGN dirigidas por tru-ARNg que evaluamos mediante GUIDE-Seq. En todos los casos, la secuencia del sitio diana se muestra con la secuencia del protoespaciador de 20 pb a la izquierda y la secuencia del PAM a la derecha en el eje x. Como con las RGN dirigidas por ARNg de longitud completa, cabe destacar cómo en todos los casos el pico más alto cae dentro de 3 a 4 pb del borde 5' de la secuencia del PAM de NGG, la posición esperada de un evento de escisión de RGN.
(f) -(h) Secuencias de sitios inespecíficos identificados por GUIDE-Seq para RGN dirigidas por tru-ARNg. Para cada RGN, la secuencia diana deseada se muestra en la línea superior con los sitios escindidos que se muestran debajo y con desajustes con el sitio específicos mostrado y resaltado en color. Los recuentos de lecturas de secuenciación de GUIDE-Seq se muestran a la derecha de cada sitio. El sitio específico previsto está marcado con un cuadrado, los sitios inespecíficos previamente conocidos de RGN dirigidas tanto por un ARNg de longitud completa como por un tru-ARNg están marcados con un rombo gris oscuro, y los sitios inespecíficos previamente conocidos que se encuentran solo con RGN dirigidas por un tru-ARNg están marcados con un rombo gris claro. Los sitios inespecíficos previamente conocidos eran aquellos que demostraron tener una frecuencia de mutagénesis de 0,1% o más en un informe anterior FU et al., Nat Biotechnol 32, 279-284 (2014)). Los datos se muestran para las RGN dirigidas por tru-ARNg al (f) sitio 1 de VEGFA, (g) sitio 3 de VEGFA y (h) sitios diana EMX1.
Figura 12. Descripción general esquemática detallada de GUIDE-Seq y secuenciación basada en AMP para la validación de inserciones de dsODN y mutaciones indel. Los detalles de ambos protocolos se pueden encontrar en los Métodos.
Figura 13A-J. Ideogramas cromosómicos de sitios CRISPR/Cas9 específicos e inespecíficos para las diez RGN evaluadas por GUIDE-Seq
Figura 14. Modelo de regresión lineal multifactor para mostrar los efectos independientes de los factores en el recuento de lecturas de GUIDE-Seq
Figuras 15A-D. Gráficos de histograma de mutaciones indel mapeadas para siete sitios de unión de ChIP-Seq previamente caracterizados como sitios de escisión inespecíficos. Las muestras experimentales y de control se muestran una al lado de la otra para cada sitio.
La Figura 16A es un gráfico que muestra las frecuencias de integración de 3 tipos de dsODN que utilizan TALEN, ZFN y RFN dirigidos contra EGFP. Todos los dsODN se fosforilaron en 5'. Los dsODN tenían un saliente aleatorio en 5'- o 3'-4-pb o eran romos, como se indica.
Las Figuras 16B-C son gráficos que muestran la integración eficiente de un oligodesoxinucleótido bicatenario (dsODN) (oSQT685 / 686) de 34 pb, fosforilado en 5', romo, en roturas bicatenarias (DSB) inducidas por TALEN en 2 sitios diana endógenos, CCR5 y APC en células U2OS. (16B) El análisis de RFLP muestra el % de integración de etiquetas dsODN oSQT685/686 en DSB inducidas por TALEN en 2 sitios endógenos, CCR5 y APC. (16C) Las frecuencias de mutagénesis acumuladas se miden mediante el ensayo T7E1 en estos 2 sitios diana endógenos.
Las Figuras 17A y 17B son gráficos de barras que muestran una comparación de diferentes protecciones de extremo de dsODN; los dsODN utilizados en este experimento estaban fosforilados y romos y tenían modificaciones de fosforotioato en 5' y 3', o solo modificaciones de fosforotioato en 3'. 17A, RFN en células U2OS humanas; 17B, Cas9 en células madre embrionarias (ME) de ratón.
Las Figuras 18A-B son gráficos que muestran experimentos a diferentes concentraciones de oligo modificado con fosforotioato en 3' en células ME de ratón. 18A, ARNsg/Cas9 de Nanog; 18B, ARNsg/Cas9 de Phc1. Los dsODN estaban fosforilados y romos y tenían modificaciones de fosforotioato en 5' y 3', o solo modificaciones de fosforotioato en 3'. Los experimentos se realizaron con nucleasas FokI guiadas por ARN dimérico en células U2OS humanas (Fig. 18A), o con Cas9 estándar en células ME de ratón (Fig. 18B).
La Figura 18C es un gráfico que muestra el análisis de T7E1 de la tasa de interrupción en presencia de oligo modificado con fosforotioato en 3' en células ME de ratón.
Las figuras 19A-B muestran la integración eficaz de etiquetas dsODN biotiniladas en roturas bicatenarias (DSB) inducidas por Cas9 en 3 sitios diana endógenos, VEGFA3, EMX1 y FANCF1 en células U2OS. (19A) El análisis de RFLP muestra el % de las tasas de integración de dsODN biotinilado (oSQT1261/1262), en comparación con el dsODN estándar (oSQT685 / 686) en DSB inducidas por Cas9 en 3 sitios endógenos, VEGFA3, EMX1 y FANCF1 en células U2OS. (19B) T7EI muestra el % de frecuencias de mutagénesis estimadas con dsODN biotinilado (oSQT1261/1262), en comparación con el dsODN estándar (oSQT685/686) en 3 sitios endógenos, VEGFA3, EMX1 y FANCF1 en células U2OS.
Las figuras 20A-B muestran que las etiquetas dsODN más largas pueden optimizarse para integrarse de manera eficiente en sitios de DSB inducidas por CRISPR-Cas9. (20A) El análisis de RFLP muestra el % de las tasas de integración de dsODN de 60 pb (oSQT1255/1256, oSQT1257/1258 y oSQT1259/1260) cuando se transfecta con 75, 50 o 25 pmol. Ensayado en 2 sitios endógenos, EMX1 y FANCF1 en células U2OS. (20B) T7EI muestra el % de las tasas estimadas de NHEJ de dsODN de 60 pb (oSQT1255/1256, oSQT1257/1258, oSQT1259/1260 cuando se transfecta con 75, 50 o 25 pmol.
Ensayado en 2 sitios endógenos, EMX1 y FANCF1 en células U2OS.
La figura 21 es un gráfico que muestra el número de sitios de escisión inespecíficos identificados por GUIDE-seq para las variantes de SpCas9 VQR y VRER modificas usando diferentes ARNsg.
La figura 22 es un gráfico que resume los cambios de especificidad detectados por GUIDE-seq entre variantes de SpCas9 de tipo salvaje y D1135E en sitios inespecíficos. No se representa gráficamente la multiplicación de ganancia estimada en la especificidad en sitios sin recuentos de lectura para D1135E. Las figuras 23A-B son gráficos que muestran (23A) Frecuencia media de integración de oligo etiquetas de GUIDE-seq en los sitios diana, estimada mediante análisis de polimorfismos de longitud de fragmentos de restricción. Las barras de error representan el s.e.m., n = 4; (23B) Frecuencias medias de mutagénesis en los sitios específicos detectados por T7E1 para experimentos de GUIDE-seq. Las barras de error representan el s.e.m., n = 4.
Descripción detallada
Los métodos de identificación no sesgada pangenómica de DSB evaluadas por secuenciación (GUIDE-Seq) descritos en el presente documento proporcionan métodos altamente sensibles, no sesgados y pangenómicos para identificar las ubicaciones de los sitios de escisión de nucleasas modificadas en células vivas, por ejemplo, células en las que la vía de reparación de unión de extremos no homólogos (NHEJ) está activa. En algunas realizaciones, el método se basa en la captura de oligodesoxinucleótidos bicatenarios (dsODN) cortos en roturas inducidas por nucleasa (un proceso que se presume está mediado por la vía de NHEJ) y, a continuación, el uso de la secuencia de dsODN insertada para identificar los sitios de inserción genómica, por ejemplo, utilizando un enfoque de secuenciación profunda basado en PCR en el que la secuencia de dsODN insertada se utiliza para amplificar selectivamente los sitios de inserción genómica para la secuenciación de alto rendimiento, o mediante inmunoprecipitación de pulí down selectiva de fragmentos genómicos incluyendo los dsODN insertados utilizando una etiqueta adjunta como biotina, por ejemplo, usando captura híbrida en solución. En el presente documento se describe el desarrollo y la validación del método GUIDE-Seq en células humanas cultivadas; el enfoque general descrito en el presente documento debería funcionar en todas las células de mamíferos y en cualquier tipo de célula u organismo en el que la vía de NHEJ esté activa o se presuma que esté activa.
Los posibles sitios inespecíficos identificados por este proceso de secuenciación inicial también podrían analizarse en busca de mutaciones indel características de la reparación de NHEJ en células en las que solo se expresan los componentes de nucleasas. Estos experimentos, que podrían realizarse mediante amplificación seguida de secuenciación profunda, proporcionarían la confirmación y cuantificación adicionales de la frecuencia de mutaciones inespecíficas inducidas por cada nucleasa.
Oligodesoxinucleótidos bicatenarios (dsODN)
En los métodos descritos en el presente documento, se expresa un dsODN de origen no natural en las células. En los presentes métodos, ambas cadenas de dsODN son ortogonales al genoma de la célula (es decir, no están presentes ni son complementarias a una secuencia presente, es decir, no tienen más del 10 %, 20 %, 30 %, 40 % o 50 % de identidad con una secuencia presente en el genoma de la célula). Los dsODN de la invención tienen una longitud de entre 15 y 50 nts. Los dsODN de la divulgación pueden tener preferiblemente entre 15 y 75 nts de longitud, por ejemplo, 15-50 nts, 50-75 nts, 30-35 nts, 60-65 nts o 50-65 nts de longitud, o entre 15 y 50 nts de longitud, por ejemplo, 20-40 o 30-35, por ejemplo, 32-34 nts de longitud. Cada cadena del dsODN debe incluir una secuencia de cebado de PCR única (es decir, el dsODN incluye dos sitios de unión del cebador de PCR, uno en cada cadena). En algunas realizaciones, el dsODN incluye un sitio de reconocimiento de enzima de restricción, preferiblemente un sitio que es relativamente poco común en el genoma de la célula.
Los dsODN se modifican; los extremos 5' del dsODN están fosforilados; y los enlaces fosforotioato están presentes en ambos extremos 3' o hay dos enlaces fosforotioato presentes en ambos extremos 3' y en ambos extremos 5'. El dsODN tiene extremos romos. En algunas realizaciones de la divulgación, los dsODN incluyen una variedad aleatoria de 1, 2, 3, 4 o más salientes de nucleótidos en los extremos 5' o 3'.
El dsODN también puede incluir una o más modificaciones adicionales, por ejemplo, como se conoce en la técnica o se describe en el documento PCT/US2011/060493. Por ejemplo, en algunas realizaciones, el dsODN está biotinilado. La versión biotinilada de la etiqueta de dsODN de GUIDE-seq se utiliza como sustrato para la integración en los sitios de las DSB genómicas. La biotina puede estar en cualquier parte interna del dsODN (por ejemplo, un residuo de timidina modificado (Biotin-dT) o utilizando azida de biotina), pero no en los extremos 5' o 3'. Tal como se muestra en el ejemplo 4, es posible integrar tal oligo de manera eficiente. Esto proporciona un método alternativo para recuperar fragmentos que contienen la etiqueta dsODN de GUIDE-seq. Mientras que en algunas realizaciones, estas secuencias se recuperan e identifican mediante PCR anidada, en este enfoque se eliminan físicamente mediante el uso de biotina, por ejemplo, mediante unión a perlas magnéticas recubiertas de estreptavidina o mediante captura de híbridos en solución; ver, por ejemplo, Gnirke et al., Nature Biotechnology 27, 182 - 189 (2009). La principal ventaja es la recuperación de ambas secuencias flanqueantes, lo que reduce la dependencia en secuencias de mapeado a un genoma de referencia para identificar sitios de escisión inespecíficos.
Nucleasas modificadas genéticamente
Hay cuatro clases principales de nucleasas modificadas genéticamente: 1) meganucleasas, 2) nucleasas con dedos de zinc, 3) nucleasas de efectores similares a activadores de transcripción (TALEN) y 4) nucleasas guiadas por ARN Cas (RGN) de repeticiones palindrómicas cortas, agrupadas y regularmente interespaciadas (CRISPR). Ver, por ejemplo, Gaj et al., Trends Biotechnol. 2013 Jul;31(7):397-405. La nucleasa puede expresarse de forma transitoria o estable en la célula, utilizando métodos conocidos en la técnica; habitualmente, para obtener expresión, se subclona una secuencia que codifica una proteína en un vector de expresión que contiene un promotor para dirigir la transcripción. Los sistemas de expresión eucariotas adecuados son bien conocidos en la técnica y se describen, por ejemplo, en Sambrook et al., Molecular Cloning, A Laboratory Manual (4th ed. 2013); Kriegler, Gene Transfer and Expression: A Laboratory Manual (2006); and Current Protocols in Molecular Biology (Ausubel et al., eds., 2010). La transformación de células eucariotas y procariotas se realiza de acuerdo con técnicas estándar (ver, por ejemplo, la referencia anterior y Morrison, 1977, J. Bacteriol. 132:349-351; Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds, 1983).
Meganucleasas de asentamiento
Las meganucleasas son endonucleasas específicas de secuencia que se originan a partir de una variedad de organismos tales como bacterias, levaduras, algas y orgánulos de plantas. Las meganucleasas endógenas tienen sitios de reconocimiento de 12 a 30 pares de bases; se han descrito sitios de unión de ADN personalizados con sitios de reconocimiento de meganucleasa de 18 pb y 24 pb de longitud, y ambos pueden utilizarse en los presentes métodos y construcciones. Ver, por ejemplo, Silva, G, et al., Current Gene Therapy, 11:11-27, (2011); Arnould et al., Journal of Molecular Biology, 355:443-58 (2006); Arnould et al., Protein Engineering Design & Selection, 24:27-31 (2011); and Stoddard, Q. Rev. Biophys. 38, 49 (2005); Grizot et al., Nucleic Acids Research, 38:2006-18 (2010).
Nucleasas CRISPR-Cas
Trabajos recientes han demostrado que los sistemas de repeticiones palindrómicas cortas, agrupadas y regularmente interespaciadas (CRISPR)/asociadas a CRISPR (Cas) (Wiedenheft et al., Nature 482, 331-338 (2012); Horvath et al., Science 327, 167-170 (2010); Terns et al., Curr Opin Microbiol 14, 321-327 (2011)) pueden servir como base de un método simple y altamente eficiente para realizar la edición genómica en bacterias, levaduras y células humanas, así como in vivo en organismos completos como moscas de la fruta, pez cebra y ratones (Wang et al., Cell 153, 910-918 (2013); Shen et al., Cell Res (2013); Dicarlo et al., Nucleic Acids Res (2013); Jiang et al., Nat Biotechnol 31, 233-239 (2013); Jinek et al., Elife 2, e00471 (2013); Hwang et al., Nat Biotechnol 31, 227-229 (2013); Cong et al., Science 339, 819-823 (2013); Mali et al., Science 339, 823-826 (2013c); Cho et al., Nat Biotechnol 31, 230-232 (2013); Gratz et al., Genetics 194(4): 1029-35 (2013)). La nucleasa Cas9 de S. pyogenes (en adelante simplemente Cas9) se puede guiar a través de la complementariedad de un par de bases simple entre 17-20 nucleótidos de un ARN guía (ARNg) modificado por ingeniería, por ejemplo, un ARN guía único o un par crRNA/tracrRNA, y la cadena complementaria de una secuencia de ADN genómico diana de interés que se encuentra junto a un motivo adyacente de protoespaciador (PAM), por ejemplo, un PAM que coincide con la secuencia NGG o NAG (Shen et al., Cell Res (2013); Dicarlo et al., Nucleic Acids Res (2013); Jiang et al., Nat Biotechnol 31, 233-239 (2013); Jinek et al., Elife 2, e00471 (2013); Hwang et al., Nat Biotechnol 31, 227-229 (2013); Cong et al., Science 339, 819-823 (2013); Mali et al., Science 339, 823-826 (2013c); Cho et al., Nat Biotechnol 31,230-232 (2013); Jinek et al., Science 337, 816-821 (2012)).
En algunas realizaciones, el presente sistema utiliza una proteína Cas9 de tipo salvaje o variante de S. pyogenes o Staphylococcus aureus, ya sea codificada en bacterias o con codones optimizados para la expresión en células de mamífero. El ARN guía se expresa en la célula junto con la Cas9. El ARN guía o la nucleasa, o ambos, pueden expresarse de forma transitoria o estable en la célula.
Matrices de repetición de efectores TAL
Los efectores TAL de bacterias fitopatógenas del género Xanthomonas desempeñan papeles importantes en la enfermedad, o activan la defensa, uniendo el ADN huésped y activando genes huésped específicos del efector. La especificidad depende de un número variable de efectores de repeticiones imperfectas, habitualmente, de 33-35 aminoácidos. Los polimorfismos están presentes principalmente en las posiciones de repetición 12 y 13, a las que se hace referencia en el presente documento como el diresiduo variable de repetición (RVD). Los RVD de los efectores TAL corresponden a 45 nucleótidos en sus sitios diana de una manera lineal directa, un RVD a un nucleótido, con cierta degeneración y sin dependencia aparente del contexto. En algunas realizaciones, la región polimórfica que otorga especificidad de nucleótidos puede expresarse como un trirresiduo o triplete.
Cada repetición de unión a ADN puede incluir un RVD que determina el reconocimiento de un par de bases en la secuencia de ADN diana, en el que cada repetición de unión a ADN es responsable de reconocer un par de bases en la secuencia de ADN diana.
En algunas realizaciones, el RVD puede comprender uno o más de: HA para reconocer C; ND para reconocer C; HI para reconocer C; HN para reconocer G; NA para reconocer G; SN para reconocer G o A; YG para reconocer T; y NK para reconocer G, y uno o más de: HD para reconocer C; NG para reconocer T; NI para reconocer A; NN para reconocer G o A; NS para reconocer A o C o G o T; N* para reconocer C o T, en donde * representa un espacio en la segunda posición del RVD; HG para reconocer T; H* para reconocer T, en donde * representa un espacio en la segunda posición del RVD; e IG para reconocer T.
Las proteínas TALE pueden ser útiles en investigación y biotecnología como nucleasas quiméricas dirigidas que pueden facilitar la recombinación homóloga en ingeniería genómica (por ejemplo, para agregar o potenciar rasgos útiles para biocombustibles o energías renovables en plantas). Estas proteínas también pueden resultar útiles como, por ejemplo, factores de transcripción y, especialmente, para aplicaciones terapéuticas que requieren un nivel muy alto de especificidad, tales como agentes terapéuticos contra patógenos (por ejemplo, virus) como ejemplos no limitantes.
Se conocen en la técnica métodos para generar matrices TALE modificadas por ingeniería, ver, por ejemplo, el sistema de alto rendimiento en fase sólida automatizable basado en ligación rápida (FLASH) descrito en el documento USSN 61/610,212, y Reyon et al., Nature Biotechnology 30,460-465 (2012); as well as the methods described in Bogdanove & Voytas, Science 333, 1843-1846 (2011); Bogdanove et al., Curr Opin Plant Biol 13, 394-401 (2010); Scholze & Boch, J. Curr Opin Microbiol (2011); Boch et al., Science 326, 1509-1512 (2009); Moscou & Bogdanove, Science 326, 1501 (2009) ; Miller et al., Nat Biotechnol 29, 143-148 (2011); Morbitzer et al., T. Proc Natl Acad Sci U S A 107, 21617-21622 (2010) ; Morbitzer et al., Nucleic Acids Res 39, 5790-5799 (2011); Zhang et al., Nat Biotechnol 29, 149-153 (2011); Geissler et al., PLoS ONE 6, e19509 (2011);
Weber et al., PLoS ONE 6, e19722 (2011); Christian et al., Genetics 186, 757-761 (2010); Li et al., Nucleic Acids Res 39, 359-372 (2011); Mahfouz et al., Proc Natl Acad Sci U S A 108, 2623-2628 (2011); Mussolino et al., Nucleic Acids Res (2011); Li et al., Nucleic Acids Res 39, 6315-6325 (2011); Cermak et al., Nucleic Acids Res 39, e82 (2011); Wood et al., Science 333, 307 (2011); Hockemeye et al. Nat Biotechnol 29, 731-734 (2011); Tesson et al., Nat Biotechnol 29, 695-696 (2011); Sander et al., Nat Biotechnol 29, 697-698 (2011); Huang et al., Nat Biotechnol 29, 699-700 (2011); and Zhang et al., Nat Biotechnol 29, 149-153 (2011).
Dedos de zinc
Las proteínas con dedos de zinc son proteínas de unión a ADN que contienen uno o más dedos de zinc, minidominios que contienen zinc plegado de forma independiente, cuya estructura es bien conocida en la técnica y se define, por ejemplo, en Miller et al., 1985, EMBO J., 4:1609; Berg, 1988, Proc. Natl. Acad. Sci. USA, 85:99; Lee etal., 1989, Science. 245:635; and Klug, 1993, Gene, 135:83 Las estructuras cristalinas de la proteína de dedos de zinc Zif268 y sus variantes unidas al ADN muestran un patrón de interacciones semiconservado, en el que habitualmente tres aminoácidos de la hélice alfa del dedo de zinc entran en contacto con tres pares de bases adyacentes o un "subsitio" en el ADN (Pavletich et al., 1991, Science, 252:809; Elrod-Erickson et al., 1998, Structure, 6:451). Por lo tanto, la estructura cristalina de Zif268 sugirió que los dominios de unión al ADN con dedos de zinc podrían funcionar de manera modular con una interacción uno a uno entre un dedo de zinc y un "subsitio" de tres pares de bases en la secuencia de ADN. En los factores de transcripción de dedos de zinc de origen natural, habitualmente se enlazan múltiples dedos de zinc en una matriz en tándem para lograr el reconocimiento específico de la secuencia de una secuencia de ADN contigua (Klug, 1993, Gene 135:83).
Múltiples estudios han demostrado que es posible modificar artificialmente las características de unión al ADN de dedos de zinc individuales aleatorizando los aminoácidos en las posiciones alfa helicoidales involucradas en la unión del ADN y utilizando metodologías de selección como la presentación de fagos para identificar las variantes deseadas capaces de unirse a sitios diana de interés del ADN (Rebar et al., 1994, Science, 263:671; Choo et al., 1994 Proc. Natl. Acad. Sci. USA, 91:11163; Jamieson et al., 1994, Biochemistry 33:5689; Wu et al., 1995 Proc. Natl. Acad. Sci. USA, 92: 344). Dichas proteínas con dedos de zinc recombinantes se pueden fusionar con dominios funcionales, como activadores transcripcionales, represores transcripcionales, dominios de metilación y nucleasas para regular la expresión génica, alterar la metilación del ADN e introducir alteraciones dirigidas en genomas de organismos modelo, plantas y células humanas (Carroll, 2008, Gene Ther., 15:1463-68; Cathomen, 2008, Mol. Ther., 16:1200-07; Wu et al., 2007, Cell. Mol. Life Sci., 64:2933-44).
Un método existente para diseñar matrices de dedos de zinc, conocido como "ensamblaje modular", aboga por la simple unión de módulos de dedos de zinc preseleccionados en matrices (Segal et al., 2003, Biochemistry, 42:2137-48; Beerli et al., 2002, Nat. Biotechnol., 20:135-141; Mandell et al., 2006, Nucleic Acids Res., 34:W516-523; Carroll et al., 2006, Nat. Protoc. 1:1329-41; Liu et al., 2002, J. Biol. Chem., 277:3850-56; Bae et al., 2003, Nat. Biotechnol., 21:275-280; Wright et al., 2006, Nat. Protoc., 1:1637-52). Aunque suficientemente sencillo como para ser practicado por cualquier investigador, informes recientes han demostrado una alta tasa de fracasos para este método, particularmente en el contexto de nucleasas de dedos de zinc (Ramirez et al., 2008, Nat. Methods, 5:374-375; Kim et al., 2009, Genome Res.
19:1279-88), una limitación que normalmente requiere la construcción y pruebas basadas en células de un gran número de proteínas con dedos de zinc para cualquier gen diana determinado (Kim et al., 2009, Genome Res. 19:1279-88).
Se ha demostrado que los métodos basados en la selección combinatoria que identifican matrices de dedos de zinc de bibliotecas aleatorias tienen tasas de éxito más altas que el ensamblaje modular (Maeder et al., 2008, Mol. Cell, 31:294-301; Joung et al., 2010, Nat. Methods, 7:91-92; Isalan et al., 2001, Nat. Biotechnol., 19:656-660). En realizaciones preferidas, las matrices de dedos de zinc se describen o se generan tal como se describe en los documentos WO 2011/017293 ay WO 2004/099366. Se describen DBD de dedos de zinc adicionales adecuados en las patentes US n.° 6.511.808, 6.013.453, 6.007.988 y 6.503.717 y la solicitud de patente US 2002/0160940.
Células
Los métodos descritos en el presente documento pueden utilizarse en cualquier célula que sea capaz de reparar una DSB en el ADN genómico. Las dos vías principales de reparación de DSB en células eucariotas son la recombinación homóloga (HR) y la unión de extremos no homólogos (NHEJ). Preferiblemente, los métodos se realizan en células capaces de NHEJ. En la técnica se conocen los métodos para detectar la actividad de NHEJ; para una revisión de las vías canónicas y alternativas de NHEJ, ver Liu et al., Nucleic Acids Res. 14; 42(10):6106-6127.
Secuenciación
Tal como se utiliza en el presente documento, "secuenciación" incluye cualquier método para determinar la secuencia de un ácido nucleico. En los presentes métodos se puede utilizar cualquier método de secuenciación, incluyendo la secuenciación del terminador de cadena (Sanger) y la secuenciación del terminador de colorante. En realizaciones preferidas, se utiliza la secuenciación de próxima generación (NGS), una tecnología de secuenciación de alto rendimiento que realiza miles o millones de reacciones de secuenciación en paralelo. Aunque las distintas plataformas de NGS utilizan distintas químicas de ensayo, todas generan datos de secuencia a partir de un gran número de reacciones de secuenciación que se ejecutan simultáneamente en un gran número de plantillas. Por lo general, los datos de la secuencia se recopilan mediante un escáner y luego se ensamblan y analizan bioinformáticamente. De este modo, las reacciones de secuenciación se realizan, leen, ensamblan y analizan en paralelo; véase, por ejemplo, el documento US 20140162897, así como Voelkerding et al., Clinical Chem., 55: 641-658, 2009; and MacLean et al., Nature Rev. Microbiol., 7: 287-296 (2009). Algunos métodos de NGS requieren amplificación de plantilla y otros no. Los métodos que requieren amplificación incluyen pirosecuenciación (ver, por ejemplo, las patentes de EE.UU. n.° 6.210.89 y 6.258.568; comercializado por Roche); la plataforma Solexa/Illumina (ver, por ejemplo, las patentes US n.° 6.833.246, 7.115.400 y 6.969.488); y la plataforma Supported Oligonucleotide Ligation and Detection (SOLiD) (Applied Biosystems; véase, por ejemplo, las patentes US n.° 5.912.148 y 6.130.073). Los métodos que no requieren amplificación, por ejemplo, métodos de secuenciación de una sola molécula, incluyen la secuenciación de nanoporos, HeliScope (patentes US n.° 7.169.560; 7.282.337; 7.482.120; 7.501.245; 6.818.395; 6.911.345; y 7.501.245); secuenciación en tiempo real por síntesis (ver, por ejemplo, la patente US n.° 7.329.492); métodos de secuenciación de ADN en tiempo real de una sola molécula (SMRT) que utilizan guías de onda de modo cero (ZMW); y otros métodos, incluidos los descritos en las patentes US n.° 7.170.050; 7.302.146; 7.313.308; y 7.476.503). Ver, por ejemplo, US 20130274147; US20140038831; Metzker, Nat Rev Genet 11(1): 31-46 (2010).
De modo alternativo, también se pueden utilizar métodos de secuencia basados en hibridación u otros métodos de alto rendimiento, por ejemplo, análisis de micromatrices, NANOSTRING, ILLUMINA u otras plataformas de secuenciación.
Ejemplos
La invención se describe adicionalmente en los siguientes ejemplos, que no limitan el alcance de la invención descrita en las reivindicaciones. Cualquier ejemplo que quede fuera del alcance de las reivindicaciones se proporciona únicamente con fines comparativos.
Ejemplo 1.
En los experimentos iniciales, se optimizó el proceso de integración de un casete de dsODN en roturas bicatenarias (DSB) inducidas por nucleasas. Experimentos publicados anteriormente habían demostrado que los dsODN que portan dos modificaciones de enlace de fosforotiorato en sus extremos 5' podrían capturarse en una DSB inducida por nucleasas con dedos de zinc (ZFN) en células de mamíferos (Orlando et al., Nucleic Acids Res. 2010 Aug;38(15):e152). Sin embargo, para utilizar la captura de dichos ssODN para identificar incluso las DSB de muy baja frecuencia, se optimizaron las características del dsODN para mejorar su tasa de captura en tales roturas. Los esfuerzos iniciales se centraron en la captura del dsODN en DSB inducida por la nucleasa Cas9 guiada por ARN de repeticiones palindrómicas cortas, agrupadas y regularmente interespaciadas (CRISPR) de Streptococcus pyogenes. Se ha notificado que Cas9 induce DSB con extremos romos y, por lo tanto, se diseñaron variantes de dsODN con extremos romos. Los experimentos de optimización mostraron que la fosforilación de ambos extremos 5' y la introducción de dos enlaces de fosforotiorato en ambos extremos 3' (además de los de los extremos 5') llevaron a una tasa de captura sustancialmente mayor de un dsODN en una DSB inducida por Cas9 DSB (Figuras 1A-B). La secuenciación de Sanger verificó la captura exitosa del dsODN en esta DSB en particular (Figuras 2A-B).
Habiendo establecido que los dsODN se pueden integrar de manera eficiente en las DSB inducidas por Cas9, los siguientes experimentos buscaron determinar si los métodos de secuenciación profunda de próxima generación podrían utilizarse para capturar, amplificar e identificar los sitios de integraciones de dsODN en los genomas de células de mamíferos. Para realizar esto, se utilizó un dsODN de 34 pb que contenía dos sitios de unión del cebador de PCR (uno en cada cadena); estas secuencias se eligieron porque cada una de ellas es ortogonal en el genoma humano.
En la Tabla 1 se proporciona la secuencia del dsODN utilizado:
Tabla 1
Figure imgf000012_0001
Este dsODN se transfectó en células U2OS humanas junto con plásmidos que codifican Cas9 y uno de cuatro ARNg específicos de diana distintos, cada uno dirigido a una secuencia de genes humanos endógenos diferentes (EMX1 y sitios 1, 2 y 3 de VEGFA). Estos cuatro ARNg particulares se eligieron porque se habían identificado previamente sitios inespecíficos auténticos para cada uno de ellos (Fu et al., Nat Biotechnol. 2013; Tabla 1). Las transfecciones se realizaron como sigue: dsODN se hibrida en STE (TrisHCl 100 mM, NaCl 500 mM, EDTA 10 mM) a una concentración de 100 uM cada una. Para las células U2OS, se utilizaron 500 ng de plásmido de expresión Cas9, 250 ng de plásmido de expresión de ARNg y 100 pmol de dsODN para nucleofectar células 2E5 con solución SE y programa DN-100. El ADN genómico se recogió tres días después de la transfección (Agencourt Ampure XP) y se utilizó un ensayo de polimorfismos de longitud de fragmentos de restricción (RFLP) basado en PCR para verificar que el dsODN se había integrado de manera eficiente en el sitio específico en estas células basándose en la presencia de un sitio de restricción codificado en el dsODN.
Para identificar de forma exhaustiva las ubicaciones de la integración del dsODN en los genomas de las células transfectadas, se utilizó un método basado en PCR que amplifica selectivamente estos sitios de inserción y también permite secuenciarlos utilizando tecnología de secuenciación de próxima generación. En la figura 3 se muestra una descripción general de la estrategia. El ADN genómico se cortó con un ultrasonicador enfocado Covaris Adaptive Focused Acoustic (AFA) hasta una longitud media de 500 pb. El ADNg cortado se reparó en los extremos (Enzymatics), se sometió a A-tailing (Enzymatics) y se ligó un adaptador de secuenciación semifuncional (documento US 20130303461) (Enzymatics) a los extremos del ADN cortado. Se utilizó la limpieza de perlas magnéticas de inmovilización reversible de fase sólida (SPR) para limpiar cada uno de estos pasos enzimáticos (Agencourt XP).
Los fragmentos de ADN que portan la secuencia de dsODN se amplificaron a continuación utilizando un cebador específico para dsODN junto con un cebador que se hibrida con el adaptador de secuenciación. Debido a que hay dos posibles sitios de cebado dentro del dsODN (uno en cada cadena como se ha indicado anteriormente), se realizaron dos reacciones de PCR independientes para amplificar selectivamente las secuencias deseadas como sigue.
Se realizaron dos rondas de PCR anidada para generar una biblioteca de secuenciación dirigida. La primera ronda de PCR se realizó utilizando un cebador complementario al dsODN de integración (cebador A) y un cebador complementario al adaptador universal (cebador B). La segunda ronda de PCR se realizó utilizando un cebador anidado en 3' complementario al cebador A (cebador C), un cebador anidado en 3' complementario al cebador B (cebador D) y un cebador que era complementario al cebador D (cebador E) que agregó una secuencia de unión de celdas de flujo y un índice molecular aleatorio para formar una molécula 'completa' que estaba lista para secuenciar. Se utilizaron perlas magnéticas de SPRI para limpiar cada ronda de PCR. (Agencourt Ampure XP)
La amplificación de secuencias genómicas que contienen dsODN mediante este enfoque no depende ni está sesgada por la secuencia flanqueante adyacente al punto de inserción porque el adaptador de secuenciación está ligado a roturas inducidas por el intercambio aleatorio de ADN genómico. Se realizó una ronda adicional de PCR para agregar secuencias de adaptador de secuenciación de próxima generación y un código de barras de indexación en el extremo más cercano al dsODN, lo que dio como resultado una biblioteca de fragmentos que está lista para la secuenciación de próxima generación. Este método general se denomina en el presente documento GUIDE-Seq, para la identificación no sesgada pangenómica de DSB evaluadas por secuenciación.
La secuenciación profunda de las bibliotecas construidas utilizando GUIDE-Seq reveló una amplia gama de loci genómicos en los que se había insertado el dsODN en presencia de cada una de las cuatro nucleasas coexpresadas de ARNg/Cas9. Al analizar los datos de secuenciación profunda sin procesar, se razonó que los sitios auténticos de inserción podrían identificarse como loci genómicos cubiertos por al menos una lectura en ambas orientaciones. Las lecturas en ambas direcciones fueron posibles tanto porque el dsODN podía insertarse en cualquier orientación como porque las amplificaciones se realizaron utilizando cebadores específicos para una u otra cadena en la secuencia de dsODN. Se identificaron un total de 465 loci genómicos que cumplían este criterio para los cuatro ARNg examinados. Para el 36 % de estos 465 loci, también se identificó una secuencia dentro de los 25 bp del punto de inserción que era similar al sitio específico del ARNg utilizado y que portaba hasta seis desajustes en relación con el sitio específico (Figuras 4A-E). Este método también descubrió con éxito todos los sitios inespecíficos auténticos conocidos anteriormente para los cuatro ARNg examinados aquí (todos los sitios inespecíficos conocidos anteriormente que se muestran en la figura 4 también están presentes en la Tabla 1 de Fu et al., Nat Biotechnol. 2013), así como muchos otros sitios inespecíficos previamente desconocidos.
Ejemplo 2.
Las nucleasas guiadas por ARN (RGN) de CRISPR-Cas personalizables son reactivos de edición genómica robustos y personalizables con un amplio rango de investigación y aplicaciones clínicas potenciales1-2; sin embargo, el uso terapéutico de las RGN en humanos requerirá un conocimiento completo de sus efectos inespecíficos para minimizar el riesgo de resultados adversos. La escisión del ADN por la nucleasa Cas9 de S. pyogenes está dirigida por un ARN guía programable de ~100 nt (ARNg)3, la focalización está mediada por 17-20 nts en el extremo 5' del ARNg, que son complementarios a un sitio de ADN "protoespaciador" que se encuentra junto a un motivo adyacente de protoespaciador (PAM) de la forma NGG en 5'. La reparación de roturas bicatenarias (DSB) del ADN inducidas por Cas9 dentro del protoespaciador mediante unión de extremos no homólogos (NHEJ) puede inducir mutaciones de inserción/deleción de longitud variable (indeles). Nuestro grupo y otros han demostrado previamente que los indeles inducidos por RGN involuntarios pueden producirse en sitios de escisión inespecíficos que difieren hasta en cinco posiciones dentro del protoespaciador o que albergan secuencias de PAM alternativas4-7. Las translocaciones cromosómicas pueden resultar de la unión de eventos de escisión inducidos por RGN específicos e inespecíficos8-11. Para aplicaciones clínicas, la identificación de alteraciones de frecuencia incluso baja será de vital importancia porque se espera que las estrategias terapéuticas ex vivo e in vivo que utilizan RGN requieran la modificación de poblaciones de células muy grandes. La inducción de la transformación oncogénica incluso en un subconjunto raro de clones celulares (por ejemplo, mutaciones inactivantes de un gen supresor de tumores o formación de una translocación cromosómica tumorigénica) es de particular preocupación porque tal alteración podría llevar a resultados clínicos desfavorables.
La identificación completa de indels o reordenamientos genómicos de orden superior que pueden producirse en cualquier parte del genoma es un desafío que no se aborda fácilmente y, lamentablemente, aún no se han descrito métodos sensibles para la identificación no sesgada, pangenómica de mutaciones inespecíficas inducidas por RGN en células vivas1213. La nueva secuenciación del genoma completo se ha utilizado para intentar identificar alteraciones de RGN inespecíficas en clones de células individuales editados1415, pero el alto coste de secuenciar un gran número de genomas hace que este método no sea práctico para encontrar eventos de baja frecuencia en poblaciones celulares12. Nosotros y otros hemos utilizado secuenciación profunda enfocada para identificar mutaciones indel en sitios potenciales inespecíficos identificados por similitud de secuencia con el sitio objetivo4-5 o por selección in vitro de bibliotecas de sitios de unión parcialmente degenerados6. Sin embargo, estos enfoques hacen suposiciones sobre la naturaleza de las secuencias inespecíficas y, por lo tanto, pueden pasar por alto otros sitios de mutación en otras partes del genoma. ChIP-Seq también se ha utilizado para identificar sitios de unión inespecíficos para ARNg complejos con Cas9 catalíticamente muerto (dCas9), pero la mayoría del trabajo publicado sugiere que muy pocos, si es que hay alguno, de estos sitios representan sitios inespecíficos de escisión por nucleasa Cas9 activa16-19.
Aquí describimos el desarrollo de un método novedoso para la identificación no sesgada, pangenómica de DSB evaluadas por secuenciación (GUIDE-Seq), que nos permitió generar los primeros panoramas de especificidad global para diez RGN distintas en células humanas vivas. Estos perfiles revelaron que el número total de DSB inespecíficas variaba ampliamente para las RGN individuales y sugirió que las conclusiones generales sobre la especificidad de las RGN de S. pyogenes u otras especies deberían basarse en grandes estudios y no solo en pequeñas cantidades de ARNg. Nuestros hallazgos también ampliaron el rango y la naturaleza de las secuencias en las que pueden producirse efectos inespecíficos. Las comparaciones directas demostraron que GUIDE-Seq superó sustancialmente a dos enfoques informáticos ampliamente utilizados y un método ChIP-Seq para identificar sitios inespecíficos de RGN. Inesperadamente, GUIDE-Seq también identificó puntos calientes de puntos de rotura de ADN independientes de RGN que pueden participar junto con DSB inducidas por RGN en alteraciones genómicas de orden superior, tal como translocaciones. Por último, mostramos en comparaciones directas que truncar la región de complementariedad de los ARNg mejoró en gran medida sus perfiles de DSB inespecíficos pangenómicos, lo que demuestra la utilidad de GUIDE-Seq para evaluar los avances diseñados para mejorar las especificidades de RGN. Los experimentos descritos aquí proporcionan la estrategia más rigurosa descrita hasta la fecha para evaluar las especificidades de las RGN, así como cualquier mejora en la plataforma, que puede considerarse para uso terapéutico.
Métodos
En este ejemplo se utilizaron los siguientes materiales y métodos.
Cultivo y transfección de células humanas
Se cultivaron células U2OS y HEK293 en Advanced DMEM (Life Technologies) suplementado con FBS al 10 %, GlutaMax 2 mm (Life Technologies) y penicilina/estreptomicina a 37 °C con CO2 al 5 %. Se transfectaron células U2OS (programa DN-100) y células HEK293 (programa CM-137) en 20 pl de solución SE en un Nucleofector 4-D de Lonza, según las instrucciones del fabricante. Se evaluaron las tasas de integración de dsODN mediante un ensayo de polimorfismos de longitud de fragmentos de restricción (RFLP) utilizando Ndel. Se procesaron y cuantificaron los productos de escisión mediante un instrumento de electroforesis capilar de Qiaxcel (Qiagen) tal como se ha descrito anteriormente (Tsai et al., Nat. Biotechnol 32, 569-576 (2014)).
Aislamiento y preparación de ADN genómico para GUIDE-Seq
Se aisló ADN genómico utilizando perlas magnéticas de inmovilización reversible en fase sólida (Agencourt DNAdvance), se cortó con un sonicador Covaris S200 a una longitud promedio de 500 pb, se reparó en el extremo, se sometió a A-tailing y se ligó a adaptadores semifuncionales, incorporando un índice molecular aleatorio de 8 nt. Se utilizaron dos rondas de PCR anclado anidado, con cebadores complementarios a la etiqueta oligo, para el enriquecimiento de la diana. En el presente documento se pueden encontrar detalles completos del protocolo GUIDE-Seq ejemplar.
Procesamiento y consolidación de las lecturas de secuenciación
Se agruparon las lecturas que compartían las mismas seis primeras bases de secuencia, así como índices moleculares de 8 nt idénticos porque se supone que se originan a partir del mismo fragmento de plantilla pre-PCR original. Estas lecturas se consolidaron en una sola lectura de consenso seleccionando la base mayoritaria en cada posición. Se asignó una base sin dianas (N) en situaciones con más del 10 % de lecturas discordantes. Se consideró que la puntuación de calidad de base era la más alta entre las lecturas previas a la consolidación. Las lecturas consolidadas se asignaron a la referencia del genoma humano (GrCh37) utilizando BWA-MEM (Li y Durbin, Bioinformatics 26, 589­ 595 (2010)).
Identificación de sitios de escisión inespecíficos
Se tabularon las posiciones de mapeado de inicio para lecturas con calidad de mapeado > 50, y las regiones con posiciones de mapeado de inicio cercanas se agruparon utilizando una ventana deslizante de 10 pb. Se identificaron las ventanas genómicas que albergaban dsODN integrados mediante uno de los siguientes criterios: 1) dos o más lecturas de índice molecular únicas que mapean cadenas opuestas en la secuencia de referencia o 2) dos o más lecturas de índice molecular únicas amplificadas por cebadores directos e inversos. Se alinearon 25 pb de la secuencia de referencia que flanqueaban ambos lados de los puntos de rotura inferidos con el sitio diana previsto y se identificaron sitios inespecíficos de RGN con ocho o menos desajustes de la secuencia diana prevista. Se identificaron los SNP y los indels en estas posiciones mediante un algoritmo de identificación de variantes de consenso bin personalizado basado en el índice molecular y las herramientas SAM, y las secuencias inespecíficas que diferían de la secuencia de referencia se reemplazaron con la secuencia específica de la célula correspondiente.
Secuenciación basada en AMP
Para la validación de AMP de los DSB detectados por GUIDE-Seq, se diseñaron cebadores para regiones que flanqueaban los puntos de rotura bicatenarios inferidos tal como se ha descrito anteriormente (Zheng, Z. et al. Anchored multiplex PCR for targeted next-generation sequencing. Nat Med 2014 Nov 10. doi: 10.1038/nm.3729 (2014)), con la adición de un índice molecular de 8 nt. Siempre que fue posible, diseñamos dos cebadores para flanquear cada DSB.
Análisis de los datos de validación de AMP
Se analizaron las lecturas con puntuaciones de calidad promedio > 30 en busca de inserciones, deleciones e integraciones que se solapaban con las posiciones DSB inferidas de GUIDE-Seq utilizando Python. Solo se incluyeron los indels de 1 pb si estaban dentro de 1 pb del sitio de DSB previsto para minimizar la introducción de ruido de la PCR o el error de secuenciación. Las frecuencias de integración e indels se calcularon sobre la base de lecturas de índice molecular consolidadas.
Variación estructural
Se identificaron translocaciones, grandes deleciones e inversiones utilizando un algoritmo personalizado basado en alineaciones divididas BWA-MEM. Se agruparon los puntos de rotura de fusión candidatos dentro de las 50 bases en el mismo cromosoma para acomodar la posible resección alrededor del sitio de escisión Cas9. Se identificó un evento de fusión con al menos 3 lecturas divididas mapeadas de forma única, un parámetro también utilizado por la herramienta segemehl (Hoffmann, Genome biology, 2014)). Se mantuvo el encadenamiento del mapeado para la identificación de fusiones recíprocas entre dos que comportaban DSB, y para determinar la deleción o inversión. Las fusiones que comportaban DSB dentro de las posiciones cromosómicas de 1 kb se descartaron para considerar los indels grandes causados por una sola escisión de Cas9. Las DSB de fusión restantes se clasificaron en cuatro categorías: 'específicas', 'inespecíficas' o 'de fondo' en base a GUIDE-seq o, de lo contrario, 'otros'.
Comparación de sitios detectados por GUIDE-Seq y ChIP-Seq y predicciones in silico
Usamos la herramienta de diseño MIT CRISPR para identificar sitios potenciales inespecíficos para las diez RGN. Esta herramienta asigna a cada sitio inespecífico potencial un percentil correspondiente. A continuación, agrupamos estos percentiles en quintiles con fines de visualización. Debido a que la herramienta E-CRISP no clasifica sitios inespecíficos, simplemente encontramos los sitios inespecíficos de GUIDE-seq que se predijeron correctamente por E-CRISP. Para ambas predicciones de GUIDE-Seq frente a in silico, también dividimos los resultados de GUIDE-Seq que no fueron predichos por el método in silico en sitios inespecíficos que tienen números de desajuste dentro del intervalo de la herramienta MIT (máximo de 4) y E-CRISPR (máximo de 3), y aquellos con números de desajuste mayores que el umbral de estas herramientas de predicción. Al comparar los sitios inespecíficos de GUIDE-Seq con las predicciones de ChIP-Seq, se utilizó la misma técnica para encontrar los sitios inespecíficos de GUIDE-Seq predichos correctamente por el ChIP-Seq. Para cada una de estas comparaciones, cada agrupación que se realizó, se subdividió por número de desajuste de sitios inespecíficos para caracterizar mejor las propiedades de los sitios inespecíficos de RGN predichos correcta e incorrectamente.
Análisis del impacto de los desajustes, la accesibilidad del ADN y la densidad de PAM local en la tasa de escisión inespecífica
Evaluamos el impacto de la posición del desajuste, el tipo de desajuste y la accesibilidad del ADN sobre la especificidad utilizando modelos de regresión lineal ajustados a las tasas de escisión estimadas en sitios potenciales inespecíficos con cuatro o menos desajustes. Las covariables de posición no coincidentes se definieron como el número de bases no coincidentes dentro de cada una de las cinco ventanas de 4 pb que no se superponían aguas arriba del PAM. Las covariables de tipo de desajuste se definieron como i) el número de desajustes que resultan en un emparejamiento oscilante (el diana T reemplazada por C, el diana G reemplazada por A), ii) el número de desajustes que resultan en un emparejamiento de bases purina-pirimidina no oscilante (diana C reemplazada por T, diana A reemplazada por G), y iii) el número de desajustes erróneos que dan como resultado emparejamientos purina-purina o pirimidina-pirimidina.
Cada uno de los tres factores se utilizó en un modelo separado como factor predictivo de las tasas de escisión relativas, estimadas por log2 (1 recuento de lecturas de GUIDE-Seq). Las estimaciones del tamaño del efecto se ajustaron para la variabilidad entre sitios diana. Se evaluó la proporción de la variabilidad de la tasa de escisión dentro del sitio explicada por cada factor mediante la estadística parcial de eta-cuadrado basada en las sumas de regresión de cuadrados (SS): -q2p = SSfactor/ (SSfactor + Sserror). Además de los modelos de factor único, también ajustamos un modelo de regresión lineal combinado que incluye los tres factores, el nivel de expresión y la densidad de PAM en una ventana de 1 kb para evaluar su contribución independiente a la probabilidad de escisión inespecífica.
Reactivos y equipos ejemplares para la preparación de bibliotecas Guide-seq Conservación a temperatura ambiente
Elemento_________________________________ Proveedor________
Covaris S220 microTube, Covaris
Etanol, 200-prueba (100 %) Sigma Aldrich
Placas ópticas MicroAmp de 96 pocillos Applied Biosystems
H2O sin nucleasas Promega
Tubos de ensayo Qubit, 500 tubos/paquete Invitrogen
Qubit dsDNA BR Kit - 500 ensayos Invitrogen
Tampón TMAC, 5M Sigma Aldrich
- Cloruro de tetrametilamonio
Tampón IX TE/10mM Tris-HCl, pH 8,0 Invitrogen
UltraPure 0.5M EDTA, pH 8.0 (Gibco) (4x100ml) Life Technologies
Conservar a 4 °C
Elemento________________________________Proveedor______
Perlas Agencourt AMPure XP 60 ml Beckman Coulter
Conservar a -20 °C
Elemento_________________________________________ N.° de catálogo______
Mezcla de solución de dNTP, 25 mm Enzymatics, Inc.
Tampón de ligación lenta Enzymatics, Inc.
Mezcla de reparación de extremos (concentración baja) Enzymatics, Inc.
Ligasa de ADN T4 Enzymatics, Inc.
- Tampón de ligasa de 10X ADN T4 (tampón de ligación lenta)
Polimerasa de a Dn Taq Platinum® Life Technologies
- Tampón de PCR 10X (sin MgCh)
- MgCl250mm
Kits de cuantificación de bibliotecas qPCR Illumina KAPA Biosystems, Inc.
Equipo
Soporte magnético de placa de 96 pocillos Invitrogen
Fluorómetro Qubit 2.0 Life Technologies
Instrumento Covaris S-2 Focused Ultra-sonicator™ Covaris
Centrifugadora de mesa Thermo Scientific
Vortex de mesa Thermo Scientific
Termociclador Eppendorf
Miseq Illumina
Protocolo ejemplar para la preparación de la biblioteca de GUIDE-seq
Preparación de adaptador-Y
El adaptador Y se genera hibridando el oligo común Miseq con cada uno de los adaptadores de código de barras de la muestra (A01 a A16, ver Tabla 3). Los adaptadores también contienen índices moleculares de 8 mer NNWNNWNN (N = A, C, T, o G; W = A o T)
Tampón TE 1X 80,0 pl
a## (100 pm) 10,0 pl
Adaptador común MiSeq MI (100 pm)__________ 10,0 pl
Total 100,0 pl
SEQ ID NO:Programa de hibridación: 95 °C durante 1 s; 60 °C durante 1 s; rampa de descenso lento (aproximadamente -2 °C/min) a 4 °C; mantener a 4 °C. Conservar a -20 °C.
Cuantificación de entrada y cizallamiento
1. Se cuantifica el dsDNA mediante Qubit y se llevan 400 ng a un volumen final de 120 ul utilizando el Tampón TE IX.
2. Cada muestra se somete a cizallamiento a una longitud promedio de 500 pb de acuerdo con el protocolo operativo estándar de Covaris S2.
3. Se realiza una limpieza con 120 pl de perlas AMPure XP SPRI (relación IX) de acuerdo con el protocolo del fabricante y se eluye en 15 pl de tampón TE IX.
Reparación de extremos, A-tailing v ligación
Reparación de extremos
4. A un tubo de PCR de 200 ml o un pocilio en una placa de 96 pocilios, añadir lo siguiente (por reacción):
H2O sin nucleasas 0,5 pl
Mezcla de dNTP, 5 mm 1,0 pl
Tampón de ligación lenta, 10X 2,5 pl
Mezcla de reparación de extremos (concentración baja) 2,0 pl
Tampón para polimerasa Taz, 10X (Mg2 libre) 2,0 pl
Polimerasa Taq (sin arranque en caliente)______________0,5 pl_____
Total 8,5 pl
muestra de ADN (del paso anterior) 14,0 pl
Total 22,5 pl
Programa de termociclador de reparación de extremos: 12 °C durante 15 min, 37 °C durante 15 min, 72 °C durante 15 min; mantener a 4 °C
Ligación de adaptadores
5. Al tubo o pocillo de reacción de la muestra, añadir los siguientes reactivos en orden (mezcla por pipeteo):
Adaptador en Y hibridado_MI (10 pm) 1,0 pl
Ligasa de ADN T4 2,0 pl
muestra de ADN (del paso anterior)__________ 22,5 pl
Total 25,5 pl
Programa de termociclador de ligación de adaptadores: 16 °C durante 30 min, 22 °C durante 30 min, mantener a 4 °C 6. Limpiar 0,9X de SPRI (22,95 pl de perlas Ampure XP), eluir en 12 pl de tampón TE IX.
PCR PCR 1 (cebador de etiqueta oligo [Discovery! o pool de cebadores grande [Validación de secuenciación profunda!)
7. Preparar la siguiente mezcla maestra:
H2O sin nucleasas 11,9 pl
Tampón para polimerasa Taz, 10X (MgCl2 ee) 3,0 pl
Mezcla de dNTP, 10 mm 0,6 pl
MgCl2, 50 mm 1,2 pl
Polimerasa Taq de platino, 5 U/pl 0,3 pl
Cebador de GSP1 (10 pm)/Pool de cebadores (*) 1,0 pl*
TMAC (0,5M) 1,5 pl
P5 1,10 pm____________________________________________________ 0,5 pl
Total 20,0 pl
muestra de ADN (del paso 6) 10,0 pl Total__________________________________________________________ 30,0 pl
* Para Discovery, hacer mezclas maestras separadas para reacciones /(sentido) y -/(antisentido), y seguir con reacciones de PCR separadas.
* Para la validación de secuenciación profunda, se puede realizar una mezcla maestra. El pool de cebadores debe normalizarse a una cantidad total de 30 pmol en la reacción de 30 pl.
Programa de termociclador Discovery (touchdown):
95 °C durante 5 min,
15 ciclos de [95 °C durante 30 s, 70 °C (-1 °C/ciclo) durante 2 min, 72 °C durante 30 s], 10 ciclos de [95 °C durante 30 s, 55 °C durante 1 min, 72 °C durante 30 s],
72 °C durante 5 min,
mantener a 4 °C
Programa de validación del termociclador:
95 °C durante 5 min,
14 ciclos de [95 °C durante 30 s, 20 % de rampa de descenso a 65 °C, 65 °C durante 5 min], 72 °C durante 5 min,
mantener a 4 °C
8. Limpiar 1,2X de SPRI (36,0 pl), eluir en 15 pl de tampón TE IX.
PCR 2 (cebador de etiqueta oliao rDiscovervI o pool de cebadores grande [Validación de secuenciación profunda])
9. Preparar la siguiente mezcla maestra:
H2O sin nucleasas 5,4 pl
Tampón para polimerasa Taz, 10X (Mg2 libre) 3,0 pl
Mezcla de dNlTp, 10 mm 0,6 pl
MgCl2, 50 mm 1,2 pl
Polimerasa Taq de platino, 5 U/pl 0,3 pl
Cebador de GSP2 (10 pm)/Pool de cebadores (*) 1,0 pl
TMAC (0,5M) 1,5 pl
P5 2,10 pm___________________________________________0,5 pl
Total 13,5 pl
P7_# (10 pm)* 1,5 pl
muestra de ADN con perlas (del paso 8) 15,0 pl Total________________________________________________ 30,0 pl
Las concentraciones de cebadores deben seguir las especificaciones descritas en la PCR1
* Para P7_ #, se deben utilizar al menos 4 en una secuenciación para un buen registro de imagen en el secuenciador Illumina (por ejemplo, P701 - P704 o P705 - P708)
Programa de termociclador Discovery (touchdown):
igual que para PCR1
Programa de validación del termociclador:
igual que para PCR1
10. Limpiar 0,7X de SPRI (21,0 pl), eluir en 30 pl de tampón TE IX.
Cuantificación de bibliotecas mediante qPCR y secuenciación
Cuantificación de qPCR
11. Cuantificar la biblioteca con el kit de Kapa Biosystems para el kit de cuantificación de bibliotecas de Illumina, de acuerdo con las instrucciones del fabricante.
Normalización y secuenciación
12. Utilizando la estimación de la cantidad media del número de moléculas por pl proporcionada por la ejecución de qPCR para cada muestra, proceder a normalizar el conjunto total de bibliotecas a 1,2 X 10A10 moléculas, dividido por el número de bibliotecas que se agruparán para la secuenciación. Esto dará una entrada por molécula para cada muestra, y también una entrada por volumen para cada muestra. Después de su agrupación (pooling), Speedvac (seque) la biblioteca con un Vacufuge hasta un volumen final de 10 pl para la secuenciación. Desnaturalizar la biblioteca y cargarla en Miseq de acuerdo con el protocolo estándar de Illumina para la secuenciación con un kit de reactivos Miseq de Illumina V2: ciclo de 300 (2 x 150 pb de extremos emparejados), excepto:
1) Añadir 3 pl de cebador de secuenciación personalizado 100 mm Index 1 a la posición 13 del cartucho de reactivo Miseq (Mezcla de cebadores Index). Añadir 3 pl de cebador de secuenciación personalizado 100 mm de lectura 2 a la posición 14 del cartucho de reactivo Miseq (mezcla de cebador de Read 2).
Enviar los datos de secuenciación en formato bcl o fastq a los conductos relevantes para su posterior análisis bioinformático.
Figure imgf000020_0001
Figure imgf000021_0001
Figure imgf000022_0002
Figure imgf000022_0001
Resultados
Descripción general del método ejemplar de GUIDE-Seq
En algunas realizaciones, GUIDE-Seq consta de dos etapas (Fig. 5B): En la Etapa I, las DSB en los genomas de las células humanas vivas se marcan mediante la integración de un oligodesoxinucleótido bicatenario (dsODN) romo en estas roturas. En la Etapa II, los sitios de integración de dsODN en el ADN genómico se mapean con precisión a nivel de nucleótidos utilizando amplificación no sesgada y secuenciación de próxima generación.
Para la Etapa I, optimizamos las condiciones para integrar un dsODN fosforilado en 5' romo en DSB inducidas por RGN en células humanas. En los experimentos iniciales, no pudimos observar la integración de tales dsODN en DSB inducidas por RGN. Usando dsODN que portan dos enlaces fosfotiorato en los extremos 5' de ambas cadenas de ADN diseñadas para estabilizar los oligos en las células20, observamos solo modestas frecuencias de integración detectables (Fig. 5B). Sin embargo, la adición de enlaces fosfotiorato en los extremos 3' de ambas cadenas llevó a eficiencias de integración robustas (Fig. 5B). Estas tasas de integración fueron solo de dos a tres veces más bajas que las frecuencias de indels inducidas por RGNs solas en estos sitios (es decir, en ausencia de dsODN).
Para la Etapa II, desarrollamos una nueva estrategia que nos permitió amplificar y secuenciar selectivamente, de una manera no sesgada, solo aquellos fragmentos que llevan un dsODN integrado (Fig. 5A). Logramos esto ligando primero adaptadores de secuenciación de próxima generación de "una sola única" a ADN genómico cortado aleatoriamente de células en las que se habían transfectado dsODN y plásmidos que codifican componentes de RGN. A continuación, realizamos una serie de reacciones de PCR iniciadas por un cebador que se hibrida específicamente con el dsODN y otro que se hibrida con el adaptador de secuenciación (Fig. 5A y Fig. 12). Debido a que el adaptador de secuenciación es de una sola cola, esto permite la amplificación unidireccional específica de la secuencia adyacente al dsODN, sin el sesgo inherente a otros métodos como la amplificación lineal mediada (LAM) -PCR2122. Hacemos referencia a nuestra estrategia como el método de PCR de adaptador/etiqueta de una sola cola (STAT). Al realizar reacciones STAT-PCR utilizando cebadores que se hibridan con cada una de las cadenas de dsODN, pudimos obtener lecturas de la secuencia genómica adyacente en ambos lados de cada etiqueta integrada (Fig. 5C). La incorporación de un código de barras molecular aleatorio de 8 pb durante el proceso de amplificación (Fig. 12) permite la corrección del sesgo de la PCR, lo que permite una cuantificación precisa de las lecturas de secuenciación únicas obtenidas de la secuenciación de alto rendimiento.
Perfiles de escisión inespecífica pangenómica de RGN de CRISPR en células humanas
Realizamos GUIDE-Seq con Cas9 y diez ARNg diferentes dirigidos a diversos genes humanos endógenos en líneas celulares humanas U2OS o HEK293 (Tabla 1). Al analizar los sitios de integración de dsODN (Métodos), pudimos identificar las ubicaciones genómicas precisas de las DSB inducidas por cada una de las diez RGN, mapeadas al nivel de nucleótidos (Fig. 5D). Para > 80 % de estas ventanas genómicas, pudimos identificar una secuencia objetivo superpuesta que es o está relacionada con el sitio específico (Métodos). Curiosamente, el número total de sitios inespecíficos que identificamos para cada RGN varió ampliamente, desde cero a > 150 (Fig. 5E), lo que demuestra que la extensión de escisión no deseada pangenómica para cualquier RGN en particular puede ser considerable o mínima en los extremos. No observamos ninguna correlación obvia entre la ortogonalidad de la secuencia del protoespaciador de ARNg en relación con el genoma humano (medida por el número total de sitios genómicos que albergan de uno a seis desajustes) y el número total de sitios inespecíficos que observamos mediante GUIDE-Seq (Fig. 5F). Las secuencias inespecíficas se encuentran dispersas por todo el genoma (Fig. 5Gg y Fig. 13A-J) y caen en exones, intrones y regiones intergénicas no codificantes (Fig. 5H). Entre las secuencias inespecíficas que identificamos estaban todos los sitios inespecíficos auténticos conocidos previamente para cuatro de las RGN4*5 (Fig.
6A-J). Más importante aún, GUIDE-Seq identificó una gran cantidad de sitios inespecíficos nuevos, previamente desconocidos, que se mapean en todo el genoma humano (Fig. 5E, 5G, 6A-J y 13A-J).
Figure imgf000024_0001
A continuación, comprobamos si el número de lecturas de secuenciación para cada sitio inespecífico identificado por GUIDE-Seq (que se muestra en las figuras 6A-J) representa un proxy de la frecuencia relativa de indels que serían inducidos por una RGN sola (es decir, en ausencia de un dsODN). El examen de estos sitios mediante la secuenciación de próxima generación basada en PCR múltiplex anclado (AMP) para cinco RGN en células U2OS humanas en las que se habían expresado componentes de nucleasa (Métodos) mostró que > 80 % (106 de 132) albergaba la característica de indels de longitud variable de la escisión de RGN, lo que respalda aún más nuestra conclusión de que GUIDE-Seq identifica sitios inespecíficos de RGN auténticos (figuras 7A). El intervalo de frecuencias indel detectadas osciló entre el 0,03 % y el 60,1 %. Es importante destacar que observamos correlaciones lineales positivas entre los recuentos de lecturas de GUIDE-Seq y las frecuencias de mutación indel para los cinco sitios inespecíficos de RGN (figuras 7A-F). Por tanto, llegamos a la conclusión de que los recuentos de lecturas de GUIDE-Seq para un sitio determinado representan una medida cuantitativa de la eficiencia de escisión de esa secuencia por una RGN.
Análisis de las características de secuencia inespecífica inducida por RGN
La inspección visual de los sitios inespecíficos que identificamos mediante GUIDE-Seq para las diez RGN subraya la diversidad de secuencias variantes en las que las RGN pueden escindirse. Estos sitios pueden albergar hasta seis desajustes dentro de la secuencia del protoespaciador (de acuerdo con un informe anterior que muestra la escisión in vitro de sitios con hasta siete desajustes6), PAM no canónicos (secuencias NAG y NGA descritas anteriormente5;-23 pero también nuevas secuencias de NAA, NGT, NGC y NCG), y desajustes24 de tipo "protuberancia" de 1 pb en la interfaz ARNg/protoespaciador (figura 6A-J). Los desajustes de los protoespaciadores tienden a ocurrir en el extremo 5' del sitio diana, pero también se pueden encontrar en determinadas posiciones del extremo 3', lo que respalda la idea de que no existen reglas simples para predecir los efectos del desajuste en función de la posición4. Curiosamente, algunos sitios inespecíficos en realidad tienen recuentos de lectura de secuenciación más altos que sus sitios específicos coincidentes (figuras 6A-D, 6J), en consonancia con nuestras observaciones anteriores de que las frecuencias de mutación inespecíficas pueden, en determinados casos, ser más altas que las del sitio específico previsto4. En particular, muchos de los sitios inespecíficos previamente conocidos para cuatro de las RGN tienen recuentos de lectura altos (figuras 6A-D), lo que sugiere que los análisis anteriores identificaron principalmente los sitios que se escinden de manera más eficiente.
El análisis cuantitativo de nuestros datos de GUIDE-Seq en las diez RGN nos permitió cuantificar las contribuciones y los impactos de diferentes variables tales como el número, ubicación y tipo de desajustes en la escisión del sitio inespecífico. Encontramos que la fracción de sitios genómicos totales que llevan un determinado número de desajustes de protoespaciadores que son escindidos por un RGN disminuye con un número creciente de desajustes (Fig. 8A).
Además, los recuentos de lecturas de secuencia muestran una tendencia general a la baja con un número creciente de desajustes (Fig. 8B). En general, los desajustes de protoespaciador emplazados más cerca del extremo 5' del sitio diana tienden a estar asociados con disminuciones más pequeñas en los recuentos de lectura de GUIDE-Seq que aquellos más cercanos al extremo 3', aunque los desajustes emplazados a 1 a 4 pb de distancia del PAM son algo mejor tolerados que los de 5 a 8 pb de distancia (Fig. 8C). Curiosamente, la naturaleza del desajuste también está asociada con un efecto en los recuentos de lectura de GUIDE-Seq. Los desajustes oscilantes ocurren con frecuencia en los sitios inespecíficos y nuestro análisis sugiere que están asociados con impactos más pequeños en los recuentos de lectura de GUIDE-Seq que otros desajustes que no son oscilantes (Fig. 8D). De acuerdo con estos resultados, encontramos que los factores individuales que explican el mayor grado de variación en la división inespecífica en los análisis de regresión univariante son el número, la posición y el tipo de desajuste. Por el contrario, otros factores como la densidad de secuencias de PAM proximales, el nivel de expresión génica o la posición genómica (intergénica/intrónica/exónica) explican una proporción mucho menor de la varianza en los recuentos de lectura de escisión de GUIDE-Seq (Fig. 8E). Un modelo de regresión lineal combinado que consideró múltiples factores, incluyendo la posición del desajuste, el tipo de desajuste, el nivel de expresión génica y la densidad de secuencias de PAM proximales arrojó resultados consistentes con los análisis univariados (Fig. 14). Este análisis también nos permitió estimar de forma independiente que, de media y dependiendo de su posición, cada desajuste oscilante adicional disminuye las tasas de escisión inespecífica en ~ 2 a 3 veces, mientras que los desajustes no oscilantes adicionales disminuyen las tasas de escisión en ~ 3- veces (Fig. 14).
Comparaciones de GUIDE-Seq con los métodos de predicción inespecífica existentes
Habiendo establecido la eficacia de GUIDE-Seq, a continuación realizamos comparaciones directas de nuestro nuevo método con dos métodos informáticos populares existentes para predecir sitios de mutación inespecíficos: el MIT CRISPR Design Tool25 (crispr.mit.edu) y el E -Programa program26 (www.e-crisp.org/E-CRISP/). Ambos programas intentan identificar posibles sitios inespecíficos en función de determinadas "reglas" sobre el número y la posición del desajuste y se han utilizado en publicaciones anteriores para identificar sitios inespecíficos. En nuestras comparaciones que utilizaban las diez RGN que caracterizamos por GUIDE-Seq, encontramos que ambos programas no pudieron identificar la gran mayoría de los sitios inespecíficos verificados experimentalmente (figuras 9A-B). Muchos de estos sitios se pasaron por alto porque los programas E-CRISP y MIT simplemente no consideran sitios inespecíficos que tengan más de 3 y 4 desajustes, respectivamente (figuras 9C-D). Incluso entre las secuencias que se consideran, estos programas siguen sin poder identificar la mayoría de los sitios inespecíficos auténticos (Fig. 9C-D), destacando su capacidad actualmente limitada para explicar los factores que determinan si se producirá o no la escisión. En particular, vale la pena señalar que los sitios omitidos incluyen aquellos con tan solo un desajuste (figuras 9C-D), aunque las puntuaciones de clasificación asignadas por el programa MIT tienen cierto poder predictivo entre los sitios que identifica correctamente. Por último, es importante señalar que ambos programas devuelven muchos sitios "falsos positivos" que no están identificados por GUIDE-Seq (figuras 9A-B). Concluimos que tanto el MIT como los programas E-CRISP funcionan de manera sustancialmente menos efectiva que nuestro método GUIDE-Seq para identificar sitios inespecíficos de RGN auténticos.
Comparación de GUIDE-Seq con el método ChIP-Seq para determinar los sitios de unión de dCas9
También buscamos comparar directamente GUIDE-Seq con los métodos de ChIP-Seq previamente descritos para identificar sitios inespecíficos de RGN. Cuatro de los RGN que evaluamos mediante GUIDE-Seq utilizaron ARNg que se había caracterizado previamente en experimentos de ChIP-Seq con Cas9 catalíticamente inactiva (dCas9), lo que dio como resultado la identificación de un gran conjunto de sitios de unión inespecíficos18. Las comparaciones directas muestran muy poca superposición entre los sitios de escisión inespecíficos de Cas9 identificados por GUIDE-Seq y los sitios de unión inespecíficos de dCas9 identificados por ChIP-Seq; entre los 149 sitios de escisión inespecíficos inducidos por RGN que identificamos para los cuatro ARNg, solo tres se identificaron previamente mediante los experimentos de dCas9 ChIP-Seq publicados anteriormente utilizando los mismos ARNg (Fig. 9E). Es probable que esta falta de superposición se deba a que los sitios de unión inespecíficos de dCas9 son fundamentalmente distintos de los sitios de escisión inespecíficos de Cas9, una hipótesis respaldada por nuestros datos que demuestran que los sitios de escisión inespecíficos de Cas9 para estos cuatro ARNg identificados por GUIDE-Seq albergan en promedio muchos menos desajustes que sus sitios de unión identificados por ChIP-Seq (Fig.9F) y por los resultados de estudios previos que demuestran que muy pocos sitios de unión de dCas9 muestran evidencia de indels en presencia de Cas9 activo16-19. Aunque GUIDE-Seq no pudo identificar los cuatro sitios inespecíficos previamente identificados por ChIP-Seq y posteriormente demostrados como diana de mutagénesis por Cas9, creemos que esto se debe a que esos sitios se identificaron incorrectamente como sitios de escisión inespecíficos auténticos en ese estudio anterior-18. Un análisis cuidadoso de los datos de secuenciación de ese estudio sugiere que la gran mayoría de las mutaciones indel encontradas en esos sitios probablemente sean causadas por errores de secuenciación o PCR y no por la actividad de escisión de RGN (figuras 15A-D). Tomados en conjunto, estos hallazgos demuestran que GUIDE-Seq supera sustancialmente a ChIP-Seq para la identificación de sitios de escisión inespecíficos auténticos y aporta respaldo experimental a la idea de que muy pocos (si los hay) sitios de unión inespecíficos de dCas9 descubiertos por ChlP-Seq representan sitios de escisión reales inespecíficos de Cas9.
identificación de puntos calientes de DSB independientes de RGN en células humanas mediante GUIDE-Seq
Nuestros experimentos GUIDE-Seq también revelaron inesperadamente la existencia de un total de 30 puntos calientes de DSB independientes de RGN únicos en las células U2OS y HEK293 utilizadas para nuestros estudios (Tabla 2). Descubrimos estos sitios al analizar el ADN genómico de experimentos de control con células U2OS y HEK293 en los que transfectamos solo el dsODN sin plásmidos que codifican RGN (Métodos). En contraste con las DSB inducidas por RGN que se asignan con precisión a posiciones de pares de bases específicas, las DSB independientes de RGN tienen patrones de integración de dsODN que están más ampliamente dispersos en cada locus en el que se producen (Métodos). Estos 30 puntos calientes de puntos de rotura se distribuyeron en muchos cromosomas y parecían estar presentes en o cerca de las regiones centroméricas o teloméricas (figura 10F). Curiosamente, solo un pequeño número de estas DSB (dos) eran comunes a ambas líneas celulares y la mayoría parecía ser específica de la línea celular (25 en células U2OS y 7 en células HEK293; figura 10F y tabla 2). Hasta donde sabemos, GUIDE-Seq es el primer método que permite la identificación directa y no sesgada de puntos calientes de puntos de rotura en células humanas vivas sin la necesidad de fármacos potencialmente tóxicos (por ejemplo, inhibidores de replicación del ADN como afidicolina) para revelar su presencia.
Tabla 2 Resumen de puntos calientes de los puntos de rotura independientes de RGN en células humanas U2OS y HEK293
Figure imgf000027_0001
Participación de DSB tanto inducidas por RGN como independientes de RGN en reordenamientos genómicos a gran escala
En el curso del análisis de los resultados de nuestros experimentos de secuenciación de próxima generación diseñados para identificar indels en DSB inducidas por RGN e independientes de RGN, también descubrimos que algunas de estas roturas pueden participar en translocaciones, inversiones y grandes deleciones. El método AMP utilizado nos permitió observar estas alteraciones genómicas a gran escala porque, para cada sitio de DSB examinado, este método utiliza solo cebadores específicos de locus anidados anclados en un solo extremo fijo en lugar de un par de cebadores específicos de locus flanqueantes (Fig. 10A). Por lo tanto, la secuenciación basada en AMP no solo identifica si se han producido mutaciones indel en una DSB, sino que también puede detectar si la DSB se ha unido a otra secuencia.
Para las cinco RGN que examinamos, la secuenciación de AMP reveló que las DSB específicas e inespecíficas inducidas por RGN podrían participar en una variedad de translocaciones (Fig. 10B). En al menos un caso, pudimos observar los cuatro posibles eventos de translocación resultantes de un par de DSB (Fig. 10C). Cuando dos DSB estaban presentes en el mismo cromosoma, también observamos grandes deleciones e inversiones (Fig. 10B). En al menos un caso, observamos tanto una gran deleción entre dos roturas inducidas por RGN como una inversión de la misma secuencia intermedia (Fig. 10D). Es importante destacar que nuestros resultados también revelaron translocaciones (y deleciones o inversiones) entre las DSB inducidas por RGN y las independientes de RGN (Fig.
10B), lo que sugiere que debe considerarse la interacción entre estos dos tipos de roturas cuando se evalúan los efectos inespecíficos de RGN en genomas celulares. Aunque nuestros datos sugieren que es probable que las frecuencias de estos reordenamientos genómicos a gran escala sean muy bajas, no fue posible la cuantificación precisa con la profundidad de secuenciación de nuestra serie de datos existente. El aumento del número de lecturas de secuenciación debería aumentar la sensibilidad de detección y permitir una mejor cuantificación de estas importantes alteraciones genómicas.
Perfiles de GUIDE-Seq de RGN dirigidas por ARNg truncados
Estudios previos de nuestro grupo han demostrado que el uso de ARNg que portan regiones de complementariedad truncadas de 17 o 18 nts puede reducir las frecuencias de mutación en sitios conocidos inespecíficos de RGN dirigidos por ARNg de longitud completa27. Sin embargo, debido a que este análisis se limitó a un pequeño número de sitios conocidos inespecíficos, las especificidades pangenómicas de estos ARNg truncados (tru-ARNg) se mantuvieron indefinidas en nuestros experimentos anteriores. Usamos GUIDE-Seq para obtener perfiles de DSB pangenómicas de RGN dirigidos por tres tru-ARNg, cada uno de los cuales son versiones más cortas de uno de los diez ARNg de longitud completa que habíamos analizado anteriormente.
Nuestros resultados muestran que en los tres casos, el número total de sitios inespecíficos identificados por GUIDESeq disminuyó sustancialmente con el uso de un tru-ARNg (Fig. 11A-D). El mapeado de las lecturas de GUIDE-Seq nos permitió identificar con precisión las ubicaciones de escisión de los sitios específicos (Fig. 11E) e inespecíficos (no se muestra). Como se esperaba y como observamos con los ARNg de longitud completa, en la lista de sitios inespecíficos se incluyeron 10 de los 12 sitios inespecíficos previamente conocidos para las RGN dirigidas por los tres tru-ARNg (figuras 11F-H). Las secuencias de los sitios inespecíficos que identificamos tenían principalmente uno o dos desajustes en el protoespaciador, pero algunos sitios tenían hasta cuatro (figuras 11F-H). Además, algunos sitios tenían secuencias de PAM alternativas de las formas NAG, NGA y NTG (figuras 11F-H). Estos datos proporcionan una confirmación a escala pangenómica de que el truncamiento de los ARNg puede reducir sustancialmente los efectos inespecíficos de las RGN y muestran cómo se puede utilizar GUIDESeq para evaluar las mejoras de especificidad para la plataforma de RGN.
Debate
GUIDE-Seq proporciona un método no sesgado, sensible y pangenómico para detectar DSB inducidas por RGN. El método es no sesgado porque detecta DSB sin hacer suposiciones sobre la naturaleza del sitio inespecíficos (por ejemplo, suponiendo que el sitio inespecífico está estrechamente relacionado en secuencia con el sitio específico). GUIDE-Seq identifica sitios inespecíficos pangenómicos, incluso dentro de exones, intrones y regiones intergénicas, y alberga hasta seis desajustes de protoespaciador y/o nuevos sitios PAM desajustados más allá de las secuencias alternativas de NAG y NGA descritas en estudios anteriores5- 23. Para las RGN que examinamos en este ejemplo, GUIDE-Seq no solo identificó con éxito todos los sitios inespecíficos conocidos previamente, sino que también reveló cientos de sitios nuevos.
Aunque la falta actual de un método estándar de referencia práctico para identificar exhaustivamente todos los sitios inespecíficos de RGN en una célula humana nos impide conocer la sensibilidad de GUIDE-Seq con certeza, creemos que es muy probable que tenga un bajo nivel de tasa de falsos negativos por las siguientes razones: En primer lugar, todas las DSB de extremos romos inducidos por RGN deberían recoger el dsODN de extremos romos de NHEJ, una hipótesis respaldada por las fuertes correlaciones que observamos entre los recuentos de lectura de GUIDE-Seq (que miden la absorción de dsODN) y las frecuencias de indels en presencia de la RGN (que mide las tasas de formación de DSB y de su reparación mutagénica) (figuras 7B-F). Observamos que estas correlaciones incluyen más de 130 sitios que muestran una amplia gama de frecuencias de mutagénesis de indels. En segundo lugar, utilizando sitios inespecíficos previamente identificados como punto de referencia (que es la única forma de medir el éxito en la actualidad), GUIDE-Seq pudo detectar 38 de 40 de estos sitios que muestran un rango de frecuencias de mutagénesis que se extienden hasta un 0,12 %. El método detectó los 28 sitios inespecíficos previamente conocidos para cuatro ARNg de longitud completa y 10 de los 12 sitios inespecíficos conocidos previamente para tres tru-ARNg. Uno de los dos sitios inespecíficos que no se detectó mostró evidencia de captura en nuestros datos sin procesar, pero nuestro algoritmo de identificación de lectura lo filtró porque las lecturas de secuenciación eran solo unidireccionales y se originaban a partir de un solo cebador (Métodos). (La falta de lecturas de mapas bidireccionales para este sitio puede deberse a una región repetitiva en un lado del sitio inespecífico que dificulta el mapeado de las lecturas con precisión). El otro sitio inespecífico no detectado ha sido previamente.
Cabe destacar que una de las RGN que evaluamos no produjo ningún efecto inespecífico detectable (en el límite de detección actual del método GUIDE-Seq), lo que plantea la intrigante posibilidad de que algunos ARNg pueden inducir muy pocas, o tal vez ninguna, mutación no deseada.
Aunque nuestros experimentos de validación muestran que GUIDE-Seq puede detectar de forma sensible sitios inespecíficos que son mutagenizados por RGN con frecuencias tan bajas como 0,1 %, sus capacidades de detección podrían mejorarse aún más con algunos simples cambios. Las estrategias que utilizan la secuenciación de próxima generación para detectar indels están limitadas por la tasa de error de la plataforma (normalmente del -0,1 %). Por el contrario, GUIDE-Seq utiliza la secuenciación para identificar los sitios de inserción de dsODN en lugar de indels y, por lo tanto, no está limitado por la tasa de error sino por la profundidad de secuenciación. Por ejemplo, creemos que la pequeña cantidad de sitios detectados en nuestros experimentos GUIDE-Seq para los cuales no encontramos indels en nuestros experimentos de validación de secuenciación en realidad representan sitios que probablemente tengan frecuencias de mutación indel por debajo del 0,1 %. De acuerdo con esto, observamos que todos menos tres de estos 26 sitios tenían recuentos de lectura de GUIDE-Seq por debajo de 100. En conjunto, estas observaciones sugieren que es posible que podamos aumentar la sensibilidad de GUIDE-Seq simplemente aumentando el número de lecturas de secuenciación (y aumentando el número de genomas utilizados como plantilla para la amplificación). Por ejemplo, el uso de una plataforma de secuenciación que rinda 1000 veces más lecturas permitiría la detección.
Las comparaciones directas permitidas por nuestros experimentos GUIDE-Seq muestran las limitaciones de dos programas informáticos existentes para predecir sitios inespecíficos de RGN. Estos programas no solo fallaron en identificar sitios inespecíficos auténticos encontrados por GUIDE-Seq, sino que también sobreidentificaron muchos sitios que no muestran escisión. Esto no es del todo sorprendente dado que los parámetros utilizados por estos programas se basaron en suposiciones más restrictivas sobre la naturaleza de los sitios inespecíficos que no tienen en cuenta un mayor número de desajustes de protoespaciadores y secuencias de PAM alternativas identificadas por nuestros experimentos de GUIDE-Seq. Es posible que se desarrollen mejores programas predictivos en el futuro, pero hacerlo requerirá sitios inespecíficos pangenómicos determinados experimentalmente para un mayor número de RGN. Hasta que se puedan desarrollar tales programas, la identificación de sitios inespecíficos se abordará de manera más eficaz mediante métodos experimentales como GUIDE-Seq.
Nuestros resultados experimentales elaboran una clara distinción entre el sitio de unión inespecífico de dCas9 y los sitios de escisión inespecíficos de Cas9. Las comparaciones de los datos de dCas9 de ChIP-Seq y Cas9 de GUIDE-Seq para cuatro ARNg distintos muestran que hay una superposición directa insignificante entre los dos conjuntos de sitios y que el número medio de desajustes en las dos clases de sitios son en realidad sustancialmente distintos. Además, mostramos que incluso el pequeño número de sitios de unión de dCas9 previamente reportados como mutagenizados por Cas9 es muy probable que no sean sitios de escisión auténticos inducidos por RGN. Tomados en conjunto, nuestros resultados muestran que la unión de dCas9 a los sitios de ADN que se capturan con ChIP-Seq representa un proceso biológico diferente al de la escisión de los sitios de ADN por la nucleasa Cas9, de acuerdo con los resultados de un estudio reciente que muestra que es necesaria la participación del extremo 5' del ARNg con el protoespaciador para una escisión eficaz19. Aunque los ensayos de ChIP-Seq sin duda tendrán un papel en la caracterización de la unión del genoma de las proteínas de fusión dCas9, el método claramente no es eficaz para determinar los sitios de escisión inespecíficos pangenómicos de las RGN catalíticamente activas.
GUIDE-Seq tiene varias ventajas importantes sobre otros métodos pangenómicos descritos anteriormente para identificar sitios de DSB en células. El método de etiquetado de oligonucleótidos BLESS recientemente descrito (roturas de etiquetado, enriquecimiento en estreptavidina y secuenciación de próxima generación, por sus siglas en inglés) se realiza in situ en células fijadas permeabilizadas27. Además de ser propenso a las aberraciones asociadas con la fijación celular, BLESS solo capturará las roturas que existen en un solo momento en el tiempo. Por el contrario, GUIDE-Seq se realiza en células vivas y captura las DSB que se producen durante un período de tiempo más prolongado (días), lo que lo convierte en un ensayo más sensible y completo. La captura de ADN de lentivirus deficientes en integración (IDLV) en regiones cercanas a DSB y la identificación de estos loci mediante LAM-PCR se ha utilizado para identificar un pequeño número de sitios inespecíficos para nucleasas de dedos de zinc (ZFN)22 y nucleasas de efectores similares a activadores de transcripción (TALEN)28 en células humanas. Sin embargo, los eventos de integración de IDLV son generalmente bajos en número y ampliamente dispersos en distancias de hasta 500 bp de distancia de la DSB2228 inespecífica real, lo que hace que sea un desafío tanto para mapear con precisión la ubicación del evento de escisión como para inferir la secuencia del sitio inespecífico real. Además, LAM-PCR presenta debilidades de sesgo de secuencia y/o baja eficiencia de las lecturas de secuenciación. En conjunto, estas limitaciones también pueden explicar la aparente incapacidad para detectar sitios de escisión inespecíficos de ZFN de menor frecuencia mediante la captura de IDLV29. Por el contrario, los dsODN se integran de manera muy eficiente y precisa en las DSB con GUIDE-Seq, lo que permite mapear las roturas con resolución de un solo nucleótido y una identificación simple y directa de los sitios de escisión inespecíficos de la nucleasa. Además, a diferencia de LAM-PCR, nuestro método STAT-PCR permite una amplificación y secuenciación eficaz y no sesgada de los fragmentos de ADN genómico en los que se ha integrado el dsODN. Observamos que STAT-PCR puede tener una utilidad más general más allá de su uso en GUIDE-Seq; por ejemplo, puede ser útil para estudios que buscan mapear los sitios de integración de virus en una escala pangenómica.
Aunque GUIDE-Seq es muy sensible, sus capacidades de detección podrían mejorarse aún más con algunos simples cambios. Las estrategias que utilizan la secuenciación de próxima generación para detectar indels están limitadas por la tasa de error de la plataforma (normalmente del 0,1 %). Por el contrario, GUIDE-Seq utiliza la secuenciación para identificar los sitios de inserción de dsODN en lugar de indels y, por lo tanto, no está limitado por la tasa de error sino por la profundidad de secuenciación. Por ejemplo, creemos que la pequeña cantidad de sitios detectados en nuestros experimentos GUIDE-Seq para los cuales no encontramos indels en nuestros experimentos de validación de secuenciación en realidad representan sitios que probablemente tengan frecuencias de mutación por debajo del 0,1 %. De acuerdo con esto, observamos que todos menos 3 de estos 26 sitios tenían recuentos de lectura de GUIDE-Seq por debajo de 100. En conjunto, estas observaciones sugieren que es posible que podamos aumentar la sensibilidad de GUIDE-Seq simplemente aumentando el número de lecturas de secuenciación (y aumentando el número de genomas utilizados como plantilla para la amplificación). Por ejemplo, el uso de una plataforma de secuenciación que produce 1000 veces más lecturas permitiría la detección de sitios con frecuencias de mutagénesis tres órdenes de magnitud más bajas (es decir, 0,0001 %), y esperamos que se produzcan más aumentos con las continuas mejoras en la tecnología.
Un resultado inesperado de nuestros experimentos fue la comprensión de que GUIDE-Seq también podría identificar puntos calientes de puntos de rotura que se producen en las células incluso en ausencia de RGN. Creemos que estas DSB no son solo una aberración de GUIDE-Seq porque nuestros experimentos de secuenciación basados en AMP verificaron no solo la captura de dsODN sino también la formación de indels en estos sitios. Cabe destacar que muchos puntos calientes son exclusivos de cada una de las dos líneas celulares examinadas en nuestro estudio, pero algunos también parecen ser comunes a ambas. Será interesante en estudios futuros definir los parámetros que rigen por qué algunos sitios son puntos calientes de puntos de rotura en un tipo de célula, pero no en otra. Además, debido a que nuestros resultados muestran que estos puntos calientes de puntos de rotura pueden participar en translocaciones, la existencia de puntos calientes de puntos de rotura específicos del tipo de célula podría ayudar a explicar por qué determinados reordenamientos genómicos solo se producen en tipos celulares específicos, pero no en otros. Hasta donde sabemos, GUIDE-Seq es el primer método descrito que puede identificar puntos calientes de puntos de rotura en células humanas vivas sin la necesidad de añadir fármacos que inhiban la replicación del ADN27. Por lo tanto, esperamos que proporcione una herramienta útil para identificar y estudiar estas roturas.
Nuestro trabajo establece el enfoque cualitativo más completo descrito hasta la fecha para identificar las translocaciones inducidas por las RGN. La secuenciación dirigida basada en AMP de sitios de DSB inducidas por RGN e independientes de RGN descubiertos por GUIDE-Seq puede encontrar un reordenamiento genómico a gran escala que incluye translocaciones, deleciones e inversiones que involucran ambas clases de sitios, lo que destaca la importancia de considerar ambas clases de roturas al identificar reordenamientos genómicos a gran escala. Además, es de suponer que no todas las DSB inducidas por RGN o independientes de RGN participarán en alteraciones a gran escala y comprender por qué algunos sitios lo hacen y otros no contribuyen a estos reordenamientos será un área importante para futuras investigaciones.
GUIDE-Seq también proporcionará un medio importante para evaluar las mejoras de la especificidad de la plataforma de RGN a escala pangenómica. En este informe, utilizamos GUIDE-Seq para mostrar cómo la implementación de ARNg truncados puede reducir los efectos inespecíficos a escala pangenómica, ampliando los resultados anteriores de nuestro grupo de que este enfoque puede reducir las mutaciones en sitios conocidos inespecíficos de un ARNg de longitud completa coincidente22. También podría adaptarse para evaluar las especificidades pangenómicas de nucleasas Cas9 alternativas de otras bacterias o arqueobacterias, o de nucleasas como ZFN diméricas, TALEN y nucleasas FokI guiadas por ARN CRISPR3132 que generan salientes en 5' o nicasas de Cas9 emparejadas33,34 que generan salientes en 5' o 3'; sin embargo, extender GUIDE-Seq para detectar estos otros tipos de DSB sin duda requerirá una modificación y optimización adicionales del dsODN para asegurar su captura eficiente en tales roturas. El método también podría utilizarse para evaluar las especificidades de nucleasas Cas9 alternativas de otras bacterias o arqueobacterias35. Una advertencia importante es la necesidad de examinar una gran cantidad de ARNg antes de sacar conclusiones generales sobre la especificidad de cualquier nueva plataforma de Cas9 porque encontramos una variabilidad muy amplia en el número de sitios inespecíficos para los diez ARNg que evaluamos.
Nuestro enfoque ejemplar que utiliza GUIDE-Seq y secuenciación basada en AMP establece un nuevo estándar de referencia para la evaluación de mutaciones inespecíficas y reordenamientos genómicos inducidos por RGN. Esperamos que GUIDE-Seq se pueda extender para el uso en cualquier célula en la que esté activo NHEJ y en la que se puedan introducir de manera eficiente los componentes necesarios; por ejemplo, ya hemos logrado una integración de dsODN eficiente en células madre embrionarias de ratón y K562 humanas (datos no mostrados). Lo más importante es que las estrategias descritas aquí se pueden utilizar como parte de una ruta preclínica rigurosa para evaluar objetivamente los posibles efectos inespecíficos de cualquier RGN propuesta para uso terapéutico, mejorando así sustancialmente las perspectivas de uso de estos reactivos en la clínica.
Ejemplo 3.
Se realizaron experimentos adicionales para explorar los requisitos para los dsODN que se pueden utilizar en algunas realizaciones de los presentes métodos.
Se utilizaron los siguientes dsODN en los experimentos en el Ejemplo 3:
Figure imgf000032_0001
En primer lugar, se evaluaron las frecuencias de integración de 3 tipos de dsODN que utilizan TALEN, ZFN y RFN dirigidos contra EGFP. Se nucleofectaron células 2E5 U2OS-EGFP con 500 ng de cada monómero de TALEN (1 ug en total), 500 ng de cada monómero de ZFN (1 ug en total) o 325 ng de plásmido de ARNg multiplex y 975 ng de plásmido de expresión de FokI-dCas9 y 100 pmol de dsODN. Los tres dsODN utilizados tenían un saliente 5' de 4 pb con enlaces fosforotioato en 5', un saliente 3' de 4 pb con enlaces fosforotioato en 3' o eran romos con enlaces fosforotioato en 5' y 3'. Todos los dsODN se fosforilaron en 5'. Se estimó la frecuencia de integración con el ensayo de polimorfismos de longitud de fragmentos de restricción (RFLP) NdeI y se cuantificó mediante electroforesis capilar; brevemente, los sitios diana se amplificaron mediante PCR a partir de ADN genómico aislado. Las PCR se digirieron con enzima de restricción Ndel (20 U) a 37 °C durante 3 horas y se purificaron con Ampure XP 1,8X. Los productos de escisión purificados se procesaron y cuantificaron mediante un instrumento de electroforesis capilar de Qiaxcel (Qiagen). La figura 16A muestra que los dsODN de extremos romos que estaban fosforilados en 5' y fosforotioados en 3' tenían las tasas de integración más altas.
Los mismos oligonucleótidos (ID SEQ. N° 1 y 2) utilizados anteriormente se transfectaron en células U2OS (programa DN-100) en 20 pl de solución SE (Lonza) en un Lonza Nucleofector 4-D según con las instrucciones del fabricante. Se transfectaron 500 ng de cada monómero de TALEN (TAL1252/TAL1301 para CCR5 y TAL2294/2295 para APC) y 100 pmol de dsODN. Las figuras 16B-C muestran evidencia de integración eficiente de un oligodesoxinucleótido bicatenario (dsODN) de 34 pb, fosforilado en 5', romo (oSQT685 / 686) en roturas bicatenarias (DSB) inducidas por TALEN en 2 sitios diana endógenos, CCR5 y APC en células U2OS, según se determina mediante análisis de polimorfismo de longitud de fragmentos de restricción (RFLP) Ndel (descrito anteriormente) o el ensayo T7E1 (brevemente, los sitios diana se amplificaron mediante PCR a partir de ADN genómico aislado. Las PCR se purificaron con Ampure XP 1,8X. El producto de PCR purificado (200 ng) se hibridó de acuerdo con el siguiente protocolo: 95 °C durante 5 minutos, 95-85 °C a -2 °C/s, 85-25 °C a -1 °C/10 s; mantener a 10 °C. A las reacciones se les añadió endonucleasa T7 I (10 U), que se incubó a 37 °C durante 15 minutos. Las reacciones se detuvieron mediante la adición de EDTA (25 mm) y se purificaron con Ampure XP 1,8X. Los productos de escisión purificados se procesaron y cuantificaron mediante un instrumento de electroforesis capilar de Qiaxcel (Qiagen).
Se realizaron experimentos adicionales con 2E5 U2OS-EGFP. Se nucleofectaron células con 325 ng de plásmido de ARNg múltiplex y 975 ng de plásmido de expresión FokI-dCas9 y 100 pmol de dsODN. Además, se nucleofectaron células ME de ratón 3E5 con 200 ng de plásmido de ARNg único y 600 ng de plásmido de expresión Cas9 y 100 pmol de dsODN. Se compararon dos dsODN: 1) romo, fosforilado, modificado con fosforotioato en 5' y 3' y 2) romo, fosforilado, modificado con fosforotioato solo en 3'. Se estimó la frecuencia de integración con el ensayo de polimorfismo de longitud de fragmentos de restricción (RFLP) Ndel y se cuantificó mediante electroforesis capilar.
Los experimentos, llevados a cabo con nucleasas Fokl guiadas por ARN dimérico en células U2OS humanas (Fig. 17A), o con Cas9 estándar en células ME de ratón (Fig. 17B), mostraron que los dsODN con solo modificaciones de fosforotioato en 3' tenían las mayores tasas de integración.
Se realizaron experimentos adicionales para probar diferentes concentraciones de oligo modificado con fosforotioato en 3' en células ME de ratón. Se nucleofectaron células ME de ratón 3E5 con 200 ng de plásmido de ARNg simple y 600 ng de plásmido de expresión Cas9, y cantidades variables de dsODN tal como se describe a continuación. En este experimento se utilizaron dsODN romos, fosforilados, modificados con fosforotioato solo en 3'. Los oligos hibridados se purificaron utilizando una columna Sephadex G-25 en una comparación entre dsODN purificado y no purificado. Los dsODN se sometieron a ensayo a concentraciones de 1, 2, 5, 10, 25, 50 y 100 pmol. Se estimó la frecuencia de integración con el ensayo de polimorfismo de longitud de fragmentos de restricción (RFLP) NdeI y se cuantificó mediante electroforesis capilar. Los resultados, que se muestran en las figuras 18A y 18B, indicaron que 50 pmol o 100 pmol proporcionaron la mejor actividad. La purificación del oligo a través de una columna Sephadex G-25 no mejoró significativamente las tasas (véanse las figuras 18A y 18B). Se estimó la frecuencia de mutagénesis mediante el ensayo T7E1, que mostró que la tasa general de alteración era alta, incluso en presencia de dsODN modificado en 3'.
También se evaluó la longitud de los dsODN. Las figuras 20A-B muestran que las etiquetas dsODN más largas (por ejemplo, 60 pb) se integraron de manera eficiente en los sitios de DSB inducidas por CRISPR-Cas9. Estos dsODN más largos se pueden utilizar para mejorar la precisión de GUIDE-seq al permitir el filtrado bioinformático de las aberraciones de amplificación por PCR. Estas secuencias podrían reconocerse como cualquiera que no contuviera secuencias presentes en la etiqueta más larga.
Figure imgf000034_0001
Estos experimentos muestran que la eficiencia de la absorción de la etiqueta dsODN se puede aumentar mediante el uso de oligos que se modifican solo en los extremos 3' en lugar de en los extremos 5' y 3', que son más largos, y que se produce una captura eficiente de la etiqueta dsODN en una variedad de líneas celulares, incluidas células que no son de una línea celular cancerosa transformada (por ejemplo, células ME de ratón).
Ejemplo 4.
En este ejemplo, se utilizó una versión biotinilada de la etiqueta de dsODN de GUIDE-seq como sustrato para la integración en los sitios de las DSB genómicas. Tal como se muestra en el ejemplo 4, fue posible integrar tal oligo de manera eficiente. Los experimentos se realizaron tal como se ha descrito anteriormente, utilizando un dsODN biotinilado, obtenido a partir de ADN de IDT.
Figure imgf000034_0002
Las figuras 19A-B demuestran la integración eficaz de la etiqueta de dsODN biotinilada en roturas bicatenarias (DSB) inducidas por Cas9 en 3 sitios diana endógenos, VEGFA3, EMX1 y FANCF1 en células U2OS. Este avance podría permitir la captura física directa de fragmentos marcados mediante la explotación de la estrecha afinidad de unión de la biotina y la estreptavidina. (A) El análisis de RFLP muestra el % de las tasas de integración de dsODN biotinilado (oSQT1261/1262), en comparación con el dsODN estándar (oSQT685 / 686) en DSB inducidas por Cas9 en 3 sitios endógenos, VEGFA3, EMX1 y FANCF1 en células U2OS. (b) T7EI muestra el % de frecuencias de mutagénesis estimadas con dsODN biotinilado (oSQT1261/1262), en comparación con el dsODN estándar (oSQT685/686) en 3 sitios endógenos, VEGFA3, EMX1 y FANCF1 en células U2OS.
Suponiendo que la biotinilación se conserva en las células, se puede utilizar para extraer físicamente fragmentos de ADN, incluyendo los ssODN biotinilados, y para secuenciar y mapear los fragmentos capturados.
Ejemplo 5.
En este ejemplo, se utiliza un método de GUIDE-Seq ejemplar con proteínas Cas9 variantes.
Se generaron proteínas variantes de Streptococcus pyogenes Cas9 (SpCas9) y Staphylococcus aureus Cas9 (SaCas9) como se describe en los documentos USSN 61/127,634 y 62/165,517, y en Kleinstiver et al., "Engineered CRISPR-Cas9 nucleases with altered PAM specificities". Nature (2015) doi:10.1038/nature14592. Se evaluaron los efectos inespecíficos tal como se ha descrito anteriormente.
La figura 21 muestra el número de sitios de escisión inespecíficos identificados por GUIDE-seq para variantes de SpCas9 modificadas por ingeniería que comprenden mutaciones en D1135V/R1335Q/T1337R (variante VQR) o D1135V/G1218R/R1335E/T1337R (variante VRER) utilizando sgRNA dirigidos EMX1, FANCF, RUNX1, VEGFA o ZNF629 (ver tabla 4 para las secuencias). Esto demuestra que GUIDE-seq también se puede utilizar para perfilar la especificidad pangenómica de las versiones modificadas por ingeniería de Cas9. GUIDE-seq también se utilizó para determinar los perfiles de especificidad de las variantes de SpCas9 VQR y VRER en células humanas dirigiéndose a sitios endógenos que contenían PAM de NGA o NGCG.
Figure imgf000036_0001
La figura 22 muestra cambios en la especificidad entre las variantes de SpCas9 de tipo salvaje y D1135E en sitios inespecíficos detectados utilizando un método ejemplar GUIDE-seq tal como se describe en el presente documento. También se utilizó GUIDE-seq para determinar las diferencias de recuento de lecturas entre SpCas9 de tipo salvaje y D1135E en 3 sitios de células humanas endógenas.
La integración de la etiqueta dsODN de GUIDE-seq también se realizó en 3 genes con la variante de Cas9 D1135E de tipo salvaje y modificada por ingeniería. Los resultados, que se muestran en las figuras 23A-B, proporcionan evidencia adicional de que GUIDE-seq se puede utilizar para perfilar variantes de Cas9 modificadas por ingeniería. Referencias
1. Sander, J.D. & Joung, J.K. CRISPR-Cas systems for editing, regulating and targeting genomes. Nat Biotechnol 32, 347-355 (2014).
2. Hsu, P.D., Lander, E.S. & Zhang, F. Development and applications of CRISPR-Cas9 for genome engineering. Cell 157, 1262-1278 (2014).
3. Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).
4. Fu, Y. et al. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells. Nat Biotechnol 31, 822-826 (2013).
5. Hsu, P.D. et al. DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol 31, 827-832 (2013).
6. Pattanayak, V. et al. High-throughput profiling of off-target DNA cleavage reveals RNA-programmed Cas9 nu-clease specificity. Nat Biotechnol 31, 839-843 (2013).
7. Cradick, T.J., Fine, E.J., Antico, C.J. & Bao, G. CRISPR/Cas9 systems targeting beta-globin and CCR5 genes have substantial off-target activity. Nucleic Acids Res 41, 9584-9592 (2013).
8. Cho, S.W. et al. Analysis of off-target effects of CRISPR/Cas-derived RNA-guided endonucleases and nickases. Genome Res 24, 132-141 (2014).
9. Ghezraoui, H. et al. Chromosomal translocations in human cells are generated by canonical nonhomologous end-joining. Mol Cell 55, 829-842 (2014).
10. Choi, P.S. & Meyerson, M. Targeted genomic rearrangements using CRISPR/Cas technology. Nat Commun 5, 3728 (2014).
11. Gostissa, M. et al. IgH class switching exploits a general property of two DNA breaks to be joined in cis over long chromosomal distances. Proc Natl Acad Sci US A 111, 2644-2649 (2014).
12. Tsai, S.Q. & Joung, J.K. What's changed with genome editing? Cell Stem Cell 15, 3-4 (2014).
13. Marx, V. Gene editing: how to stay on-target with CRISPR. Nat Methods 11, 1021-1026 (2014).
14. Veres, A. et al. Low incidence of off-target mutations in individual CRISPR-Cas9 and TALEN targeted human stem cell clones detected by whole-genome sequencing. Cell Stem Cell 15, 27-30 (2014).
15. Smith, C. et al. Whole-genome sequencing analysis reveals high specificity of CRISPR/Cas9 and TALEN-based genome editing in human iPSCs. Cell Stem Cell 15, 12-13 (2014).
16. Duan, J. et al. Genome-wide identification of CRISPR/Cas9 off-targets in human genome. Cell Res 24, 1009-1012 (2014).
17. Wu, X. et al. Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells. Nat Biotechnol 32, 670-676 (2014).
18. Kuscu, C., Arslan, S., Singh, R., Thorpe, J. & Adli, M. Genome-wide analysis reveals characteristics of off-target sites bound by the Cas9 endonuclease. Nat Biotechnol 32, 677-683 (2014).
19. Cencic, R. et al. Protospacer Adjacent Motif (PAM)-Distal Sequences Engage CRISPR Cas9 DNA Target Cleav-age. PLoSOne 9, e109213 (2014).
20. Orlando, S.J. et al. Zinc-finger nuclease-driven targeted integration into mammalian genomes using donors with limited chromosomal homology. Nucleic Acids Res 38, e152 (2010).
21. Schmidt, M. et al. High-resolution insertion-site analysis by linear amplification-mediated PCR (LAM-PCR). Nat Methods 4, 1051-1057 (2007).
22. Gabriel, R. et al. An unbiased genome-wide analysis of zinc-finger nuclease specificity. Nat Biotechnol 29, 816-823 (2011).
23. Jiang, W., Bikard, D., Cox, D., Zhang, F. & Marraffini, L.A. RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol 31, 233-239 (2013).
24. Lin, Y. et al. CRISPR/Cas9 systems have off-target activity with insertions or deletions between target DNA and guide RNA sequences. Nucleic Acids Res 42, 7473-7485 (2014).
25. Ran, F.A. et al. Genome engineering using the CRISPR-Cas9 system. Nat Protoc 8, 2281-2308 (2013).
26. Heigwer, F., Kerr, G. & Boutros, M. E-CRISP: fast CRISPR target site identification. Nat Methods 11, 122­ 123 (2014).
27. Crosetto, N. et al. Nucleotide-resolution DNA double-strand break mapping by next-generation sequencing. Nat Methods 10, 361-365 (2013).
28. Osborn, M.J. et al. TALEN-based gene correction for epidermolysis bullosa. Mol Ther 21, 1151-1159 (2013).
29. Sander, J.D. et al. In silico abstraction of zinc finger nuclease cleavage profiles reveals an expanded landscape of off-target sites. Nucleic Acids Res (2013).
30. Fu, Y., Sander, J.D., Reyon, D., Cascio, V.M. & Joung, J.K. Improving CRISPR-Cas nuclease specificity using truncated guide RNAs. Nat Biotechnol 32, 279-284 (2014).
31. Tsai, S.Q. et al. Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing. Nat Biotechnol 32, 569-576 (2014).
32. Guilinger, J.P., Thompson, D.B. & Liu, D.R. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat Biotechnol 32, 577-582 (2014).
33. Mali, P. et al. CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nat Biotechnol 31, 833-838 (2013).
34. Ran, F.A. et al. Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity. Cell 154, 1380-1389 (2013).
35. Fonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among or-thologous type II CRISPR-Cas systems. Nucleic Acids Res 42, 2577-2590 (2014).
Otras realizaciones
Cabe entender que mientras que la invención se ha descrito junto con la descripción detallada de la misma, la anterior descripción está prevista para ilustrar y no limitar el alcance de la invención, la cual queda definida por el alcance de las reivindicaciones adjuntas. Otros aspectos, ventajas y modificaciones entran dentro del alcance de las siguientes reivindicaciones.

Claims (14)

REIVINDICACIONES
1. Un método ex vivo o in vitro para detectar roturas bicatenarias (DSB) de una célula, comprendiendo el método:
poner en contacto la célula con un oligodesoxinucleótido bicatenario (dsODN) de extremo romo, donde el dsODN tiene entre 15 y 50 nts de longitud, donde ambas cadenas del dsODN son ortogonales al genoma de la célula; los extremos 5' del dsODN están fosforilados; y los enlaces fosforotioato están presentes en ambos extremos 3' o hay dos enlaces fosforotioato presentes en ambos extremos 3' y en ambos extremos 5';
expresar o activar la nucleasa modificada por ingeniería exógena en la célula, durante un tiempo suficiente para que la nucleasa induzca DSB en el ADN genómico de la célula, y para que la célula repare las DSB, integrando un dsODN en una o más DSB;
amplificar una porción de ADN genómico que comprende un dsODN integrado; y
secuenciar la porción amplificada del ADN genómico, detectando de este modo una DSB en el ADN genómico de la célula.
2. El método de la reivindicación 1, en donde la amplificación de una porción del ADN genómico comprende:
fragmentar el ADN;
ligar extremos del ADN genómico fragmentado de la célula con un adaptador universal;
realizar una primera ronda de reacción en cadena de la polimerasa (PCR) en el ADN ligado con un cebador complementario al dsODN integrado (cebador A) y un cebador complementario al adaptador universal (cebador B); a continuación, realizar una segunda ronda de PCR utilizando un cebador anidado en 3' complementario al cebador A (cebador C), un cebador anidado en 3' complementario al cebador B (cebador D) y un cebador complementario al cebador D (cebador E).
3. El método de la reivindicación 2, en donde el cebador E comprende uno o más de: una secuencia de purificación o unión; y/o una secuencia de identificación.
4. El método de la reivindicación 1, en donde la nucleasa modificada por ingeniería se selecciona del grupo que consiste en meganucleasas, nucleasas con dedos de zinc, nucleasas de efectores similares a activadores de transcripción (TALEN) y nucleasas guiadas por ARN de repeticiones palindrómicas cortas, agrupadas y regularmente interespaciadas (CRISPR)/Cas (RGN CRISPR/Cas).
5. El método de las reivindicaciones 1-4, en donde las DSB son DSB inespecíficas.
6. El método de las reivindicaciones 1-4, en donde las DSB se indujeron por una nucleasa modificada por ingeniería exógena.
7. Un método ex vivo o in vitro para determinar cuál de una pluralidad de ARN guía es el más específico, es decir, induce las menores DSB inespecíficas, comprendiendo el método:
poner en contacto una primera población de células con un primer ARN guía y un oligodesoxinucleótido bicatenario (dsODN) de extremo romo, donde el dsODN tiene entre 15 y 50 nts de longitud, donde ambas cadenas del dsODN son ortogonales al genoma de la célula; los extremos 5' del dsODN están fosforilados; y los enlaces fosforotioato están presentes en ambos extremos 3' o hay dos enlaces fosforotioato presentes en ambos extremos 3' y en ambos extremos 5';
expresar o activar una nucleasa modificada por ingeniería Cas9 exógena en la primera población de células, durante un tiempo
suficiente para que la nucleasa induzca DSB en el ADN genómico de las células, y para que las células reparen las DSB, integrando un dsODN en una o más DSB;
amplificar una porción de ADN genómico de la primera población de células que comprende un dsODN integrado; y secuenciar la porción amplificada del ADN genómico de la primera población de células;
determinar un número de sitios en los que se integra el dsODN en el ADN genómico de la primera población de células; poner en contacto una segunda población de células con un segundo ARN guía y un oligodesoxinucleótido bicatenario (dsODN) romo, donde el dsODN tiene entre 15 y 50 nts de longitud, donde ambas cadenas del dsODN
son ortogonales al genoma de la célula;
los extremos 5' del dsODN están fosforilados; y los enlaces fosforotioato están presentes en ambos extremos 3' o hay dos enlaces fosforotioato presentes en ambos extremos 3' o en ambos extremos 5'.
expresar o activar una nucleasa modificada por ingeniería Cas9 exógena en la segunda población de células, durante un tiempo suficiente para que la nucleasa induzca DSB en el ADN genómico de la segunda población de células y para que
las células reparen las DSB, integrando un dsODN en una o más DSB;
amplificar una porción de ADN genómico que comprende un dsODN integrado de la segunda población de células; y secuenciar la porción amplificada del ADN genómico de la segunda población de células; determinar un número de sitios en los que se integró el dsODN en el ADN genómico de la segunda población de células;
comparar el número de sitios en los que se integró el dsODN en el ADN genómico de la primera población de células con el número de sitios en los que se integró el dsODN en el ADN genómico de la segunda población de células; en donde el dsODN que se integró en menos sitios (inespecíficos) es más específico.
8. El método de cualquiera de las reivindicaciones 1-7, donde la célula es una célula de mamífero.
9. El método de cualquiera de las reivindicaciones 1-8 donde la nucleasa modificada por ingeniería es una nucleasa Cas9,y el método también incluye expresar en las células un ARN guía que dirige la nucleasa Cas9 a una secuencia diana en el genoma.
10. El método de cualquiera de las reivindicaciones anteriores, donde el dsODN tiene 30-35 nts de longitud y/o, donde el dsODN está biotinilado.
11. El método de la reivindicación 11, donde el método comprende:
cizallar el ADNg genómico en fragmentos; y
aislar los fragmentos que comprenden un dsODN mediante unión a la biotina.
12. El método de cualquiera de las reivindicaciones anteriores, donde el dsODN tiene 1 , 2, 3 o 4 nts que sobresalen en el extremo 5', y donde el dsODN está fosforotioado en los extremos 3'.
13. El método de cualquiera de las reivindicaciones anteriores, donde el dsODN contiene un código de barras de ADN aleatorizado.
14. El método de cualquiera de las reivindicaciones anteriores, que comprende:
cizallar el ADNg genómico en fragmentos; y
preparar los fragmentos para la secuenciación mediante reparación de extremos/A-tailing/ligación de un adaptador de secuenciación con una sola cola.
ES15812186T 2014-06-23 2015-06-23 Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.) Active ES2888976T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462015911P 2014-06-23 2014-06-23
US201462077844P 2014-11-10 2014-11-10
US201462078923P 2014-11-12 2014-11-12
US201462088223P 2014-12-05 2014-12-05
PCT/US2015/037269 WO2015200378A1 (en) 2014-06-23 2015-06-23 Genomewide unbiased identification of dsbs evaluated by sequencing (guide-seq)

Publications (1)

Publication Number Publication Date
ES2888976T3 true ES2888976T3 (es) 2022-01-10

Family

ID=54938752

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15812186T Active ES2888976T3 (es) 2014-06-23 2015-06-23 Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.)

Country Status (10)

Country Link
US (3) US9822407B2 (es)
EP (2) EP3919621A1 (es)
JP (3) JP6784601B2 (es)
KR (2) KR102598819B1 (es)
CN (1) CN106604994B (es)
AU (3) AU2015280069B2 (es)
CA (1) CA2953362A1 (es)
ES (1) ES2888976T3 (es)
IL (2) IL286474B2 (es)
WO (1) WO2015200378A1 (es)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2734621B1 (en) 2011-07-22 2019-09-04 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
ES2888976T3 (es) 2014-06-23 2022-01-10 Massachusetts Gen Hospital Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.)
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
JP7068821B2 (ja) 2014-12-03 2022-05-17 アジレント・テクノロジーズ・インク 化学修飾を有するガイドrna
EP3858990A1 (en) 2015-03-03 2021-08-04 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
CN107787367B (zh) 2015-04-06 2021-10-26 里兰斯坦福初级大学理事会 用于crispr/cas介导的基因调控的化学修饰的引导rna
JP2018530536A (ja) 2015-09-11 2018-10-18 ザ ジェネラル ホスピタル コーポレイション ヌクレアーゼDSBの完全照合およびシーケンシング(FIND−seq)
EP3356526B1 (en) 2015-09-30 2021-08-25 The General Hospital Corporation Comprehensive in vitro reporting of cleavage events by sequencing (circle-seq)
IL310721A (en) 2015-10-23 2024-04-01 Harvard College Nucleobase editors and their uses
US10961573B2 (en) 2016-03-28 2021-03-30 Boreal Genomics, Inc. Linked duplex target capture
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
EP3485032B1 (en) * 2016-07-12 2021-02-17 Life Technologies Corporation Compositions and methods for detecting nucleic acid regions
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11352647B2 (en) 2016-08-17 2022-06-07 The Broad Institute, Inc. Crispr enzymes and systems
CN110312799A (zh) * 2016-08-17 2019-10-08 博德研究所 新型crispr酶和系统
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CN110214180A (zh) 2016-10-14 2019-09-06 哈佛大学的校长及成员们 核碱基编辑器的aav递送
CN108070610B (zh) * 2016-11-08 2021-11-09 中国科学院分子植物科学卓越创新中心 植物基因组定点敲入方法
CA3048420A1 (en) 2016-12-09 2018-06-14 Boreal Genomics, Inc. Linked ligation
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
EP3565907B1 (en) 2017-01-06 2022-05-04 Editas Medicine, Inc. Methods of assessing nuclease cleavage
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
CN110914426A (zh) 2017-03-23 2020-03-24 哈佛大学的校长及成员们 包含核酸可编程dna结合蛋白的核碱基编辑器
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
CN106939303B (zh) * 2017-05-16 2021-02-23 上海交通大学 一种Cas9核酸酶R919P及其用途
WO2018232114A1 (en) * 2017-06-14 2018-12-20 Wisconsin Alumni Research Foundation Modified guide rnas, crispr-ribonucleotprotein complexes and methods of use
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
US11286468B2 (en) 2017-08-23 2022-03-29 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases with altered PAM specificity
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
WO2019075197A1 (en) 2017-10-11 2019-04-18 The General Hospital Corporation METHODS OF DETECTION OF INDIVIDUAL SITE-SPECIFIC PARASITE GENOMIC DEAMINATION BY BASE EDITING TECHNOLOGIES
AU2018352592A1 (en) 2017-10-16 2020-06-04 Beam Therapeutics, Inc. Uses of adenosine base editors
CN112313241A (zh) * 2018-04-17 2021-02-02 总医院公司 核酸结合、修饰、和切割试剂的底物偏好和位点的灵敏体外试验
WO2019217785A1 (en) 2018-05-10 2019-11-14 St. Jude Children's Research Hospital, Inc. High-throughput method for characterizing the genome-wide activity of editing nucleases in vitro
KR20210104068A (ko) 2018-12-14 2021-08-24 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 게놈 편집을 위한 신규한 crispr-cas 시스템
WO2020141464A1 (en) 2019-01-03 2020-07-09 Boreal Genomics, Inc. Linked target capture
AU2020242032A1 (en) 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
CA3140171A1 (en) * 2019-06-10 2020-12-17 Boreal Genomics, Inc. Linked target capture
JP2022545539A (ja) * 2019-08-26 2022-10-27 パクト ファーマ インコーポレイテッド 初代ヒトT細胞へのGUIDE-Seqの実施方法
WO2021050565A1 (en) * 2019-09-09 2021-03-18 Oregon Health & Science University Crispr-mediated capture of nucleic acids
CA3177481A1 (en) 2020-05-08 2021-11-11 David R. Liu Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
TW202208628A (zh) * 2020-05-13 2022-03-01 瑞士商赫孚孟拉羅股份公司 靶向顆粒蛋白前體之寡核苷酸促效劑
JP2023535407A (ja) * 2020-07-23 2023-08-17 インテグレーティッド ディーエヌエイ テクノロジーズ インコーポレーティッド 「CTL-seq」(CRISPR Tag Linear-seq)と称するヌクレアーゼオン/オフターゲット編集位置を指定するための方法
CN112159838B (zh) * 2020-09-30 2022-07-01 南方医科大学 一种检测脱靶效应方法及其应用
CN112501165A (zh) * 2020-11-12 2021-03-16 珠海舒桐医疗科技有限公司 一种生物素化的dsODN及其构建GUIDE-pro库的方法
CN113512535A (zh) * 2021-04-30 2021-10-19 华东师范大学 改变细胞内基因组序列的方法、基因编辑细胞及应用
CN113403309B (zh) * 2021-05-24 2022-08-16 珠海舒桐医疗科技有限公司 非同源双链寡聚核苷酸片段在基因敲除系统中的应用
CN113564227A (zh) * 2021-07-29 2021-10-29 翌圣生物科技(上海)股份有限公司 基于CRISPR/dcas9的宿主与病原微生物DNA快速分离方法
WO2023039586A1 (en) 2021-09-10 2023-03-16 Agilent Technologies, Inc. Guide rnas with chemical modification for prime editing
WO2024033378A1 (en) * 2022-08-09 2024-02-15 Institute Of Molecular Biology Ggmbh (Imb) Method of parallel, rapid and sensitive detection of dna double strand breaks
EP4321630A1 (en) * 2022-08-09 2024-02-14 Institute of Molecular Biology gGmbH (IMB) Method of parallel, rapid and sensitive detection of dna double strand breaks
CN115851720A (zh) * 2022-09-29 2023-03-28 细胞生态海河实验室 基因敲入方法及其在构建内源性融合基因和原代细胞基因敲入中的应用
CN116206684B (zh) * 2022-12-26 2024-01-30 纳昂达(南京)生物科技有限公司 一种评估基因组重复区探针捕获安全性的方法及其装置

Family Cites Families (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3102800B2 (ja) 1994-08-19 2000-10-23 パーキン−エルマー コーポレイション 増幅及び連結反応の共役法
USRE45721E1 (en) 1994-08-20 2015-10-06 Gendaq, Ltd. Relating to binding proteins for recognition of DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6503717B2 (en) 1999-12-06 2003-01-07 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
CA2364267A1 (en) * 1999-02-19 2000-08-24 Athersys, Inc. Compositions and methods for non-targeted activation of endogenous genes
US7501245B2 (en) 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
WO2001023610A2 (en) 1999-09-29 2001-04-05 Solexa Ltd. Polynucleotide sequencing
US6511808B2 (en) 2000-04-28 2003-01-28 Sangamo Biosciences, Inc. Methods for designing exogenous regulatory molecules
DE60131194T2 (de) 2000-07-07 2008-08-07 Visigen Biotechnologies, Inc., Bellaire Sequenzbestimmung in echtzeit
AU2003304086A1 (en) 2002-10-23 2004-11-26 Massachussetts Institute Of Technlogy Context sensitive parallel optimization of zinc finger dna binding domains
US7575865B2 (en) 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
WO2005039389A2 (en) 2003-10-22 2005-05-06 454 Corporation Sequence-based karyotyping
EP1526177A1 (en) * 2003-10-24 2005-04-27 Institut Curie Nucleic acids useful for triggering tumor cell lethality
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
CA2902980A1 (en) 2004-03-08 2005-09-29 Rubicon Genomics, Inc. Methods and compositions for generating and amplifying dna libraries for sensitive detection and analysis of dna methylation
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
AU2005296200B2 (en) 2004-09-17 2011-07-14 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
DK1924704T3 (da) 2005-08-02 2011-09-05 Rubicon Genomics Inc Sammensætninger og fremgangsmåder til bearbejdning og mangfoldiggørelse af DNA, herunder ved anvendelse af flere enzymer i en enkelt reaktion
ES2398918T3 (es) 2005-08-26 2013-03-22 Dupont Nutrition Biosciences Aps Un método y una ordenación para soportar verticalmente elementos de resistencia eléctrica pendientes
BRPI0618473A2 (pt) * 2005-11-11 2011-08-30 Pfizer combinações e métodos de uso de um oligodeoxinucleotìdeo imunomodulador
US7282337B1 (en) 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
ES2719789T3 (es) 2007-03-02 2019-07-16 Dupont Nutrition Biosci Aps Cultivos con resistencia mejorada a fagos
EP2568048A1 (en) * 2007-06-29 2013-03-13 Pioneer Hi-Bred International, Inc. Methods for altering the genome of a monocot plant cell
WO2009027978A1 (en) * 2007-08-30 2009-03-05 Hadasit Medical Research Services & Development Ltd. NUCLEIC ACID SEQUENCES COMPRISING NF-ϰB BINDING SITE WITHIN O(6)-METHYLGUANINE-DNA-METHYLTRANSFERASE (MGMT) PROMOTER REGION AND USES THEREOF FOR THE TREATMENT OF CANCER AND IMMUNE-RELATED DISORDERS
WO2009133466A2 (en) 2008-04-30 2009-11-05 Population Genetics Technologies Ltd. Asymmetric adapter library construction
WO2010011961A2 (en) 2008-07-25 2010-01-28 University Of Georgia Research Foundation, Inc. Prokaryotic rnai-like system and methods of use
WO2010030683A1 (en) * 2008-09-09 2010-03-18 Rosetta Inpharmatics Llc Methods of generating gene specific libraries
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
CN102264895B (zh) 2008-12-12 2015-01-28 杜邦营养生物科学有限公司 用于乳品发酵的具有独特流变性质的嗜热链球菌菌株的遗传簇
CN102301009B (zh) * 2009-02-03 2015-09-30 新英格兰生物实验室公司 使用酶在dna中产生随机双链断裂
US20120178647A1 (en) 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
JP5387839B2 (ja) 2009-09-04 2014-01-15 アイシン・エィ・ダブリュ株式会社 ナビゲーション装置、ナビゲーション方法、及びナビゲーションプログラム
CN102725412B (zh) * 2009-11-27 2017-09-22 巴斯夫植物科学有限公司 优化的内切核酸酶及其用途
US9023769B2 (en) 2009-11-30 2015-05-05 Complete Genomics, Inc. cDNA library for nucleic acid sequencing
WO2011086118A1 (en) * 2010-01-14 2011-07-21 Deutsches Krebsforschungszentrum In vivo determination of the lokalization of dna double-stand breaks and application thereof
WO2011100058A1 (en) * 2010-02-09 2011-08-18 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
US10087431B2 (en) 2010-03-10 2018-10-02 The Regents Of The University Of California Methods of generating nucleic acid fragments
EP2566985A4 (en) 2010-05-06 2014-08-06 Ibis Biosciences Inc INTEGRATED SAMPLE PREPARATION SYSTEMS AND MIXTURES OF STABILIZED ENZYMES
MX2012013037A (es) 2010-05-10 2013-07-29 Univ California Composiciones de endorribonucleasa y metodos de uso de las mismas.
EP3572528A1 (en) 2010-09-24 2019-11-27 The Board of Trustees of the Leland Stanford Junior University Direct capture, amplification and sequencing of target dna using immobilized primers
US8829171B2 (en) 2011-02-10 2014-09-09 Illumina, Inc. Linking sequence reads using paired code tags
AU2011325956B2 (en) 2010-11-12 2016-07-14 The General Hospital Corporation Polycomb-associated non-coding RNAs
EP2670894B1 (en) 2011-02-02 2017-11-29 University Of Washington Through Its Center For Commercialization Massively parallel continguity mapping
EP3260557A1 (en) * 2011-05-27 2017-12-27 Life Technologies Corporation Methods for manipulating biomolecules
WO2012164565A1 (en) 2011-06-01 2012-12-06 Yeda Research And Development Co. Ltd. Compositions and methods for downregulating prokaryotic genes
WO2013078470A2 (en) * 2011-11-22 2013-05-30 MOTIF, Active Multiplex isolation of protein-associated nucleic acids
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US9528107B2 (en) 2012-01-31 2016-12-27 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
US9487828B2 (en) 2012-05-10 2016-11-08 The General Hospital Corporation Methods for determining a nucleotide sequence contiguous to a known target nucleotide sequence
DE202013012242U1 (de) 2012-05-25 2016-02-02 Emmanuelle Charpentier Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription
EP2872629B1 (en) 2012-07-03 2019-09-04 Integrated DNA Technologies Inc. Tm-enhanced blocking oligonucleotides and baits for improved target enrichment and reduced off-target selection
US20140024542A1 (en) 2012-07-17 2014-01-23 Counsyl, Inc. Methods and compositions for enrichment of target polynucleotides
US10155941B2 (en) 2012-08-01 2018-12-18 Bernhard Suter High throughput yeast two-hybrid screening method and reagent kit
JP6552965B2 (ja) 2012-12-12 2019-07-31 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のための改善された系、方法および酵素組成物のエンジニアリングおよび最適化
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
SG10201707569YA (en) 2012-12-12 2017-10-30 Broad Inst Inc Delivery, Engineering and Optimization of Systems, Methods and Compositions for Sequence Manipulation and Therapeutic Applications
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
US20140186843A1 (en) 2012-12-12 2014-07-03 Massachusetts Institute Of Technology Methods, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
US20140189896A1 (en) 2012-12-12 2014-07-03 Feng Zhang Crispr-cas component systems, methods and compositions for sequence manipulation
PL2931898T3 (pl) 2012-12-12 2016-09-30 Le Cong Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi
MX2015007549A (es) 2012-12-12 2017-01-20 Broad Inst Inc Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias.
WO2014093701A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
RU2678001C2 (ru) 2012-12-13 2019-01-22 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Способы обнаружения днк для сайт-специфической нуклеазной активности
CN105142396A (zh) 2013-01-14 2015-12-09 重组股份有限公司 缺角家畜
US20140212869A1 (en) 2013-01-25 2014-07-31 Agilent Technologies, Inc. Nucleic Acid Proximity Assay Involving the Formation of a Three-way junction
EP2958996B1 (en) 2013-02-25 2019-10-16 Sangamo Therapeutics, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
WO2014150624A1 (en) 2013-03-14 2014-09-25 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
US20140349400A1 (en) 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
KR102210319B1 (ko) 2013-03-15 2021-02-01 더 제너럴 하스피탈 코포레이션 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
CN105263312A (zh) 2013-04-05 2016-01-20 美国陶氏益农公司 用于在植物基因组内整合外源序列的方法和组合物
HUE040575T2 (hu) 2013-04-16 2019-03-28 Regeneron Pharma A patkány genom célzott módosítása
US10604771B2 (en) 2013-05-10 2020-03-31 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
WO2015010114A1 (en) 2013-07-19 2015-01-22 Larix Bioscience, Llc Methods and compositions for producing double allele knock outs
ES2888976T3 (es) 2014-06-23 2022-01-10 Massachusetts Gen Hospital Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.)
EP3858990A1 (en) 2015-03-03 2021-08-04 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
WO2017040348A1 (en) 2015-08-28 2017-03-09 The General Hospital Corporation Engineered crispr-cas9 nucleases
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases

Also Published As

Publication number Publication date
EP3158066B1 (en) 2021-05-12
IL249555A0 (en) 2017-02-28
US20200199665A1 (en) 2020-06-25
JP2017519508A (ja) 2017-07-20
CN106604994A (zh) 2017-04-26
WO2015200378A1 (en) 2015-12-30
CA2953362A1 (en) 2015-12-30
AU2023216790A1 (en) 2023-09-07
JP2020191885A (ja) 2020-12-03
IL286474A (en) 2021-10-31
EP3158066A4 (en) 2017-11-22
EP3919621A1 (en) 2021-12-08
IL249555B (en) 2021-10-31
KR102598819B1 (ko) 2023-11-03
CN106604994B (zh) 2021-12-14
KR20220108199A (ko) 2022-08-02
EP3158066A1 (en) 2017-04-26
AU2015280069A1 (en) 2017-01-12
KR102425438B1 (ko) 2022-07-27
AU2021212165B2 (en) 2023-05-18
KR20170020470A (ko) 2017-02-22
AU2015280069B2 (en) 2021-08-12
JP6784601B2 (ja) 2020-11-11
JP2022137097A (ja) 2022-09-21
US20160304950A1 (en) 2016-10-20
US10501794B2 (en) 2019-12-10
JP7095031B2 (ja) 2022-07-04
IL286474B1 (en) 2023-07-01
US20180087104A1 (en) 2018-03-29
IL286474B2 (en) 2023-11-01
AU2021212165A1 (en) 2021-08-26
US9822407B2 (en) 2017-11-21

Similar Documents

Publication Publication Date Title
ES2888976T3 (es) Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.)
US11028429B2 (en) Full interrogation of nuclease DSBs and sequencing (FIND-seq)
US10738303B2 (en) Comprehensive in vitro reporting of cleavage events by sequencing (CIRCLE-seq)