ES2840648T3 - Generación de código de barras de endonucleasa - Google Patents
Generación de código de barras de endonucleasa Download PDFInfo
- Publication number
- ES2840648T3 ES2840648T3 ES16785144T ES16785144T ES2840648T3 ES 2840648 T3 ES2840648 T3 ES 2840648T3 ES 16785144 T ES16785144 T ES 16785144T ES 16785144 T ES16785144 T ES 16785144T ES 2840648 T3 ES2840648 T3 ES 2840648T3
- Authority
- ES
- Spain
- Prior art keywords
- crispr
- cells
- endonuclease
- cas
- synonymous mutations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
Un método para marcar células tratadas con endonucleasa, que comprende las etapas de: a) proporcionar células o una composición que comprende células; b) poner en contacto dichas células o dicha composición con: - al menos una endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)- asociada a CRISPR (Cas) (CRISPR-Cas) adecuada para abordar una región genómica de interés en dichas células, o un vector adecuado para expresar dicha endonucleasa en dichas células; - al menos un primer ácido nucleico adecuado para introducir, después de escisión específica de secuencia de la región genómica de interés por la endonucleasa, una o más mutaciones sinónimas portadas por el primer ácido nucleico en dicha región genómica por reparación dirigida por homología (HDR), y opcionalmente una o más mutaciones no sinónimas; y - al menos un segundo ácido nucleico adecuado para introducir, después de escisión específica de secuencia de la región genómica de interés por la endonucleasa, una o más mutaciones sinónimas portadas por el segundo ácido nucleico en dicha región genómica por reparación dirigida por homología (HDR), pero distintas de las mutaciones sinónimas del primer ácido nucleico; como control para efectos inespecíficos, marcando de ese modo células tratadas con endonucleasa.
Description
DESCRIPCIÓN
Generación de código de barras de endonucleasa
Campo de la invención
La invención se refiere a métodos, usos y kits para marcar y detectar células tratadas con endonucleasa CRISPR-Cas y muy preferiblemente células eucariotas.
Antecedentes de la invención
En los últimos años, los avances escalonados en las tecnologías de secuenciación han proporcionado una visión global detallada de manera sin precedente de las múltiples aberraciones genéticas en cáncer. Expandiendo considerablemente la lista de nuevos posibles oncogenes y genes supresores tumorales, estos nuevos datos enfatizan fuertemente la necesidad de estrategias rápidas y fiables para caracterizar la función normal y patológica de estos genes y evaluar su función, en particular como factores motrices durante la oncogénesis.
Como alternativa a las estrategias más convencionales, tales como sobreexpresión de ADNc o regulación por disminución por interferencia de ARN, las nuevas tecnologías para la edición de ADN proporcionan el medio para recrear las mutaciones reales observadas en cáncer a través de manipulación directa del genoma.
De hecho, las enzimas nucleasas naturales y genomanipuladas han obtenido una considerable atención en los últimos años.
El mecanismo detrás de la edición genómica basada en endonucleasa en general requiere una primera etapa de rotura mono o bicatenaria de ADN, que entonces puede activar dos mecanismos celulares distintos para la reparación del ADN, que pueden explotarse para la edición de ADN: la unión de extremos no homólogos propensa a errores (NHEJ) y la reparación dirigida por homología de alta fidelidad (HDR).
La reparación de ADN a través de NHEJ frecuentemente genera inserciones o eliminaciones (indel), que pueden alterar el desplazamiento del marco de lectura de una secuencia codificante, provocando, por tanto, inactivación génica. En HDR, un ácido nucleico donador cointroducido en las células funciona como moldes para la reparación precisa: a través del diseño apropiado del ácido nucleico donador, este mecanismo puede usarse para generar una amplia gama de modificaciones genéticas, incluyendo mutaciones específicas de unos pocos nucleótidos o la inserción de un gen completo.
Las endonucleasas para edición génica han llegado de diversas formas, que incluyen sistemas de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)/asociados a CRISPR (Cas) (CRISPR/Cas), nucleasas Argonaute (Ago), meganucleasas (MN), nucleasas de dedos de cinc (ZFN) y nucleasas efectoras similares a activador de la transcripción (TALEN).
Además, esas herramientas de edición de ADN, que se basan en el reconocimiento de proteína-ADN, tienden a sufrir (a grados variables) múltiples inconvenientes:
(i) pueden carecer de flexibilidad y/o no son fáciles de usar;
(ii) pueden inducir escisión de ADN inespecífica;
(iii) la eficacia de la edición de ADN puede variar sustancialmente; y
(iv) pueden no ser compatibles con modificaciones que tienen un impacto negativo sobre el crecimiento celular. Una de las consecuencias de dichos inconvenientes es la necesidad de seleccionar adicionalmente clones individuales en que haya sucedido el acontecimiento de HDR.
El sistema de CRISPR/Cas9 se ha descrito en el documento US 8697359 B1 y el documento US 2014/0068797 A1. Originalmente un sistema inmunitario adaptativo en procariotas (Barrangou y Marraffini, 2014), CRISPR se ha genomanipulado recientemente en una nueva herramienta poderosa para la edición genómica.
Este sistema genomanipulado habitualmente está compuesto de una nucleasa Cas9, en particular la nucleasa Cas9 de S. pyogenes, y una secuencia de ARN corta, el ARN de guía simple (o de guía del sistema) (ARNgs). Cuando se coexpresa en las células, Cas9 y el ARNgs forman un complejo que reconoce específicamente una secuencia de ADN particular a través de emparejamiento de bases de Watson y Crick y promueve su escisión. El ARNgs puede diseñarse para que se acople con cualquier secuencia genómica, siendo la única restricción la necesidad de que la secuencia diana vaya seguida por un motivo de ADN particular, el motivo adyacente de protoespaciador (PAM), que corresponde a 5'-NGG para Cas9 de S. pyogenes (Doudna y Charpentier, 2014; Hsu et al., 2014).
En comparación con otras herramientas de edición de ADN, incluyendo las nucleasas de dedos de cinc y las nucleasas efectoras similares a activador de la transcripción, que se basan en el reconocimiento de proteína-ADN, la tecnología
de CRISPR/Cas9 es notablemente más flexible y fácil de usar. Entre las diversas aplicaciones descritas hasta ahora, CRISPR/Cas9 se ha implementado en cribados funcionales genómicos de células cultivadas, así como para la generación de organismos modificados genéticamente o nuevos modelos de cáncer.
Sin embargo, a pesar del potencial innegable de esta nueva tecnología, las estrategias típicas basadas en CRISPR/Cas9 aún albergan al menos algunos de los inconvenientes mencionados anteriormente:
- en primer lugar, este sistema también puede tolerar unos pocos emparejamientos incorrectos entre el ARNgs y su secuencia diana, que aún pueden provocar escisión de ADN inespecífica. Aunque las herramientas se han diseñado para identificar in silico dichas posibles secuencias inespecíficas, recientemente se ha informado de desplazamientos mínimos ocasionales en la estructura secundaria de la estructura doble de ARN-ADN que podrían hacer que dichas predicciones fueran más difíciles;
- en segundo lugar, la eficacia de la edición de ADN mediada por CRISPR/Cas9 puede variar sustancialmente, dependiendo del modelo celular, el ARNgs y el ADN diana, de modo que en un experimento dado solamente una fracción de células dentro de una población contendrá la modificación genética deseada;
- además de los posibles problemas relacionados con la variabilidad clonal, esta estrategia aún requiere una eficacia razonablemente alta de edición mediada por CRISPR, y obviamente aún no es compatible con las modificaciones que tienen un impacto negativo sobre el crecimiento celular;
En particular, el diseño típico de un estudio de cultivo celular basado en tecnología de endonucleasa, incluyendo la tecnología de CRISPR/Cas9, aún requiere la derivación y amplificación de clones y, por lo tanto, está restringido por la eficacia variable de la adición de ADN y los posibles efectos no específicos.
Por tanto, la derivación y el posterior análisis de un número variable de clones individuales aún representa una etapa casi inevitable que es lenta y menos susceptible a tecnología de alto rendimiento.
Fu et al. ("Improving CRISPR-Cas nuclease specificity using truncated guide RNAs; Nature Biotechnology; 2014) proporciona nuevas estrategias para mejorar la especificidad de nucleasa CRISPR/Cas usando ARN de guía truncados con regiones más cortas de complementariedad con la diana.
Shah et al. ("The clonal and mutational evolution spectrum of primary triple-negative breast cancers"; Nature; 2012) muestra el seguimiento de una evolución genómica de mutaciones relevantes tumorales a lo largo del tiempo, identificando frecuencias clonales de mutaciones particulares que causan cáncer.
Por tanto, sigue habiendo una necesidad de proporcionar herramientas novedosas, métodos y usos para mejorar la edición de ADN, muy preferiblemente en células eucariotas, y limitar o evitar sus inconvenientes.
En particular, sigue habiendo una necesidad de superar los inconvenientes asociados con las endonucleasas propensas a escisión de ADN inespecífica, tal como en los sistemas de CRISPR/Cas.
También sigue habiendo una necesidad de evitar la variabilidad clonal y/o de limitar la necesidad de derivación y amplificación de clones.
También sigue habiendo una necesidad de técnicas de adición de ADN que sean más susceptibles a tecnología de alto rendimiento.
Compendio de la invención
La invención se refiere a un método para marcar células tratadas con endonucleasa, muy preferiblemente células eucariotas, que comprende las etapas de:
a) proporcionar células o una composición que comprende células;
b) poner en contacto dichas células o dicha composición con:
- al menos una endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) adecuada para abordar una región genómica de interés en dichas células, o un vector adecuado para expresar dicha endonucleasa en dichas células;
- al menos un primer ácido nucleico adecuado para introducir, después de escisión específica de secuencia de la región genómica de interés por la endonucleasa, una o más mutaciones sinónimas en dicha región genómica por HDR, y opcionalmente una o más mutaciones no sinónimas; y
- al menos un segundo ácido nucleico adecuado para introducir, después de escisión específica de secuencia de la región genómica de interés por la endonucleasa, una o más mutaciones sinónimas en dicha región genómica, pero distintas de las mutaciones sinónimas del primer ácido nucleico;
como control para efectos inespecíficos, marcar de ese modo células tratadas con endonucleasa.
La invención también se refiere a un método para detectar una población de células tratadas con endonucleasa, muy preferiblemente células eucariotas, que comprende las etapas de:
a) proporcionar al menos:
- una primera población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) que comprende una o más mutaciones sinónimas (y opcionalmente una o más mutaciones no sinónimas) introducidas en una región genómica de interés por HDR, proporcionando de ese modo una primera característica distintiva; y
- una segunda población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) que comprende una o más mutaciones sinónimas introducidas en la misma región genómica de interés por HDR, en el que dicha una o más mutaciones sinónimas son distintas de la una o más mutaciones sinónimas de la primera población, proporcionando de ese modo una segunda característica distintiva;
b) determinar dicha primera y segunda característica distintiva; y
c) comparar dicha primera y segunda característica distintiva, detectando de ese modo dicha primera población de células tratadas con endonucleasa.
La invención también se refiere a un uso de una composición para detectar una población de células tratadas con endonucleasa, caracterizándose dicha composición por que comprende al menos:
(i) una primera población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas), que comprende una o más mutaciones sinónimas en una región genómica de interés; y
(ii) una segunda población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas), que comprende una o más mutaciones sinónimas en dicha región genómica, pero distintas de las mutaciones sinónimas de la primera población;
en el que la una o más mutaciones sinónimas se introducen en dichas células por HDR después de tratamiento con una misma endonucleasa dirigida a dicha región genómica de interés.
De acuerdo con algunas realizaciones preferidas, dichas células son células eucariotas.
La invención también se refiere a un uso de un kit para detectar una población de células tratadas con endonucleasa, que comprende al menos:
- una primera parte que comprende una primera población de células tratadas con endonucleasa como se define anteriormente; y
- una segunda parte que comprende una segunda población de células tratadas con endonucleasa como se define anteriormente.
La invención también se refiere a un kit para marcar células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas), que comprende: (i) al menos un sistema de CRISP/Cas que comprende:
a) un primer elemento regulador funcional en una célula unido de manera funcional a al menos una secuencia de nucleótidos que codifica un ARN de guía del sistema de CRISPR/Cas que hibrida con una región genómica diana de interés de dicha célula, y
b) un segundo elemento regulador funcional en dicha célula unido de manera funcional a una secuencia de nucleótidos que codifica una endonucleasa Cas, en el que los componentes (a) y (b) están ubicados en el mismo vector o diferentes vectores del sistema;
(ii) al menos un ácido nucleico adecuado para introducir una o más mutaciones sinónimas en la región genómica de interés de dicha célula por HDR, y opcionalmente una o más mutaciones no sinónimas en dicha región genómica de interés.
De acuerdo con algunas realizaciones preferidas, dichas células son células eucariotas.
Breve descripción de las figuras
Figura 1: restablecimiento de APC funcional en células de cáncer colorrectal a través de código de barras de CRISPR
A. Esquemas de la incorporación de códigos de barras de APC-WT y APC-STOP (control) para restablecer la función del gen APC en células de cáncer colorrectal. La posición de los cebadores directo e inverso para PCR se indica con flechas.
B. Representación esquemática de la estrategia de código de barras de CRISPR para evaluar los efectos del restablecimiento de APC en la activación de la señalización de Wnt.
C. Análisis por qPCR de ADN genómico para evaluar la proporción relativa de los códigos de barras de APC-WT y APC-STOP en las diferentes subpoblaciones celulares de DLD-1 clasificados por FACS. Los resultados corresponden a los valores medios de la relación de APC-WT a APC-STOP (± ETM; n = 3) de un representante de tres experimentos independientes. El asterisco indica la diferencia estadística (p < 0,01 prueba de la t de Student). De izquierda a derecha: células sin clasificar, GFPto (nivel más bajo de GFP) y GFPhi (nivel más alto de GFP). El eje de ordenadas indica una relación WT/STOP normalizada.
D. Representación esquemática del procedimiento experimental para investigar los efectos del restablecimiento de APC en el crecimiento celular de DLD-1 a través de código de barras de CRISPR
E. Análisis por qPCR para evaluar la proporción relativa de los códigos de barras APC-WT y APC-STOP a partir de ADN genómico celular DLD-1 en los puntos temporales indicados como se describe en (D). Los resultados corresponden a los valores medios de la relación de APC-WT a APC-STOP de un representante de tres experimentos independientes. Las curvas "a", "b", "c" y "d" representan una variación de la relación WT-STOP normalizada a lo largo del tiempo (Tref; día 7, día 14, día 21, día 27) en cuatro matraces distintos.
F. Análisis de secuenciación profunda de las muestras de ADN genómico "c" usadas en el panel (E). El porcentaje de lecturas originales (eje de ordenadas) que contienen los códigos de barras de APC-WT (WT) y APC-STOP (STOP) en comparación con la secuencia endógena se muestra a lo largo del tiempo (Tref; día 7, día 14, día 21, día 27).
Figura 2: representación esquemática de código de barras múltiple de CRISPR en células PC9 para estudios in vitro o in vivo. EGFR-T790M, KRAS-G12D y EML4-ALK son mutaciones que confieren resistencia a inhibición de EGFR, y se cointroducen en un cultivo celular para obtener una mezcla de subpoblaciones celulares marcadas genéticamente.
Figura 3: esquema para la reparación de la mutación oncógena ALK F1174L en células de neuroblastoma. La incorporación de cada secuencia exógena puede provocar cuatro combinaciones posibles: para tres de ellas, incluyendo el código de barras/indel probablemente más frecuente, la secuencia fenotípicamente dominante expresada en la célula se espera que sea la codificada por el código de barras.
Figura 4: Esquema para evaluar la invasión y migración celular usando código de barras de CRISPR. Las células PC9 con código de barras de EGFR se pretrataron durante dos días con gefitinib, después se transfirieron a cámaras Boyden que contenían matrigel.
Figura 5: Esquema para sondear la heterogeneidad intratumoral usando códigos de barras de CRISPR degenerados. Las células se transfectaron secuencialmente para código de barras de CRISPR con dos ARNgs distintos, y un ODNmc degenerado que contiene un sitio de restricción SalI se usa para permitir la cuantificación de RFLP de la fracción de células que contiene un marcador genético. Después de asignar código de barras, parte de las células se inyecta de manera bilateral en la almohadilla de grasa de ratones inmunocomprometidos, mientras que el resto se mantiene en cultivo. En diferentes puntos temporales, se sacrifica a los ratones y se obtiene el ADNg tanto de los tumores como de las células en cultivo.
Figura 6: esquema para detección múltiple TaqMan de códigos de barras genómicos. Se realizó PCR TaqMan a partir de ADNg derivado de células PC9 transfectadas para código de barra de CRISPR de EGFR-T790 usando un par de cebadores sin modificar directo (fw) e inverso (rv), junto con una sonda TaqMan dirigida al código de barras T790T (tinte FAM) y una sonda TaqMan dirigida al código de barras T790M (tinte ABY). Para limitar la amplificación de la secuencia endógena, se añadió a la reacción un oligonucleótido de bloqueo específico que contenía enlaces fosforotioato y una ddC en 3'. Se muestra un diagrama de discriminación alélica típico obtenido de un conjunto de muestras representativas con: A. muestras que contienen una subpoblación de células con código de barras con T790M; B. muestras que contienen una subpoblación de células con código de barras con T790T; C. muestras que contienen dos subpoblaciones de células con código de barras con T790M y T790T; D. células sin código de barras (control negativo); (el eje de ordenadas representa el alelo T790M y el eje de abscisas representa el alelo T790T).
Descripción detallada de la invención
Los métodos, usos, composiciones y kits descritos en la presente memoria se refieren todos al concepto de marcaje específico de células tratadas específicamente con endonucleasa CRISPR-Cas, más preferiblemente células eucariotas, en que ha sucedido un acontecimiento de recombinación dado.
Para contrarrestar los inconvenientes que impedían la edición de ADN basada en grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-endonucleasa asociada a CRISPR (Cas) (CRISPR-Cas), por tanto, se ha ideado un protocolo de "generación de código de barras" basado en endonucleasa, una estrategia en que una
modificación posiblemente funcional en una región genómica de interés se acopla con una serie de mutaciones sinónimas (es decir, puntuales), que funciona como marcador genético para el rastreo celular.
En paralelo, se inserta un segundo código de barras que comprende o consiste en una o más mutaciones sinónimas distintas y se usa como control para efectos inespecíficos (es decir, escisión inespecífica de CRISPR). El ADN genómico de la mezcla resultante de células modificadas y sin modificar entonces puede establecer una característica distintiva única, que puede determinarse y compararse (es decir, usando cebadores complementarios a dicha característica distintiva de las poblaciones de células eucariotas para evaluar la proporción relativa de cada código de barras).
Cabe observar que el segundo código de barras comprende una o más mutaciones sinónimas distintas, que, por tanto, pueden abarcar realizaciones en la que:
- todas las mutaciones sinónimas del segundo código de barras están en diferentes posiciones de la región genómica de interés en comparación con el primer código de barras;
- al menos algunas de las mutaciones sinónimas del segundo código de barras están en diferentes posiciones de la región genómica de interés en comparación con el primer código de barras;
- cuando la una o más mutaciones sinónimas del segundo código de barras están en las mismas posiciones de la región genómica de interés en comparación con el primer código de barras, son preferiblemente distintas.
Ventajosamente, por tanto, pueden generarse varios códigos de barras distintos después de reparación dirigida por homología (HDR).
También ventajosamente, la estrategia de código de barras no requiere niveles particularmente altos de edición de ADN.
Esos métodos, usos, composiciones y kits son particularmente útiles en edición de ADN basado en CRISPR de células eucariotas, que son propensas a escisión de ADN inespecífico y/o que implican reparación dirigida por homología (HDR) en dichas células.
Las endonucleasas que se consideran particularmente incluyen en particular endonucleasas CRISPR-Cas de tipo II.
Como se ilustra en la presente memoria y en los ejemplos, se acoplaron dos códigos de barras de endonucleasa distintos (en ese caso código de barras de CRISPR) a una mutación de aminoácido/finalizadora particular y a su equivalente sinónimo, que se usó como control para escisión inespecífica posible de CRISPR/Cas9. Usando cebadores específicos para PCR cuantitativa instantánea (qPCR), se pudo evaluar el modo en que variaba la fracción de células que contenían cada código de barras dentro de una población heterogénea después de exposición a una condición selectiva particular, que dependía del modelo celular usado. Se aplicó esta estrategia para manipular la secuencia endógena de diferentes oncogenes y supresores tumorales en diversos modelos de células cancerosas, y se evaluaron los efectos de dichas modificaciones en la activación de rutas de señalización, crecimiento celular e invasión, o resistencia a quimioterapia, tanto in vitro como in vivo.
Por tanto, exponiendo las células a una condición selectiva dada, esta estrategia puede usarse para caracterizar funcionalmente los efectos de diferentes tipos de mutaciones de un gen particular de interés.
Además, la incorporación de un código de barras genético en el genoma de las células permite su rastreo dentro de una población heterogénea de células modificadas con endonucleasa y sin modificar, y evita la necesidad de selección clonal.
La introducción de una o más mutaciones sinónimas en distintos códigos de barras tiene además la ventaja de prevenir o reducir la probabilidad de que la secuencia recombinante se escinda por la endonucleasa y, si fuera aplicable, su ácido nucleico de guía simple, tal como un ARNgs (es decir, para sistemas de CRISPR/Cas).
Como demostración preliminar de nuestra estrategia, se reparó la secuencia mutada del supresor tumoral APC en células de cáncer colorrectal usando la generación de código de barras de CRISPR, y mostró que la restauración de poliposis coli adenomatosa (APC) provocaba la inhibición tanto de la actividad indicadora de señalización de Wnt como el crecimiento celular. El gen supresor tumoral APC es un componente principal del complejo de destrucción que promueve la degradación de p-catenina libre. De hecho, más de un 80 % de los cánceres colorrectales contienen alteraciones del gen APC, en general correspondientes a mutaciones finalizadoras o de desplazamiento del marco de lectura, provocando la expresión de proteínas truncadas e inactivas.
Para ilustrar adicionalmente el amplio intervalo de posibles aplicaciones de esta estrategia, se usó la generación de código de barras de CRISPR para modificar la secuencia de otros genes relacionados con cáncer, incluyendo TP53, ALK, EGFR y KRAS, en diversas células tumorales, y se evaluaron los efectos de dichas alteraciones sobre el crecimiento celular, la invasión y la resistencia a quimioterapia, tanto in vitro como in vivo. Por tanto, evitando las limitaciones asociadas con la baja eficacia y los posibles efectos inespecíficos de la edición de ADN, nuestros estudios demuestran que la generación de código de barras de endonucleasa, en particular código de barras de CRISPR, es
una estrategia rápida, conveniente y eficaz para investigar las consecuencias funcionales de una modificación genética particular en células, incluyendo células eucariotas y no eucariotas, y muy preferiblemente en células eucariotas.
Definiciones
Las expresiones "al menos uno" y "uno o más" se usan indistintamente. Por consiguiente, la expresión "al menos uno" puede comprender "dos o más", "tres o más", "cuatro o más", "cinco o más" y así sucesivamente.
Las expresiones "polinucleótido", "nucleótido", "secuencia de nucleótidos", "ácido nucleico" y "oligonucleótido" se usan indistintamente. Se refieren a una forma polimérica de nucleótidos de cualquier longitud, ya sean desoxirribonucleótidos o ribonucleótidos, o análogos de los mismos. Los polinucleótidos pueden tener cualquier estructura tridimensional, y pueden realizar cualquier función, conocida o desconocida. Los siguientes son ejemplos no limitantes de polinucleótidos: regiones codificantes o no codificantes de un gen o fragmento génico, locus definidos a partir de análisis de vinculación, exones, intrones, ARN mensajero (ARNm), ARN de transferencia, ARN ribosómico, ARN interferente corto (ARNic), ARN de horquilla corta (ARNhc), microARN (miARN), ribozimas, ADNc, polinucleótidos recombinantes, polinucleótidos ramificados, plásmidos, vectores, ADN aislado de cualquier secuencia, ARN aislado de cualquier secuencia, sondas de ácido nucleico y cebadores. Un polinucleótido puede comprender uno o más nucleótidos modificados, tales como nucleótidos metilados y análogos nucleotídicos. Si están presentes, las modificaciones a la estructura nucleotídica pueden conferirse antes o después del ensamblaje del polímero. La secuencia de nucleótidos puede interrumpirse por componentes no nucleotídicos. Un polinucleótido puede modificarse adicionalmente después de polimerización, tal como por conjugación con un componente de marcaje.
"Nucleasa" y "endonucleasa" se usan indistintamente en la presente memoria para indicar una o más enzimas o complejos que contienen enzima (que pueden incluir, si fuera aplicable, complejos de proteína-ácido nucleico tal como Cas9 en complejo con ARNgs) que poseen actividad catalítica para la escisión de polinucleótidos, en particular escisión de ADN. Las endonucleasas que se consideran incluyen endonucleasas de origen natural, que no son de origen natural, recombinantes, quiméricas y/o heterólogas, y análogos de las mismas.
Los análogos de endonucleasas pueden incluir endonucleasas que comparten al menos un 80 % de identidad de secuencia con una endonucleasa dada, que incluye al menos un 80 %, 85 %, 90 % y un 95 % de identidad, basada en una alineación óptima.
La alienación óptima de las secuencias para la comparación puede realizarse por ordenador usando algoritmos conocidos. Es completamente preferible que el porcentaje de identidad de secuencia se determine usando el programa informático CLUSTAL W2 (versión 2.1), fijándose los parámetros "por defecto"". Por "endonucleasa adecuada para abordar una región genómica de interés" se entiende cualquier endonucleasa, como se describe anteriormente, que puede abordar específicamente una región genómica de interés de una célula dada, y proporcionar actividad catalítica para la escisión de polinucleótidos en la región genómica diana.
Por tanto, dicha definición puede incluir tanto:
(i) endonucleasas que tienen al menos un dominio de dirección y al menos un dominio activo para la escisión de polinucleótidos; y/o
(ii) endonucleasa que tiene al menos un dominio activo para la escisión de polinucleótidos, en la que el dominio de dirección es parte de un polipéptido distinto y/o un polinucleótido distinto.
En general, "sistema de CRISPR" o "sistema de CRISPR/Cas" se refiere colectivamente a transcritos y otros elementos implicados en la expresión u orientación de la actividad de genes asociados a CRISPR ("Cas"), incluyendo secuencias que codifican uno o más de: un gen Cas, una secuencia crtra (CRISPR de activación en trans) (por ejemplo, ARNcrtra o un ARNcrtra parcial activo), una secuencia de acoplamiento a crtra (que abarca una "repetición directa" y una repetición directa parcial procesada por ARNcrtra en el contexto de un sistema de CRISPR endógeno), una secuencia de guía (también denominada "espaciador" en el contexto de un sistema de CRISPR endógeno), un ácido nucleico de guía simple (en particular, un ARN de guía simple (ARNgs)) u otras secuencias asociadas y transcritos de un locus CRISPR necesario para abordar una región genómica de interés.
Ejemplos de "sistema de CRISPR" que se consideran por la invención incluyen sistemas de CRISPR de tipo II (o "clase 2") tales como CRISPR/Cas9 o el CRISPR más reciente caracterizado de Provotella y Francisella 1 (Cpf1) en Zetsche etal. ("Cpf1 is a Single RNA-guided Endonuclease of a Class 2 CRISPR-Cas System (2015); Cell; 163, 1-13).
Por "dominio de escisión" o "dominio activo" o "dominio de nucleasa" de una nucleasa/endonucleasa se entiende la secuencia polipeptídica o dominio dentro de la nucleasa que posee la actividad catalítica para escisión de polinucleótidos, en particular escisión de ADN. Un dominio de escisión puede estar contenido en una sola cadena polipeptídica o la actividad de escisión puede resultar de la asociación de dos (o más) polipéptidos. Un solo dominio nucleasa puede consistir en más de un tramo aislado de aminoácidos dentro de un polipéptido dado.
Por "recombinación" se entiende un proceso de intercambio de información genética entre dos polinucleótidos. Como se usa en la presente memoria, "reparación dirigida por homología (HDR)" se refiere a la forma especializada de
reparación de ADN que tiene lugar, por ejemplo, durante la reparación de roturas bicatenarias en células. Este proceso requiere homología de secuencia de nucleótidos, usa una molécula "donadora" para aportar un molde a la reparación de una molécula "diana" (es decir, la que experimentó la rotura bicatenaria) y da lugar a la transferencia de información genética del donador a la diana. La reparación dirigida por homología puede provocar una alteración de la secuencia de la molécula diana (por ejemplo, inserción, eliminación, mutación), si el polinucleótido donador difiere de la molécula diana y parte o toda la secuencia del polinucleótido donador se incorpora en el ADN diana. En algunas realizaciones, el polinucleótido donador, una parte del polinucleótido donador, una copia del polinucleótido donador o una parte de una copia del polinucleótido donador se integra en la región genómica diana de interés.
Por "unión de extremos no homólogos (NHEJ)" se entiende la reparación de roturas bicatenarias en ADN por ligamiento directo de los extremos rotos entre sí sin la necesidad de un molde homólogo (en contraste con la reparación dirigida por homología, que requiere una secuencia homóloga para guiar la reparación). La NHEJ a menudo provoca la inserción o eliminación (indel) de uno o más nucleótidos cerca del sitio de la rotura bicatenaria.
"Complementario" se refiere a la capacidad de un ácido nucleico de formar uno o más enlaces de hidrógeno con otra secuencia de ácido nucleico mediante tipos tradicionales de Watson y Crick u otros tipos no tradicionales. Un porcentaje de complementariedad indica el porcentaje de residuos en una molécula de ácido nucleico que pueden formar enlaces de hidrógeno (por ejemplo, emparejamiento de bases de Watson y Crick) con una segunda secuencia de ácido nucleico (por ejemplo, 5, 6, 7, 8, 9, 10 de 10 siendo un 50 %, 60 %, 70 %, 80 %, 90 % y 100 % de complementariedad). "Perfectamente complementario" significa que todos los residuos contiguos de una secuencia de ácido nucleico formarán enlaces de hidrógeno con el mismo número de residuos contiguos en una segunda secuencia de ácido nucleico. "Sustancialmente complementario", como se usa en la presente memoria, se refiere a un grado de complementariedad que es al menos un 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %. 97 %, 98 %, 99 % o un 100 % sobre una región de 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 30, 35, 40, 45, 50 o más nucleótidos, o se refiere a dos ácidos nucleicos que hibridan en condiciones rigurosas.
"Hibridación" se refiere a una reacción en que uno o más polinucleótidos reaccionan para formar un complejo que se estabiliza mediante formación de enlaces de hidrógeno entre las bases de los residuos nucleotídicos. La formación de enlaces de hidrógeno puede producirse por emparejamiento de bases de Watson y Crick, unión de Hoogstein o de cualquier otra manera específica de secuencia. El complejo puede comprender dos hebras que forman una estructura doble, tres o más hebras que forman un complejo multicatenario, una sola hebra autohibridante 17 o cualquier combinación de estos. Una reacción de hibridación puede constituir una etapa en un proceso más amplio, tal como el inicio de PCR o la escisión de un polinucleótido por una enzima. Una secuencia que puede hibridar con una secuencia dada se denomina "complemento" de la secuencia dada.
La hibridación requiere que los dos ácidos nucleicos contengan secuencias complementarias, aunque son posibles emparejamientos incorrectos entre las bases. Las condiciones apropiadas para la hibridación entre dos ácidos nucleicos dependen de la longitud de los ácidos nucleicos y el grado de complementación, variables bien conocidas en la técnica. Cuanto mayor sea el grado de complementación entre dos secuencias de nucleótidos, mayor será el valor de la temperatura de fusión (Tm) para híbridos de ácidos nucleicos que tienen esas secuencias. Para hibridaciones entre ácidos nucleicos con tramos cortos de complementariedad (por ejemplo, complementariedad sobre 35 o menos, 30 o menos, 25 o menos, 22 o menos, 20 o menos o 18 o menos nucleótidos) la posición de emparejamientos incorrectos llega a ser importante (véase, Sambrook etal., supra, 11.7-11.8). Típicamente, la longitud para un ácido nucleico hibridable es de al menos aproximadamente 8 o 10 nucleótidos. Longitudes mínimas ilustrativas para un ácido nucleico hibridable son: al menos aproximadamente 15 nucleótidos; al menos aproximadamente 20 nucleótidos; al menos aproximadamente 22 nucleótidos; al menos aproximadamente 25 nucleótidos; y al menos aproximadamente 30 nucleótidos).
Se entiende en la técnica que la secuencia de polinucleótido no tiene que ser 100 % complementaria a la de su ácido nucleico diana para que sea hibridable específicamente o hibridable. Además, un polinucleótido puede hibridar sobre uno o más segmentos de modo que los segmentos intermedios o adyacentes no están implicados en el acontecimiento de hibridación (por ejemplo, una estructura de lazo o estructura de horquilla). Un polinucleótido puede comprender al menos un 70 %, al menos un 80 %, al menos un 90 %, al menos un 95 %, al menos un 99 % o al menos un 100 % de complementariedad de secuencia con una región diana dentro de la secuencia de ácido nucleico diana a la que se dirige. Por ejemplo, un ácido nucleico de antisentido en que 18 de 20 nucleótidos del compuesto de antisentido son complementarios a una región diana y, por lo tanto, hibridarían específicamente, representaría un 90 por ciento de complementariedad. En este ejemplo, los nucleótidos no complementarios restantes pueden agruparse o intercalarse con nucleótidos complementarios y no tienen que ser contiguos entre sí o a los nucleótidos complementarios. El porcentaje de complementariedad entre tramos particulares de secuencias de ácido nucleico dentro de ácidos nucleicos puede determinarse de forma rutinaria usando programas BLAST (herramientas de búsqueda de alineación local básicas) y programas PowerBLAST conocidos en la técnica (Altschul et al., J. Mol. Biol., 1990, 215, 403-410; Zhang y Madden, Genome Res., 1997, 7, 649-656) o usando el programa Gap (Wisconsin Sequence Analysis Package, Versión 8 para Unix, Genetics Computer Group, University Research Park, Madison Wis.), usando configuraciones por defecto, que usan el algoritmo de Smith y Waterman (Adv. Appl. Math., 1981,2, 482-489).
"Locus de interés" y "región genómica de interés" se usan indistintamente en la presente memoria para indicar la región del genoma para la que puede producirse HDR. Cuando HDR requiere un ácido nucleico "donador", la región genómica de interés puede definirse como la región que es complementaria al ácido nucleico "donador".
Un "vector" o "vector de expresión" es un replicón, tal como un plásmido, fago, virus o cósmido, al que puede unirse otro segmento de ADN, es decir, un "inserto" para conseguir la replicación del segmento unido en una célula.
Un "casete de expresión" comprende una secuencia codificante de ADN unida de manera funcional a un promotor. "Unido de manera funcional" se refiere a una yuxtaposición en la que los componentes así descritos están en una relación que les permite funcionar de su manera pretendida. Por ejemplo, un promotor unido de manera funcional a una secuencia codificante si el promotor afecta a su transcripción o expresión.
Las expresiones "vector de expresión recombinante" o "construcción de ADN" se usan indistintamente en la presente memoria para hacer referencia a una molécula de ADN que comprende un vector y al menos un inserto. Los vectores de expresión recombinantes habitualmente se generan con el fin de expresar y/o propagar el uno o más insertos, o para la construcción de otras secuencias de nucleótidos recombinantes. El uno o más insertos pueden estar unidos de manera funcional o no a una secuencia promotora y pueden estar unidos de manera funcional o no a secuencias reguladoras de ADN.
Por "mutación sinónima" se entiende mutaciones que, cuando se introducen en la región genómica de interés, no alteran el fenotipo de la célula y/u organismo en que se producen. Las mutaciones sinónimas pueden producirse en regiones no codificantes (fuera de genes o dentro de intrones) o pueden producirse dentro de exones. Cuando las mutaciones sinónimas se producen dentro de exones, no provocan un cambio en la secuencia de aminoácidos de una proteína, o provocan la inserción de un aminoácido alternativo con propiedades similares a las del aminoácido original. Además, de acuerdo con una realización más preferida de la invención, las "mutaciones sinónimas" consisten en mutaciones que se producen dentro de un exón o marco abierto de lectura, pero que no provocan un cambio en la secuencia de aminoácidos de la proteína o fragmento de la misma correspondiente a dicho exón o marco abierto de lectura. Ejemplos de mutaciones sinónimas incluyen mutaciones que introducen uno o más sitios de restricción reconocidos por una o más endonucleasas, pero que no alteran el fenotipo de la célula y/u organismo.
Por consiguiente, las "mutaciones no sinónimas" preferiblemente consisten en mutaciones que se producen dentro de un exón y que provocan un cambio en la secuencia de aminoácidos de la proteína o fragmento de la misma correspondiente a dicho exón. Dicho cambio puede incluir eliminaciones, sustituciones e inserciones de otra secuencia de aminoácidos. Ejemplos de mutaciones no sinónimas incluyen mutaciones que introducen un codón de parada dentro de un marco abierto de lectura (ORF).
Una "célula" se selecciona del grupo que consiste en células eucariotas y no eucariotas; que incluye células eucariotas y células procariotas seleccionadas de bacterias y arqueobacterias.
Una "célula eucariota" puede seleccionarse del grupo que comprende o consiste en: una levadura, un organismo unicelular eucariota, una célula somática, una célula germinal, una célula madre, una célula vegetal, una célula de algas, una célula animal, una célula de invertebrado, una célula de vertebrado, una célula de pez, una célula de rana, una célula de ave, una célula de mamífero, una célula de cerdo, una célula de vaca, una célula de cabra, una célula de oveja, una célula de roedor, una célula de rata, una célula de ratón, una célula de primate no humano y una célula humana. Ejemplos de células eucariotas que consideran específicamente por la invención incluyen células PC9 (cáncer pulmonar), células BT474 y MCF7 (cáncer de mama) y células DLD-1 y HCT116 (cáncer de colon).
La expresión "de origen natural" o "sin modificar", como se usa en la presente memoria, aplicada a un ácido nucleico, un polipéptido, una célula o un organismo, se refiere a un ácido nucleico, polipéptido, célula u organismo que se encuentra en la naturaleza. Por ejemplo, una secuencia polipeptídica o nucleotídica que está presente en un organismo (incluyendo virus) que puede aislarse de una fuente de la naturaleza y que no se ha modificado intencionadamente por un ser humano en el laboratorio es de origen natural.
El término "quimérico", como se usa en la presente memoria, aplicado a un ácido nucleico o polipéptido se refiere a dos componentes que se definen por estructuras derivadas de diferentes fuentes. Por ejemplo, cuando se usa "quimérico" en el contexto de un polipéptido quimérico (por ejemplo, una proteína quimérica Cas9/Csn1), el polipéptido quimérico incluye secuencias de aminoácidos que derivan de diferentes polipéptidos. Un polipéptido quimérico puede comprender secuencias polipeptídicas modificadas o de origen natural (por ejemplo, una primera secuencia de aminoácidos de una proteína Cas9/Csn1 modificada o sin modificar; y una segunda secuencia de aminoácidos distinta de la proteína Cas9/Csn1). Asimismo, "quimérico" en el contexto de un polinucleótido que codifica un polipéptido quimérico incluye secuencias de nucleótidos derivadas de diferentes regiones codificantes (por ejemplo, una primera secuencia de nucleótidos que codifica una proteína Cas9/Csn1 modificada o sin modificar; y una segunda secuencia de nucleótidos que codifica un polipéptido distinto de una proteína Cas9/Csn1).
La expresión "polipéptido quimérico" se refiere a un polipéptido que se prepara mediante la combinación (es decir, "fusión") de dos segmentos de lo contrario separados de secuencia de amino, habitualmente a través de intervención humana. Un polipéptido que comprende una secuencia de aminoácidos quimérica es un polipéptido quimérico. Algunos polipéptidos quiméricos pueden denominarse "variantes de fusión".
"Heterólogo", como se usa en la presente memoria, significa una secuencia de nucleótidos o polipeptídica que no se encuentra en el ácido nucleico o proteína natural, respectivamente. Por ejemplo, en una proteína quimérica Cas9/Csn1, el dominio de unión a ARN de un polipéptido Cas9/Csn1 bacteriano de origen natural (o una variante del mismo) puede fusionarse a una secuencia polipeptídica heteróloga (es decir, una secuencia polipeptídica de una proteína distinta de Cas9/Csn1 o una secuencia polipeptídica de otro organismo). La secuencia polipeptídica heteróloga puede mostrar una actividad (por ejemplo, actividad enzimática) que también se mostrará por la proteína quimérica Cas9/Csn1 (por ejemplo, actividad metiltransferasa, actividad acetiltransferasa, actividad cinasa, actividad de ubicuitinación, etc.). Una secuencia de ácido nucleico heteróloga puede unirse a una secuencia de ácido nucleico de origen natural (o una variante de la misma) (por ejemplo, por ingeniería genética) para generar una secuencia de nucleótidos quimérica que codifica un polipéptido quimérico. Como otro ejemplo, en un polipéptido variante de fusión dirigido al sitio Cas9, puede fusionarse un polipéptido variante dirigido al sitio Cas9 con un polipéptido heterólogo (es decir, un polipéptido distinto de Cas9), que muestra una actividad que también se mostrará por el polipéptido variante de fusión dirigido al sitio Cas9. Una secuencia de ácido nucleico heteróloga puede unirse a un polipéptido variante dirigido al sitio Cas9 (por ejemplo, por ingeniería genética) para generar una secuencia de nucleótidos que codifica un polipéptido variante de fusión dirigido al sitio Cas9.
"Recombinante", como se usa en la presente memoria, significa que un ácido nucleico particular (ADN o ARN) es el producto de diversas combinaciones de etapas de clonación, restricción, reacción en cadena de la polimerasa (PCR) y/o ligamiento que dan como resultado una construcción que tiene una secuencia estructural codificante o no codificante distinguible de ácidos nucleicos endógenos encontrados en sistemas naturales. Las secuencias de ADN que codifican polipéptidos pueden ensamblarse a partir de fragmentos de ADNc o a partir de una serie de oligonucleótidos sintéticos para proporcionar un ácido nucleico sintético que puede expresarse a partir de una unidad transcripcional recombinante contenida en una célula o en un sistema de transcripción y traducción sin células. El ADN genómico que comprende las secuencias relevantes también puede usarse en la formación de un gen o unidad transcripcional recombinante. Las secuencias de ADN no traducido pueden estar presentes 5' o 3' del marco abierto de lectura, donde dichas secuencias no interfieren con la manipulación o expresión de las regiones codificantes y, de hecho, pueden actuar modulando la producción de un producto deseado por diversos mecanismos (véanse "secuencias reguladoras de ADN", a continuación). Como alternativa, las secuencias de ADN que codifican ARN (por ejemplo, ARN dirigido a ADN) que no se traduce también pueden considerarse recombinantes. Por tanto, por ejemplo, el término ácido nucleico "recombinante" se refiere a uno que no es de origen natural, por ejemplo, se prepara por la combinación artificial de dos segmentos de secuencia de lo contrario separados a través de intervención humana. Esta combinación artificial a menudo se consigue por medios de síntesis química, o por la manipulación artificial de segmentos aislados de ácidos nucleicos, por ejemplo, por técnicas de ingeniería genética. Esto se hace habitualmente para remplazar un codón con un codón que codifica el mismo aminoácido, un aminoácido conservativo o un aminoácido no conservativo. Como alternativa, se realiza para unir conjuntamente segmentos de ácido nucleico de funciones deseadas para generar una combinación deseada de funciones. Esta combinación artificial a menudo se consigue por medios de síntesis química o por la manipulación artificial de segmentos aislados de ácidos nucleicos, por ejemplo, técnicas de ingeniería genética. Cuando un polinucleótido recombinante codifica un polipéptido, la secuencia del polipéptido codificado puede ser de origen natural ("de tipo silvestre") o puede ser una variante (por ejemplo, un mutante) de la secuencia de origen natural. Por tanto, el término polipéptido "recombinante" no se refiere necesariamente a un polipéptido cuya secuencia no es de origen natural. En su lugar, un polipéptido "recombinante" está codificado por una secuencia de ADN recombinante, pero la secuencia del polipéptido puede ser de origen natural ("de tipo silvestre") o no de origen natural (por ejemplo, una variante, un mutante, etc.). Por tanto, un polipéptido "recombinante" es el resultado de intervención humana, pero puede ser una secuencia de aminoácidos de origen natural.
Las expresiones "secuencias reguladoras de ADN", "elementos de control" y "elementos reguladores" usadas indistintamente en la presente memoria, se refieren a secuencias de control transcripcional y traduccional, tales como promotores, potenciadores, señales de poliadenilación, terminadores, señales de degradación de proteínas y similares que proporcionan y/o regulan la transcripción de una secuencia no codificante (por ejemplo, ARN dirigido a ADN) o una secuencia codificante (por ejemplo, polipéptido modificador dirigido al sitio o polipéptido Cas9/Csn1) y/o regulan la traducción de un polipéptido codificado.
En particular, la expresión "elemento regulador" pretende incluir promotores, potenciadores, sitios internos de entrada al ribosoma (IRES) y otros elementos de control de la expresión (por ejemplo, señales de terminación de la transcripción, tales como señales de poliadenilación y secuencias de poli-U). Dichos elementos reguladores se describen, por ejemplo, en Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Los elementos reguladores incluyen aquellos que dirigen la expresión constitutiva de una secuencia de nucleótidos en muchos tipos de células hospedadoras y aquellos que dirigen la expresión de una secuencia de nucleótidos únicamente en determinadas células hospedadoras (por ejemplo, secuencias reguladoras específicas de tejido). Un promotor específico de tejido puede dirigir la expresión principalmente en un tejido deseado de interés, tal como músculo, neurona, hueso, piel, sangre, órganos específicos (por ejemplo, hígado, páncreas) o tipos celulares particulares (por ejemplo, linfocitos). Los elementos reguladores también pueden dirigir la expresión de una manera dependiente del tiempo, tal como de una manera dependiente del ciclo celular o dependiente del estado de desarrollo, que también pueden ser específicos de tejido o tipo celular o no. En algunas realizaciones, un vector comprende uno o más promotores de pol III (por ejemplo, 1, 2, 3, 4, 5 o más
promotores de pol I), uno o más promotores de pol II (por ejemplo, 1,2, 3, 4, 5 o más promotores de pol II), uno o más promotores de pol I (por ejemplo, 1, 2, 3, 4, 5 o más promotores de pol I) o combinaciones de los mismos. Ejemplos de promotores de pol III incluyen, aunque sin limitación, promotores U6 y H1. Ejemplos de promotores de pol II incluyen, aunque sin limitación, el promotor LTR retrovírico del virus del sarcoma de Rous (RSV) (opcionalmente con el potenciador de RSV), el promotor de citomegalovirus (CMV) (opcionalmente con el potenciador de CMV) [véase, por ejemplo, Boshart et al., Cell, 41:521-530 (1985)], el promotor de SV40, el promotor de la dihidrofolato reductasa, el promotor de p-actica, el promotor de la fosfoglicerol cinasa (PGK) y el promotor de EF1a. También se incluyen en la expresión "elemento regulador" elementos potenciadores, tales como WPRE; potenciadores de CMV; el segmento R-U5' en LTR de HTLV-I (Mol. Cell. Biol., Vol. 8(1), pág. 466-472, 1988); potenciador de SV40 y la secuencia intrónica entre los exones 2 y 3 de p-globina de conejo (Proc. Natl. Acad. Sci. USA., Vol. 78(3), pág. 1527-31, 1981). Los expertos en la materia apreciarán que el diseño del vector de expresión puede depender de factores tales como la elección de la mejor célula a transformar, el nivel de expresión deseado, etc. Un vector puede introducirse en células hospedadoras para producir de ese modo transcritos, proteínas o péptidos, incluyendo proteínas o péptidos de fusión, codificados por ácidos nucleicos como se describe en la presente memoria (por ejemplo, transcritos de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR), proteínas, enzimas, formas mutantes de los mismos, proteínas de fusión de los mismos, etc.).
Métodos para detectar y marcar células
De acuerdo con un primer objeto, la invención se refiere a un método para marcar células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas), muy preferiblemente células eucariotas, que comprende las etapas de:
a) proporcionar células o una composición que comprende células;
b) poner en contacto dichas células o dicha composición con:
- al menos una endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) adecuada para abordar una región genómica de interés en dichas células, o un vector adecuado para expresar dicha endonucleasa en dichas células;
- al menos un primer ácido nucleico adecuado para introducir, después de escisión específica de secuencia de la región genómica de interés por la endonucleasa, una o más mutaciones sinónimas en dicha región genómica por HDR, y opcionalmente una o más mutaciones no sinónimas en dicha región genómica de interés; y
- al menos un segundo ácido nucleico adecuado para introducir, después de escisión específica de secuencia de la región genómica de interés por la endonucleasa, una o más mutaciones sinónimas en dicha región genómica, pero distintas de las mutaciones sinónimas del primer ácido nucleico;
como control para efectos inespecíficos, marcando de ese modo células tratadas con endonucleasa.
El primer y segundo ácido nucleico se consideran ácidos nucleicos "donadores". En la etapa b), por tanto, pueden integrarse en la región genómica diana de interés por HDR.
La etapa b) de poner en contacto dichas células con dicho primer y segundo ácido nucleico se consigue en la misma composición o en diferentes composiciones ("en paralelo") antes de la mezcla, proporcionando de ese modo células tratadas con endonucleasa marcadas (o "con código de barras").
Cuando el primer y segundo ácido nucleico se ponen en contacto con dichas células en una misma composición, el primer y segundo ácido nucleico pueden ponerse en contacto simultánea o secuencialmente (uno después del otro).
Cuando el primer y segundo ácido nucleico se ponen en contacto con dichas células en una composición diferente, el primer y segundo ácido nucleico se ponen en contacto en paralelo. Por consiguiente, el al menos primer ácido nucleico se pone en contacto con una o más células en una primera composición, y el al menos segundo ácido nucleico se pone en contacto con una o más células en una segunda composición; la primera y segunda composición entonces se mezclan, marcando de ese modo las células tratadas con endonucleasa (es decir, véase la figura 1B).
De acuerdo con algunas realizaciones, el primer y segundo ácido nucleico se ponen en contacto con dichas células de una manera adecuada para que se produzca el acontecimiento de HDR simultáneamente.
De acuerdo con otras realizaciones, el primer y segundo ácido nucleico se ponen en contacto con dichas células de una manera adecuada para que el evento HDR se produzca secuencialmente o en paralelo.
Una ventaja de poner dichos ácidos nucleicos en contacto con dichas células de una manera secuencial o en paralelo, es evitar o reducir la probabilidad de incorporación de los ácidos nucleicos donadores deferentes alelos de la misma célula.
Otra ventaja es mejorar la eficacia de transfección.
Por consiguiente, dicho primer y segundo ácido nucleico (que son muy preferiblemente del mismo tipo) pueden seleccionarse del grupo que comprende o consiste en: desoxirribonucleótidos monocatenarios (ADNmc); desoxirribonucleótidos bicatenarios (ADNbc); ribonucleótidos monocatenarios (ARNmc); ribonucleótidos bicatenarios (ARNbc); oligodesoxirribonucleótidos monocatenarios (ODNmc); oligodesoxirribonucleótidos bicatenarios (ODNbc); oligorribonucleótidos monocatenarios (ORNmc); oligorribonucleótidos bicatenarios (ORNbc); estructuras dobles de ARN-ADN; de una forma modificada o no modificada. Cuando dichos ácidos nucleicos están en una forma modificada, opcionalmente pueden comprender secuencias degeneradas y bases no convencionales.
Por ejemplo, el uso de un ODNmc como ácido nucleico donador, se ha descrito en Chen et al., (2011). High-frequency genome editing using ssDNA oligonucleotides with zinc-finger nucleases. Nat Methods. 8(9):753-5.
De una manera no limitante, dichos ácidos nucleicos pueden estar en forma de ARN mensajero (ARNm), ARN de transferencia, ARN ribosómico, ARN interferente corto (ARNic), ARN de horquilla corta (ARNhc), microARN (miARN), ribozimas, ADNc, polinucleótidos recombinantes, polinucleótidos ramificados, plásmidos, vectores, ADN aislado de cualquier secuencia, ARN aislado de cualquier secuencia, sondas de ácido nucleico y cebadores.
De acuerdo con una realización preferida, dichos ácidos nucleicos son ácidos desoxirribonucleicos.
Pueden ser de longitud variable dependiendo de la naturaleza y longitud de la región genómica de interés y también para conseguir hibridación en la célula y HDR después del tratamiento con endonucleasa. Por tanto, pueden comprender o consistir en 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 100, 150 o más nucleótidos.
Cuando el uno o más ácidos nucleicos se usan para introducir una o más mutaciones sinónimas en dicha región genómica de interés, pueden ser uno o más oligodesoxirribonucleótidos monocatenarios (ODNmc). Cuando el uno o más ácidos nucleicos se usan para la introducción o remplazo de una secuencia de ácido nucleico más larga por HDR (es decir, un gen completo), pueden ser uno o más desoxirribonucleótidos bicatenarios (ADNbc).
Cuando dicho primer y segundo ácido nucleico donador son ácidos nucleicos bicatenarios, pueden comprender extremos romos o adhesivos.
De acuerdo con una realización, dicho primer y segundo ácido nucleico donador comprenden extremos romos.
De acuerdo con una realización, el primer y segundo ácido nucleico son uno o más oligodesoxirribonucleótidos monocatenarios (ODNmc).
De acuerdo con una realización más particular, el primer y segundo ácido nucleico son uno o más oligodesoxirribonucleótidos monocatenarios (ODNmc) o uno o más oligodesoxirribonucleótidos bicatenarios (ODNbc) de extremos romos.
Además, puede estar presente más de un tipo de "código de barras" dentro de una misma muestra (es decir, una composición o tejido). Por consiguiente, los acontecimientos de HDR asociados con la introducción de cada "código de barras" puede producirse en la misma muestra o en distintas muestras que después pueden mezclarse conjuntamente para formar una sola muestra que comprende una mezcla de dichas células, proporcionando de ese modo una mezcla de células tratadas con endonucleasa marcadas (es decir, véase la figura 2).
Ventajosamente, el código de barras correspondiente a cada población celular puede entonces detectarse, por ejemplo, por PCR TaqMan múltiple.
Las endonucleasas que son adecuadas para la invención incluyen cualquier endonucleasa CRISPR-Cas adecuada para introducir, después de escisión específica de secuencia de la región genómica de interés, un ácido nucleico donador o fragmento del mismo por HDR.
Ejemplos de dichas endonucleasas son conocidos en la técnica.
Una endonucleasa CRISPR-Cas puede seleccionarse de Cas9 o Cpf1, y preferiblemente es una endonucleasa Cas9.
Por consiguiente, dicho vector es preferiblemente un sistema de CRISPR-Cas, tal como un sistema de CRISPR-Cas9.
En algunas realizaciones, uno o más elementos de un sistema de CRISPR derivan de un sistema de CRISPR de tipo I, tipo II o tipo III. En algunas realizaciones, uno o más elementos de un sistema de CRISPR derivan de un organismo particular que comprende un sistema de CRISPR endógeno, tal como Streptococcuspyogenes. En general, un sistema de CRISPR se caracteriza por elementos que promueven la formación de un complejo CRISPR en el sitio de una secuencia diana (también denominado protoespaciador en el contexto de un sistema de CRISPR endógeno). En el contexto de formación de un complejo CRISPR, "secuencia diana" se refiere a una secuencia para la que se diseña una secuencia de guía que tenga complementariedad, donde la hibridación entre una secuencia diana y una secuencia de guía promueve la formación de un complejo CRISPR. No se requiere necesariamente complementariedad completa, siempre que sea suficiente complementariedad para provocar la hibridación y promover la formación de un
complejo CRISPR. Una secuencia diana puede comprender cualquier polinucleótido, tal como polinucleótidos de ADN o ARN.
Entre los sistemas de CRISPR-Cas, un sistema de CRISPR de tipo II de Streptococcus pyogenes implica solamente un único gen que codifica la proteína Cas9 y dos ARN, un ARN de CRISPR maduro (ARNcr) y un ARN de acción en trans parcialmente complementario (ARNcrtra), que son necesarios y suficientes para el silenciamiento guiado por ARN de ADN exógenos.
Por consiguiente, un sistema de CRISPR-Cas de la invención puede implicar una endonucleasa Cas y un ácido nucleico de guía del sistema de CRISPR-Cas, tal como un ARN de guía del sistema de CRISPR-Cas que hibrida con la secuencia diana.
Por consiguiente, un sistema de CRISPR-Cas adecuado para la invención puede comprender o consistir en uno o más vectores que comprenden:
a) un primer elemento regulador funcional en una célula (preferiblemente una célula eucariota) unido de manera funcional a al menos una secuencia de nucleótidos que codifica un ácido nucleico de guía del sistema de CRISPR-Cas, tal como un ARN de guía del sistema de CRISPR-Cas, que hibrida con la secuencia diana, y
b) un segundo elemento regulador funcional en una célula (preferiblemente una célula eucariota) unido de manera funcional a una secuencia de nucleótidos que codifica una endonucleasa Cas, tal como una proteína Cas9 de tipo II,
en el que los componentes (a) y (b) están ubicados en el mismo vector o en diferentes vectores del sistema, con lo que el ácido nucleico de guía se dirige a la secuencia diana y la proteína endonucleasa Cas (es decir, Cas9 de tipo II) escinde la región genómica de interés.
De una manera no limitante, los sistemas de CRISPR-Cas que son adecuados para la invención se describen en el documento US 8697359 B1 y el documento US 2014/0068797 A1, o en Zetsche et al., ("Cpf1 is a Single RNA-guided Endonuclease of a Class 2 CRISPR-Cas System (2015); Cell; 163, 1 -13).
En algunas realizaciones, la enzima de CRISPR tiene los codones optimizados para su expresión en una célula eucariota. En algunas realizaciones, la enzima de CRISPR dirige la escisión de una o dos hebras en la ubicación de la secuencia diana. En algunas realizaciones, la enzima de CRISPR comprende un marcador detectable, tal como un marcador fluorescente. En algunas realizaciones, la enzima de CRISPR es una proteína Cas, que incluye una proteína Cas9 de tipo II o una de sus isoformas.
Ejemplos de dichos vectores incluyen lentivirus y virus adenoasociados, y tipos de dichos vectores también pueden seleccionarse para abordar tipos particulares de células eucariotas. Otros ejemplos de vectores de expresión, incluyendo vectores de expresión de mamífero, que pueden dirigir la expresión de un ácido nucleico dado en tipos celulares particulares son conocidos en la técnica.
De acuerdo con una realización preferida de dicho método, dicha endonucleasa o vector es respectivamente una endonucleasa Cas9 de tipo II o un sistema de CRISPR-Cas.
De forma ilustrativa y de una manera no limitante, un ejemplo de protocolo de generación de código de barras de CRISPR para células eucariotas requiere:
- un primer ADN donador que consiste en un ODNmc (ODNmc-1), que comprende una mutación no sinónima a introducir en la región genómica de interés, y un primer conjunto de mutaciones sinónimas;
- un segundo ADN donador que consiste en un ODNmc (ODNmc-2), que comprende un segundo conjunto de mutaciones sinónimas a introducir en la misma región genómica de interés, en el que dicha mutación sinónima no modifica la secuencia de aminoácidos de la proteína codificada por dicha región genómica; y
- un vector de expresión (es decir, un plásmido) para expresar Cas9 y un ARNgs en dichas células eucariotas.
Las células entonces se transfectan con el vector de expresión y los dos o más ADN donadores.
Por lo tanto, se produce una población mixta de células eucariotas, que comprende al menos (i) células eucariotas en que se ha producido HDR; (ii) células eucariotas en que se ha producido HDR en presencia de ODNmc-1; (iii) células eucariotas en que se ha producido HDR en presencia de ODNmc-2; y opcionalmente (iv) células eucariotas en que la escisión de ADN se ha reparado por NHEJ.
La proporción de células que contienen ODNmc-1 u ODNmc-2 se determina entonces (preferiblemente por PCR cuantitativa (qPCR), de polimorfismos de longitud de fragmentos de restricción (RFLP)-PCR o secuenciación de siguiente generación (NGS)), en general 2-3 días después de la transfección (correspondiente a t0), y después se repite a lo largo del tiempo, lo que proporciona, por tanto, una indicación de si la región genómica de interés induce un efecto negativo o positivo sobre el crecimiento celular.
El ODNmc-2, que no introduce modificaciones en la secuencia de aminoácidos, se usa como control interno para la normalización, para evitar la posible escisión no específica asociada con CRISPR.
Ventajosamente, las mutaciones sinónimas de la primera y segunda característica distintiva en dichos ácidos nucleicos pueden intercambiarse adicionalmente, como control de posibles efectos de dichas mutaciones sinónimas sobre la estabilidad del ARNm y los niveles de expresión génica.
Los métodos mencionados anteriormente para marcar células tratadas con endonucleasa en una composición pueden proporcionar, en dicha composición, una mezcla de células modificadas y no modificadas. Por consiguiente, pueden proporcionar al menos:
- una primera población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) que comprende una o más mutaciones sinónimas introducidas en una región genómica de interés por HDR, proporcionando de ese modo una primera característica distintiva; y
- una segunda población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) que comprende una o más mutaciones sinónimas introducidas en la misma región genómica de interés por HDR, en la que dicha una o más mutaciones sinónimas son distintas de la una o más mutaciones sinónimas de la primera población, proporcionando de ese modo una segunda característica distintiva;
- opcionalmente una tercera población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) que comprende una o más mutaciones sinónimas introducidas en la misma región genómica de interés por HDR, en la que dicha una o más mutaciones sinónimas son distintas de la una o más mutaciones sinónimas de la primera población y opcionalmente la segunda población, proporcionando de ese modo una tercera característica distintiva;
- opcionalmente una población de células sin modificar y/o células modificadas por NHEJ.
Ventajosamente, dicha primera y segunda característica distintiva pueden usarse adicionalmente como marcador, para la detección o seguimiento de una población de células, muy preferiblemente células eucariotas, dentro una mezcla compleja (es decir, una composición o un tejido). Dicho de otro modo, proporcionan un "código de barras" para detectar la variación de una población sobre las otras, por ejemplo, en presencia de un estímulo, sin la necesidad de una etapa adicional de selección o identificación de clones.
De acuerdo con una realización, el método para marcar células, como se describe anteriormente, se usa para la preparación de una composición (es decir, una composición farmacéutica y/o un medicamento), que comprende o consiste en al menos:
- dicha primera población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas); y
- dicha segunda población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas).
Por consiguiente, los métodos mencionados anteriormente para marcaje pueden integrarse adicionalmente en métodos para detectar una población de células tratadas con endonucleasa, muy preferiblemente células eucariotas, en una muestra (es decir, una composición o un tejido biológico aislado) o un individuo (es decir, un ser humano o mamífero no humano), como se describe adicionalmente a continuación en este documento.
Ejemplos de composiciones o tejidos biológicos aislados que se consideran particularmente incluyen composiciones y tejidos que comprenden o consisten en líneas de células cancerosas.
Se consideran particularmente métodos in vitro. Por tanto, de acuerdo con un segundo objeto, la invención se refiere a un método para detectar una población de células tratadas con endonucleasa, muy preferiblemente células eucariotas, que comprende las etapas:
a) proporcionar al menos:
- una primera población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) que comprende una o más mutaciones sinónimas introducidas en una región genómica de interés por HDR, proporcionando de ese modo una primera característica distintiva; y
- una segunda población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas), que comprende una o más mutaciones sinónimas introducidas en la misma región genómica de interés por HDR, en la que dicha o más mutaciones
sinónimas son distintas de la una o más mutaciones sinónimas de la primera población, proporcionando de ese modo una segunda característica distintiva;
b) determinar dicha primera y segunda característica distintiva; y
c) comparar dicha primera y segunda característica distintiva, detectando de ese modo dicha primera población de células tratadas con endonucleasa.
Por consiguiente, una relación entre dicha primera y segunda característica distintiva o, como alternativa, una relación entre dicha segunda y primera característica distintiva, proporciona una indicación de la variación de la primera población sobre la segunda población.
Por consiguiente, la invención se refiere a un método para detectar una población de células tratadas con endonucleasa, muy preferiblemente células eucariotas, en una muestra, que comprende las etapas de:
a) proporcionar una muestra que comprende al menos:
- una primera población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) que comprende una o más poblaciones sinónimas introducidas en una región genómica de interés por HDR, proporcionando de ese modo una primera característica distintiva; y
- una segunda población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas), que comprende una o más mutaciones sinónimas introducidas en la misma región genómica de interés por HDR, en la que dicha una o más mutaciones sinónimas son distintas de la una o más mutaciones sinónimas de la primera población, proporcionando de ese modo una segunda característica distintiva;
b) determinar dicha primera y segunda característica distintiva en dicha muestra; y
c) comparar dicha primera y segunda característica distintiva, detectando de ese modo dicha primera población de células tratadas con endonucleasa en dicha muestra;
en el que dicha muestra se selecciona preferiblemente del grupo que consiste en una composición (tal como una composición descrita anteriormente) o un tejido biológico aislado.
De acuerdo con una realización, la primera población de células tratadas con endonucleasa también puede comprender una o más mutaciones no sinónimas en dicha región genómica de interés.
De acuerdo con una realización, la etapa b) de determinar dicha característica distintiva genómica y de referencia se consigue amplificando dicha región genómica de interés (es decir, con cebadores complementarios a dichas características distintivas y/o a una región que abarca dicha característica distintiva); en la que dichos cebadores son preferiblemente adecuados para PCR cuantitativa instantánea (qPCR).
De acuerdo con una realización, la etapa b) de determinar dicha característica distintiva genómica y de referencia se consigue por PCR cuantitativa instantánea.
De acuerdo con una realización, la etapa b) de determinar dicha característica distintiva genómica y de referencia se consigue por secuenciación profunda.
La primera y segunda población se trataron por una cualquiera de las endonucleasas CRISPR-Cas mencionadas anteriormente.
Ejemplos de nucleasas CRISPR-Cas incluyen Cas9 de tipo II y nucleasas Cpf1 de tipo II.
Por consiguiente, una endonucleasa preferida es una nucleasa Cas9 de tipo II.
Los métodos para detectar una población de células tratadas con endonucleasa como se describe en la presente memoria son particularmente ventajosos para el seguimiento de una población de células sobre la otra en una muestra (es decir, una composición o un tejido biológico tal como un tejido biológico aislado), en presencia o en ausencia de un estímulo dado o una condición experimental particular.
De una manera no limitante, esos métodos pueden implementarse en métodos de cribado para evaluar:
- las consecuencias de una mutación oncógena en células derivadas de neuroblastoma;
- los mecanismos de resistencia asociados con quimioterapia, tal como en cáncer pulmonar; y/o
- el estudio de células madre cancerosas, en particular la heterogeneidad intratumoral.
Cada una de esas realizaciones puede combinarse.
De acuerdo con un tercer objeto, la invención se refiere a un uso de una composición para detectar una población de células tratadas con endonucleasa, caracterizándose dicha composición por que comprende al menos:
(i) una primera población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas), que comprende una o más mutaciones sinónimas en una región genómica de interés, y opcionalmente una o más mutaciones no sinónimas en dicha región genómica de interés; y
(ii) una segunda población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas), que comprende una o más mutaciones sinónimas en dicha región genómica, pero distintas de las mutaciones sinónimas de la primera población;
en el que la una o más mutaciones sinónimas se introducen en dichas células por HDR después de tratamiento con una misma endonucleasa dirigida a dicha región genómica de interés.
De acuerdo con una realización preferida, dichas células son células eucariotas.
Las composiciones que se consideran incluyen cualquier medio que sea adecuado para el crecimiento celular, o formulación para su adición, según se desee, a cultivos celulares convencionales y disponibles.
Una composición puede seleccionarse de un grupo que comprende o consiste en: una composición farmacéutica, un medicamento, un medio de crecimiento o medio de cultivo adecuado para dichas células.
Una composición puede ser una composición que sea adecuada para administración parenteral u oral y/o una inyección estéril (es decir, inyección intravenosa o intraarterial o intratisular).
Esta composición puede obtenerse realizando un método para marcar células, muy preferiblemente células eucariotas, en una composición como se describe anteriormente.
De acuerdo con una realización particular, dicha primera y/o segunda población comprende además una o más mutaciones no sinónimas en dicha región genómica de interés.
En particular, se consideran explícitamente las siguientes alternativas:
(i) dicha primera población comprende mutaciones no sinónimas, pero no la segunda población; o
(ii) dicha primera y segunda población comprenden ambas una o más mutaciones no sinónimas, siendo dicha una o más mutaciones no sinónimas iguales o diferentes, y preferiblemente diferentes.
Dicha primera y segunda población pueden considerarse en una forma aislada o en presencia de otros contaminantes y/o poblaciones distintas.
Por consiguiente, cuando dicha primera y segunda población se consideran en una forma aislada, pueden ser parte de una composición sustancialmente pura (es decir, una composición que no comprende de ninguna manera detectable ninguna otra población de células).
Dicha primera y segunda población también pueden considerarse en forma de un kit.
De acuerdo con un cuarto objeto, la invención se refiere a un uso de un kit para detectar una población de células tratadas con endonucleasa, muy preferiblemente células eucariotas, que comprende al menos:
- una primera parte que comprende una primera población de células tratadas con endonucleasa como se define anteriormente; y
- una segunda parte que comprende una segunda población de células tratadas con endonucleasa como se define anteriormente.
Por consiguiente, dicha primera y segunda población de células tratadas con endonucleasa se obtienen preferiblemente después de poner en contacto las células con
(i) al menos una endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) adecuada para abordar una región genómica de interés en dichas células, o vector adecuado para expresar dicha endonucleasa en dicha célula; y
(ii) al menos un ácido nucleico de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociado a CRISPR (Cas) (CRISPR-Cas) adecuado para introducir dicha una o más mutaciones sinónimas en la región genómica de interés de dichas células por HDR.
La primera y segunda población se trataron por una cualquiera de las endonucleasas mencionadas anteriormente, que incluyen endonucleasas seleccionadas de: una nucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas).
Por consiguiente, una endonucleasa preferida es una proteína Cas de tipo II, tal como Cas9 o Cpf1.
Por consiguiente, un vector preferido adecuado para expresar dicha endonucleasa en un sistema de CRISPR-Cas, tal como un sistema de CRISPR-Cas9 o un sistema de CRISPR-Cpf1.
De acuerdo con un quinto objeto, la invención también se refiere a un kit para marcar células tratadas con el sistema de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociado a CRISPR (Cas) (CRISPR-Cas), muy preferiblemente células eucariotas, que comprende:
(i) una primera parte que comprende al menos un sistema de CRISPR-Cas, que comprende:
a) un primer elemento regulador funcional en una célula unido de manera funcional a al menos una secuencia de nucleótidos que codifica un ácido nucleico de guía del sistema de CRISPR-Cas que hibrida con una región genómica diana de interés de dicha célula, y
b) un segundo elemento regulador funcional en dicha célula unido de manera funcional a una secuencia de nucleótidos que codifica una endonucleasa Cas, preferiblemente una proteína Cas9 de tipo II, en el que los componentes (a) y (b) están ubicados en el mismo vector o vectores diferentes del sistema;
(ii) una segunda parte que comprende al menos un ácido nucleico adecuado para introducir una o más mutaciones sinónimas en dicha región genómica de interés por HDR, y opcionalmente una o más mutaciones no sinónimas en dicha región genómica de interés.
El ácido nucleico de guía del sistema de CRISPR-Cas es preferiblemente un ARN de guía del sistema de CRISPR-Cas. Por tanto, la invención también se refiere a un kit para marcar células tratadas con el sistema de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociado a CRISPR (Cas) (CRISPR-Cas), muy preferiblemente células eucariotas, que comprende:
(i) una primera parte que comprende al menos un sistema de CRISPR-Cas, que comprende:
a) un primer elemento regulador funcional en una célula unido de manera funcional a al menos una secuencia de nucleótidos que codifica un ARN de guía del sistema de CRISPR-Cas que hibrida con una región genómica diana de interés de dicha célula, y
b) un segundo elemento regulador funcional en dicha célula unido de manera funcional a una secuencia de nucleótidos que codifica una endonucleasa Cas, preferiblemente una proteína Cas9 de tipo II, en el que los componentes (a) y (b) están ubicados en el mismo vector o vectores diferentes del sistema;
(ii) una segunda parte que comprende al menos un ácido nucleico adecuado para introducir una o más mutaciones sinónimas en dicha región genómica de interés por HDR, y opcionalmente una o más mutaciones no sinónimas en dicha región genómica de interés.
De acuerdo con una realización, los componentes (a) y (b) de dicho sistema de CRISPR-Cas están ubicados en el mismo vector o ácido nucleico.
De acuerdo con una realización, dicho kit para marcar una o más células tratadas con el sistema de CRISPR-Cas comprende:
(ii) al menos un primer ácido nucleico adecuado para introducir una o más mutaciones sinónimas en dicha región genómica de interés de dicha una o más células por HDR, y opcionalmente una o más mutaciones no sinónimas; y
(iii) al menos un segundo ácido nucleico adecuado para introducir una o más mutaciones sinónimas en la región genómica de interés de dicha o más células, pero distintas de las mutaciones sinónimas del primer ácido nucleico; en el que dichos ácidos nucleicos están dentro de partes distintas o dentro de la misma parte.
Los kits que se describen en la presente memoria pueden comprender además una o más células, en particular una o más células eucariotas, incluyendo células derivadas de un mamífero o una planta.
De acuerdo con algunas realizaciones de los métodos, composiciones y kits descritos en la presente memoria, dicha una o más mutaciones sinónimas están dentro de:
- un marco abierto de lectura (ORF) o exón de un gen que codifica una proteína de interés; o
- una región no codificante.
De acuerdo con una realización preferida de los métodos, composiciones y kits descritos en la presente memoria, dicha una o más mutaciones sinónimas están dentro de un marco abierto de lectura (ORF) o exón de un gen que codifica una proteína de interés.
Cada una de esas realizaciones puede combinarse.
Ejemplos
A. Material y métodos
Cultivo celular, transfección, producción lentivírica e inhibidores
Se obtuvieron células 293T (riñón embrionario humano), DLD-1, HCT-116 (carcinoma colorrectal), MCF-7 (cáncer de mama) de la ATCC, se obtuvieron células PC9 (NSCLC) de ECACC-Sigma-Aldrich, las células Kelly (neuroblastoma) fueron un presente del Dr. C. Einvik. Todas células se hicieron crecer en medio de Eagle modificado por Dulbecco (Life technologies) excepto las células Kelly y PC-9, que se hicieron crecer en medio del Roswell Park Memorial Institute (Life technologies), ambos complementados con suero bovino fetal al 10 % (FBS, Life Technologies) y penicilina/estreptomicina al 0,6 % (Life technologies). Las células se transfectaron con un dispositivo Nucleofector II (Lonza) usando el kit Amaxa Nucleofector (Lonza) y el programa de electroporación recomendado por el fabricante. Las células 293T se transfectaron usando polietilenimina (Polysciences). La eficacia de cada transfección se evaluó en paralelo usando un plásmido que contenía GFP.
La construcción sensible a Wnt se generó clonando el promotor sensible a Wnt de un indicador descrito previamente (Grumolato et al., 2013), seguido de GFP desestabilizada (Matsuda y Cepko, 2007) en el vector lentivírico VIRSP, que contenía el gen de resistencia a puromicina. Para la producción de lentivirus, se cotransfectaron células 293T con el vector lentivírico sensible a Wnt, los plásmidos pCMV A8.91 y pMD VSV-G. Dos días después de la transfección, el medio acondicionado se recogió, se purificó por centrifugación, se complementó con 8 pg/ml de polibreno y se añadió durante incubación de una noche a células DLD1 recién sembradas en placa. Dos días después de la infección, las células se seleccionaron en 2 mg/ml de puromicina.
Se adquirió Nutlin-3 de SelleckChem y se adquirió doxorrubicina de Abcam. El inhibidor de ATM, el inhibidor de ALK y los inhibidores de EGFR se adquirieron de Santa-Cruz Biotechnology
Generación de código de barras de CRISPR
Se diseñaron secuencias diana de ARNgs (véase la lista de secuencias - SEQ ID N°1-14) usando la herramienta CRISPR Design por el Massachusetts Institute of Technology (http://crispr.mit.edu) para minimizar los posibles efectos inespecíficos. Después se hibridaron oligos que codificaban las secuencias de dirección y se ligaron en el vector pSpCas9(BB)-2A-Puro (Ran et al., 2013) digerido con BbsI (New England Biolabs). La secuencia de los ODNmc (Integrated DNA Technologies) usados para HDR mediada por CRISPR/Cas9, que contenían una mutación de aminoácido/finalizadora acoplada con diferentes mutaciones sinónimas, se proporciona en la lista de secuencias (SEQ ID N°15-29). El conjunto de mutaciones sinónimas se diseña para posibilitar la especificidad de PCR y para evitar el reconocimiento por el ARNgs correspondiente usado para escindir la secuencia endógena. Para cada locus diana, las células se cotransfectaron con 2 pg del plásmido de CRISPR/Cas9 y 2 pl del control o el ODNmc de sentido/finalizador (50 pM). Inmediatamente después de la transfección, las células se combinaron el mismo matraz. Para la generación de código de barras de AAVS1, células BT474 se sometieron a dos rondas de transfección a intervalos de dos semanas usando plásmidos de CRISPR/Cas9 que codifican dos ARNgs distintos, junto con un ODNmc que contiene nueve nucleótidos degenerados y un sitio de restricción de SalI (véase la lista de secuencias - respectivamente SEQ ID N°13-14 y 29).
qPCR, PCR y ensayo Surveyor y ensayo de RFLP
se extrajo el ADNg usando el kit NucleoSpin Tissue (Macherey-Nagel). El ARN total se aisló usando el Tri-Reagent (Sigma-Aldrich) y el kit RNeasy (Qiagen), se digirió con DNasa y se retrotranscribió usando el sistema de retrotranscripción Improm-II (Promega). La secuencia de los diferentes cebadores de PCR, diseñados usando Primer-BLAST (NCBI), se proporciona en la lista de secuencias (SEQ ID N°30-57). Para evitar la posible amplificación a partir de moléculas de ODNmc no integradas en el locus genómico correcto, uno de los dos cebadores se diseñó para que se dirigiera a la secuencia genómica endógena que flanquea la región que comparte homología con los ODNmc. Se evaluó la especificidad del cebador para cada código de barras particular. Se realizó qPCR de 100 ng de ADNg usando SYBR Green (Life Technologies) en un sistema 7900 HT Fast-Real-Time, Q-PCR ABI PRISM 7500 o QuantStudio Flex PCR (Life Technologies). El análisis de qPCR se realizó usando la curva patrón o los métodos de Pfaffl (Pfaffl, 2001).
La secuencia de los cebadores usados para amplificar una región de ~ 800 pb de los genes APC y AAVS1 que abarcan los sitios diana de CRISPR/Cas9 se proporciona en la lista de secuencias (SEQ ID N°58-61). Se realizó PCR usando la ADN polimerasa de fusión Herculase II (Agilent Technologies) y el amplicón se purificó usando el kit de PCR cleanup (Macherey-Nagel) y se eluyó con 30 pl de tampón TE. Se realizó ensayo Surveyor como se describe (Ran et al., 2013). En resumen, se mezclaron entonces 15 pl de productos de PCR purificados con tampón de PCR con polimerasa
Taq y se sometieron a un proceso de rehibridación para posibilitar la formación de estructuras dobles heterogéneas de ADN. Después de la rehibridación, los productos se trataron con nucleasa SURVEYOR y potenciador S SURVEYOR (Transgenomic). Los 15 gl restantes del amplicón purificado se usaron como control. Para el ensayo de RFLP, se digirieron los amplicones de AAVS1 en presencia o en ausencia de Salí (Promega). Tanto para el ensayo Surveyor como de RFLP, los productos de reacción se analizaron en un gel de acrilamida al 10 %-TBE teñido con SYBR-Gold (Life Technologies) y se tomaron imágenes con un sistema de imágenes de gel Chemidoc (Bio-Rad).
Detección de código de barras mediante PCR TaqMan múltiple
Los códigos de barras T790T y T790M en muestras de ADNg de células PC9 se detectaron por PCR TaqMan múltiple usando un par de cebadores directo e inverso son modificar, junto con una sonda TaqMan QSY dirigida al código de barras T790T (tinte FAM, Life Technologies) y una sonda TaqMan QSY dirigida al código de barras T790M (tinte ABY, Life Technologies). Para limitar la amplificación de la secuencia endógena, se añadió un oligonucleótido de bloqueo específico, que contiene enlaces fosforotioato y un ddC en 3' (Eurofins Genomics) a la reacción. Las reacciones se realizaron en presencia de TaqMan Multiplex Master Mix 1X (Life technologies) en un sistema de PCR QuantStudio Flex (Life Technologies). La secuencia de los cebadores y sondas se proporciona en la lista de secuencias.
Extracción de ARN y retrotranscripción
El ARN total se aisló usando el Tri-Reagent (Sigma-Aldrich) y el kit RNeasy (Qiagen), se digirió con DNasa y se retrotranscribió usando el sistema de retrotranscripción Improm-II (Promega).
Clasificación celular por FACS
Las células DLD1 transducidas con el indicador sensible a Wnt se clasificaron basándose en el nivel de expresión de GFP. En resumen, las células recogidas se resuspendieron en tampón de clasificación por FACS estéril (medio D-PBS, EDTA 2 mM, BSA al 0,5 %), se filtraron en filtros de cribado celular de 30 gm (BD Biosciences) para eliminar los agregados celulares y se aislaron por FACS usando un citómetro FACSAria-III (BD Biosciences). Las células DLD1 que contenían un indicador Wnt se clasificaron en primer lugar para reducir la fracción de células que expresan niveles bajos de GFP. La población de células DLD1 resultante se transfectó para el código de barras de CRISPR APC, y cinco días después se aislaron células GFPhi (definidas como el 10 % de las células que presentan la fluorescencia más alta) y GFPto (definidas como el 10 % de las células que presentan la fluorescencia más baja) por FACS. Se extrajo el ADNg de células clasificadas y no clasificadas para análisis por qPCR. Las células se mantuvieron a 4 °C durante todo el procedimiento de clasificación. Un nuevo análisis de las fracciones clasificadas mostró coherentemente que más de un 95 % de las células clasificadas eran viables y correspondían a las ventanas de adquisición GFPhi o GFPo Se realizó el análisis y representación gráfica de los datos usando el programa informático FlowJo (Tree stars).
Secuenciación profunda de APC
Se realizó PCR a partir de muestras de ADNg de células DLD1 usando ADN polimerasa Herculase II Fusion y dos pares de cebadores (Lista de secuencias - SEQ ID N°58-72), diseñados para amplificar dos regiones solapantes del gen APC que abarca 245 y 220 pb, respectivamente, incluyendo ambas la secuencia diana de CRISPR/Cas9. Las muestras se prepararon a partir de 1 gg de amplicones purificados usando SPRIworks System I automaton (Beckman). Cada par de amplicones se indexó con la misma secuencia adaptadora (Craig et al., 2008), y se secuenciaron las colecciones enriquecidas en un Genome Analyzer IIx (Illumina) con lecturas de extremos emparejados de 76 pb. Se realizó análisis de imágenes y asignación de bases por análisis instantáneo (RTA 1.9) y el programa informático CASAVA (vl.8.2, Illumina). El recuento medio de lectura que pasa los filtros para cada muestra fue al menos 160000 y un 94 % de las bases secuenciadas tiene una puntuación Q por encima de 30. Los motivos de interés se contaron en los archivos FastQ.
Ensayo de invasión
Se sembraron células PC9 que contenían los códigos de barras EGFR-T790M y -T790T pretratadas o no con gefitinib (0,5 gM) durante 48 h en cámaras de invasión de 6 pocillos de matrigel (poros de 8 gM; BD Biosciences) a una densidad de 1,5 X 106 células por cámara, en presencia o ausencia de gefitinib (0,5 gM) y se incubaron durante 24 h. Como control, se sembró una fracción de las células en paralelo en pocillos normales. Las células dentro y fuera de las cámaras se trataron entonces con tripsina y se extrajo el ADNg para qPCR.
Xenoinjertos de ratón
Se resuspendieron células PC9 que contenían los códigos de barras EGFR-T790, KRAS-G12 y EML4-ALK en PBS y se inocularon por vía subcutánea en el flanco izquierdo y derecho (2 X 106 células por sitio) de ratón SCID macho (NCI). El tamaño de los tumores se midió por calibre cada 3-4 días. Dieciséis días después de la inyección, cuando los tumores eran palpables, la mitad de los ratones se trataron 5 días a la semana con gefitinib (25 mg/kg/día) por sonda. Cuando el tamaño de al menos uno de los tumores alcanzó el volumen arbitrario de 550 mm3, los ratones se sacrificaron y se extrajo el ADNg de los tumores para análisis de qPCR. Se mezclaron células BT474 (5 X 106 células por sitio) con matrigel y se inocularon de manera bilateral en la almohadilla de grasa mamaria de ratones SCID hembra a las que se les implantó previamente gránulos de 17p-estradiol (Innovative Research of America). Los ratones se
sacrificaron 3, 4 y 5 semanas después de la inyección y se extrajo el ADNg de los tumores para análisis de secuenciación profunda. En cada punto temporal, se extrajo el ADNg del mismo lote de células BT474 mantenido en cultivo. Todos los experimentos animales se aprobaron y realizaron de acuerdo con las normas reguladoras pertinentes expuestas por el comité de cuidados y uso de animales de Mount Sinai.
Inmunotransferencia
Las células se lavaron una vez con solución salina tamponada con fosfato (PBS) y se lisaron en hielo en tampón de lisis que contenía Hepes 50 mM pH 7,6, NaCl 150 mM, EDTA 5 mM, Nonidet P-40 al 1 %, NAF 20 mM, ortovanadato de sodio 2 mM, complementado con minicomprimidos de inhibidor de proteasa (Thermo Scientific). Los lisados se aclararon por centrifugación a 14000 g durante 15 minutos a 4 °C y se determinaron las concentraciones de proteína usando el ensayo de proteínas Bio-Rad (Bio-Rad). Se añadió tampón de carga de dodecil sulfato de sodio (SDS) a cantidades iguales de lisado, seguido de electroforesis en SDS-gel de poliacrilamida (SDS-PAGE) y se transfirieron a membrana de poli(fluoruro de vinilideno) (PVDF) (Thermo Scientific). Las membranas se sondearon usando anticuerpos de ratón antiTP53 (Cell Signaling) y de ratón antipcatenina (BD Biosciences) y se analizaron por quimioluminiscencia usando sustrato de transferencia de Western ECL (Thermo Scientific).
B. Resultados
1. Restablecimiento del supresor tumoral APC en células de cáncer colorrectal a través de código de barras de CRISPR
Se usó generación de código de barras de CRISPR para investigar los efectos de restablecimiento de la función APC en células de cáncer colorrectal DLD-1, que portan una mutación de desplazamiento del marco de lectura homocigótica en la posición c.4248 (datos no mostrados). Para este fin, se diseñó un ARNgs específico y un ODNmc(APC-WT), que contenía la secuencia codificante de APC de tipo silvestre reparada, así como unas pocas mutaciones sinónimas adicionales para que sirvieran como código de barras genético.
Como control para una posible escisión inespecífica de CRISPR/Cas9 se generó un ODNmc (APC-STOP), que contiene un código de barras distinto que no puede restablecer la expresión de una proteína APC de longitud completa (figura 1A). Para evitar la posible incorporación de las dos secuencias de ADN donadoras en diferentes alelos de la misma célula, se cotransfectaron células DLD-1 por separado con el plásmido de CRISPR/Cas9, que codifica Cas9 y el ARNgs, y ODNmc(APC-WT) u ODNmc (APC-STOP). Inmediatamente después de la transfección, las células se combinaron para formar una población mixta de células sin modificar APC-WT y APC-STOP. Se diseñaron cebadores de PCR que reconocen específicamente los códigos de barras de APC-WT o APC-STOP (datos no mostrados).
El restablecimiento de una proteína APC de longitud completa en células de cáncer colorrectal mutantes para APC-se espera que regule por disminución la ruta de señalización de Wnt. Como medio para medir la activación de Wnt en estas células, se usó un indicador lentivírico que contenía una forma desestabilizada de GFP, dirigida por un promotor mínimo que contenía 14 elementos sensibles a Wnt. Las células DLD-1 que contienen de manera estable el indicador Wnt se transfectaron para código de barras de CRISPR de APC como se ilustra en la figura 1B. Cinco días después de la transfección, las células se clasificaron por FACS para aislar el 10 % de las células que presentaban los niveles de GFP más altos (GFPhi) o más bajos (GFPto) (figura 1C). Como se muestra en la figura 1D, el análisis de qPCR del genómico ADN (ADNg) reveló un fuerte enriquecimiento del código de barras de APC-WT en comparación con el APC-STOP en las células GFPo A la inversa, se redujo APC-WT en las células GFPhi, coherente con la inhibición de la señalización de Wnt en células que contenían un gen APC reparado.
Se ha demostrado que la inhibición de Wnt a través de la expresión de una construcción dominante negativa puede inducir la detención del crecimiento de células cancerosas colorrectales (van de Wetering et al., 2002). Para evaluar los efectos de la reparación del gen APC en el crecimiento de células DLD-1, se cotransfectaron células originales con el plásmido de CRISPR/Cas9 y los ODNmc de APC-WT o APC-STOP y se mezclaron inmediatamente, tres días después de la transfección, correspondiente al momento de referencia (Tref), las células se trataron con tripsina, se volvieron a sembrar en cuatro matraces diferentes y se propagaron durante aproximadamente cuatro semanas. En cada pase de células, se extrajo el ADNg para análisis por qPCR (figura 1E). Como se muestra en la figura 1F, la fracción de células DLD-1 que contenía el código de barras de APC-WT en comparación con el APC-STOP disminuyó fuertemente a lo largo del tiempo, alcanzando una meseta a las dos semanas después de la transfección (figura 1F). Se obtuvieron resultados similares usando un ARNgs diferente (datos no mostrados), coherente con la adicción de las células de cáncer colorrectal a la señalización de Wnt activada. Cabe destacar que, cuando los niveles de APC-WT y APC-STOP se normalizaban a la cantidad total de ADN, se descubrió que en puntos temporales anteriores la proporción de ambos códigos de barras disminuía, aunque a un grado diferente (datos no mostrados). Este efecto podría derivar de manera concebible de un retardo independiente de APC en la progresión del ciclo celular provocado por la escisión mediada por ARNgs de secuencias inespecíficas, o por la respuesta al daño del ADN inducido por CRISPR/Cas9, lo que enfatiza fuertemente la necesidad de un control interno para la especificidad de edición génica.
Como soporte para los datos de qPCR, se secuenció de forma profunda la región del gen APC abordado por CRISPR/Cas9 a partir de muestras de ADNg usadas en la figura 1F. La figura 1G muestra que la proporción de lecturas de APC-WT disminuye drásticamente en comparación con las lecturas que contienen el código de barras de APCSTOP, coherente con una presión negativa contra las células en que se restablecía APC de longitud completa. De manera intrigante, se descubrió que la proporción de lecturas de APC-WT que contenían mutaciones de desplazamiento del marco de lectura aumentaba seis veces en el día 27 en comparación con el Tref (datos no mostrados), coherente con una selección positiva de códigos de barras de APC-WT "falsos", que no puede restablecer la proteína APC de longitud completa. El enriquecimiento de estas secuencias, probablemente originado durante el proceso de reparación dirigido pro homología (HDR) o la síntesis del ODNmc, podría explicar la persistencia de una pequeña población, pero estable, de células que retienen el código de barras de APC-WT (figuras 1F-G).
Este experimento proporciona evidencia de la necesidad de controles internos para la especificidad de edición génica, y también la aplicación práctica de códigos de barras de endonucleasa, en particular códigos de barras de CRISPR, para estudiar el impacto de los genes sobre el crecimiento celular, sobre diferenciación celular, sobre la motilidad e invasión celular y sobre la regulación de las rutas de señalización.
2. Inactivación de TP53 usando código de barras de CRISPR
En células diploides, la edición de CRISPR/Cas9 puede afectar a uno o los dos alelos, provocando modificaciones heterocigóticas u homocigóticas (Ran et al., 2013). La distribución de alelos editados frente a no editados puede ser más compleja en células cancerosas, que a menudo son aneuploides. En nuestro modelo de cáncer de colon DLD-1, la modificación genética generada por CRISPR/Cas9 ejercía un efecto dominante, ya que la reparación de solamente un alelo de APC era suficiente de manera concebible para restablecer la expresión de una proteína APC de longitud completa y, por consiguiente, para inhibir la señalización de Wnt y el crecimiento celular. Se buscó si la generación de código de barras de CRISPR podía aplicarse de manera más general para investigar la función de genes para los que ambos alelos pueden contribuir al fenotipo celular.
Se ha informado de que la tasa de reparación por NHEJ después de escisión de ADN inducida por CRISPR/Cas9 es considerablemente mayor en comparación con HDR (Hsu et al., 2014). Coherente con estas observaciones, la secuenciación profunda y el ensayo Surveyor reveló que en células DLD-1, la fracción de alelos de APC que contenían indel o cualquier código de barras era de aproximadamente un 30-50 % y un 5-6 %, respectivamente (figura 1F y datos no mostrados). Se especuló que, si en una célula particular la actividad de CRISPR/Cas9 es suficiente para posibilitar la inserción de un código de barras en un alelo, en muchos casos también provocaría la inactivación del segundo alelo por NHEJ, provocando de este modo un efecto dominante del código de barras. Para ensayar esta hipótesis, se usó código de barras de CRISPR para inactivar el gen supresor tumoral TP53. En respuesta a una diversidad de agresores celulares, incluyendo daño en el ADN, privación de nutrientes y activación de oncogenes, TP53 se estabiliza a nivel de proteína y actúa como factor de transcripción para regular la expresión de diferentes genes diana, provocando la detención del ciclo celular, senescencia, autofagia o apoptosis. La estabilización de TP53 también puede inducirse de manera artificial usando inhibidores micromoleculares tal como Nutlin 3, que bloquea la interacción entre TP53 y la ubicuitina ligasa de E3 MDM2. Para inactivar el gen que codifica este supresor tumoral, se diseñó un ODNmc (TP53-STOP) para introducir un codón de parada para remplazar Phe109, ubicado al inicio del dominio de unión a ADN y en dirección 3' a los dominios de transactivación y rico en prolina (datos no mostrados).
En paralelo, también se generó un ODNmc(p53-WT) de control que contenía solamente mutaciones sinónimas. Como se describe anteriormente para APC y células DLD-1, se realizó una generación de código de barras de CRISPR de TP53 en dos líneas cancerosas ampliamente usadas que presentan un gen TP53 de tipo silvestre, es decir, células cancerosas de mama MCF7 y de colon HCT-116, ambas de tipo silvestre para el gen TP53 (http://p53.iarc.fr/CellLines.aspx). El tratamiento con Nutlin 3 (datos no mostrados) aumentó significativamente la fracción de células MCF7 y HCT-116 que contenían el código de barras TP53-STOP, coherente con la pérdida de actividad TP53 en estas células, apoyando de este modo la aplicación de código de barras de CRISPR en modelos donde dos alelos contribuyen a la función de un gen particular.
A pesar de ejercer efectos similares o más fuertes que Nutlin 3 sobre la inducción de TP53 y la inhibición del crecimiento celular (datos no mostrados), el agente genotóxico doxorrubicina no afectaba a la proporción relativa de los dos códigos de barras, apoyando la noción de que TP53 no se requiere de manera estricta para la activación de puntos de control da daño de ADN (datos no mostrados).
Este experimento proporciona evidencias de que la generación de código de barras de endonucleasa, en particular código de barras de CRISPR, puede aplicarse a genes para los que ambos alelos pueden contribuir a un fenotipo celular; y opcionalmente para inactivar dichos genes.
3. Reparación de la mutación oncógena en células ALK-F1174L de neuroblastoma
La estrategia general para investigar las propiedades oncógenas de una supuesta mutación de ganancia de función implica la expresión exógena y potencialmente no fisiológica del gen mutante o la generación de modelos de inserción que requieren mucho tiempo. Para demostrar la idoneidad de la generación de código de barras de CRISPR como estrategia alternativa, se eligió la cinasa de linfoma anaplásico (ALK), una tirosina cinasa receptora (RTK) mutada en un 6-10 % de neuroblastomas. Como modelo, se usó la línea celular de neuroblastoma Kelly, que contiene una mutación F1174L heterocigótica en el dominio catalítico de este receptor (datos no mostrados).
Usando la misma estrategia descrita para APC y p53, se aplicó la tecnología de CRISPR/Cas9 para introducir tres códigos de barras distintos en el genoma de células Kelly:
(i) ALK-F1174F, para reparar la mutación oncógena;
(ii) ALK-F1174L, como control para el receptor mutado;
(iii) ALK-STOP, para generar una proteína truncada que carece de la mayor parte del dominio intracelular, incluyendo el dominio catalítico.
Como las células originales contienen un alelo de tipo silvestre y un alelo F1174L, la incorporación de cada código de barras puede producir cuatro posibles combinaciones: para tres de ellas, incluyendo el código de barras/indel más probable, la secuencia de ALK fenotípicamente dominante expresada en la célula se espera que sea la codificada por el código de barras (véase la figura 3). Después de la generación del código de barras de CRISPR de ALK, la fracción de células F1174L permaneció estable, mientras que los códigos de barras F1174F y STOP disminuyeron de manera similar a lo largo del tiempo. Se obtuvieron los mismos resultados usando un ARNgs distinto (datos no mostrados), lo que indica que la mutación F1174L es estrictamente necesaria para el efecto de ALK sobre el crecimiento de estas células.
Las mutaciones sinónimas que componen un código de barras de CRISPR pueden tener de manera concebible un impacto sobre la estabilidad del transcrito correspondiente. Aunque esto sería irrelevante para un código de barras STOP, diferencias en los niveles de expresión de un alelo particular causadas por dichas mutaciones podrían traducirse en efectos positivos falsos o negativos falsos en el fenotipo de las células.
Además, la fracción relativa de los diferentes códigos de barras en el ADNg en comparación con el ADNc extraído en paralelo de las mismas células no reveló efectos sustanciales sobre la expresión génica de un conjunto particular de mutaciones sinónimas (datos no mostrados).
Como control adicional, se intercambia las mutaciones sinónimas en los códigos de barras F1174F y F1174L. Coherente con los datos previos, los códigos de barras "intercambiados" confirmaron que las células que contenían el codón de tipo silvestre o de parada estaban sujetas a una desventaja de crecimiento similar (datos no mostrados), excluyendo, por tanto, una posible desviación debido a un efecto no garantizado de las mutaciones sinónimas sobre la estabilidad del ARNm.
Para demostrar adicionalmente la especificidad de nuestra estrategia, se ensayó si la inhibición de la actividad de la cinasa ALK podría alterar la proporción de los diferentes códigos de barras. Se investigaron los efectos de inhibir la actividad cinasa de este receptor, demostrando que las fracciones de células ALK-F1174F y ALK-STOP disminuían significativamente menos en presencia de una pequeña molécula, lo que indica que la presión selectiva que favorece la expresión de un receptor mutante se anula tras la inhibición de la actividad catalítica de ALK.
Este experimento proporciona evidencias de que la generación de código de barras de endonucleasa, en particular código de barras de CRISPR, puede aplicarse introduciendo múltiples códigos de barras en el mismo locus genómico de líneas de células cancerosas.
También proporciona evidencias de que el intercambio de mutaciones sinónimas (entre códigos de barras) puede usarse como condición adicional frente a los efectos no garantizados debidos a posibles variaciones en los niveles de expresión del gen de interés que podrían provocarse por dichas mutaciones sinónimas.
4. Resistencia a quimioterapia en células de cáncer pulmonar
Una limitación importante de los tratamientos dirigidos a cáncer es el desarrollo casi inevitable de una resistencia adquirida. Como ejemplo típico, gefitinib y erlotinib son inhibidores micromoleculares del receptor del factor de crecimiento epidérmico (EGFR) que se usan en clínica para el tratamiento de canceres pulmonares no microcíticos (NSCLC) avanzados que portan mutaciones activadoras de EGFR. Después de una respuesta inicial a estos inhibidores, los tumores invariablemente sufren recidiva, como resultado de la aparición de una subpoblación de células cancerosas resistentes. El mecanismo molecular más común responsable de la resistencia adquirida a los inhibidores de EGFR en NSCLC es la aparición de la mutación secundaria T790M en el dominio catalítico de este receptor.
Usando la misma estrategia descrita anteriormente, se introdujo un código de barras de control EGFR-T790M y EGFR-T790T en células PC9, una línea celular sensible a gefitinib/erlotinib derivada de NSCLC que porta una pequeña eliminación en el marco de lectura (p.E746_A750del) en el exón 19 de EGFR. A causa del control interno EGFR-T790T, la estrategia de código de barras de CRISPR permite especificidad sobre un amplio intervalo de concentraciones de inhibidor. De hecho, un enriquecimiento de células que contienen EGFR-T790M fue fácilmente detectable después de cuatro días de tratamiento con gefitinib a una concentración de 10 nM, mientras que se observó un efecto más fuerte a dosis mayores (datos no mostrados).
Por tanto, la estrategia de generación de código de barras de CRISPR permite especificidad sobre un amplio intervalo de concentraciones de inhibidor.
Las mutaciones puntuales del oncogén KRAS están entre las aberraciones genéticas más frecuentes en NSCLC. Extremadamente infrecuentes en tumores que contienen EGFR mutante, las mutaciones de KRAS representan un mecanismo típico de resistencia primaria a inhibidores de EGFR. Se usó la generación de código de barras de CRISPR para insertar la mutación G12D de KRAS en células PC9, que después se trataron en presencia o ausencia de gefitinib. El inhibidor de EGFR indujo un enriquecimiento significativo de células KRAS-G12D, lo que indica que la resistencia a gefitinib en células PC9 también puede conferirse por KRAS mutante.
A continuación, se investigaron los efectos de un inhibidor irreversible de EGFR de tercera generación diseñado para abordar selectivamente el receptor mutante T790M. Se muestra que la expansión de células que contienen el código de barras EGFR-T790M en presencia de gefitinib se anulaba por cotratamiento con este inhibidor, coherente con una especificidad de diana diferente de estas dos clases de inhibidores de EGFR. A la inversa, la fracción relativa de células KRAS-G12D se aumentó significativamente en presencia del inhibidor, lo que refleja una activación posterior de la señalización de EGFR en estas células.
EGFR puede estimular la migración celular y la invasión a través de activación directa de efectores posteriores, incluyendo Src y STAT5, o promoviendo la transición epitelial a mesenquimatosa. Los efectos abrumadores sobre la proliferación y supervivencia celular han impedido las investigaciones de la función de la señalización de EGFR en la capacidad de invasión de células de NSCLC. Como medio para superar la posible desviación debida a la inhibición del crecimiento celular, se usó la generación de código de barras de CRISPR para evaluar los efectos de gefitinib sobre la invasión de células PC9. Las células PC9 con código de barras de EGFR se pretrataron durante dos días con gefitinib, después se transfirieron a cámaras Boyden que contenían matrigel. Veinticuatro horas después, las células dentro y fuera de la cámara Boyden, es decir, en los lados de la membrana de policarbonato, es decir, se recogieron y se extrajo el ADNg (véase la figura 4).
Se muestra que el código de barras EGFR-T790M se enriquecía drásticamente en las células que migraban a través de la membrana recubierta con matrigel, en comparación con las que permanecían dentro de la cámara, lo que indica que la señalización de EGFR contribuye fuertemente a las propiedades invasivas de estas células cancerosas. Como control, la proporción de los dos códigos de barras de EGFR en cada compartimento permanecía constante en ausencia de tratamiento con gefitinib (datos no mostrados). Midiendo la proporción relativa de las células con código de barras en ambos lados de la cámara, nuestra estrategia permite un análisis específico y cuantitativo de la invasión celular, independientemente de cualquier posible efecto sobre la proliferación y supervivencia celular.
Este experimento proporciona evidencias de la aplicación práctica de generación de código de barras de endonucleasa, en particular código de barras de CRISPR, para evaluar la especificidad de fármacos, para cribar fármacos, para estudiar la invasión celular y sobre dianas distintas.
5. Generación de código de barras de CRISPR múltiple para estudios in vitro e in vivo
La identificación de reordenamientos cromosómicos que implican el gen ALK en una fracción significativa de NSCLC metastásicos ha dado lugar a la aprobación de inhibidores de ALK específicos para el tratamiento de este tipo de cáncer. El más frecuente de dichos reordenamientos corresponde a una inversión en el cromosoma 2, que provoca la expresión de una proteína de fusión constitutivamente activa, compuesta de la proteína de tipo 4 asociada a microtúbulos de equinodermo (EML4) y ALK. Recientemente, la inversión de EML4-ALK se ha reproducido artificialmente tanto en células cultivadas como en pulmones de ratón usando la tecnología de CRISPR/Cas9. Para ampliar las posibles aplicaciones de la generación de código de barras de CRISPR a este tipo de aberraciones genéticas, se indujo simultáneamente la escisión de los genes EML4 y ALK en células PC9 a través de la coexpresión de Cas9 y dos ARNgs distintos como se describe previamente.
Para aumentar la eficacia de la inversión cromosómica, las células se cotransfectaron con un ODNmc que abarca la secuencia de EML4-ALK reordenada (datos no mostrados). Se diseñaron cebadores de qPCR para reconocer específicamente el locus invertido, que aquí actúa como un tipo de código de barras genético para la expresión en células de la proteína EML4-ALK oncógena (datos no mostrados). El tratamiento con gefitinib indujo un enriquecimiento de células PC9 que contienen EML4-ALK, lo que indica que este reordenamiento cromosómico podría representar un nuevo mecanismo para resistencia adquirida a inhibidores de EGFR.
Como demostración preliminar, se cointrodujeron en el mismo cultivo de células PC9 las tres modificaciones descritas anteriormente, que pueden conferir resistencia a inhibición de EGFR, es decir, EGFR-T790M, KRAS-G12D y EML4-ALK. Coherente con los datos obtenidos con mutaciones individuales, el tratamiento con gefitinib de células PC9 con código de barras de CRISPR múltiple indujo un enriquecimiento específico de las secuencias EGFR-T790M, KRAS-G12D y EML4-ALK (figura 2). Se muestra que la resistencia a gefitinib inducida por EGFR-T790M y EML4-ALK se bloqueaba específicamente por cotratamiento con un inhibidor irreversible de EGFR o un inhibidor de ALK, mientras que estos compuestos no tenían efecto sobre la fracción de células que contenían el código de barras KRAS-G12D.
Basándose en una mezcla de subpoblaciones celulares marcadas genéticamente, la generación de código de barras de CRISPR puede adaptarse para combinaciones.
Este experimento proporciona evidencias de que la generación de código de barras de endonucleasa, en particular código de barras de CRISPR, puede implementarse fácilmente en una configuración múltiple, en que subpoblaciones celulares que contienen códigos de barras para las mismas o diferentes localizaciones genómicas pueden coexistir en la misma población en masa. Dicha estrategia es particularmente adecuada para, aunque sin limitación, cribado de fármacos.
Como los cribados de alto rendimiento necesitan niveles aumentados de automatización, se ideó una estrategia de lectura de qPCR diferente para la detección de códigos de barras. Se realiza PCR en presencia de distintas sondas TaqMan que son específicas para cada código de barras y contienen distintos tintes fluorescentes. Para impedir la amplificación de la secuencia natural más abundante, que podría dar lugar a agotamiento prematuro de los cebadores y otros componentes de PCR, la reacción también incluía un oligonucleótido de bloqueo resistente a la actividad 5' exonucleasa del ADN polimerasa y que no puede cebar la prolongación, que se diseñó específicamente para hibridar con la secuencia no modificada original. Para cada muestra de ADNg, la fluorescencia normalizada para cada tinte permite cuantificar en una sola reacción de PCR la fracción del mutante frente al código de barras de control. Se usó esta estrategia para investigar los efectos de diversos compuestos sobre la resistencia a gefitinib en células PC9 con código de barras EGFR-T790.
Este experimento proporciona evidencia de que PCR TaqMan múltiple puede usarse convenientemente para la detección de códigos de barras de endonucleasa, en particular códigos de barras de CRISPR, incluyendo aplicaciones de alto rendimiento (es decir, cribado de alto rendimiento).
Para ilustrar las posibles aplicaciones de nuestra estrategia en estudios in vivo, células PC9 con código de barras de CRISPR múltiple se inyectaron de manera subcutánea y bilateral en ratones inmunocomprometidos (datos no mostrados). Dieciséis días después de la inyección, cuando los tumores eran palpables, la mitad de los ratones se trató con gefitinib (25 mg/kg/día). Como se esperaba, el crecimiento de los tumores se detuvo inicialmente tras el tratamiento con gefitinib, pero finalmente se reanudó después de unas pocas semanas (datos no mostrados), lo que imita el patrón típicamente observado en clínica para pacientes con NSCLC tratados con este inhibidor. Cuando al menos uno de los dos tumores excedía el volumen arbitrario de 550 mm3, los ratones se sacrificaron y se obtuvo el ADNg de los tumores. La frecuencia de las tres mutaciones diferentes en las muestras de tumor se midió por qPCR y se normalizó a los niveles observados en el mismo lote de células antes de la inyección en los ratones. Se mostró que la proporción de las tres mutaciones se aumentaba fuertemente en los tumores de ratones tratados con gefitinib, aunque el enriquecimiento relativo era diferente en cada tumor.
6. Sondeo de la heterogeneidad intratumoral usando códigos de barras de CRISPR degenerados
El hecho de que tumores individuales contienen un determinado grado de heterogeneidad genética y/o genotípica, que variar sustancialmente de acuerdo con el tipo de tumor, puede tener repercusiones fundamentales en el tratamiento del cáncer. Se han usados diferentes estrategias para aislar y caracterizar funcionalmente subpoblaciones celulares particulares dentro de un tumor, incluyendo clasificación FACS, rastreo de linaje genético en ratones y marcaje vírico. Se razonó que la generación de código de barras de CRISPR podía adaptarse fácilmente para marcar células cancerosas individuales dentro de una población en masa usando un ODNmc que contenía diferentes nucleótidos degenerados. Como demostración preliminar, se abordó el locus AAVS1 en el cromosoma 19, un "puerto seguro" genómico ampliamente usado para inserción de transgenes, en células de cáncer de mama BT474, una línea celular que presenta alta eficacia de edición de ADN por CRISPR/Cas9 (datos no mostrados). Las células se transfectaron secuencialmente para generación de código de barras de CRISPR con dos ARNgs distintos (SEQ ID N°13-14), y un conjunto degenerado de ODNmc que contenían un sitio de restricción SalI (SEQ ID N°29) se usó para permitir la cuantificación por PCR de polimorfismos de longitud de fragmentos de restricción (RFLP) de la fracción de células que contenía un marcador genético (figura 6). Después de la generación de código de barras, parte de las células se inyectó de manera bilateral en la almohadilla de grasa de ratones inmunocomprometidos, mientras que el resto se mantuvo en cultivo. En diferentes puntos temporales, los ratones se sacrificaron y se obtuvo el ADNg tanto de los tumores como de las células en cultivo para análisis de secuenciación profunda de la complejidad de código de barras en las diferentes muestras (datos no mostrados).
Estos experimentos proporcionan evidencias de que la generación de código de barras de endonucleasa, en particular código de barras de CRISPR, puede aplicarse a estudios in vivo incluyendo, aunque sin limitación, marcaje de células cancerosas individuales dentro de una población en masa usando códigos de barras degenerados.
Datos bibliográficos
Doudna, J.A., y Charpentier, E. (2014). Genome editing. The new frontier of genome engineering with CRISPR-Cas9. Science 346, 1258096.
Hsu, P.D., Lander, E.S., y Zhang, F. (2014). Development and applications of CRISPR-Cas9 for genome engineering. Cell 157, 1262-1278.
Barrangou, R., y Marraffini, L.A. (2014). CRISPR-Cas systems: Prokaryotes upgrade to adaptive immunity. Molecular cell 54, 234-244.
Claims (15)
1. Un método para marcar células tratadas con endonucleasa, que comprende las etapas de:
a) proporcionar células o una composición que comprende células;
b) poner en contacto dichas células o dicha composición con:
- al menos una endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) adecuada para abordar una región genómica de interés en dichas células, o un vector adecuado para expresar dicha endonucleasa en dichas células;
- al menos un primer ácido nucleico adecuado para introducir, después de escisión específica de secuencia de la región genómica de interés por la endonucleasa, una o más mutaciones sinónimas portadas por el primer ácido nucleico en dicha región genómica por reparación dirigida por homología (HDR), y opcionalmente una o más mutaciones no sinónimas; y
- al menos un segundo ácido nucleico adecuado para introducir, después de escisión específica de secuencia de la región genómica de interés por la endonucleasa, una o más mutaciones sinónimas portadas por el segundo ácido nucleico en dicha región genómica por reparación dirigida por homología (HDR), pero distintas de las mutaciones sinónimas del primer ácido nucleico;
como control para efectos inespecíficos, marcando de ese modo células tratadas con endonucleasa.
2. El método de acuerdo con la reivindicación precedente, en el que el primer y/o segundo ácido nucleico es uno o más oligodesoxirribonucleótidos monocatenarios (ODNms).
3. Un método para detectar una población de células tratadas con endonucleasa, que comprende las etapas de: a) proporcionar al menos:
- una primera población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas) que comprende una o más mutaciones sinónimas introducidas en una región genómica de interés por reparación dirigida por homología (HDR), proporcionando de ese modo una primera característica distintiva; y
- una segunda población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas), que comprende una o más mutaciones sinónimas introducidas en la misma región genómica de interés por HDR, en la que dicha una o más mutaciones sinónimas son distintas de la una o más mutaciones sinónimas de la primera población, proporcionando de ese modo una segunda característica distintiva;
b) determinar dicha primera y segunda característica distintiva; y
c) comparar dicha primera y segunda característica distintiva, detectando de ese modo dicha primera población de células tratadas con endonucleasa.
4. El método de acuerdo con la reivindicación precedente, en el que la etapa b) se consigue amplificando dicha región genómica de interés.
5. Uso de una composición para detectar una población de células tratadas con endonucleasa, estando dicha composición caracterizada por que comprende al menos:
(i) una primera población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas), que comprende una o más mutaciones sinónimas en una región genómica de interés de dichas células; y
(ii) una segunda población de células tratadas con endonucleasa de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas), que comprende una o más mutaciones sinónimas en dicha región genómica, pero distintas de las mutaciones sinónimas de la primera población, en la que la una o más mutaciones sinónimas se introducen en dichas células por reparación dirigida por homología (HDR) después de tratamiento con una misma endonucleasa dirigida a dicha región genómica de interés.
6. El uso de acuerdo con la reivindicación precedente, en el que dicha primera y segunda población de células tratadas con endonucleasa se obtienen después de poner en contacto las células con
(i) al menos una endonucleasa adecuada para abordar una región genómica de interés en dichas células, o un vector adecuado para expresar dicha endonucleasa; y
(ii) al menos un ácido nucleico adecuado para introducir dicha una o más mutaciones sinónimas en dicha región genómica de interés por HDR.
7. El uso de acuerdo con la reivindicación 5 o 6, en el que dicha primera y/o segunda población comprende además una o más mutaciones sinónimas en dicha región genómica de interés.
8. El uso de acuerdo con una cualquiera de las reivindicaciones 5 a 7, en el que:
(i) dicha primera población comprende mutaciones no sinónimas, pero no la segunda población; o
(ii) dicha primera y segunda población comprenden ambas una o más mutaciones no sinónimas, siendo dicha una o más mutaciones no sinónimas iguales o diferentes, y preferiblemente diferentes.
9. Uso de un kit para detectar una población de células tratadas con endonucleasa, comprendiendo dicho kit:
- una primera parte que comprende una primera población de células tratadas con endonucleasa como se define en la reivindicación 5; y
- una segunda parte que comprende una segunda población de células tratadas con endonucleasa como se define en la reivindicación 5.
10. Un kit para marcar células tratadas con el sistema de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociado a CRISPR (Cas) (CRISPR-Cas), que comprende:
(i) una primera parte que comprende al menos un sistema de CRISPR-Cas que comprende:
a) un primer elemento regulador funcional en una célula unido de manera funcional a al menos una secuencia de nucleótidos que codifica un ARN de guía del sistema de CRISPR-Cas que hibrida con una región genómica diana de interés de dicha célula, y
b) un segundo elemento regulador funcional en dicha célula unido de manera funcional a una secuencia de nucleótidos que codifica una endonucleasa Cas, en el que los componentes (a) y (b) están ubicados en el mismo vector o diferentes vectores del sistema;
(ii) una segunda parte que comprende al menos un ácido nucleico adecuado para introducir una o más mutaciones sinónimas en la región genómica de interés de dicha célula por reparación dirigida por homología (HDR), y opcionalmente una o más mutaciones no sinónimas en dicha región genómica de interés.
11. El kit de acuerdo con la reivindicación 10, que comprende:
(ii) al menos un primer ácido nucleico adecuado para introducir una o más mutaciones sinónimas en dicha región genómica de interés por reparación dirigida por homología (HDR), y opcionalmente una o más mutaciones no sinónimas; y
(iii) al menos un segundo ácido nucleico adecuado para introducir una o más mutaciones sinónimas en dicha región genómica de interés por reparación dirigida por homología (HDR), pero distintas de las mutaciones sinónimas del primer ácido nucleico.
12. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 4, o el uso de acuerdo con una cualquiera de las reivindicaciones 5 a 9, o el kit de acuerdo con una cualquiera de las reivindicaciones 10 u 11; en el que la endonucleasa es una endonucleasa de tipo II de grupos de repeticiones palindrómicas cortas en intervalos regulares (CRISPR)-asociada a CRISPR (Cas) (CRISPR-Cas).
13. El método, composición o kit de acuerdo con la reivindicación precedente, en el que la endonucleasa es una endonucleasa Cas9 de tipo II.
14. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 4 y 12 o 13, o el uso de acuerdo con una cualquiera de las reivindicaciones 5 a 9 y 12 o 13, o el kit de acuerdo con una cualquiera de las reivindicaciones 10 a 13; en el que dicha una o más mutaciones sinónimas están dentro de un marco abierto de lectura (ORF) o exón de un gen que codifica una proteína de interés.
15. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 4 y 12 a 14, o el uso de acuerdo con una cualquiera de las reivindicaciones 5 a 9 y 12 a 14, o el kit de acuerdo con una cualquiera de las reivindicaciones 10 a 14; en el que dicha una o más células son una o más células eucariotas.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15306698 | 2015-10-22 | ||
PCT/EP2016/075370 WO2017068120A1 (en) | 2015-10-22 | 2016-10-21 | Endonuclease-barcoding |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2840648T3 true ES2840648T3 (es) | 2021-07-07 |
Family
ID=54396800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES16785144T Active ES2840648T3 (es) | 2015-10-22 | 2016-10-21 | Generación de código de barras de endonucleasa |
Country Status (4)
Country | Link |
---|---|
US (2) | US11371040B2 (es) |
EP (1) | EP3365461B1 (es) |
ES (1) | ES2840648T3 (es) |
WO (1) | WO2017068120A1 (es) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4063503A1 (en) | 2014-02-11 | 2022-09-28 | The Regents of the University of Colorado, a body corporate | Crispr enabled multiplexed genome engineering |
JP2019518478A (ja) | 2016-06-24 | 2019-07-04 | ザ リージェンツ オブ ザ ユニバーシティ オブ コロラド,ア ボディー コーポレイトTHE REGENTS OF THE UNIVERSITY OF COLORADO,a body corporate | バーコードを付けたコンビナトリアルライブラリーを生成する方法 |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US10011849B1 (en) | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
CN113403342A (zh) * | 2019-03-26 | 2021-09-17 | 珠海舒桐医疗科技有限公司 | 一种单碱基突变方法及采用的系统 |
WO2020210225A1 (en) * | 2019-04-12 | 2020-10-15 | Chan Zuckerberg Biohub, Inc. | Barcoded clonal tracking of gene targeting in cells |
CN112322587A (zh) * | 2020-09-17 | 2021-02-05 | 杭州市第一人民医院 | 一种带Cas9基因的人源可诱导多能干细胞系、构建方法、鉴定方法及应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK2800811T3 (en) | 2012-05-25 | 2017-07-17 | Univ Vienna | METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION |
US8697359B1 (en) * | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
WO2015065964A1 (en) * | 2013-10-28 | 2015-05-07 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof |
EP4063503A1 (en) | 2014-02-11 | 2022-09-28 | The Regents of the University of Colorado, a body corporate | Crispr enabled multiplexed genome engineering |
WO2015138855A1 (en) | 2014-03-14 | 2015-09-17 | The Regents Of The University Of California | Vectors and methods for fungal genome engineering by crispr-cas9 |
-
2016
- 2016-10-21 ES ES16785144T patent/ES2840648T3/es active Active
- 2016-10-21 WO PCT/EP2016/075370 patent/WO2017068120A1/en active Application Filing
- 2016-10-21 US US15/769,585 patent/US11371040B2/en active Active
- 2016-10-21 EP EP16785144.3A patent/EP3365461B1/en active Active
-
2022
- 2022-05-25 US US17/824,063 patent/US20220307012A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220307012A1 (en) | 2022-09-29 |
EP3365461A1 (en) | 2018-08-29 |
US20180312831A1 (en) | 2018-11-01 |
EP3365461B1 (en) | 2020-10-14 |
US11371040B2 (en) | 2022-06-28 |
WO2017068120A1 (en) | 2017-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2840648T3 (es) | Generación de código de barras de endonucleasa | |
US20230091847A1 (en) | Compositions and methods for improving homogeneity of dna generated using a crispr/cas9 cleavage system | |
Belancio et al. | All y’all need to know ‘bout retroelements in cancer | |
Steinkraus et al. | Tiny giants of gene regulation: experimental strategies for microRNA functional studies | |
Valdmanis et al. | Upregulation of the microRNA cluster at the Dlk1-Dio3 locus in lung adenocarcinoma | |
EP3568470B1 (en) | Methods for in vitro site-directed mutagenesis using gene editing technologies | |
CN104685055A (zh) | 对单核苷酸KRAS突变特异的双功能短发夹RNA(bi-shRNA) | |
Wang et al. | CRISPR-Cas9 HDR system enhances AQP1 gene expression | |
Frisbie | Neurofibromin 2 (NF2) Is Necessary for Efficient Silencing of LINE-1 Retrotransposition Events in Human Embryonic Carcinoma Cells | |
Fei et al. | Wild-type Splicing Factor U2AF1 inhibits splicing associated with a recurrent U2AF1 mutant in human lung cancers and is required for cell survival | |
US11357853B2 (en) | Inhibition of a lncRNA for treatment of neuroblastoma | |
Rahbari et al. | LINE-1 retrotransposons and their role in cancer | |
Lenko | Functional Characterization of Germline Smg1 Mutations Associated With Pancreatic Ductal Adenocarcinoma | |
Banerjee | Gene specific DNA methylation editing to investigate gene regulation in melanoma cell lines | |
Raouf | G-quadruplexes: Kinetic stability and effects on the c-KIT promoter | |
Jarvis | Delineating the APOBEC3 enzymes responsible for the APOBEC mutation signature in cancer | |
Ravegnini et al. | GENETIC INSTABILITY IN CANCERGLORIA RAVEGNINI, PATRIZIA HRELIA, AND SABRINA ANGELINI | |
Filkowski | The role of epigenetic changes in chemoresistant breast cancer cells | |
Pons | Retrotransposition in colorectal cancer | |
Borecká | Role of genetic factors responsible for development of pancreatic cancer | |
Winkler | Elucidating the Molecular Mechanism of Cis-Regulation by the Long Noncoding RNA LincRNA-p21 | |
Jung | Identifying and characterizing functionally relevant microRNAs and 5’isomiRs in triple-negative breast cancer | |
Barraco et al. | LncRNA H19, HOTAIR AND MALAT1 as molecular biomarkers in GIST | |
WO2024044304A1 (en) | Crispr-cas9 as a selective and specific cell killing tool | |
Grisard | BTBD7, a gene identified with a transposon based forward genetic screening, is important for colorectal cancer metastasis |