ES2905181T3 - Deleción precisa de secuencias cromosómicas in vivo - Google Patents

Deleción precisa de secuencias cromosómicas in vivo Download PDF

Info

Publication number
ES2905181T3
ES2905181T3 ES16789905T ES16789905T ES2905181T3 ES 2905181 T3 ES2905181 T3 ES 2905181T3 ES 16789905 T ES16789905 T ES 16789905T ES 16789905 T ES16789905 T ES 16789905T ES 2905181 T3 ES2905181 T3 ES 2905181T3
Authority
ES
Spain
Prior art keywords
seq
meganuclease
fxn
repeat
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16789905T
Other languages
English (en)
Inventor
James Smith
Victor Bartsevich
Derek Jantz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Precision Biosciences Inc
Original Assignee
Precision Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Precision Biosciences Inc filed Critical Precision Biosciences Inc
Application granted granted Critical
Publication of ES2905181T3 publication Critical patent/ES2905181T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

Una composición para su uso en el tratamiento de un sujeto que tiene un trastorno de expansión de repetición de nucleótidos, en el que dicho trastorno de expansión de repetición de nucleótidos se caracteriza por la expansión de una repetición de nucleótidos en un gen de interés, comprendiendo dicha composición : al menos primer ácido nucleico que codifica una primera nucleasa diseñada y un segundo ácido nucleico que codifica una segunda nucleasa diseñada, en la que dicha primera nucleasa diseñada y dicha segunda nucleasa diseñada son expresables en células diana in vivo; en la que dicha primera nucleasa diseñada reconoce y escinde una primera secuencia de reconocimiento situada 5' corriente arriba de dicha repetición de nucleótidos en dicho gen de interés; y en la que dicha segunda nucleasa diseñada reconoce y escinde una segunda secuencia de reconocimiento situada 3' corriente abajo de dicha repetición de nucleótidos en dicho gen de interés; y en la que un fragmento de ADN intermedio entre dicha primera secuencia de reconocimiento y dicha segunda secuencia de reconocimiento se extirpa y el número de dicha repetición de nucleótidos se reduce en dicho gen de interés; y en la que dicha primera nucleasa diseñada y dicha segunda nucleasa diseñada generan salientes complementarios que promueven la nueva ligación directa de dicho gen de interés.

Description

DESCRIPCIÓN
Deleción precisa de secuencias cromosómicas in vivo
CAMPO DE LA INVENCIÓN
La invención se relaciona con el campo de la biología molecular y la tecnología de ácidos nucleicos recombinantes. En particular, la invención se refiere a composiciones para su uso en un procedimiento de tratamiento de un paciente con un trastorno de expansión de repetición de nucleótidos que comprende la eliminación de la región de repetición de nucleótidos utilizando nucleasas diseñadas.
ANTECEDENTES DE LA INVENCIÓN
Los trastornos de expansión de repetición de nucleótidos, que también se conocen como "trastornos de repetición de nucleótidos" o "trastornos de reiteración de codones", son una clase de enfermedades genéticas causadas por un exceso de repeticiones de nucleótidos en el genoma. Las repeticiones de nucleótidos son comunes en el genoma humano y normalmente no se asocian con enfermedades. Sin embargo, en algunos casos, el número de repeticiones se expande más allá de un umbral estable y puede conducir a la enfermedad, con la gravedad de los síntomas generalmente correlacionados con el número de repeticiones.
Los trastornos por expansión de repeticiones de nucleótidos pueden clasificarse generalmente como "poliglutamínicos" o "no poliglutamínicos". Los trastornos poliglutamínicos, incluyendo la enfermedad de Huntington (EH) y varias ataxias espinocerebelosas, están causados por una repetición CAG (glutamina) en las regiones que codifican las proteínas de genes específicos. Los trastornos no poliglutamínicos son más heterogéneos y pueden estar causados por expansiones de repeticiones de trinucleótidos CAG en regiones no codificantes, tal como en la distrofia miotónica, o por la expansión de repeticiones de trinucleótidos distintas de CAG que pueden estar en regiones codificantes o no codificantes, tal como la expansión de repeticiones CGG responsable del Síndrome X Frágil. Aunque muchos trastornos de expansión de repeticiones de nucleótidos implican repeticiones de trinucleótidos, algunos trastornos se caracterizan por repeticiones de diferentes longitudes. Por ejemplo, la distrofia miotónica Tipo II (DM2) está causada por una expansión de repetición de tetranucleótidos CCTG en el intrón 1 del gen ZNF9 del cromosoma 3. La esclerosis lateral amiotrófica (ELA) y la demencia frontotemporal (DFT) están fuertemente asociadas a una expansión de la repetición hexanucleotídica de GGGGCC en el primer intrón del gen C9ORF72 (entre los exones 1a y 1b) situado en el cromosoma 9p21. Los trastornos de expansión de repetición de nucleótidos más comunes se resumen en la Tabla 1.
T l 1. Tr rn r Ex n i n R i i n N l i m n
Figure imgf000002_0001
(continuación)
Figure imgf000003_0001
Los trastornos por expansión de repeticiones de nucleótidos son dinámicos en el sentido de que el número de repeticiones puede variar de una generación a otra o incluso de una célula a otra en el mismo individuo. Se cree que la expansión de las repeticiones está causada por el "deslizamiento" de la polimerasa durante la replicación del a Dn . Las repeticiones en tándem de la secuencia de ADN pueden "salirse" manteniendo el emparejamiento de bases complementarias entre la cadena madre y las cadenas hijas. Si la estructura de bucle se forma a partir de la cadena hija, el número de repeticiones aumentará. Por el contrario, si la estructura de bucle se forma a partir de la cadena madre, el número de repeticiones disminuirá. Parece que la expansión es más común que la reducción. En general, cuanto más grande es la expansión, más probable es que cause la enfermedad o que aumente la gravedad de la misma. Por lo tanto, los trastornos por expansión de repeticiones de nucleótidos están sujetos a la "anticipación", lo que significa que la gravedad de los síntomas y/o la edad de aparición empeoran a través de las sucesivas generaciones de familias afectadas debido a la expansión de estas repeticiones de una generación a otra.
Síndrome del cromosoma X Frágil. El síndrome del cromosoma X frágil, también conocido como síndrome de Martin-Bell o síndrome de Escalante, es un trastorno genético resultante de una expansión de la repetición de trinucleótidos CGG en el gen FMR1 del cromosoma X. Da lugar a una variedad de discapacidades intelectuales que van de leves a graves, así como a características físicas como una cara alargada, orejas grandes o protuberantes y testículos grandes (macroorquidismo), y a características de comportamiento como movimientos estereotipados (por ejemplo, batir las manos) y ansiedad social. Casi la mitad de los niños con síndrome del cromosoma X frágil cumplen los criterios para el diagnóstico de autismo. La repetición de trinucleótidos CGG expandida responsable del síndrome del cromosoma X frágil se encuentra en la región no traducida (UTR) 5' del gen FMR1, que codifica la proteína del retraso mental del cromosoma X frágil (FMRP), necesaria para el desarrollo neuronal normal. En los individuos no afectados, el gen FMR1 tiene 6-53 repeticiones del codón CGG, siendo lo más habitual 29 o 30 repeticiones (Santoro et al. (2012), Annu. Rev. Pathol. Mech. Dis. 7:219-45). Los alelos con 54-200 repeticiones no suelen ser sintomáticos, pero se consideran indicativos de una predisposición familiar a la enfermedad. Los individuos afectados por el síndrome del cromosoma X frágil suelen tener más de 200 repeticiones del codón CGG, lo que provoca la metilación del promotor del FMR1, el silenciamiento del gen y la incapacidad de producir la proteína FMR1. La FMR1 es una proteína de unión al ARNm que se expresa en gran medida en el cerebro y los testículos. Se cree que es responsable del transporte de ciertos ARNm desde el núcleo hasta las sinapsis neuronales. En ausencia de la proteína FMR1, las sinapsis no se forman adecuadamente, lo que provoca una disminución de la capacidad cognitiva y un deterioro del desarrollo. La incidencia del síndrome del cromosoma X frágil es de aproximadamente 1 de cada 3.600 varones y 1 de cada 4.000­ 6.000 mujeres, siendo aproximadamente 98 % de los casos atribuibles a una repetición de trinucleótidos CGG expandida en el 5'UTR y el resto debido a mutaciones en el propio gen FMR1.
Enfermedad de Huntington. La enfermedad de Huntington (EH) es un trastorno neurodegenerativo causado por la expansión de una repetición de trinucleótidos CAG en el gen de la Huntingtina (HTT). Los síntomas de la enfermedad varían según los individuos, pero suelen implicar un declive gradual de la función neuromuscular. Los síntomas pueden comenzar a cualquier edad, pero lo más frecuente es que empiecen entre los 35 y los 44 años. Se ha observado que los síntomas suelen empezar antes en la vida con las sucesivas generaciones debido al aumento del número de repeticiones de trinucleótidos de una generación a otra. Los primeros síntomas suelen ser problemas sutiles con el estado de ánimo, la cognición y/o la coordinación muscular. A medida que la enfermedad avanza, los movimientos corporales descoordinados se hacen más evidentes, junto con una disminución de las capacidades mentales y síntomas de comportamiento errático. Las capacidades físicas empeoran gradualmente hasta que el movimiento se vuelve difícil y los pacientes comienzan a mostrar demencia. Las complicaciones tales como la neumonía, las enfermedades cardíacas y las lesiones físicas reducen la esperanza de vida a unos veinte años desde el momento en que comienzan los síntomas. Aproximadamente 6 % de los casos comienzan antes de los 21 años con un síndrome acinético-rígido. La variante de progresión rápida se clasifica como EH juvenil, acinética-rígida o variante Westphal.
El gen HTT está situado en el brazo corto del cromosoma 4. La región N-terminal de la proteína HTT contiene un tracto de aminoácidos de glutamina (Q) codificado por el trinucleótido CAG. Los individuos no afectados tienen 6-35 repeticiones del trinucleótido, mientras que los individuos afectados suelen tener > 35 repeticiones, y un mayor número de repeticiones se asocia con una mayor gravedad y un inicio más temprano de la enfermedad. La proteína HTT se expresa en los niveles más altos en las neuronas y los testículos. Se desconoce la función exacta de la proteína, así como el mecanismo por el que la repetición de trinucleótidos CAG afecta a la función y puede causar enfermedades. La forma mutante (ampliada) del gen actúa de forma dominante. Por lo tanto, los síntomas no se atribuyen a la producción de una cantidad insuficiente de la proteína HTT sino, más bien, a la presencia de una forma tóxica de la proteína con un tracto de poliglutamina expandido (Walker (2007), Lancet 369:218-28). Los primeros efectos de la EH incluyen la pérdida significativa de neuronas en los ganglios basales. Otras zonas del cerebro afectadas son la sustancia negra, las capas 3, 5 y 6 de la corteza cerebral, el hipocampo, las células de Purkinje en el cerebelo, los núcleos tubulares laterales del hipotálamo y partes del tálamo, todas las cuales presentan reducciones de tamaño debido a la pérdida de neuronas. Las neuronas espinosas estriatales parecen ser las más susceptibles a la EH, especialmente las que tienen proyecciones hacia el globo pálido externo.
Ataxia de Friedreich. La ataxia de Friedreich (AF) es una enfermedad hereditaria autosómica recesiva que resulta de la expansión de una repetición intrónica de trinucleótidos GAA en el gen de la frataxina(FXN). La enfermedad se presenta inicialmente como una mala coordinación, pero provoca daños progresivos en el sistema nervioso hasta que el paciente necesita una silla de ruedas para moverse. La FA afecta al control motor pero no afecta a la cognición. Su incidencia en la población general es de aproximadamente 1 por cada 50.000.
El trastorno está causado por una expansión de repetición de trinucleótidos GAA en el gen FXN que codifica la proteína mitocondrial frataxina. La frataxina es una proteína que se une al hierro y se encarga de formar grupos de hierro y azufre. La deficiencia de frataxina provoca que no se produzcan varias proteínas que contienen grupos de hierro y azufre que participan en el transporte de electrones en la mitocondria, así como la acumulación de niveles tóxicos de hierro. El daño celular asociado a la patología se produce principalmente en la médula espinal y los nervios periféricos. Esto incluye la esclerosis y la degeneración del ganglio de la raíz dorsal, los tractos espinocerebelosos, los tractos corticoespinales laterales y las columnas posteriores (Marmolino (2011), Brain Research Reviews 67:311-330).
El gen FXN está localizado en el cromosoma 9. La repetición de trinucleótidos GAA asociada a la FA se encuentra en el primer intrón del gen. Los individuos no afectados suelen tener entre 7 y 34 copias de la repetición, mientras que los afectados suelen > 100 copias. Debido a que la repetición no se encuentra en la secuencia codificante, no afecta a la secuencia de aminoácidos de la proteína. Más bien, un elevado número de repeticiones da lugar al silenciamiento de los genes mediante la formación de heterocromatina (Delatyckik et al. (2000), J. Med. Genet. 37:1-8). Esto reduce el nivel de expresión del gen FXN y el grado de silenciamiento del gen aumenta con el número de repeticiones GAA.
Distrofia miotónica. La distrofia miotónica (DM) es una forma de distrofia muscular autosómica dominante. Se caracteriza por el desgaste de los músculos, cataratas, defectos de conducción del corazón, cambios endocrinos y miotonía. Hay dos tipos principales de DM Tipo 1 (DM1), que también se llama enfermedad de Steinert, tiene una forma congénita grave y una forma de inicio en la edad adulta. El Tipo 2 (DM2), también llamado miopatía miotónica proximal, es más raro que la DM1 y generalmente se manifiesta con signos y síntomas más leves. Ambas formas de la enfermedad pueden presentarse en pacientes de cualquier edad.
La DM1 está causada por una expansión de repetición de trinucleótidos CAG en la UTR 3' del gen DMPK que codifica la proteína quinasa de la distrofia miotónica. Se desconoce la función celular exacta de la proteína, pero se expresa en los tejidos musculares, cardíacos y cerebrales. Debido a que la expansión de la repetición de trinucleótidos CAG se encuentra en una porción no codificante del gen, no afecta a la secuencia de aminoácidos de la proteína. Más bien, la repetición expandida en la porción no traducida del ARNm parece causar que el ARNm de la DMPK y las proteínas de unión/procesamiento del ARNm se agreguen en el núcleo de la célula, lo que lleva a la disfunción y muerte celular. No se sabe si la citotoxicidad es atribuible directamente a la agregación del ARNm o si, más probablemente, los transcritos DMPK agregados secuestran los factores de empalme del ARNm, lo que provoca el empalme erróneo de otros ARNpre-m. Alternativamente, o además, la expansión de la repetición CAG en el gen DMPK puede alterar la expresión de los genes vecinos. La DMPK se encuentra en una región rica en genes del cromosoma 19.
La DM2 está causada por una expansión de repetición de tetranucleótidos CCTG en el Intrón 1 del gen ZNF9 en el Cromosoma 3. La DM2 es un trastorno de expansión de repeticiones de tetranucleótidos. ZNF9 codifica la proteína de dedos de zinc-9, una proteína de unión al ARN que participa en la regulación de varios genes relacionados con la homeostasis del colesterol. La expansión de la repetición ZNF9 se encuentra en una región no codificante que no cambia la secuencia de aminoácidos de la proteína. Al igual que la DM1, la patogénesis de la DM2 se atribuye generalmente a la agregación del ARNm, que se cree que secuestra los factores de empalme necesarios para la función celular normal.
Esclerosis Lateral Am iotrófica y Demencia Frontotemporal. La aparición de la esclerosis lateral amiotrófica (ELA) y la demencia frontotemporal (DFT) está fuertemente asociada a una expansión de repetición de hexanucleótidos GGGGCC en el primer intrón del gen C9ORF72 (entre los exones 1a y 1b) situado en el cromosoma 9p21. La función de la proteína codificada por C9ORF72 es ampliamente desconocida, pero se ha predicho que funciona como un factor de intercambio de nucleótidos de guanina para pequeñas GTPasas. Los individuos no afectados suelen tener hasta 30 repeticiones de hexanucleótidos en C9ORF72, mientras que los individuos afectados pueden tener cientos de repeticiones. Aunque la expansión de la repetición está presente en una porción no codificante del gen, la mutación interfiere con la expresión normal de la proteína fabricada por C9ORF72 y puede dar lugar a la formación de focos de ARN nucleasa.
El uso de meganucleasas diseñadas para el tratamiento de los trastornos por expansión de repeticiones de nucleótidos fue divulgado previamente en el documento WO 2004/067753. En esa publicación, los autores divulgan la posibilidad de utilizar una meganucleasa diseñada para dirigir una rotura de doble cadena de ADN a una repetición de trinucleótidos de manera que promueva la recombinación homóloga entre los dos cromosomas (recombinación intercromosómica) o entre repeticiones individuales en el mismo cromosoma (recombinación intracromosómica). Este último enfoque, que consiste en dirigir una rotura de ADN a la propia repetición (o inmediatamente adyacente a la misma) de manera que los trinucleótidos individuales se recombinan entre sí para reducir efectivamente el número de repeticiones, se ha demostrado en sistemas experimentales utilizando nucleasas de dedos de zinc y TALEN (Richard (2015), Trends Genet. 31(4): 177-86). Estos procedimientos previamente divulgados implican una única rotura de ADN inducida por una única endonucleasa y requieren una recombinación homóloga para corregir el trastorno. Como la recombinación homóloga no es el mecanismo dominante de reparación de roturas de ADN en muchos tipos de células, los procedimientos divulgados anteriormente son extremadamente ineficaces y, por lo tanto, es poco probable que tengan un beneficio clínico significativo porque el gen no se "corrige" en suficientes células. Yanjie et al. (Mol. Ther.
2015, 23(6): El documento 1055-1065 divulga el tratamiento de los trastornos por expansión de repeticiones de nucleótidos mediante la escisión de secuencias repetidas. El documento US 2013/117869 A1 divulga la deleción de regiones genéticas no deseadas mediante la escisión con meganucleasas. Por lo tanto, sigue siendo necesario encontrar procedimientos para tratar los trastornos por expansión de repeticiones de nucleótidos que no requieran recombinación homóloga.
SUMARIO DE LA INVENCIÓN
La invención está definida por las reivindicaciones adjuntas.
La presente invención depende, en parte, del reconocimiento y la aplicación del hecho de que las roturas de doble cadena en dos loci en los cromosomas de mamíferos pueden promover eficazmente la reparación del cromosoma con la consiguiente deleción de la secuencia intermedia. El mecanismo es distinto del utilizado en los procedimientos del estado de la técnica, en los que se ha utilizado una única rotura de doble cadena junto con el suministro de una secuencia donante que carece de la deleción deseada, de manera que la reparación del ADN mediada por la recombinación homóloga entre el cromosoma escindido y la secuencia donante daría lugar a la deleción de la secuencia deseada en el cromosoma. Además, la presente invención depende, en parte, del reconocimiento y la aplicación del hecho de que la generación de dos roturas de doble cadena con salientes 3' complementarios puede dar lugar a un porcentaje relativamente alto de deleciones precisas de las secuencias intermedias, aparentemente independientes de la recombinación homóloga con un cromosoma hermano o una secuencia donante, sin degradación por exonucleasas de los salientes, y evitando mecanismos tales como la unión de extremos no homólogos.
Así, la presente invención proporciona composiciones para su uso en tratamientos de trastornos de expansión de repetición de nucleótidos en los que la región del cromosoma que comprende la expansión de repetición causante de la enfermedad se extirpa del genoma utilizando un par de endonucleasas específicas del sitio. Hemos demostrado que las secuencias de ADN genómico, incluyendo las secuencias de expansión de trinucleótidos, hexanucleótidos y tetranucleótidos, pueden eliminarse del genoma introduciendo un par de endonucleasas diseñadas que reconocen y cortan los sitios de ADN que flanquean la secuencia de interés. El fragmento de un cromosoma situado entre ese par de rupturas de ADN dirigidas se pierde del genoma, lo que da lugar a la eliminación de la secuencia causante de la enfermedad. La célula resultante, y su progenie, tendrán un fenotipo normal debido a la eliminación de la repetición expandida.
La invención puede utilizar endonucleasas de corte raro específicas para el sitio que están diseñadas para reconocer secuencias de ADN en el locus de interés. Los procedimientos para producir endonucleasas diseñadas específicas para cada sitio son conocidos en la técnica. Por ejemplo, las nucleasas de dedos de zinc (ZFN) pueden ser diseñadas para reconocer y cortar sitios predeterminados en un genoma. Las ZFN son proteínas quiméricas que comprenden un dominio de unión al ADN de dedo de zinc fusionado con el dominio nucleasa de la enzima de restricción FokI. El dominio del dedo de zinc se puede rediseñar a través de medios racionales o experimentales para producir una proteína que se une a una secuencia de ADN predeterminada de ~18 pares de bases de longitud. Al fusionar este dominio proteico diseñado con la nucleasa FokI, es posible dirigir las roturas de ADN con especificidad a nivel del genoma. Los ZFN se han utilizado ampliamente para dirigir la adición, eliminación y sustitución de genes en una amplia gama de organismos eucariotas (revisado en Durai et al. (2005), Nucleic Acids Res. 33, 5978). Asimismo, se pueden generar nucleasas efectoras TAL (TALEN) para escindir sitios específicos en el ADN genómico. Al igual que un ZFN, un TALEN está compuesto por un dominio de unión al ADN específico del sitio, diseñado, fusionado con el dominio de la nucleasa FokI (revisado en Mak et al. (2013), Curr. Opinen. Construir. Biol. 23:93-9). En este caso, sin embargo, el dominio de unión al ADN comprende un conjunto en tándem de dominios efectores TAL, cada uno de los cuales reconoce específicamente un único par de bases de ADN. Una limitación que tienen los ZFN y los TALEN para la práctica de la presente invención es que son heterodiméricos, de modo que la producción de una única nucleasa funcional en una célula requiere la coexpresión de dos monómeros de proteínas. Como la invención actual requiere dos nucleasas, una para cortar a cada lado de la repetición de nucleótidos, esto requeriría la coexpresión de cuatro monómeros ZFN o TALEN en la misma célula. Esto supone un reto importante en el suministro de genes, ya que los vectores tradicionales de suministro de genes tienen una capacidad de carga limitada. También introduce la posibilidad de una "dimerización errónea" en la que los monómeros se asocian de forma inapropiada para formar especies de endonucleasas diméricas no deseadas que podrían reconocer y cortar lugares fuera del objetivo en el genoma. Esto puede, potencialmente, minimizarse generando heterodímeros obligatorios ortogonales en los que los dominios de la nucleasa FokI de los cuatro monómeros se diseñan diferencialmente para dimerizar preferentemente con el monómero asociado previsto.
Las TALEN compactas son una arquitectura de endonucleasas alternativa que evita la necesidad de dimerización (Beurdeley et al. (2013), Nat. Commun. 4:1762). Una TALEN compacta comprende un dominio de unión al ADN del efector TAL específico del lugar, diseñado, fusionado con el dominio de la nucleasa de la endonucleasa de localización I-TevI. A diferencia de FokI, I-TevI no necesita dimerizarse para producir una rotura de doble cadena de ADN, por lo que una TALEN compacta es funcional como monómero. Así, es posible coexpresar dos TALEN compactas en la misma célula para practicar la presente invención.
Las endonucleasas diseñadas con base en el sistema CRISPR/Cas9 también se conocen en la técnica (Ran et al. (2013), Nat. Protoc. 8:2281-2308; Mali et al. (2013), Nat. Methods 10:957-63). Una endonucleasa CRISPR consiste en dos componentes: (1) una nucleasa efectora de caspasas, típicamente la Cas9 microbiana; y (2) un "ARN guía" corto que comprende una secuencia de orientación de -20 nucleótidos que dirige la nucleasa a un lugar de interés en el genoma. Al expresar varios ARN guía en la misma célula, cada uno de ellos con una secuencia de orientación diferente, es posible dirigir las roturas de ADN simultáneamente a múltiples lugares del genoma. Así, las nucleasas CRISPR/Cas9 son adecuadas para la presente invención. El principal inconveniente del sistema CRISPR/Cas9 es su alta frecuencia de roturas de ADN fuera del objetivo, que podría limitar la utilidad del sistema para el tratamiento de pacientes humanos (Fu et al. (2013), Nat. Biotechnol. 31:822-6).
En la realización preferida de la invención, el agente inductor de la rotura del ADN es una endonucleasa de localización diseñada (también llamada "meganucleasa"). Las endonucleasas de localización son un grupo de nucleasas de origen natural que reconocen sitios de corte de 15-40 pares de bases que se encuentran comúnmente en los genomas de plantas y hongos. Con frecuencia se asocian a elementos de ADN parásitos, tales como los intrones autoempalmados del grupo 1 y las inteínas. Promueven de forma natural la recombinación homóloga o la inserción de genes en lugares específicos del genoma del anfitrión al producir una rotura de doble cadena en el cromosoma, que recluta la maquinaria celular de reparación del ADN (Stoddard (2006), Q. Rev. Biophys. 38: 49-95). Las endonucleasas de localización se agrupan comúnmente en cuatro familias: la familia LAGLIDADg , la familia GIY-YIG, la familia His-Cys box y la familia HNH. Estas familias se caracterizan por motivos estructurales, que afectan a la actividad catalítica y a la secuencia de reconocimiento. Por ejemplo, los miembros de la familia LAGLIDADG se caracterizan por tener una o dos copias del motivo LAGLIDADG conservado (ver Chevalier et al. (2001), Nucleic Acids Res. 29(18): 3757-3774). Las endonucleasas de localización LAGLIDADG con una sola copia del motivo LAGLIDADG forman homodímeros, mientras que los miembros con dos copias del motivo LAGLIDADg se encuentran como monómeros.
I-CreI (SEQ ID NO: 1) es un miembro de la familia LAGLIDADG de endonucleasas de referencia que reconoce y corta una secuencia de reconocimiento de 22 pares de bases en el cromosoma del cloroplasto del alga Chlamydomonas reinhardtii. Se han utilizado técnicas de selección genética para modificar la preferencia del sitio de escisión de I-CreI de tipo salvaje (Sussman et al. (2004), J. Mol. Biol. 342: 31-41 Chames et al. (2005), Nucleic Acids Res. 33: e178 Seligman et al. (2002), Nucleic Acids Res. 30: 3870-9, Arnould et al. (2006), J. Mol. Biol. 355: 443-58). Más recientemente, se describió un procedimiento de diseño racional de las endonucleasas de localización mono-LAGLIDADG que es capaz de rediseñar exhaustivamente I-CreI y otras endonucleasas de señalización para dirigirse a sitios de ADN ampliamente divergentes, incluyendo sitios en genomas de mamíferos, levaduras, plantas, bacterias y virus (documento WO 2007/047859).
Como se describe por primera vez en el documento WO 2009/059195I-CreI y sus derivados diseñados son normalmente diméricos, pero pueden fusionarse en un solo polipéptido utilizando un enlace peptídico corto que une el terminal C de una primera subunidad con el terminal N de una segunda subunidad (Li et al. (2009), Nucleic Acids Res. 37:1650-62; Grizot et al. (2009), Nucleic Acids Res. 37:5405-19). Así, una meganucleasa funcional de "cadena única" puede expresarse a partir de un único transcrito. Al suministrar genes que codifican dos meganucleasas de cadena simple diferentes a la misma célula, es posible cortar simultáneamente dos sitios diferentes. Esto, unido a la bajísima frecuencia de corte fuera del objetivo observada con las meganucleasas diseñadas, las convierte en las endonucleasas preferidas para la presente invención.
Se divulga un procedimiento para promover la deleción precisa de un locus flanqueado por un par de secuencias de repetición directa en un cromosoma en una población de células eucariotas, introduciendo en las células al menos primer ácido nucleico que codifica una primera nucleasa diseñada y un segundo ácido nucleico que codifica una segunda nucleasa diseñada, en el que la primera nucleasa diseñada y la segunda nucleasa diseñada se expresan en las células in vivo; en el que el par de secuencias de repetición directa incluye una primera secuencia de repetición directa 5' del locus en una primera cadena de ADN del cromosoma y una segunda secuencia de repetición directa 3' del locus en la primera cadena de ADN del cromosoma, y cada una de la primera secuencia de repetición directa y la segunda secuencia de repetición directa consiste en la misma secuencia de nucleótidos de 2-4 pares de bases; en el que la primera nucleasa diseñada reconoce la primera secuencia de repetición directa y escinde la primera cadena del cromosoma ya sea en el extremo 3' o 5' de la primera secuencia de repetición directa en la primera cadena, y escinde la segunda cadena del cromosoma ya sea en el extremo 3' o 5' de la primera secuencia de repetición directa en la segunda cadena, produciendo así un primer saliente 3' o 5'; en el que la segunda nucleasa diseñada reconoce la segunda secuencia de repetición directa y escinde la primera cadena del cromosoma en el extremo 3' o 5' de la segunda secuencia de repetición directa en la primera cadena, y escinde la segunda cadena del cromosoma en el extremo 3' o 5' de la segunda secuencia de repetición directa en la segunda cadena, produciendo así un segundo saliente 3' o 5' que es complementario al primer saliente 3' o 5'; y en el que la ligación del primer saliente 3' o 5' con el segundo saliente 3' o 5' promueve una deleción precisa del locus entre el par de repeticiones directas. Para evitar dudas, cualquier nucleasa dada siempre cortará en sólo uno de los extremos 3' o 5' de la repetición directa, y siempre producirá sólo uno de los salientes 3' o 5'. Sin embargo, algunas nucleasas siempre cortarán en los extremos 3' y producirán salientes 3' mientras que otras nucleasas siempre cortarán en los extremos 5' y producirán salientes 5'. Para promover deleciones precisas, es necesario que la primera nucleasa y la segunda nucleasa produzcan salientes complementarios de igual longitud.
La primera y/o segunda nucleasa diseñada puede ser una meganucleasa diseñada, una meganucleasa de cadena simple, una TALEN compacta, una CRISPR o una nucleasa de dedos de zinc. Así, la primera y/o segunda nucleasa puede ser una meganucleasa LAGLIDADG diseñada o una meganucleasa LAGLIDADG de cadena simple y la escisión del cromosoma produce un saliente 3' de 4 pares de bases. La primera y/o segunda nucleasa también puede ser una meganucleasa GIY-YIG de ingeniería y la escisión del cromosoma produce un saliente 3' de 2 pares de bases. La primera y/o segunda nucleasa puede ser una TALEN compacta de ingeniería y la escisión del cromosoma produce un saliente 3' de 2 pares de bases. La primera y/o segunda nucleasa puede ser una CRISPR diseñada y la escisión del cromosoma produce un saliente 5' de 2-4 pares de bases.
La ligación del primer saliente 3' o 5' y del segundo saliente 3' o 5' puede promover una deleción precisa del locus entre el par de repeticiones directas en al menos 20 %, 25 %, 30 %, 35 % o 40 % de la población de células.
Uno o ambos extremos de la secuencia suprimida pueden estar presentes en un exón, y la deleción precisa resulta en la deleción de una longitud total de secuencias de exón que es un múltiplo de tres pares de bases.
El locus que debe suprimirse con precisión puede incluir una expansión de repetición de nucleótidos que cause un trastorno de expansión de repetición de nucleótidos. El trastorno de expansión de repetición de nucleótidos puede elegirse entre la atrofia dentatoruballidoluysiana (DRPLA), la enfermedad de Huntington (EH), la atrofia muscular espinal y bulbar (SBMA), la ataxia espinocerebelosa Tipo 1 (SCA1), Ataxia espinocerebelosa Tipo 2 (SCA2), Ataxia espinocerebelosa Tipo 3 o enfermedad de Machado-Joseph (SCA3), Ataxia espinocerebelosa Tipo 6 (SCA6), Ataxia espinocerebelosa Tipo 7 (SCA7), Ataxia espinocerebelosa Tipo 17 (SCA17), síndrome del cromosoma X frágil (FRAXA), síndrome de temblor/ataxia asociado al cromosoma X frágil (FXTAS), retraso mental del cromosoma XE frágil (FRAXE), ataxia de Friedreich (FRDA), distrofia miotónica tipo I (DM1), distrofia miotónica tipo II (DM 2), ataxia espinocerebelosa Tipo 8 (SCA8), ataxia espinocerebelosa Tipo 12 (SCA12), esclerosis lateral amiotrófica (ELA) y demencia frontotemporal (FTD).
Uno o ambos pares de repeticiones directas pueden incluirse en una de las secuencias de reconocimiento divulgadas en el presente documento. Además, una o ambas de la primera nucleasa diseñada y la segunda nucleasa diseñada pueden ser una de las meganucleasas diseñadas divulgadas en el presente documento.
Se divulga un procedimiento de tratamiento de un trastorno de expansión de repetición de nucleótidos que comprende la administración de un par de nucleasas diseñadas, o de ácidos nucleicos que codifican un par de nucleasas diseñadas, a las células de un paciente de manera que las dos nucleasas extirpen del genoma la expansión de repetición de nucleótidos responsable de la enfermedad de forma permanente. Se divulga un procedimiento general para tratar los trastornos de expansión de repeticiones de nucleótidos, así como nucleasas diseñadas adecuadas para practicar el procedimiento. Se dan a conocer vectores y técnicas para suministrar nucleasas diseñadas a las células del paciente.
Se divulgan nucleasas diseñadas, o ácidos nucleicos que codifican nucleasas diseñadas, que extirpan una expansión de repetición de nucleótidos responsable de un trastorno de expansión de repetición de nucleótidos de forma permanente del genoma. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena simple diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
Se divulgan nucleasas diseñadas que reconocen y escinden una secuencia de reconocimiento dentro del intrón 1 del gen humano de la frataxina(FXN). La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena simple diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
La secuencia de reconocimiento puede situarse 5' corriente arriba de una región de repetición GAA en dicho intrón 1 (SEQ ID NO: 74). La secuencia de reconocimiento puede comprender una cualquiera de las SEQ ID NOs: 12-73. La secuencia de reconocimiento puede comprender la SEQ ID NO: 29. La secuencia de reconocimiento puede comprender la SEQ ID NO: 63. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena simple diseñada. La meganucleasa diseñada puede comprender la SEQ ID NO: 133 o 134. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
La secuencia de reconocimiento puede situarse 3' corriente abajo de una región de repetición GAA en dicho intrón 1 (SEQ ID NO: 96). La secuencia de reconocimiento puede comprender una cualquiera de las SEQ ID NOs: 75-95. La secuencia de reconocimiento puede comprender la SEQ Id NO: 89. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena simple diseñada. La meganucleasa diseñada puede comprender la SEQ ID NO: 135. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
Se divulgan nucleasas diseñadas que reconocen y escinden una secuencia de reconocimiento dentro de la región 5' no traducida (UTR) del gen humano FMR1. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena simple diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
La secuencia de reconocimiento puede situarse 5' corriente arriba de una región de repetición CGG en dicha región 5' UTR (SEQ ID NO: 3). La secuencia de reconocimiento puede comprender la SEQ ID NO: 2. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena simple diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
La secuencia de reconocimiento puede situarse 3' corriente abajo de una región de repetición CGG en la región 5' UTR. La secuencia de reconocimiento puede comprender la SEQ ID NO: 4. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena simple diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
Se divulgan nucleasas diseñadas que reconocen y escinden una secuencia de reconocimiento dentro del exón 1 del gen HTT humano. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena única diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
La secuencia de reconocimiento puede situarse 5' corriente arriba de una región de repetición CAG en el exón 1 (SEQ ID NO: 7). La secuencia de reconocimiento puede comprender una cualquiera de las SEQ ID NOs: 5, 6, o 141. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena única diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
La secuencia de reconocimiento puede situarse 3' corriente abajo de una región de repetición CAG en el exón 1 (SEQ ID NO: 11). La secuencia de reconocimiento puede comprender una cualquiera de las SEQ ID NOs: 8-10. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena única diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
Se divulgan nucleasas diseñadas que reconocen y escinden una secuencia de reconocimiento dentro de la región 3' UTR del gen DMPK humano. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena única diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
La secuencia de reconocimiento puede situarse 5' corriente arriba de una región de repetición CTG en la región 3' UTR (SEQ ID NO: 102). La secuencia de reconocimiento puede comprender una cualquiera de las SEQ ID NOs: 97­ 101. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena única diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
La secuencia de reconocimiento puede situarse 3' corriente abajo de una región de repetición CTG en la región 3' UTR (SEQ ID NO: 132). La secuencia de reconocimiento puede comprender una cualquiera de las SEQ ID NOs: 103-131. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena única diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
Se divulgan nucleasas diseñadas que reconocen y escinden una secuencia de reconocimiento dentro del intrón 1 del gen ZNF9 humano. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena única diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
La secuencia de reconocimiento puede situarse 5' corriente arriba de una repetición de tetranucleótidos CCTG en el intrón 1. La secuencia de reconocimiento puede situarse 3' corriente abajo de una repetición de tetranucleótidos CCTG en el intrón 1. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena única diseñada. La nucleasa diseñada puede ser una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o nucleasa megaTAL.
Se divulgan polinucleótidos aislados que comprenden una secuencia de ácido nucleico que codifica una nucleasa diseñada divulgada en el presente documento. El polinucleótido aislado puede ser un ARNm. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena única diseñada, una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o una megaTAL como se describe en el presente documento, o que reconoce y escinde al menosa de las secuencias de reconocimiento descritas en el presente documento.
Se divulga un constructo de ADN recombinante que comprende una secuencia de ácido nucleico que codifica una nucleasa diseñada descrita en el presente documento. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena única diseñada, una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o una megaTAL como se describe en el presente documento, o que reconoce y escinde al menos una de las secuencias de reconocimiento descritas en el presente documento.
Se divulga un vector viral que comprende una secuencia de ácido nucleico que codifica una nucleasa diseñada divulgada en el presente documento. El vector viral puede ser un vector de virus adeno-asociado (AAV) recombinante. La nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena única diseñada, una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o una megaTAL como se describe en el presente documento, o que reconoce y escinde al menosa de las secuencias de reconocimiento descritas en el presente documento.
En otro aspecto, la invención proporciona composiciones para su uso en el tratamiento de un sujeto que tiene un trastorno de expansión de repetición de nucleótidos caracterizado por la expansión de una repetición de nucleótidos en un gen de interés, comprendiendo la composición que comprende: (a) al menosa primera proteína nucleasa diseñada y una segunda proteína nucleasa diseñada; o (b) al menos primer ácido nucleico que codifica la primera nucleasa diseñada y un segundo ácido nucleico que codifica la segunda nucleasa diseñada, en el que el primer ácido nucleico y el segundo ácido nucleico son expresables en las células objetivo in vivo; en el que la primera nucleasa diseñada reconoce y escinde una primera secuencia de reconocimiento situada 5' corriente arriba de la repetición de nucleótidos en el gen de interés; y en el que la segunda nucleasa diseñada reconoce y escinde una segunda secuencia de reconocimiento situada 3' corriente abajo de la repetición de nucleótidos en el gen de interés; en el que un fragmento de ADN intermedio entre la primera secuencia de reconocimiento y la segunda secuencia de reconocimiento se extirpa y el número de la repetición de nucleótidos se reduce en el gen de interés; y en el que dicha primera nucleasa diseñada y dicha segunda nucleasa diseñada generan salientes complementarios que promueven la ligación nueva directa de dicho gen de interés.
En algunas realizaciones, la nucleasa diseñada puede ser una meganucleasa diseñada o una meganucleasa de cadena simple, una nucleasa de dedos de zinc, TALEN, TALEN compacta, CRISPR o una nucleasa megaTAL.
En algunas realizaciones, la primera nucleasa diseñada y la segunda nucleasa diseñada generan salientes complementarios que promueven la religación directa del gen de interés tras la escisión del fragmento de ADN intermedio. En algunas realizaciones, los salientes son de al menos 2-4 pares de bases y son salientes de 3',
En algunas realizaciones, la repetición de nucleótidos es una repetición de trinucleótidos. En algunas de estas realizaciones del procedimiento, la repetición de trinucleótidos se selecciona del grupo que consiste en CAG, CGG, CCG, GAA y CTG.
En algunas realizaciones, el trastorno de expansión de repetición de nucleótidos es la Ataxia de Friedreich, la repetición de trinucleótidos es GAA, y el gen de interés es el gen de la frataxina humanafFXN), en el que la repetición de trinucleótidos se posiciona dentro del intrón 1 del gen FXN. En algunas de estas realizaciones, la primera secuencia de reconocimiento se sitúa 5' corriente arriba de la repetición de trinucleótidos en el intrón 1 (SEQ ID NO: 74), y la segunda secuencia de reconocimiento se sitúa 3' corriente abajo de la repetición de trinucleótidos en el intrón 1 (SEQ ID NO: 96). En algunas realizaciones, la nucleasa diseñada es una meganucleasa diseñada o una meganucleasa de cadena simple.
En algunas realizaciones particulares de las composiciones para su uso en el tratamiento de la Ataxia de Friedreich, la primera secuencia de reconocimiento puede comprender una cualquiera de las SEQ ID NO: 13-15, 19, 26-28, 30, 31, 33, 34, 40, 42, 43, 45, 46, 48, 49, 54, 55, 57, 58, 60, 62, 63, 65, 67, 71 y 73. En algunas realizaciones particulares, la primera nucleasa diseñada es una meganucleasa y puede comprender las SEQ ID NOs: 133 o 134. En otras realizaciones particulares, la segunda secuencia de reconocimiento puede comprender una cualquiera de las SEQ ID NO: 76, 78-91, y 93-95. En algunas realizaciones particulares, la segunda nucleasa diseñada es una meganucleasa y puede comprender SEQ ID NO: 135. En determinadas realizaciones, una primera meganucleasa diseñada comprende la SEQ ID NO: 133 y una segunda meganucleasa diseñada comprende SEQ ID NO: 135. En algunas realizaciones particulares, una primera meganucleasa diseñada comprende SEQ ID NO: 134 y una segunda meganucleasa diseñada comprende SEQ ID NO: 135.
En algunas realizaciones, el trastorno de expansión de la repetición de nucleótidos es el síndrome del cromosoma X frágil, la repetición de trinucleótidos es CGG, y el gen de interés es el gen humano FMR1, en el que la repetición de trinucleótidos está posicionada dentro de la región 5' UTR del gen FMR1. En algunas de estas realizaciones, la primera secuencia de reconocimiento se sitúa 5' corriente arriba de la repetición de trinucleótidos en la región 5' UTR (SEQ ID NO: 3), y la segunda secuencia de reconocimiento se sitúa 3' corriente abajo de la repetición de trinucleótidos en la región 5' UTR. En algunas realizaciones, la nucleasa diseñada es una meganucleasa diseñada o una meganucleasa de cadena simple.
En algunas realizaciones, el trastorno de expansión de repetición de nucleótidos es la enfermedad de Huntington, la repetición de trinucleótidos es CAG, y el gen de interés es el gen HTT humano, en el que la repetición de trinucleótidos se posiciona dentro del exón 1 del gen HTT. En algunas de estas realizaciones, la primera secuencia de reconocimiento se sitúa 5' corriente arriba de la repetición de trinucleótidos en el exón 1 (SEQ ID NO: 7), y la segunda secuencia de reconocimiento se sitúa 3' corriente abajo de la repetición de trinucleótidos en el exón 1 (SEQ ID NO: 11). En algunas realizaciones, la nucleasa diseñada es una meganucleasa diseñada o una meganucleasa de cadena simple.
En algunas realizaciones, el trastorno de expansión de repetición de nucleótidos es la distrofia miotónica tipo I (DM1), la repetición de trinucleótidos es CAG, y el gen de interés es el gen humano DMPK, en el que la repetición de trinucleótidos está posicionada dentro de la región 3' UTR del gen DMPK. En algunas de estas realizaciones, la primera secuencia de reconocimiento se sitúa 5' corriente arriba de la repetición de trinucleótidos en la región 3' UTR (SEQ ID NO: 102), y la segunda secuencia de reconocimiento se sitúa 3' corriente abajo de la repetición de trinucleótidos en la región 3' UTR (SEQ ID NO: 132). En algunas de estas realizaciones de los procedimientos, la primera secuencia de reconocimiento puede comprender una cualquiera de los SEQ ID NOs: 98 y 100. En otras realizaciones de los procedimientos, la segunda secuencia de reconocimiento puede comprender una cualquiera de los SEQ ID NOs: 107, 113, 116, 120, y 123.
En algunas realizaciones, la repetición de nucleótidos es una repetición de tetranucleótidos. En algunas de estas realizaciones, el trastorno de expansión de repetición de nucleótidos es la distrofia miotónica tipo II (DM2), la repetición de tetranucleótidos es CCTG, y el gen de interés es el gen humano ZNF9, en el que la repetición de tetranucleótidos se sitúa dentro del intrón 1 del gen ZNF9. En algunas de estas realizaciones, la primera secuencia de reconocimiento se sitúa 5' corriente arriba de la repetición de tetranucleótidos en el intrón 1, y la segunda secuencia de reconocimiento se sitúa 3' corriente abajo de la repetición de tetranucleótidos en el intrón 1. En algunas realizaciones, la nucleasa diseñada es una meganucleasa diseñada o una meganucleasa de cadena simple.
Se divulga también una meganucleasa diseñada que reconoce y escinde una secuencia de reconocimiento dentro del intrón 1 del gen de la frataxina humana (FXN ), en la que la meganucleasa diseñada comprende una primera subunidad y una segunda subunidad, en la que la primera subunidad se une a un primer medio sitio de reconocimiento de la secuencia de reconocimiento y comprende una primera región hipervariable (HVR1), y en la que la segunda subunidad se une a un segundo medio sitio de reconocimiento de la secuencia de reconocimiento y comprende una segunda región hipervariable (HVR2).
La secuencia de reconocimiento puede comprender SEQ ID NO: 34 (es decir, la secuencia de reconocimiento FXN 3­ 4). La primera subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 7-153 de una cualquiera de las SEQ ID NO: 155-159, y/o la segunda subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 198-344 de una cualquiera de las SEQ ID NO: 155-159. La región HVR1 puede comprender los residuos 24-79 de una cualquiera de las SEQ ID NO: 155-159. La región HVR2 puede comprender los residuos 215-270 de una cualquiera de las SEQ ID NO: 155-159. La primera subunidad puede comprender los residuos 7-153 de una cualquiera de los SEQ ID NO: 155-159. La segunda subunidad puede comprender los residuos 198-344 de una cualquiera de los SEQ ID NO: 155­ 159. La nucleasa diseñada es una meganucleasa de cadena única que comprende un enlazador, en el que el enlazador une covalentemente la primera subunidad y la segunda subunidad. La meganucleasa diseñada puede comprender la secuencia de aminoácidos de una cualquiera de las SEQ ID NOs: 155-159.
La secuencia de reconocimiento puede comprender SEQ ID NO: 89 (es decir, la secuencia de reconocimiento FXN 5­ 6). La primera subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 198-344 de una cualquiera de las SEQ ID NO: 170-172, o los residuos 7-153 de SEQ ID NO: 173, y/o la segunda subunidad puede comprender una secuencia de aminoácidos que tiene al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 7-153 de una cualquiera de las SEQ ID NO: 170-172, o los residuos 198-344 de SEQ ID NO: 173. La región HVR1 puede comprender los residuos 215-270 de una cualquiera de las SEQ ID NO: 170-172, o los residuos 24-79 de SEQ ID NO: 173. La región HVR2 puede comprender los residuos 24-79 de una cualquiera de las SEQ ID NO: 170-172, o los residuos 215-270 de SEQ ID NO: 173. La primera subunidad puede comprender los residuos 198-344 de una cualquiera de los SEQ ID NO: 170-172, o los residuos 7-153 de SEQ ID NO: 173. La segunda subunidad puede comprender los residuos 7-153 de una cualquiera de los SEQ ID NO: 170-172, o los residuos 198-344 de SEQ ID NO: 173. La nucleasa diseñada puede ser una meganucleasa de cadena única que comprende un enlazador, en la que el enlazador une covalentemente la primera subunidad y la segunda subunidad. La meganucleasa diseñada puede comprender la secuencia de aminoácidos de una cualquiera de las SEQ ID NOs: 170-173
La secuencia de reconocimiento puede comprender SEQ ID NO: 29 (es decir, la secuencia de reconocimiento FXN 1­ 2). La primera subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 7-153 de una cualquiera de las SEQ ID NO: 143-146, y/o la segunda subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 198-344 de una cualquiera de las SEQ ID NO: 143-146. La región HVR1 puede comprender los residuos 24-79 de una cualquiera de las s Eq ID NO: 143-146. En algunas realizaciones particulares, la región HVR2 puede comprender los residuos 215-270 de una cualquiera de las SEQ ID NO: 143-146. La primera subunidad puede comprender los residuos 7-153 de una cualquiera de los SEQ ID NO: 143-146. La segunda subunidad puede comprender los residuos 198-344 de una cualquiera de los SEQ ID NO: 143-146. La nucleasa diseñada puede ser una meganucleasa de cadena única que comprende un enlazador, en la que el enlazador une covalentemente la primera subunidad y la segunda subunidad. La meganucleasa diseñada puede comprender la secuencia de aminoácidos de una cualquiera de las SEQ ID NOs: 143-146.
La secuencia de reconocimiento puede comprender SEQ ID NO: 29 (es decir, la secuencia de reconocimiento FXN 11-12). La primera subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 198-344 de una cualquiera de las SEQ ID NO: 182-185, y/o la segunda subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 7­ 153 de una cualquiera de las SEQ ID NO: 182-185. La región HVR1 puede comprender los residuos 215-270 de una cualquiera de las SEQ ID NO: 182-185. En algunas realizaciones particulares, la región HVR2 puede comprender los residuos 24-79 de una cualquiera de las SEQ ID NO: 182-185. La primera subunidad puede comprender los residuos 198-344 de una cualquiera de los SEQ ID NO: 182-185. La segunda subunidad puede comprender los residuos 7-153 de una cualquiera de los SEQ ID NO: 182-185. La nucleasa diseñada puede ser una meganucleasa de cadena única que comprende un enlazador, en la que el enlazador une covalentemente la primera subunidad y la segunda subunidad. La meganucleasa diseñada puede comprender la secuencia de aminoácidos de una cualquiera de las SEQ ID NOs: 182-185.
Se divulga una meganucleasa diseñada que reconoce y escinde una secuencia de reconocimiento dentro del gen humano C9ORF72, en la que la meganucleasa diseñada comprende una primera subunidad y una segunda subunidad, en la que la primera subunidad se une a un primer medio sitio de reconocimiento de la secuencia de reconocimiento y comprende una primera región hipervariable (HVR1), y en la que la segunda subunidad se une a un segundo medio sitio de reconocimiento de la secuencia de reconocimiento y comprende una segunda región hipervariable (HVR2).
La secuencia de reconocimiento puede comprender SEQ ID NO: 194 (es decir, la secuencia de reconocimiento ORF 7-8). La primera subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 7-153 de una cualquiera de las SEQ ID NO: 198-200 o los residuos 198-344 de SEQ ID NO: 201, y/o la segunda subunidad puede comprender una secuencia de aminoácidos que tiene al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 198-344 de una cualquiera de las SEQ ID NO: 198-200 o los residuos 7-153 de SEQ ID NO: 201. La región HVR1 puede comprender los residuos 24-79 de una cualquiera de las SEQ ID NO: 198­ 200 o los residuos 215-270 de SEQ ID NO: 201. En algunas realizaciones particulares, la región HVR2 puede comprender los residuos 215-270 de una cualquiera de las SEQ ID NO: 198-200 o los residuos 24-79 de SEQ ID NO: 201. La primera subunidad puede comprender los residuos 7-153 de una cualquiera de los SEQ ID NO: 198-200 o los residuos 198-344 de SEQ ID NO: 201. La segunda subunidad puede comprender los residuos 198-344 de una cualquiera de los SEQ ID NO: 198-200 o los residuos 7-153 de Se Q ID NO: 201. La nucleasa diseñada puede ser una meganucleasa de cadena única que comprende un enlazador, en la que el enlazador une covalentemente la primera subunidad y la segunda subunidad. La meganucleasa diseñada puede comprender la secuencia de aminoácidos de una cualquiera de las SEQ ID NOs: 198-201.
La secuencia de reconocimiento puede comprender SEQ ID NO: 195 (es decir, la secuencia de reconocimiento ORF 9-10). La primera subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 7-153 de una cualquiera de las SEQ ID NO: 210-213, y/o la segunda subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 198­ 344 de una cualquiera de las SEQ ID NO: 210-213. La región HVR1 puede comprender los residuos 24-79 de una cualquiera de las SEQ ID NO: 210-213. La región HVR2 puede comprender los residuos 215-270 de una cualquiera de las SEQ ID NO: 210-213. La primera subunidad puede comprender los residuos 7-153 de una cualquiera de los SEQ ID NO: 210-213. La segunda subunidad puede comprender los residuos 198-344 de una cualquiera de los SEQ ID NO: 210-213. La nucleasa diseñada puede ser una meganucleasa de cadena única que comprende un enlazador, en la que el enlazador une covalentemente la primera subunidad y la segunda subunidad. La meganucleasa diseñada puede comprender la secuencia de aminoácidos de una cualquiera de las SEQ ID NOs: 210-213.
La secuencia de reconocimiento puede comprender SEQ ID NO: 196 (es decir, la secuencia de reconocimiento ORF 11-12). La primera subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 198-344 de una cualquiera de las SEQ ID NO: 222-225, y/o la segunda subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 7­ 153 de una cualquiera de las SEQ ID NO: 222-225. La región HVR1 puede comprender los residuos 215-270 de una cualquiera de las SEQ ID NO: 222-225. En algunas realizaciones particulares, la región HVR2 puede comprender los residuos 24-79 de una cualquiera de las SEQ ID NO: 222-225. La primera subunidad puede comprender los residuos 198-344 de una cualquiera de los SEQ ID NO: 222-225. La segunda subunidad puede comprender el residuo 7-153 de una cualquiera de las SEQ ID NOs: 222-225. La nucleasa diseñada puede ser una meganucleasa de cadena única que comprende un enlazador, en la que el enlazador une covalentemente la primera subunidad y la segunda subunidad. La meganucleasa diseñada puede comprender la secuencia de aminoácidos de una cualquiera de las SEQ ID NOs: 222-225.
La secuencia de reconocimiento puede comprender SEQ ID NO: 197 (es decir, la secuencia de reconocimiento ORF 13-14). La primera subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 7-153 de una cualquiera de las SEQ ID NO: 234-237, y/o la segunda subunidad puede comprender una secuencia de aminoácidos que tenga al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, o más, de identidad de secuencia con los residuos 198­ 344 de una cualquiera de las SEQ ID NO: 234-237. La región HVR1 puede comprender los residuos 24-79 de una cualquiera de las SEQ ID NO: 234-237. En algunas realizaciones particulares, la región HVR2 puede comprender los residuos 215-270 de una cualquiera de las SEQ ID NO: 234-237. La primera subunidad puede comprender los residuos 7-153 de una cualquiera de los SEQ ID NO: 234-237. La segunda subunidad puede comprender los residuos 198-344 de una cualquiera de los SEQ ID NO: 234-237. La nucleasa diseñada puede ser una meganucleasa de cadena única que comprende un enlazador, en la que el enlazador une covalentemente la primera subunidad y la segunda subunidad. La meganucleasa diseñada puede comprender la secuencia de aminoácidos de una cualquiera de las SEQ ID NOs: 234-237.
En otro aspecto, la invención proporciona polinucleótidos aislados que comprenden secuencias de ácidos nucleicos que codifican las nucleasas diseñadas de la invención. En algunas realizaciones, el polinucleótido aislado es un ARNm.
En algunas realizaciones, la invención proporciona un constructo de ADN recombinante que comprende una secuencia de ácido nucleico que codifica una nucleasa diseñada de la invención. En algunas de estas realizaciones, la constructo de ADN recombinante codifica un vector viral. En algunas realizaciones, el vector viral es un retrovirus, un lentivirus, un adenovirus o un vector de virus adenoasociado (AAV). En determinadas realizaciones, el vector viral es un vector AAV recombinante.
En algunas realizaciones, la invención proporciona un vector viral que comprende una secuencia de ácido nucleico que codifica una nucleasa diseñada de la invención. En algunas realizaciones, el vector viral es un retrovirus, un lentivirus, un adenovirus o un vector de virus adenoasociado (AAV). En determinadas realizaciones, el vector viral es un vector AAV recombinante.
Se divulga también una composición farmacéutica para el tratamiento de un sujeto que tiene un trastorno de expansión de repetición de nucleótidos, en el que el trastorno de expansión de repetición de nucleótidos se caracteriza por la expansión de una repetición de nucleótidos en un gen de interés. La composición farmacéutica comprende un portador farmacéuticamente aceptable y: (a) un primer ácido nucleico que codifica una primera nucleasa diseñada como se describe en el presente documento y un segundo ácido nucleico que codifica una segunda nucleasa diseñada como se describe en el presente documento, en el que la primera nucleasa diseñada y la segunda nucleasa diseñada se expresan en una célula diana in vivo; en el que la primera nucleasa diseñada reconoce y escinde una primera secuencia de reconocimiento situada 5' corriente arriba de la repetición de nucleótidos en el gen de interés y en el que la segunda nucleasa diseñada reconoce y escinde una segunda secuencia de reconocimiento situada 3' corriente abajo de la repetición de nucleótidos en el gen de interés.
La primera secuencia de reconocimiento y/o la segunda secuencia de reconocimiento pueden situarse dentro del mismo exón, el mismo intrón o la misma región no traducida (UTR) que la repetición de nucleótidos. La primera secuencia de reconocimiento y/o la segunda secuencia de reconocimiento pueden estar posicionadas no dentro del mismo exón, el mismo intrón o la misma UTR que la repetición de nucleótidos. La primera secuencia de reconocimiento y/o la segunda secuencia de reconocimiento pueden situarse en un exón, un intrón o una UTR adyacente al exón, intrón o UTR que está ocupado por la repetición de nucleótidos.
El primer ácido nucleico y/o el segundo ácido nucleico pueden ser un ARNm.
La composición farmacéutica puede comprender un primer constructo de ADN recombinante que comprende el primer ácido nucleico y/o un segundo constructo de ADN recombinante que comprende el segundo ácido nucleico.
La composición farmacéutica puede comprender un primer vector viral que comprende el primer ácido nucleico y/o un segundo vector viral que comprende el segundo ácido nucleico.
El primer vector viral y/o el segundo vector viral pueden ser un retrovirus, un lentivirus, un adenovirus o un vector AAV. El primer vector viral y/o el segundo vector viral pueden ser un vector AAV recombinante.
La composición farmacéutica puede ser útil para el tratamiento del síndrome del cromosoma X frágil y el gen de interés es el gen humano FMR1. La primera secuencia de reconocimiento puede comprender SEQ ID NO: 2. La segunda secuencia de reconocimiento puede comprender SEQ ID NO: 4.
La composición farmacéutica puede ser útil para el tratamiento de la enfermedad de Huntington y el gen de interés es el gen humano HTT. La primera secuencia de reconocimiento puede comprender una cualquiera de las SEQ ID NOs: 5, 6, o 141. En algunas realizaciones particulares, la segunda secuencia de reconocimiento puede comprender SEQ ID NO: 4.
La composición farmacéutica puede ser útil para el tratamiento de la distrofia miotónica tipo I (MD1) y el gen de interés es el gen humano DMPK. La primera secuencia de reconocimiento puede comprender una cualquiera de las SEQ ID NOs: 97-101. La segunda secuencia de reconocimiento puede comprender una cualquiera de las SEQ ID NOs: 103­ 131.
Se divulgan polinucleótidos aislados para su uso como medicamentos, en los que los polinucleótidos aislados comprenden una secuencia de ácido nucleico que codifica una nucleasa diseñada, y particularmente una meganucleasa diseñada, de la invención.
Se divulga un vector AAV recombinante para su uso como medicamento, en el que el vector AAV recombinante comprende un polinucleótido aislado, y en el que el polinucleótido aislado comprende una secuencia de ácido nucleico que codifica una nucleasa diseñada, y particularmente una meganucleasa diseñada, de la invención.
BREVE DESCRIPCIÓN DE LAS FIGURAS
Figura 1. Estructuras de varios genes humanos asociados a trastornos por expansión de repeticiones de nucleótidos. A) Estructura de la porción 5' del gen FMR1 asociada al síndrome de cromosoma X Frágil. La repetición de trinucleótidos CGG se encuentra en la región no traducida 5' del gen. Los sitios de inicio de la transcripción y la traducción se identifican con distancias relativas (en pares de bases) a la región de repetición CGG. Las regiones objetivo corriente arriba y corriente abajo a las que podría dirigirse un par de nucleasas para extirpar la repetición están sombreadas. B) Estructura de la porción 5' del gen HTT asociado a la enfermedad de Huntington. Se identifica el sitio de inicio de la traducción, así como el resto del exón 1 y el límite exón1/intrón 1. Las regiones objetivo corriente arriba y corriente abajo a las que podría dirigirse un par de nucleasas para extirpar la repetición del exón están sombreadas. C) La estructura del intrón 1 del gen humano FXN asociado a la Ataxia de Friedreich. Se indican los bordes del exón/intrón y se sombrean los loci preferidos y menos preferidos para dirigir las endonucleasas corriente arriba y corriente abajo de la repetición GAA responsable de la enfermedad. D) Estructura de la región no traducida (UTR) 3' de la DMPK que muestra la ubicación de la repetición de trinucleótidos CTG asociada a la distrofia miotónica. Los loci preferidos y menos preferidos para dirigir las endonucleasas corriente arriba y corriente abajo de la repetición están sombreados. E) Estructura de la porción 5' del gen C9ORF72 asociada a la ELA y la FTD. Se representan el exón 1, el intrón 1 y el exón 2, y se muestra la ubicación de la repetición hexanucleotídica GGGGCC en el intrón 1. Los loci preferidos y menos preferidos para dirigir las endonucleasas corriente arriba y corriente abajo de la repetición están sombreados.
Figura 2. Estrategias de eliminación de repeticiones de nucleótidos utilizando diferentes tipos de nucleasas.
2A) Estrategia para eliminar una repetición de nucleótidos utilizando un par de CRISPR. Se utilizan un par de "ARN guía" ("ARNg") que son complementarios a un par de sitios de reconocimiento que flanquean el nucleótido de interés. Como se dibuja en esta figura, los ARNg pueden ser complementarios a las secuencias de reconocimiento que son distales al motivo conservado "g G" y al sitio de escisión del ADN de Cas9. En esta orientación, las secuencias de reconocimiento CRISPR se conservan en gran medida tras la escisión del ADN, la escisión del fragmento de ADN genómico que interviene y la nueva unión de los extremos del cromosoma. 2B) Un esquema alternativo para suprimir una repetición de nucleótidos utilizando un par de CRISPR en el que los ARNg son complementarios a las secuencias de reconocimiento que son proximales a la repetición de nucleótidos. En esta orientación, las secuencias de reconocimiento CRISPR se eliminan en gran medida tras la escisión del ADN, la escisión del fragmento de ADN genómico que interviene y la nueva unión de los extremos del cromosoma. Se contempla que la invención también podría comprender un híbrido de los esquemas mostrados en 2A y 2B. 2C) Estrategia para eliminar una repetición de nucleótidos utilizando un par de TALEN compactas (TALENc). Se utilizan un par de dominios de unión al ADN efectores TAL ("TALE") que se unen a un par de sitios de reconocimiento que flanquean la repetición de nucleótidos de interés. Como se dibuja en esta figura, las TALE pueden unirse a secuencias de reconocimiento distales al motivo conservado "CNNNG" que es reconocido y cortado por el dominio de escisión I-TevI ("TevI-CD"). En esta orientación, las secuencias de reconocimiento de TALENc se conservan en gran medida tras la división del ADN, la escisión del fragmento de ADN genómico que interviene y la nueva unión de los extremos del cromosoma. Además, los TALENc en esta figura se muestran con los dominios TALE y TevI-CD en una orientación N- a C-. También es posible generar TALENc con estos dos dominios en orientación C- a N-. 2D) Un esquema alternativo para eliminar una repetición de nucleótidos utilizando un par de TALENc en el que los dominios TALE se unen a secuencias de reconocimiento que están próximas a la repetición. En esta orientación, las secuencias de reconocimiento de TALENc se eliminan en gran medida tras la escisión del ADN, la escisión del fragmento de ADN genómico que interviene y la nueva unión de los extremos del cromosoma. Además, los TALENc de esta figura están dibujados con los dominios TALE y TevI-CD en una orientación de C a N. Se contempla en la invención también podría comprender un híbrido de los esquemas mostrados en 2C y 2D. 2E) Estrategia para suprimir un gen de repetición de nucleótidos utilizando un par de meganucleasas de cadena simple. Las meganucleasas se dibujan como proteínas de dos dominios (MGN-N: el dominio N-terminal; y MGN-C: el dominio C-terminal) unidos por un enlazador. En la figura, el dominio C-terminal está dibujado como uniéndose a la mitad de la secuencia de reconocimiento que está más cerca de la repetición. En algunas realizaciones, sin embargo, el dominio N-terminal puede unirse a esta mitad de la secuencia de reconocimiento. Los cuatro pares de bases centrales de la secuencia de reconocimiento se muestran como "NNNN". Estos cuatro pares de bases se convierten en "salientes" de una sola cadena 3' después de ser cortados por la meganucleasa. El subconjunto de secuencias preferidas de cuatro pares de bases que comprende esta región de la secuencia se identifica en el documento WO/2010/009147. La escisión del ADN por el par de meganucleasas genera un par de salientes 3' de cuatro pares de bases en los extremos del cromosoma. Si estos salientes son complementarios, pueden unirse entre sí y volverse a ligar directamente, con lo que la secuencia de cuatro pares de bases queda retenida en el cromosoma tras la escisión de la repetición de nucleótidos. Dado que las meganucleasas escinden cerca de la mitad de la secuencia de reconocimiento, la mitad de cada secuencia de reconocimiento se mantendrá con frecuencia en el cromosoma tras la escisión de la repetición. La otra mitad de cada secuencia de reconocimiento se eliminará del genoma con la repetición.
Figura 3. Las meganucleasas diseñadas de la invención comprenden dos subunidades, en las que la primera subunidad que comprende la región HVR1 se une a un primer medio sitio de reconocimiento ( por ejemplo, FXN1) y la segunda subunidad que comprende la región HVR2 se une a un segundo medio sitio de reconocimiento (por ejemplo, FXN2). En las realizaciones donde la meganucleasa recombinante es una meganucleasa de cadena única, la primera subunidad que comprende la región HVR1 puede colocarse como subunidad N-terminal o C-terminal. Asimismo, la segunda subunidad que comprende la región HVR2 puede situarse ya sea como subunidad N-terminal o C-terminal.
Figura 4. Esquema del ensayo reportero en células CHO para evaluar las meganucleasas recombinantes. Para las meganucleasas recombinantes descritas en el presente documento, se produjo una línea celular CHO en la que se integró de forma estable un casete informador en el genoma de la célula. El casete reportero comprendía, en orden 5' a 3': un SV40 Early Promoter; los 5' 2/3 del gen GFP; la secuencia de reconocimiento para una meganucleasa modificada por ingeniería genética de la invención; la secuencia de reconocimiento de la meganucleasa CHO-23/24 (documento WO/2012/167192); y el 3' 2/3 del gen GFP. Las células transfectadas de forma estable con este casete no expresaron GFP en ausencia de un agente inductor de la rotura del ADN. Las meganucleasas se introdujeron por transducción de ADN plasmídico o ARNm que codifica cada meganucleasa. Cuando se indujo una rotura de ADN en cualquiera de las secuencias de reconocimiento de la meganucleasa, las regiones duplicadas del gen GFP se recombinaron entre sí para producir un gen GFP funcional. El porcentaje de células que expresan GFP podría entonces determinarse mediante citometría de flujo como una medida indirecta de la frecuencia de escisión del genoma por las meganucleasas.
Figura 5. Eficiencia de las meganucleasas recombinantes para reconocer y escindir las secuencias de reconocimiento corriente arriba y corriente abajo de la región de repetición de trinucleótidos en el gen FXN humano en un ensayo de reportero de células CHO. Las meganucleasas diseñadas fueron diseñadas para dirigirse a la secuencia de reconocimiento FXN 1-2 (SEQ ID NO: 29), la secuencia de reconocimiento FXN 11-12 (SEQ ID NO: 63), y la secuencia de reconocimiento FXN 5-6 (SEQ ID NO: 89), y se comprobó su eficacia en el ensayo reportero de células CHO. Los resultados mostrados proporcionan el porcentaje de células que expresan GFP observadas en cada ensayo, lo que indica la eficacia de cada meganucleasa para escindir su respectiva secuencia de reconocimiento objetivo o la secuencia de reconocimiento CHO-23/24. También se incluyó un control negativo (bs) en cada ensayo. A) Meganucleasas dirigidas a la secuencia de reconocimiento FXN 1-2. B) Meganucleasas dirigidas a la secuencia de reconocimiento FXN 11-12. C) Meganucleasas dirigidas a la secuencia de reconocimiento FXN 5-6.
Figura 6. Escisión de la repetición GAA de FXN utilizando las meganucleasas FXN 1-2x.63, FXN 11-12x.63 y FXN 5-6x.24. 6A) Secuencia del Intrón 1 de FXN que flanquea la repetición GAA asociada a la Ataxia de Friedreich. La secuencia de repetición está subrayada. Los sitios de reconocimiento de las meganucleasas FXN 1-2x.63, FXN 11-12x.63 y FXN 5-6x.24 están sombreados en gris. Los sitios de fusión de un par de cebadores PCR utilizados para el análisis aparecen en cursiva. 6B) Análisis de electroforesis en gel de agarosa de células HEK-293 cotransfectadas con ARNm que codifica las meganucleasas FXN 1-2x.63 FXN 5-6x.24 o FXN 11-12x.63 FXN 5-6x.24. Se aisló el a Dn genómico de las células y se evaluó por PCR utilizando los cebadores indicados en (6A). Los productos de la PCR se resolvieron en un gel de agarosa y se comprobó que las células HEK-293 que coexpresaban cada uno de los dos pares de meganucleasas daban una banda de PCR más pequeña, consistente con la deleción de la secuencia que interviene en los sitios de reconocimiento de la meganucleasa.
Figura 7. Ejemplos de secuencias de células HEK-293 cotransfectadas con: A) FXN 11-12x.63 FXN 5-6x.24; o B) Fx N 1-2x.63 FXN 5-6x.24. Las bandas de PCR más pequeñas mostradas en la Figura 6B fueron aisladas, clonadas y secuenciadas, y se muestran dos secuencias representativas de cada transfección. El sitio de reconocimiento FXN 1-2x.63 se muestra en negrita. El lugar de reconocimiento del FXN 11-12x.63 se muestra en negrita/en cursiva/subrayado. El sitio de reconocimiento del FXN 5-6x.24 se muestra en letra subrayada/en negrita. Las bases eliminadas de la secuencia (es decir, ausentes de la secuencia) están sombreadas en gris. Las bases que se añadieron a la secuencia (es decir, mediante una inserción no planificada) están doblemente subrayadas. Los sitios de los cebadores se indican con un subrayado de trazos.
Figura 8. Eficiencia de las meganucleasas recombinantes para reconocer y escindir las secuencias de reconocimiento corriente arriba y corriente abajo de la región de repetición de trinucleótidos en el gen FXN humano en un ensayo de reportero de células CHO. Las meganucleasas diseñadas fueron diseñadas para dirigirse a la secuencia de reconocimiento FXN 1-2 (SEQ ID NO: 29), la secuencia de reconocimiento FXN 3-4 (SEQ ID NO: 34), la secuencia de reconocimiento FXN 5-6 (SEQ ID NO: 89), y la secuencia de reconocimiento FXN 11-12 (SEQ ID NO: 63), y se comprobó su eficacia en el ensayo reportero de células CHO. Los resultados mostrados proporcionan el porcentaje de células que expresan GFP observadas en cada ensayo, lo que indica la eficacia de cada meganucleasa para escindir su respectiva secuencia de reconocimiento objetivo o la secuencia de reconocimiento CHO-23/24. También se incluyó un control negativo (bs) en cada ensayo. A) Meganucleasas dirigidas a la secuencia de reconocimiento fX n 1­ 2. B) Meganucleasas dirigidas a la secuencia de reconocimiento FXN 3-4. A) Meganucleasas dirigidas a la secuencia de reconocimiento FXN 5-6. A) Meganucleasas dirigidas a la secuencia de reconocimiento FXN 11-12.
Figura 9. Análisis por PCR de la deleción de repeticiones de trinucleótidos en células de mamíferos. A) Las células HEK 293 se transformaron con un par de meganucleasas FXN 3-4/FXN 5-6 y se evaluaron mediante el análisis PCT para determinar si se producía una deleción de la región de repetición GAA al cabo de 3 o 6 días. B) Las bandas más pequeñas del análisis de la PCR se secuenciaron para determinar si se produjo la ligación nueva entre los sitios de escisión FXN 3-4 y FXN 5-6.
Figura 10. Análisis por PCR de la deleción de repeticiones de trinucleótidos en células de mamíferos. Las células de fibroblastos humanos GM03816, que comprenden una repetición GAA expandida en el gen FXN, se transformaron con una meganucleasa FXN 3-4, una meganucleasa FXN 5-6 o un par de meganucleasas FXN 3-4/FXN 5-6 para extirpar la región de la repetición GAA. A) Análisis por PCR del ARN de las células transformadas después de 4 días. B) Análisis por PCR del ARN de las células transformadas después de 18 días. C) A los 10 días después de la transfección, se obtuvo ARN de las células transfectadas con la meganucleasa FXN 3-4, la meganucleasa FXN 5-6 o el par de meganucleasas FXN 3-4/FXN 5-6, y se analizó mediante PCR cuantitativa para evaluar los cambios en la expresión del ARNm de FXN.
Figura 11. Eficiencia de las meganucleasas recombinantes para reconocer y escindir las secuencias de reconocimiento corriente arriba y corriente abajo de la región de repetición de hexanucleótidos en el gen humano C9ORF72 en un ensayo de reportero de células CHO. Las meganucleasas diseñadas fueron diseñadas para dirigirse a la secuencia de reconocimiento ORF 7-8 (SEQ ID NO: 194), la secuencia de reconocimiento ORF 9-10 (SEQ ID NO: 195), la secuencia de reconocimiento ORF 11-12 (SEQ ID NO: 196), y la secuencia de reconocimiento ORF 13-14 (SEQ ID NO: 197), y se comprobó su eficacia en el ensayo reportero de células CHO. Los resultados mostrados proporcionan el porcentaje de células que expresan GFP observadas en cada ensayo, lo que indica la eficacia de cada meganucleasa para escindir su respectiva secuencia de reconocimiento objetivo o la secuencia de reconocimiento CHO-23/24. También se incluyó un control negativo (bs) en cada ensayo. A) Meganucleasas dirigidas a la secuencia de reconocimiento ORF 7­ 8. B) Meganucleasas dirigidas a la secuencia de reconocimiento ORF 9-10. C) Meganucleasas dirigidas a la secuencia de reconocimiento ORF 11-12. A) Meganucleasas dirigidas a la secuencia de reconocimiento ORF 13-14.
Figura 12. Análisis por PCR de la deleción de repeticiones de hexanucleótidos en células de mamíferos. A) Se introdujeron combinaciones de meganucleasas ORF diseñadas mediante ARN en células HEK293 para determinar si cada par eliminaría la repetición de hexanucleótidos C9ORF72 de forma consistente debido a la religación directa de los salientes compatibles. El ADN se aisló de las células 48 horas después de la transfección y se analizó por PCR utilizando cebadores que flanquean la región de repetición de hexanucleótidos. B) Se introdujeron combinaciones de meganucleasas ORF diseñadas mediante ARN en células ND42496 (fibroblastos derivados de un paciente homocigoto para una expansión de repetición de hexanucleótidos en el gen C9ORF72) para determinar si cada par eliminaría la repetición de hexanucleótidos C9ORF72 de forma consistente debido a la religación directa de los salientes compatibles. El ADN se aisló de las células 48 horas después de la transfección y se analizó por PCR utilizando cebadores que flanquean la región de repetición de hexanucleótidos.
BREVE DESCRIPCION DE LAS SECUENCIAS
La SEQ ID NO: 1 establece la secuencia de aminoácidos de la meganucleasa I-CreI de tipo silvestre. La SEQ ID NO: 2 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición CGG de FMR1.
La SEQ ID NO: 3 establece la secuencia de ácido nucleico de una UTR 5' del gen FMR1 corriente arriba de la repetición CGG.
La SEQ ID NO: 4 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición CGG de FMR1.
La SEQ ID NO: 5 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición CAG de HTT.
La SEQ ID NO: 6 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición CAG de HTT.
La SEQ ID NO: 7 establece la secuencia de ácido nucleico de una región 5' del exón 1 de HTT corriente arriba de la repetición CAG.
La SEQ ID NO: 8 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición CAG de HTT.
La SEQ ID NO: 9 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición CAG de HTT.
La SEQ ID NO: 10 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición CAG de HTT.
La SEQ ID NO: 11 establece la secuencia de ácido nucleico unai región 3' del exón 1 de HTT corriente abajo de la repetición CAG.
La SEQ ID NO: 12 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 13 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 14 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 15 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 16 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 17 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 18 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 19 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 20 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 21 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 22 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 23 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 24 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 25 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 26 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 27 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 28 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 29 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 30 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 31 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 32 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 33 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 34 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 35 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 36 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 37 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 38 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 39 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 40 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 41 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 42 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 43 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 44 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 45 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 46 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 47 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 48 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 49 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 50 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 51 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 52 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 53 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 54 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 55 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 56 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 57 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 58 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 59 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 60 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 61 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 62 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 63 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 64 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 65 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 66 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 67 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 68 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 69 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 70 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 71 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 72 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 73 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición GAA de FXN.
La SEQ ID NO: 74 establece la secuencia de ácido nucleico de un FXN Intrón 1 corriente arriba de la repetición GAA.
La SEQ ID NO: 75 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 76 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 77 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 78 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 79 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 80 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 81 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 82 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 83 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 84 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 85 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 86 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 87 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 88 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO : 89 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO : 90 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO : 91 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO : 92 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO : 93 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO : 94 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO : 95 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición GAA de FXN.
La SEQ ID NO: 96 establece la secuencia de ácido nucleico de un intrón 1 de FXN corriente abajo de la repetición GAA.
La SEQ ID NO : 97 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición DMPK CTG.
La SEQ ID NO : 98 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición DMPK CTG.
La SEQ ID NO : 99 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición DMPK CTG.
La SEQ ID NO: 100 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición DMPK CTG.
La SEQ ID NO: 101 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición DMPK CTG.
La SEQ ID NO: 102 establece la secuencia de ácido nucleico d e una DMPK 3' UTR corriente arriba de la repetición CTG.
La SEQ ID NO: 103 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 104 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 105 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 106 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 107 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 108 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 109 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 110 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 111 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 112 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 113 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 114 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 115 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 116 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 117 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 118 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 119 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO 120 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 121 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 122 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 123 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 124 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 125 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 126 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 127 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 128 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 129 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 130 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 131 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente abajo de la repetición DMPK CTG.
La SEQ ID NO: 132 establece la secuencia de ácido nucleico de una DMPK 3' UTR corriente abajo de la repetición CTG y la región intergénica DMPK-SIX5.
La SEQ ID NO: 133 establece la secuencia de aminoácidos de una meganucleasa FXN 1-2x.63 que comprende una señal de localización de la nucleasa N-terminal derivada del SV40.
La SEQ ID NO: 134 establece la secuencia de aminoácidos de una meganucleasa FXN 11-12x.63 que comprende una señal de localización de la nucleasa N-terminal derivada del SV40.
La SEQ ID NO: 135 establece la secuencia de aminoácidos de una meganucleasa FXN 5-6x.24 que comprende una señal de localización de la nucleasa N-terminal derivada del SV40.
La SEQ ID NO: 136 establece la secuencia de ácido nucleico de una plantilla de PCR de FXN 1-2x.63 para ARNm.
La SEQ ID NO: 137 establece la secuencia de ácido nucleico de una plantilla de PCR de FXN 11-12x.63 para ARNm.
La SEQ ID NO: 138 establece la secuencia de ácido nucleico de una plantilla de PCR de FXN 5-6x.24 para ARNm.
La SEQ ID NO: 139 establece la secuencia de ácido nucleico de un cebador de PCR ascendente de FXN. La SEQ ID NO: 140 establece la secuencia de ácido nucleico de un cebador de PCR inversa de FXN. La SEQ ID NO: 141 establece la secuencia de ácido nucleico de una secuencia de reconocimiento de meganucleasas corriente arriba de la repetición CAG de HTT.
La SEQ ID NO: 142 establece la secuencia de ácido nucleico de una UTR 5' y el sitio de inicio de la traducción del gen FMR1 corriente abajo de la repetición CGG.
La SEQ ID NO: 143 establece la secuencia de aminoácidos de una meganucleasa FXN 1-2x.63.
La SEQ ID NO: 144 establece la secuencia de aminoácidos de una meganucleasa FXN 1-2x.11.
La SEQ ID NO: 145 establece la secuencia de aminoácidos de una meganucleasa FXN 1-2x.73.
La SEQ ID NO: 146 establece la secuencia de aminoácidos de una meganucleasa FXN 1-2x.84.
La SEQ ID NO: 147 establece la secuencia de aminoácidos de una subunidad de unión a FXN1 de meganucleasa FXN 1-2x.63.
La SEQ ID NO: 148 establece la secuencia de aminoácidos de una subunidad de unión a FXN1 de la meganucleasa FXN 1-2x.11.
La SEQ ID NO: 149 establece la secuencia de aminoácidos de una subunidad de unión a FXN1 de la meganucleasa FXN 1-2x.73.
La SEQ ID NO: 150 establece la secuencia de aminoácidos de una subunidad de unión a FXN1 de la meganucleasa FXN 1-2x.84.
La SEQ ID NO: 151 establece la secuencia de aminoácidos de una subunidad de unión a FXN2 de la meganucleasa FXN 1-2x.63.
La SEQ ID NO: 152 establece la secuencia de aminoácidos de una subunidad de unión a FXN2 de la meganucleasa FXN 1-2x.11.
La SEQ ID NO: 153 establece la secuencia de aminoácidos de una subunidad de unión a FXN2 de la meganucleasa FXN 1-2x.73.
La SEQ ID NO: 154 establece la secuencia de aminoácidos de una subunidad de unión a FXN2 de meganucleasa FXN 1-2x.84.
La SEQ ID NO: 155 establece la secuencia de aminoácidos de una meganucleasa FXN 3-4L.34.
La SEQ ID NO: 156 establece la secuencia de aminoácidos de una meganucleasa FXN 3-4L.5.
La SEQ ID NO: 157 establece la secuencia de aminoácidos de una meganucleasa FXN 3-4L.12.
La SEQ ID NO: 158 establece la secuencia de aminoácidos de una meganucleasa FXN 3-4x.312.
La SEQ ID NO: 159 establece la secuencia de aminoácidos de una meganucleasa FXN 3-4x.383.
La SEQ ID NO: 160 establece la secuencia de aminoácidos de una subunidad de unión a FXN3 de la meganucleasa FXN 3-4L.34.
La SEQ ID NO: 161 establece la secuencia de aminoácidos de una subunidad de unión a FXN3 de meganucleasa FXN 3-4L.5.
La SEQ ID NO: 162 establece la secuencia de aminoácidos de una subunidad de unión a FXN3 de la meganucleasa FXN 3-4L.12.
La SEQ ID NO: 163 establece la secuencia de aminoácidos de una subunidad de unión a FXN3 de meganucleasa FXN 3-4x.312.
La SEQ ID NO: 164 establece la secuencia de aminoácidos de una subunidad de unión a FXN3 de meganucleasa FXN 3-4x.383.
La SEQ ID NO: 165 establece la secuencia de aminoácidos de una subunidad de unión a FXN4 de la meganucleasa FXN 3-4L.34.
La SEQ ID NO: 166 establece la secuencia de aminoácidos de una subunidad de unión a FXN4 de la meganucleasa FXN 3-4L.5.
La SEQ ID NO: 167 establece la secuencia de aminoácidos de una subunidad de unión a FXN4 de la meganucleasa FXN 3-4L.12.
La SEQ ID NO: 168 establece la secuencia de aminoácidos de una subunidad de unión a meganucleasa FXN4 de FXN 3-4x.312.
La SEQ ID NO: 169 establece la secuencia de aminoácidos de una subunidad de unión a FXN4 de la meganucleasa FXN 3-4x.383.
La SEQ ID NO: 170 establece la secuencia de aminoácidos de una meganucleasa FXN 5-6L.45.
La SEQ ID NO: 171 establece la secuencia de aminoácidos de una meganucleasa FXN 5-6L.38.
La SEQ ID NO: 172 establece la secuencia de aminoácidos de una meganucleasa FXN 5-6x.24.
La SEQ ID NO: 173 establece la secuencia de aminoácidos de una meganucleasa FXN 5-6x.20.
La SEQ ID NO: 174 establece la secuencia de aminoácidos de una subunidad de unión a FXN5 de la meganucleasa FXN 5-6L.45.
La SEQ ID NO: 175 establece la secuencia de aminoácidos de una subunidad de unión a FXN5 de la meganucleasa FXN 5-6L.38.
La SEQ ID NO: 176 establece la secuencia de aminoácidos de una subunidad de unión a FXN5 de meganucleasa FXN 5-6x.24.
La SEQ ID NO: 177 establece la secuencia de aminoácidos de una subunidad de unión a FXN5 de meganucleasa FXN 5-6x.20.
La SEQ ID NO: 178 establece la secuencia de aminoácidos de una subunidad de unión a FXN6 de la meganucleasa FXN 5-6L.45.
La SEQ ID NO: 179 establece la secuencia de aminoácidos de una subunidad de unión a FXN6 de la meganucleasa FXN 5-6L.38.
La SEQ ID NO: 180 establece la secuencia de aminoácidos de una subunidad de unión a FXN6 de meganucleasa FXN 5-6x.24.
La SEQ ID NO: 181 establece la secuencia de aminoácidos de una subunidad de unión a FXN6 de meganucleasa FXN 5-6x.20.
La SEQ ID NO: 182 establece la secuencia de aminoácidos de una meganucleasa FXN 11-12x.63.
La SEQ ID NO: 183 establece la secuencia de aminoácidos de una meganucleasa FXN 11-12x.99.
La SEQ ID NO: 184 establece a secuencia de aminoácidos de una meganucleasa FXN 11-12x107.
La SEQ ID NO: 185 establece la secuencia de aminoácidos de una meganucleasa FXN 11-12x139.
La SEQ ID NO: 186 establece la secuencia de aminoácidos de una subunidad de unión a meganucleasa FXN11 de FXN 11-12x.63.
La SEQ ID NO: 187 establece la secuencia de aminoácidos de una subunidad de unión a meganucleasa FXN11 de FXN 11-12x.99.
La SEQ ID NO: 188 establece la secuencia de aminoácidos de una subunidad de unión a meganucleasa FXN11 de FXN 11-12x.107.
La SEQ ID NO: 189 establece la secuencia de aminoácidos de una subunidad de unión a meganucleasa FXN11 de FXN 11-12x.139.
La SEQ ID NO: 190 establece la secuencia de aminoácidos de una subunidad de unión a meganucleasa FXN12 de FXN 11-12x.63.
La SEQ ID NO: 191 establece la secuencia de aminoácidos de una subunidad de unión a FXN12 de meganucleasa FXN 11-12x.99.
La SEQ ID NO: 192 establece a secuencia de aminoácidos de una subunidad de unión a meganucleasa FXN12 de FXN 11-12x.107.
La SEQ ID NO: 193 establece la secuencia de aminoácidos de una subunidad de unión a meganucleasa FXN12 de FXN 11-12x.139.
La SEQ ID NO: 194 establece la secuencia de ácido nucleico de una secuencia de reconocimiento ORF 7-8.
La SEQ ID NO: 195 establece la secuencia de ácido nucleico de una secuencia de reconocimiento ORF 9-10.
La SEQ ID NO: 196 establece la secuencia de ácido nucleico de una secuencia de reconocimiento ORF 11-12.
La SEQ ID NO: 197 establece la secuencia de ácido nucleico de una secuencia de reconocimiento ORF 13-14.
La SEQ ID NO: 198 establece la secuencia de aminoácidos de una meganucleasa ORF 7-8x.4.
La SEQ ID NO: 199 establece la secuencia de aminoácidos de una meganucleasa ORF 7-8x.31.
La SEQ ID NO: 200 establece la secuencia de aminoácidos de una meganucleasa ORF 7-8x.45.
La SEQ ID NO: 201 establece la secuencia de aminoácidos de una meganucleasa ORF 7-8x.29.
La SEQ ID NO: 202 establece la secuencia de aminoácidos de una subunidad de unión a ORF7 de meganucleasa ORF 7-8x.4.
La SEQ ID NO: 203 establece la secuencia de aminoácidos de una subunidad de unión a ORF7 de meganucleasa ORF 7-8x.31.
La SEQ ID NO: 204 establece la secuencia de aminoácidos de una subunidad de unión a ORF7 de meganucleasa ORF 7-8x.45.
La SEQ ID NO: 205 establece la secuencia de aminoácidos de una subunidad de unión a ORF7 de meganucleasa ORF 7-8x.29.
La SEQ ID NO: 206 establece la secuencia de aminoácidos de una subunidad de unión a ORF8 de meganucleasa ORF 7-8x.4.
La SEQ ID NO: 207 establece la secuencia de aminoácidos de una subunidad de unión a ORF8 de meganucleasa ORF 7-8x.31.
La SEQ ID NO: 208 establece la secuencia de aminoácidos de una subunidad de unión a ORF8 de meganucleasa ORF 7-8x.45.
La SEQ ID NO: 209 establece la secuencia de aminoácidos de una subunidad de unión a ORF8 de meganucleasa ORF 7-8x.29.
La SEQ ID NO: 210 establece la secuencia de aminoácidos de una meganucleasa ORF 9-10x.15.
La SEQ ID NO: 211 establece la secuencia de aminoácidos de una meganucleasa ORF 9-10x.14.
La SEQ ID NO: 212 establece la secuencia de aminoácidos de una meganucleasa ORF 9-10x.61.
La SEQ ID NO: 213 establece la secuencia de aminoácidos de una meganucleasa ORF 9-10x.77.
La SEQ ID NO: 214 establece la secuencia de aminoácidos de una subunidad de unión a ORF9 de meganucleasa ORF 9-10x.15.
La SEQ ID NO: 215 establece la secuencia de aminoácidos de una subunidad de unión a ORF9 de meganucleasa ORF 9-10x.14.
La SEQ ID NO: 216 establece la secuencia de aminoácidos de una subunidad de unión a ORF9 de meganucleasa ORF 9-10x.61.
La SEQ ID NO: 217 establece la secuencia de aminoácidos de una subunidad de unión a ORF9 de meganucleasa ORF 9-10x.77.
La SEQ ID NO: 218 establece la secuencia de aminoácidos de una subunidad de unión a ORF10 de meganucleasa ORF 9-10x.15.
La SEQ ID NO: 219 establece la secuencia de aminoácidos de una subunidad de unión a ORF 10 de meganucleasa ORF 9-10x.14.
La SEQ ID NO: 220 establece la secuencia de aminoácidos de una subunidad de unión a ORF 10 de meganucleasa ORF 9-10x.61.
La SEQ ID NO: 221 establece la secuencia de aminoácidos de una subunidad de unión a ORF 10 de meganucleasa ORF 9-10x.77.
La SEQ ID NO: 222 establece la secuencia de aminoácidos de una meganucleasa ORF 11-12x.5.
La SEQ ID NO: 223 establece la secuencia de aminoácidos de una meganucleasa ORF 11-12L.1.
La SEQ ID NO: 224 establece la secuencia de aminoácidos de una meganucleasa ORF 11-12L.8.
La SEQ ID NO: 225 establece la secuencia de aminoácidos de una meganucleasa ORF 11-12L.64.
La SEQ ID NO: 226 establece la secuencia de aminoácidos de una subunidad de unión a ORF 11 de meganucleasa ORF 11-12x.5.
La SEQ ID NO: 227 establece la secuencia de aminoácidos de una subunidad de unión a ORF 11 de meganucleasa ORF 11-12L.1.
La SEQ ID NO: 228 establece la secuencia de aminoácidos de una subunidad de unión a ORF 11 de meganucleasa ORF 11-12L.8.
La SEQ ID NO: 229 establece la secuencia de aminoácidos de una subunidad de unión a ORF 11 de meganucleasa ORF 11-12L.64.
La SEQ ID NO: 230 establece la secuencia de aminoácidos de una subunidad de unión a ORF12 de meganucleasa ORF 11-12x.5.
La SEQ ID NO: 231 establece la secuencia de aminoácidos de una subunidad de unión a ORF12 de meganucleasa ORF 11-12L.1.
La SEQ ID NO: 232 establece la secuencia de aminoácidos de una subunidad de unión a ORF12 de meganucleasa ORF 11-12L.8.
La SEQ ID NO: 233 establece la secuencia de aminoácidos de una subunidad de unión a ORF12 de meganucleasa ORF 11-12L.64.
La SEQ ID NO 234 establece la secuencia de aminoácidos de una meganucleasa ORF 13-14x.40.
La SEQ ID NO 235 establece la secuencia de aminoácidos de una meganucleasa ORF 13-14x.77.
La SEQ ID NO 236 establece la secuencia de aminoácidos de una meganucleasa ORF 13-14x.90.
La SEQ ID NO 237 establece la secuencia de aminoácidos de una meganucleasa ORF 13-14x.3.
La SEQ ID NO: 238 establece la secuencia de aminoácidos de una subunidad de unión a ORF 13 de meganucleasa ORF 13-14x.40.
La SEQ ID NO: 239 establece la secuencia de aminoácidos de una subunidad de unión a ORF 13 de meganucleasa ORF 13-14x.77.
La SEQ ID NO: 240 establece la secuencia de aminoácidos de una subunidad de unión a ORF 13 de meganucleasa ORF 13-14x.90.
La SEQ ID NO: 241 establece la secuencia de aminoácidos de una subunidad de unión a ORF 13 de meganucleasa ORF 13-14x.3.
La SEQ ID NO: 242 establece la secuencia de aminoácidos de una subunidad de unión a ORF14 de meganucleasa ORF 13-14x.40.
La SEQ ID NO: 243 establece la secuencia de aminoácidos de una subunidad de unión a ORF14 de meganucleasa ORF 13-14x.77.
La SEQ ID NO: 244 establece la secuencia de aminoácidos de una subunidad de unión a ORF14 de meganucleasa ORF 13-14x.90.
La SEQ ID NO: 245 3 establece la secuencia de aminoácidos de una subunidad de unión a ORF14 de meganucleasa ORF 13-14x.3.
La SEQ ID NO: 246 establece la secuencia de ácido nucleico del intrón 1 de FXN que flanquea la repetición GAA asociada a la Ataxia de Friedreich.
La SEQ ID NO: 247 establece la secuencia de ácido nucleico de clon #1 de FXN que tiene una deleción de 713 pb.
La SEQ ID NO: 248 establece la secuencia de ácido nucleico de un clon #6 de FXN que tiene una deleción de 596 pb y una inserción de 5 pb.
La SEQ ID NO: 249 establece la secuencia de ácido nucleico de un clon #2 de FXN que tiene una deleción de 758 pb y una inserción de 29 pb.
La SEQ ID NO: 250 establece la secuencia de ácido nucleico de un clon #3 de FXN que tiene una deleción de 790 pb.
DESCRIPCION DETALLADA DE LA INVENCION
1.1 Referencias y definiciones
La literatura científica y de patentes a la que se hace referencia en el presente documento establece conocimientos que están disponibles para los expertos en la materia.
La presente invención puede plasmarse en diferentes formas y no debe interpretarse como limitada a las realizaciones expuestas en el presente documento. Más bien, estas realizaciones se proporcionan para que esta divulgación sea exhaustiva y completa, y transmita plenamente el alcance de la invención a los expertos en la técnica. Por ejemplo, las características ilustradas con respecto a una realización pueden ser incorporadas a otras realizaciones, y las características ilustradas con respecto a una realización particular pueden ser eliminadas de esa realización. Además, numerosas variaciones y adiciones a las realizaciones sugeridas en el presente documento serán evidentes para los expertos en la técnica a la luz de la divulgación instantánea, que no se apartan de la invención instantánea.
A menos que se defina de otro modo, todos los términos técnicos y científicos utilizados en el presente documento tienen el mismo significado que comúnmente entiende una persona con conocimientos ordinarios en la técnica a la que pertenece esta invención. La terminología utilizada en la descripción de la presente invención tiene el único propósito de describir realizaciones particulares y no pretende ser limitativa de la invención.
Tal y como se utiliza en el presente documento, "un", "una" o "el/la" puede significar uno o más de uno. Por ejemplo, "una" célula puede significar una sola célula o una multiplicidad de células.
Tal como se utiliza en el presente documentos, a menos que se indique específicamente lo contrario, la palabra "o" se utiliza en el sentido inclusivo de "y/o" y no en el sentido exclusivo de "ya sea/o"
Tal y como se utiliza en el presente documento, los términos "nucleasa" y "endonucleasa" se utilizan indistintamente para referirse a las enzimas naturales o diseñadas que escinden un enlace fosfodiéster dentro de una cadena de polinucleótidos.
Tal y como se utiliza en el presente documento, el término "meganucleasa" se refiere a una endonucleasa derivada de I-CreI. El término meganucleasa, tal como se usa en el presente documento, se refiere a una variante diseñada de I-Crel que se ha modificado en relación con la I-Crel natural con respecto, por ejemplo, a la especificidad de unión al ADN, la actividad de escisión del ADN, la afinidad de unión al ADN o las propiedades de dimerización. Los procedimientos para producir tales variantes modificadas de I-Crel son conocidos en la técnica (por ejemplo el documento WO 2007/047859). Una meganucleasa puede unirse al ADN de doble cadena como un homodímero, como es el caso de la I-CreI de tipo silvestre, o puede unirse al ADN como un heterodímero. Una meganucleasa también puede ser una "meganucleasa de cadena única" en la que un par de dominios de unión al ADN se unen en un solo polipéptido utilizando un enlazador peptídico. El término "endonucleasa de localización" es sinónimo del término "meganucleasa" Las meganucleasas de la invención son sustancialmente no tóxicas cuando se expresan en células sin que se observen efectos deletéreos en la viabilidad celular o reducciones significativas en la actividad de escisión de las meganucleas cuando se miden utilizando los procedimientos descritos en el presente documento.
Tal como se utiliza en el presente documento, el término "meganucleasa de cadena única" se refiere a un polipéptido que comprende un par de subunidades de nucleasa unidas por un enlazador. Una meganucleasa de cadena única tiene la organización: Subunidad N-terminal - Enlazados- Subunidad C-terminal. Las dos subunidades de meganucleasa, cada una de las cuales se deriva de I-CreI, generalmente no serán idénticas en la secuencia de aminoácidos y reconocerán secuencias de ADN no idénticas. Así, las meganucleasas de cadena única suelen escindir secuencias de reconocimiento pseudopalindrómicas o no palindrómicas. Una meganucleasa de cadena única se puede denominar "heterodímero de cadena única" o "meganucleasa heterodimérica de cadena única", aunque en realidad no es dimérica. Para mayor claridad, a menos que se especifique lo contrario, el término "meganucleasa" puede referirse a una meganucleasa dimérica o de cadena única.
Tal como se utiliza en el presente documento, el término "enlazador" se refiere a una secuencia peptídica exógena utilizada para unir dos subunidades de meganucleasas en un solo polipéptido. Un enlazador puede tener una secuencia que se encuentra en las proteínas naturales, o puede ser una secuencia artificial que no se encuentra en ninguna proteína natural. Un enlazador puede ser flexible y carecer de estructura secundaria o puede tener una propensión a formar una estructura tridimensional específica bajo condiciones fisiológicas. Un enlazador puede incluir, sin limitación, los comprendidos en Patente de EE. Uu . No. 8,445,251 En algunas realizaciones, un enlazador puede tener una secuencia de aminoácidos que comprende los residuos 154-195 de una cualquiera de las SEQ ID NOs: 143­ 146, 155-159, 170-173, 182-185, 198-201,210-213, 222-225, o 234-237.
Tal y como se utiliza en el presente documento, el término "TALEN" se refiere a una endonucleasa que comprende un dominio de unión al ADN con 16-22 repeticiones del dominio TAL fusionado a cualquier porción del dominio de la nucleasa FokI.
Tal como se utiliza en el presente documento, el término "TALEN compacto" se refiere a una endonucleasa que comprende un dominio de unión a ADN con 16-22 repeticiones del dominio TAL fusionadas en cualquier orientación con cualquier porción de la endonucleasa autodirigida I-TevI.
Tal como se utiliza en el presente documento, el término "nucleasa de dedos de zinc" o "ZFN" se refiere a una endonucleasa quimérica que comprende un dominio de unión al ADN de dedos de zinc fusionado con el dominio nucleasa de la enzima de restricción FokI. El dominio de dedo de zinc se puede rediseñar a través de medios racionales o experimentales para producir una proteína que se une a una secuencia de ADN predeterminada ~18 pares de bases de longitud, que comprende un par de medios sitios de nueve pares de bases separados por 2-10 pares de bases. La escisión por parte de una nucleasa de dedo de zinc puede crear un extremo romo o una sobrecarga 5' de longitud variable (frecuentemente cuatro pares de bases).
Tal y como se utiliza en el presente documento, el término "CRISPR" se refiere a una endonucleasa con base en la caspasa que comprende una caspasa, tal como Cas9, y un ARN guía que dirige la escisión del ADN de la caspasa al hibridarse con un sitio de reconocimiento en el ADN genómico.
Tal y como se utiliza en el presente documento, el término "megaTAL" se refiere a una endonucleasa de cadena única que comprende un dominio de unión al ADN efector similar al activador de la transcripción (TALE) con una endonucleasa de localización específica de la secuencia diseñada.
Tal y como se utiliza en el presente documento, con respecto a una proteína, el término "recombinante" indica que tiene una secuencia de aminoácidos alterada como resultado de la aplicación de técnicas de ingeniería genética a los ácidos nucleicos que codifican la proteína, y a las células u organismos que expresan la proteína. Con respecto a un ácido nucleico, el término "recombinante" indica que tiene una secuencia de ácido nucleico alterada como resultado de la aplicación de técnicas de ingeniería genética. Las técnicas de ingeniería genética incluyen, pero no se limitan a, las tecnologías de PCR y de clonación de ADN; la transfección, la transformación y otras tecnologías de transferencia de genes; la recombinación homóloga; la mutagénesis dirigida al sitio; y la fusión de genes. De acuerdo con esta definición, una proteína que tiene una secuencia de aminoácidos idéntica a una proteína de origen natural, pero producida por clonación y expresión en un huésped heterólogo, no se considera recombinante.
Tal y como se utiliza en el presente documento, el término "silvestre" se refiere a cualquier forma natural de una meganucleasa. El término "tipo silvestre" no pretende indicar la variante alélica más común de la enzima en la naturaleza sino, más bien, cualquier variante alélica encontrada en la naturaleza. Las endonucleasas de localización de tipo silvestre se distinguen de las meganucleasas recombinantes o de origen no natural.
El término "tipo silvestre" también puede referirse al alelo natural más común (es decir, secuencia de polinucleótidos) en la población de alelos del mismo tipo de gen, en el que un polipéptido codificado por el alelo de tipo silvestre tiene sus funciones originales. El término "tipo silvestre" también se refiere a un polipéptido codificado por un alelo de tipo silvestre. Los alelos (es decir, polinucleótidos) y polipéptidos de tipo silvestre se distinguen de los alelos y polipéptidos mutantes o variantes, que comprenden una o más mutaciones y/o sustituciones en relación con las secuencias de tipo silvestre. Mientras que un alelo o polipéptido de tipo silvestre puede conferir un fenotipo normal en un organismo, un alelo o polipéptido mutante o variante puede, en algunos casos, conferir un fenotipo alterado.
Tal y como se utiliza en el presente documento, el término "modificado genéticamente" se refiere a una célula u organismo en el que, o en un ancestro del mismo, se ha modificado deliberadamente una secuencia de ADN genómico mediante tecnología recombinante. Tal y como se utiliza en el presente documento, el término "modificado genéticamente" engloba el término "transgénico"
Tal como se utiliza en el presente documento con respecto a las proteínas recombinantes, el término "modificación" indica cualquier inserción, deleción o sustitución de un residuo de aminoácido en la secuencia recombinante en relación con una secuencia de referencia (por ejemplo, una secuencia nativa o de tipo silvestre).
Tal y como se utiliza en el presente documento, el término "secuencia de reconocimiento" se refiere a una secuencia de ADN que está unida y escindida por una endonucleasa. En el caso de una meganucleasa, una secuencia de reconocimiento comprende un par de "medios sitios" invertidos de 9 pares de bases que están separados por cuatro pares de bases. En el caso de una meganucleasa de cadena única, el dominio N-terminal de la proteína contacta con un primer medio sitio y el dominio C-terminal de la proteína contacta con un segundo medio sitio. La escisión por parte de una meganucleasa produce cuatro "salientes" 3' de pares de bases. Los "salientes" o "extremos pegajosos" son segmentos cortos de ADN de una sola cadena que pueden producirse por la escisión de una endonucleasa de una secuencia de ADN de doble cadena. En el caso de las meganucleasas y las meganucleasas de cadena única derivadas de I-CreI, el saliente comprende las bases 10-13 de la secuencia de reconocimiento de 22 pares de bases. En el caso de un TALEN compacto, la secuencia de reconocimiento comprende una primera secuencia CNNNGN que es reconocida por el dominio I-TevI, seguida de un espaciador inespecífico de 4-16 pares de bases de longitud, seguido de una segunda secuencia de 16-22 pb de longitud que es reconocida por el dominio del efector TAL (esta secuencia suele tener una base 5' T). La escisión por un TALEN compacto produce dos pares de bases 3' en salientes. En el caso de un CRISPR, la secuencia de reconocimiento es la secuencia, normalmente de 16 a 24 pares de bases, a la que se une el ARN guía para dirigir la escisión de Cas9. La escisión mediante CRISPR produjo extremos romos. En el caso de un dedo de zinc, los dominios de unión al ADN reconocen típicamente una secuencia de reconocimiento de 18 pb que comprende un par de " medios sitios" de nueve pares de bases separados por 2-10 pares de bases y la escisión por parte de la nucleasa crea un extremo romo o un saliente 5' de longitud variable (frecuentemente cuatro pares de bases).
Tal como se utiliza en el presente documento, el término "sitio objetivo" o "secuencia objetivo" se refiere a una región del ADN cromosómico de una célula que comprende una secuencia de reconocimiento para una meganucleasa.
Tal como se utiliza en el presente documento, el término "afinidad de unión al ADN" o "afinidad de unión" indica la tendencia de una meganucleasa a asociarse de forma no covalente con una molécula de ADN de referencia (por ejemplo, una secuencia de reconocimiento o una secuencia arbitraria). La afinidad de unión se mide por una constante de disociación, Kd. Tal como se utiliza en el presente documento, una nucleasa tiene una afinidad de unión "alterada" si la Kd de la nucleasa para una secuencia de reconocimiento de referencia aumenta o disminuye en una cantidad estadísticamente significativa (p<0,05) en relación con una nucleasa de referencia.
Tal como se utiliza en el presente documento, el término "especificidad" indica la capacidad de una meganucleasa para reconocer y escindir moléculas de ADN de doble cadena sólo en una secuencia particular de pares de bases denominada secuencia de reconocimiento, o sólo en un conjunto particular de secuencias de reconocimiento. El conjunto de secuencias de reconocimiento compartirá ciertas posiciones conservadas o motivos de secuencia, pero puede ser degenerado en una o más posiciones. Una meganucleasa altamente específica es capaz de escindir sólo una o muy pocas secuencias de reconocimiento. La especificidad puede determinarse por cualquier procedimiento conocido en la técnica. Tal como se utiliza en el presente documento, una meganucleasa tiene una especificidad "alterada" si se une a una secuencia de reconocimiento y la escinde, que no se une a una meganucleasa de referencia (por ejemplo, una de tipo silvestre) ni la escinde bajo condiciones fisiológicas, o si la tasa de escisión de una secuencia de reconocimiento aumenta o disminuye en una cantidad biológicamente significativa (por ejemplo, al menos 2*, o 2*-10*) en relación con una meganucleasa de referencia.
Tal y como se utiliza en el presente documento, el término "recombinación homóloga" o "HR" se refiere al proceso celular natural en el que se repara una rotura de ADN de doble cadena utilizando una secuencia de ADN homóloga como plantilla de reparación (véase, por ejemplo Cahill et al. (2006), Front. Biosci. 11:1958-1976). La secuencia de ADN homóloga puede ser una secuencia cromosómica endógena o un ácido nucleico exógeno que fue entregado a la célula.
Como se usa en el presente documento, el término "unión final no homóloga" o "NHEJ" se refiere al proceso celular natural en el que se repara una rotura de ADN de doble cadena mediante la unión directa de dos segmentos de ADN no homólogos (véase, por ejemplo, Cahill et al. (2006), Front. Biosci. 11:1958-1976). La reparación del ADN mediante la unión de extremos no homólogos es propensa a los errores y con frecuencia da lugar a la adición o eliminación no prevista de secuencias de ADN en el lugar de la reparación.
Tal y como se utiliza en el presente documento, el término "ligación nueva" se refiere a un proceso en el que dos extremos de ADN producidos por un par de roturas de doble cadena de ADN se unen covalentemente entre sí con la pérdida de la secuencia de a Dn intermedia pero sin la ganancia o pérdida de ninguna secuencia de ADN adicional. En el caso de un par de roturas de ADN que se producen con salientes de una sola hebra, la ligación nueva puede proceder a través de la fusión de salientes complementarios seguido de la unión covalente de los extremos 5' y 3' por una ADN ligasa. La ligación nueva se distingue de la NHEJ en que no da lugar a la adición o eliminación no prevista de ADN del sitio de reparación.
Tal como se utiliza en el presente documento, el término "deleción precisa" se refiere a una deleción de un segmento de ADN cromosómico en el que, después de la introducción de roturas de doble cadena que flanquean el segmento que se va a eliminar por la primera nucleasa diseñada y la segunda nucleasa diseñada, el cromosoma se vuelve a ligar sin pérdida de ningún par de bases adicional (por ejemplo, por la actividad de la exonucleasa que degrada los salientes 3' o 5') o la inserción de cualquier par de bases adicional (por ejemplo, por recombinación homóloga). La eliminación precisa permite predecir la secuencia final del cromosoma ligado nuevamente con base en la secuencia original del cromosoma y en los sitios de corte de las nucleasas.
Como se usa en el presente documento con respecto a las secuencias de aminoácidos y las secuencias de ácidos nucleicos, los términos "identidad porcentual", "identidad de secuencia", "similitud porcentual", "similitud de secuencia" y similares se refieren a una medida del grado de similitud de dos secuencias con base en una alineación de las secuencias que maximiza la similitud entre los residuos de aminoácidos o nucleótidos alineados, y que es una función de la cantidad de residuos o nucleótidos idénticos o similares, la cantidad de residuos o nucleótidos totales, y la presencia y longitud de las brechas en el alineamiento de secuencias. Existen diversos algoritmos y programas informáticos para determinar la similitud de las secuencias utilizando parámetros estándar. Como se utiliza en el presente documento, la similitud de la secuencia se mide utilizando el programa BLASTp para las secuencias de aminoácidos y el programa BLASTn para las secuencias de ácidos nucleicos, ambos disponibles a través del National Center for Biotechnology Information (www.ncbi.nlm.nih.gov/), y que se describen, por ejemplo, en, Altschul et al. (1990), J. Mol. Biol. 215:403-410 Gish y States (1993), Nature Genet. 3:266-272 Madden et al. (1996), Meth. Enzymol.266:131-141 Altschul et al. (1997), Nucleic Acids Res. 25:3389-3402); Zhang et al. (2000), J. Comput. Biol.
7(1-2):203-14. Como se usa en el presente documento, el porcentaje de similitud de dos secuencias de aminoácidos es la puntuación con base en los siguientes parámetros para el algoritmo BLASTp: tamaño de palabra = 3; penalización por apertura de brecha=— 11; penalización de extensión de brecha=— 1; y matriz de puntuación=BLOSUM62. Tal y como se utiliza en el presente documento, el porcentaje de similitud de dos secuencias de ácidos nucleicos es la puntuación con base en los siguientes parámetros del algoritmo BLASTn: tamaño de la palabra=11; penalización de apertura de brecha=-5; penalización de extensión de brecha =-2; recompensa por coincidencia=1; y penalización por falta de coincidencia=-3.
Tal como se utiliza en el presente documento con respecto a las modificaciones de dos proteínas o secuencias de aminoácidos, el término "correspondiente a" se utiliza para indicar que una modificación especificada en la primera proteína es una sustitución del mismo residuo de aminoácido que en la modificación en la segunda proteína, y que la posición de aminoácidos de la modificación en las primeras proteínas corresponde o se alinea con la posición de aminoácidos de la modificación en la segunda proteína cuando las dos proteínas se someten a alineaciones de secuencia estándar (por ejemplo, utilizando el programa BLASTp). Así, la modificación del residuo "X" por el aminoácido "A" en la primera proteína corresponderá a la modificación del residuo "Y" por el aminoácido "A" en la segunda proteína si los residuos X e Y se corresponden entre sí en una alineación de secuencias, y a pesar del hecho de que X e Y pueden ser números diferentes.
Tal como se utiliza en el presente documento, el término "medio sitio de reconocimiento", "medio sitio de secuencia de reconocimiento" o simplemente "medio sitio" significa una secuencia de ácido nucleico en una molécula de ADN de doble cadena que es reconocida por un monómero de una meganucleasa homodimérica o heterodimérica, o por una subunidad de una meganucleasa de cadena única.
Tal como se utiliza en el presente documento, el término "región hipervariable" se refiere a una secuencia localizada dentro de un monómero o subunidad de meganucleasa que comprende aminoácidos con una variabilidad relativamente alta. Una región hipervariable puede comprender aproximadamente 50-60 residuos contiguos, aproximadamente 53-57 residuos contiguos, o preferentemente aproximadamente 56 residuos. En algunas realizaciones, los residuos de una región hipervariable pueden corresponder a las posiciones 24-79 o a las posiciones 215-270 de una cualquiera de las SEQ ID NOs: 143-146, 155-159, 170-173, 182-185, 198-201, 210-213, 222-225, o 234-237. Una región hipervariable puede comprender uno o más residuos que entran en contacto con bases de ADN en una secuencia de reconocimiento y pueden ser modificados para alterar la preferencia de bases del monómero o subunidad. Una región hipervariable también puede comprender uno o más residuos que se unen a la columna vertebral del ADN cuando la meganucleasa se asocia con una secuencia de reconocimiento de ADN de doble cadena. Dichos residuos pueden modificarse para alterar la afinidad de unión de la meganucleasa con el esqueleto del ADN y la secuencia de reconocimiento objetivo. En diferentes realizaciones de la invención, una región hipervariable puede comprender entre 1-20 residuos, o más, que presentan variabilidad y pueden ser modificados para influir en la preferencia de bases y/o en la afinidad de unión al ADN.
Tal y como se utiliza en el presente documento, los términos "FXN" o "gen de la frataxina" se refieren a un gen humano localizado en el cromosoma 9. En los seres humanos, el gen FXN está identificado por el NCBI como Gene ID No.
2395 y está localizado desde el par de bases 69.035.563 hasta el par de bases 69.100.178 en el cromosoma 9.
Tal y como se utiliza en el presente documento, el término "HTT" o "gen de la huntingtina" se refiere a un gen humano localizado en el cromosoma 4. En los seres humanos, el gen HTT está identificado por el NCBI como Gene ID No.
3064 y está localizado desde el par de bases 3.074.510 hasta el par de bases 3.243.960 en el cromosoma 4.
Tal como se utiliza en el presente documento, el término "FMR1" o "gen del retraso mental del cromosoma X frágil 1" se refiere a un gen humano localizado en el cromosoma X. En los seres humanos, el gen FMR1 está identificado por el NCBI con el número de identificación del gen 2332 y está localizado desde el par de bases 147.911.951 hasta el par de bases 147.951.127 en el cromosoma X.
Tal como se utiliza en el presente documento, el término "DMPK" o "gen de la proteína quinasa de la distrofia miotónica" se refiere a un gen humano localizado en el cromosoma 19. En los seres humanos, el gen DMPK está identificado por el NCBI como Gene ID No. 1760 y está localizado desde el par de bases 46.272.975 hasta el par de bases 45.782.557 en el cromosoma 19.
Tal y como se utiliza en el presente documento, el término "ZNF9" se refiere a un gen humano situado en el cromosoma 3 que también se denomina CNBP o proteína de unión a ácidos nucleicos de tipo CCHC. En los seres humanos, el gen ZNF9 está identificado por el NCBI como Gene ID No. 7555 y está localizado desde el par de bases 129.167.815 hasta el par de bases 129.183.967 en el cromosoma 3.
Tal como se utiliza en el presente documento, el término "C9ORF72" se refiere a un gen humano situado en el cromosoma 9. En los seres humanos, el gen C9ORF72 está identificado por el NCBI como Gene ID No. 203228 y está localizado desde el par de bases 27.546.546 hasta el par de bases 27.573.886 en el cromosoma 9.
Los términos "constructo de ADN recombinante", "constructo recombinante", "casete de expresión", "constructo de expresión", "constructo quimérico" y "fragmento de ADN recombinante" se utilizan indistintamente en el presente documento y son fragmentos de ácido nucleico. Un constructo recombinante comprende una combinación artificial de fragmentos de ácido nucleico, incluyendo, sin limitación, secuencias reguladoras y codificadoras que no se encuentran juntas en la naturaleza. Por ejemplo, un constructo de ADN recombinante puede comprender secuencias reguladoras y secuencias codificadoras derivadas de fuentes diferentes, o secuencias reguladoras y secuencias codificadoras derivadas de la misma fuente y dispuestas de manera diferente a la que se encuentra en la naturaleza. Este constructo puede utilizarse por sí mismo o junto con un vector.
Tal como se utiliza en el presente documento, un "vector" o "vector de ADN recombinante" puede ser un constructo que incluye un sistema de replicación y secuencias que son capaces de transcribir y traducir una secuencia codificadora de polipéptidos en una célula anfitriona determinada. Si se utiliza un vector, la elección del mismo depende del procedimiento que se utilizará para transformar las células anfitrionas, como es bien sabido por los expertos en la técnica. Los vectores pueden incluir, sin limitación, vectores plasmídicos y vectores AAV recombinantes, o cualquier otro vector conocido en esa técnica adecuada para entregar un gen que codifica una meganucleasa de la invención a una célula diana. La persona experta conoce bien los elementos genéticos que deben estar presentes en el vector para transformar, seleccionar y propagar con éxito las células anfitrionas que comprenden cualquiera de los nucleótidos aislados o secuencias de ácido nucleico de la invención.
Tal como se utiliza en el presente documento, un "vector" también puede referirse a un vector viral. Los vectores virales pueden incluir, sin limitación, vectores retrovirales, vectores lentivirales, vectores adenovirales y vectores virales adenoasociados (AAV).
Tal como se utiliza en el presente documento con respecto a las modificaciones de dos proteínas o secuencias de aminoácidos, el término "correspondiente a" se utiliza para indicar que una modificación especificada en la primera proteína es una sustitución del mismo residuo de aminoácido que en la modificación en la segunda proteína, y que la posición de aminoácidos de la modificación en las primeras proteínas corresponde o se alinea con la posición de aminoácidos de la modificación en la segunda proteína cuando las dos proteínas se someten a alineaciones de secuencia estándar (por ejemplo, utilizando el programa BLASTp). Así, la modificación del residuo "X" por el aminoácido "A" en la primera proteína corresponderá a la modificación del residuo "Y" por el aminoácido "A" en la segunda proteína si los residuos X e Y se corresponden entre sí en una alineación de secuencias, y a pesar del hecho de que X e Y pueden ser números diferentes.
Tal como se utiliza en el presente documento, los términos "tratamiento" o "tratar a un sujeto" se refieren a la administración de una nucleasa diseñada de la invención, o un ácido nucleico que codifica una nucleasa diseñada de la invención, a un sujeto que tiene un trastorno de expansión de repetición de nucleótidos. Dicho tratamiento da lugar a una reducción del número de repeticiones de nucleótidos patógenos en un número de células suficiente para proporcionar un alivio parcial o completo de uno o más síntomas de una enfermedad resultante de la expansión de la repetición de nucleótidos. En algunos aspectos, una nucleasa diseñada de la invención, o un ácido nucleico que codifica la misma, se administra durante el tratamiento como una composición farmacéutica.
Tal como se utiliza en el presente documento, la recitación de un intervalo numérico para una variable pretende transmitir que la invención puede practicarse con la variable igual a cualquiera de los valores dentro de ese intervalo. Así, para una variable que es intrínsecamente discreta, la variable puede ser igual a cualquier valor entero dentro del intervalo numérico, incluyendo los puntos finales del rango. Del mismo modo, para una variable que es intrínsecamente continua, la variable puede ser igual a cualquier valor real dentro del rango numérico, incluyendo los puntos finales del intervalo. A modo de ejemplo, y sin limitación, una variable que se describe con valores entre 0 y 2 puede tomar los valores 0, 1 o 2 si la variable es intrínsecamente discreta, y puede tomar los valores 0,0, 0,1, 0,01, 0,001, o cualquier otro valor real ^0 y ^2 si la variable es intrínsecamente continua.
Tal como se utiliza en el presente documentos, a menos que el contexto indique claramente lo contrario, la palabra "o" se utiliza en el sentido inclusivo de "y/o" y no en el sentido exclusivo de "cualquiera/o"
2.1 Principio de Deleción de la Expansión de Repeticiones de Nucleótidos
La presente invención se basa, en parte, en la hipótesis de que los trastornos por expansión de repeticiones de nucleótidos pueden corregirse eliminando permanentemente la región de repetición del genoma. La región repetida puede eliminarse mediante la administración de un par de endonucleasas específicas (o los genes que las codifican) a las células de un paciente, de forma que las nucleasas corten los sitios de ADN situados antes y después de la repetición y liberen el fragmento intermedio del genoma. Sorprendentemente, si se seleccionan un par de nucleasas que generen salientes idénticos, la secuencia del genoma resultante tras la deleción del fragmento intermedio tendrá con frecuencia una secuencia bien definida resultante de la ligadura directa de los extremos del cromosoma roto mediada por los salientes compatibles.
2.2 Nucleasas para Eliminar Exones
Se sabe en la técnica que es posible usar una nucleasa específica de sitio para hacer una ruptura de ADN en el genoma de una célula viva y que tal ruptura de ADN puede dar como resultado una modificación permanente del genoma a través de la reparación NHEJ mutagénica o a través de HR con una secuencia de ADN transgénico. La presente invención, sin embargo, implica la coexpresión de un par de nucleasas en la misma célula. Sorprendentemente, se descubrió que un par de nucleasas dirigidas a sitios de ADN muy próximos entre sí (separados por menos de 10.000 pares de bases) pueden extirpar del genoma el fragmento de ADN intermedio.
También sorprendentemente, se encuentra que la escisión del ADN utilizando un par de nucleasas frecuentemente procede a través de un mecanismo que involucra los salientes de ADN de cadena única generados por las nucleasas. En experimentos que implican un par de meganucleasas que generan salientes de ADN complementarios, se descubrió que la secuencia del Salientes se conservaba con frecuencia tras la escisión del fragmento y la reparación de los extremos cromosómicos resultantes. El mecanismo de reparación del ADN, en este caso, parece ser la religación directa de los extremos rotos, lo que no se ha observado en las células de mamíferos. No se observó una deleción y religación tan precisa cuando se utilizó un par de meganucleasas que generaron salientes no idénticos (véase el Ejemplo 1). Así, en una realización preferida, el par de nucleasas utilizado para la escisión de repeticiones de nucleótidos se selecciona para generar salientes complementarios.
Para extirpar un exón eficientemente, el par de sitios de corte de la nucleasa debe estar relativamente cerca. En general, cuanto más cerca estén los dos sitios, más eficiente será el proceso. Así, la realización preferida de la invención utiliza un par de nucleasas que cortan secuencias que están a menos de 10.000 pares de bases o, más preferentemente, a 5.000 pares de bases o, aún más preferentemente, a menos de 2.500 pares de bases o, más preferentemente, a menos de 1.500 pares de bases.
Como se muestra en la Figura 2, una variedad de diferentes tipos de nucleasas es util para poner en práctica la invención. Las Figuras 2A y 2B muestran ejemplos de cómo puede practicarse la invención utilizando un par de nucleasas CRISPR. En este caso, la invención puede practicarse entregando tres genes a la célula: un gen que codifica la proteína Cas9 y un gen que codifica cada uno de los dos ARN guía. Las CRISPR escinden el ADN y dejan extremos romos que, por lo general, no se ligan de nuevo limpiamente. Como resultado, el producto final tendrá generalmente mutaciones adicionales de inserción y/o deleción ("indel") en la secuencia. En una realización alternativa, puede utilizarse una "nicasa CRISPR", como se indica en Ran et al. (2013), Cell 154:1380-9. Para poner en práctica esta realización, es necesario expresar cuatro ARN guía en la célula, dos de los cuales son complementarios a la secuencia corriente arriba del exón y dos de los cuales son complementarios a la secuencia corriente abajo del exón. En esta realización, los dos pares de ARN guía se hibridan con hebras complementarias en la región objetivo y cada miembro del par produce una muesca de ADN de cadena única en una de las cadenas, equivalente a una rotura de doble cadena. Así, los dos pares de guías dan lugar a dos pares de muescas. Además, las muescas de cada par pueden estar desplazadas unas de otras para obtener un saliente de una sola cadena que es ventajoso para la práctica de la invención. Los procedimientos para fabricar las CRISPR y nicasas CRISPR que reconocen sitios de ADN predeterminados son conocidos en la técnica, por ejemplo Ran et al. (2013), Nat. Protoc.
8:2281-308.
En realizaciones alternativas, como se muestra en la Figura 2C y 2D, el par de nucleasas puede ser las TALEN compactas. Una TALEN compacta comprende un dominio de unión al ADN del efector TAL (TALE) fusionado en su extremo N o C al dominio de escisión de I-TevI, que comprende al menos los residuos 1-96 y preferentemente los residuos 1-182 de I-TevI. El dominio de escisión de I-TevI reconoce y corta secuencias de ADN de la forma 5'-CNbNNtG-3', donde "b" representa el sitio de escisión de la cadena inferior y "t" representa el sitio de escisión de la cadena superior, y donde "N" es cualquiera de las cuatro bases. Una TALEN compacta, por lo tanto, se escinde para producir dos pares de bases 3' salientes. En una realización preferida, para las deleciones de secuencias dentro de un exón, el par TALEN compacto, se selecciona para crear salientes complementarios que puedan ligarse de nuevo directamente. Los procedimientos para fabricar dominios TALE que se unen a sitios predeterminados del ADN son conocidos en la técnica, por ejemplo, Reyon et al. (2013), Nat. Biotechnol. 30:460-5. En otra realización alternativa, se puede utilizar un par de TALEN para practicar la invención. Una TALEN puede comprender un dominio de unión a ADN que comprende 16-22 repeticiones del dominio TAL fusionadas con cualquier porción del dominio de nucleasa FokI.
En otra realización alternativa, se puede utilizar un par de nucleasas de dedos de zinc para practicar la invención. Las nucleasas de dedo de zinc se unen a una secuencia de ADN predeterminada de ~18 pares de bases y comprenden un par de medios sitios de 9 pares de bases separados por 2-10 pares de bases. La escisión por parte de una nucleasa de dedo de zinc puede crear un extremo romo o una sobrecarga 5' de longitud variable (frecuentemente cuatro pares de bases).
En otra realización alternativa, se puede utilizar un par de megaTAL para practicar la invención. Las megaTAL son endonucleasas de cadena única que comprenden un dominio de unión al ADN efector similar al activador de la transcripción (TALE) con una endonucleasa de localización específica de la secuencia diseñada.
En la realización preferida, tal como se muestra en la Figura 2E, las nucleasas utilizadas para practicar la invención son un par de meganucleasas de cadena simple. Una meganucleasa de cadena única comprende un dominio N-terminal y un dominio C-terminal unidos por un péptido conector. Cada uno de los dos dominios reconoce la mitad de la secuencia de reconocimiento y el sitio de escisión del ADN está en el medio de la secuencia de reconocimiento cerca de la interfaz de las dos subunidades. Las roturas de la cadena de ADN están desplazadas cuatro pares de bases, de modo que la escisión del ADN por una meganucleasa genera un par de salientes de la cadena única de cuatro pares de bases. En una realización preferida, se seleccionan meganucleasas de cadena única que cortan secuencias de reconocimiento con salientes complementarios. En las Tablas 2-11 se enumeran ejemplos de secuencias de reconocimiento para el síndrome X frágil, la enfermedad de Huntington, la ataxia de Friedreich, la distrofia miotónica y la ELA.
La Tabla 2 enumera una única secuencia de reconocimiento de ejemplo no limitativo (SEQ ID NO: 2) para una nucleasa diseñada, en particular una meganucleasa, que puede encontrarse en la región objetivo corriente arriba del gen FMR1 entre el sitio de inicio de la transcripción y la repetición CGG responsable del síndrome del cromosoma X frágil (SEQ ID NO: 3). La Tabla 3 enumera una única secuencia de reconocimiento de ejemplo no limitativo (SEQ ID NO: 4) para una nucleasa diseñada, en particular una meganucleasa, que puede encontrarse en la región objetivo corriente abajo del gen FMR1 entre la repetición CGG responsable del síndrome de cromosoma X frágil y el inicio de la traducción (SEQ ID NO: 5). Por lo tanto, se espera que la coexpresión de un par de nucleasas que reconocen y cortan secuencias en las regiones objetivo FMR1 corriente arriba (SEQ ID NO: 3) y corriente abajo (SEQ ID NO: 5) en una célula elimine la región de repetición CGG sin interrumpir los sitios de inicio de transcripción o traducción.
La Tabla 4 enumera ejemplos no limitantes de secuencias de reconocimiento para nucleasas diseñadas, particularmente meganucleasas, que pueden encontrarse en la región del gen HTT humano entre el sitio de inicio de la traducción y la repetición de trinucleótidos CAG asociada con la enfermedad de Huntington (SEQ ID NO: 7). La Tabla 5 enumera ejemplos no limitantes de secuencias de reconocimiento para nucleasas diseñadas, particularmente meganucleasas, que pueden encontrarse en la región del gen HTT humano corriente abajo de la repetición de trinucleótidos CAG, pero corriente arriba del extremo 3' del exón 1 (SEQ ID NO: 11). Así, expresando un par de nucleasas que cortan un sitio corriente arriba en SEQ ID NO: 7 y un sitio corriente abajo en SEQ ID NO: 11 se espera que elimine la repetición de trinucleótidos del gen. Dado que la repetición se encuentra en una porción traducida del gen HTT, es preferible eliminar la repetición de forma que el marco de lectura se mantenga tras la escisión de la región que interviene en los dos sitios de la endonucleasa. En concreto, la secuencia de ADN codificante o exón que se elimina debe ser un múltiplo de 3 pares de bases de longitud.
La Tabla 6 enumera ejemplos no limitantes de secuencias de reconocimiento para nucleasas diseñadas, particularmente meganucleasas, que pueden encontrarse en la región del gen humano FXN Intrón 1 corriente arriba de la repetición de trinucleótidos GAA responsable de la Ataxia de Friedreich (SEQ ID NO: 74). La Tabla 7 enumera ejemplos no limitantes de secuencias de reconocimiento para nucleasas diseñadas, particularmente meganucleasas, que pueden encontrarse en la región del gen humano fX n Intrón 1 en los primeros 1.000 pares de bases corriente abajo de la repetición de trinucleótidos GAA (SEQ ID NO: 96). Esta es la región preferida para dirigir una nucleasa corriente abajo de la repetición GAA en el gen FXN, aunque la invención también incorpora nucleasas que reconocen secuencias de ADN que están en el Intrón 1 pero más de 1.000 pares de bases corriente abajo de la repetición. Así, expresando un par de nucleasas que cortan un sitio corriente arriba en SEQ ID NO: 74 y un sitio corriente abajo en SEQ ID NO: 96 se espera que elimine la repetición de trinucleótidos del gen. En las realizaciones preferidas, las secuencias de reconocimiento corriente arriba y corriente abajo se seleccionan de tal manera que la escisión por el par de nucleasas cognadas generará salientes de cadena única idénticos. Por ejemplo, puede seleccionarse una nucleasa diseñada, en particular una meganucleasa, que reconozca y corte la SEQ ID NO: 34 corriente arriba de la repetición de trinucleótidos FXN y esta nucleasa puede ser emparejada con una segunda nucleasa diseñada, particularmente una meganucleasa, que reconoce y corta la SEQ ID NO: 89 corriente abajo de la repetición. Dado que ambas nucleasas diseñadas pueden generar salientes de 3' con la secuencia 5'-GTGT-3', la escisión simultánea por ambas nucleasas en la misma célula generará salientes compatibles que pueden ligarse de nuevo entre sí tras la eliminación de la secuencia intermedia. Del mismo modo, una nucleasa diseñada, particularmente una meganucleasa, que reconoce la SEQ ID NO: 63 puede ser emparejada ventajosamente con una nucleasa diseñada, particularmente una meganucleasa, que reconoce la SEQ ID NO: 80 porque ambas nucleasas pueden generar salientes compatibles con la secuencia 5'-ACAC-3'.
La Tabla 8 enumera ejemplos no limitantes de secuencias de reconocimiento para nucleasas diseñadas, particularmente meganucleasas, que pueden encontrarse en la región de la región no traducida (UTR) 3' del gen DMPK humano corriente arriba de la repetición de trinucleótidos CTG asociada a la distrofia miotónica (SEQ ID NO: 102). La Tabla 9 enumera ejemplos no limitantes de secuencias de reconocimiento para nucleasas diseñadas, particularmente meganucleasas, que pueden encontrarse en la región 3' no traducida (UTR) del gen DMPK humano corriente abajo de la repetición de trinucleótidos CTG, así como en la región menos preferida entre la DMPK 3'UTR y la 5' UTR del gen SIX5 adyacente (SEQ ID NO: 132). Así, expresando un par de nucleasas que cortan un sitio corriente arriba en SEQ ID NO: 102 y un sitio corriente abajo en SEQ ID NO: 132 se espera que elimine la repetición de trinucleótidos del gen. En una realización preferida, las secuencias de reconocimiento corriente arriba y corriente abajo se seleccionan de tal manera que la escisión por el par de nucleasas cognadas generará salientes de cadena única idénticos. Por ejemplo, puede seleccionarse una nucleasa diseñada, en particular una meganucleasa, que reconozca y corte la SEQ ID NO: 98 corriente arriba de la repetición de trinucleótidos BMPK y esta nucleasa puede ser emparejada con una segunda nucleasa diseñada, particularmente una meganucleasa, que reconoce y corta la SEQ ID NO: 123 corriente abajo de la repetición. Dado que ambas nucleasas diseñadas pueden generar salientes de 3' con la secuencia 5'-GTGC-3', la escisión simultánea por ambas nucleasas en la misma célula generará salientes compatibles que pueden ligarse de nuevo entre sí tras la eliminación de la secuencia intermedia.
La Tabla 10 enumera ejemplos no limitantes de secuencias de reconocimiento para nucleasas diseñadas, particularmente meganucleasas, que pueden encontrarse en la región no codificante del intrón 1 del gen humano C9ORF72 corriente arriba de la repetición de hexanucleótidos GGGCC asociada con la ELA y la FTD. La Tabla 11 enumera ejemplos no limitantes de secuencias de reconocimiento para nucleasas diseñadas, particularmente meganucleasas, que pueden encontrarse en la región no codificante del intrón 1 del gen humano C9ORF72 corriente abajo de la repetición de hexanucleótidos GGGGCC asociada con la ELA y la FTD. Así, se espera que la expresión de un par de nucleasas que corten un sitio corriente arriba y otro corriente abajo en el intrón 1 del gen C9ORF72 elimine la repetición de hexanucleótidos del gen. En una realización preferida, las secuencias de reconocimiento corriente arriba y corriente abajo se seleccionan de tal manera que la escisión por el par de nucleasas cognadas generará salientes de cadena única idénticos. Por ejemplo, puede seleccionarse una nucleasa diseñada, en particular una meganucleasa, que reconozca y corte la SEQ ID NO: 194(es decir, la secuencia de reconocimiento del ORF 7-8) corriente arriba de la repetición de hexanucleótidos GGGGCC, y esta nucleasa puede ser emparejada con una segunda nucleasa diseñada, particularmente una meganucleasa, que reconoce y corta la SEQ ID NO: 195 (es decir, la secuencia de reconocimiento del ORF 9-10) corriente abajo de la repetición. Ambas nucleasas diseñadas pueden generar salientes de 3' con la secuencia 5'-GTGC-3', por lo que la escisión simultánea por ambas nucleasas en la misma célula generará salientes compatibles que pueden ligarse nuevamente entre sí tras la eliminación de la secuencia intermedia. En otro ejemplo, se puede seleccionar una nucleasa diseñada, en particular una meganucleasa, que reconozca y corte la SEQ ID NO: 197 (es decir, la secuencia de reconocimiento del ORF 13-14) corriente arriba de la repetición de hexanucleótidos GGGGCC y esta nucleasa puede ser emparejada con una segunda nucleasa diseñada, particularmente una meganucleasa, que reconoce y corta la SEQ ID n O: 196 (es decir, la secuencia de reconocimiento del ORF 11-12) corriente abajo de la repetición. Ambas nucleasas diseñadas pueden generar salientes de 3' con la secuencia 5-GTGT-3' y, por lo tanto, la escisión simultánea por ambas nucleasas en la misma célula generará salientes compatibles que pueden ligarse de nuevo entre sí tras la eliminación de la secuencia intermedia. Tabla 2. Ejemplo de Secuencia de Reconocimiento de Nucleasas Corriente Arriba de la Repetición CGG de FMR1
Figure imgf000031_0001
Tabla 3. Ejemplo de Secuencia de Reconocimiento de Nucleasas en la Corriente de la Repetición CGG de FMR1
Figure imgf000031_0002
Tabla 4. E m l n i R n imi n N l An l R i i n A e HTT
Figure imgf000031_0003
Tabla 5. Ejemplos de Secuencias de Reconocimiento de Nucleasas Corriente Abajo de la Repetición CAG de HTT
Figure imgf000031_0004
Tabla 6. Ejemplo de Secuencia de Reconocimiento de Nucleasas Corriente Arriba de la Repetición GAA de
FXN
Figure imgf000031_0005
(continuación)
Figure imgf000032_0001
(continuación)
Figure imgf000033_0001
Tabla 7. Ejemplo de Secuencias de Reconocimiento de Nucleasas Corriente Abajo de la Repetición GAA de FXN
Figure imgf000033_0002
Tabla 8. Ejemplos de Secuencias de Reconocimiento de Nucleasas Corriente Arriba de la Repetición CAG de HTT
Figure imgf000033_0003
Tabla 9. Ejemplos de Secuencias de Reconocimiento de Nucleasas Corriente Abajo de la Repetición CTG de DMPK
Figure imgf000034_0001
Tabla 10. Ejemplo de Secuencias de Reconocimiento de Nucleasas Corriente Arriba de la Repetición GGGGCC de C9ORF72
Figure imgf000034_0002
Tabla 11. Ejemplo de Secuencias de Reconocimiento de Nucleasa Corriente Arriba de la Repetición GGGGCC de C9ORF72
Figure imgf000034_0003
Las meganucleasas recombinantes de la invención comprenden una primera subunidad, que comprende una primera región hipervariable (HVR1), y una segunda subunidad, que comprende una segunda región hipervariable (HVR2).
Además, la primera subunidad se une a un primer medio sitio de reconocimiento en la secuencia de reconocimiento ( por ejemplo, un medio sitio FXN1), y la segunda subunidad se une a un segundo medio sitio de reconocimiento en la secuencia de reconocimiento (por ejemplo, un medio sitio FXN2). En las realizaciones donde la meganucleasa recombinante es una meganucleasa de cadena única, la primera y la segunda subunidades están orientadas de tal manera que la primera subunidad, que comprende la región HVR1 y se une al primer medio sitio, se sitúa como la subunidad N-terminal, y la segunda subunidad, que comprende la región HVR2 y se une al segundo medio sitio, se sitúa como la subunidad C-terminal. En realizaciones alternativas, la primera y la segunda subunidades están orientadas de tal manera que la primera subunidad, que comprende la región HVR1 y se une al primer medio sitio, se posiciona como la subunidad C-terminal, y la segunda subunidad, que comprende la región HVR2 y se une al segundo medio sitio, se posiciona como la subunidad N-terminal.
En realizaciones particulares, las meganucleasas diseñadas de la invención comprenden una señal de localización de nucleasa N-terminal derivada de SV40, una primera subunidad de meganucleasa, una secuencia enlazadora y una segunda subunidad de meganucleasa. Cada subunidad de la meganucleasa se une a un medio sitio de una secuencia de reconocimiento y comprende una región hipervariable (HVR) de 56 pares de bases, denominada HVR1 y HVR2 para la primera y segunda subunidades, respectivamente. Cada subunidad está altamente conservada fuera de la región HVR con la excepción del aminoácido correspondiente a la posición 80 y/o a la posición 271 de una cualquiera de las SEQ ID NO: 143-146, 155-159, 170-173, 182-185, 198-201, 210-213, 222-225, o 234-237, que pueden ser ocupados por Q o E para modular la afinidad de unión al ADN de la meganucleasa diseñada.
En algunos ejemplos particulares, las nucleasas diseñadas, y particularmente las meganucleasas, se han diseñado para reconocer y escindir la secuencia de reconocimiento FXN 1-2 (SEQ ID NO: 29). Dichas nucleasas recombinantes se denominan colectivamente en el presente documento como "nucleasas FXN 1-2" o "meganucleasas FXN 1-2", según corresponda. Las meganucleasas FXN 1-2 ejemplares se proporcionan en las SEQ ID NOs: 143-146.
En ejemplos adicionales, las nucleasas diseñadas, y en particular las meganucleasas, se han diseñado para reconocer y escindir la secuencia de reconocimiento FXN 3-4 (SEQ ID NO: 34). Dichas nucleasas recombinantes se denominan colectivamente en el presente documento como "nucleasas FXN 3-4" o "meganucleasas FXN 3-4", según corresponda. Las meganucleasas FXN 3-4 ejemplares se proporcionan en las SEQ ID NOs: 155-159.
En ejemplos adicionales, las nucleasas diseñadas, y en particular las meganucleasas, se han diseñado para reconocer y escindir la secuencia de reconocimiento FXN 5-6 (SEQ ID NO: 89). Dichas nucleasas recombinantes se denominan colectivamente en el presente documento como "nucleasas FXN 5-6" o "meganucleasas FXN 5-6", según corresponda. Las meganucleasas FXN 5-6 ejemplares se proporcionan en las SEQ ID NOs: 170-173.
En ejemplos adicionales, las nucleasas diseñadas, y en particular las meganucleasas, se han diseñado para reconocer y escindir la secuencia de reconocimiento FXN 11-12 (SEQ ID NO: 63). Dichas nucleasas recombinantes se denominan colectivamente en el presente documento como "nucleasas FXN 11-12" o "meganucleasas FXN 11-12", según corresponda. Las meganucleasas FXN 1-2 ejemplares se proporcionan en las SEQ ID NOs: 182-185.
En ejemplos adicionales, las nucleasas diseñadas, y en particular las meganucleasas, se han diseñado para reconocer y escindir la secuencia de reconocimiento ORF 7-8 (SEQ ID NO: 194). Dichas nucleasas recombinantes se denominan colectivamente en el presente documento como "nucleasas ORF 7-8" o "meganucleasas ORF 7-8", según corresponda. Las meganucleasas ORF 7-8 ejemplares se proporcionan en las SEQ ID NOs: 198-201.
En ejemplos adicionales, las nucleasas diseñadas, y en particular las meganucleasas, se han diseñado para reconocer y escindir la secuencia de reconocimiento ORF 9-10 (SEQ ID NO: 195). Dichas nucleasas recombinantes se denominan colectivamente en el presente documento "nucleasas ORF 9-10" o "meganucleasas ORF 9-10", según corresponda. Las meganucleasas ORF 9-10 ejemplares se proporcionan en SEQ ID NO: 210-213.
En ejemplos adicionales, las nucleasas diseñadas, y en particular las meganucleasas, se han diseñado para reconocer y escindir la secuencia de reconocimiento ORF 11-12 (SEQ ID NO: 196). Dichas nucleasas recombinantes se denominan colectivamente en el presente documento como "nucleasas ORF 11-12" o "meganucleasas ORF 11-12", según corresponda. Las meganucleasas ORF 11-12 ejemplares se proporcionan en las SEQ ID NOs: 222-225.
En ejemplos adicionales, las nucleasas diseñadas, y en particular las meganucleasas, se han diseñado para reconocer y escindir la secuencia de reconocimiento ORF 13-14 (SEQ ID NO: 197). Dichas nucleasas recombinantes se denominan colectivamente en el presente documento como "nucleasas ORF 13-14" o "meganucleasas ORF 13-14", según corresponda. Las meganucleasas ORF 13-14 ejemplares se proporcionan en las SEQ ID NOs: 234-237.
Las meganucleasas FXN 1-2, FXN 3-4, FXN 5-6 y FXN 11-12 ejemplares de la invención se proporcionan en las Tablas 12-15, respectivamente. Las meganucleasas ORF 7-8, ORF 9-10, ORF 11-12 y ORF 13-14 ejemplares de la invención se proporcionan en las Tablas 16-19, respectivamente.
Tabla 12. Meganucleasas recombinantes ejemplares diseñadas para reconocer y escindir la secuencia de reconocimiento FXN 1-2 SEQ ID NO: 29
Figure imgf000036_0001
Tabla 13. Meganucleasas recombinantes ejemplares diseñadas para reconocer y escindir la secuencia de reconocim iento FXN 3-4 SEQ ID NO: 34
Figure imgf000036_0002
Tabla 14. Meganucleasas recombinantes ejemplares diseñadas para reconocer y escindir la secuencia de reconocim iento FXN 5-6 SEQ ID NO: 89
Figure imgf000036_0003
Tabla 15. Meganucleasas recombinantes ejemplares diseñadas para reconocer y escindir la secuencia de reconocim iento FXN 11-12 (SEQ ID NO: 63)
Figure imgf000037_0001
Tabla 16. Meganucleasas recombinantes ejemplares diseñadas para reconocer y escindir la secuencia de reconocim iento ORF 7-8 SEQ ID NO: 194
Figure imgf000037_0002
Tabla 17. Meganucleasas recombinantes ejemplares diseñadas para reconocer y escindir la secuencia de reconocim iento ORF 9-10 SEQ ID NO: 195
Figure imgf000037_0003
Tabla 18. Meganucleasas recombinantes ejemplares diseñadas para reconocer y escindir la secuencia de reconocim iento ORF 11-12 SEQ^ ID NO: 196
Figure imgf000037_0004
(continuación)
Figure imgf000038_0001
Tabla 19. Meganucleasas recombinantes ejemplares diseñadas para reconocer y escindir la secuencia de reconocim iento ORF 13-14 SEQJD NO: 197
Figure imgf000038_0002
2.3 Procedimientos de Administración y Expresión de Nucleasas
El tratamiento de los trastornos de expansión de repeticiones de nucleótidos de acuerdo con la invención requiere que un par de nucleasas se expresen simultáneamente en las células de los tejidos apropiados. Los tejidos objetivo para la administración de las nucleasas de la invención variará en función del trastorno que se trate. Por ejemplo, el tratamiento de la enfermedad de Huntington, la ataxia de Friedreich o ELA requiere la administración en el sistema nervioso central, mientras que el tratamiento de la distrofia miotónica requiere la administración en el músculo. La Tabla 20 enumera los tejidos objetivo para cada uno de los trastornos de expansión de repetición de nucleótidos comunes.
Las nucleasas pueden entregarse a las células objetivo de un sujeto durante el tratamiento como proteína purificada o como ARN o ADN que codifica las nucleasas. Preferentemente, las nucleasas diseñadas de la invención se entregan como un ácido nucleico que codifica la nucleasa diseñada. Dichos ácidos nucleicos pueden ser ADN (por ejemplo, ADN de plásmido circular o linealizado o productos de PCR) o ARN (por ejemplo, ARNm). En algunas realizaciones, el ARNm que codifica una nucleasa diseñada se entrega a una célula debido a que esto reduce la probabilidad de que el gen que codifica la nucleasa diseñada se integre en el genoma de la célula. Dicho ARNm que codifica una nucleasa diseñada puede producirse mediante procedimientos conocidos en la técnica, como la transcripción in vitro. En algunas realizaciones, el ARNm se cubre con 7-metil-guanosina. En algunas realizaciones, el ARNm puede estar poliadenilado.
En algunas realizaciones particulares, un ácido nucleico que codifica una endonucleasa de la invención puede introducirse en una célula utilizando una plantilla de ADN de cadena única. En algunas de estas realizaciones, el ADN de cadena única puede comprender además una secuencia de repetición terminal invertida (ITR) 5' y/o 3' de AAV que flanquea el ADN que codifica la secuencia de nucleasa. En otras realizaciones, el ADN de cadena única puede comprender además un brazo de homología 5' y/o un brazo de homología 3' que flanquee el ADN que codifica la secuencia de la nucleasa.
Las proteínas nucleasas purificadas pueden introducirse en las células para escindir el ADN genómico mediante una variedad de mecanismos diferentes conocidos en la técnica, incluyendo los que se detallan más adelante.
En una realización, las proteínas nucleasas o el ARNm o el vector que codifica las nucleasas se suministran a las células objetivo mediante una inyección directamente en el tejido objetivo. Los trastornos musculares, por ejemplo, pueden tratarse mediante una inyección intramuscular (Maltzahn et al. (2012), Proc. Natl. Acad. Sci. EE.UU; 109:20614-9) o la inyección hidrodinámica (Taniyama et al. (2012), Curr. Top. Med. Chem. 12:1630-7; Hegge et al. (2010), Hum. Gene Ther. 21:829-42). Los trastornos del sistema nervioso central pueden tratarse, por ejemplo, mediante la inyección intracraneal de las proteínas o los ácidos nucleicos. Como alternativa, la proteína nucleasa, el ARNm o el ADN pueden administrarse sistémicamente a través del sistema circulatorio.
En algunas realizaciones, las proteínas nucleasas diseñadas, o el ADN/ARN que codifica nucleasas diseñadas, se formulan para la administración sistémica, o la administración a tejidos objetivo, en un portador farmacéuticamente aceptable de acuerdo con técnicas conocidas. Véase, por ejemplo, Remington, The Science and Practice of Pharmacy 21st Edition (Philadelphia: Lippincott Williams & Wilkins, 2005). En la fabricación de una formulación farmacéutica de acuerdo con la invención, las proteínas/ARN/ARNm se suelen mezclar con un portador farmacéuticamente aceptable. Por supuesto, el portador debe ser aceptable en el sentido de ser compatible con cualquier otro ingrediente de la formulación y no debe ser perjudicial para el sujeto. El portador puede ser un sólido o un líquido, o ambos, y puede ser formulado con el compuesto como una formulación de dosis unitaria.
Para facilitar la captación celular, las proteínas o los ácidos nucleicos pueden acoplarse a un péptido de penetración celular para facilitar la captación por las células. Ejemplos de péptidos penetrantes de células conocidos en la técnica incluyen poli-arginina (Jearawiriyapaisarn, et al. (2008), Mol. Ther. 16:1624-9), el péptido TAT del virus del VIH (Hudecz et al. (2005), Med. Res. Rev. 25: 679-736), MPG (Simeoni et al. (2003), Nucleic Acids Res. 31:2717-2724), Pep-1 (Deshayes et al. (2004), Biochemistry 43: 7698-7706y HSV-1 VP-22 (Deshayes et al. (2005) Cell Mol Life Sci. 62:1839-49. Alternativamente, la penetración celular puede facilitarse mediante la encapsulación de liposomas (véase, por ejemplo, Lipofectamine™, Life Technologies Corp., Carlsbad, CA). La formulación del liposoma puede utilizarse para facilitar la fusión de la bicapa lipídica con una célula objetivo, permitiendo así que el contenido del liposoma o las proteínas asociadas a su superficie se introduzcan en la célula. En una realización alternativa, las nucleasas o el ADN/ARN que codifica las nucleasas se acoplan de forma covalente o no covalente a un anticuerpo que reconoce un receptor específico de la superficie celular expresado en las células diana, de forma que la proteína nucleasa/ADN/ARN se une a las células diana y es internalizada por ellas. Alternativamente, la proteína nucleasa/ADN/ARNm puede acoplarse de forma covalente o no covalente al ligando natural (o a una porción del ligando natural) para dicho receptor de superficie celular. (McCall et al. (2014), Tissue Barriers 2(4):e944449 Dinda et al. (2013), Curr. Pharm. Biotechnol. 14:1264-74; Kang et al. (2014), Curr. Pharm. Biotechnol. 15(3):220-30 Qian et al. (2014), Expert Opin. Drug Metab. Toxicol. 10(11): 1491-508).
Tabla munes
Figure imgf000039_0001
En algunas realizaciones, las proteínas endonucleasas, o el ADN/ARN que codifica endonucleasas, se encapsulan dentro de hidrogeles biodegradables para su inyección o implantación dentro de un órgano deseado (por ejemplo, la región del hígado en proximidad a las células endoteliales sinusoidales hepáticas, o las células progenitoras que se diferencian en células endoteliales sinusoidales hepáticas). Los hidrogeles también pueden proporcionar una liberación sostenida y ajustable de la carga terapéutica en la región deseada de un órgano sin necesidad de inyecciones frecuentes, y los materiales que responden a los estímulos (por ejemplo, los hidrogeles que responden a la temperatura y al pH) pueden diseñarse para liberar la carga útil en respuesta a señales ambientales o aplicadas externamente (véase, por ejemplo, Kang Derwent et al. (2008), Trans. Am. Ophthalmol. Soc. 106:206-214).
En algunas realizaciones, las proteínas nucleasas o el ADN/ARN que codifica las nucleasas están acoplados de forma covalente o, preferentemente, no covalente a una nanopartícula. Una nanopartícula es cualquier soporte sólido, tal como un metal, un polímero o una macromolécula biológica, al que se pueden unir múltiples copias de las proteínas nucleasas, el ARNm o el ADN. Esto aumenta el número de copias de la proteína/ARN/ADN que se entrega a cada célula y, por lo tanto, aumenta la expresión intracelular de cada nucleasa para maximizar la probabilidad de que se corten las secuencias de reconocimiento. Además, las nanopartículas pueden acoplarse ventajosamente a moléculas de orientación para dirigir la nanopartícula al tipo de célula apropiado y/o aumentar la probabilidad de captación celular. Ejemplos de estas moléculas de orientación incluyen los anticuerpos específicos para los receptores de la superficie celular y los ligandos naturales (o porciones de los ligandos naturales) para los receptores de la superficie celular.
En algunas realizaciones, las proteínas de nucleasa o el ADN/ARNm que codifican las nucleasas se encapsulan dentro de liposomas o forman complejos usando lípidos catiónicos (véase, por ejemplo, Lipofectamine™, Life Technologies Corp., Carlsbad, CA; Zuris et al. (2013), Nat. Biotechnol. 33: 73-80; Mishra et al. (2011) J Drug Deliv. 2011:863734). Las formulaciones de liposomas y lipoplex pueden proteger la carga útil de la degradación, mejorar la acumulación y la retención en el lugar objetivo, y facilitar la captación celular y la eficiencia de la entrega a través de la fusión con y/o la interrupción de las membranas celulares de las células objetivo.
En algunas realizaciones, las proteínas nucleasas, o el ADN/ARN que codifica nucleasas, se encapsulan dentro de andamios poliméricos (por ejemplo, PLGA) o se acomplejan utilizando polímeros catiónicos (porejemplo, PEI, PLL) (Tamboli et al. (2011), Ther. Deliv. 2(4): 523-536). Los portadores poliméricos pueden diseñarse para proporcionar tasas de liberación de fármacos sintonizables a través del control de la erosión del polímero y la difusión del fármaco, y las altas eficiencias de encapsulación del fármaco pueden ofrecer protección de la carga terapéutica hasta la entrega intracelular a la población celular deseada.
En algunas realizaciones, las proteínas nucleasas o las nucleasas que codifican ADN/ARNm se combinan con moléculas anfifílicas que se autoensamblan en micelas (Tong et al. (2007), J. Gene Med. 9(11): 956-66). Las micelas poliméricas pueden incluir una cubierta micelar formada con un polímero hidrofílico (por ejemplo, polietilenglicol) que puede evitar la agregación, enmascarar las interacciones de carga y reducir las interacciones no específicas dentro del fluido vítreo.
En algunas realizaciones, las proteínas nucleasas, o el ADN/ARN que codifica nucleasas, se formulan en una emulsión o nanoemulsión (es decir, con un diámetro medio de partícula de < 1nm) para su administración y/o entrega a la célula diana. El término "emulsión" se refiere, sin limitación, a cualquier dispersión o gota de aceite en agua, de agua en aceite, de agua en aceite o de aceite en agua en aceite, incluyendo las estructuras lipídicas que pueden formarse como resultado de las fuerzas hidrófobas que alejan los residuos apolares (por ejemplo, las cadenas largas de hidrocarburos) del agua y los grupos de cabeza polar hacia el agua, cuando una fase inmiscible de agua se mezcla con una fase acuosa. Estas otras estructuras lipídicas incluyen, pero no se limitan a, vesículas lipídicas unilamelares, paucilamelares y multilamelares, micelas y fases laminares. Las emulsiones están compuestas por una fase acuosa y una fase lipofílica (que suele contener un aceite y un disolvente orgánico). Las emulsiones también suelen contener uno o más tensioactivos. Las formulaciones en nanoemulsión son bien conocidas, por ejemplo, las descritas en Solicitud de Patente de EE. UU. No. 2002/0045667 y 2004/0043041y Pat. de EE. UU. Nos.
6,015,832, 6,506,803, 6,635,676, y 6,559,189.
En algunas realizaciones, las proteínas nucleasas o las nucleasas que codifican ADN/ARNm se unen covalentemente o no se asocian covalentemente con conjugados poliméricos multifuncionales, dendrímeros de ADN y dendrímeros poliméricos (Mastorakos et al. (2015) Nanoescale. 7(9): 3845-56; Cheng et al. (2008), J. Pharm. Sci. 97(1): 123-43). La generación de dendrímeros puede controlar la capacidad y el tamaño de la carga útil y puede proporcionar una alta capacidad de carga útil de fármacos. Además, el despliegue de múltiples grupos de superficie puede aprovecharse para mejorar la estabilidad, reducir las interacciones inespecíficas y mejorar la orientación y la liberación de fármacos en células específicas.
En algunas realizaciones, los genes que codifican un par de nucleasas se entregan utilizando un vector viral, o un par de vectores virales. Tales vectores son conocidos en la técnica e incluyen vectores retrovirales, vectores lentivirales, vectores adenovirales y vectores de virus adeno-asociados (AAV) (revisados en Vannucci, et al. (2013), New Microbiol.
36:1-22). En algunas realizaciones, los vectores virales se inyectan directamente en los tejidos objetivo (Bosch et al. (2008), Mol. Ther. 1:63-70; Greig et al. (2014), PLoS One. 9(11):e112268). En otras realizaciones, los vectores virales se administran por vía sistémica a través del sistema circulatorio. Es conocido en la técnica que diferentes vectores AAV tienden a localizarse en diferentes tejidos. Los serotipos de AAV musculotrópicos incluyen AAV1, AAV9 y AAV2.5 (Bowles et al. (2008), Mol. Ther. 20:443-55). Por lo tanto, estos serotipos son los preferidos para la entrega de nucleasas en el tejido muscular. Los serotipos de AAV más utilizados para aplicaciones en el sistema nervioso central son AAV1, AAV2, AAV4, AAV5, AAV6, AAV8 y AAV9 (McCown (2005), Curr. Gene Ther. 5:333-8; Lentz et al. (2012), Neurobiol. Dis. 48:179-88).
En una realización, un vector utilizado para la entrega del gen de la endonucleasa es un vector autolimitante. Un vector autolimitante puede tener un tiempo de persistencia limitado en una célula u organismo debido a la presencia de una secuencia de reconocimiento para una nucleasa dentro del vector que conduce a la destrucción del mismo. Así, un vector autolimitante puede diseñarse para proporcionar secuencias codificantes para un promotor, una nucleasa como se describe en el presente documento, y un sitio de reconocimiento de nucleasas dentro del propio vector autolimitante. El vector autolimitante suministra el gen de la nucleasa a una célula, tejido u organismo, de forma que la nucleasa se expresa y es capaz de cortar el genoma de la célula en una secuencia de reconocimiento endógena dentro del genoma. La nucleasa suministrada también encontrará su sitio objetivo dentro del propio vector autolimitante y cortará el vector en este sitio objetivo. Una vez cortados, los extremos 5' y 3' del vector quedarán expuestos y serán degradados por las exonucleasas, destruyendo así el vector y cesando la producción de la endonucleasa.
Si los genes de la nucleasa se entregan en forma de ADN (por ejemplo, plásmido) y/o a través de un vector viral (por ejemplo., AAV), deben estar vinculados de forma operativa a un promotor. En algunas realizaciones, puede tratarse de un promotor viral, tal como los promotores endógenos del vector viral (por ejemplo, el LTR de un vector lentiviral) o los conocidos promotores tempranos del citomegalovirus o del virus SV40. En una realización preferida, los genes de la nucleasa están vinculados de forma operable a un promotor que impulsa la expresión del gen preferentemente en las células diana. Ejemplos de promotores específicos para el músculo incluyen C5-12 (Liu, et al. (2004), Hum. Gene Ther. 15:783-92), el promotor de la creatina quinasa específica del músculo (MCK) (Yuasa, et al. (2002), Gene Ther. 9:1576-88), o el promotor del músculo liso 22 (SM22) (Haase, et al. (2013) b Mc Biotechnol. 13:49-54). Algunos ejemplos de promotores específicos del sistema nervioso central (neuronas) son los promotores de NSE, Synapsin y MeCP2 (Lentz, et al. (2012), Neurobiol. Dis. 48:179-88). En algunas realizaciones, los genes de la nucleasa están bajo el control de dos promotores separados. En otras realizaciones, los genes están bajo el control de un único promotor y están separados por un sitio de entrada al ribosoma interno (IRES) o una secuencia peptídica 2A (Szymczak y Vignali (2005), Expert Opin. Biol. Ther. 5:627-38).
Se prevé que un único tratamiento elimine permanentemente las repeticiones de nucleótidos de un porcentaje de células del paciente. Sin embargo, si la frecuencia de deleción de repetición de nucleótidos es baja, o si es necesario corregir un gran porcentaje de células objetivo, puede ser necesario realizar múltiples tratamientos en cada paciente.
2.4 Composiciones Farmacéuticas
Se divulga una composición farmacéutica que comprende un portador farmacéuticamente aceptable y una nucleasa diseñada de la invención, o un portador farmacéuticamente aceptable y un ácido nucleico que codifica una nucleasa diseñada de la invención. Las composiciones farmacéuticas de la invención pueden ser útiles para tratar a un sujeto que tenga un trastorno de expansión de repetición de nucleótidos.
Dichas composiciones farmacéuticas se pueden preparar de acuerdo con técnicas conocidas. Véase, por ejemplo, Remington, The Science and Practice of Pharmacy 21st Edition (Philadelphia: Lippincott Williams & Wilkins, 2005). En la fabricación de una formulación farmacéutica, los polipéptidos de nucleasa manipulados (o el ADN/ARN que los codifica) se mezclan normalmente con un portador farmacéuticamente aceptable y la composición resultante se administra a un sujeto. Por supuesto, el portador debe ser aceptable en el sentido de ser compatible con cualquier otro ingrediente de la formulación y no debe ser perjudicial para el sujeto. Las composiciones farmacéuticas pueden comprender además uno o más agentes adicionales o moléculas biológicas útiles para el tratamiento de una enfermedad en el sujeto. Asimismo, los agentes adicionales y/o las moléculas biológicas pueden ser coadministradas como una composición separada.
2.5 Procedimientos para Producir Vectores AAV Recombinantes
En algunas realizaciones, la invención proporciona vectores AAV recombinantes para su uso en los procedimientos de la invención. Los vectores AAV recombinantes suelen producirse en líneas celulares de mamíferos tales como HEK-293. Dado que los genes virales cap y rep se eliminan del vector para evitar su autorreplicación y para dejar espacio a los genes terapéuticos que se van a entregar (por ejemplo, el gen de la endonucleasa), es necesario proporcionarlos en trans en la línea celular de empaquetamiento. Además, es necesario proporcionar los componentes "ayudantes" (por ejemplo, adenovirales) necesarios para apoyar la replicación (Cots et al. (2013), Curr. Gene Ther.
13(5): 370-81). Con frecuencia, los vectores AAV recombinantes se producen utilizando una triple transfección en la que una línea celular se transfecta con un primer plásmido que codifica los componentes "ayudantes", un segundo plásmido que comprende los genes cap y rep, y un tercer plásmido que comprende los ITR virales que contienen la secuencia de ADN intermedia que se empaquetará en el virus. Las partículas virales que comprenden un genoma (ITR y genes intermedios de interés) encerrado en una cápside se aíslan entonces de las células mediante ciclos de congelación-descongelación, sonicación, detergente u otros medios conocidos en la técnica. A continuación, las partículas se purifican mediante centrifugación en gradiente de densidad con cloruro de cesio o cromatografía de afinidad y, posteriormente, se entregan a los genes de interés en células, tejidos u organismo, tal como un paciente humano.
Debido a que las partículas de AAV recombinantes generalmente se producen (fabrican) en células, se deben tomar precauciones al practicar la presente invención para garantizar que la nucleasa específica del sitio no se exprese en las células de empaquetamiento. Debido a que los genomas virales de la invención comprenden una secuencia de reconocimiento para la nucleasa, cualquier endonucleasa expresada en la línea celular de empaquetamiento será capaz de escindir el genoma viral antes de que pueda empaquetarse en partículas virales. Esto dará lugar a una menor eficacia del empaquetado y/o al empaquetado de genomas fragmentados. Se pueden utilizar varios enfoques para evitar la expresión de nucleasas en las células de empaquetado, incluyendo:
1. La nucleasa puede colocarse bajo el control de un promotor específico del tejido que no esté activo en las células de empaquetamiento. Por ejemplo, si se desarrolla un vector viral para la entrega de genes de nucleasa al tejido muscular, se puede utilizar un promotor específico para el músculo. Ejemplos de promotores específicos para el músculo incluyen el C5-12 (Liu, et al. (2004), Hum. Gene Ther. 15:783-92), el promotor de la creatina quinasa específica del músculo (MCK) (Yuasa, et al. (2002), Gene Ther. 9:1576-88), o el promotor del músculo liso 22 (Sm 22) (Haase, et al. (2013) BMC Biotechnol. 13:49-54). Algunos ejemplos de promotores específicos del sistema nervioso central (neuronas) son los promotores de NSE, Synapsin y MeCP2 (Lentz, et al. (2012), Neurobiol. Dis. 48:179-88). Los ejemplos de promotores específicos del hígado incluyen promotores de albúmina (tal como Palb), a1-antitripsina humana (tal como PA1AT) y hemopexina (tal como Phpx) (Kramer et al. (2008), Mol. Therapy 7:375-85). Ejemplos de promotores específicos del ojo incluyen opsina y promotores K12 específicos del epitelio corneal (Martin et al. (2002), Methods (28): 267­ 75), (Tong et al. (2007), J. Gene Med, 9:956-66). Estos promotores, u otros promotores específicos de tejido conocidos en la técnica, no son altamente activos en las células HEK-293 y, por tanto, no se espera que produzcan niveles significativos de expresión del gen de la nucleasa en las células de empaquetamiento cuando se incorporan a los vectores virales de la presente divulgación. Del mismo modo, los vectores virales de la presente divulgación contemplan el uso de otras líneas celulares con el uso de promotores específicos de tejidos incompatibles (es decir, la bien conocida línea celular HeLa (célula epitelial humana) y el uso del promotor de hemopexina específico del hígado). Otros ejemplos de promotores específicos de tejidos son: sarcomas sinoviales PDZD4 (cerebelo), C6 (hígado), ASb5 (músculo), PPP1R12b (corazón), SLC5A12 (riñón), regulación del colesterol APOM (hígado), ADPRHL1 (corazón) y síndromes de malformación monogénica TP73L (músculo). Jacox et al. (2010), PLoS One v.5(8): e12274).
2. Alternativamente, el vector se puede empaquetar en células de una especie diferente en la que no es probable que se exprese la nucleasa. Por ejemplo, las partículas virales pueden producirse en células microbianas, de insectos o de plantas utilizando promotores de mamíferos, tales como los bien conocidos promotores tempranos del citomegalovirus o del virus SV40, que no son activos en las células de empaquetado no mamíferas. En una realización preferida, las partículas virales se producen en células de insectos utilizando el sistema de baculovirus como se describió por Gao, et al. (Gao et al. (2007), J. Biotechnol. 131(2):138-43). Es poco probable que una nucleasa bajo el control de un promotor de mamífero se exprese en estas células (Airenne et al. (2008), Mol. Ther. 21(4):739-49). Además, las células de los insectos utilizan motivos de empalme de ARNm diferentes a los de las células de los mamíferos. Así, es posible incorporar un intrón de mamífero, tal como el intrón de la hormona del crecimiento humano (HGH) o el intrón del antígeno T grande del SV40, en la secuencia de codificación de una endonucleasa. Dado que estos intrones no se empalman eficazmente a partir de los transcritos de ARNpre-m en las células de los insectos, las células de los insectos no expresarán una endonucleasa funcional y empaquetarán el genoma completo. Por el contrario, las células de mamífero a las que se entregan las partículas recombinantes AAV resultantes empalmarán correctamente el ARNpre-m y expresarán la proteína nucleasa funcional. Se ha informado sobre el uso de los intrones del antígeno T grande HGH y SV40 para atenuar la expresión de las proteínas tóxicas barnasa y el fragmento A de la toxina diftérica en células empaquetadoras de insectos, lo que permite la producción de vectores AAV recombinantes que portan estos genes de toxina (Chen (2012), Mol. Ther. Ácidos Nucleicos 1(11): e57).
3. El gen de la nucleasa se puede unir operativamente a un promotor inducible de manera que se requiere un inductor de molécula pequeña para la expresión de la nucleasa. Algunos ejemplos de promotores inducibles son el sistema Tet-On (Clontech, Mountain View, CA) Chen et al. (2015) BMC Biotechnol. 15(1):4)) y el sistema RheoSwitch (Intrexon, Research Triangle Park, NC Sowa et al. (2011), Spine 36(10): E623-8). Ambos sistemas, al igual que otros similares conocidos en la técnica, se basan en factores de transcripción inducibles por ligando (variantes del represor Tet y del receptor Ecdysone, respectivamente) que activan la transcripción en respuesta a un activador de molécula pequeña (Doxiciclina o Ecdysone, respectivamente). La práctica de la presente invención utilizando dichos activadores de transcripción inducibles por ligando incluye: 1) colocar el gen de la nucleasa bajo el control de un promotor que responda al factor de transcripción correspondiente, teniendo el gen de la nucleasa sitios de unión para el factor de transcripción; y 2) incluir el gen que codifica el factor de transcripción en el genoma viral empaquetado. Este último paso es necesario porque la nucleasa no se expresará en las células o tejidos objetivo tras la entrega recombinante de AAV si el activador de la transcripción no se proporciona también a las mismas células. El activador de la transcripción luego induce la expresión del gen de la nucleasa solo en células o tejidos que se tratan con el activador de molécula pequeña cognada. Este enfoque es ventajoso debido a que permite que la expresión del gen de la nucleasa se regule de manera espacio-temporal al seleccionar cuándo y en qué tejidos se administra el inductor de molécula pequeña. Sin embargo, el requisito de incluir el inductor en el genoma viral, que tiene una capacidad de carga significativamente limitada, crea un inconveniente para este enfoque.
4. En otra realización preferida, las partículas AAV recombinantes se producen en una línea celular de mamífero que expresa un represor de la transcripción que impide la expresión de la endonucleasa. Los represores de la transcripción son conocidos en la técnica e incluyen el represor Tet, el represor Lac, el represor Cro y el represor Lambda. Muchos receptores hormonales nucleares, tales como el receptor de la ecdisona, también actúan como represores de la transcripción en ausencia de su ligando hormonal cognado. Para poner en práctica la presente invención, las células de empaquetamiento se transfectan/transducen con un vector que codifica un represor de la transcripción y el gen de la nucleasa en el genoma viral (vector de empaquetamiento) se une operativamente a un promotor que se modifica para comprender sitios de unión para el represor de manera que el represor silencia al promotor. El gen que codifica el represor de la transcripción se puede colocar en una variedad de posiciones. Se puede codificar en un vector separado; puede incorporarse al vector de empaquetamiento fuera de las secuencias ITR; puede incorporarse al vector cap/rep o al vector auxiliar adenoviral; o, lo más preferentemente, puede integrarse de manera estable en el genoma de la célula de empaquetamiento de manera que se exprese de manera constitutiva. Los procedimientos para modificar promotores comunes de mamíferos para incorporar sitios represores de la transcripción son conocidos en la técnica. Por ejemplo, los promotores fuertes y constitutivos de CMV y RSV se modificaron para incluir operadores para el represor Lac y demostraron que la expresión génica de los promotores modificados se atenuó en gran medida en las células que expresaban el represor (Chang y Roninson (1996), Gene 183: 137 -42). El uso de un represor de la transcripción no humano asegura que la transcripción del gen de la nucleasa será reprimida solo en las células de empaquetamiento que expresan el represor y no en las células o tejidos objetivo transducidos con el vector AAV recombinante resultante.
2.6 Variantes de Nucleasas Diseñadas
Las realizaciones de la invención abarcan las nucleasas diseñadas descritas en el presente documento y variantes de las mismas. Otras realizaciones de la invención abarcan polinucleótidos aislados que comprenden una secuencia de ácido nucleico que codifica las nucleasas descritas en el presente documento y variantes de tales polinucleótidos.
Como se usa en el presente documento, el término "variantes" pretende indicar secuencias sustancialmente similares. Un polipéptido "variante" se refiere a un polipéptido derivado del polipéptido original o "nativo" por deleción o adición de uno o más aminoácidos en uno o más sitios internos en la proteína nativa y/o sustitución de uno o más aminoácidos en uno o más sitios en el polipéptido nativo. Como se usa en el presente documento, un polinucleótido o polipéptido original o "nativo" comprende una secuencia parental de la que se derivan las variantes. Las variantes de los polipéptidos comprendidas en las realizaciones son biológicamente activas. Es decir, siguen poseyendo la actividad biológica deseada de la proteína nativa; es decir, la capacidad de reconocer y escindir secuencias de reconocimiento que se encuentran corriente arriba y corriente abajo de un locus cromosómico que se va a eliminar (por ejemplo, una expansión de repetición de nucleótidos patógena en un gen de interés). Dichas variantes pueden resultar, por ejemplo, de la manipulación humana o mutagénesis natural. Las variantes biológicamente activas de un polipéptido nativo de las realizaciones, o las variantes biológicamente activas de las subunidades de unión a medio sitio de reconocimiento descritas en el presente documento, tendrán al menos aproximadamente 40 %, aproximadamente 45 %, aproximadamente 50 %, aproximadamente 55 %, aproximadamente 60 %, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 %, aproximadamente 80 %, aproximadamente 85 %, aproximadamente 90 %, aproximadamente 91 %, aproximadamente 92 %, aproximadamente 93 %, aproximadamente 94 %, aproximadamente 95 %, aproximadamente 96 %, aproximadamente 97 %, aproximadamente 98 %, o aproximadamente 99 %, de identidad de secuencia con la secuencia de aminoácidos del polipéptido nativo o de la subunidad nativa, tal como se determina mediante los programas de alineación de secuencias y los parámetros descritos en el presente documento. Una variante biológicamente activa de un polipéptido o subunidad de las realizaciones puede diferir de ese polipéptido 0 subunidad en tan pocos como aproximadamente 1-40 residuos de aminoácidos, tan pocos como aproximadamente 1-20, tan pocos como aproximadamente 1-10, tan pocos como aproximadamente 5, tan pocos como 4, 3, 2, o incluso 1 residuo de aminoácido.
Los polipéptidos de las realizaciones se pueden alterar de diversas maneras, incluyendo sustituciones, eliminaciones, truncamientos e inserciones de aminoácidos. Los procedimientos para tales manipulaciones son generalmente conocidos en el arte. Por ejemplo, las variantes de la secuencia de aminoácidos se pueden preparar mediante mutaciones en el ADN de la forma original o nativa. Los procedimientos de mutagénesis y alteración de polinucleótidos son bien conocidos en la técnica. Véase, por ejemplo, Kunkel (1985), Proc. Natl. Acad. Sci. USA 82:488-492 Kunkel et al. (1987), Methods in Enzymol. 154:367-382 Pat. de EE. UU. No. 4,873,192 Walker y Gaastra, eds. (1983), Techniques in Molecular Biology (MacMillan Publishing Company, Nueva York) y las referencias citadas en él. En el modelo de Dayhoff et al., se puede encontrar orientación sobre las sustituciones de aminoácidos adecuadas que no afectan la actividad biológica de la proteína de interés. (1978), Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D.C.). Las sustituciones conservadoras, tales como el cambio de un aminoácido por otro con propiedades similares, pueden ser óptimas.
Se ha identificado previamente un número sustancial de modificaciones de aminoácidos en el dominio de reconocimiento de ADN de la meganucleasa I-Crel de tipo salvaje (por ejemplo, Pat. de EE. UU. No. 8,021,867) que, por separado o en combinación, dan lugar a meganucleasas recombinantes con especificidades alteradas en bases individuales dentro del medio sitio de la secuencia de reconocimiento del ADN, de manera que las meganucleasas de diseño racional resultantes tienen especificidades de medio sitio diferentes de la enzima de tipo natural. La Tabla 21 proporciona las posibles sustituciones que pueden realizarse en un monómero o subunidad de meganucleasa recombinante derivada de I-CreI para mejorar la especificidad con base en la base presente en cada posición de medio sitio (-1 a -9) de un medio sitio de reconocimiento.
Tabla 21.
Figure imgf000044_0001
(continuación)
Figure imgf000045_0001
En el caso de los polinucleótidos, una "variante" comprende una deleción y/o adición de uno o más nucleótidos en uno o más sitios dentro del polinucleótido nativo. Un experto en la técnica reconocerá que las variantes de los ácidos nucleicos de las realizaciones se construirán de manera que se mantenga el marco de lectura abierto. Para los polinucleótidos, las variantes conservativas incluyen aquellas secuencias que, debido a la degeneración del código genético, codifican la secuencia de aminoácidos de uno de los polipéptidos de las realizaciones. Los polinucleótidos variantes incluyen polinucleótidos derivados sintéticamente, tales como los generados, por ejemplo, mediante el uso de mutagénesis dirigida al sitio, pero que siguen codificando una meganucleasa recombinante de las realizaciones. Generalmente, las variantes de un polinucleótido particular de las realizaciones tendrán al menos aproximadamente 40 %, aproximadamente 45 %, aproximadamente 50 %, aproximadamente 55 %, aproximadamente 60 %, aproximadamente 65 %, aproximadamente 70 %, aproximadamente 75 %, aproximadamente 80 %, aproximadamente 85 %, aproximadamente 90 %, aproximadamente 91 %, aproximadamente 92 %, aproximadamente 93 %, aproximadamente 94 %, aproximadamente 95 %, aproximadamente 96 %, aproximadamente 97 %, aproximadamente 98 %, aproximadamente 99 % o más de identidad de secuencia con ese polinucleótido particular como se determina por los programas de alineación de secuencia y los parámetros descritos en otra parte del presente documento. Las variantes de un polinucleótido particular de las realizaciones (es decir, el polinucleótido de referencia) también pueden evaluarse por comparación del porcentaje de identidad de secuencia entre el polipéptido codificado por un polinucleótido variante y el polipéptido codificado por el polinucleótido de referencia.
No se espera que las deleciones, inserciones y sustituciones de las secuencias proteínicas en el presente documento englobadas produzcan cambios radicales en las características del polipéptido. Sin embargo, cuando es difícil predecir el efecto exacto de la sustitución, deleción o inserción antes de hacerlo, un experto en la técnica apreciará que el efecto puede evaluarse mediante el cribado rutinario del polipéptido para su capacidad de reconocer y escindir preferentemente secuencias de reconocimiento que se encuentran corriente arriba o corriente abajo de un locus cromosómico que se va a eliminar (por ejemplo, una expansión de repetición de nucleótidos patógena en un gen de interés).
EJEMPLOS
Esta invención se ilustra adicionalmente mediante los siguientes ejemplos, que no deben interpretarse como limitantes. Los ejemplos que no caen dentro del alcance de las reivindicaciones son solo para fines ilustrativos.
eec n e a epetc n e r nuc e t os e e ante un ar e eganuceasas e a ena nca Diseñadas
1. Meganucleasas que reconocen la SEQ ID NO: 29, SEQ ID NO: 63, y SEQ ID NO: 89
Una meganucleasa diseñada llamada "FXN 1-2x.63" (SEQ ID NO: 143) que reconoce y corta la SEQ ID NO: 29 en el Intrón 1 de FXN corriente arriba de la repetición de trinucleótidos g Aa . Una segunda meganucleasa diseñada denominada "FXN 11-12x.63" (SEQ ID No : 182) que reconoce y escinde la SEQ ID NO: 63 en el Intrón 1 de FXN corriente arriba de la repetición de trinucleótidos GAA. Una tercera meganucleasa diseñada denominada "FXN 5-6x.24" (SEQ ID NO: 172) que reconoce y corta la SEQ ID NO: 89 en el Intrón 1 de FXN corriente abajo de la repetición de trinucleótidos g Aa (Figura 6A). Cada meganucleasa comprende una señal de localización de nucleasa N-terminal derivada de SV40, una primera subunidad de meganucleasa, una secuencia enlazadora y una segunda subunidad de meganucleasa.
Para determinar si cada meganucleasa FXN podía reconocer y escindir su respectiva secuencia de reconocimiento, se evaluó cada meganucleasa recombinante utilizando un ensayo reportero de células CHO descrito previamente (véase, el documento WO2012/167192 y la Figura 4). Para realizar los ensayos, se produjeron líneas de células CHO reporteras que llevaban un casete de expresión del gen de la proteína verde fluorescente (GFP) no funcional integrado en el genoma de las células. El gen de la GFP en cada línea celular fue interrumpido por un par de secuencias de reconocimiento de tal manera que la escisión intracelular de cualquiera de las secuencias de reconocimiento por una meganucleasa estimularía un evento de recombinación homóloga que daría lugar a un gen funcional de la GFP.
En las líneas de células reporteras CHO desarrolladas para este estudio, una secuencia de reconocimiento insertada en el gen GFP fue la secuencia de reconocimiento FXN 1-2 (SEQ ID NO: 29), la secuencia de reconocimiento FXN 11-12 (SEQ ID NO: 63), o la secuencia de reconocimiento FXN 5-6 (SEQ ID NO: 89). La segunda secuencia de reconocimiento insertada en el gen GFP fue una secuencia de reconocimiento CHO-23/24, que es reconocida y escindida por una meganucleasa de control llamada "CHO-23/24". Las células reporteras de CHO que comprenden la secuencia de reconocimiento FXN 1-2 y la secuencia de reconocimiento CHO-23/24 se denominan en el presente documento "células FXN 1-2". Las células reporteras de CHO que comprenden la secuencia de reconocimiento FXN 11-12 y la secuencia de reconocimiento CHO-23/24 se denominan en el presente documento "células FXN 11-12". Las células reporteras de CHO que comprenden la secuencia de reconocimiento FXN 5-6 y la secuencia de reconocimiento CHO-23/24 se denominan en el presente documento "células FXN 5-6".
Las células CHO reporteras se transfectaron con ADN plasmídico que codifica sus correspondientes meganucleasas recombinantes (por ejemplo, las células FXN 1-2 se transfectaron con ADN plasmídico que codifica la meganucleasa FXN 1-2) o que codifica la meganucleasa CHO-23/24. En cada ensayo, se transfectaron 4*105 células reporteras CHO con 50 ng de ADN plasmídico en una placa de 96 pocillos utilizando Lipofectamine 2000 (ThermoFisher) de acuerdo con las instrucciones del fabricante. A las 48 horas después de la transfección, las células se evaluaron por citometría de flujo para determinar el porcentaje de células positivas a la GFP en comparación con un control negativo no transfectado (FXN 1-2bs, FXN 11-12bs o FXN 5-6bs). Como se muestra en la Figura 5, se descubrió que las meganucleasas FXN 1-2x.63, FXN 11-12x.63 y FXN 5-6x.24 producen células positivas a la GFP en líneas celulares que comprenden su secuencia de reconocimiento correspondiente a frecuencias que superan significativamente el control negativo.
2. Deleción de la Repetición de Trinucleótidos FXN en células HEK-293
Las células de riñón embrionario humano (HEK-293) fueron cotransfectadas con ARNm que codifica FXN 1-2x.63 y FXN 5-6x.24 o FXN 11-12x.63 y FXN 5-6x.24. El ARNm se preparó produciendo primero una plantilla de PCR para una reacción de transcripción in vitro (SEQ ID NO: 136, Se Q ID NO: 137, y SEQ ID NO: 138). Cada producto de la PCR incluía un promotor T7 y 609 pb de la secuencia del vector corriente abajo del gen de la meganucleasa. El producto de la PCR se purificó en gel para garantizar una plantilla única. El ARN tapado (m7G) se generó utilizando el kit RiboMAX T7 (Promega, Madison, WI) de acuerdo con las instrucciones del fabricante. Se incluyó en la reacción el análogo de la tapa Ribo m7G (Promega, Madison, WI) y sirvieron 0,5 |jg del producto de la PCR de la meganucleasa purificada como el molde de ADN. El ARN tapado se purificó utilizando el sistema de aislamiento de ARN total SV (Promega, Madison, WI) de acuerdo con las instrucciones del fabricante.
Se nucleofectaron 1,5*106 células HEK-293 con 1,5*1012 copias de ARNm que codifican la meganucleasa corriente arriba (FXN 1-2x.63 o FXN 11-12x.63) y 1,5*1012 copias de ARNm que codifican FXN 5-6x.24 (2*106 copias/célula) utilizando un dispositivo Amaxa Nucleofector II (Lonza, Basilea, Suiza) de acuerdo con las instrucciones del fabricante.
48 horas después de la transfección, se aisló el ADN genómico de las células utilizando un kit FlexiGene (Qiagen, Hilden, Alemania) de acuerdo con las instrucciones del fabricante. A continuación, el ADN genómico se sometió a la PCR utilizando cebadores que flanquean la repetición de trinucleótidos GAA y las secuencias adyacentes de reconocimiento de meganucleasas (SEQ ID NO: 139 y SEQ ID NO: 140). Cuando los productos de la PCR se resolvieron mediante electroforesis en gel de agarosa, se vio que las células que coexpresaban los pares de nucleasas daban dos productos de la PCR (Figura 3B). El producto más grande es consistente en tamaño con el producto PCR esperado de las células con un gen FXN no modificado. La banda más pequeña en cada caso es consistente en tamaño con lo que se esperaría si el par de nucleasas correspondiente eliminara un fragmento del gen FXN.
Los productos de PCR más pequeños se aislaron del gel y se clonaron en un plásmido bacteriano (pUC-19) para el análisis de la secuencia. Se secuenciaron dos clones de plásmidos para cada una de las dos transfecciones y se descubrió que los cuatro plásmidos contenían un fragmento de FXN Intrón 1 en el que se había eliminado una parte del intrón que comprende la repetición de trinucleótidos GAA. En cada caso, la deleción abarcaba los dos sitios de corte de la meganucleasa y se extendía a una distancia variable 5' del sitio de corte corriente arriba. En consecuencia, las cuatro secuencias obtenidas eran diferentes. Es importante señalar que las meganucleasas utilizadas en este experimento no generaron salientes compatibles y, por lo tanto, no se esperaba una secuencia consistente resultante de eventos de ligación nueva directa.
3. Conclusiones
Se ha demostrado que es posible utilizar un par de meganucleasas de cadena única diseñadas para extirpar un fragmento del genoma humano que comprende una repetición de nucleótidos implicada en una enfermedad.
EJEMPLO 2
Deleción de la Repetición de Trinucleótidos del FXN Utilizando Pares Adicionales de Meganucleasas de Cadena Única Diseñadas
1. Meganucleasas que reconocen secuencia de reconocimiento FXN 1-2 (SEQ ID NO: 29), FXN 3-4 (SEQ ID NO: 34), FXN 5-6 (SEQ ID NO: 63), y FXN 11-12 (SEQ ID NO: 89)
Para identificar meganucleasas diseñadas con capacidades de escisión diferentes a las meganucleasas FXN descritas anteriormente, se generaron meganucleasas diseñadas adicionales dirigidas a FXN 1-2 (SEQ ID NO: 29), FXN 11-12 (SEQ ID NO: 63), y FXN 5-6 (SEQ ID NO: 89) secuencias de reconocimiento. Además, se hicieron nuevas meganucleasas diseñadas denominadas meganucleasas FXN 3-4 para reconocer y cortar la secuencia de reconocimiento FXN 3-4 (SEQ ID NO: 34), que se encuentra 5' corriente arriba de la repetición de trinucleótidos GAA. Se añadió FXN 3-4 debido a que la escisión en su secuencia de reconocimiento generaría salientes 3' compatibles con los salientes producidos por las meganucleasas FXN 5-6. Como se describió anteriormente, cada meganucleasa diseñada comprende una señal de localización de nucleasa N-terminal derivada de SV40, una primera subunidad de meganucleasa, una secuencia de enlace y una segunda subunidad de meganucleasa.
Estas meganucleasas diseñadas se probaron en el ensayo de reportero de células CHO como se describió anteriormente, y los resultados se muestran en la Figura 8. La Figura 8A muestra que varias variantes de las meganucleasas FXN 1-2, FXN 1-2x.11 (SEQ ID NO: 144), FXN1-2x.73 (SEQ ID NO: 145), y FXN 1-2x.84 (SEQ ID NO: 146) producen células positivas a la GFP en líneas celulares que comprenden la secuencia de reconocimiento FXN 1-2 en frecuencias significativamente superiores al control negativo. Las Figuras 8B, 8C y 8D muestran que los resultados de varias variantes de las meganucleasas FXN 3-4: FXN 3-4L.34 (SEQ ID NO: 155), FXN 3-4L.5 (SEQ ID NO: 156), FXN 3-4L.12 (SEQ ID NO: 157), FXN 3-4x.312 (SEQ ID NO: 158), y FXN 3-4x.383 (SEQ ID NO: 159) producen todos ellas células positivas a la GFP con altas frecuencias, aunque ligeramente inferiores a las de los controles positivos. Las Figuras 8E y 8F muestran que los resultados de varias variantes de las meganucleasas FXN 5-6: FXN 5-6L.45 (SEQ ID NO: 170), FXN 5-6.L38 (SEQ ID NO: 171), y FXN 5-6x.20 (SEQ ID NO: 173) producen todos células positivas a la GFP en frecuencias iguales o mayores que el control positivo. La Figura 8G muestra que los resultados de varias meganucleasas FXN 11-12 variantes: FXN 11-12x.99 (Se Q ID NO: 183), FXN 11-12x107 (SEQ ID NO: 184), y FXN 11-12x139 (SEQ ID NO: 185) produjeron todos células positivas a la GFP en las líneas celulares que incluían la secuencia de reconocimiento FXN 11-12 en frecuencias mayores o iguales al control positiv
2. Deleción de la repetición de trinucleótidos en células de mamíferos y detección de la re-ligación
Dado que las meganucleasas FXN 3-4 y FXN 5-6 producen salientes compatibles, a continuación, se busca si se podía detectar signos de ligación nueva directa. Las células HEK 293 se electroporaron como se ha descrito anteriormente con un par FXN 3-4/FXN 5-6; el nuevo FXN 3-4x.312 y el anteriormente utilizado FXN 5-6x.24). Se realizó la PCR utilizando cebadores que flanquean la repetición de trinucleótidos, y los productos de la PCR se resolvieron mediante electroforesis en gel de agarosa. Como se ha descrito anteriormente, se observaron dos productos de PCR a los 3 y 6 días (Figura 9A). La banda más pequeña se purificó en gel y se clonó, y se secuenciaron 38 clones. 35 de los 38 clones mostraron que la repetición de trinucleótidos se había eliminado por completo en las células. De esos 35 clones que mostraban una deleción completa de la región de repetición, 20 clones mostraban una religación perfecta de los salientes generados por las meganucleasas FXN 3-4 y FXN 5-6 (Figura 9B).
3. Deleción de Repeticiones de Trinucleótidos en Fibroblastos Humanos
Para comprobar aún más si las nuevas meganucleasas podían eliminar la repetición de trinucleótidos, se probaron FXN 3-4x.312 y FXN 5-6x.24 en fibroblastos derivados de un paciente homocigoto para la expansión en el gen FXN, con alelos de aproximadamente 330 y 390 repeticiones (GM03816, Instituto Coriell de Investigación Médica). En este experimento, se utilizó el par FXN 3-4 y FXN 5-6, ya que generan salientes 3' compatibles y podrían eliminar potencialmente la repetición de trinucleótidos de forma consistente debido a la ligación nueva directa de los salientes. El ARN para las meganucleasas FXN 3-4 y FXN 5-6 se generó como se ha descrito anteriormente y las células GM03816 se transfectaron utilizando el reactivo de transfección de ARN Stemfect (Stemgent, Cambridge, MA). Mediante el análisis de PCR a los 4 días (Figura 10A) y a los 18 días (Figura 10B), se observaron de nuevo dos productos de PCR en las muestras tratadas con el par de meganucleasas FXN 3-4/FXN 5-6, lo que indica la deleción de la región de repetición GAA.
Además, a los 10 días después de la transfección, se obtuvo ARN de las células transfectadas con la meganucleasa FXN 3-4, la meganucleasa FXN 5-6 o el par de meganucleasas FXN 3-4/FXN 5-6, que luego se analizó mediante PCR cuantitativa para determinar el cambio en la expresión de ARNm de FXN. Como se muestra en la Figura 10C, la transfección de meganucleasas se acompañó de un aumento de la expresión de ARNm de frataxina en los fibroblastos humanos GM03816.
Para seguir probando si las meganucleasas recién diseñadas podían eliminar la expansión de la repetición de trinucleótidos GAA, se probaron varias combinaciones en fibroblastos GM03816. En este experimento sólo se utilizaron los pares FXN 3-4 y FXN 5-6, ya que generan salientes 3' compatibles y podrían eliminar potencialmente la repetición de trinucleótidos de forma consistente debido a la ligación nueva directa de los salientes. El ARN para las meganucleasas FXN 3-4 y FXN 5-6 se generó como se ha descrito anteriormente y las células GM03816 se transfectaron con los pares indicados en la Tabla 22 utilizando el reactivo de transfección de ARN Stemfect (Stemgent, Cambridge, MA).
A los 3 y 6 días transfección después de la transfección, se cosechó el ADN genómico y se analizaron las células para la deleción de la repetición de FXN mediante un ensayo de PCR digital. En el ensayo de PCR digital, se utilizan dos conjuntos de cebadores junto con dos sondas marcadas con fluorescencia. El primer conjunto de cebadores amplifica una región corriente abajo de la secuencia de reconocimiento de FXN 3-4, pero corriente arriba de las repeticiones de trinucleótidos en el gen FXN. El segundo conjunto de cebadores amplifica una secuencia genética irrelevante y sirve como secuencia de referencia para controlar el número de plantillas. Una sonda marcada con carboxifluoresceína (FAM) se fusiona dentro del amplicón generado por el primer conjunto de cebadores y una sonda marcada con VIC se fusiona dentro del amplicón generado por el segundo conjunto de cebadores. Si los pares de meganucleas FXN 3-4/FXN 5-6 eliminan con éxito la región entre las dos secuencias de reconocimiento, la sonda que se une al primer amplicón ya no se funde y la señal se pierde. Así, comparando la relación FAM:VIC, es posible cuantificar con precisión qué porcentaje de las células han tenido la región entre las secuencias de reconocimiento FXN 3-4 y FXN 5-6 eliminadas.
Tabla 22.
Figure imgf000048_0001
Como se muestra en la Tabla 22, los pares FXN 3-4/FXN 5-6 probados en las células GM03816 fueron todos capaces de eliminar la región de repetición, con eficiencias que oscilaron desde 10,5 % a 21,4 % en el día 3 después de la transfección. En el día 6 después de la transfección, las eficiencias de deleción disminuyeron ligeramente, pero todavía demostraron que hasta 18,4 % de las células tenían la repetición de trinucleótidos eliminada.
Además, se obtuvo ADN genómico en las muestras del día 3 del experimento anterior, que luego se analizó mediante secuenciación profunda para evaluar la eficiencia de la unión final precisa entre los sitios de escisión FXN 3-4 y FXN 5-6 después de la escisión de la región de repetición GAA. Como se indica en la Tabla 23, la eficacia de la unión final de precisión fue excepcionalmente alta, superando 83 % en todas las muestras.
Tabla 23.
Figure imgf000048_0002
(continuación)
Figure imgf000049_0001
4. Conclusiones
Estos datos demuestran claramente que es posible utilizar dos meganucleasas diseñadas que flanquean la región de repetición de trinucleótidos en el gen FXN para eliminar la región de repetición. Los datos de las células HEK 293 y de los fibroblastos derivados de pacientes con FRDA muestran que la deleción de la región de la repetición es altamente eficiente, eliminando la repetición en más del 20 % de las células en un ensayo. Además, si las dos meganucleasas modificadas generan salientes 3' compatibles, los salientes pueden volver a ligarse directamente, lo que da lugar a una secuencia reparada altamente predecible y consistente en más del 50% de los clones.
EJEMPLO 3
Meganucleasas de Cadena Única Diseñadas con Especificidad para Reconocer Secuencias Dentro del Gen C9ORF72
1. Meganucleasas que reconocen ORF 7-8 (SEQ ID NO: 194), ORF 9-10 (SEQ ID NO: 195), ORF 11-12 (SEQ ID NO: 196), y ORF 13-14 (SEQ ID NO: 197)
Se hicieron varias meganucleasas diseñadas para reconocer y cortar 5' corriente arriba o 3' corriente abajo de la repetición de hexanucleótidos GGGGCC en el gen C9ORF72. Cada meganucleasa comprende una señal de localización de nucleasa N-terminal derivada de SV40, una primera subunidad de meganucleasa, una secuencia enlazadora y una segunda subunidad de meganucleasa.
Una primera serie de meganucleasas reconoce y escinde la secuencia de reconocimiento de ORF 7-8 corriente arriba (SEQ ID NO: 194). Estas meganucleasas incluyen ORF 7-8x.4 (SEQ ID NO: 198), ORF 7-8x.31 (SEQ ID NO: 199), ORF 7-8x.45 (Se Q ID NO: 200), y ORF 7-8x.29 (SEQ ID NO: 201). Una segunda serie de meganucleasas reconoce y escinde la secuencia de reconocimiento ORF 9-10 corriente abajo (SEQ ID NO: 195). Estas meganucleasas incluyen ORF 9-10x.15 (SEQ ID NO: 210), ORF 9-10x.14 (SEQ ID NO: 211), ORF 9-10x.61 (SEQ ID NO: 212), y ORF 9-10x.77 (SEQ ID NO: 213). Tras la escisión, las meganucleasas de ORF 7-8 y ORF 9-10 generarán salientes compatibles para promover la ligación nueva directa.
Una tercera serie de meganucleasas diseñadas reconoce y escinde la secuencia de reconocimiento ORF 11-12 corriente abajo (SEQ ID NO: 196). Estas meganucleasas incluyen ORF 11-12x.5 (SEQ ID NO: 222), ORF 11-12L.1 (SEQ ID NO: 223), ORF 11-12L.8 (SEQ ID NO: 224), y ORF 11-12L.64 (SEQ ID NO: 225). Una cuarta serie de meganucleasas diseñadas reconoce y escinde la secuencia de reconocimiento ORF 13-14 corriente arriba (SEQ ID NO: 197). Estos incluyen ORF 13-14x.40 (SEQ ID NO: 234), ORF 13-14x.77 (SEQ ID NO: 235), ORF 13-14x.90 (SEQ ID NO: 236), y ORF 13-14x.3 (SEQ ID NO: 237). Tras la escisión, las meganucleasas de o Rf 11-12 y ORF 13-14 generarán salientes compatibles para promover la ligación nueva directa.
Para determinar si cada meganucleasa ORF podía reconocer y escindir su respectiva secuencia de reconocimiento, se evaluó cada meganucleasa recombinante utilizando un ensayo reportero de células CHO descrito previamente (véase, el documento WO2012/167192 y la Figura 4). Para realizar los ensayos, se produjeron líneas de células CHO reporteras que llevaban un casete de expresión del gen de la proteína verde fluorescente (GFP) no funcional integrado en el genoma de las células. El gen de la GFP en cada línea celular fue interrumpido por un par de secuencias de reconocimiento de tal manera que la escisión intracelular de cualquiera de las secuencias de reconocimiento por una meganucleasa estimularía un evento de recombinación homóloga que daría lugar a un gen funcional de la GFP.
En las líneas de células reporteras CHO desarrolladas para este estudio, una secuencia de reconocimiento insertada en el gen GFP fue la secuencia de reconocimiento ORF 7-8 (SEQ ID NO: 194), la secuencia de reconocimiento ORF 9-10 (SEQ ID NO: 195), la secuencia de reconocimiento ORF 11-12 (s Eq ID NO: 196), o la secuencia de reconocimiento ORF 13-14 (SEQ ID NO: 197). La segunda secuencia de reconocimiento insertada en el gen GFP fue una secuencia de reconocimiento CHO-23/24, que es reconocida y escindida por una meganucleasa de control llamada "CHO-23/24". Las células reporteras de CHO que comprenden la secuencia de reconocimiento ORF 7-8 y la secuencia de reconocimiento CHO-23/24 se denominan en el presente documento "células ORF 7-8". Las células reporteras de CHO que comprenden la secuencia de reconocimiento ORF 9-10 y la secuencia de reconocimiento c Ho -23/24 se denominan en el presente documento "células ORF 9-10". Las células reporteras de CHO que comprenden la secuencia de reconocimiento ORF 11-12 y la secuencia de reconocimiento CHO-23/24 se denominan en el presente documento "células ORF 11-12". Las células reporteras de CHO que comprenden la secuencia de reconocimiento ORF 13-14 y la secuencia de reconocimiento CHO-23/24 se denominan en el presente documento "células ORF 13-14".
Las células reporteras CHO se transfectaron con ADN plasmídico que codifica sus correspondientes meganucleasas recombinantes (por ejemplo, las células ORF 7-8 se transfectaron con ADN plasmídico que codifica la meganucleasa ORF 7-8) o que codifica la meganucleasa CHO-23/24. En cada ensayo, se transfectaron 4*105 células reporteras CHO con 50 ng de ADN plasmídico en una placa de 96 pocillos utilizando Lipofectamine 2000 (ThermoFisher, Waltham, MA) de acuerdo con las instrucciones del fabricante. A las 48 horas después de la transfección, las células se evaluaron por citometría de flujo para determinar el porcentaje de células positivas a la GFP en comparación con un control negativo no transfectado. Como se muestra en la Figura 11A, se descubrió que las meganucleasas ORF 7-8x.4, ORF 7-8x.31, ORF 7-8x.45 y ORF 7-8x.29 producen células positivas a la GFP en líneas celulares que comprenden sus secuencias de reconocimiento correspondiente a frecuencias significativamente superiores al control negativo. La Figura 11B demuestra que ORF 9-10x.15, ORF 9-10x.14, ORF 9-10x.61 y ORF 9-10x.77 produjeron células positivas a la GFP con frecuencias significativas; ORF 9-10x.14 superó el control positivo. El ORF 11-12L.1, ORF 11-12L.8, ORF 11-12L.64 y ORF 11-12x.5 produjeron células positivas a la GFP con frecuencias iguales o mayores que el control positivo (Figuras 11C y 11D). El ORF 13-14x.40, ORF 13-14x.77, ORF 13-14x.90 y ORF 13-14x.3 generaron células positivas a la GFP con frecuencias mayores o iguales al control positivo (Figura 11E).
2. Deleción de repeticiones de hexanucleótidos en células de mamíferos
Para comprobar si las meganucleasas ORF podían eliminar la repetición de hexanucleótidos, se probaron varias combinaciones en células HEK 293. Dado que ORF 7-8 y ORF 9-10 generan salientes compatibles, y ORF 11-12 y ORF 13-14 generan salientes compatibles, estos pares podrían eliminar la repetición de hexanucleótidos de forma consistente debido a la ligación nueva directa de los salientes. Se generó ARN para las meganucleasas ORF y se electroporaron células HEK 293 como se ha descrito anteriormente, utilizando los siguientes pares de meganucleasas ORF: Or F 7-8x.4 y ORF 9-10x.15; ORF 11-12x.5 y ORF 13-14x.40 (Figura 12A). 48 horas después de la transfección, se aisló el ADN, se realizó la PCR utilizando cebadores que flanquean la región de repetición de hexanucleótidos y los productos de la PCR se resolvieron mediante electroforesis en gel de agarosa. En las células transfectadas de forma simulada, la banda grande de aproximadamente 850 pb representa la región no modificada. En las células transfectadas con ORF 7-8/ORF 9-10 o con ORF 11-12/ORF 13-14, la presencia de bandas más pequeñas coincide en tamaño con lo que se esperaría si el par de nucleasas correspondiente eliminara un fragmento del gen C9ORF72.
Para determinar si las meganucleasas ORF con extremos compatibles eran capaces de volver a ligar directamente tras la eliminación de la secuencia intermedia, las pequeñas bandas de PCR mostradas en la Figura 12A fueron purificadas en gel y secuenciadas en profundidad (MiSeq, Illumina, San Diego, CA). Las lecturas de secuenciación se alinearon con el producto previsto si se producía la ligación nueva directa. Como se muestra en la Tabla 24, ambos pares de meganucleasas ORF demostraron la ligación nueva directa de los salientes compatibles en la mayoría de las secuencias. En particular, las secuencias procedentes de células transfectadas con el par ORF 11-12/ORF 13-14 religaron directamente los salientes en más del 80% de las secuencias.
Tabla 24.
Figure imgf000050_0001
Para comprobar si las meganucleasas ORF podían eliminar la expansión de repetición de hexanucleótidos en células derivadas de pacientes, se probaron las mismas combinaciones ORF en fibroblastos derivados de un paciente homocigoto para la expansión en el gen C9ORF72 (ND42496, Coriell Institute for Medical Research). El ARN de las meganucleasas ORF se generó como se ha descrito anteriormente y las células ND42496 se transfectaron con los mismos pares comentados anteriormente utilizando el reactivo de transfección de ARN Stemfect (Stemgent) de acuerdo con las instrucciones del fabricante. 48 horas después de la transfección, se aisló el ADN, se realizó la PCR utilizando cebadores que flanquean la región de repetición de hexanucleótidos y los productos de la PCR se resolvieron mediante electroforesis en gel de agarosa (Figura 12B). A diferencia de las células HEK 293, no se detecta ningún producto de la PCR en las células falsamente transfectadas. Esto se debe probablemente a la dificultad de amplificar una región repetitiva con un contenido de GC del 100 %. Sin embargo, en las células transfectadas con ORF 7-8/ORF 9-10 o ORF 11-12/ORF 13-14, la presencia de bandas más pequeñas coincide en tamaño con lo que se esperaría si el par de nucleasas correspondiente eliminara un fragmento del gen C9ORF72.

Claims (15)

REIVINDICACIONES
1. Una composición para su uso en el tratamiento de un sujeto que tiene un trastorno de expansión de repetición de nucleótidos, en el que dicho trastorno de expansión de repetición de nucleótidos se caracteriza por la expansión de una repetición de nucleótidos en un gen de interés, comprendiendo dicha composición : al menos primer ácido nucleico que codifica una primera nucleasa diseñada y un segundo ácido nucleico que codifica una segunda nucleasa diseñada, en la que dicha primera nucleasa diseñada y dicha segunda nucleasa diseñada son expresables en células diana in vivo; en la que dicha primera nucleasa diseñada reconoce y escinde una primera secuencia de reconocimiento situada 5' corriente arriba de dicha repetición de nucleótidos en dicho gen de interés; y en la que dicha segunda nucleasa diseñada reconoce y escinde una segunda secuencia de reconocimiento situada 3' corriente abajo de dicha repetición de nucleótidos en dicho gen de interés; y en la que un fragmento de ADN intermedio entre dicha primera secuencia de reconocimiento y dicha segunda secuencia de reconocimiento se extirpa y el número de dicha repetición de nucleótidos se reduce en dicho gen de interés; y en la que dicha primera nucleasa diseñada y dicha segunda nucleasa diseñada generan salientes complementarios que promueven la nueva ligación directa de dicho gen de interés.
2. La composición para el uso de la reivindicación 1, en la que dicha nucleasa diseñada es una meganucleasa diseñada, una TALEN compacta o una CRISPR.
3. La composición para el uso de la reivindicación 1 o la reivindicación 2, en la que dicha primera secuencia de reconocimiento y dicha segunda secuencia de reconocimiento están posicionadas dentro del mismo exón, el mismo intrón o la misma región no traducida (UTR) que dicha repetición de nucleótidos.
4. La composición para el uso de cualquiera de las reivindicaciones 1 a 3, en la que dicha repetición de nucleótidos es una repetición de trinucleótidos, preferentemente en la que dicha repetición de trinucleótidos se selecciona del grupo que consiste en CAG, CGG, Cc G, GAA y CTG.
5. La composición para el uso de la reivindicación 4, en la que dicha repetición de trinucleótidos es GAA y dicho gen de interés es el gen de la frataxina (FXN), en la que dicha repetición de trinucleótidos está posicionada dentro del intrón 1 del gen FXN.
6. La composición para el uso de la reivindicación 5, en la que dicha primera secuencia de reconocimiento está posicionada 5' corriente arriba en dicho intrón 1 (SEQ ID NO: 74) de dicha repetición de trinucleótidos, y/o en la que dicha segunda secuencia de reconocimiento está posicionada 3' corriente abajo en dicho intrón 1 (SEQ ID NO: 96) de dicha repetición de trinucleótidos.
7. La composición para el uso de la reivindicación 5 o la reivindicación 6, en la que dicha primera nucleasa diseñada es una primera meganucleasa diseñada y dicha segunda nucleasa diseñada es una segunda meganucleasa diseñada.
8. La composición para el uso de la reivindicación 7, en la que dicha primera secuencia de reconocimiento comprende una cualquiera de las SEQ ID NOs: 13-15, 19, 26-28, 30, 31, 33, 34, 40, 42, 43, 45, 46, 48, 49, 54, 55, 57, 58, 60, 62, 63, 65, 67, 71, y 73, preferentemente en la que dicha primera secuencia de reconocimiento comprende SEQ ID NO: 34.
9. La composición para el uso de la reivindicación 8, en la que dicha primera secuencia de reconocimiento comprende SEQ ID NO: 34, y en la que dicha primera meganucleasa diseñada comprende una primera subunidad y una segunda subunidad, en la que:
(a) dicha primera subunidad se une a un primer semisitio de reconocimiento de dicha primera secuencia de reconocimiento, y en la que dicha primera subunidad comprende una secuencia de aminoácidos que tiene al menos 80 % de identidad de secuencia con los residuos 7-153 de una cualquiera de las SEQ ID NO: 155­ 159 y comprende una primera región hipervariable (HVR1) que comprende los residuos 24-79 de una cualquiera de las SEQ iD NO: 155-159; y
(b) dicha segunda subunidad se une a un segundo sitio medio de reconocimiento de dicha primera secuencia de reconocimiento, y en la que dicha segunda subunidad comprende una secuencia de aminoácidos que tiene al menos 80 % de identidad de secuencia con los residuos 198-344 de una cualquiera de las SEQ ID NO: 155-159 y comprende una segunda región hipervariable (HVR2) que comprende los residuos 215-270 de una cualquiera de las SEQ ID NO: 155-159.
10. La composición para el uso de la reivindicación 9, en la que dicha primera subunidad comprende los residuos 7­ 153 de una cualquiera de las SEQ ID NO: 155-159, y/o en la que dicha segunda subunidad comprende los residuos 198-344 de una cualquiera de las SEQ ID NOs: 155-159.
11. La composición para el uso de la reivindicación 9 o la reivindicación 10, en la que dicha primera meganucleasa diseñada comprende la secuencia de aminoácidos de una cualquiera de las SEQ ID NO: 155-159.
12. La composición para el uso de una cualquiera de las reivindicaciones 7-11, en la que dicha segunda secuencia de reconocimiento comprende una cualquiera de las SEQ ID NOs: 76 y 78-95, y preferentemente en la que dicha segunda secuencia de reconocimiento comprende la SEQ ID NO: 89.
13. La composición para el uso de la reivindicación 12, en la que dicha segunda secuencia de reconocimiento comprende la SEQ ID NO: 89, y en la que dicha segunda meganucleasa diseñada comprende una primera subunidad y una segunda subunidad, en la que:
(a) dicha primera subunidad se une a un primer semisitio de reconocimiento de dicha segunda secuencia de reconocimiento, y en la que dicha primera subunidad comprende una secuencia de aminoácidos que tiene al menos 80 % de identidad de secuencia con los residuos 198-344 de una cualquiera de las SEQ ID NO: 170­ 172, o los residuos 7-153 de SEQ ID NO: 173 y comprende una primera región hipervariable (HVR1) que comprende los residuos 215-270 de una cualquiera de las SEQ ID NOs: 170-172, o los residuos 24-79 de SEQ ID NO: 173; y
(b) en la que dicha segunda subunidad se une a un segundo semisitio de reconocimiento de dicha segunda secuencia de reconocimiento, y en la que dicha segunda subunidad comprende una secuencia de aminoácidos que tiene al menos 80 % de identidad de secuencia con los residuos 7-153 de una cualquiera de las SEQ ID NO: 170-172, o los residuos 198-344 de SEQ ID NO: 173 y comprende una segunda región hipervariable (HVR2) que comprende los residuos 24-79 de una cualquiera de las SEQ ID NO: 170-172, o los residuos 215-270 de SEQ ID NO: 173.
14. La composición para el uso de la reivindicación 13, en la que dicha primera subunidad comprende los residuos 198-344 de una cualquiera de las SEQ ID NO: 170-172, o los residuos 7-153 de SEQ ID NO: 173, y/o en la que dicha segunda subunidad comprende los residuos 7-153 de una cualquiera de las SEQ ID NOs: 170-172, o los residuos 198-344 de SEQ ID NO: 173.
15. La composición para el uso de la reivindicación 13 o la reivindicación 14, en la que dicha segunda meganucleasa diseñada comprende la secuencia de aminoácidos de una cualquiera de las SEQ ID NO: 170-173.X
ES16789905T 2015-05-01 2016-05-02 Deleción precisa de secuencias cromosómicas in vivo Active ES2905181T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562155838P 2015-05-01 2015-05-01
PCT/US2016/030460 WO2016179112A1 (en) 2015-05-01 2016-05-02 Precise deletion of chromoscomal sequences in vivo and treatment of nucleotide repeat expansion disorders using engineered nucleases

Publications (1)

Publication Number Publication Date
ES2905181T3 true ES2905181T3 (es) 2022-04-07

Family

ID=57218596

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16789905T Active ES2905181T3 (es) 2015-05-01 2016-05-02 Deleción precisa de secuencias cromosómicas in vivo

Country Status (5)

Country Link
US (3) US20180344817A1 (es)
EP (2) EP4015633A1 (es)
DK (1) DK3289076T3 (es)
ES (1) ES2905181T3 (es)
WO (1) WO2016179112A1 (es)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
BR112017025507A2 (pt) 2015-05-29 2018-08-07 Regeneron Pharmaceuticals, Inc. roedor, célula isolada de roedor ou tecido isolado de roedor, célula-tronco embrionária de roedor, embrião de roedor, e, métodos para preparação de um roedor e para identificação de um candidato terapêutico.
CA3004710A1 (en) * 2015-10-06 2017-04-13 The Children's Hospital Of Philadelphia Compositions and methods for treating fragile x syndrome and related syndromes
CN108513575A (zh) 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
US12011488B2 (en) 2016-03-23 2024-06-18 The Regents Of The University Of California Methods of treating mitochondrial disorders
AU2017237912B2 (en) 2016-03-23 2022-03-10 The Regents Of The University Of California Methods of treating mitochondrial disorders
WO2018002783A1 (en) * 2016-06-29 2018-01-04 Crispr Therapeutics Ag Materials and methods for treatment of friedreich ataxia and other related disorders
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
RU2760877C2 (ru) 2016-09-30 2021-12-01 Регенерон Фармасьютикалс, Инк. Животные, отличные от человека, характеризующиеся экспансией гексануклеотидных повторов в локусе c9orf72
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
WO2018078134A1 (en) * 2016-10-28 2018-05-03 Genethon Compositions and methods for the treatment of myotonic dystrophy
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
SG11201908658TA (en) 2017-03-23 2019-10-30 Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
CN111757937A (zh) 2017-10-16 2020-10-09 布罗德研究所股份有限公司 腺苷碱基编辑器的用途
KR20240007965A (ko) 2017-12-06 2024-01-17 어비디티 바이오사이언시스 인크. 근위축증 및 근긴장성 이영양증을 치료하는 조성물 및 방법
JP2021534755A (ja) * 2018-08-22 2021-12-16 リサーチ インスティチュート アット ネイションワイド チルドレンズ ホスピタル 筋強直性ジストロフィープロテインキナーゼの発現を抑制および/またはdmpk遺伝子の3’非翻訳領域におけるトリヌクレオチドリピート伸長に干渉するための組換えウイルス産物および方法
AU2019403015B2 (en) 2018-12-20 2024-01-18 Regeneron Pharmaceuticals, Inc. Nuclease-mediated repeat expansion
DE112020001342T5 (de) 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
EP3958913A4 (en) * 2019-04-26 2023-05-31 The Children's Hospital of Philadelphia CRISPR/CAS9 GENE EDIT OF ATXN2 FOR TREATMENT OF SPINOCEREBELLAR ATAXIA TYPE 2
KR20220005555A (ko) 2019-05-07 2022-01-13 프리시젼 바이오사이언시스 인코포레이티드 인식 서열에 대한 조작된 메가뉴클레아제의 최적화
EP4121120A2 (en) * 2020-03-16 2023-01-25 The Regents of the University of California Methods of treating mitochondrial disorders
EP4121063A4 (en) 2020-03-19 2024-07-03 Avidity Biosciences Inc COMPOSITIONS AND METHODS FOR TREATING FACIO-SCAPULO-HUMERAL MUSCULAR DYSTROPHY
KR20220161378A (ko) 2020-03-27 2022-12-06 어비디티 바이오사이언시스 인크. 근이영양증의 치료용 조성물 및 방법
EP4146804A1 (en) 2020-05-08 2023-03-15 The Broad Institute Inc. Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
WO2021231259A1 (en) 2020-05-11 2021-11-18 Precision Biosciences, Inc. Self-limiting viral vectors encoding nucleases
CA3218805A1 (en) 2021-05-10 2022-11-17 Ziqing QIAN Compositions and methods for intracellular therapeutics
WO2022271818A1 (en) 2021-06-23 2022-12-29 Entrada Therapeutics, Inc. Antisense compounds and methods for targeting cug repeats
AU2022368911A1 (en) * 2021-10-19 2024-05-30 Precision Biosciences, Inc. Gene editing methods for treating alpha-1 antitrypsin (aat) deficiency

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US6015832A (en) 1997-12-31 2000-01-18 The Regents Of The University Of Michigan Methods of inactivating bacteria including bacterial spores
US6559189B2 (en) 1999-04-28 2003-05-06 Regents Of The University Of Michigan Non-toxic antimicrobial compositions and methods of use
US7767216B2 (en) 1999-04-28 2010-08-03 The Regents Of The University Of Michigan Antimicrobial compositions and methods of use
US6506803B1 (en) 1999-04-28 2003-01-14 Regents Of The University Of Michigan Methods of preventing and treating microbial infections
US6635676B2 (en) 1999-04-28 2003-10-21 Regents Of The University Of Michigan Non-toxic antimicrobial compositions and methods of use
AU2004208031B2 (en) 2003-01-28 2009-10-08 Cellectis Use of meganucleases for inducing homologous recombination ex vivo and in toto in vertebrate somatic tissues and application thereof.
JP5937292B2 (ja) 2005-10-18 2016-06-22 デューク大学 配列特異性およびdna−結合親和度が変更された、合理設計メガヌクレアーゼ
WO2008043149A1 (en) * 2006-10-12 2008-04-17 Simons Haplomics Limited Methods for obtaining information from genetic material
DK2215223T3 (da) 2007-10-31 2013-07-22 Prec Biosciences Inc Rationelt konstruerede enkeltkæde-meganucleaser med ikke-palindrome genkendelsessekvenser
CA2730921A1 (en) 2008-07-14 2010-01-21 Precision Biosciences, Inc. Recognition sequences for i-crei-derived meganucleases and uses thereof
KR101982360B1 (ko) * 2011-04-05 2019-05-24 셀렉티스 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도
DK3489366T3 (da) 2011-06-01 2020-02-24 Prec Biosciences Inc Fremgangsmåder og produkter til produktion af manipulerede mammale cellelinier med forstærkede transgener
JP5798504B2 (ja) * 2011-11-18 2015-10-21 王子ホールディングス株式会社 微細繊維状セルロースの製造方法、不織布の製造方法、微細繊維状セルロース、微細繊維状セルロース含有スラリー、不織布、および複合体

Also Published As

Publication number Publication date
US20180344817A1 (en) 2018-12-06
EP3289076B1 (en) 2021-11-17
US20230201317A1 (en) 2023-06-29
WO2016179112A1 (en) 2016-11-10
EP3289076A4 (en) 2018-11-07
EP3289076A1 (en) 2018-03-07
DK3289076T3 (da) 2022-01-17
EP4015633A1 (en) 2022-06-22
US20210228693A1 (en) 2021-07-29

Similar Documents

Publication Publication Date Title
ES2905181T3 (es) Deleción precisa de secuencias cromosómicas in vivo
Lee et al. Gene therapy for visual loss: Opportunities and concerns
US8802437B2 (en) Meganuclease reagents of uses thereof for treating genetic diseases caused by frame shift/non sense mutations
ES2821149T3 (es) Eliminación del exón del gen de la distrofina mediante nucleasas modificadas genéticamente
ES2905791T3 (es) Nucleasas de ingeniería útiles para el tratamiento de la hemofilia A
ES2566553T3 (es) ARNnp U7 modificados para el tratamiento de las enfermedades neuromusculares
ES2573981T3 (es) Oligonucleótidos antisentido de triciclo-ADN, composiciones, y métodos para el tratamiento de enfermedades
KR20210102882A (ko) 핵산 구조체 및 사용 방법
JP2022110004A (ja) 設計されたメガヌクレアーゼを使用した網膜色素変性症の治療
JP2017504354A (ja) 血友病を処置するための方法および組成物
BR112014004895B1 (pt) Oligonucleotídeos antissentido para o tratamento de amaurose congênita de leber
ES2968892T3 (es) Métodos y composiciones para aumentar la producción de mielina funcional
JP2020500541A (ja) ヒト化デュシェンヌ型筋ジストロフィー変異を有するdmdレポーターモデル
EP4335925A2 (en) Long-lasting analgesia via targeted in vivo epigenetic repression
ES2920477T3 (es) Vectores virales autolimitantes que codifican nucleasas
KR20210126012A (ko) Cas12a 가이드 RNA 분자 및 그의 용도
JP2024502620A (ja) リボザイムで活性化されたrna構築物及びその使用
US20220177878A1 (en) Crispr/cas9 gene editing of atxn2 for the treatment of spinocerebellar ataxia type 2
RU2774456C2 (ru) Композиции и способы лечения ассоциированного с cep290 заболевания
LLADO SANTAEULARIA THERAPEUTIC GENOME EDITING IN RETINA AND LIVER
Chrzanowski et al. CRISPR-based gene editing techniques in pediatric neurologic disorders
TW202334194A (zh) 用於表現因子ix以便治療b型血友病的組成物及方法
JP2024096438A (ja) ゲノム編集の方法及び構築物
TW202208406A (zh) 用於治療kcnq4相關性聽力損失之組成物及方法
US20200291427A1 (en) Crispr-based therapeutics for targeting htra1 and methods of use