ES2784005T3 - Proteínas que tienen actividad nucleasa, proteínas de fusión y usos de estas - Google Patents

Proteínas que tienen actividad nucleasa, proteínas de fusión y usos de estas Download PDF

Info

Publication number
ES2784005T3
ES2784005T3 ES18181129T ES18181129T ES2784005T3 ES 2784005 T3 ES2784005 T3 ES 2784005T3 ES 18181129 T ES18181129 T ES 18181129T ES 18181129 T ES18181129 T ES 18181129T ES 2784005 T3 ES2784005 T3 ES 2784005T3
Authority
ES
Spain
Prior art keywords
nucleic acid
sequence
dna
acid molecule
nuclease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18181129T
Other languages
English (en)
Inventor
Ralf Kühn
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Helmholtz Zentrum Muenchen Deutsches Forschungszentrum fuer Gesundheit und Umwelt GmbH
Original Assignee
Helmholtz Zentrum Muenchen Deutsches Forschungszentrum fuer Gesundheit und Umwelt GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Helmholtz Zentrum Muenchen Deutsches Forschungszentrum fuer Gesundheit und Umwelt GmbH filed Critical Helmholtz Zentrum Muenchen Deutsches Forschungszentrum fuer Gesundheit und Umwelt GmbH
Application granted granted Critical
Publication of ES2784005T3 publication Critical patent/ES2784005T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0608Germ cells
    • C12N5/0609Oocytes, oogonia
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/21Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
    • C12Y301/21004Type II site-specific deoxyribonuclease (3.1.21.4)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/05Animals modified by non-integrating nucleic acids, e.g. antisense, RNAi, morpholino, episomal vector, for non-therapeutic purpose
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2999/00Further aspects of viruses or vectors not covered by groups C12N2710/00 - C12N2796/00 or C12N2800/00
    • C12N2999/007Technological advancements, e.g. new system for producing known virus, cre-lox system for production of transgenic animals

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Environmental Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Cell Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Mycology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

Una molécula de ácido nucleico que codifica (I) un polipéptido que tiene la actividad de una endonucleasa, que es (a) una molécula de ácido nucleico que codifica un polipéptido que comprende la secuencia de aminoácidos de la sec. con núm. de ident.:1; (b) una molécula de ácido nucleico que comprende la secuencia de nucleótidos de la sec. con núm. de ident.: 2; (c) una molécula de ácido nucleico que codifica una endonucleasa, cuya secuencia de aminoácidos es al menos 70 % idéntica a la secuencia de aminoácidos de la sec. con núm. de ident.:1; (d) una molécula de ácido nucleico que comprende una secuencia de nucleótidos que es al menos 50 % idéntica a la secuencia de nucleótidos de la sec. con núm. de ident.: 2; (e) una molécula de ácido nucleico que es degenerada con respecto a la molécula de ácido nucleico de (d); o (f) una molécula de ácido nucleico correspondiente a la molécula de ácido nucleico de cualquiera de (a) hasta (e) en donde T se reemplaza por U; (II) un fragmento del polipéptido de (I) que tiene la actividad de una endonucleasa.

Description

DESCRIPCIÓN
Proteínas que tienen actividad nucleasa, proteínas de fusión y usos de estas
La presente invención se refiere a una molécula de ácido nucleico que codifica (I) un polipéptido que tiene la actividad de una endonucleasa, que es (a) una molécula de ácido nucleico que codifica un polipéptido que comprende o que consiste en la secuencia de aminoácidos de la sec. con núm. de ident.: 1; (b) una molécula de ácido nucleico que comprende o que consiste en la secuencia de nucleótidos de la sec. con núm. de ident.: 2; (c) una molécula de ácido nucleico que codifica una endonucleasa, cuya secuencia de aminoácidos es al menos 70 % idéntica a la secuencia de aminoácidos de la sec. con núm. de ident.: 1; (d) una molécula de ácido nucleico que comprende que consiste en una secuencia de nucleótidos que es al menos 50 % idéntica a la secuencia de nucleótidos de la sec. con núm. de ident.: 2; (e) una molécula de ácido nucleico que es degenerada con respecto a la molécula de ácido nucleico de (d); o (f) una molécula de ácido nucleico correspondiente a la molécula de ácido nucleico de cualquiera de (a) hasta (e) en donde T se reemplaza por U; (II) un fragmento del polipéptido de (I) que tiene la actividad de una endonucleasa. Además, la presente invención se refiere a un vector que comprende la molécula de ácido nucleico y una proteína codificada por dicha molécula de ácido nucleico. Además, la invención se refiere a un método para modificar el genoma de una célula eucariótica y a un método para producir un vertebrado no humano o mamífero.
Las nucleasas, desde su descubrimiento a finales de los años 1960, permanecen como una de las herramientas más importantes para los biólogos moleculares. Las nucleasas son enzimas capaces de escindir los enlaces fosfodiéster entre las subunidades de nucleótidos de los ácidos nucleicos. Las enzimas que catalizan la escisión del ADN y del ARN son partes integrales de los principales procesos metabólicos del ADN, tales como la replicación del ADN, la recombinación del ADN, la reparación del ADN, la recombinación en un sitio específico y el empalme del ARN. Además, las actividades nucleasas son esenciales en el procesamiento y la maduración del ARN, en el ARN de interferencia y son componentes de los mecanismos de defensa microbiana.
El ARN y el ADN presentan solamente dos tipos de enlaces fosfodiéster para la escisión, 5'- o 3'- de un fosfato escindible y la química fundamental es la sustitución nucleofílica bimolecular. Sin embargo, las estructuras y los mecanismos catalíticos de las nucleasas de ARN y ADN son muy variados y complejos. Las nucleasas pueden ser endonucleasas o exonucleasas, específicas del ADN o del ARN, topoisomerasas, recombinasas, ribozimas, o enzimas de empalme del ARN. Su reacción puede dividirse en las tres etapas del ataque nucleofílico, la formación de un intermedio pentacovalente cargado negativamente y la rotura del enlace escindible. Las nucleasas utilizan una variedad de nucleófilos para escindir un enlace fosfato escindible. Los nucleófilos más comunes son las moléculas de agua desprotonadas por una base general para la hidrólisis directa. Para la escisión del ADN, las cadenas laterales de Ser, Tir e His sirven como nucleófilos para formar un intermedio covalente de ADN fosforil-proteína, que se resuelve posteriormente ya sea mediante la reacción de transferencia del fosforilo nuevamente al ADN durante la recombinación y topoisomerización, o mediante hidrólisis en reacciones de escisión de dos etapas. Para permitir la degradación controlada o el procesamiento del ADN o ARN celular, las actividades de las nucleasas se regulan estrictamente mediante una rigurosa especificidad de sustrato, localización confinada, o mediante inhibidores potentes.
Por conveniencia, las nucleasas pueden clasificarse de acuerdo con su mecanismo catalítico en tres clases principales basado en su dependencia de iones metálicos (Yang, W. (2011). Q. Rev. Biophys. 44(1): 1-93). Estas clases de nucleasas dependientes de dos iones metálicos, de un ion metálico e independientes de metales se dividen, además, en familias o superfamilias de acuerdo con la conservación de la secuencia y la estructura y la diversidad funcional.
Endonucleasas de Restricción
Entre todas las tres clases catalíticas se encuentran diversas familias de endonucleasas de restricción. Las enzimas de restricción de tipo I, III y IV son maquinarias moleculares complejas y de múltiples subunidades que combinan múltiples actividades que incluyen la restricción, la metilación y la translocación de ADN, requieren cofactores adicionales (AdoMet, ATP o GTP), se unen a más de un sitio diana, y escinden por fuera de la secuencia de reconocimiento, con frecuencia a una distancia aleatoria. Las endonucleasas de restricción de tipo II son enzimas que reconocen secuencias cortas de ADN (generalmente de 4-8 pb de longitud) y escinden la diana en ambas hebras en, o muy cerca de, el sitio de reconocimiento. Las enzimas de restricción tipo II ortodoxas son homodiméricas, escinden dentro de secuencias palindrómicas, requieren iones Mg2+ y pueden actuar sobre copias únicas de sus dianas. Debido a su especificidad notablemente alta para reconocer y escindir sus secuencias diana, son de gran interés como las herramientas más frecuentemente usadas para la tecnología del ADN recombinante (Pingoud, A., M. Fuxreiter, y otros (2005). Cell Mol Life Sci 62(6): 685-707; Orlowski, J. y J. M. Bujnicki (2008). Nucleic Acids Res 36(11): 3552-69).
En la naturaleza, las REasastipo II (endonucleasas de restricción) se encuentran en los organismos procarióticos, donde ellas forman sistemas de modificación por restricción con las ADN metiltransferasas de la misma o muy similar especificidad de sustrato. Las ADN metiltransferasas usan S-adenosilmetionina (AdoMet) como un donante del grupo metilo para modificar bases específicas en la secuencia diana, de esta manera las vuelve resistente a la escisión mediada por la enzima de restricción. Mientras que el ADN del propio sistema de Restricción-Modificación se protege contra la autodegradación por la nucleasa, cualquier ADN extraño (por ejemplo, de los fagos) que invade la célula huésped y que carece de metilación, puede destruirse eficientemente. Para distinguir los componentes de los sistemas de modificación/restricción los nombres de las metilasas y nucleasas están precedidos de los prefijos 'M'. y 'R.' (por ejemplo, M.Fokl y R.Fokl).
Muchas endonucleasas de restricción de tipo II usadas comúnmente comparten el motivo conservado PD-(D/E)XK. Dicho motivo se encuentra, generalmente, en proteínas que interaccionan con moléculas de ácido nucleico tales como el ADN y no se limita a la presencia en nucleasas. Los tres residuos catalíticos se ubican cercanos entre sí en una horquilla p irregular. La primera D se ubica al inicio de la hebra primera y más corta, y la E y la K, separadas por un residuo hidrófobo x, en el medio de la hebra segunda y más larga. La primera D es la más conservada y coordina ambos iones metálicos, mientras que la segunda E puede reemplazarse por Q, D, N, H o S, y la tercera K puede reemplazarse por E, Q, D, S, N o T. Mediante la variación de las interfaces diméricas y, por lo tanto, de las posiciones relativas de los dos centros catalíticos, las endonucleasas diméricas pueden escindir el ADN para generar extremos romos o extremos escalonados con diversos salientes 5'- o 3'-. El módulo catalítico se aproxima invariablemente al ADN desde el lado del surco menor, y la unión a la secuencia específica se realiza mediante un módulo/subdominio separado en el surco mayor. Los dos primeros carboxilatos del motivo DEK coordinan los iones metálicos. El tercero, que generalmente se une al hidrógeno, tanto con el agua nucleófila como con el módulo de unión al ADN en el surco mayor, acopla el reconocimiento de la secuencia de ADN con la reacción de escisión. Los miembros de esta superfamilia tienen una secuencia primaria muy diversa y, por lo tanto, diferentes estructuras que rodean el núcleo catalítico. Las búsquedas en bases de datos con secuencias de enzimas de restricción, típicamente, no muestran similitud significativa con cualquier proteína, o una similitud muy alta (> 90 % de identidad) con unos pocos isosquizómeros, y ninguna similitud con otras proteínas. Esta distribución fuertemente sesgada de similitudes y disimilitudes dificultó el análisis de secuencia comparativa de todas las enzimas de restricción y planteó una interrogante acerca de si la diversidad de secuencias de aminoácidos de las endonucleasas de restricción indica evolución polifilética (convergencia) o divergencia extrema de un ancestro común.
Mientras que ~70 % de las endonucleasas de restricción pertenecen a la superfamilia PD-(D/E)XK, otros miembros de la superfamilia pueden ser monoméricos o tetraméricos e involucrarse en otros procesos tales como la reparación del ADN y la recombinación homóloga. Además de las endonucleasas, los miembros de esta superfamilia pueden ser, además, exonucleasas 5'- o 3'-. La fuente más completa de información sobre enzimas de restricción es la base de datos REBASE (http://rebase.neb.com) que enumera varios miles de enzimas caracterizadas funcionalmente y varios miles de enzimas putativas, deducidas a partir de comparaciones de secuencias o de análisis genómicos. Por lo tanto, existe una gran desproporción entre el número de secuencias conocidas o predichas y el número pequeño de ~50 proteínas caracterizadas experimentalmente con estructuras tridimensionales conocidas. En la actualidad, una gran fracción de enzimas putativas permanece sin ninguna predicción o dato experimental.
Las REasas tipo II se subdividen adicionalmente en numerosos tipos de acuerdo con la simetría de su sitio de reconocimiento, la organización estructural o la necesidad de cofactor. La mayoría de las enzimas de restricción usadas para el trabajo con el ADN recombinante pertenecen al Tipo IIP (P - palindrómico). Las enzimas Tipo IIA reconocen secuencias asimétricas, como Bpu10I, un dímero de subunidades no idénticas, cada una de las cuales es responsable de la escisión de una hebra del ADN. Las enzimas Tipo IIB escinden el ADN a ambos lados de la secuencia de reconocimiento, un ejemplo es Bpll que, en la hebra de arriba escinde 8 nucleótidos antes y 13 nucleótidos después de la secuencia de reconocimiento, mientras que en la hebra de abajo escinde 13 nucleótidos antes y 8 nucleótidos después de la secuencia de reconocimiento. Las enzimas Tipo IIC tienen dos dominios, uno de escisión y otro de modificación, dentro de un polipéptido. Las enzimas Tipo IIE, para una escisión eficaz, necesitan interaccionar con dos copias de sus secuencias de reconocimiento, una es la copia diana para la escisión, la otra copia sirve como un efector alostérico. Las enzimas Tipo IIE, como Nael, reconocen secuencias de nucleótidos palindrómicas de una manera similar a las enzimas Tipo IIP y escinden el ADN dentro de los límites de sus sitios de reconocimiento; sin embargo, poseen un dominio de unión al ADN separado para realizar una función alostérica. Las enzimas Tipo IIF típicamente, son endonucleasas de restricción homotetraméricas que, además, interaccionan con dos copias de su sitio de reconocimiento, pero escinden ambas de una manera concertada. Las enzimas Tipo IIG, esencialmente un subgrupo de enzimas tipo IIC, tienen dominios de escisión y de modificación dentro de un polipéptido. En general, son estimuladas por AdoMet, pero de cualquier otra manera se comportan como enzimas típicas Tipo II. Las enzimas Tipo IIH se comportan como las enzimas Tipo II, pero su organización genética se asemeja a los sistemas de Modificación/Restricción Tipo I. Las enzimas Tipo IIM reconocen una secuencia específica metilada y escinden el ADN en un sitio fijo. La enzima representativa más conocida es Dpnl que escinde Gm6ATC, Gm6ATm4C y Gm6ATm5C, pero no GATC, GATm4C, GATm5C o los sitios hemimetilados. Muchas otras enzimas de restricción son más o menos tolerantes a la metilación, pero para las enzimas Tipo IIM el grupo metilo es un elemento de reconocimiento esencial. Las enzimas ortodoxas Tipo IIP como EcoRI, reconocen secuencias de nucleótidos simétricas y escinden dentro de sus sitios de reconocimiento. Comparten un núcleo estructural común que comprende las cinco hojas-p mezcladas flanqueadas por a-hélices. Sin embargo, los sitios de unión al ADN de las enzimas Tipo IIP son muy diversos y generalmente forman un parche en la superficie de la proteína compuesto por residuos de aminoácidos ubicados en los diferentes elementos estructurales (a-hélices, hojas-p, lazos). Las enzimas ortodoxas Tipo IIP interaccionan con el ADN como homodímeros, y cada subunidad contribuye al reconocimiento de la mitad de la secuencia palindrómica. Las enzimas Tipo IIS escinden al menos una hebra del ADN diana fuera de la secuencia de reconocimiento. La enzima Tipo IIS mejor conocida es Fokl, que al igual que muchas otras enzimas Tipo IIS interacciona con dos sitios de reconocimiento antes de escindir el ADN. Las enzimas Tipo IIS son activas como homodímeros y están compuestas por dos dominios, uno responsable para el reconocimiento de las diana y el otro para la catálisis (que sirve, además, como el dominio de dimerización). Esto es evidente a partir de la estructura cristalina y de los estudios bioquímicos de Fokl (Bitinaite, J., D. A. Wah, y otros (1998). Proc Natl Acad Sci U S A 95(18): 10570-5; Wah, D. A., J.
Bitinaite, y otros (1998). Proc Natl Acad Sci U S A 95(18): 10564-9). El análisis de la estructura cristalina de Fokl revela que está compuesta por un módulo de unión específico al ADN fusionado con el dominio de escisión que posee un núcleo catalítico de endonucleasa conservado pero escinde el ADN de una manera no específica. La arquitectura modular es característica, además, para la enzima Bfil de Tipo IIS, que está compuesta por dos dominios de unión al ADN fusionados al núcleo catalítico dimérico similar a la nucleasa no específica que pertenece a la familia de la fosfolipasa D. La presencia de un dominio nucleasa separado se ha informado, además, a partir de la estructura cristalina de la enzima Sdal Tipo IIP (Tamulaitiene, G., A. Jakubauskas, y otros (2006). Structure 14(9): 1389-400)
Enzimas de Restricción Modificadas y nucleasas quiméricas como herramientas para la edición del genoma
Las nucleasas que escinden las moléculas de ácido nucleico en sitios específicos en lugar de en sitios aleatorios son cada vez más importantes en las tecnologías emergentes tales como, por ejemplo, en la ingeniería genética y en la transformación génica. La transformación génica es un proceso en el cual una molécula de ADN introducida en una célula reemplaza el segmento cromosómico correspondiente mediante recombinación homóloga y, por lo tanto, presenta una forma precisa de manipular el genoma (Capecchi, M. R. (2005). Nat Rev Genet 6(6): 507-12). En el pasado, la aplicación de la transformación génica en células de mamíferos estuvo limitada por su baja eficiencia. Los experimentos en sistemas modelos demostraron que la frecuencia de recombinación homóloga de un vector de transformación génica aumenta fuertemente si se induce una rotura de doble hebra dentro de su secuencia diana cromosómica. Mediante el uso de la endonucleasa de direccionamiento de levadura I-Scel, que escinde el ADN en un sitio de reconocimiento de 18 pares de bases de longitud, se demostró inicialmente que la recombinación homóloga y la transformación génica se estimulan más de 1000 veces en células de mamíferos cuando se inserta un sitio de reconocimiento en un gen diana e I-Scel se expresa en esas células (Rouet, P., Smih, F., Jasin, M.; Mol Cell Biol 1994; 14: 8096-8106; Rouet, P., Smih, F. Jasin, M; Proc Natl Acad Sci USA 1994; 91: 6064-6068). En ausencia de un vector de transformación génica para la reparación dirigida mediante homología, frecuentemente las células cierran la ruptura de la doble hebra mediante uniones de extremos no homólogos (NHEJ). Dado que este mecanismo es propenso a errores, frecuentemente conduce a la deleción o la inserción de múltiples nucleótidos en el sitio de escisión. Si el sitio de escisión se ubica dentro de la región codificante de un gen, de esta manera es posible identificar y seleccionar mutantes que muestren mutaciones con desplazamiento del marco de lectura a partir de una población mutagenizada y que representen alelos inactivados no funcionales del gen diana.
Por lo tanto, las nucleasas de secuencia específica representan una herramienta importante para la biotecnología para modificar el genoma de organismos modelos o líneas celulares. Para generar las nucleasas que reconocen específicamente nuevas secuencias diana dentro de los genes, se siguieron dos enfoques basados en la modificación de las endonucleasas de direccionamiento naturales o en la fusión de un dominio de unión al ADN, natural o modificado por ingeniería genética, a un dominio nucleasa. Tales enzimas de restricción modificadas o nucleasas quiméricas pueden dirigirse a grandes sitios de ADN (hasta 36 pb) y pueden modificarse genéticamente para unirse a secuencias de ADN deseadas.
Las endonucleasas de direccionamiento, tales como I-Scel de levaduras, son elementos genéticos naturales que catalizan su propia duplicación en alelos receptores mediante la generación de DSB en sitios específicos que inician su propia transferencia genética mediante recombinación homóloga. Una característica clave de estas enzimas es que crean roturas de la doble hebra en los sitios de reconocimiento que tienen una longitud de 14 a 40 pb. La principal limitación para el uso de endonucleasas de direccionamiento en la transformación génica es que cada enzima reconoce exclusivamente su secuencia diana natural. Mediante la ingeniería de proteínas se ha intentado modificar las endonucleasas de direccionamiento para reconocer nuevos sitios diana. En este trabajo, podrían hacerse modificaciones que alteren el sitio diana natural dentro de algunos nucleótidos, pero aún no es posible diseñar enzimas específicas para regiones diana completamente nuevas.
Debido a la dificultad para la manipulación de la secuencia de reconocimiento de las endonucleasas de direccionamiento, las nucleasas dedos de zinc (ZFN) son en la actualidad las nucleasas artificiales usadas más comúnmente para la ingeniería genética (Urnov, F. D., E. J. Rebar, y otros Nat Rev Genet 11(9): 636-46). Las nucleasas dedos de zinc se desarrollaron mediante la fusión del dominio de escisión, no específico de secuencia, de la endonucleasa de restricción Tipo IIS FokI (dominio Fn) a un nuevo dominio de unión al ADN. La ventaja de las nucleasas dedos de zinc es que el dominio dedos de zinc de unión al ADN puede modificarse para reconocer secuencias diana novedosas, que incluyen aquellas en los genes endógenos. Los módulos de proteínas conocidos como dedos de zinc se encuentran en el dominio de unión al ADN de la familia más abundante de factores de transcripción en la mayoría de los genomas eucarióticos. Cada dedo está compuesto por 30 aminoácidos, coordina un ion Zn2+ mediante el uso de dos cisteínas y dos residuos de histidina, y contacta principalmente con tres pares de bases de ADN. Dos características críticas de la estructura son que cada dedo une su sitio diana de 3 pb independientemente y que cada nucleótido parece estar en contacto por una única cadena lateral de aminoácidos que se proyecta desde un extremo de la a-hélice hasta el surco mayor del ADN. Se diseñaron dedos individuales para reconocer muchos de los 64 tripletes diana diferentes, pero el mayor éxito ha sido el diseño de dedos de zinc para reconocer los tripletes 5'-GNN-3'. Aunque se han propuesto códigos de reconocimiento de dedos de zinc, actualmente no existe ningún código que resulte consistentemente en dedos de zinc con enlace de alta afinidad. El perfeccionamiento de la especificidad de la unión de los dedos de zinc, tales como mediante el aumento del número de dedos o mediante la construcción de proteínas de múltiples dedos que usan unidades de dos dedos, permanece como un área activa de investigación.
Mediante el uso de nucleasas dedos de zinc en ausencia de un vector de transformación génica para la reparación dirigida por homología, se generaron alelos inactivados en líneas de células de mamíferos y se obtuvieron ratas y peces cebra portadores de genes inactivados tras la expresión del ARNm de ZFN en embriones unicelulares (Santiago Y, Chan E, Liu PQ, Orlando S, Zhang L, Urnov FD, Holmes MC, Guschin D, Waite A, Miller JC, Rebar e J , Gregory PD, Klug A, Collingwood TN.; Proc Natl Acad Sci U S A 2008; 105:5809-5814; Doyon Y, McCammon JM, Miller JC, Faraji F, Ngo C, Katibah GE, Amora R, Hocking TD, Zhang L, Rebar EJ, Gregory p D , Urnov FD, Amacher SL.; Nat Biotechnol 2008; 26:702-708; Geurts AM, Cost GJ, Freyvert Y, Zeitler B, Miller JC, Choi VM, Jenkins SS, Wood A, Cui X, Meng X, Vincent A, Lam S, Michalkiewicz M, Schilling R, Foeckler J, Kalloway S, Weiler H, Menoret S, Anegon I, Davis GD, Zhang L, Rebar EJ, Gregory PD, Urnov FD, Jacob HJ, Buelow R.; Science 2009; 325:433). Además, las nucleasas dedo de zinc se usaron en presencia de vectores de transformación génica exógenos que contienen regiones de homología con el gen diana para la reparación dirigida por homología de la ruptura de doble hebra a través de la conversión génica. Esta metodología se aplicó a la ingeniería genética en líneas de células de mamíferos y en la corrección génica en células humanas primarias (Urnov FD, Miller JC, Lee YL, Beausejour CM, Rock JM, Augustus S, Jamieson AC, Porteus MH, Gregory PD, Holmes MC.; Nature 2005; 435:646-651; Porteus MH, Baltimore D. 2003. Science 300:763; Hockemeyer D, Soldner F, Beard C, Gao Q, Mitalipova M, DeKelver RC, Katibah GE, Amora R, Boydston EA, Zeitler B, Meng X, Miller JC, Zhang L, Rebar EJ, Gregory PD, Urnov FD, Jaenisch R.; Nat Biotechnol 2009; 27:851-857).
Aunque el uso de las nucleasas dedos de zinc resulta en una mayor frecuencia de recombinación homóloga, se requieren esfuerzos y tiempos considerables para diseñar proteínas dedos de zinc que se unen a una nueva secuencia diana de ADN con alta eficiencia y que actúen como nucleasas de una secuencia específica. Además, durante mucho tiempo se ignoró que la naturaleza del dominio nucleasa de las nucleasas dedos de zinc, y de otras nucleasas quimérica, puede representar un factor de éxito igualmente importante para la actividad general de la proteína de fusión. La razón de esta desatención se basa en el hecho de que hasta la fecha solamente se encontró un único dominio nucleasa que retiene la actividad nucleasa dentro de un dominio de plegamiento de proteínas separado y que puede combinarse con los dominios de unión al ADN, para generar una proteína de fusión nucleasa de secuencia específica. Este dominio nucleasa se deriva de la enzima de restricción Fokl, Tipo IIS, que se ha caracterizado en detalle y se conoce que actúa como un dímero obligado (Bitinaite, J., D. A. Wah, y otros (1998). Proc Natl Acad Sci U S A 95(18): 10570-5; Wah, D. A., J. Bitinaite, y otros (1998). Proc Natl Acad Sci U S A 95(18): 10564-9). En la mayoría de las otras enzimas de restricción, el reconocimiento y la escisión del ADN se combinan en un solo dominio de proteína y no pueden separarse. Una excepción es la enzima Sdal que se ha caracterizado estructuralmente por poseer un dominio nucleasa separado (Tamulaitiene, G., A. Jakubauskas, y otros (2006). Structure 14(9): 1389-400). Además, no ha sido posible aislar mutantes que pierden el reconocimiento de ADN pero retienen la actividad de escisión del ADN.
Por lo tanto, debido a la falta de otros dominios nucleasas funcionales comparables, durante mucho tiempo fue esencialmente desconocido si las propiedades enzimáticas del dominio Fokl Fn pueden constituir un factor limitante para la actividad nucleasa del dominio Fn de las proteínas de fusión. Por ejemplo, la estructura intrínseca del dominio Fn puede restringir su actividad enzimática o la pequeña interfaz de dimerización de dos dominios Fn puede conducir a una interacción subóptima y a una baja tasa de escisión del sustrato de ADN.
Mediante mutagénesis dirigida, el dominio Fokl Fn se modificó genéticamente en las variantes KK y EL que actúan, preferentemente, como heterodímeros (Miller, J. C., M. C. Holmes, y otros (2007). Nat Biotechnol 25(7): 778-85). El uso de estas variantes proporciona la especificidad mejorada por la secuencia diana de las nucleasas dedos de zinc y disminuye la toxicidad en las células de mamíferos, ya que se reconocen y procesan menos secuencias genómicas fuera de la diana. Sin embargo, la actividad nucleasa global de las variantes KK y EL es, a lo máximo, comparable a la del dominio Fn de tipo silvestre.
Sólo muy recientemente se encontró que el dominio Fokl Fn de tipo silvestre exhibe ciertamente solo una actividad enzimática nucleasa subóptima, que limita el uso de las nucleasas dedos de zinc para la modificación genética del genoma. En un estudio de evolución de proteínas dirigida, el dominio Fn se mutagenizó al azar y se sometió a un ensayo en E. coli basado en nucleasa capaz de seleccionar mutantes que exhiben una actividad enzimática aumentada (Guo, J., T. Gaj, y otros (2010), J Mol Biol 400(1): 96-107). Mediante este procedimiento, se hizo posible aislar mutantes que exhiben una actividad de nucleasa > 10 veces más alta en comparación con el dominio Fn de tipo silvestre. Después del acoplamiento de estos mutantes a dominios dedos de zinc, tales proteínas de fusión mostraron un procesamiento de sustrato mejorado de tres a seis veces en células de mamíferos. Sin embargo, en la actualidad permanece desconocido si la actividad del dominio Fn puede mejorarse aún más o si la arquitectura intrínseca de la proteína del dominio Fn puede restringir cualquier mejora adicional.
Además de los dominios dedos de zinc de unión al ADN fusionados a los dominios nucleasa, muy recientemente se identificó, además, los dominios de unión al ADN de la proteína efectora TAL. En comparación con los motivos dedos de zinc, los elementos de repetición TAL dentro de las proteínas efectoras TAL proporcionan un nuevo tipo de dominio de unión al ADN que puede combinarse con un dominio nucleasa en nucleasas de secuencia específica. Una característica clave de los elementos peptídicos TAL se proporciona por su naturaleza moduladora. De esta manera, pueden generarse nuevas proteínas de unión al ADN en una secuencia específica mediante la combinación de solo cuatro elementos TAL básicos que cada uno es específico para los nucleótidos A, C, G o T. Actualmente, solamente el dominio nucleasa de Fokl se usa exitosamente en la fusión con los dominios de unión al ADN de la proteína efectora TAL (Miller y otros (2010). Nat. Biotechnol. 29, 143-148).
En resumen, existe una necesidad continua de nucleasas que puedan usarse en diversos entornos experimentales, que incluyen su fusión a otras proteínas y la modificación del dominio nucleasa.
El problema técnico que subyace en la presente invención fue la identificación de alternativas y/o medios y métodos mejorados para escindir moléculas de ácido nucleico.
La solución a este problema técnico se logra al proporcionar las realizaciones caracterizadas en las reivindicaciones.
En consecuencia, la presente invención se refiere en una primera realización a una molécula de ácido nucleico que codifica (I) un polipéptido que tiene la actividad de una endonucleasa, que es (a) una molécula de ácido nucleico que codifica un polipéptido que comprende o que consiste en la secuencia de aminoácidos de la sec. con núm. de ident.: 1; (b) una molécula de ácido nucleico que comprende o que consiste en la secuencia de nucleótidos de la sec. con núm. de ident.: 2; (c) una molécula de ácido nucleico que codifica una endonucleasa, cuya secuencia de aminoácidos es al menos 70 % idéntica a la secuencia de aminoácidos de la sec. con núm. de ident.: 1; (d) una molécula de ácido nucleico que comprende o que consiste en una secuencia de nucleótidos que es al menos 50 % idéntica a la secuencia de nucleótidos de la sec. con núm. de ident.: 2; (e) una molécula de ácido nucleico que es degenerada con respecto a la molécula de ácido nucleico de (d); o (f) una molécula de ácido nucleico correspondiente a la molécula de ácido nucleico de cualquiera de (a) hasta (e) en donde T se reemplaza por U; (II) un fragmento del polipéptido de (I) que tiene la actividad de una endonucleasa.
De acuerdo con la presente invención el término "molécula de ácido nucleico" define una cadena molecular lineal que consiste en al menos (para cada una) 2, 5, 10, 25, 50, 75, 100, 250, 500, tal como al menos 750, 1000, o al menos 2500 o más nucleótidos. El grupo de moléculas designado en la presente descripción como "moléculas de ácido nucleico" comprende, además, genes completos. El término "molécula de ácido nucleico", en la presente descripción se usa indistintamente con el término "polinucleótido".
El término "molécula de ácido nucleico" de acuerdo con la presente invención incluye ADN, tal como ADNc o ADN genómico, de doble o simple hebra, y ARN. En este sentido, "ADN" (ácido desoxirribonucleico) se refiere a cualquier cadena o secuencia de los bloques de construcción químicos adenina (A), guanina (G), citosina (C) y timina (T), llamadas bases de nucleótidos, que están unidas sobre una cadena principal de azúcar desoxirribosa. El ADN puede tener una hebra de bases de nucleótidos, o dos hebras complementarias que pueden formar una estructura de doble hélice. El "ARN" (ácido ribonucleico) se refiere a cualquier cadena o secuencia de los bloques de construcción químicos adenina (A), guanina (G), citosina (C) y uracilo (U), llamadas bases de nucleótidos, que se unen juntos en una cadena principal de azúcar ribosa. Típicamente, el ARN tiene una hebra de bases de nucleótidos. Además, se incluyen moléculas híbridas monocatenarias y bicatenarias, es decir, ADN-ARN. La molécula de ácido nucleico puede modificarse, además, por muchos medios conocidos en la técnica. Los ejemplos no limitantes de tales modificaciones incluyen la metilación, los "capuchones", la sustitución de uno o más de los nucleótidos de origen natural con un análogo, y las modificaciones entre los nucleótidos, tales como por ejemplo, aquellas con enlaces no cargados (por ejemplo, fosfonatos de metilo, fosfotriésteres, fosforamidatos, carbamatos, etcétera) y con enlaces cargados (por ejemplo, fosforotioatos, fosforoditioatos, etcétera). Los polinucleótidos pueden contener una o más porciones adicionales unidas covalentemente, tales como, por ejemplo, proteínas (por ejemplo, nucleasas, toxinas, anticuerpos, péptidos señal, poli-L-lisina, etcétera), intercaladores (por ejemplo, acridina, psoraleno, etcétera), agentes quelantes (por ejemplo, metales, metales radiactivos, hierro, metales oxidativos, etcétera), y agentes alquilantes. Los polinucleótidos pueden derivatizarse mediante la formación de un metil o etil fosfotriéster o un enlace alquilo fosforamidato. Se incluyen, además, moléculas que imitan el ácido nucleico conocidas en la técnica, tales como los derivados sintéticos o semisintéticos de ADN o ARN y los polímeros mixtos. Tales moléculas que imitan el ácido nucleico o los derivados de ácido nucleico de acuerdo con la invención incluyen ácido nucleico fosforotioato, ácido nucleico fosforamidato, ácido ribonucleico 2'-O-metoxietilo, ácido nucleico morfolino, ácido nucleico hexitol (HNA), ácido nucleico peptídico (PNA) y ácido nucleico bloqueado (LNA) (ver Braasch y Corey, Chem Biol 2001, 8: 1). El LNA es un derivado de ARN en el que el anillo de ribosa se restringe por un enlace metileno entre el oxígeno-2' y el carbono-4'. Además, se incluyen los ácidos nucleicos que contienen bases modificadas, por ejemplo, tiouracilo, tioguanina y fluorouracilo. Típicamente, una molécula de ácido nucleico transporta la información genética, que incluye la información usada por la maquinaria celular para producir proteínas y/o polipéptidos. La molécula de ácido nucleico de la invención puede comprender, adicionalmente, promotores, potenciadores, elementos de respuesta, secuencias de señal, secuencias de poliadenilación, intrones, regiones no codificantes 5' y 3' y similares.
El término "polipéptido", como se usa en la presente descripción indistintamente con el término "proteína", describe cadenas moleculares lineales de aminoácidos, que incluye las proteínas de cadena sencilla, que contienen más de 30 aminoácidos, mientras que el término "péptido" describe cadenas moleculares lineales de aminoácidos, que incluye las proteínas de cadena sencilla, que contienen menos de, y hasta 30 aminoácidos. Los polipéptidos pueden formar, además, oligómeros que consisten en al menos dos moléculas idénticas o diferentes. Las correspondientes estructuras de orden superior de tales multímeros son, según el caso, denominados homo o heterodímeros, homo o heterotrímeros, etcétera. Los polipéptidos de la invención pueden formar heteromultímeros u homomultímeros, tales como heterodímeros u homodímeros. Además, los peptidomiméticos de tales proteínas/polipéptidos donde los aminoácidos y/o los enlaces peptídicos se reemplazaron por análogos funcionales, son además, comprendidos por la invención. Tales análogos funcionales incluyen todos los aminoácidos conocidos distintos de los 20 aminoácidos codificados por genes, tal como la selenocisteína. Los términos "polipéptido" y "proteína" se refieren, además, a polipéptidos y proteínas modificados naturalmente, donde la modificación se efectúa, por ejemplo, mediante glicosilación, acetilación, fosforilación, ubiquitinilación y modificaciones similares que se conocen bien en la técnica.
El término "un polipéptido que tiene la actividad de una endonucleasa", como se usa en la presente descripción, se refiere a un polipéptido que es capaz de escindir los enlaces fosfodiéster entre las subunidades de nucleótidos de ácidos nucleicos dentro de una cadena de polinucleótidos.
De acuerdo con la invención, la actividad enzimática endonucleasa se considera estable cuando, en las condiciones respectivas, la enzima es capaz de durar lo suficiente como para obtener el efecto deseado, específicamente, la escisión de su sustrato. Con respecto a esto, se observa que la actividad endonucleasa puede evaluarse como se describió en los ejemplos de la descripción o mediante métodos bien conocidos en la técnica. Por ejemplo, una molécula de ácido nucleico puede exponerse a una proteína cuya actividad endonucleasa debe evaluarse en condiciones que son adecuadas para la actividad enzimática endonucleasa. Después de la incubación, la composición que comprende la molécula de ácido nucleico (con o sin dicha proteína a evaluar) puede someterse a un ensayo para evaluar la longitud de una molécula de ácido nucleico tal como, por ejemplo, electroforesis en gel, para determinar si la molécula de ácido nucleico fue escindida.
De acuerdo con la presente invención, el término "porcentaje (%) de identidad de secuencia" describe el número de coincidencias ("aciertos") de nucleótidos/aminoácidos idénticos de dos o más secuencias de ácido nucleico o de aminoácido alineadas en comparación a la cantidad de nucleótidos o de residuos de aminoácidos que constituyen la longitud total de las secuencias modelos de ácido nucleico o aminoácidos. En otros términos, mediante el uso de una alineamiento, para dos o más secuencias o subsecuencias, puede determinarse el porcentaje de residuos de aminoácidos o de nucleótidos que son iguales (por ejemplo, 95 % de identidad) cuando se comparan y se alinean las (sub)secuencias para obtener el máximo de correspondencia en una ventana de comparación, o en una región designada según lo medido mediante el uso de un algoritmo de comparación de secuencias como se conoce en la técnica, o cuando se realiza el alineamiento manualmente y se inspecciona visualmente. Esta definición se aplica, además, al complemento de cualquier secuencia para alinearse. El alineamiento y el análisis de la secuencia de aminoácidos en relación con la presente invención se realizaron mediante el uso del algoritmo de la NCBI BLAST (Stephen F. Altschul, Thomas L. Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, y David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402) y el programa informático del banco de trabajo principal CLC (versión 5.7.1; CLC bio, Aarhus, Dinamarca) que se usan, preferentemente, de acuerdo con esta invención. Preferentemente, se usan los parámetros estándar publicados (Altschul y otros, en el lugar citado). El experto en la técnica conoce la existencia de programas adicionales adecuados para alinear secuencias de ácidos nucleicos. Un programa preferido para el alineamiento de las secuencias de ácido nucleico, de acuerdo con la invención, es el programa informático del banco de trabajo principal CLC que usa los parámetros de alineamientos estándar del programa informático (versión 5.7.1; CLC bio, Aarhus, Dinamarca).
Como se define en las realizaciones anteriores en la presente descripción, la invención contempla determinadas identidades de secuencia de aminoácidos. Además, se contempla, con preferencia creciente, las identidades de secuencias de aminoácidos de al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, al menos 97,5 %, al menos 98 %, al menos 98,5 %, al menos 99 %, al menos 99,5 %, al menos 99,8 %, y 100 % de identidad con la secuencia de aminoácidos respectiva de acuerdo con la invención.
Como se define en las realizaciones anteriores en la presente descripción, la invención contempla determinadas identidades de secuencia de nucleótidos. Además, se contempla, con preferencia creciente, las identidades de secuencias de nucleótidos de al menos 55 %, al menos 60 %, al menos 65 %, al menos 70 %, al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, al menos 97,5 %, al menos 98 %, al menos 98,5 %, al menos 99 %, al menos 99,5 %, al menos 99,8 %, y 100 % de identidad con respecto a la secuencia de ácido nucleico respectiva de acuerdo con la invención.
El experto en la técnica apreciará fácilmente que más de una molécula de ácido nucleico puede codificar el mismo polipéptido debido a la degeneración del código genético. La degeneración se debe a que un código de tripletes designa a 20 aminoácidos y un codón de parada. Debido a que existen cuatro bases que se utilizan para codificar la información genética, se necesitan codones de tripletes para producir al menos 21 códigos diferentes. Las 43 posibilidades posibles para las bases en los tripletes proporcionan 64 codones posibles, lo que significa que alguna degeneración debe existir. Como un resultado, algunos aminoácidos están codificados por más de un triplete, es decir, por hasta seis. La degeneración surge principalmente a partir de alteraciones en la tercera posición en un triplete. Esto significa que las moléculas de ácido nucleico que tienen diferentes secuencias, pero que aún codifican el mismo polipéptido se contemplan y pueden emplearse de acuerdo con el método de la presente invención.
Los fragmentos de acuerdo con la presente invención son polipéptidos que tienen la actividad de una endonucleasa, como se define anteriormente en la presente descripción, y comprenden al menos 90 aminoácidos. Con respecto a esto, se prefiere, con preferencia creciente, que los fragmentos de acuerdo con la presente invención sean polipéptidos de al menos 100, al menos 125, al menos 150, al menos 200 aminoácidos, al menos 300 aminoácidos, al menos 400 aminoácidos. Los fragmentos del polipéptido de la invención, que retienen sustancialmente la actividad endonucleasa, incluyen truncamientos N-terminales, truncamientos C-terminales, sustituciones de aminoácidos, deleciones internas y adición de aminoácidos (ya sea internamente o en cualquier extremo de la proteína). Por ejemplo, las sustituciones de aminoácidos conservativas son conocidas en la técnica y pueden introducirse en la endonucleasa de la invención sin afectar sustancialmente la actividad endonucleasa, es decir, disminuir dicha actividad.
Como es evidente a partir de los ejemplos, el inventor fue capaz de identificar y aislar una nueva nucleasa, en particular el dominio endonucleasa, derivado de una cepa de Clostridium como se detalla más abajo. Específicamente, el inventor pudo establecer la utilidad del producto génico de un gen bacteriano putativo sin connotación funcional conocida como una secuencia de nucleasa inespecífica. La nucleasa novedosa puede emplearse en diversos entornos experimentales al igual que cualquier otra nucleasa. Por ejemplo, puede usarse para escindir aleatoriamente moléculas de ácido nucleico o, por ejemplo, en fusión con dominios de unión al ADN, para la escisión en un sitio específico de las moléculas de ácido nucleico. Es importante destacar que, como se describe más abajo y específicamente en los ejemplos, la endonucleasa novedosa puede usarse en combinación con los dominios de unión al ADN de la proteína efectora TAL como parte de una proteína de fusión para la escisión de ácidos nucleicos en una secuencia específica. Con respecto a esto, la nucleasa novedosa muestra su superioridad sobre las endonucleasas del estado de la técnica distintas de Fokl, que hasta el momento no pudieron mostrarse activas en las proteínas de fusión correspondientes. Brevemente, los inventores probaron el producto génico de dicho gen microbiano hipotético no caracterizado que designaron como "Clo051" (sec. con núm. de ident.: 17) y que se derivó del genoma de Clostridium spec. 7_2_43FAA (Secuencia de Referencia del NCBI: ZP_05132802.1; publicación/base de datos liberada en fecha: 9 de junio, de 2010), más específicamente su dominio nucleasa putativo (ver Figuras 5 y 6), por su actividad endonucleasa en combinación con el dominio de unión al ADN de una proteína efectora TAL. Además, se evaluaron diversas proteínas endonucleasas conocidas en combinación con los dominios de unión al ADN de la proteína efectora TAL, así como también otros dos genes microbianos hipotéticos. Sorprendentemente, solamente pudo demostrarse que el dominio nucleasa de Clo051 estaba activo, mientras que las otras proteínas de fusión no mostraron actividad (ver el Ejemplo 1 para los detalles). Los experimentos comparativos enfatizaron en el significado del descubrimiento de la presente invención en que se identificó una nucleasa novedosa que, además, exhibe actividad cuando se fusiona a los dominios de unión al ADN de las proteínas efectoras TAL. Las proteínas efectoras TAL se expresan por los patógenos de plantas del género Xanthomonas y reprograman las células huésped mediante la imitación de los factores de transcripción eucarióticos. Las proteínas efectoras TAL se caracterizan por un dominio central de repeticiones en tándem de 32 a 34 aminoácidos que constituyen un dominio de unión al ADN. El número y el orden de las repeticiones en una proteína efectora TAL determinan su actividad específica de unión al ADN. (Boch, J., y otros 2009 Science 326: 1509-12). Las secuencias de aminoácidos de las repeticiones son conservadas, excepto para dos residuos adyacentes altamente variables (en las posiciones 12 y 13) que determinan la especificidad hacia las bases del ADN A, G, C o T. La unión al ADN se realiza mediante el contacto de un nucleótido de la doble hélice del ADN con los residuos variables en la posición 12 y 13 dentro del motivo efector de TAL, lo que resulta en una correspondencia uno a uno entre las repeticiones secuenciales en las proteínas efectoras TAL y los nucleótidos secuenciales en el ADN diana. La unión a secuencias de ADN más largas se logra mediante la unión en tándem de varios de estos motivos efectores TAL para formar un "dominio de unión al ADN de una proteína efectora TAL". El uso de tales dominios de unión al ADN de las proteínas efectoras TAL para la creación de proteínas de fusión, motivo efector TAL nucleasa, que reconoce y escinde una secuencia diana específica depende de la creación adecuada de los dominios de unión al ADN de las proteínas efectoras TAL que pueden reconocer específicamente dicha diana particular. La ventaja de los elementos de repetición TAL, en comparación con, por ejemplo, los elementos dedos de zinc, se proporciona por su naturaleza verdaderamente modular. De esta manera, pueden generarse nuevas proteínas de unión al ADN en una secuencia específica a través de la combinación de los cuatro elementos básicos de TAL que son específicos para los nucleótidos A, C, G o T.
Es importante señalar que, en la presente invención, el dominio nucleasa Clo051 fusionado a los dominios de unión al ADN de las proteínas efectoras t A l se evaluó y se encontró que es activo en mamíferos, específicamente en cultivos de células humanas. Por lo tanto, la utilidad de las proteínas de fusión del dominio nucleasa Clo051 para la manipulación del ADN y de los genes, específicamente en células de mamíferos, pero sin limitación, se ha demostrado directamente en el sistema biológico que proporciona aplicaciones importantes para esta tecnología. Este hallazgo es de particular importancia debido a que los estudios sobre la función de las proteínas que se realizan en organismos eucarióticos inferiores, como, por ejemplo, levaduras, no permiten una conclusión definitiva acerca de la utilidad de la proteína en estudio en células de mamíferos. Por ejemplo, una proteína específica puede funcionar de manera óptima a 30° Celsius, la temperatura de crecimiento de la levadura, pero se vuelve inestable o se inactiva a 37° Celsius que es la temperatura corporal típica de los mamíferos. Además, el medio intracelular de, por ejemplo, las células de levadura, como la concentración de iones y de proteínas, la diversidad de proteínas y los mecanismos de degradación de proteínas, se distinguen del medio intracelular de las células de mamíferos.
Mientras que los ejemplos describen solamente el uso del dominio nucleasa de Clo051 (sec. con núm. de ident.: 1), por ejemplo, en combinación con los dominios de unión al ADN, el experto en la técnica apreciará que puede emplearse la secuencia completa de Clo051 como se establece en la sec. con núm. de ident.: 17 o los fragmentos más cortos de esta que tienen actividad endonucleasa y que comprenden la secuencia de aminoácidos de la sec. con núm. de ident.: 1. La secuencia de aminoácidos de la sec. con núm. de ident.: 1 comienza en E389 y termina en Y587 de los aminoácidos de la sec. con núm. de ident.: 17 como se ilustra, además, en la Figura 5.
En una realización preferida de la molécula de ácido nucleico de la invención, en (I)(c) en dicha secuencia de aminoácidos que tiene al menos un 70 % de identidad de secuencia con la sec. con núm. de ident.: 1 los residuos de aminoácidos P66, D67, D84 y/o K86 de la sec. con núm. de ident.: 1 no están modificados.
El dominio nucleasa de Clo051, al igual que muchas endonucleasas de restricción Tipo-II y, por ejemplo, la proteína MutH de reparación del ADN, comparte el motivo de secuencia conservada PD-(D/E)XK dentro del núcleo de su dominio catalítico. El núcleo sirve como un andamio para un sitio activo débilmente conservado, que comprende, típicamente, dos o tres residuos ácidos (Asp o Glu) y un residuo de Lys, que juntos forman el motivo catalítico bipartito distintivo [(P)D. Xn. (D/E)XK](donde X es cualquier aminoácido). Este motivo ha llevado a denominar a esta superfamilia de proteínas como 'PD-(D/E)XK'. El trabajo sobre las enzimas de restricción y las proteínas de reparación del ADN ha demostrado que los tres residuos catalíticos se ubican cercanos entre sí en una horquilla p irregular. La primera D se ubica al inicio de la hebra primera y más corta, y la E y la K, separadas por un residuo hidrófobo x, en el medio de la hebra segunda y más larga. El módulo catalítico se aproxima invariablemente al ADN desde el lado del surco menor, y la unión a la secuencia específica se realiza mediante un módulo/subdominio separado en el surco mayor. Los dos primeros carboxilatos del motivo DEK coordinan los iones metálicos. La primera D es la más conservada y coordina ambos iones metálicos, mientras que la segunda E puede reemplazarse por Q, D, N, H o S, y la tercera K puede reemplazarse por E, Q, D, S, N o T. El residuo de lisina en el motivo DEK conservado coordina el agua nucleófila junto con el fosfato 3' al enlace escindible; la misma Lisina, además, se une al hidrógeno con un oxígeno carbonilo en el módulo de unión al ADN. Esta lisina, que es conservada en muchas endonucleasas de restricción y se reemplaza por Glu o Gln en BamHI y Bglll, se ha propuesto como un sensor para la unión al ADN y un centro que acopla el reconocimiento de bases y la escisión del a Dn (Lee y otros (2005). Molecular Cell 20, 155- 166; Orlowski, J. y J. M. Bujnicki (2008). Nucleic Acids Res 36(11): 3552-69).
La secuencia primaria del dominio nucleasa de Clo051 entre las posiciones E389 e Y587 de la secuencia de sec. con núm. de ident.: 17, es decir, la secuencia de la sec. con núm. de ident.: 1, exhibe una distribución única de los residuos de arginina (R) y lisina (K) cargados positivamente y de los residuos de glutamato (E) y aspartato (D) cargados negativamente (Figura 13). Estos residuos constituyen un paisaje tridimensional de cargas dentro del dominio Clo051 que determina la estructura terciaria única de esta nucleasa, como se muestra en el modelo estructural en la Figura 6. Determinados reemplazos de residuos polares versus no polares, o de residuos no polares contra residuos polares, por ejemplo en las posiciones S35 y/o R58 de la sec. con núm. de ident.:1 (o S423 y R446 de la sec. con núm. de ident.: 17), alteran la estructura tridimensional de la cadena proteica y pueden resultar en un aumento de la actividad nucleasa. Tales reemplazos de aminoácidos pueden realizarse mediante ensayos de prueba y error o pueden seguir hipótesis específicas sobre el impacto estructural y funcional en el dominio nucleasa de Clo051. Alternativamente, un gran número de variantes mutagenizadas aleatoriamente de la región codificante del dominio nucleasa de Clo051 pueden ensamblarse en una biblioteca mediante PCR mutagénico, propenso a errores. Esta biblioteca de moléculas mutantes puede analizarse para detectar la presencia de variantes hiperactivas de nucleasa mediante un ensayo de selección fenotípico en células de E. coli,, levaduras o mamíferos que se acopla a una lectura de nucleasa funcional, por ejemplo, como se describió para la mejora de la recombinasa FLP (Buchholz y otros, Nat. Biotechnol. 16,657-62,1998). Tal selección funcional para variantes mejoradas de nucleasas puede resultar en el reemplazo de residuos únicos o múltiples que conduce a un aumento de la actividad nucleasa en comparación con la forma de tipo silvestre de Clo051.
Además, se contemplan realizaciones donde más de un residuo de aminoácido P66, D67, D84 y/o K86 de la sec. con núm. de ident.: 1 no están modificados, tal como, por ejemplo, los tramos de aminoácidos, por ejemplo desde al menos P66 hasta al menos K86, al menos R64 hasta al menos Y88, al menos G62 hasta al menos E90, así como también desde L60 hasta al menos Y92 de la sec. con núm. de ident.: 1.
En una realización preferida de la invención, la molécula de ácido nucleico codifica, además, un dominio de unión al ADN.
En esta realización, la molécula de ácido nucleico de la invención codifica una proteína de fusión que tiene la actividad de una endonucleasa y comprende un dominio de unión al ADN y un dominio de escisión que comprende o consiste en el dominio endonucleasa novedoso. El término "proteína de fusión" es bien conocido en la técnica y tiene el mismo significado en la presente descripción. Específicamente, se refiere a una proteína generada mediante la unión de dos o más secuencias de ácido nucleico diana, por ejemplo, genes que originalmente codifican proteínas separadas, para crear un constructo de fusión. La traducción de dicho constructo de fusión resulta en una proteína única con las propiedades funcionales derivadas de dichas proteínas separadas. Las dos proteínas que dan lugar a la proteína de fusión pueden conectarse mediante un enlazador, tal como, por ejemplo, un péptido enlazador. En otras palabras, el dominio de unión al ADN y el dominio de escisión de las nucleasas pueden fusionarse directamente entre sí o pueden fusionarse a través de un enlazador.
El término "enlazador", como se usa de acuerdo con la presente invención, se refiere a una secuela de aminoácidos (es decir, péptidos enlazadores) así como también a enlazadores no peptídicos.
Los péptidos enlazadores, como se contempla por la presente invención, son péptidos o polipéptidos enlazadores de al menos 1 aminoácido en longitud. Preferentemente, los enlazadores son de 1 hasta 100 aminoácidos en longitud. Con mayor preferencia, los enlazadores son de 5 hasta 50 aminoácidos en longitud, e incluso con mayor preferencia, los enlazadores son de 10 hasta 20 aminoácidos en longitud. Es bien conocido por el experto en la técnica que la naturaleza, es decir, la longitud y/o la secuencia de aminoácidos del enlazador puede modificar o potenciar la estabilidad y/o la solubilidad de la molécula. Por lo tanto, la longitud y la secuencia de un enlazador dependen de la composición de las porciones respectivas de la proteína de fusión.
El experto en la técnica conoce los métodos para evaluar la idoneidad de diferentes enlazadores. Por ejemplo, las propiedades de la molécula pueden probarse fácilmente mediante la evaluación de la actividad nucleasa, así como también la especificidad de unión al ADN de las porciones respectivas de la proteína de fusión para usarse en el método de la invención.
Se apreciará por el experto en la técnica que cuando la proteína de fusión se proporciona como una molécula de ácido nucleico que codifica la proteína de fusión en forma expresable, el enlazador es un péptido enlazador codificado, además, por dicha molécula de ácido nucleico.
El término "enlazador no peptídico", como se usa de acuerdo con la presente invención, se refiere a grupos de enlace que tienen dos o más grupos reactivos pero que excluyen los péptidos enlazadores como se definió anteriormente. Por ejemplo, el enlazador no peptídico puede ser un polímero que tiene grupos reactivos en ambos extremos, que se unen individualmente a grupos reactivos de las porciones individuales de la proteína de fusión, por ejemplo, un extremo amino, un residuo de lisina, un residuo de histidina o un residuo de cisteína. Los grupos reactivos del polímero incluyen un grupo aldehído, un grupo aldehído propiónico, un grupo aldehído butilo, un grupo maleimida, un grupo cetona, un grupo vinil sulfona, un grupo tiol, un grupo hidrazida, un grupo carbonildimidazol (CDI) un grupo carbonato de nitrofenilo (NPC), un grupo trisilato, un grupo isocianato y derivados de succinimida. Los ejemplos de derivados de succinimida incluyen propionato de succinimidilo (SPA), ácido succinimidil butanoico (SBA), carboximetilato de succinimidilo (SCM), succinimidil succinamida (SSA), succinimidil succinato (SS), succinimidil carbonato y N-hidroxi succinimida (NHS). Los grupos reactivos en ambos extremos del polímero no peptídico pueden ser iguales o diferentes. Por ejemplo, el polímero no peptídico puede tener un grupo maleimida en un extremo y un grupo aldehído en otro extremo. Preferentemente, el enlazador es un péptido enlazador. Con mayor preferencia, el péptido enlazador consiste en siete residuos de glicina.
Además, la proteína de fusión puede estar flanqueada en los extremos N o C terminal por secuencias adicionales no relacionadas a dichas proteínas en la proteína de fusión. De acuerdo con la presente invención, una proteína de fusión de la invención comprende un dominio de unión a ADN. El término "dominio de unión al ADN" tiene el mismo significado como se conoce en la técnica y se refiere a un motivo/conformación de secuencia dentro de una proteína que se une a los motivos del ADN. Los dominios de proteínas que pueden unirse específicamente a una secuencia de ácido nucleico incluyen, por ejemplo, repeticiones de dedos de zinc, el motivo hélice-giro-hélice (HTH) de los homeodominios, y el motivo cinta-hélice-hélice (RHH). La unión específica se refiere a la unión específica a una secuencia y es específica, cuando un dominio de unión al ADN estadísticamente solamente se une a una secuencia particular y no se une, o no se une esencialmente, a una secuencia no relacionada. El experto en la técnica conoce bien las secuencias que codifican los dominios de unión al ADN (Rohs y otros (2010). Annu. Rev. Biochem. 79, 233-269; Maeder y otros (2009). Nat. Protocols 10, 1471-1501).
En una realización más preferida de la molécula de ácido nucleico de la invención, el dominio de unión al ADN es un motivo efector TAL de una proteína efectora TAL.
Esta realización se refiere a una molécula de ácido nucleico que codifica, además, una nucleasa TAL. El término "nucleasa TAL", como se usa en la presente descripción, es bien conocido en la técnica y se refiere a una proteína de fusión que comprende un dominio de unión al ADN, en donde el dominio de unión al ADN comprende o consiste en motivos efectores TAL de una proteína efectora TAL y el dominio de escisión no específico de una nucleasa de restricción. La proteína de fusión de la invención que, además, se emplea en el método de la invención más abajo retiene, o retiene esencialmente, la actividad enzimática de la endonucleasa de la invención. De acuerdo con la presente invención, dicha actividad endonucleasa (además, denominada función) se retiene esencialmente si al menos se retiene el 60 % de la actividad biológica de la actividad endonucleasa. Preferentemente, se retiene al menos el 75 % o al menos el 80 % de la actividad endonucleasa. Más preferido es que se retiene al menos 90 % tal como al menos 95 %, incluso más preferido al menos 98 % tal como al menos 99 % de la actividad biológica de la endonucleasa. Lo más preferido es que la actividad biológica se retenga completamente, es decir, hasta el 100 %. Además, de acuerdo con la invención, se contemplan proteínas de fusión que tienen una actividad biológica aumentada en comparación con la endonucleasa cuando no está fusionada a un dominio de unión a ADN, es decir, más del 100 % de la actividad. Los métodos para evaluar la actividad biológica de las endonucleasas (de restricción) se conocen bien por el experto en la técnica e incluyen, sin limitación, la incubación de una endonucleasa con ADN recombinante y el análisis de los productos de la reacción mediante electroforesis en gel (Bloch KD.; Curr Protoc Mol Biol 2001; Capítulo 3:Unidad 3.2).
El término "proteína efectora TAL", como se usa en la presente descripción, se refiere a proteínas que pertenecen a la familia de proteínas TAL (similar a activador de la transcripción). Estas proteínas se expresan por los patógenos bacterianos de las plantas del género Xanthomonas. Los miembros de la gran familia de efectores TAL son factores clave de la virulencia de Xanthomonas y reprograman las células huésped mediante la imitación de los factores de transcripción eucarióticos. La patogenicidad de muchas bacterias depende de la inyección de proteínas efectoras a través de la secreción de tipo III en células eucarióticas para manipular los procesos celulares. Las proteínas efectoras TAL de Xanthomonas patogénicos de plantas son factores de virulencia importantes que actúan como activadores transcripcionales en el núcleo de la célula vegetal. PthXo1, una proteína efectora TAL de unas Xanthomonas patógena de arroz, activa la expresión del gen del arroz Os8N3, que permite que Xanthomonas colonice las plantas de arroz. Las proteínas efectoras TAL se caracterizan por un dominio central de repeticiones en tándem, es decir, un dominio de unión al ADN, así como también señales de localización nuclear (NLS) y un dominio de activación transcripcional ácido. Los miembros de esta familia de efectores están altamente conservados y difieren principalmente en la secuencia de aminoácidos de sus repeticiones y en el número de repeticiones. El número y el orden de las repeticiones en una proteína efectora TAL determinan su actividad específica. Estas repeticiones son referidas en la presente descripción como "motivos efectores TAL". Un miembro ilustrativo de esta familia de efectores, AvrBs3 de Xanthomonas campestris pv. vesicatoria, contiene 17,5 repeticiones e induce la expresión de los genes UPA (regulado positivamente por AvrBs3), que incluye el gen de resistencia Bs3 en plantas de pimiento (Kay, y otros 2005 Mol Plant Microbe Interact 18(8): 838-48; Kay, S. y U. Bonas 2009 Curr Opin Microbiol 12(1): 37-43). Las repeticiones de AvrBs3 son esenciales para la unión al ADN de AvrBs3 y representan un tipo distinto de dominio de unión al ADN. El mecanismo de reconocimiento del ADN en una secuencia específica se dilucidó mediante estudios recientes de las proteínas AvrBs3, Hax2, Hax3 y Hax4 que revelaron el código de reconocimiento del ADN de los efectores TAL (Boch, J., y otros 2009 Science 326: 1509-12).
Los motivos o repeticiones efectores Tal son motivos de secuencia de proteína de 32 a 34 aminoácidos. Las secuencias de aminoácidos de las repeticiones son conservadas, excepto para dos residuos adyacentes altamente variables (en las posiciones 12 y 13) que determinan la especificidad hacia las bases del ADN A, G, C o T. En otras palabras, la unión al ADN se realiza mediante el contacto de un nucleótido de la doble hélice del ADN con los residuos variables en la posición 12 y 13 dentro del motivo efector TAL de una proteína efectora TAL particular (Boch, J., y otros 2009 Science 326: 1509­ 12). Por lo tanto, se encontró una correspondencia uno a uno entre las repeticiones secuenciales en las proteínas efectoras TAL y los nucleótidos secuenciales en el ADN diana. Cada motivo efector TAL reconoce principalmente un solo nucleótido dentro del sustrato de ADN. Por ejemplo, la combinación de histidina en la posición 12 y ácido aspártico en la posición 13 se une específicamente a la citosina; la combinación de asparagina en ambas, la posición 12 y en la posición 13 se une específicamente a la guanina; la combinación de asparagina en la posición 12 e isoleucina en la posición 13 se une específicamente a la adenina y la combinación de asparagina en la posición 12 y la glicina en la posición 13 se une específicamente a la timina. La unión a secuencias de a Dn más largas se logra mediante la unión en tándem de varios de estos motivos efectores TAL para formar un "dominio de unión al ADN de una proteína efectora TAL". Por lo tanto, un dominio de unión al ADN de una proteína efectora TAL se refiere a los dominios de unión al ADN que se encuentran en las proteínas efectoras TAL de origen natural, así como también a los dominios de unión al ADN diseñados para unirse a una secuencia de nucleótidos diana específica como se describió en los ejemplos más abajo. El uso de tales dominios de unión al ADN de las proteínas efectoras TAL para la generación de las proteínas de fusión- motivo efector TAL/ nucleasaque reconocen y escinden una secuencia diana específica depende de la generación adecuada de dominios de unión al ADN de las proteínas efectoras TAL que pueden reconocer específicamente dicha diana particular. Los métodos para la generación de dominios de unión al ADN de las proteínas efectoras TAL se conocen bien en la técnica (Zhang y otros (2011). Nat Biotechol. 29, 149-153; Cermaky otros (2011). Nucleic Acis Res. April 14, identificador de PubMed 21493687).
Preferentemente, el dominio de unión al ADN se deriva de los motivos efectores TAL que se encuentran en las proteínas efectoras TAL de origen natural, tales como por ejemplo las proteínas efectoras TAL seleccionadas del grupo que consiste en AvrBs3, Hax2, Hax3 o Hax4 (Bonas y otros 1989. Mol Gen Genet 218(1): 127-36; Kay y otros 2005 Mol Plant Microbe Interact 18(8): 838-48).
Se contemplan, de acuerdo con la presente invención, proteínas de fusión que se proporcionan como un dominio de unión al ADN de una proteína efectora TAL acoplada con un único dominio nucleasa. Estas proteínas monoméricas pueden combinarse para actuar como un dímero funcional para desarrollar actividad nucleasa a través de la cooperación de dos dominios nucleasa, cada uno de los cuales es parte de una proteína de fusión.
Preferentemente, la nucleasa TAL de acuerdo con la presente invención comprende más de uno, es decir, varios motivos efectores TAL, tal como al menos 12 motivos efectores TAL, tal como, por ejemplo, al menos 14 o al menos 16 motivos efectores TAL. Con mayor preferencia, la nucleasa TAL comprende al menos 18 motivos efectores TAL. En otras palabras, el dominio de unión al ADN de una proteína efectora TAL dentro de dicha proteína de fusión comprende al menos 18 motivos efectores TAL. En el caso de proteínas de fusión que consisten en dímeros, como se describió anteriormente, esto significa que cada monómero de proteína de fusión comprende al menos nueve motivos efectores TAL. Los métodos para evaluar la especificidad de unión al ADN de una proteína de fusión de acuerdo con la presente invención son conocidos por el experto en la técnica e incluyen, sin limitación, los ensayos de genes reporteros de la transcripción y los ensayos de cambio de movilidad electroforética (EMSA).
Preferentemente, el sitio de unión de la proteína de fusión es de hasta 500 nucleótidos, tal como hasta 250 nucleótidos, hasta 100 nucleótidos, hasta 50 nucleótidos, hasta 25 nucleótidos, hasta 10 nucleótidos tal como hasta 5 nucleótidos en el extremo 5' (es decir, 5') o en el extremo 3' (es decir 3') del nucleótidos(s) que es/son modificados de acuerdo con el método de la presente invención como se detalla más abajo.
En otra realización, la invención se refiere a un vector que codifica la molécula de ácido nucleico de la invención.
El término "vector" de acuerdo con la invención significa, preferentemente, un plásmido, cósmido, virus, bacteriófago u otro vector usado, por ejemplo, convencionalmente en ingeniería genética, que es portador de la molécula de ácido nucleico de la invención que codifica el péptido o la proteína de fusión de la invención. En consecuencia, la molécula de ácido nucleico de la invención puede insertarse en diversos vectores disponibles comercialmente. Los ejemplos no limitantes incluyen, vectores de plásmidos procarióticos, tales como los de las series pUC, pBluescript (Stratagene), las series pET de vectores de expresión (Novagen) o pCRTOPO (Invitrogen) y vectores compatibles con la expresión en células de mamíferos como pREP (Invitrogen), pcDNA3 (Invitrogen), pCEP4 (Invitrogen), pMC1neo (Stratagene), pXT1 (Stratagene), pSG5 (Stratagene), EBO-pSV2neo, pBPV-1, pdBPVMMTneo, pRSVgpt, pRSVneo, pSV2-dhfr, plZD35, pLXIN, pSIR (Clontech), pIRES-EGFP (Clontech), pEAK-10 (Edge Biosystems) pTriEx-Hygro (Novagen) y pCINeo (Promega). Los ejemplos para los vectores de plásmidos adecuados para Pichia pastoris comprenden, por ejemplo, los plásmidos pAO815, pPIC9K y pPIC3.5K (todos de Invitrogen).
La molécula de ácido nucleico de la presente invención mencionada anteriormente puede insertarse, además, en vectores de manera que se genere una fusión traduccional (adicional) con otra molécula de ácido nucleico. Para este objetivo, puede aplicarse el PCR por extensión de superposición (por ejemplo Wurch, T., Lestienne, F., y Pauwels, P.J., A modified overlap extension PCR method to create chimeric genes in the absence of restriction enzymes, Biotechn. Techn. 12, 9, Sept. 1998, 653-657). Los productos que surgen de este proceso se denominan proteínas de fusión y se describirán adicionalmente más abajo. Las otras moléculas de ácido nucleico pueden codificar una proteína que puede, por ejemplo, aumentar la solubilidad y/o facilitar la purificación de la proteína codificada por la molécula de ácido nucleico de la invención. Los ejemplos no limitantes incluyen pET32, pET41, pET43. Los vectores pueden contener, además, un ácido nucleico expresable adicional que codifica para una o más chaperonas con el propósito de facilitar el plegamiento correcto de la proteína. Los huéspedes para la expresión bacteriana adecuados comprenden, por ejemplo, las cepas derivadas a partir de BL21 (tales como BL21 (DE3), BL21 (DE3)PlysS, BL21 (DE3)RIL, BL21 (DE3)PRARE) o Rosetta®.
Los plásmidos particularmente preferidos que pueden usarse para introducir el ácido nucleico que codifica el polipéptido de la invención, que tiene la actividad de una endonucleasa, en la célula huésped son: pUC18/19 (Roche Biochemicals), pBluescript II (Alting-Mees, y otros (1992). Meth. Enzymol., 216, 483-495), pKK-177-3H (Roche Biochemicals), pBTac2 (Roche Biochemicals), pKK223-3 (Amersham Pharmacia Biotech), pKK-233-3 (Stratagene) y pET (Novagen).
Para las técnicas de modificación de vectores, ver Sambrooky Russel, 2001. Generalmente, los vectores pueden contener uno o más orígenes de replicación (ori) y sistemas de herencia para la clonación o expresión, uno o más marcadores para la selección en el huésped, por ejemplo, de resistencia a antibióticos, y uno o más casetes de expresión. Los orígenes de replicación adecuados incluyen, por ejemplo, los orígenes de replicación Col E1, el SV40 viral y el M13.
Las secuencias codificantes insertadas en el vector pueden, por ejemplo, sintetizarse mediante métodos estándar, o aislarse a partir de fuentes naturales. La ligación de las secuencias codificantes a elementos reguladores de la transcripción y/o a otras secuencias codificantes de aminoácidos puede realizarse mediante el uso de métodos establecidos. Los elementos reguladores de la transcripción (partes de un casete de expresión) que aseguran la expresión en células procarióticas o eucarióticas se conocen bien por los expertos en la técnica. Estos elementos comprenden secuencias reguladoras que garantizan el inicio de la transcripción (por ejemplo, codón de inicio de la traducción, secuencias de terminación de la transcripción, promotores, potenciadores y/o aisladores), sitios internos de entrada ribosomal (IRES) y, opcionalmente, señales poli-A que garantizan la terminación de la transcripción y la estabilidad del transcrito. Los elementos reguladores adicionales pueden incluir potenciadores transcripcionales así como también traduccionales, y/o regiones promotoras heterólogas o asociadas naturalmente. Los elementos reguladores pueden ser elementos reguladores heterólogos. Preferentemente, la molécula de ácido nucleico de la invención se une operativamente a tales secuencias de control de la expresión que permiten la expresión en células procarióticas o eucarióticas. El vector puede comprender, además, secuencias de nucleótidos que codifican señales de secreción como elementos reguladores adicionales. Tales secuencias se conocen bien por el experto en la técnica. Además, en dependencia del sistema de expresión usado, las secuencias líder, capaces de dirigir el polipéptido expresado hacia un compartimento celular, pueden añadirse a la secuencia codificante de la molécula de ácido nucleico de la invención. Tales secuencias líder se conocen bien en la técnica. Los vectores diseñados específicamente permiten la transferencia de ADN entre diferentes huéspedes, tales como entre las células bacterianas-fúngicas o células bacterianas-animales.
La cotransfección con un marcador de selección, tal como kanamicina o genes de resistencia a la ampicilina para el cultivo en E. coli y otras bacterias, permite la identificación y el aislamiento de las células transfectadas. Los marcadores de selección para el cultivo de células de mamíferos son los genes de resistencia dhfr, gpt, neomicina, e higromicina. Además, el ácido nucleico transfectado puede amplificarse, para expresar grandes cantidades del polipéptido codificado. El marcador DHFR (dihidrofolato reductasa) es útil para desarrollar líneas celulares que portan varios cientos o incluso varios miles de copias del gen de interés. Otro marcador de selección útil es la enzima glutamina sintasa (GS) (Fisher y otros, Infect Immun. 1991 Oct;59(10):3562-5; Bebbington y otros, Biotechnology (N Y). 1992 Feb;10(2):169-75).
Mediante el uso de tales marcadores, las células se cultivan en medio selectivo y se seleccionan las células con la mayor resistencia.
En otra realización, la invención se refiere a una célula huésped que comprende, por ejemplo, como un resultado de la transformación, transducción, microinyección o transfección, la molécula de ácido nucleico o el vector de la invención.
Puede concebirse una diversidad de sistemas de expresión del huésped para expresar la secuencia codificante de la endonucleasa en una célula huésped mediante el uso de un vector adecuado.
La "célula huésped" de acuerdo con la invención puede producirse mediante la introducción de la molécula de ácido nucleico o el vector(es) de la invención en la célula huésped que, en su presencia, preferentemente, media la expresión de la molécula de ácido nucleico de la invención que codifica la endonucleasa de la invención. El huésped a partir del cual se deriva la célula huésped puede ser cualquier célula procariótica o eucariótica.
Una célula huésped eucariótica adecuada puede ser una célula de vertebrado, una célula de anfibio, una célula de pez, una célula de insecto, una célula de hongo/levadura, una célula de nemátodo o una célula vegetal. La célula de insecto puede ser una célula de Spodoptera frugiperda, una célula de Drosophila S2 o una célula de Spodoptera Sf9, la célula de hongo/levadura puede ser una célula de Saccharomyces cerevisiae, célula de Pichia pastoris o una célula de Aspergillus. Se prefiere que la célula de vertebrado sea una célula de mamífero tal como una célula humana, CHO, COS, 293 o células de melanoma de Bowes. La célula vegetal se selecciona, preferentemente, independientemente de una célula de Anacardium, Anona, Arachis, Artocarpus, Asparagus, Atropa, Avena, Brassica, Carica, Citrus, Citrullus, Capsicum, Carthamus, Cocos, Coffea, Cucumis, Cucurbita, Daucus, Elaeis, Fragaria, Glycine, Gossypium, Helianthus, Heterocallis, Hordeum, Hyoseyamus, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Malus, Manihot, Majorana, Medicago, Nicotiana, Olea, Oryza, Panieum, Pannesetum, Passiflora, Persea, Phaseolus, Pistachia, Pisum, Pyrus, Prunus, Psidium, Raphanus, Ricinus, Secale, Senecio, Sinapis, Solanum, Sorghum, Theobromus, Trigonella, Triticum, Vicia, Vitis, Vignay Zea. La célula puede ser una parte de una línea celular. La célula vegetal puede, por ejemplo, derivarse a partir de la raíz, la hoja, la corteza, la aguja, el tronco o el tallo.
Los procariotas adecuados (bacterias) útiles como huésped para la invención son aquellas que se usan generalmente para la clonación y/o la expresión, como E. coli (por ejemplo, las cepas de E coli BL21, HB101, DH5a, XL1 Blue, Y1090 y JM101), Salmonella typhimurium, Serratia marcescens, Burkholderia glumae, Pseudomonas putida, Pseudomonas fluorescens, Pseudomonas stutzeri, Streptomyces lividans, Lactococcus lactis, Mycobacterium smegmatis, Streptomyces o Bacillus subtilis. Los medios y condiciones de cultivo apropiados para las células huésped descritas anteriormente son conocidos en la técnica.
Los ejemplos preferidos para que la célula huésped sea modificada mediante ingeniería genética con la molécula de ácido nucleico o el vector(es) de la invención es una célula de levadura, E. coli y/o una especie del género Bacillus (por ejemplo, B. subtilis). La célula huésped más preferida es Bacillus spec..
En una realización adicional, la invención se refiere a un método para producir una proteína o fusión que tiene la actividad de una endonucleasa como se definió anteriormente en la presente descripción que comprende las etapas: (a) cultivar la célula huésped de la invención y (b) aislar la proteína que se produce o la proteína de fusión que tiene la actividad de dicha endonucleasa.
Las condiciones adecuadas para el cultivo de un huésped procariótico o eucariótico se conocen bien por el experto en la técnica. Las condiciones adecuadas para cultivar E. coli DH18BAkat E (Invitrogen), Pichia pastoris o Aspergillus niger son, por ejemplo, proporcionadas en los ejemplos de la invención. En general, las condiciones adecuadas para el cultivo de bacterias son las que facilitan el crecimiento de estas bajo aireación, en medio Luria Bertani (LB). Para aumentar el rendimiento y la solubilidad del producto de expresión, el medio puede tamponarse o complementarse con aditivos adecuados conocidos porque mejoran o facilitan ambos. La E. coli puede cultivarse desde 4 a aproximadamente 37 °C, la temperatura exacta o la secuencia de temperaturas depende de la molécula que se va a expresar en exceso. En general, Aspergillus sp. puede crecerse sobre agar Sabouraud dextrosa, o agar de patata dextrosa a aproximadamente de 10 °C a aproximadamente 40 °C, y preferentemente, a aproximadamente 25 °C. Se conocen las condiciones adecuadas para los cultivos de levadura, por ejemplo de Guthrie y Fink, "Guide to Yeast Genetics and Molecular Cell Biology" (2002); Academic Pr Inc.. El experto en la técnica es consciente, además, de todas estas condiciones y puede, adaptar estas condiciones aún más a las necesidades de una especie huésped particular y a los requisitos del polipéptido expresado. En el caso de que un promotor inducible controle el ácido nucleico de la invención en el vector presente en la célula huésped, la expresión del polipéptido puede inducirse mediante la adición de un agente inductor apropiado. Los protocolos y estrategias de expresión adecuados son conocidos por el experto en la técnica.
En dependencia del tipo de célula y de sus requisitos específicos, el cultivo de células de mamíferos puede realizarse, por ejemplo, en medio RpMI o DMEM que contiene FCS 10 % (v/v), L-glutamina 2mM y penicilina/estreptomicina 100 U/mL. Las células pueden mantenerse a 37 °C en una atmósfera saturada de agua, al 5 % de CO2.
Los protocolos de expresión adecuados para células eucarióticas se conocen bien por el experto en la técnica y pueden retomarse, por ejemplo, de Sambrook, 2001.
Los métodos de aislamiento del polipéptido producido se conocen bien en la técnica y comprenden, sin limitación, las etapas de los métodos tales como cromatografía de intercambio iónico, cromatografía de filtración en gel (cromatografía de exclusión por tamaño), cromatografía de afinidad, cromatografía líquida de alta presión (HPLC), HPLC de fase inversa, electroforesis en gel de disco o inmunoprecipitación, ver, por ejemplo, Sambrook, 2001.
La etapa de aislamiento de proteínas es, preferentemente, una etapa de la purificación de proteínas. La purificación de proteínas, de acuerdo con la invención, especifica un proceso o una serie de procesos destinados a aislar más aún el polipéptido de la invención a partir de una mezcla compleja, preferentemente, para la homogeneidad. Las etapas de purificación, por ejemplo, explotan las diferencias en el tamaño de las proteínas, las propiedades fisicoquímicas y la afinidad de unión. Por ejemplo, las proteínas pueden purificarse de acuerdo con sus puntos isoeléctricos mediante su paso a través de un gel con un gradiente de pH o una columna de intercambio iónico. Además, las proteínas pueden separarse de acuerdo con su tamaño o peso molecular mediante cromatografía de exclusión por tamaño, o mediante el análisis de SDS-PAGE (electroforesis en gel de dodecil sulfato de sodio y poliacrilamida). En la técnica, con frecuencia las proteínas se purifican mediante el uso de 2D-PAGE y después se analizan más aún mediante la huella peptídica para establecer la identidad de la proteína. Esto es muy útil para fines científicos y los límites de detección para las proteínas son muy bajos, y para su análisis son suficientes las cantidades en nanogramos de proteína. Además, las proteínas pueden separarse por su polaridad/hidrofobicidad mediante cromatografía líquida de alto rendimiento o cromatografía de fase inversa. Por lo tanto, los métodos para la purificación de proteínas se conocen bien por el experto en la técnica.
Además, en una realización la invención se refiere a una proteína o proteína de fusión que tiene la actividad de una endonucleasa codificada por la molécula de ácido nucleico o vector de la invención.
Las definiciones para las proteínas o proteínas de fusión que tienen la actividad de una endonucleasa codificada por la molécula de ácido nucleico o el vector de la invención, proporcionadas en las realizaciones anteriores, pertenecientes a la molécula de ácido nucleico o vector de la invención se aplican explícitamente, además, a esta realización.
Como una consecuencia de su actividad endonucleasa, otra realización de la invención se refiere al uso de la proteína o proteína de fusión de la invención para escindir una molécula de ácido nucleico, por ejemplo, en uno de los métodos de la invención descritos más abajo.
Adicionalmente, la presente invención se refiere, además, a un kit que comprende la molécula de ácido nucleico, la proteína y/o la proteína de fusión de la invención. Los diversos componentes del kit pueden empaquetarse en uno o más contenedores, tales como uno o más frascos. Los frascos pueden, además de los componentes, comprender conservantes o tampones para almacenamiento. Además, el kit puede contener las instrucciones para usar.
En otra realización, la invención se refiere a un método in vitro para modificar una secuencia diana en el genoma de una célula eucariótica, el método comprende la etapa: (a) introducir en dicha célula la molécula de ácido nucleico, el vector o la proteína o proteína de fusión de la invención.
El término "modificar" como se usa de acuerdo con la presente invención se refiere a manipulaciones genómicas aleatorias y en sitios específicos que resultan en cambios en la secuencia de nucleótidos del genoma del huésped eucariótico. Cuando se introduce la proteína de fusión de la invención, se logra la modificación en un sitio específico de dicha "secuencia diana" en el genoma a través del dominio de unión al ADN. Cuando solamente se introduce la proteína de la invención, la "secuencia diana" no es una secuencia específica, porque la endonucleasa novedosa no es específica de un sitio. Por lo tanto, la proteína de la invención puede usarse para introducir mutaciones aleatorias en un genoma, es decir, la "secuencia diana" se produce múltiples veces en el genoma y no depende de un motivo específico de una secuencia. El material genético que comprende estos cambios en su secuencia de nucleótidos es referido, además, en la presente descripción como la "secuencia diana modificada" cuando la modificación es en un sitio específico como, por ejemplo, en el caso de usar la proteína de fusión de la invención. El término "modificación" incluye, pero no se limita a, sustitución, inserción y deleción de uno o más nucleótidos dentro de la secuencia diana. En el proceso de recombinación homóloga, el producto final puede reflejar una deleción de secuencias. Como comprenderá el experto en la técnica, una recombinación homóloga, por otra parte, siempre incluye, además, la incorporación de material genético de la secuencia de ADN donante, que en esta realización, sin embargo, conduce a una deleción total. Se comprenderá por el experto en la técnica que, mediante la simple introducción de roturas de doble hebra en el genoma de una célula, pueden introducirse modificaciones que son el resultado de una recombinación homóloga (en la presencia y ausencia de secuencias donantes exógenas) o una reparación endógena del ADN, mecanismos tales como, por ejemplo, la reparación de ADN mediante la unión de extremos no homólogos (NHEJ), que es propensa a la introducción de pequeñas deleciones en el sitio de la rotura de doble hebra en el curso de la ligadura de los extremos rotos.
El término "sustitución", como se usa en la presente descripción, se refiere al reemplazo de nucleótidos con otros nucleótidos. El término incluye, por ejemplo, el reemplazo de nucleótidos individuales que resultan en mutaciones puntuales. Dichas mutaciones puntuales pueden conducir a un intercambio de aminoácidos en el producto proteico resultante, pero además, pueden no reflejarse a nivel de los aminoácidos. El término "sustitución" contempla, además, las mutaciones que resultan en el reemplazo de múltiples nucleótidos, tales como, por ejemplo, partes de genes, tales como partes de exones o intrones, así como también el reemplazo de genes completos.
El término "inserción" de acuerdo con la presente invención se refiere a la incorporación de uno o más nucleótidos en una molécula de ácido nucleico. El término "inserción" contempla, además, la inserción de partes de genes, tales como partes de exones o intrones, así como también la inserción de genes completos. Cuando el número de nucleótidos insertados no es divisible por tres, la inserción puede resultar en una mutación con desplazamiento del marco de lectura dentro de una secuencia codificante de un gen. Tales mutaciones con desplazamiento del marco de lectura alterarán los aminoácidos codificados por un gen después de la mutación. En algunos casos, tal mutación causará que la traducción activa del gen encuentre un codón de parada prematuro, lo que resulta en una terminación de la traducción y en la producción de una proteína truncada. Cuando el número de nucleótidos insertados es, en cambio, divisible por tres, la inserción resultante es una "inserción en el marco de lectura". En este caso, el marco de lectura permanece intacto después de la inserción y la traducción probablemente se completará si los nucleótidos insertados no codifican para un codón de parada. Sin embargo, debido a los nucleótidos insertados, la proteína resultante contendrá, en dependencia del tamaño de la inserción, uno o varios aminoácidos nuevos que pueden afectar la función de la proteína.
El término "deleción" como se usa de acuerdo con la presente invención se refiere a la pérdida de nucleótidos o parte de genes, tales como exones o intrones, así como también a genes completos. Como se definió con respecto al término "inserción", la deleción de una cantidad de nucleótidos que no es divisible de manera equitativa entre tres, conducirá a una mutación con desplazamiento del marco de lectura que causa que todos los codones que se producen después de la deleción se lean incorrectamente durante la traducción, lo que produce, potencialmente, una proteína gravemente alterada y, muy probablemente, no funcional. Si una deleción no resulta en una mutación con desplazamiento del marco de lectura, es decir, debido a que el número de nucleótidos delecionados puede dividirse en tres, la proteína resultante no obstante se ve alterada, ya que carecerá, en dependencia del tamaño de la deleción, de varios aminoácidos que pueden afectar o efectuar la función de la proteína.
Las modificaciones definidas anteriormente no se limitan a las regiones codificantes en el genoma, sino que pueden ocurrir, además, en regiones no codificantes del genoma diana, por ejemplo, en regiones reguladoras tales como elementos promotores, o potenciadores, o en intrones.
Los ejemplos de modificaciones del genoma diana incluyen, sin ser limitantes, la introducción de mutaciones en un gen de tipo silvestre para analizar su efecto sobre la función del gen; el reemplazo de un gen completo con un gen mutado o, alternativamente, si la secuencia diana comprende mutaciones, la alteración de estas mutaciones para identificar que mutación es la causante de un efecto particular; la eliminación de genes completos o proteínas o la eliminación de elementos reguladores de genes o proteínas, así como también la introducción de asociados de fusión, tales como por ejemplo etiquetas de purificación tales como la etiqueta his o la etiqueta tap, etcétera. En el último caso, el término "adición" puede usarse, además, en lugar de "inserción" para describir la adición preferente de una etiqueta a un extremo de un polipéptido más que dentro de la secuencia de un polipéptido
El término "célula eucariótica", como se usa en la presente descripción, se refiere a cualquier célula de un organismo eucariótico unicelular o multicelular, que incluye las células de animales como los vertebrados y de los hongos y plantas. Preferentemente, pero sin limitación, la célula es una célula de mamífero. El término "célula de mamífero", como se usa en la presente descripción, se conoce bien en la técnica y se refiere a cualquier célula que pertenece a un animal que se agrupa en la clase de mamíferos. El término "célula", como se usa en relación con la presente invención, puede referirse a una célula única y/o aislada o a una célula que es parte de una entidad multicelular, tal como un tejido, un organismo o a una célula de otro cultivo. En otras palabras, el método puede realizarse in vivo, ex vivo o in vitro. En dependencia del objetivo particular para lograrse a través de la modificación del genoma de una célula de mamífero, pueden usarse células de diferentes subclases de mamíferos, tales como prototerios o terios. Por ejemplo, dentro de la subclase de terios, preferentemente, células de animales de la subclase euteria, con mayor preferencia del orden primates, artiodactyla, perissodactyla, rodentia y lagomorpha se usan en el método de la invención como se detalla más abajo. Además, dentro de una especie, puede elegirse una célula para usar en el método de la invención basado en el tipo de tejido y/o la capacidad para diferenciarse igualmente en dependencia del objetivo para lograrse al modificar el genoma. Tres categorías básicas de células conforman el cuerpo de los mamíferos: células germinales, células somáticas y células madre. Una célula germinal es una célula que da lugar a gametos y, por lo tanto, es continua a través de las generaciones. Las células madre pueden dividirse y diferenciarse en diversos tipos de células especializadas, así como también autorrenovarse para producir más células madre. En los mamíferos hay dos tipos principales de células madre: células madre embrionarias y células madre adultas. Las células somáticas incluyen todas las células que no son gametos, gametocitos o células madre indiferenciadas. Las células de un mamífero pueden agruparse, además, por su capacidad para diferenciarse. Una célula totipotente (conocida además como omnipotente) es una célula que es capaz de diferenciarse en todos los tipos de células de un organismo adulto, que incluyen el tejido placentario, tal como un cigoto (ovocito fecundado) y blastómeros posteriores, mientras que las células pluripotentes, tales como células madre embrionarias, no pueden contribuir al tejido extraembrionario tal como la placenta, pero tienen el potencial de diferenciarse en cualquiera de las tres capas germinales endodermo, mesodermo y ectodermo. Las células progenitoras multipotentes tienen el potencial de dar lugar a células de múltiples, pero número limitado de linajes celulares. Además, hay células oligopotentes que pueden desarrollarse solamente en unos pocos tipos de células y células unipotentes (a veces denominadas células precursoras) que pueden convertirse solamente en un tipo de célula. Hay cuatro tipos básicos de tejidos: tejido muscular, tejido nervioso, tejido conectivo y tejido epitelial del que pueden derivarse una célula que va a usarse en el método de la invención, tal como por ejemplo, células madre hematopoyéticas o células madre neuronales. En la medida en que se prevean células humanas para usar en el método de la invención, se prefiere que tal célula humana no se obtenga a partir de un embrión humano, en particular no a través de métodos que impliquen la destrucción de un embrión humano. Por otra parte, las células madre embrionarias humanas están a disposición de los expertos en la técnica, tal como las que se toman a partir de las líneas de células madre embrionarias existentes, comercialmente disponibles. En consecuencia, en la presente invención puede trabajarse con células madre embrionarias humanas sin necesidad de usar o destruir un embrión humano. Alternativamente, o en lugar de células madre embrionarias humanas, pueden usarse células pluripotentes que se asemejan a las células madre embrionarias tales como las células madre pluripotentes inducidas (iPS), cuya generación se establece como estado de la técnica (Hargus G y otros, Proc Natl Acad Sci U S A 107:15921-15926;
Jaenisch R. y Young R., 2008, Cell 132:567-582; Saha K, y Jaenisch R., 2009, Cell Stem Cell 5:584-595).
El término "moléculas de ácido nucleico que codifican dicha proteína o proteína de fusión en forma expresable" se refiere a una molécula de ácido nucleico que, al expresarse en una célula o un sistema libre de células, resulta en una proteína funcional o proteína de fusión de la invención. Preferentemente, pero sin limitación, dicho ácido nucleico es ARNm. Alternativamente, pueden usarse el ADN que tiene señales de transcripción apropiadas para permitir la expresión, o el ADNc.
La introducción de la proteína, proteína de fusión, o de la molécula de ácido nucleico que codifica dicha proteína, y la proteína de fusión en forma expresable dentro de una célula, pueden lograrse mediante los métodos conocidos en la técnica, y depende de la naturaleza de dichas proteínas o moléculas de ácido nucleico. Por ejemplo, y en el caso de la introducción de moléculas de ácido nucleico, dicha introducción puede lograrse mediante métodos basados en químicos (fosfato de calcio, liposomas, DEAE-dextrán, polietilenimina, nucleofección), métodos no químicos (electroporación, sonoporación, transfección óptica, electrotransferencia de genes, administración hidrodinámica), métodos basados en partículas (pistola de genes, magnetofección, impalefección) y métodos virales. Preferentemente, las moléculas de ácido nucleico son para introducirse en el núcleo mediante métodos tales como, por ejemplo, microinyección o nucleofección. Los métodos para realizar la microinyección se conocen bien en la técnica y se describen, por ejemplo, en Nagy y otros (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003. Manipulating the Mouse Embryo. Cold Spring Harbour, New York: Cold Spring Harbour Laboratory Press) así como también en los ejemplos de la presente descripción más abajo. El experto en la técnica entiende que, en dependencia del método de introducción, puede ser ventajoso adaptar las moléculas de ADN. Por ejemplo, una molécula de ADN lineal puede ser más eficiente en los eventos de recombinación homóloga cuando se usa la electroporación como método para introducir dicha molécula de ADN en, por ejemplo, una célula de mamífero, mientras que una molécula de ADN circular puede ser más ventajosa cuando se inyectan las células.
Todas las definiciones y realizaciones preferidas definidas anteriormente con respecto a la molécula de ácido nucleico, proteína o proteína de fusión de la invención se aplican, además, mutatis mutandis en el contexto del método de la invención.
De acuerdo con la presente invención, el término "secuencia diana en el genoma" se refiere a la ubicación genómica que se va a modificar por el método de la invención. La "secuencia diana en el genoma" comprende, pero no se restringe a los nucleótidos sujetos a la modificación particular. Además, y preferentemente con respecto a la proteína de fusión de la invención, el término "secuencia diana en el genoma" comprende, además, las regiones para la unión de secuencias homólogas de una segunda molécula de ácido nucleico. En otras palabras, el término "secuencia diana en el genoma" comprende, además, la secuencia que flanquea/rodea el nucleótido(s) pertinente que va a modificarse. En algunos casos, el término "secuencia diana" puede referirse, además, al gen completo que va a modificarse.
La unión específica se definió anteriormente en la presente descripción y garantiza que solamente las roturas de doble hebra se introduzcan dentro de dicha secuencia diana.
En una realización más preferida del método de la invención, la modificación de dicha secuencia diana es mediante recombinación homóloga con una secuencia de ácido nucleico donante, que comprende además la etapa: (b) introducir una molécula de ácido nucleico en dicha célula, en donde dicha molécula de ácido nucleico comprende dicha secuencia de ácido nucleico donante, en donde dicha secuencia de ADN donante está flanqueada hacia el extremo 5' por un primer elemento flanqueante y hacia el extremo 3' por un segundo elemento flanqueante, en donde dicho primer y segundo elementos flanqueantes son diferentes y en donde cada uno de dichos primer y segundo elementos flanqueantes son homólogos a una secuencia continua de ADN a cada lado de la rotura de la doble hebra introducida en (a) del método de la invención dentro de dicha secuencia diana en el genoma de dicha célula eucariótica.
El término "recombinación homóloga", se usa de acuerdo con las definiciones proporcionadas en la técnica. Por lo tanto, se refiere a un mecanismo de recombinación genética en el que dos hebras de ADN que comprenden secuencias de nucleótidos similares intercambian material genético. Las células usan la recombinación homóloga, durante la meiosis, donde esta sirve para reorganizar el ADN para crear un conjunto totalmente único de cromosomas haploides, pero además, para la reparación del ADN dañado, en particular para la reparación de roturas de doble hebra. El mecanismo de recombinación homóloga se conoce bien por el experto en la técnica y se ha descrito, por ejemplo, por Paques y Haber ( Paques F, Haber JE.; Microbiol Mol Biol Rev 1999; 63:349-404). En el método de la presente invención, la recombinación homóloga de la secuencia donante se permite por la presencia de dicho primer y dicho segundo elemento flanqueante que se ubican hacia el extremo 5' (5') y hacia el extremo 3' (3'), respectivamente, de dicha secuencia de ADN donante cada uno de los cuales es homólogo a una secuencia de ADN continua dentro de dicha secuencia diana.
De acuerdo con la presente invención, el término "secuencia de ADN donante" se refiere a una secuencia de ADN que sirve como un molde en el proceso de recombinación homóloga y que porta la modificación que va a introducirse dentro la secuencia diana. Mediante el uso de esta secuencia de ADN donante como un molde, la información genética, que incluye las modificaciones, se copia en la secuencia diana dentro del genoma de la célula por medio de recombinación homóloga. En los ejemplos no limitantes, la secuencia de ácido nucleico donante puede ser esencialmente idéntica a la parte de la secuencia diana que va a reemplazarse, con la excepción de un nucleótido que difiere y resulta en la introducción de una mutación puntual después de la recombinación homóloga o esta puede consistir en un gen adicional previamente no presente en la secuencia diana. Es concebible que la naturaleza de la secuencia de ADN donante, es decir, su longitud, composición de bases, similitud con la secuencia diana, dependa de cómo se modificará la secuencia diana, así como también el objetivo particular que se logrará mediante la modificación de la secuencia diana. Los expertos en la técnica entenderán que dicha secuencia de ADN donante está flanqueada por secuencias que son homólogas a las secuencias dentro de la secuencia diana para permitir que tenga lugar una recombinación homóloga que conduce a la incorporación de la secuencia de ADN donante en el genoma de dicha célula. Además de ser homólogos a una secuencia continua de ADN dentro del ADN genómico, el primer y el segundo elementos flanqueantes son diferentes para permitir que tenga lugar una recombinación homóloga dirigida.
El término "homólogo a una secuencia continua de ADN a cada lado de la rotura de doble hebra introducida en (a) del método de la invención dentro de dicha secuencia diana", de acuerdo con la presente invención, se refiere a regiones que tienen suficiente identidad de secuencia para asegurar la unión específica a las secuencias diana que se encuentran hacia los extremos 5' y 3' de la ubicación de la rotura de doble hebra. El término "homólogo" como se usa en la presente descripción puede intercambiarse con el término "idéntico" como se describe en la presente descripción en otra parte con respecto a los niveles variables de identidad de secuencia. Los métodos para evaluar el nivel de identidad entre dos secuencias de ácido nucleico se conocen bien en la técnica y se describieron anteriormente en la presente descripción. Estos métodos involucran programas, además de proporcionar un alineamiento de secuencia por pares, informan, además, el nivel de identidad de la secuencia (generalmente en porcentaje de identidad) y la probabilidad de que ocurra el alineamiento por azar (valor de P) y pueden usarse, además, para predecir la aparición de la unión específica.
Preferentemente, dicho primer y segundo elementos flanqueantes son "homólogos a una secuencia de ADN continua dentro de dicha secuencia diana" (denominados en la técnica, además, "brazos de homología") tienen una identidad de secuencia con la parte correspondiente de la secuencia diana de al menos 95 %, más preferido al menos 97 %, más preferido al menos 98 %, más preferido al menos 99 %, incluso más preferido al menos 99,9 % y el más preferido 100 %. Las identidades de secuencia definidas anteriormente se definen solamente con respecto a aquellas partes de la secuencia diana que sirven como sitios de unión para los brazos de homología, es decir, dicho primer y dicho segundo elementos flanqueantes. Por lo tanto, la identidad de secuencia global entre la secuencia diana completa y las regiones homólogas de la molécula de ácido nucleico de la etapa (b) del método de modificación de una secuencia diana de la presente invención puede diferir de las identidades de secuencia definidas anteriormente, debido a la presencia de la parte de la secuencia diana que va a reemplazarse por la secuencia de ADN donante.
Los elementos flanqueantes homólogos a la secuencia diana comprendida en la molécula de ADN tienen una longitud de al menos 170 pb cada uno. Preferentemente, cada uno de los elementos tienen una longitud de al menos 250 nucleótidos, al menos 300 nucleótidos, al menos 400 nucleótidos, al menos 500 nucleótidos, tal como al menos 600 nucleótidos, al menos 750 pb de nucleótidos, con mayor preferencia al menos 1000 nucleótidos, tal como al menos 1500 nucleótidos, incluso con mayor preferencia al menos 2000 nucleótidos y con la máxima preferencia al menos 2500 nucleótidos. La longitud máxima de los elementos homólogos a la secuencia diana comprendida en la molécula de ácido nucleico depende del tipo de vector de clonación usado y puede tener una longitud de hasta 20000 nucleótidos en plásmidos de alto número de copias de E. coli que usan el origen de replicación col El (por ejemplo, pBluescript) o hasta una longitud de 300 000 nucleótidos cada uno en plásmidos que usan el origen del factor F (por ejemplo, en vectores BAC, tal como, por ejemplo, pTARBAC1).
Las moléculas de ADN que comprenden la secuencia de ADN donante y los elementos flanqueantes se modifican, necesariamente, si el sitio de unión a la nucleasa específica de un sitio (proteína de fusión) está contenido sin interrupciones dentro de uno de los elementos flanqueantes y, preferentemente, si el sitio de unión a la nucleasa específica de un sitio (proteína de fusión) se interrumpe por la secuencia donante, es decir, una parte en cada uno de los elementos flanqueantes, de manera que la proteína de fusión no introduzca una rotura de doble hebra en la secuencia del ADN donante como parte de una molécula de ADN. Cuando la proteína de fusión es una TAL o una nucleasa dedo de zinc, esto puede lograrse, por ejemplo, mediante una modificación ya sea en el motivo de unión o de escisión (ver Ejemplo 2, Figura 12).
Se apreciará por el experto en la técnica que dicha molécula de ADN para introducirse en la célula en el ítem (b) del método de la invención puede comprender toda una molécula de ácido nucleico (secuencia) que codifica dicha proteína de fusión en forma expresable y la molécula de ácido nucleico que comprende la secuencia de ácido nucleico donante y los elementos flanqueantes homólogos a la secuencia diana. Alternativamente, la molécula de ácido nucleico del ítem (b) puede ser una molécula de ácido nucleico distinta, para introducirse adicionalmente a las moléculas de ácido nucleico que codifican dicha proteína de fusión en forma expresable del ítem (a).
En una realización preferida del método de la invención se contempla, además, que dicha célula se analiza para la modificación exitosa de dicha secuencia diana en el genoma.
Los métodos para analizar la presencia o ausencia de una modificación se conocen bien en la técnica e incluyen, sin limitación, ensayos basados en la separación física de moléculas de ácido nucleico, ensayos de secuenciación, así como también ensayos de escisión y digestión, y análisis del ADN mediante la reacción en cadena de la polimerasa (PCR).
Los ejemplos de ensayos basados en la separación física de moléculas de ácido nucleico incluyen, sin limitación, MALDI-
TOF, electroforesis en gel de gradiente desnaturalizante y otros de tales métodos conocidos en la técnica, ver por ejemplo Petersen y otros, Hum. Mutat. 20 (2002) 253-259; Hsia y otros, Theor. Appl. Genet. 111 (2005) 218-225; Tost and Gut, Clin. Biochem. 35 (2005) 335-350; Palais y otros, Anal. Biochem. 346 (2005) 167-175.
Los ejemplos de ensayos de secuenciación comprenden, sin limitación, los métodos de análisis de secuencia mediante secuenciación directa, SSCP fluorescente en un secuenciador de ADN automatizado y pirosecuenciación. Estos procedimientos son comunes en la técnica, ver, por ejemplo, Adams y otros (Ed.), "Automated DNA Sequencing and Analysis", Academic Press, 1994; Alphey, "DNA Sequencing: From Experimental Methods to Bioinformatics", Springer Verlag Publishing, 1997; Ramon y otros, J. Transí. Med. 1 (2003) 9; Meng y otros., J. Clin. Endocrinol. Metab. 90 (2005) 3419-3422.
Los ejemplos de ensayos de escisión y digestión incluyen, sin limitación, ensayos de digestión de restricción, tales como ensayos de polimorfismo de longitud de fragmentos de restricción (ensayos de RFLP), ensayos de protección de RNasa, ensayos basados en métodos de escisión química y ensayos de escisión de desapareamientos mediante enzimas, ver por ejemplo Youil y otros, Proc. Natl. Acad. Sci. U.S.A. 92 (1995) 87-91; Todd y otros, J. Oral Maxil. Surg. 59 (2001) 660­ 667; Amar y otros, J. Clin. Microbiol. 40 (2002) 446-452.
Alternativamente, en vez de analizar las células para detectar la presencia o ausencia de la modificación deseada, en particular, en el caso de la modificación en una secuencia específica, las células modificadas exitosamente pueden seleccionarse mediante la incorporación de marcadores de selección apropiados. Los marcadores de selección incluyen marcadores de selección positivos y negativos, que se conocen bien en la técnica y se emplean habitualmente por el experto en la técnica. Los ejemplos no limitantes de marcadores de selección incluyen dhfr, gpt, neomicina, higromicina, dihidrofolato reductasa, G418 o glutamina sintasa (GS) (Murphy y otros, Biochem J. 1991, 227:277; Bebbington y otros, Bio/Technology 1992, 10:169). Mediante el uso de estos marcadores, las células se cultivan en medio selectivo y se seleccionan las células con la mayor resistencia. Se contemplan, además, los marcadores de selección positiva/negativa combinados, que pueden incorporarse en el genoma diana mediante recombinación homóloga o integración aleatoria. Después de la selección positiva, el primer casete que comprende el marcador de selección positiva flanqueado por sitios de reconocimiento de recombinasa se intercambia mediante intercambio de casete mediado por recombinasa contra un segundo casete sin marcador. Después, los clones que contienen el casete de intercambio deseado se obtienen mediante selección negativa.
En una realización preferida del método de la invención, la célula se selecciona a partir del grupo que consiste en una célula de mamífero o de vertebrado, una célula vegetal o una célula fúngica.
En otra realización preferida del método de la invención, la célula es un ovocito no humano.
Como se usa en la presente descripción, el término "ovocito" se refiere a la célula germinal femenina involucrada en la reproducción, es decir, el óvulo o la célula huevo. De acuerdo con la presente invención, el término "ovocito" comprende ambos, los ovocitos antes de la fecundación, así como también los ovocitos fecundados que, además, se denominan cigotos. Por lo tanto, el ovocito antes de la fecundación comprende solamente los cromosomas maternos, mientras que un ovocito después de la fecundación comprende los cromosomas maternos y paternos. Después de la fecundación, el ovocito permanece en un estado doble haploide durante varias horas, en ratones, por ejemplo, hasta 18 horas después de la fecundación. De acuerdo con la invención, el ovocito es no humano.
En una realización más preferida del método de la invención, el no humano es un ovocito fertilizado. El término "ovocito fecundado", como se usa en la presente descripción, se refiere a un ovocito no humano después de la fusión con el esperma fecundante. Durante un período de muchas horas (tal como hasta 18 horas en ratones) después de la fecundación, el ovocito se encuentra en un estado doble haploide, que comprende un pronúcleo haploide materno y un pronúcleo haploide paterno. Después de la migración de los dos pronúcleos juntos, sus membranas se rompen y los dos genomas se condensan en cromosomas, de esta manera se reconstituye un organismo diploide. Preferentemente, el ovocito mamífero o aviar usado en el método de la presente invención es un ovocito de mamífero o aviar fecundado en el estado doble haploide.
En el caso de los ovocitos para usarse como células en el método de la invención, la proteína, la proteína de fusión o la molécula de ácido nucleico que codifica dicha proteína o proteína de fusión se introducen en el ovocito mediante microinyección. La microinyección en el ovocito puede realizarse mediante inyección en el núcleo (antes de la fecundación), en el pronúcleo (después de la fecundación) y/o mediante la inyección en el citoplasma (tanto antes como después de la fecundación). Cuando se emplea un ovocito fecundado, la inyección en el pronúcleo se realiza, ya sea para un pronúcleo, o para ambos pronúcleos. La inyección de la nucleasa dedos-Tal o de un ADN que codifica la nucleasa dedos-Tal de la etapa (a) del método para modificar una secuencia diana de la presente invención es, preferentemente, dentro del núcleo/pronúcleo, mientras que la inyección de un ARNm que codifica la nucleasa dedos-Tal de la etapa (a) es, preferentemente, en el citoplasma. La inyección de la molécula de ácido nucleico de la etapa (b) es, preferentemente, dentro del núcleo/pronúcleo. Sin embargo, la inyección de la molécula de ácido nucleico de la etapa (b) puede realizarse, además, en el citoplasma cuando dicha molécula de ácido nucleico se proporciona como una secuencia de ácido nucleico que tiene una señal de localización nuclear, para asegurar su suministro dentro del núcleo/pronúcleo. Preferentemente, la microinyección se realiza mediante inyección tanto dentro del núcleo/pronúcleo como en el citoplasma. Por ejemplo, la aguja puede introducirse dentro del núcleo/pronúcleo y se inyecta una primera cantidad de la nucleasa dedos-Tal y/o la molécula de ácido nucleico dentro del núcleo/pronúcleo. Mientras se retira la aguja del ovocito, se inyecta una segunda cantidad de la nucleasa dedos-Tal y/o la molécula de ácido nucleico en el citoplasma.
Los métodos para realizar la microinyección se conocen bien en la técnica y se describen, por ejemplo, en Nagy y otros (Nagy A, Gertsenstein M, Vintersten K, BehringerR., 2003. Manipulating the Mouse Embryo. Cold Spring Harbour, Nueva York: Cold Spring Harbour Laboratory Press) así como también en los ejemplos de la presente descripción más abajo.
Se prefiere, además, que la molécula de ácido nucleico de la etapa (b) del método de la invención se introduzca (además) dentro de la célula mediante microinyección.
En otro aspecto, la divulgación se refiere al método de producción de un vertebrado no humano o mamífero no humano que lleva una secuencia diana modificada en su.
Se contempla además, de acuerdo con el método para producir un vertebrado no humano o mamífero que porta una secuencia diana modificada en su genoma, que se realice una etapa de análisis de la modificación genómica exitosa antes del trasplante en la hembra huésped. Como ejemplo no limitante, el ovocito puede cultivarse hasta la etapa de 2 células, 4 células o 8 células y una célula puede eliminarse sin destruir o alterar el embrión resultante. El análisis de la constitución genómica, por ejemplo, la presencia o ausencia de la modificación genómica, puede realizarse después mediante el uso, por ejemplo, de PCR o de técnicas de transferencia southern o cualquiera de los métodos descritos anteriormente en la presente descripción. Tales métodos de análisis de genotipificación exitoso antes del trasplante se conocen en la técnica y se describen, por ejemplo, en Peippo y otros (Peippo J, Viitala S, Virta J, Raty M, Tammiranta N, Lamminen T, Aro J, Myllymaki H, Vilkki J.; Mol Reprod Dev 2007; 74:1373-1378).
Cuando la célula es un ovocito, el método para producir un vertebrado no humano o un mamífero que porta una secuencia diana modificada en su genoma comprende (a) modificar la secuencia diana en el genoma de un ovocito de un vertebrado o mamífero de acuerdo con el método de la invención; y, opcionalmente, analizar la descendencia suministrada por el huésped hembra para detectar la presencia de la modificación.
Para este método para producir un vertebrado no humano o un mamífero, se requiere la fecundación del ovocito. Dicha fecundación puede ocurrir antes de la modificación de la secuencia diana en la etapa (a) de acuerdo con el método para producir un vertebrado no humano o mamífero de la invención, es decir, puede usarse un ovocito fecundado para el método de modificación de una secuencia diana de acuerdo con la invención. La fecundación puede realizarse, además, después de la modificación de la secuencia diana en la etapa (a), es decir, puede usarse un ovocito no fecundado para el método de modificación de una secuencia diana de acuerdo con la invención, en donde el ovocito es posteriormente.
La etapa de análisis para detectar la presencia de la modificación en la descendencia suministrada por el huésped hembra proporciona la información necesaria acerca de si el vertebrado no humano o el mamífero producido porta, o no, la secuencia diana modificada en su genoma. Por lo tanto, la presencia de la modificación es indicativa de que dicha descendencia es portadora de una secuencia diana modificada en su genoma, mientras que la ausencia de la modificación es indicativa de que dicha descendencia no es portadora de la secuencia diana modificada en su genoma. Los métodos de análisis para detectar la presencia o ausencia de una modificación se detallaron anteriormente.
El vertebrado no humano o el mamífero no humano producido por el método de la invención es, entre otras cosas, útil para estudiar la función de los genes de interés y la expresión/resultado fenotípico de las modificaciones del genoma en tales animales. Se contempla, además, que los mamíferos no humanos de la invención pueden emplearse como modelos de enfermedades y para evaluar agentes/composiciones terapéuticas. Adicionalmente, el vertebrado no humano o el mamífero de la invención puede usarse, además, para la cría de ganado.
El método para producir un vertebrado no humano o un mamífero no humano comprende, además, cultivar la célula para formar un embrión de preimplantación o introducir la célula en un blastocisto. Los métodos para cultivar la célula para formar un embrión de preimplantación o introducir la célula en un blastocisto se conocen bien en la técnica y, por ejemplo, se describen en Nagy y otros, en el lugar citado.
El término "introducir la célula en un blastocisto" como se usa en la presente descripción, abarca la inyección de la célula en un blastocisto así como también la fusión de una célula con un blastocisto. Los métodos para introducir una célula en un blastocisto se describen en la técnica, por ejemplo en Nagy y otros, en el lugar citado. Aquí se describe un vertebrado no humano o un mamífero mamífero no humano que se puede obtener mediante el método descrito anteriormente.
En una realización preferida de los métodos de la invención, la célula no humana es de un mamífero seleccionado del grupo que consiste en roedores, perros, félidos, primates, conejos, cerdos, o vacas o la célula es de un ave seleccionada del grupo que consiste en pollos, pavos, faisanes, patos, gansos, codornices y aves no voladoras, que incluyen avestruces, emúes y casuarios, o la célula es de un pez tal como, por ejemplo, un pez cebra, salmón, trucha, carpa común o carpa koi.
Todos los mamíferos, aves y peces descritos en la presente descripción se conocen bien por los expertos en la técnica y se definen taxonómicamente de acuerdo con la técnica anterior y el conocimiento general común de los expertos en la técnica.
Los ejemplos no limitantes de "roedores" son ratones, ratas, ardillas, ardillas ralladas, ardilla de la tierra, puercoespines, castores, hámster, jerbos, cobayas, degús, chinchillas, perritos de las praderas y marmotas.
Los ejemplos no limitantes de "perros" incluyen los miembros de la subespecie canis lupus familiaris, así como también lobos, zorros, chacales, y coyotes.
Los ejemplos no limitantes de "félidos" incluyen miembros de las dos subfamilias: las pantherinas, que incluyen leones, tigres, jaguares y leopardos y las felinas, que incluyen pumas, guepardos, gato cerval, linces, caracales, ocelotes y gatos domésticos.
El término "primates", como se usa en la presente descripción, se refiere a todos los monos, que incluyen, por ejemplo, cercopithecoid (mono del viejo mundo) o platyrrhine (mono del nuevo mundo), así como también lemures, tarseros, simios y monos tití (Callithrixjacchus).
Con respecto a las realizaciones caracterizadas en esta descripción, en particular en las reivindicaciones, se pretende que cada realización mencionada en una reivindicación dependiente se combine con cada realización de cada reivindicación (independiente o dependiente) de la que depende dicha reivindicación dependiente. Por ejemplo, en el caso de una reivindicación independiente 1 que enumera 3 alternativas A, B y C, una reivindicación dependiente 2 que enumera 3 alternativas D, E y F y una reivindicación dependiente 3 de conformidad con las reivindicaciones 1 y 2 y que enumera 3 alternativas G, H y I, debe entenderse que la descripción describe de manera inequívoca las realizaciones correspondientes a las combinaciones A, D, G; A, D, H; A, D, I; A, E, G; A, E, H; A, E, I; A, F, G; A, F, H; A, F, I; B, D, G; B, D, H; B, D, I; B, E, G; B, E, H; B, E, I; B, F, G; B, F, H; B, F, I; C, D, G; C, D, H; C, D, I; C, E, G; C, E, H; C, E, I; C, F, G; C, F, H; C, F, I, a menos que se mencione específicamente de cualquier otra manera.
De manera similar, y, además, en aquellos casos donde las reivindicaciones independientes y/o dependientes no enumeren alternativas, se entiende que si las reivindicaciones dependientes se refieren nuevamente a una pluralidad de reivindicaciones anteriores, se considera que cualquier combinación de la materia cubierta de esta manera se describe explícitamente. Por ejemplo, en el caso de una reivindicación independiente 1, una reivindicación dependiente 2 que se refiere nuevamente a la reivindicación 1 y una reivindicación dependiente 3 que se refiere nuevamente a las reivindicaciones 2 y 1, se deduce que la combinación de la materia de las reivindicaciones 3 y 1 se describe de manera clara e inequívoca, al igual que la combinación de la materia de las reivindicaciones 3, 2 y 1. En caso de que esté presente, además, una reivindicación dependiente 4 que se refiere a cualquiera de las reivindicaciones 1 a 3, se deduce que la combinación de la materia de las reivindicaciones 4 y 1, de las reivindicaciones 4, 2 y 1, de las reivindicaciones 4, 3 y 1, así como también de las reivindicaciones 4, 3, 2 y 1, se describen de manera clara e inequívoca.
Las Figuras muestran:
Figura 1: Vectores de expresión de Nucleasa-TAL.
La figura muestra la estructura y función de las proteínas de fusión Nucleasa-TAL, que consiste en un dominio de unión al ADN en una secuencia específica y un dominio de escisión del ADN (nucleasa) no específico. El dominio de unión al ADN puede ensamblarse a partir de los cuatro tipos de elementos peptídicos de TAL, de 34 aminoácidos, que exhiben especificidad de unión contra uno de los nucleótidos del ADN a través de las posiciones de los aminoácidos 12 y 13 (Nl -A; HD - C; NG - T; NN - G). Después de la unión del dominio del elemento TAL a la secuencia del ADN diana seleccionada, el dominio nucleasa de la proteína de fusión entra en contacto estrecho con la doble hebra del ADN, pero no escinde el ADN como un monómero de nucleasa. Solamente después de la unión de una segunda proteína de fusión Nucleasa-TAL a una segunda secuencia diana de ADN ubicada hacia el extremo 3' con respecto al sitio de unión de la primera proteína de fusión, la doble hebra de ADN se escinde a través de la cooperación de los dos dominios nucleasa que están en contacto estrecho.
Figura 2: Modificación de las secuencias genómicas inducida por la Nucleasa-TAL.
La figura muestra un par de proteínas de fusión Nucleasa-TAL que se unen en los extremos 5' y 3' con respecto al sitio diana seleccionado dentro de un gen diana genómico. Después de la creación de una rotura de doble hebra del ADN dentro del sitio diana, dos mecanismos competidores de reparación del ADN se activan fuertemente en las células: i) mediante recombinación homóloga, en presencia de un vector de transformación génica introducido externamente que comprende dos regiones de homología con el gen diana y una modificación/mutación genética prediseñada, la modificación planeada previamente se copia a partir del vector de transformación en el genoma; por esta vía, cualquier modificación génica dirigida (por ejemplo, inactivación génica, reemplazo génico) puede colocarse en el genoma, ii) mediante la vía de reparación por la unión de extremos no homólogos (NHEJ), los extremos de ADN libres se unen por ligación sin un molde de reparación; por esta vía, con frecuencia se pierde un número variable de nucleótidos (símbolo del cuchillo) antes de la ligación final y frecuentemente resulta en un alelo inactivado del gen diana.
Figura 3: Uso de Nucleasas-TAL para la transformación génica en líneas celulares de mamíferos y cigotos.
A: Para la generación de modificaciones génicas en líneas celulares de mamíferos, los vectores de transformación de Nucleasa-TAL pueden transfectarse junto con, o sin, un vector específico de transformación génica, en células en cultivo. Después de la expresión de la nucleasa y la reparación del ADN, una fracción de las células tratadas contiene la alteración génica deseada. Estas células pueden aislarse y cultivarse adicionalmente como una línea celular modificada genéticamente pura. B: Después de la microinyección del ARNm de Nucleasa-TAL, junto con o sin un vector de transformación génica específico, dentro de ovocitos de mamíferos fecundados (cigotos, aislados de hembras de tipo silvestre, por ejemplo, ratones) puede introducirse directamente un alelo inactivado (KO) o un gen de reemplazo (Kl) en el genoma del embrión unicelular. Las hembras pseudo embarazadas suministran la descendencia a partir de ovocitos microinyectados. A la descendencia se le realiza una genotipificación para detectar la presencia de la modificación génica inducida. Los animales positivos se seleccionan para su reproducción ulterior con el propósito de establecer una cepa modificada genéticamente.
Figura 4: Vectores de expresión de Nucleasa-TAL.
El vector de expresión Nucleasa-TAL pCAG-Tal-nucleasa contiene una región del promotor CAG y una unidad transcripcional que comprende, el extremo 5' de un par central de sitios de restricción BsmBI, un codón de inicio de la transcripción ATG (flecha), una secuencia de localización nuclear (NLS), una secuencia de etiqueta FLAG (FLAG), una secuencia enlazadora, un segmento codificante para 110 aminoácidos de la proteína TAL AvrBs3 (AvrN) y sus repeticiones invariables Tal en el N-terminal (r0.5). En el extremo 3' de los sitios de restricción BsmBI la unidad transcripcional contiene una repetición Tal invariable en el extremo C-terminal (rx.5), un segmento codificante para 44 aminoácidos derivados de la proteína Tal AvrBs3, unos sitios de restricción Pmel y Mlul para la inserción de las regiones codificantes de la nucleasa y una secuencia señal de poliadenilación (pA). Los segmentos de ADN codificantes para los elementos de repetición TAL pueden insertarse en los sitios BsmBI del pCAG-Tal-nucleasa para la expresión de proteínas de fusión Nucleasa-TAL variables. Para crear los vectores de expresión pArtTall-nucleasa el arreglo ArtTall de los elementos de repetición TAL, que reconocen la secuencia diana especificada de 12 pb, se insertaron en los sitios BsmBI del pCAG-TAL-nucleasa. Cada repetición Tal de 34 aminoácidos se representa como un cuadrado que indica el código de los aminoácidos de las repeticiones en las posiciones 12/13 que confieren la unión a uno de los nucleótidos del ADN de la secuencia diana (NI > A, NG > T, HD > C, NN > G) mostrada anteriormente. A continuación, las regiones codificantes del dominio nucleasa sintética se insertaron en los sitios Pmel y Mlul del pCAG-ArtTal1-nucleasa para obtener los vectores de expresión: A :pCAG-ArtTal1-Alw que incluye el dominio nucleasa de la endonucleasa de restricción Alwl, B: pCAG-ArtTal1-CleDORF que incluye el dominio nucleasa del gen CleDORF, C: pCAG-ArtTal1-Clo051 que incluye el dominio nucleasa del gen Clo051, D:pCAG-ArtTal1-Mly que incluye el dominio nucleasa de la endonucleasa de restricción Mlyl, E: pCAG-ArtTal1-Pept071 que incluye el dominio nucleasa del gen Pept071, F: pCAG-ArtTal1-Sbf que incluye el dominio nucleasa de la endonucleasa de restricción Sbfl, G: pCAG-ArtTal1-Sdal que incluye el dominio nucleasa de la endonucleasa de restricción Sdal H: pCAG-ArtTal1-Sst que incluye el dominio nucleasa de la endonucleasa de restricción Stsl, e I: pCAG-ArtTal1-Fok que incluye el dominio nucleasa de la endonucleasa de restricción Fokl
Figura 5: Secuencia de aminoácidos de la proteína Clo051
Secuencia de los 587 aminoácidos de la proteína Clo051 en el código de una letra. Se indican la metionina en la posición 1 (M1), la tirosina en la posición 587 (Y587) y el residuo 199 del dominio nucleasa entre las posiciones E389 e Y587. Además, se destacan las posiciones D455, D472 y K474 que son características del sitio activo conservado de la superfamilia de enzimas 'PD-(D/E)XK' que interaccionan con el ADN.
Figura 6: Estructura predicha de la proteína Clo051 y su dominio nucleasa.
La estructura terciaria de la proteína Clo051 se predijo a partir de su secuencia de aminoácidos (Figura 5) mediante el uso del programa informático I-TASSER. Las estructuras secundarias se muestran como regiones alfa-helicoidales y de hojas beta. Se destacan la metionina en la posición 1 (M1), el residuo de glutamato 389 (E389) y la tirosina 587 (Y587). La cadena de proteínas entre E389 e Y587 forma un dominio de plegamiento separado que actúa como una nucleasa.
Figura 7: Plásmidos reporteros de Nucleasa-TAL-y ensayo reportero de nucleasa.
A: Los plásmidos reporteros Nucleasa-TAL contienen una región del promotor de CMV, una secuencia codificante de 400 pb para el segmento del extremo N-terminal de p-galactosidasa y un codón de parada. Esta unidad es seguida por una región diana de unión a TAL que consiste en dos secuencias de reconocimiento orientadas inversas (subrayadas), separadas por una región espaciadora de 15 pb (NNN..), para el arreglo ArtTal1 (a), el arreglo TalRab1 (b), el arreglo TalRab2 (c), o una región de unión híbrida compuesta por una secuencia de reconocimiento ArtTal1 y una TalRab2 (d). La región diana Nucleasa-TAL es seguida por la región codificante completa para p-galactosidasa y una señal de poliadenilación (pA). Para evaluar la actividad nucleasa contra la secuencia diana un vector de expresión Nucleasa-TAL (Figura 4) se cotransfectó transitoriamente con su plásmido reportero correspondiente en células HEK 293. Después de la expresión de la proteína Nucleasa-TAL el plásmido reportero se abre mediante una rotura de doble hebra inducida por nucleasa dentro de la secuencia diana Nucleasa-TAL (símbolo de tijeras).
B: Las regiones de ADN adyacentes a la rotura de doble hebra son idénticas en 400 pb y pueden alinearse y recombinarse (X) mediante la reparación del ADN por recombinación homóloga. C: La recombinación homóloga de un plásmido reportero abierto resulta en un vector de expresión de p-galactosidasa funcional que produce la enzima p-galactosidasa. Después de dos días, las células transfectadas se lisaron y la actividad de la enzima en el lisado se determinó con un ensayo reportero de quimioluminiscencia. Los niveles de la emisión de luz catalizada por el reportero se miden e indican la actividad de la Nucleasa-TAL en comparación con las muestras que se transfectaron con el plásmido reportero solo.
Figura 8: Actividad de las proteínas de fusión Nucleasa-TAL en células HEK 293.
Para evaluar la actividad nucleasa de las proteínas de fusión de los dominio nucleasa-TAL, los vectores de expresión para las proteínas ArtTal1-Alwl, -CleDORF, - Clo051, -Mlyl, -Fokl, -Pept071, -Sbfl, -Sdal, y -Stsl (Figura 4) se transfectaron juntos con el plásmido reportero ArtTal1 (Figura 7) en células HEK 293. La actividad nucleasa específica contra la secuencia diana del plásmido reportero conduce a la recombinación homóloga y a la expresión de p-galactosidasa. Dos días después de la transfección, se lisaron las poblaciones celulares y se determinó la actividad de la p-galactosidasa con un ensayo reportero de quimioluminiscencia. Los niveles de emisión de luz se normalizaron en relación con la actividad de un plásmido de expresión de luciferasa cotransfectado (pLuciferasa) y se muestran en comparación con la actividad de un vector de expresión de p-galactosidasa control positivo. La barra para cada muestra transfectada representa el valor medio y la SD derivada de tres pocillos de cultivo transfectados a la par. A: La transfección del plásmido reportero ArtTall sin vector de expresión de nucleasa resulta en un bajo nivel de fondo de p-galactosidasa. La cotransfección de pCAG-ArtTal1-Alwl, -CleDORF, y -Mlyl con el plásmido reportero ArtTall no condujo a un aumento significativo de la expresión del reportero, lo que indica que las proteínas de fusión ArtTal1-Alwl, -CleDORF, y -Mlyl no exhiben actividad nucleasa. Por el contrario, la cotransfección del plásmido reportero ArtTall y el plásmido pCAG-ArtTal1-Clo051 resultó en un fuerte aumento de la expresión del reportero, lo que indica que la proteína de fusión ArtTal1-Clo051 exhibe actividad nucleasa específica de la secuencia diana en las células 293. B: En un experimento de transfección independiente, la cotransfección de pCAG-ArtTal1-Pept071, -Sbfl, -Sdal y -Sst con el plásmido reportero ArtTall no condujo a un aumento significativo de la expresión del reportero, en comparación con el plásmido reportero ArtTall solo, lo que indica que las proteínas de fusión ArtTal1-Pept071, -Sbfl, - Sdal, y -Stsl no exhiben actividad nucleasa. Por el contrario, la cotransfección de los plásmidos reportero ArtTall y pCAG-ArtTall-Fokl resultó en un aumento de la expresión del reportero, lo que indica la actividad nucleasa de la proteína de fusión ArtTal1-Fokl en células 293.
Figura 9: Especificidad de la secuencia diana de la nucleasa ArtTal1-Clo051.
Para evaluar la especificidad de la nucleasa ArtTal1-Clo051 contra la secuencia diana prediseñada en comparación con las secuencias de ADN no relacionadas, el vector de expresión pCAG-ArtTal1-Clo051 se cotransfectó con el plásmido reportero ArtTall correspondiente o con los plásmidos reporteros TalRabl o TalRab2 (Figura 7), que contienen secuencias diana no relacionadas, en células HEK 293. La actividad nucleasa fuerte se desarrolló solamente en la combinación específica del vector de expresión ArtTaI1-Clo051 junto con el plásmido reportero ArtTall, lo que indica que la nucleasa ArtTal1-Clo051 actúa específicamente contra la secuencia diana prediseñada.
Figura 10: Caracterización de la cooperatividad de proteínas de fusión nucleasa TAL-Clo051
A: Para evaluar la cooperatividad de los dominios nucleasa Clo051 de un par de proteínas de fusión TAL-Clo051, los vectores de expresión para las proteínas de fusión ArtTal1-Clo051 o TalRab2-Clo051 se cotransfectaron con el correspondiente plásmido reportero ArtTall o TalRab2 (Figura 7) y se comparó con la cotransfección con el plásmido reportero ArtTal1/TalRab2, que contiene una región diana híbrida (Figura 7). La actividad nucleasa significativa se desarrolló solamente en la combinación de vectores de expresión de Nucleasa-TAL con plásmidos reporteros que contienen dos copias idénticas e inversas de la secuencia diana del arreglo TAL correspondiente, pero no con el plásmido reportero ArtTal1/TalRab2 que contiene solamente una secuencia de unión única de las proteínas de fusión ArtTall-Clo051 y TalRab2-Clo051. Este resultado indica que dos dominios nucleasa Clo051 deben cooperar para inducir una rotura de doble hebra del ADN, mientras que un único dominio nucleasa Clo051 no actúa como una nucleasa. B: La cotransfección del plásmido reportero ArtTall/TalRab2 con ambos vectores de expresión para ArtTal1-Clo051 y TalRab2-Clo051, pero no con ArtTal1-Clo051 o -Fok solo, resulta en una actividad nucleasa fuerte, en comparación con la transfección del plásmido reportero ArtTal1/TalRab2. Este resultado indica que la actividad nucleasa y la inducción de roturas de doble hebra en la región diana se producen solamente después de la unión de dos proteínas de fusión TAL-Clo051 y de la interacción de un par de dominios nucleasa Clo051.
Figura 11: Diseño de un par de proteínas de fusión TAL-Clo051 de acuerdo con la presente invención, que reconoce el gen Rab38 de ratón.
Nucleasa TAL que reconoce una secuencia diana dentro del exón 1 del gen de ratón Rab38. El trinucleótido que representa el codón 19 está subrayado. Se indica cada secuencia de 14 nucleótidos que se reconoce por una de las proteínas de fusión TAL-Clo051 indicadas, RabChtTal1- y RabChtTal2-Clo051. Las dos secuencias diana de 14 pb flanquean una secuencia espaciadora central de 15 pb que se escinde por los dominios nucleasa Clo051.
Figura 12: Estrategia para la modificación del gen de ratón Rab38 en células ES y cigotos mediante el uso de proteínas de fusión TAL-Clo051.
Dentro del exón 1 del gen de tipo silvestre Rab38 (Rab38 WT) se indica la posición de los sitios de unión para el par Nucleasa TAL RabChtTal1- y RabChtTal2-Clo051. El vector de transformación Rab38-cht contiene una región de homología 5' de 942 pb y una región de homología 3' de 2788 pb que flanquean los sitios de reconocimiento TAL de Rab38. Dentro del exón 1 el cambio de dos nucleótidos dentro del codón 19 (GTA) de Rab38 produce una mutación chocolate (cht) sin sentido que codifica para valina (Val) en lugar de la glicina (Gly) de tipo silvestre (WT), y elimina un sitio de restricción BsaJI. En cada uno de los sitios adyacentes de reconocimiento TAL de Rab38 se introdujeron numerosas mutaciones silentes para evitar la unión de las proteínas TAL de Rab38 al vector de transformación. La inducción de una rotura de doble hebra dentro del gen de tipo silvestre Rab38 por el par de proteínas RabChtTal estimula la recombinación homóloga con el vector de transformación Rab38-cht e integra la mutación chocolate sin sentido y las mutaciones silentes en el genoma.
Figura 13: Aislamiento de mutantes hiperactivos de nucleasa Clo051.
La figura muestra la secuencia primaria del dominio nucleasa Clo051 entre las posiciones E389 e Y587. Se indica la distribución de los residuos arginina (R) y lisina (K) (cuadrados sólidos) cargados positivamente de y de los residuos glutamato (E) y aspartato (D) (círculos abiertos) cargados negativamente. Los triángulos indican las posiciones S423 y R446. Estos residuos constituyen un marco tridimensional de cargas dentro del dominio Clo051 que determina la estructura terciaria única de esta nucleasa, como se modeló en la estructura de la Figura 6. Determinados reemplazos de residuos polares versus no polares o de residuos no polares contra residuos polares, por ejemplo en las posiciones 423 y 446, cambian la estructura tridimensional de la cadena proteica y resulta en una actividad nucleasa que trabaja más eficientemente.
Figura 14: Actividad de la nucleasa ArtTal1-Clo051 sobre un reportero genómico en células HEK293 Las células HEK293 que poseen copias genómicas integradas del constructo reportero pCMV-Rab-Reporter(hygro) se transfectaron con pBluescript o pCAG.ArtTal1-Clo051. La actividad nucleasa específica contra la secuencia diana del reportero conduce a la recombinación homóloga y a la expresión de p-galactosidasa. Dos días después de la transfección, se fijaron las poblaciones celulares y se determinó la fracción de células que expresaban p-galactosidasa mediante tinción histoquímica con X-Gal. A: Cultivo de células reporteras teñidas con X-Gal después de la transfección con pBluescript. B: Cultivo de células reporteras teñidas con X-Gal después de la transfección con el vector de expresión de nucleasa pCAG-ArtTal1-Clo051.
Los ejemplos ilustran la invención:
Ejemplo 1: Construcción de vectores de expresión y reporteros para Nucleasa Tal y detección de la actividad nucleasa específica
Construcción de vectores de expresión Nucleasa-TAL
Para la expresión de nucleasa-TAL en células de mamíferos, diseñamos el vector de expresión genérico pCAG-TAL-nucleasa (sec. con núm. de ident.: 3) (Figura 4), que contiene una región del promotor híbrida CAG y una unidad transcripcional que comprende una secuencia codificante para un péptido N-terminal de 176 aminoácidos (sec. con núm. de ident.: 4) de las proteínas de fusión Nucleasa TAL, ubicada en el extremo 5' de un par de sitios de restricción BsmBI. Esta región N-terminal incluye un codón de inicio de la transcripción ATG, una secuencia de localización nuclear, una secuencia de etiqueta FLAG, una secuencia enlazadora rica en glicina, un segmento codificante para 110 aminoácidos de la proteína Tal AvrBs3 y la repetición Tal invariable del extremo N-terminal del efector TAL Hax3. En el extremo 3' de los sitios centrales BsmBI, la unidad transcripcional contiene 78 codones (sec. con núm. de ident.: 5) que incluyen una repetición TAL invariable del extremo C-terminal (34 aminoácidos) y 44 residuos derivados de la proteína TAL AvrBs3, seguido por un sitio de restricción Pmel y Mlul para la inserción de una región codificante de nucleasa y por una secuencia señal de poliadenilación (pA). Los segmentos de ADN codificantes para los arreglos de repeticiones TAL, diseñados para unir una secuencia diana de nucleasa TAL pueden insertarse en los sitios BsmBI de pCAG-Tal-nucleasa en el marco de lectura con las regiones codificantes de los extremos 5' y 3' para la expresión de proteínas nucleasa TAL prediseñadas.
Para generar los vectores TAL-nucleasa para la expresión en células de mamíferos insertamos un segmento de ADN sintético con la región codificante de un arreglo de 12 repeticiones Tal, designado ArtTal1 (sec. con núm. de ident.: 6), en los sitios BsmBI de pCAG-TAL-nucleasa, para derivar el plásmido pCAG-ArtTal1-nucleasa (sec. con núm. de ident.: 7). El elemento TAL en el arreglo ArtTal1 reconoce la secuencia diana de ADN artificial 5'-ATTCTGGGACGT-3' (Figura 4). En otro ejemplo insertamos un segmento de ADN sintético con la región codificante de un arreglo de 14 repeticiones Tal, designado TalRab2 (sec. con núm. de ident.: 8), en los sitios BsmBI de pCAG-TAL-nucleasa, para derivar el plásmido pCAG-TalRab2-nucleasa (sec. con núm. de ident.: 9). El elemento TAL en el arreglo TalRab2 reconoce la secuencia diana 5'-GGTGGCCCGGTAGT-3' (Figura 7) que ocurre dentro del gen de ratón Rab38. Las secuencias diana TAL se seleccionaron de manera que las regiones de unión de las proteínas TAL fueran precedidas por un nucleótido T. Siguiendo la secuencia hacia el extremo 3' de la T inicial en dirección 5'>3', los dominios de unión al ADN específicos de TAL se combinaron juntos en arreglos de 12 (ArtTal1) (Figura 4), o 14 (TalRab2) elementos TAL. Cada motivo de elemento TAL consiste en 34 aminoácidos, la posición 12 y 13 de los cuales determina la especificidad hacia el reconocimiento de A, G, C o T dentro de la secuencia diana. Para derivar los dominios de unión al ADN del elemento TAL usamos el motivo efector TAL (repetición) #11 de la proteína Hax3 de Xanthomonas (Núm. de acceso del GenBank AY993938.1 (LTPEQVVAIASNIGGKQALETVQRLLPVLCQAHG) con los aminoácidos N12 e I13 para reconocer A, el motivo efector TAL (repetición) #5 (LTPQQVVAIASHDGGKQALETVQRLLPVLCQAHG) derivado de la proteína Hax3 con los aminoácidos H12 y D13 para reconocer C, y el motivo efector TAL (repetición) #4 (LTPQQVVAIASNGGGKQALETVQRLLPVLCQAHG) de la proteína Hax4 de Xanthomonas (Núm. de acceso del GenBank: AY993939.1) con los aminoácidos N12 y G13 para reconocer T. Para reconocer un nucleótido diana G usamos el motivo efector TAL (repetición) #4 de la proteína Hax4 con el reemplazo de los aminoácidos 12 por N y 13 por N (LTPQQVVAIASNNGGKQALETVQRLLPVLCQAHG).
A continuación, construimos proteínas de fusión del dominio de unión al ADN ArtTal1 con dominios de proteínas derivado de nucleasas conocidas o putativas y evaluamos si esas proteínas de fusión nucleasa-TAL son capaces de inducir una rotura en la doble hebra después de unirse al ADN mediante la región de reconocimiento TAL. Para este propósito, insertamos segmentos de ADN sintético que comprenden las regiones codificantes de ocho dominios de nucleasa putativos y el dominio conocido de nucleasa de Fokl (sec. con núm. de ident.: 10), en los sitios Pmel y Mlul del plásmido pCAG-ArtTal1-nucleasa. Entre los ocho dominios putativos de nucleasa seleccionamos dominios de las cinco enzimas de restricción conocidas Alwl (sec. con núm. de ident.: 11), Mlyl (sec. con núm. de ident.: 12), Sbfl (sec. con núm. de ident.: 13), Sdal (sec. con núm. de ident.: 14) y Stsl (sec. con núm. de ident.: 15). Además, seleccionamos dominios putativos de nucleasa de tres genes microbianos hipotéticos, aún no caracterizados, designados en la presente como 'CleDORF' (sec. con núm. de ident.: 16) (Secuencia de Referencia del NCBI: ZP_02080987.1, derivado a partir del genoma de Clostridium leptumDSM753), 'Clo051' (sec. con núm. de ident.: 17) (Secuencia de Referencia del n Cb I: ZP_05132802.1, derivado a partir del genoma de Clostridium spec.7_2_43FAA) y 'Pept071' (sec. con núm. de ident.: 18) (Secuencia de Referencia del NCBI: ZP_07399918.1, derivado a partir del genoma de Peptoniphilus duerdenii ATCC BAa -1640). Estas proteínas se seleccionaron por los elementos de secuencia característicos que son compatibles con el sitio activo conservado de la superfamilia de enzimas 'PD-(D/E)XK' (Kosinski, J., y otros (2005). BMC Bioinformatics, 6,172) que interaccionan con el a Dn (ver Figura 6 para la proteína Clo051). En particular, la proteína Clo051 de 587 residuos puede clasificarse como un miembro de la familia de proteína PD-(D/E)XK por la localización de los pares de aminoácidos P454/ D455 (motivo PD) y D472/ K474 (motivo DXK) (Figura 5). Para dilucidar si la proteína Clo051 contiene un dominio nucleasa separado, realizamos una predicción estructural tridimensional a partir de su secuencia de aminoácidos primaria mediante el uso del programa informático I-TASSER (Roy, A. y otros (2010). Nat Protoc., 5(4):725-38). Como se muestra en la Figura 6 la proteína Clo051 está compuesta por dos dominios de proteína. El dominio C-terminal de Clo051, que comienza aproximadamente con el residuo E389, contiene el motivo consenso de la familia PD-(D/E)XK y aparece como un dominio nucleasa no específico.
Para la expresión de estos dominios de proteínas en células de mamíferos usamos regiones codificantes sintéticas optimizadas de acuerdo con el uso de codones en mamíferos e insertamos segmentos que comprenden los dominios nucleasa putativos de Alwl (sec. con núm. de ident.: 19), CleDORF (sec. con núm. de ident.: 20), Clo051 (sec. con núm. de ident.: 1), Mlyl (sec. con núm. de ident.: 21), Pept071 (sec. con núm. de ident.: 22), Sbfl (sec. con núm. de ident.: 23), Sdal (sec. con núm. de ident.: 24), Stsl (sec. con núm. de ident.: 25) y el dominio nucleasa conocido de Fokl (sec. con núm. de ident.: 26) dentro de los sitios Pmel y Mlul del plásmido pCAG-ArtTal1-nucleasa, para derivar los vectores de expresión pCAG-ArtTal1-Alwl (sec. con núm. de ident.: 27) (Figura 4a ), pCAG-ArtTal1-CleDORF (sec. con núm. de ident.: 28) (Figura 4B), pCAG-ArtTal1-Clo051 (sec. con núm. de ident.: 29) (Figura 4C), pCAG-ArtTal1-Mlyl (sec. con núm. de ident.: 30) (Figura 4D), pCAG-ArtTal1-Pept071 (sec. con núm. de ident.: 31) (Figura 4E), pCAG-ArtTal1-Sbfl (sec. con núm. de ident.: 32) (Figura 4F), pCAG-ArtTal1-Sdal (sec. con núm. de ident.: 33) (Figura 4g ), pCAG-ArtTal1-Stsl (sec. con núm. de ident.: 34) (Figura 4h ), y pCAG-ArtTal1-Fokl (sec. con núm. de ident.: 35) (Figura 4I). Estos vectores de expresión codifican para las proteínas de fusión-TAL designadas como ArtTal1-Alwl (sec. con núm. de ident.: 36), ArtTal1-CleDORF (sec. con núm. de ident.: 37), ArtTal1-Clo051 (sec. con núm. de ident.: 38), ArtTal1-Mlyl (sec. con núm. de ident.: 39), ArtTal1-Pept071 (sec. con núm. de ident.: 40), ArtTal1-Sbfl (sec. con núm. de ident.: 41), ArtTal1-Sdal (sec. con núm. de ident.: 42), ArtTal1-Stsl (sec. con núm. de ident.: 43), y ArtTal1-Fokl (sec. con núm. de ident.: 44).
Construcción de plásmidos reporteros de nucleasa TAL
Para determinar la actividad y la especificidad del dominio nucleasa TAL de las proteínas de fusión en células de mamíferos, construimos plásmidos reporteros de nucleasa TAL que contienen dos copias de una secuencia diana de ADN TAL en orientación inversa, separadas por una región espaciadora de 15 nucleótidos (Figuras 7a-d). Esta configuración permite medir la actividad de un solo tipo de nucleasa TAL que interacciona como un homodímero de dos moléculas de proteínas que se unen al par inverso de las secuencias diana del plásmido reportero. Después de la unión al ADN y la interacción de dos dominios nucleasas, el ADN del plásmido reportero se escinde dentro de la región espaciadora de 15 pb y exhibe una rotura de doble hebra.
Los plásmidos reporteros de nucleasa TAL contienen una región promotora de CMV, una secuencia de 400 pb que codifica el segmento N-terminal de p-galactosidasa y un codón de parada. Esta unidad es seguida por la región diana de nucleasa TAL (que consiste en dos secuencias de reconocimiento de orientación inversa separadas por una región espaciadora de 15 pb) para las proteínas de fusión ArtTal1 en el plásmido reportero ArtTal1 (sec. con núm. de ident.: 45)(Figura. 7 a), por la secuencia diana no relacionada TalRab1 en el plásmido reportero TalRab1 (sec. con núm. de ident.: 46) (Figura 7 b), por la región diana para las proteínas de fusión TalRab2 en el plásmido reportero TalRab2 (sec. con núm. de ident.: 47) (Figura 8 c ), o una región diana híbrida que contiene una copia de las secuencias de reconocimiento ArtTal1 y TalRab2 en el plásmido reportero ArtTal1/TalRab2 (sec. con núm. de ident.: 48) (Figura 8 d ).
Dentro de estos plásmidos reporteros, las regiones diana de nucleasa TAL están seguidas por la región codificante completa de la p-galactosidasa y una señal de poliadenilación (pA). Para evaluar la actividad nucleasa contra la secuencia diana específica, un vector de expresión de nucleasa (Figura 4) se cotransfectó transitoriamente con su correspondiente plásmido reportero en células de mamíferos. Después de la expresión de la proteína nucleasa TAL, el plásmido reportero se abre mediante una rotura de doble hebra inducida por la nucleasa dentro de la secuencia diana de la nucleasa TAL (Figura 7 A ). Las regiones de ADN adyacentes a la rotura de doble hebra son idénticas en 400 pb y pueden alinearse y recombinarse mediante la recombinación homóloga del proceso de reparación del ADN (Figura 7 B). La recombinación homóloga de un plásmido reportero abierto resultará posteriormente en una región codificante de p-galactosidasa funcional transcrita a partir del promotor de CMV que conduce a la producción de la proteína p-galactosidasa (Figura 7 C). En los lisados de las células transfectadas, puede determinarse la actividad enzimática de la p-galactosidasa mediante quimioluminiscencia y referir la actividad nucleasa de las proteínas de fusión TAL.
Medición de la actividad y especificidad de la Nucleasa-TAL en células 293 humanas
Para determinar la actividad y especificidad de las nucleasas TAL en células de mamíferos, electroporamos un millón de células HEK 293 (ATCC #CRL-1573) (Graham FL, Smiley J, Russell WC, Nairn R., J. Gen. Virol. 36, 59-74, 1977) con 5 |jg de ADN plasmídico de uno de los vectores de expresión de Nucleasa TAL (Figura 4) junto con 5 |jg de uno de los plásmidos reporteros de Nucleasa TAL (Figura 7). Además, cada muestra recibió 5 jg del plásmido de expresión de luciferasa de luciérnaga pCMV-hLuc (sec. con núm. de ident.: 49) y se ajustó a una cantidad total de ADN de 20 jg con el ADN plasmídico pBluescript (pBS) (sec. con núm. de ident.: 50). Después de la transfección, las células se sembraron por triplicado en pocillos de una placa de cultivo de tejidos de 6 pocillos y se cultivaron durante dos días antes de comenzar el análisis. Para el análisis, las células transfectadas de cada pocillo se lisaron y se determinaron individualmente las actividades de las enzimas p-galactosidasa y luciferasa de los lisados mediante el uso de los ensayos reporteros quimioluminiscentes de acuerdo con las instrucciones del fabricante (Roche Applied Science, Alemania) en un luminómetro (Berthold Centro LB 960). Como control positivo transfectamos 5 jg del plásmido de expresión de pgalactosidasa pCMVp (sec. con núm. de ident.: 51) con 15 jg de pBS, como control negativo se transfectaron 5 jg de pCMV-hLuc con 15 jg de pBS o 5 jg de pCMV-hLuc junto con 5 jg de un plásmido reportero de nucleasa TAL y 10 jg de pBS. Los valores de p-galactosidasa por triplicado de cada muestra se normalizaron en relación con los niveles de actividad de luciferasa y el valor medio y la desviación estándar de la actividad de p-galactosidasa se calcularon y expresaron en comparación con el control positivo pCMVp. En este tipo de ensayo de recombinación, el nivel de emisión de luz catalizada por la p-galactosidasa refleja la escisión y reparación de los plásmidos reporteros y, de esta manera, indica la actividad de las nucleasas TAL.
Como se muestra en la Figura 8 la transfección del plásmido reportero ArtTal1 solo resultó en niveles de fondo de pgalactosidasa. La cotransfección del plásmido reportero ArtTal1 con los vectores de expresión pCAG-ArtTal1-Alwl, -CleDORF, -Mlyl, -Pept071, -Sbfl, -Sdal, y -Stsl no revelaron ninguna actividad nucleasa significativa de las proteínas de fusión que codifican TAL (Figura 8), lo que indica que los dominios nucleasas seleccionados son incapaces de operar en combinación con los elementos TAL de unión al a Dn . En contraste, la cotransfección del plásmido reportero ArtTal1 con los vectores de expresión pCAG-ArtTal1-Clo051 (Figura 8A) y - Fokl (Figura 8B) resultó en un aumento significativo de la actividad reportera, lo que indica que los dominios de proteínas seleccionados Fokl y Clo051 son capaces de funcionar como nucleasas en fusión con los elementos TAL de unión al ADN.
Dado que en ensayos repetidos, las fusiones de TAL con el dominio Clo051 parecía más activo en comparación a las fusiones con el dominio nucleasa de Fokl, creemos que el dominio Clo051 es el más adecuado para la construcción de Nucleasas TAL altamente activas.
Para definir si la nucleasa ArtTal1-Clo051 reconoce específicamente su secuencia diana dentro del plásmido reportero ArtTal1 (Figura 7a), el pCAG-ArtTal1-Clo051 se cotransfectó con el correspondiente plásmido reportero ArtTal1 o con los plásmidos reporteros no relacionados TalRab1 o TalRab2 (Figura 7b,c) en células HEK 293. Como se muestra en la Figura 9 se detectó actividad reportera aumentada significativamente solamente a partir de la combinación específica de la nucleasa ArtTal-Clo051 con su correspondiente promotor, mientras que la cotransfección con plásmidos reporteros no relacionados no exhibe actividad nucleasa significativa. Estos resultados indican que el dominio nucleasa Clo051 en fusión con los elementos TAL de unión al ADN actúa en una secuencia diana de manera específica y que las secuencias diana no relacionadas no se procesan.
A continuación, caracterizamos si el dominio nucleasa Clo051, como un monómero, induce roturas de doble hebra recombinogénicas o si es necesario la interacción de dos dominios nucleasa como un dímero. Para este propósito, construimos el plásmido reportero híbrido ArtTal1/TalRab2-reportero (sec. con núm. de ident.: 48) (Figura 7d) que contiene una secuencia de reconocimiento ArtTal1 en el extremo 5' de la región espaciadora y una secuencia de reconocimiento TalRab2 en el extremo 3' de la región espaciadora. El arreglo TalRab2 (sec. con núm. de ident.: 8) está compuesto por 14 elementos TAL que reconocen la secuencia diana 5'-GGTGGCCCGGTAGT-3'. El dominio nucleasa Clo051 se clonó como una región codificante sintética en los sitios Pmel y Mlul del plásmido pCAG-TalRab2-nucleasa (sec. con núm. de ident.: 9) para derivar el vector de expresión pCAG-TalRab2-Clo051 (sec. con núm. de ident.: 52) para la expresión de la proteína TalRab2-Clo051 (sec. con núm. de ident.: 53). Como se muestra en la Figura 10A la cotransfección de pCAG-ArtTal1-Clo051 junto con el plásmido reportero ArtTal1 resultó en una expresión génica significativa del reportero, lo que indica la actividad nucleasa específica de la proteína de fusión ArtTal1-Clo051. Dado que los plásmidos reporteros ArtTal1 contienen dos secuencias de unión ArtTal1 inversas, la actividad nucleasa de ArtTal1-Clo051 puede resultar a partir de la acción de una proteína de fusión única o de la acción combinada de dos moléculas. Para distinguir entre estas posibilidades el pCAGArtTal1-Clo051 se cotransfectó con el plásmido reportero ArtTal1/TalRab2 que contiene solamente una secuencia de unión ArtTal1. Como se muestra en la Figura 10A la nucleasa ArtTal1-Clo051 no exhibe actividad nucleasa significativa sobre el reportero ArtTal1/TalRab2, lo que indica que para inducir una rotura en la doble hebra de ADN los dos dominios nucleasa Clo051 deben interaccionar como un dímero. Estos resultados se confirmaron con la nucleasa TalRab2-Clo051 que actúa sobre su correspondiente plásmido reportero TalRab2 pero no sobre el plásmido reportero híbrido ArtTal1/TalRab2 (Figura 10A). Como se esperaba, la proteína de fusión ArtTal1-Fokl igualmente no exhibe actividad nucleasa sobre el reportero ArtTal1/TalRab2 (Figura 10B).
A continuación, estudiamos si dos dominios nucleasa Clo051, que se fusionan a diferentes arreglos de los elementos TAL de unión al ADN, son capaces, además, de interaccionar e inducir roturas en la doble hebra. Para este propósito, los vectores de expresión pCAG-ArtTal1-Clo051 y pCAG-TalRab2-Clo051 se cotransfectaron junto con el plásmido reportero ArtTal1/TalRab2 y los resultados se compararon con la cotransfección del pCAG-ArtTal1-Clo051 junto con el reportero ArtTal1/TalRab2. Como se muestra en la Figura 10B, la actividad nucleasa significativa sobre el reportero ArtTal1/TalRab2 se desarrolló solamente mediante la coexpresión de las nucleasas ArtTall- y TalRab2-Clo051, lo que indica que los dominios nucleasa Clo051 fusionados con diferentes arreglos de TAL son capaces de interaccionar e inducir una rotura en la doble hebra del ADN dentro de una región diana híbrida que contiene las secuencias de reconocimiento de dos arreglos TAL de unión al ADN distinguidos.
Ejemplo 2: Transformación del gen de ratón Rab38 en células ES y cigotos con nucleasas TAL-Clo051
Construcción de nucleasas TAL-Clo051 específicas de Rab38 y un vector de transformación
Para demostrar la funcionalidad de las proteínas de fusión nucleasa-dominio efector TAL de unión al ADN en células de mamíferos diseñamos un par de proteínas de fusión que reconocen una secuencia diana de ADN dentro del gen de ratón Rab38 (Figura 11). Las dos proteínas de fusión nucleasa-dominio efector TAL de unión al ADN son destinadas a unirse junto a la región del ADN diana bipartita e inducir una rotura en la doble hebra en la región espaciadora para estimular la recombinación homóloga en el locus diana en células de mamíferos.
El gen de ratón Rab38 codifica la proteína RAB38 que es un miembro de una familia de proteínas conocidas por tener un papel crucial en el transporte vesicular. En ratones mutantes chocolate (cht) el intercambio de un solo nucleótido en la posición 146 (mutación G > T) dentro del primer exón de Rab38 conduce al reemplazo de glicina por valina en el codón 19 (Loftus, S.K., y otros, Proc Natl Acad Sci USA, 2002. 99(7): p. 4471-6). Este reemplazo de aminoácido se ubica dentro del dominio de unión a GTP conservado de RAB38 y afecta la clasificación de la proteína relacionada con la tirosinasa 1 (TYRP1) en los melanosomas de los melanocitos Rab38cht/Rab38cht. La TYRP1 es una glicoproteína de membrana melanosomal, que funciona como una enzima oxidasa 5,6-Dihidroxiindol-2-ácido carbónico para producir melanina y como un proveedor de estabilidad estructural para la tirosinasa en el complejo enzimático melanogénico. Se cree que TYRP1 transita desde la red trans-Golgi hasta los melanosomas en etapa II por medio de vesículas recubiertas de clatrina. La cantidad reducida de TYRP1 ubicada correctamente conduce a un deterioro de la producción de pigmento y al cambio del color del pelaje, de negro a marrón similar al chocolate, en ratones Rab38cht/Rab38cht. Dado que se conoce que las mutaciones de los genes necesarios para la función de los melanocitos causan el albinismo oculocutáneo (OCD), tal como el síndrome de Hermansky-Pudlak en el hombre, el gen Rab38 es un locus candidato en los pacientes con OCD.
Nos propusimos introducir una fenocopia de la mutación chocolate en el codón 19 de Rab38 mediante el uso de un par de nucleasas TAL (RabChtTal1- y RabChtTal2-Clo051) que cada una reconoce una secuencia diana de 14 pb ubicada en el extremo 5' y en el extremo 3' de una secuencia espaciadora de 15 pb dentro del exón 1 del gen Rab38 (Figura 11). Para derivar los vectores de expresión para las nucleasas sintéticas RabChtTal1 y RabChtTal2-Clo051, las regiones codificantes sintéticas para los dominios de unión al ADN RabChtTal1 y RabChtTal2 compuestos de 14 elementos TAL y el dominio nucleasa Clo051 se insertaron en el vector pCAG-TAL-nucleasa. El plásmido resultante pCAG-RabChtTal1-Clo051 (sec. con núm. de ident.: 54) codifica la proteína de fusión RabChtTal1-Clo051 (sec. con núm. de ident.: 55), y el plásmido pCAG-RabChtTal2-Clo051 (sec. con núm. de ident.: 56) codifica la proteína de fusión RabChtTal2-Clo051 (sec. con núm. de ident.: 57).
Para la modificación del gen Rab38 mediante recombinación homóloga en ovocitos fecundados, construimos el vector de transformación génica pRab38-chtTAL (Figura 12) (sec. con núm. de ident.: 58), que comprende dos regiones de homología que abarcan 942 y 2788 pb de la secuencia genómica que flanquean el exón 1 del gen de ratón Rab38 (sec. con núm. de ident.: 59). Para este propósito, los vectores con los brazos de homología 5' y 3' se amplificaron a partir del clon genómico BAC, RPCI-421G2 (derivado a partir del genoma de C57BL/6J, Imagenes GmbH, Berlín), mediante el uso de cebadores específicos de PCR. Dentro de la secuencia del codón 19, introdujimos dos cambios de nucleótidos que modifican el codón 19 de la secuencia de tipo silvestre GGT, que codifica para glicina, en GTA, que codifica para valina. Esta nueva mutación chocolate puede distinguirse de la mutación chocolate de origen natural, que exhibe un solo intercambio de nucleótidos dentro del codón 19 (GTT) que codifica para valina (Loftus, S.K., y otros, Proc Natl Acad Sci U S A , 2002. 99(7): p. 4471-6). Ambos alelos mutantes chocolate pueden distinguirse adicionalmente del alelo de tipo silvestre mediante análisis de restricción, ya que las mutaciones en el codón 19 eliminan un sitio de reconocimiento para la endonucleasa de restricción BsaJI (Figura 12). La región de reconocimiento de las nucleasas TAL se ubica en el extremo 3' del codón 19 (Figura 11). Para la construcción de la región de homología 3' del vector de transformación, cada secuencia de reconocimiento de 14 pb de la proteína de fusión TAL se modificó adicionalmente mediante la introducción de cambios de nucleótidos silentes que no alteran la secuencia de la proteína RAB38 (Figura 12), para evitar el procesamiento potencial del vector de transformación por las nucleasas TAL específicas de Rab38.
Para la modificación del gen Rab38 mediante recombinación homóloga en células ES de ratón, modificamos el vector de transformación génica pRab38-chtTAL (Figura 12) mediante la inserción de un gen de resistencia a neomicina, como un marcador de selección, en la región espaciadora de la región de reconocimiento de la nucleasa-TAL, para derivar el vector de transformación pRab38-chtTAL-neo (sec. con núm. de ident.: 60).
Transformación del gen Rab38 en células ES y cigotos
Para demostrar la utilidad de las proteínas RabChtTal1- y RabChtTal2-Clo051 para la transformación génica en células de mamíferos (Figura 3) introdujimos los vectores de expresión o el ARNm codificante de las proteínas junto con el vector de transformación pRab38-chtTAL-neo en células ES de ratón o con el vector pRab38-chtTAL en ovocitos fecundados de ratón.
Para la transformación en células ES transfectamos las células ES IDG3.2 (Hitz, C. y otros Nucleic Acids Res. 35, e90, 2007) con el vector de transformación linealizado pRab38-chtTAL-neo junto con, o sin, los plásmidos de expresión de nucleasa TAL pCAG-RabChtTal1- y pCAG-RabChtTal2-Clo051. La transfección, selección, expansión y genotipificación de los clones de células ES resistentes a neomicina se realizó de acuerdo con los procedimientos estándar de detección de genes diana como se describió (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003. Manipulating the Mouse Embryo. Cold Spring Harbour, New York: Cold Spring Harbour Laboratory Press). El análisis de los clones de células ES resistentes reveló que la expresión de las nucleasas TAL conduce a una tasa significativamente aumentada de recombinación homóloga en el gen Rab38 en células ES. Para la microinyección en ovocitos de ratón fecundados, el vector de ADN circular pRab38-chtTAL se mezcló in vitro con el transcrito de ARNm codificante de las proteínas RabChtTal1- y RabChtTal2-Clo051 en el tampón de inyección como se describió (Meyer, M., y otros, Proc Natl Acad Sci U S A . 107(34): p. 15022-6). El ARNm de TAL-nucleasa se prepara a partir de los plásmidos de expresión linealizados pCAG-RabChtTAl1- y pCAG-RabChtTal2-Clo051
Mediante la transcripción in vitro a partir del promotor T7 mediante el uso del kit mMessage mMachine (Ambion) de acuerdo con las instrucciones del fabricante. El ARNm se modificó adicionalmente mediante la adición de una cola de poli-A mediante el uso del kit de adición de Poli(A) y se purificó con las columnas MegaClear de Ambion. Finalmente, el ARNm se precipitó y disolvió en tampón de inyección.
Para aislar los ovocitos fecundados, los machos de la cepa C57BL/6 se aparean con hembras superovuladas de la cepa FVB. Para inducir la superovulación las hembras FVB de tres semanas de edad, 2 días antes del apareamiento, se trataron con suero de yeguas preñadas 2.5 IU (PMS), y con gonadotropina coriónica humana 2.5 IU (hCG) el día del apareamiento. Los ovocitos fecundados se aislaron de los oviductos de las hembras con tapón positivo y se microinyectaron en medio M2 (Sigma-Aldrich Inc Núm. Cat. M7167) con el ARNm de nucleasa TAL y la preparación del vector de transformación pRab38-chtTAL, en uno de los pronúcleos y el citoplasma de acuerdo con los procedimientos estándar (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003. Manipulating the Mouse Embryo. Cold Spring Harbour, New York: Cold Spring Harbour Laboratory Press).
Después de la microinyección, los ARNm de nucleasa TAL se traducen en proteínas que inducen una rotura de doble hebra en uno o en ambos alelos de Rab38 en una o más células del embrión en desarrollo. Este evento estimula la recombinación del vector de transformación pRab38-chtTAL con un alelo Rab38 a través de las regiones de homología presentes en el vector y conduce a la inserción en un sitio específico del codón mutante 19 en el genoma, lo que resulta en un alelo Rab38Fht portador de la mutación chocolate (Figura 12). Los cigotos microinyectados se transfirieron a hembras pseudopreñadas para permitir su desarrollo ulterior en ratones vivos (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003. Manipulating the Mouse Embryo. Cold Spring Harbour, New York: Cold Spring Harbour Laboratory Press). A partir de la descendencia resultante, se extrajo ADN genómico de las puntas de la cola para analizar la presencia del evento de recombinación homóloga deseado en el locus Rab38 mediante PCR. Este análisis se realizó mediante la amplificación por PCR de la región genómica que abarca el exón 1. La presencia de un alelo Rab38cht puede reconocerse después de la digestión de los productos del PCR con BsaJI, ya que la mutación Rab38cht en el codón 19 conduce a la eliminación de un sitio de restricción BsaJI que está presente en la secuencia de tipo silvestre.
En un experimento de este tipo, se analizaron ratones derivados de cigotos microinyectados mediante un ensayo de PCR de Rab38. Entre este grupo, la mayoría de los ratones exhibieron los dos alelos del genotipo normal Rab38 de tipo silvestre, mientras que algunos individuos albergaban un alelo de la mutación chocolate Rab38 prediseñada, como lo indica la ausencia del sitio de restricción BsaJI en el exón 1.
En conjunto, fue posible introducir una modificación prediseñada en la región codificante del gen Rab38 mediante recombinación homóloga asistida por la nucleasa TAL-Clo051 en células ES de ratón y ovocitos fecundados.
Ejemplo 3: Aislamiento de mutantes hiperactivos de nucleasa Clo051.
Como se muestra en la Figura 13 la secuencia primaria del dominio nucleasa Clo051 entre las posiciones E389 e Y587 exhibe una distribución única de residuos de arginina (R) y lisina (K) cargados positivamente y de residuos de glutamato (E) y aspartato (D) cargados negativamente. Estos residuos componen un panorama tridimensional de cargas dentro del dominio Clo051 que determina la estructura terciaria única de esta nucleasa, como se muestra en el modelo estructural en la Figura 6. Determinados reemplazos de residuos polares versus no polares o de residuos no polares contra residuos polares, por ejemplo en las posiciones 423 y 446, alteran la estructura tridimensional de la cadena proteica y puede resultar en un aumento de la actividad nucleasa.
Tales reemplazos de aminoácidos pueden realizarse mediante ensayos de prueba y error o pueden seguir hipótesis específicas sobre el impacto estructural y funcional en el dominio nucleasa de Clo051. Alternativamente, un gran número de variantes mutagenizadas aleatoriamente de la región codificante del dominio nucleasa Clo051 pueden ensamblarse en una biblioteca mediante PCR mutagénica. Esta biblioteca de moléculas mutantes puede analizarse para detectar la presencia de variantes de nucleasa hiperactiva mediante un ensayo de selección fenotípica en células de levadura, de mamíferos o en E. coli que se acopla a una lectura de nucleasa funcional, por ejemplo, como se describió para la mejora de la recombinasa FLP (Buchholz y otros, Nat. Biotechnol. 16, 657-62, 1998).

Claims (15)

REIVINDICACIONES
1. Una molécula de ácido nucleico que codifica
(I) un polipéptido que tiene la actividad de una endonucleasa, que es
(a) una molécula de ácido nucleico que codifica un polipéptido que comprende la secuencia de aminoácidos de la sec. con núm. de ident.:1;
(b) una molécula de ácido nucleico que comprende la secuencia de nucleótidos de la sec. con núm. de ident.: 2;
(c) una molécula de ácido nucleico que codifica una endonucleasa, cuya secuencia de aminoácidos es al menos 70 % idéntica a la secuencia de aminoácidos de la sec. con núm. de ident.:1;
(d) una molécula de ácido nucleico que comprende una secuencia de nucleótidos que es al menos 50 % idéntica a la secuencia de nucleótidos de la sec. con núm. de ident.: 2;
(e) una molécula de ácido nucleico que es degenerada con respecto a la molécula de ácido nucleico de (d); o
(f) una molécula de ácido nucleico correspondiente a la molécula de ácido nucleico de cualquiera de (a) hasta (e) en donde T se reemplaza por U;
(II) un fragmento del polipéptido de (I) que tiene la actividad de una endonucleasa.
2. La molécula de ácido nucleico de la reivindicación 1, en donde en (I)(c) en dicha secuencia de aminoácidos que tiene al menos 70 % de identidad de secuencia con respecto a la sec. con núm. de ident.: 1 los residuos de aminoácidos P66, D67, D84 y/o K86 de la sec. con núm. de ident.: 1 no están modificados.
3. La molécula de ácido nucleico de la reivindicación 1 o 2 que codifica, además, un dominio de unión al ADN.
4. La molécula de ácido nucleico de la reivindicación 3, en donde el dominio de unión al ADN es un motivo efector TAL de una proteína efectora TAL.
5. Un vector que comprende la molécula de ácido nucleico de una cualquiera de las reivindicaciones 1 a 4.
6. Una célula huésped que comprende la molécula de ácido nucleico de una cualquiera de las reivindicaciones 3, 4 o el vector de conformidad con la reivindicación 5.
7. Una proteína o proteína de fusión que tiene la actividad de una endonucleasa en donde dicha proteína o proteína de fusión está codificada por la molécula de ácido nucleico de una cualquiera de las reivindicaciones 1 a 4 o el vector de la reivindicación 5.
8. Un método para la modificación in vitro de una secuencia diana en el genoma de una célula eucariótica, comprendiendo el método la etapa:
(a) introducir en dicha célula la molécula de ácido nucleico de una cualquiera de las reivindicaciones 3 a 4, el vector de la reivindicación 5 o la proteína o proteína de fusión de la reivindicación 7.
9. El método de la reivindicación 8, en donde la modificación de dicha secuencia diana es mediante recombinación homóloga con una secuencia de ácido nucleico donante, que comprende, además, la etapa:
(b) introducir una molécula de ácido nucleico en dicha célula, en donde dicha molécula de ácido nucleico comprende dicha secuencia de ácido nucleico donante, en donde dicha secuencia de ADN donante está flanqueada en el extremo 5' por un primer elemento flanqueante y en el extremo 3' por un segundo elemento flanqueante, en donde dicho primer y segundo elementos flanqueantes son diferentes y en donde cada uno de dichos primer y segundo elementos flanqueantes son homólogos a una secuencia de ADN continua sobre ambos lados de la doble hebra introducidas en (a) de conformidad con la reivindicación 8 dentro de dicha secuencia diana en el genoma de dicha célula eucariótica.
10. El método de las reivindicaciones 8 o 9, en donde dicha célula se analiza para determinar la modificación exitosa de dicha secuencia diana en el genoma.
11. El método de una cualquiera de las reivindicaciones 8 a 10, en donde la célula se selecciona a partir del grupo que consiste en una célula de mamífero o vertebrado, una célula vegetal o una célula de hongo.
12. El método de una cualquiera de las reivindicaciones 8 a 11, en donde la célula es un ovocito no humano.
13. Un método para producir un vertebrado no humano o un mamífero no humano que porta una secuencia diana modificada en su genoma; el método que comprende producir una célula no humana de acuerdo con el método de una cualquiera de las reivindicaciones 9 a 12.
14. El método de una cualquiera de las reivindicaciones 8 a 13, en donde la célula se selecciona a partir del grupo que consiste en roedores, perros, félidos, primates, conejos, cerdos, vacas, pollos, pavos, faisanes, patos, gansos, codornices, avestruz, emúes, casuarios y pez cebra.
15. Un método para producir la proteína o proteína de fusión de la reivindicación 7 que comprende las etapas: (a) cultivar la célula huésped de la reivindicación 6 y (b) aislar la proteína o proteína de fusión que se produce.
ES18181129T 2011-06-07 2012-06-06 Proteínas que tienen actividad nucleasa, proteínas de fusión y usos de estas Active ES2784005T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP11004635 2011-06-07

Publications (1)

Publication Number Publication Date
ES2784005T3 true ES2784005T3 (es) 2020-09-21

Family

ID=44541489

Family Applications (2)

Application Number Title Priority Date Filing Date
ES18181129T Active ES2784005T3 (es) 2011-06-07 2012-06-06 Proteínas que tienen actividad nucleasa, proteínas de fusión y usos de estas
ES12725813T Active ES2709216T3 (es) 2011-06-07 2012-06-06 Proteínas que tienen actividad nucleasa, proteínas de fusión y usos de estas

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES12725813T Active ES2709216T3 (es) 2011-06-07 2012-06-06 Proteínas que tienen actividad nucleasa, proteínas de fusión y usos de estas

Country Status (6)

Country Link
US (4) US9410134B2 (es)
EP (2) EP3434775B1 (es)
DK (2) DK3434775T3 (es)
ES (2) ES2784005T3 (es)
PT (2) PT2718440T (es)
WO (1) WO2012168304A1 (es)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9528124B2 (en) 2013-08-27 2016-12-27 Recombinetics, Inc. Efficient non-meiotic allele introgression
US10920242B2 (en) 2011-02-25 2021-02-16 Recombinetics, Inc. Non-meiotic allele introgression
DK3434775T3 (da) * 2011-06-07 2020-04-06 Helmholtz Zentrum Muenchen Deutsches Forschungszentrum Gesundheit & Umwelt Gmbh Protein med nukleaseaktivitet, fusionsproteiner og anvendelser deraf
US10058078B2 (en) 2012-07-31 2018-08-28 Recombinetics, Inc. Production of FMDV-resistant livestock by allele substitution
JP6502259B2 (ja) 2012-11-16 2019-04-17 トランスポサジェン バイオファーマシューティカルズ, インコーポレイテッド 部位特異的酵素および使用方法
EP2796558A1 (en) * 2013-04-23 2014-10-29 Rheinische Friedrich-Wilhelms-Universität Bonn Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants
US10779518B2 (en) 2013-10-25 2020-09-22 Livestock Improvement Corporation Limited Genetic markers and uses therefor
AU2015277180A1 (en) * 2014-06-17 2017-01-12 Poseida Therapeutics, Inc. A method for directing proteins to specific loci in the genome and uses thereof
US20170114149A1 (en) * 2014-06-17 2017-04-27 Poseida Therapeutics, Inc. Methods and compositions for in vivo non-covalent linking
EP3310909B1 (en) * 2015-06-17 2021-06-09 Poseida Therapeutics, Inc. Compositions and methods for directing proteins to specific loci in the genome
US20190119636A1 (en) 2017-10-23 2019-04-25 Poseida Therapeutics, Inc. Modified stem cell memory t cells, methods of making and methods of using same
US10329543B2 (en) 2017-10-23 2019-06-25 Poseida Therapeutics, Inc. Modified stem cell memory T cells, methods of making and methods of using same
WO2019126578A1 (en) * 2017-12-20 2019-06-27 Poseida Therapeutics, Inc. Compositions and methods for directing proteins to specific loci in the genome
EP3814370A4 (en) * 2018-06-27 2022-06-22 Altius Institute For Biomedical Sciences NUCLEASES FOR GENOMIC EDITING
US20210332339A1 (en) 2018-08-27 2021-10-28 Hiroshima University Novel nuclease domain and use thereof
JP7216877B2 (ja) * 2018-10-29 2023-02-02 中国▲農▼▲業▼大学 新規なCRISPR/Cas12f酵素およびシステム
WO2024007010A2 (en) * 2022-06-30 2024-01-04 Demeetra Agbio, Inc. Gene editing compositions and methods of use thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3434775T3 (da) * 2011-06-07 2020-04-06 Helmholtz Zentrum Muenchen Deutsches Forschungszentrum Gesundheit & Umwelt Gmbh Protein med nukleaseaktivitet, fusionsproteiner og anvendelser deraf

Also Published As

Publication number Publication date
EP3434775A1 (en) 2019-01-30
EP2718440A1 (en) 2014-04-16
ES2709216T3 (es) 2019-04-15
EP3434775B1 (en) 2020-03-18
DK2718440T3 (en) 2019-02-04
PT2718440T (pt) 2019-02-06
US11149289B2 (en) 2021-10-19
US20180237802A1 (en) 2018-08-23
DK3434775T3 (da) 2020-04-06
US20170175141A1 (en) 2017-06-22
US20220002757A1 (en) 2022-01-06
EP2718440B1 (en) 2018-10-10
PT3434775T (pt) 2020-04-08
US20140298505A1 (en) 2014-10-02
US9410134B2 (en) 2016-08-09
WO2012168304A1 (en) 2012-12-13

Similar Documents

Publication Publication Date Title
ES2784005T3 (es) Proteínas que tienen actividad nucleasa, proteínas de fusión y usos de estas
AU2011263855B2 (en) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
ES2901074T3 (es) Métodos y composiciones para modificaciones genéticas objetivo y métodos de uso
CN102625655B (zh) 使用锌指核酸酶在大鼠中进行基因组编辑
JP5320546B2 (ja) Tol1因子のトランスポザーゼ及びそれを用いたDNA導入システム
US20110023148A1 (en) Genome editing of addiction-related genes in animals
US20110023151A1 (en) Genome editing of abc transporters
US20120030778A1 (en) Genomic editing of genes involved with parkinsons disease
US11730150B2 (en) Fibrillin-1 mutations for modeling neonatal progeroid syndrome with congenital lipodystrophy
JPWO2018097257A1 (ja) ゲノム編集方法
Chen et al. Generation of obese rat model by transcription activator-like effector nucleases targeting the leptin receptor gene
ES2911249T3 (es) Animales no humanos que comprenden una mutación de slc30a8 y métodos de uso
KR20130069188A (ko) 마이오스타틴을 표적으로 하는 징크 핑거 뉴클레아제 및 이의 용도
WO2005080574A1 (en) Transgenic mouse model and method for evaluating glucocerebrosidase deficiencies
CA2394827A1 (en) Resolvase-catalysed, sequence-specific dna-recombination in eukaryotic cells