ES2709216T3

ES2709216T3 - Proteínas que tienen actividad nucleasa, proteínas de fusión y usos de estas

Info

Publication number: ES2709216T3
Application number: ES12725813T
Authority: ES
Inventors: Ralf Kühn
Original assignee: Helmholtz Zentrum Muenchen Deutsches Forschungszentrum fuer Gesundheit und Umwelt GmbH
Current assignee: Helmholtz Zentrum Muenchen Deutsches Forschungszentrum fuer Gesundheit und Umwelt GmbH
Priority date: 2011-06-07
Filing date: 2012-06-06
Publication date: 2019-04-15
Anticipated expiration: 2032-06-06
Also published as: ES2784005T3; PT3434775T; PT2718440T; WO2012168304A1; DK3434775T3; DK2718440T3; EP3434775A1; US20180237802A1; EP2718440B1; US11149289B2; EP3434775B1; US20220002757A1; US20170175141A1; EP2718440A1; US9410134B2; US20140298505A1

Abstract

Una molécula de ácido nucleico que codifica (I) un polipéptido que tiene la actividad de una endonucleasa, que es (a) una molécula de ácido nucleico que codifica un polipéptido que consiste en la secuencia de aminoácidos de la sec. con núm. de ident.:1; (b) una molécula de ácido nucleico que consiste en la secuencia de nucleótidos de la sec. con núm. de ident.: 2; (c) una molécula de ácido nucleico que codifica una endonucleasa, cuya secuencia de aminoácidos es al menos 70 % idéntica a la secuencia de aminoácidos de la sec. con núm. de ident.:1; (d) una molécula de ácido nucleico que consiste en una secuencia de nucleótidos que es al menos 50 % idéntica a la secuencia de nucleótidos de la sec. con núm. de ident.: 2; (e) una molécula de ácido nucleico que es degenerada con respecto a la molécula de ácido nucleico de (d); o (f) una molécula de ácido nucleico correspondiente a la molécula de ácido nucleico de cualquiera de (a) hasta (e) en donde T se reemplaza por U; (II) un fragmento del polipéptido de (I) que tiene la actividad de una endonucleasa.

Description

DESCRIPCION

Protemas quetienen actividad nucleasa, protemas de fusion y usos de estas

La presente invencion se refiere a las modalidades como se caracterizaron en las reivindicaciones; espedficamente a una molecula de acido nucleico que codifica (I) un polipeptido que tiene la actividad de una endonucleasa, que es (a) una molecula de acido nucleico que codifica un polipeptido que consiste en la secuencia de aminoacidos de la sec. con num. de ident.: 1; (b) una molecula de acido nucleico que consiste en la secuencia de nucleotidos de la sec. con num. de ident.: 2; (c) una molecula de acido nucleico que codifica una endonucleasa, cuya secuencia de aminoacidos es al menos 70 % identica a la secuencia de aminoacidos de la sec. con num. de ident.: 1; (d) una molecula de acido nucleico que consiste en una secuencia de nucleotidos que es al menos 50 % identica a la secuencia de nucleotidos de la sec. con num. de ident.: 2; (e) una molecula de acido nucleico que es degenerada con respecto a la molecula de acido nucleico de (d); o (f) una molecula de acido nucleico correspondiente a la molecula de acido nucleico de cualquiera de (a) hasta (e) en donde T se reemplaza por U; (II) un fragmento del polipeptido de (I) que tiene la actividad de una endonucleasa. Ademas, la presente invencion se refiere a un vector que comprende la molecula de acido nucleico y una protema codificada por dicha molecula de acido nucleico. Ademas, la invencion se refiere a un metodo in vitro para modificar el genoma de una celula eucariotica y a un metodo para producir un vertebrado no humano o un mairnfero no humano.

En esta descripcion, se citan un numero de documentos que incluyen las solicitudes de patentes y las instrucciones de los fabricantes. La descripcion de esos documentos no se considera relevante para la patentabilidad de esta invencion.

Las nucleasas, desde su descubrimiento a finales de los anos 1960, permanecen como una de las herramientas mas importantes para los biologos moleculares. Las nucleasas son enzimas capaces de escindir los enlaces fosfodiester entre las subunidades de nucleotidos de los acidos nucleicos. Las enzimas que catalizan la escision del ADN y del ARN son partes integrales de los principales procesos metabolicos del ADN, tales como la replicacion del ADN, la recombinacion del ADN, la reparacion del ADN, la recombinacion en un sitio espedfico y el empalme del ARN. Ademas, las actividades nucleasas son esenciales en el procesamiento y la maduracion del ARN, en el ARN de interferencia y son componentes de los mecanismos de defensa microbiana.

El ARN y el ADN presentan solamente dos tipos de enlaces fosfodiester para la escision, 5'- o 3'- de un fosfato escindible y la qmmica fundamental es la sustitucion nucleofflica bimolecular. Sin embargo, las estructuras y los mecanismos catalfticos de las nucleasas de ARN y ADN son muy variados y complejos. Las nucleasas pueden ser endonucleasas o exonucleasas, espedficas del ADN o del ARN, topoisomerasas, recombinasas, ribozimas, o enzimas de empalme del ARN. Su reaccion puede dividirse en las tres etapas del ataque nucleofflico, la formacion de un intermedio pentacovalente cargado negativamente y la rotura del enlace escindible. Las nucleasas utilizan una variedad de nucleofilos para escindir un enlace fosfato escindible. Los nucleofilos mas comunes son las moleculas de agua desprotonadas por una base general para la hidrolisis directa. Para la escision del ADN, las cadenas laterales de Ser, Tir e His sirven como nucleofilos para formar un intermedio covalente de ADN fosforil-protema, que se resuelve posteriormente ya sea mediante la reaccion de transferencia del fosforilo nuevamente al ADN durante la recombinacion y topoisomerizacion, o mediante hidrolisis en reacciones de escision de dos etapas. Para permitir la degradacion controlada o el procesamiento del ADN o ARN celular, las actividades de las nucleasas se regulan estrictamente mediante una rigurosa especificidad de sustrato, localizacion confinada, o mediante inhibidores potentes.

Por conveniencia, las nucleasas pueden clasificarse de acuerdo con su mecanismo catalttico en tres clases principales basado en su dependencia de iones metalicos (Yang, W. (2011). Q. Rev. Biophys. 44(1): 1-93). Estas clases de nucleasas dependientes de dos iones metalicos, de un ion metalico e independientes de metales se dividen, ademas, en familias o superfamilias de acuerdo con la conservacion de la secuencia y la estructura y la diversidad funcional.

Endonucleasas de Restriccion

Entre todas las tres clases cataltticas se encuentran diversas familias de endonucleasas de restriccion. Las enzimas de restriccion de tipo I, III y IV son maquinarias moleculares complejas y de multiples subunidades que combinan multiples actividades que incluyen la restriccion, la metilacion y la translocacion de ADN, requieren cofactores adicionales (AdoMet, ATP o GTP), se unen a mas de un sitio diana, y escinden por fuera de la secuencia de reconocimiento, con frecuencia a una distancia aleatoria. Las endonucleasas de restriccion de tipo II son enzimas que reconocen secuencias cortas de ADN (generalmente de 4-8 pb de longitud) y escinden la diana en ambas hebras en, o muy cerca de, el sitio de reconocimiento. Las enzimas de restriccion tipo II ortodoxas son homodimericas, escinden dentro de secuencias palindromicas, requieren iones Mg2+ y pueden actuar sobre copias unicas de sus dianas. Debido a su especificidad notablemente alta para reconocer y escindir sus secuencias diana, son de gran interes como las herramientas mas frecuentemente usadas para la tecnologfa del ADN recombinante (Pingoud, A., M. Fuxreiter, y otros (2005). Cell Mol Life Sci 62(6): 685-707; Orlowski, J. y J. M. Bujnicki (2008). Nucleic Acids Res 36(11): 3552-69).

En la naturaleza, las REasastipo II (endonucleasas de restriccion) se encuentran en los organismos procarioticos, donde ellas forman sistemas de modificacion por restriccion con las ADN metiltransferasas de la misma o muy similar especificidad de sustrato. Las ADN metiltransferasas usan S-adenosilmetionina (AdoMet) como un donante del grupo metilo para modificar bases espedficas en la secuencia diana, de esta manera las vuelve resistente a la escision mediada por la enzima de restriccion. Mientras que el ADN del propio sistema de Restriccion-Modificacion se protege contra la autodegradacion por la nucleasa, cualquier ADN extrano (por ejemplo, de los fagos) que invade la celula huesped y que carece de metilacion, puede destruirse eficientemente. Para distinguir los componentes de los sistemas de modificacion/restriccion los nombres de las metilasas y nucleasas estan precedidos de los prefijos 'M'. y 'R.' (por ejemplo, M.Fokl y R.Fokl).

Muchas endonucleasas de restriccion detipo II usadas comunmente comparten el motivo conservado PD-(D/E)XK. Dicho motivo se encuentra, generalmente, en protemas que interaccionan con moleculas de acido nucleico tales como el ADN y no se limita a la presencia en nucleasas. Los tres residuos cataltticos se ubican cercanos entre sf en una horquilla p irregular. La primera D se ubica al inicio de la hebra primera y mas corta, y la E y la K, separadas por un residuo hidrofobo x, en el medio de la hebra segunda y mas larga. La primera D es la mas conservada y coordina ambos iones metalicos, mientras que la segunda E puede reemplazarse por Q, D, N, H o S, y la tercera K puede reemplazarse por E, Q, D, S, N o T. Mediante la variacion de las interfaces dimericas y, por lo tanto, de las posiciones relativas de los dos centros cataltticos, las endonucleasas dimericas pueden escindir el ADN para generar extremos romos o extremos escalonados con diversos salientes 5'- o 3'-. El modulo catalttico se aproxima invariablemente al ADN desde el lado del surco menor, y la union a la secuencia espedfica se realiza mediante un modulo/subdominio separado en el surco mayor. Los dos primeros carboxilatos del motivo DEK coordinan los iones metalicos. El tercero, que generalmente se une al hidrogeno, tanto con el agua nucleofila como con el modulo de union al ADN en el surco mayor, acopla el reconocimiento de la secuencia de ADN con la reaccion de escision. Los miembros de esta superfamilia tienen una secuencia primaria muy diversa y, por lo tanto, diferentes estructuras que rodean el nucleo catalftico. Las busquedas en bases de datos con secuencias de enzimas de restriccion, tfpicamente, no muestran similitud significativa con cualquier protema, o una similitud muy alta (> 90 % de identidad) con unos pocos isosquizomeros, y ninguna similitud con otras protemas. Esta distribucion fuertemente sesgada de similitudes y disimilitudes dificulto el analisis de secuencia comparativa de todas las enzimas de restriccion y planteo una interrogante acerca de si la diversidad de secuencias de aminoacidos de las endonucleasas de restriccion indica evolucion polifiletica (convergencia) o divergencia extrema de un ancestro comun.

Mientras que ~70 % de las endonucleasas de restriccion pertenecen a la superfamilia PD-(D/E)XK, otros miembros de la superfamilia pueden ser monomericos o tetramericos e involucrarse en otros procesos tales como la reparacion del ADN y la recombinacion homologa. Ademas de las endonucleasas, los miembros de esta superfamilia pueden ser, ademas, exonucleasas 5'- o 3'-. La fuente mas completa de informacion sobre enzimas de restriccion es la base de datos REBASE (http://rebase.neb.com) que enumera varios miles de enzimas caracterizadas funcionalmente y varios miles de enzimas putativas, deducidas a partir de comparaciones de secuencias o de analisis genomicos. Por lo tanto, existe una gran desproporcion entre el numero de secuencias conocidas o predichas y el numero pequeno de ~50 protemas caracterizadas experimentalmente con estructuras tridimensionales conocidas. En la actualidad, una gran fraccion de enzimas putativas permanece sin ninguna prediccion o dato experimental.

Las REasas tipo II se subdividen adicionalmente en numerosos tipos de acuerdo con la simetna de su sitio de reconocimiento, la organizacion estructural o la necesidad de cofactor. La mayona de las enzimas de restriccion usadas para el trabajo con el ADN recombinante pertenecen al Tipo IIP (P - palindromico). Las enzimas Tipo IIA reconocen secuencias asimetricas, como Bpu10I, un dfmero de subunidades no identicas, cada una de las cuales es responsable de la escision de una hebra del ADN. Las enzimas Tipo IIB escinden el ADN a ambos lados de la secuencia de reconocimiento, un ejemplo es Bpll que, en la hebra de arriba escinde 8 nucleotidos antes y 13 nucleotidos despues de la secuencia de reconocimiento, mientras que en la hebra de abajo escinde 13 nucleotidos antes y 8 nucleotidos despues de la secuencia de reconocimiento. Las enzimas Tipo IIC tienen dos dominios, uno de escision y otro de modificacion, dentro de un polipeptido. Las enzimas Tipo IIE, para una escision eficaz, necesitan interaccionar con dos copias de sus secuencias de reconocimiento, una es la copia diana para la escision, la otra copia sirve como un efector alosterico. Las enzimas Tipo IIE, como Nael, reconocen secuencias de nucleotidos palindromicas de una manera similar a las enzimas Tipo IIP y escinden el ADN dentro de los lfmites de sus sitios de reconocimiento; sin embargo, poseen un dominio de union al ADN separado para realizar una funcion alosterica. Las enzimas Tipo IIF tfpicamente, son endonucleasas de restriccion homotetramericas que, ademas, interaccionan con dos copias de su sitio de reconocimiento, pero escinden ambas de una manera concertada. Las enzimas Tipo IIG, esencialmente un subgrupo de enzimas tipo IIC, tienen dominios de escision y de modificacion dentro de un polipeptido. En general, son estimuladas por AdoMet, pero de cualquier otra manera se comportan como enzimas tfpicas Tipo II. Las enzimas Tipo IIH se comportan como las enzimas Tipo II, pero su organizacion genetica se asemeja a los sistemas de Modificacion/Restriccion Tipo I. Las enzimas Tipo IIM reconocen una secuencia espedfica metilada y escinden el ADN en un sitio fijo. La enzima representativa mas conocida es Dpnl que escinde Gm6ATC, Gm6ATm4C y Gm6ATm5C, pero no GATC, GATm4C, GATm5C o los sitios hemimetilados. Muchas otras enzimas de restriccion son mas o menos tolerantes a la metilacion, pero para las enzimas Tipo IIM el grupo metilo es un elemento de reconocimiento esencial. Las enzimas ortodoxas Tipo IIP como EcoRI, reconocen secuencias de nucleotidos simetricas y escinden dentro de sus sitios de reconocimiento. Comparten un nucleo estructural comun que comprende las cinco hojas-p mezcladas flanqueadas por a-helices. Sin embargo, los sitios de union al ADN de las enzimas Tipo IIP son muy diversos y generalmente forman un parche en la superficie de la protema compuesto por residuos de aminoacidos ubicados en los diferentes elementos estructurales (a-helices, hojas-p, lazos). Las enzimas ortodoxas Tipo IIP interaccionan con el ADN como homodfmeros, y cada subunidad contribuye al reconocimiento de la mitad de la secuencia palindromica. Las enzimas Tipo IIS escinden al menos una hebra del ADN diana fuera de la secuencia de reconocimiento. La enzima Tipo IIS mejor conocida es Fokl, que al igual que muchas otras enzimas Tipo IIS interacciona con dos sitios de reconocimiento antes de escindir el ADN. Las enzimas Tipo IIS son activas como homodfmeros y estan compuestas por dos dominios, uno responsable para el reconocimiento de las diana y el otro para la catalisis (que sirve, ademas, como el dominio de dimerizacion). Esto es evidente a partir de la estructura cristalina y de los estudios bioqmmicos de Fokl (Bitinaite, J., D. A. Wah, y otros (1998). Proc Natl Acad Sci U S A 95(18): 10570-5; Wah, D. A., J. Bitinaite, y otros (1998). Proc Natl Acad Sci U S A 95(18): 10564-9). El analisis de la estructura cristalina de Fokl revela que esta compuesta por un modulo de union espedfico al ADN fusionado con el dominio de escision que posee un nucleo catalftico de endonucleasa conservado pero escinde el ADN de una manera no espedfica. La arquitectura modular es caractenstica, ademas, para la enzima Bfil de Tipo IIS, que esta compuesta por dos dominios de union al ADN fusionados al nucleo catalftico dimerico similar a la nucleasa no espedfica que pertenece a la familia de la fosfolipasa D. La presencia de un dominio nucleasa separado se ha informado, ademas, a partir de la estructura cristalina de la enzima Sdal Tipo IIP (Tamulaitiene, G., A. Jakubauskas, y otros (2006). Structure 14(9): 1389-400)

Enzimas de Restriccion Modificadas y nucleasas quimericas como herramientas para la edicion del genoma

Las nucleasas que escinden las moleculas de acido nucleico en sitios espedficos en lugar de en sitios aleatorios son cada vez mas importantes en las tecnologfas emergentes tales como, por ejemplo, en la ingeniena genetica y en la transformacion genica. La transformacion genica es un proceso en el cual una molecula de ADN introducida en una celula reemplaza el segmento cromosomico correspondiente mediante recombinacion homologa y, por lo tanto, presenta una forma precisa de manipular el genoma (Capecchi, M. R. (2005). Nat Rev Genet 6(6): 507-12). En el pasado, la aplicacion de la transformacion genica en celulas de mairftferos estuvo limitada por su baja eficiencia. Los experimentos en sistemas modelos demostraron que la frecuencia de recombinacion homologa de un vector de transformacion genica aumenta fuertemente si se induce una rotura de doble hebra dentro de su secuencia diana cromosomica. Mediante el uso de la endonucleasa de direccionamiento de levadura I-Scel, que escinde el ADN en un sitio de reconocimiento de 18 pares de bases de longitud, se demostro inicialmente que la recombinacion homologa y la transformacion genica se estimulan mas de 1000 veces en celulas de mamferos cuando se inserta un sitio de reconocimiento en un gen diana e I-Scel se expresa en esas celulas (Rouet, P., Smih, F., Jasin, M.; Mol Cell Biol 1994; 14: 8096-8106; Rouet, P., Smih, F. Jasin, M; Proc Natl Acad Sci USA 1994; 91: 6064-6068). En ausencia de un vector de transformacion genica para la reparacion dirigida mediante homologfa, frecuentemente las celulas cierran la ruptura de la doble hebra mediante uniones de extremos no homologos (NHEJ). Dado que este mecanismo es propenso a errores, frecuentemente conduce a la delecion o la insercion de multiples nucleotidos en el sitio de escision. Si el sitio de escision se ubica dentro de la region codificante de un gen, de esta manera es posible identificary seleccionar mutantes que muestren mutaciones con desplazamiento del marco de lectura a partir de una poblacion mutagenizada y que representen alelos inactivados no funcionales del gen diana.

Por lo tanto, las nucleasas de secuencia espedfica representan una herramienta importante para la biotecnologfa para modificar el genoma de organismos modelos o lrneas celulares. Para generar las nucleasas que reconocen espedficamente nuevas secuencias diana dentro de los genes, se siguieron dos enfoques basados en la modificacion de las endonucleasas de direccionamiento naturales o en la fusion de un dominio de union al ADN, natural o modificado por ingeniena genetica, a un dominio nucleasa. Tales enzimas de restriccion modificadas o nucleasas quimericas pueden dirigirse a grandes sitios de ADN (hasta 36 pb) y pueden modificarse geneticamente para unirse a secuencias de ADN deseadas.

Las endonucleasas de direccionamiento, tales como I-Scel de levaduras, son elementos geneticos naturales que catalizan su propia duplicacion en alelos receptores mediante la generacion de DSB en sitios espedficos que inician su propia transferencia genetica mediante recombinacion homologa. Una caractenstica clave de estas enzimas es que crean roturas de la doble hebra en los sitios de reconocimiento que tienen una longitud de 14 a 40 pb. La principal limitacion para el uso de endonucleasas de direccionamiento en la transformacion genica es que cada enzima reconoce exclusivamente su secuencia diana natural. Mediante la ingeniena de protemas se ha intentado modificar las endonucleasas de direccionamiento para reconocer nuevos sitios diana. En estetrabajo, podnan hacerse modificaciones que alteren el sitio diana natural dentro de algunos nucleotidos, pero aun no es posible disenar enzimas espedficas para regiones diana completamente nuevas.

Debido a la dificultad para la manipulacion de la secuencia de reconocimiento de las endonucleasas de direccionamiento, las nucleasas dedos de zinc (ZFN) son en la actualidad las nucleasas artificiales usadas mas comunmente para la ingeniena genetica (Urnov, F. D., E. J. Rebar, y otros Nat Rev Genet 11(9): 636-46). Las nucleasas dedos de zinc se desarrollaron mediante la fusion del dominio de escision, no espedfico de secuencia, de la endonucleasa de restriccion Tipo IIS FokI (dominio Fn) a un nuevo dominio de union al ADN. La ventaja de las nucleasas dedos de zinc es que el dominio dedos de zinc de union al ADN puede modificarse para reconocer secuencias diana novedosas, que incluyen aquellas en los genes endogenos. Los modulos de protemas conocidos como dedos de zinc se encuentran en el dominio de union al ADN de la familia mas abundante de factores de transcripcion en la mayona de los genomas eucarioticos. Cada dedo esta compuesto por 30 aminoacidos, coordina un ion Zn2+ mediante el uso de dos cistemas y dos residuos de histidina, y contacta principalmente con tres pares de bases de ADN. Dos caractensticas cnticas de la estructura son que cada dedo une su sitio diana de 3 pb independientemente y que cada nucleotido parece estar en contacto por una unica cadena lateral de aminoacidos que se proyecta desde un extremo de la a-helice hasta el surco mayor del ADN. Se disenaron dedos individuales para reconocer muchos de los 64 tripletes diana diferentes, pero el mayor exito ha sido el diseno de dedos de zinc para reconocer los tripletes 5'-GNN-3'. Aunque se han propuesto codigos de reconocimiento de dedos de zinc, actualmente no existe ningun codigo que resulte consistentemente en dedos de zinc con enlace de alta afinidad. El perfeccionamiento de la especificidad de la union de los dedos de zinc, tales como mediante el aumento del numero de dedos o mediante la construccion de protemas de multiples dedos que usan unidades de dos dedos, permanece como un area activa de investigacion.

Mediante el uso de nucleasas dedos de zinc en ausencia de un vector de transformacion genica para la reparacion dirigida por homologfa, se generaron alelos inactivados en lmeas de celulas de mairnferos y se obtuvieron ratas y peces cebra portadores de genes inactivados tras la expresion del ARNm de ZFN en embriones unicelulares (Santiago Y, Chan E, Liu PQ, Orlando S, Zhang L, Urnov FD, Holmes MC, Guschin D, Waite A, Miller JC, Rebar eJ, ^{Gregory PD, Klug A,}Collingwood TN.; Proc Natl Acad Sci U S A 2008; 105:5809-5814; Doyon Y, McCammon JM, Miller JC, Faraji F, Ngo C, ^{Katibah GE, Amora R, Hocking TD, Zhang L, Rebar EJ, Gregory}pD, ^{Urnov FD, Amacher SL.; Nat Biotechnol 2008;}26:702-708; Geurts AM, Cost GJ, Freyvert Y, Zeitler B, Miller JC, Choi VM, Jenkins SS, Wood A, Cui X, Meng X, Vincent A, Lam S, Michalkiewicz M, Schilling R, Foeckler J, Kalloway S, Weiler H, Menoret S, Anegon I, Davis GD, Zhang L, Rebar EJ, Gregory PD, Urnov FD, Jacob HJ, Buelow R.; Science 2009; 325:433). Ademas, las nucleasas dedo de zinc se usaron en presencia de vectores de transformacion genica exogenos que contienen regiones de homologfa con el gen diana para la reparacion dirigida por homologfa de la ruptura de doble hebra a traves de la conversion genica. Esta metodologfa se aplico a la ingeniena genetica en lmeas de celulas de marnfferos y en la correccion genica en celulas humanas primarias (Urnov FD, Miller JC, Lee YL, Beausejour CM, Rock JM, Augustus S, Jamieson AC, Porteus MH, Gregory PD, Holmes MC.; Nature 2005; 435:646-651; Porteus MH, Baltimore D. 2003. Science 300:763; Hockemeyer D, Soldner F, Beard C, Gao Q, Mitalipova M, DeKelver RC, Katibah GE, Amora R, Boydston EA, Zeitler B, Meng X, Miller JC, Zhang L, Rebar EJ, Gregory PD, Urnov FD, Jaenisch R.; Nat Biotechnol 2009; 27:851-857).

Aunque el uso de las nucleasas dedos de zinc resulta en una mayor frecuencia de recombinacion homologa, se requieren esfuerzos y tiempos considerables para disenar protemas dedos de zinc que se unen a una nueva secuencia diana de ADN con alta eficiencia y que actuen como nucleasas de una secuencia espedfica. Ademas, durante mucho tiempo se ignoro que la naturaleza del dominio nucleasa de las nucleasas dedos de zinc, y de otras nucleasas quimerica, puede representar un factor de exito igualmente importante para la actividad general de la protema de fusion. La razon de esta desatencion se basa en el hecho de que hasta la fecha solamente se encontro un unico dominio nucleasa que retiene la actividad nucleasa dentro de un dominio de plegamiento de protemas separado y que puede combinarse con los dominios de union al ADN, para generar una protema de fusion nucleasa de secuencia espedfica. Este dominio nucleasa se deriva de la enzima de restriccion Fokl, Tipo IIS, que se ha caracterizado en detalle y se conoce que actua como un dfmero obligado (Bitinaite, J., D. A. Wah, y otros (1998). Proc Natl Acad Sci U S A 95(18): 10570-5; Wah, D. A., J. Bitinaite, y otros (1998). Proc Natl Acad Sci U S A 95(18): 10564-9). En la mayona de las otras enzimas de restriccion, el reconocimiento y la escision del ADN se combinan en un solo dominio de protema y no pueden separarse. Una excepcion es la enzima Sdal que se ha caracterizado estructuralmente por poseer un dominio nucleasa separado (Tamulaitiene, G., A. Jakubauskas, y otros (2006). Structure 14(9): 1389-400). Ademas, no ha sido posible aislar mutantes que pierden el reconocimiento de ADN pero retienen la actividad de escision del ADN.

Por lo tanto, debido a la falta de otros dominios nucleasas funcionales comparables, durante mucho tiempo fue esencialmente desconocido si las propiedades enzimaticas del dominio Fokl Fn pueden constituir un factor limitante para la actividad nucleasa del dominio Fn de las protemas de fusion. Por ejemplo, la estructura intrmseca del dominio Fn puede restringir su actividad enzimatica o la pequena interfaz de dimerizacion de dos dominios Fn puede conducir a una interaccion suboptima y a una baja tasa de escision del sustrato de ADN.

Mediante mutagenesis dirigida, el dominio Fokl Fn se modifico geneticamente en las variantes KK y EL que actuan, preferentemente, como heterodfmeros (Miller, J. C., M. C. Holmes, y otros (2007). Nat Biotechnol 25(7): 778-85). El uso de estas variantes proporciona la especificidad mejorada por la secuencia diana de las nucleasas dedos de zinc y disminuye la toxicidad en las celulas de mamfferos, ya que se reconocen y procesan menos secuencias genomicas fuera de la diana. Sin embargo, la actividad nucleasa global de las variantes KK y EL es, a lo maximo, comparable a la del dominio Fn detipo silvestre.

Solo muy recientemente se encontro que el dominio Fokl Fn de tipo silvestre exhibe ciertamente solo una actividad enzimatica nucleasa suboptima, que limita el uso de las nucleasas dedos de zinc para la modificacion genetica del genoma. En un estudio de evolucion de protemas dirigida, el dominio Fn se mutagenizo al azar y se sometio a un ensayo en E. coli basado en nucleasa capaz de seleccionar mutantes que exhiben una actividad enzimatica aumentada (Guo, J., T. Gaj, y otros (2010), J Mol Biol 400(1): 96-107). Mediante este procedimiento, se hizo posible aislar mutantes que exhiben una actividad de nucleasa > 10 veces mas alta en comparacion con el dominio Fn de tipo silvestre. Despues del acoplamiento de estos mutantes a dominios dedos de zinc, tales protemas de fusion mostraron un procesamiento de sustrato mejorado de tres a seis veces en celulas de mamfferos. Sin embargo, en la actualidad permanece desconocido si la actividad del dominio Fn puede mejorarse aun mas o si la arquitectura intrmseca de la protema del dominio Fn puede restringir cualquier mejora adicional.

Ademas de los dominios dedos de zinc de union al ADN fusionados a los dominios nucleasa, muy recientemente se identifico, ademas, los dominios de union al ADN de la protema efectora TAL. En comparacion con los motivos dedos de zinc, los elementos de repeticion TAL dentro de las protemas efectoras TAL proporcionan un nuevo tipo de dominio de union al ADN que puede combinarse con un dominio nucleasa en nucleasas de secuencia espedfica. Una caractenstica clave de los elementos peptfdicos TAL se proporciona por su naturaleza moduladora. De esta manera, pueden generarse nuevas protemas de union al ADN en una secuencia espedfica mediante la combinacion de solo cuatro elementos TAL basicos que cada uno es espedfico para los nucleotidos A, C, G o T. Actualmente, solamente el dominio nucleasa de Fokl se usa exitosamente en la fusion con los dominios de union al ADN de la protema efectora TAL (Miller y otros (2010). Nat. Biotechnol. 29, 143-148).

En resumen, existe una necesidad continua de nucleasas que puedan usarse en diversos entornos experimentales, que incluyen su fusion a otras protemas y la modificacion del dominio nucleasa.

El problema tecnico que subyace en la presente invencion fue la identificacion de alternativas y/o medios y metodos mejorados para escindir moleculas de acido nucleico.

La solucion a este problema tecnico se logra al proporcionar las modalidades caracterizadas en las reivindicaciones.

En consecuencia, la presente invencion se refiere en una primera modalidad a una molecula de acido nucleico que codifica (I) un polipeptido que tiene la actividad de una endonucleasa, que es (a) una molecula de acido nucleico que codifica un polipeptido que consiste en la secuencia de aminoacidos de la sec. con num. de ident.: 1; (b) una molecula de acido nucleico que consiste en la secuencia de nucleotidos de la sec. con num. de ident.: 2; (c) una molecula de acido nucleico que codifica una endonucleasa, cuya secuencia de aminoacidos es al menos 70 % identica a la secuencia de aminoacidos de la sec. con num. de ident.: 1; (d) una molecula de acido nucleico que consiste en una secuencia de nucleotidos que es al menos 50 % identica a la secuencia de nucleotidos de la sec. con num. de ident.: 2; (e) una molecula de acido nucleico que es degenerada con respecto a la molecula de acido nucleico de (d); o (f) una molecula de acido nucleico correspondiente a la molecula de acido nucleico de cualquiera de (a) hasta (e) en donde T se reemplaza por U; (II) un fragmento del polipeptido de (I) que tiene la actividad de una endonucleasa.

De acuerdo con la presente invencion el termino "molecula de acido nucleico" define una cadena molecular lineal que consiste en al menos (para cada una) 2, 5, 10, 25, 50, 75, 100, 250, 500, tal como al menos 750, 1000, o al menos 2500 o mas nucleotidos. El grupo de moleculas designado en la presente descripcion como "moleculas de acido nucleico" comprende, ademas, genes completos. El termino "molecula de acido nucleico", en la presente descripcion se usa indistintamente con el termino "polinucleotido".

El termino "molecula de acido nucleico" de acuerdo con la presente invencion incluye ADN, tal como ADNc o ADN genomico, de doble o simple hebra, y ARN. En este sentido, "ADN" (acido desoxirribonucleico) se refiere a cualquier cadena o secuencia de los bloques de construccion qrnmicos adenina (A), guanina (G), citosina (C) y timina (T), llamadas bases de nucleotidos, que estan unidas sobre una cadena principal de azucar desoxirribosa. El ADN puede tener una hebra de bases de nucleotidos, o dos hebras complementarias que pueden formar una estructura de doble helice. El "ARN" (acido ribonucleico) se refiere a cualquier cadena o secuencia de los bloques de construccion qrnmicos adenina (A), guanina (G), citosina (C) y uracilo (U), llamadas bases de nucleotidos, que se unen juntos en una cadena principal de azucar ribosa. Tfpicamente, el ARN tiene una hebra de bases de nucleotidos. Ademas, se incluyen moleculas dbridas monocatenarias y bicatenarias, es decir, ADN-ARN. La molecula de acido nucleico puede modificarse, ademas, por muchos medios conocidos en la tecnica. Los ejemplos no limitantes de tales modificaciones incluyen la metilacion, los "capuchones", la sustitucion de uno o mas de los nucleotidos de origen natural con un analogo, y las modificaciones entre los nucleotidos, tales como por ejemplo, aquellas con enlaces no cargados (por ejemplo, fosfonatos de metilo, fosfotriesteres, fosforamidatos, carbamatos, etcetera) y con enlaces cargados (por ejemplo, fosforotioatos, fosforoditioatos, etcetera). Los polinucleotidos pueden contener una o mas porciones adicionales unidas covalentemente, tales como, por ejemplo, protemas (por ejemplo, nucleasas, toxinas, anticuerpos, peptidos senal, poli-L-lisina, etcetera), intercaladores (por ejemplo, acridina, psoraleno, etcetera), agentes quelantes (por ejemplo, metales, metales radiactivos, hierro, metales oxidativos, etcetera), y agentes alquilantes. Los polinucleotidos pueden derivatizarse mediante la formacion de un metil o etil fosfotriester o un enlace alquilo fosforamidato. Se incluyen, ademas, moleculas que imitan el acido nucleico conocidas en la tecnica, tales como los derivados sinteticos o semisinteticos de ADN o ARN y los polfmeros mixtos. Tales moleculas que imitan el acido nucleico o los derivados de acido nucleico de acuerdo con la invencion incluyen acido nucleico fosforotioato, acido nucleico fosforamidato, acido ribonucleico 2'-O-metoxietilo, acido nucleico morfolino, acido nucleico hexitol (HNA), acido nucleico peptfdico (PNA) y acido nucleico bloqueado (LNA) (ver Braasch y Corey, Chem Biol 2001, 8: 1). El LNA es un derivado de ARN en el que el anillo de ribosa se restringe por un enlace metileno entre el oxfgeno-2' y el carbono-4'. Ademas, se incluyen los acidos nucleicos que contienen bases modificadas, por ejemplo, tiouracilo, tioguanina y fluorouracilo. Tfpicamente, una molecula de acido nucleico transporta la informacion genetica, que incluye la informacion usada por la maquinaria celular para producir protemas y/o polipeptidos. La molecula de acido nucleico de la invencion puede comprender, adicionalmente, promotores, potenciadores, elementos de respuesta, secuencias de senal, secuencias de poliadenilacion, intrones, regiones no codificantes 5' y 3' y similares.

El termino "polipeptido", como se usa en la presente descripcion indistintamente con el termino "protema", describe cadenas moleculares lineales de aminoacidos, que incluye las protemas de cadena sencilla, que contienen mas de 30 aminoacidos, mientras que el termino "peptido" describe cadenas moleculares lineales de aminoacidos, que incluye las protemas de cadena sencilla, que contienen menos de, y hasta 30 aminoacidos. Los polipeptidos pueden formar, ademas, oligomeros que consisten en al menos dos moleculas identicas o diferentes. Las correspondientes estructuras de orden superior de tales multfmeros son, segun el caso, denominados homo o heterodfmeros, homo o heterotnmeros, etcetera. Los polipeptidos de la invencion pueden formar heteromultimeros u homomultimeros, tales como heterodfmeros u homodfmeros. Ademas, los peptidomimeticos de tales protemas/polipeptidos donde los aminoacidos y/o los enlaces peptidicos se reemplazaron por analogos funcionales, son ademas, comprendidos por la invencion. Tales analogos funcionales incluyen todos los aminoacidos conocidos distintos de los 20 aminoacidos codificados por genes, tal como la selenocistema. Los terminos "polipeptido" y "protema" se refieren, ademas, a polipeptidos y protemas modificados naturalmente, donde la modificacion se efectua, por ejemplo, mediante glicosilacion, acetilacion, fosforilacion, ubiquitinilacion y modificaciones similares que se conocen bien en la tecnica.

El termino "un polipeptido que tiene la actividad de una endonucleasa", como se usa en la presente descripcion, se refiere a un polipeptido que es capaz de escindir los enlaces fosfodiester entre las subunidades de nucleotidos de acidos nucleicos dentro de una cadena de polinucleotidos.

De acuerdo con la invencion, la actividad enzimatica endonucleasa se considera estable cuando, en las condiciones respectivas, la enzima es capaz de durar lo suficiente como para obtener el efecto deseado, espedficamente, la escision de su sustrato. Con respecto a esto, se observa que la actividad endonucleasa puede evaluarse como se describio en los ejemplos de la descripcion o mediante metodos bien conocidos en la tecnica. Por ejemplo, una molecula de acido nucleico puede exponerse a una protema cuya actividad endonucleasa debe evaluarse en condiciones que son adecuadas para la actividad enzimatica endonucleasa. Despues de la incubacion, la composicion que comprende la molecula de acido nucleico (con o sin dicha protema a evaluar) puede someterse a un ensayo para evaluar la longitud de una molecula de acido nucleico tal como, por ejemplo, electroforesis en gel, para determinar si la molecula de acido nucleico fue escindida.

De acuerdo con la presente invencion, el termino "porcentaje (%) de identidad de secuencia" describe el numero de coincidencias ("aciertos") de nucleotidos/aminoacidos identicos de dos o mas secuencias de acido nucleico o de aminoacido alineadas en comparacion a la cantidad de nucleotidos o de residuos de aminoacidos que constituyen la longitud total de las secuencias modelos de acido nucleico o aminoacidos. En otros terminos, mediante el uso de una alineamiento, para dos o mas secuencias o subsecuencias, puede determinarse el porcentaje de residuos de aminoacidos o de nucleotidos que son iguales (por ejemplo, 95 % de identidad) cuando se comparan y se alinean las (sub)secuencias para obtener el maximo de correspondencia en una ventana de comparacion, o en una region designada segun lo medido mediante el uso de un algoritmo de comparacion de secuencias como se conoce en la tecnica, o cuando se realiza el alineamiento manualmente y se inspecciona visualmente. Esta definicion se aplica, ademas, al complemento de cualquier secuencia para alinearse. El alineamiento y el analisis de la secuencia de aminoacidos en relacion con la presente invencion se realizaron mediante el uso del algoritmo de la NCBI BLAST (Stephen F. Altschul, Thomas L. Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, y David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402) y el programa informatico del banco detrabajo principal CLC (version 5.7.1; CLC bio, Aarhus, Dinamarca) que se usan, preferentemente, de acuerdo con esta invencion. Preferentemente, se usan los parametros estandar publicados (Altschul y otros, en el lugar citado). El experto en la tecnica conoce la existencia de programas adicionales adecuados para alinear secuencias de acidos nucleicos. Un programa preferido para el alineamiento de las secuencia de acido nucleico, de acuerdo con la invencion, es el programa informatico del banco de trabajo principal CLC que usa los parametros de alineamientos estandar del programa informatico (version 5.7.1; CLC bio, Aarhus, Dinamarca).

Como se define en las modalidades anteriores en la presente descripcion, la invencion contempla determinadas identidades de secuencia de aminoacidos. Ademas, se contempla, con preferencia creciente, las identidades de secuencias de aminoacidos de al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, al menos 97,5 %, al menos 98 %, al menos 98,5 %, al menos 99 %, al menos 99,5 %, al menos 99,8 %, y 100 % de identidad con la secuencia de aminoacidos respectiva de acuerdo con la invencion.

Como se define en las modalidades anteriores en la presente descripcion, la invencion contempla determinadas identidades de secuencia de nucleotidos. Ademas, se contempla, con preferencia creciente, las identidades de secuencias de nucleotidos de al menos 55 %, al menos 60 %, al menos 65 %, al menos 70 %, al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, al menos 97,5 %, al menos 98 %, al menos 98,5 %, al menos 99 %, al menos 99,5 %, al menos 99,8 %, y 100 % de identidad con respecto a la secuencia de acido nucleico respectiva de acuerdo con la invencion.

El experto en la tecnica apreciara facilmente que mas de una molecula de acido nucleico puede codificar el mismo polipeptido debido a la degeneracion del codigo genetico. La degeneracion se debe a que un codigo de tripletes designa a 20 aminoacidos y un codon de parada. Debido a que existen cuatro bases que se utilizan para codificar la informacion genetica, se necesitan codones de tripletes para producir al menos 21 codigos diferentes. Las 43 posibilidades posibles para las bases en los tripletes proporcionan 64 codones posibles, lo que significa que alguna degeneracion debe existir. Como un resultado, algunos aminoacidos estan codificados por mas de un triplete, es decir, por hasta seis. La degeneracion surge principalmente a partir de alteraciones en la tercera posicion en un triplete. Esto significa que las moleculas de acido nucleico que tienen diferentes secuencias, pero que aun codifican el mismo polipeptido se contemplan y pueden emplearse de acuerdo con el metodo de la presente invencion.

Los fragmentos de acuerdo con la presente invencion son polipeptidos que tienen la actividad de una endonucleasa, como se define anteriormente en la presente descripcion, y comprenden al menos 90 aminoacidos. Con respecto a esto, se prefiere, con preferencia creciente, que los fragmentos de acuerdo con la presente invencion sean polipeptidos de al menos 100, al menos 125, al menos 150, al menos 200 aminoacidos, al menos 300 aminoacidos, al menos 400 aminoacidos. Los fragmentos del polipeptido de la invencion, que retienen sustancialmente la actividad endonucleasa, incluyen truncamientos N-terminales, truncamientos C-terminales, sustituciones de aminoacidos, deleciones internas y adicion de aminoacidos (ya sea internamente o en cualquier extremo de la protema). Por ejemplo, las sustituciones de aminoacidos conservativas son conocidas en la tecnica y pueden introducirse en la endonucleasa de la invencion sin afectar sustancialmente la actividad endonucleasa, es decir, disminuir dicha actividad.

Como es evidente a partir de los ejemplos, el inventor fue capaz de identificar y aislar una nueva nucleasa, en particular el dominio endonucleasa, derivado de una cepa de Clostridium como se detalla mas abajo. Espedficamente, el inventor pudo establecer la utilidad del producto genico de un gen bacteriano putativo sin connotacion funcional conocida como una secuencia de nucleasa inespedfica. La nucleasa novedosa puede emplearse en diversos entornos experimentales al igual que cualquier otra nucleasa. Por ejemplo, puede usarse para escindir aleatoriamente moleculas de acido nucleico o, por ejemplo, en fusion con dominios de union al ADN, para la escision en un sitio espedfico de las moleculas de acido nucleico. Es importante destacar que, como se describe mas abajo y espedficamente en los ejemplos, la endonucleasa novedosa puede usarse en combinacion con los dominios de union al ADN de la protema efectora TAL como parte de una protema de fusion para la escision de acidos nucleicos en una secuencia espedfica. Con respecto a esto, la nucleasa novedosa muestra su superioridad sobre las endonucleasas del estado de la tecnica distintas de Fokl, que hasta el momento no pudieron mostrarse activas en las protemas de fusion correspondientes. Brevemente, los inventores probaron el producto genico de dicho gen microbiano hipotetico no caracterizado que designaron como "Clo051" (sec. con num. de ident.: 17) y que se derivo del genoma de Clostridium spec. 7_2_43FAA (Secuencia de Referencia del NCBI: ZP_05132802.1; publicacion/base de datos liberada en fecha: 9 de junio, de 2010), mas espedficamente su dominio nucleasa putativo (ver Figuras 5 y 6), por su actividad endonucleasa en combinacion con el dominio de union al ADN de una protema efectora TAL. Ademas, se evaluaron diversas protemas endonucleasas conocidas en combinacion con los dominios de union al ADN de la protema efectora TAL, asf como tambien otros dos genes microbianos hipoteticos. Sorprendentemente, solamente pudo demostrarse que el dominio nucleasa de Clo051 estaba activo, mientras que las otras protemas de fusion no mostraron actividad (ver el Ejemplo 1 para los detalles). Los experimentos comparativos enfatizaron en el significado del descubrimiento de la presente invencion en que se identifico una nucleasa novedosa que, ademas, exhibe actividad cuando se fusiona a los dominios de union al ADN de las protemas efectoras TAL. Las protemas efectoras TAL se expresan por los patogenos de plantas del genero Xanthomonas y reprograman las celulas huesped mediante la imitacion de los factores de transcripcion eucarioticos. Las protemas efectoras TAL se caracterizan por un dominio central de repeticiones en tandem de 32 a 34 aminoacidos que constituyen un dominio de union al ADN. El numero y el orden de las repeticiones en una protema efectora TAL determinan su actividad espedfica de union al ADN. (Boch, J., y otros 2009 Science 326: 1509-12). Las secuencias de aminoacidos de las repeticiones son conservadas, excepto para dos residuos adyacentes altamente variables (en las posiciones 12 y 13) que determinan la especificidad hacia las bases del ADN A, G, C o T. La union al ADN se realiza mediante el contacto de un nucleotido de la doble helice del ADN con los residuos variables en la posicion 12 y 13 dentro del motivo efector de TAL, lo que resulta en una correspondencia uno a uno entre las repeticiones secuenciales en las protemas efectoras TAL y los nucleotidos secuenciales en el ADN diana. La union a secuencias de ADN mas largas se logra mediante la union en tandem de varios de estos motivos efectores TAL para formar un "dominio de union al ADN de una protema efectora TAL". El uso de tales dominios de union al ADN de las protemas efectoras TAL para la creacion de protemas de fusion, motivo efector TAL nucleasa, que reconoce y escinde una secuencia diana espedfica depende de la creacion adecuada de los dominios de union al ADN de las protemas efectoras TAL que pueden reconocer espedficamente dicha diana particular. La ventaja de los elementos de repeticion TAL, en comparacion con, por ejemplo, los elementos dedos de zinc, se proporciona por su naturaleza verdaderamente modular. De esta manera, pueden generarse nuevas protemas de union al ADN en una secuencia espedfica a traves de la combinacion de los cuatro elementos basicos de TAL que son espedficos para los nucleotidos A, C, G o T.

Es importante senalar que, en la presente invencion, el dominio nucleasa Clo051 fusionado a los dominios de union al ADN de las protemas efectoras t Al se evaluo y se encontro que es activo en mairnferos, espedficamente en cultivos de celulas humanas. Por lo tanto, la utilidad de las protemas de fusion del dominio nucleasa Clo051 para la manipulacion del ADN y de los genes, espedficamente en celulas de mamfferos, pero sin limitacion, se ha demostrado directamente en el sistema biologico que proporciona aplicaciones importantes para esta tecnologfa. Este hallazgo es de particular importancia debido a que los estudios sobre la funcion de las protemas que se realizan en organismos eucarioticos inferiores, como, por ejemplo, levaduras, no permiten una conclusion definitiva acerca de la utilidad de la protema en estudio en celulas de mamfferos. Por ejemplo, una protema espedfica puede funcionar de manera optima a 30° Celsius, la temperatura de crecimiento de la levadura, pero se vuelve inestable o se inactiva a 37° Celsius que es la temperatura corporal tfpica de los mamfferos. Ademas, el medio intracelular de, por ejemplo, las celulas de levadura, como la concentracion de iones y de protemas, la diversidad de protemas y los mecanismos de degradacion de protemas, se distinguen del medio intracelular de las celulas de mamfferos.

Mientras que los ejemplos describen solamente el uso del dominio nucleasa de Clo051 (sec. con num. de ident.: 1), por ejemplo, en combinacion con los dominios de union al ADN, el experto en la tecnica apreciara que puede emplearse la secuencia completa de Clo051 como se establece en la sec. con num. de ident.: 17 o los fragmentos mas cortos de esta que tienen actividad endonucleasa y que comprenden la secuencia de aminoacidos de la sec. con num. de ident.: 1. La secuencia de aminoacidos de la sec. con num. de ident.: 1 comienza en E389 y termina en Y587 de los aminoacidos de la sec. con num. de ident.: 17 como se ilustra, ademas, en la Figura 5.

En una modalidad preferida de la molecula de acido nucleico de la invencion, en (I)(c) en dicha secuencia de aminoacidos que tiene al menos un 70 % de identidad de secuencia con la sec. con num. de ident.: 1 los residuos de aminoacidos P66, D67, D84 y/o K86 de la sec. con num. de ident.: 1 no estan modificados.

El dominio nucleasa de Clo051, al igual que muchas endonucleasas de restriccion Tipo-II y, por ejemplo, la protema MutH de reparacion del ADN, comparte el motivo de secuencia conservada PD-(D/E)XK dentro del nucleo de su dominio catalttico. El nucleo sirve como un andamio para un sitio activo debilmente conservado, que comprende, tipicamente, dos o tres residuos acidos (Asp o Glu) y un residuo de Lys, que juntos forman el motivo catalttico bipartite distintivo [(P)D. Xn. (D/E)XK](donde X es cualquier aminoacido). Este motivo ha llevado a denominar a esta superfamilia de protemas como 'PD-(D/E)XK'. El trabajo sobre las enzimas de restriccion y las protemas de reparacion del ADN ha demostrado que los tres residuos cataltticos se ubican cercanos entre sf en una horquilla p irregular. La primera D se ubica al inicio de la hebra primera y mas corta, y la E y la K, separadas por un residuo hidrofobo x, en el medio de la hebra segunda y mas larga. El modulo catalftico se aproxima invariablemente al ADN desde el lado del surco menor, y la union a la secuencia espedfica se realiza mediante un modulo/subdominio separado en el surco mayor. Los dos primeros carboxilatos del motivo DEK coordinan los iones metalicos. La primera D es la mas conservada y coordina ambos iones metalicos, mientras que la segunda E puede reemplazarse por Q, D, N, H o S, y la tercera K puede reemplazarse por E, Q, D, S, N o T. El residuo de lisina en el motivo DEK conservado coordina el agua nucleofila junto con el fosfato 3' al enlace escindible; la misma Lisina, ademas, se une al hidrogeno con un oxfgeno carbonilo en el modulo de union al ADN. Esta lisina, que es conservada en muchas endonucleasas de restriccion y se reemplaza por Glu o Gln en BamHI y Bglll, se ha propuesto como un sensor para la union al ADN y un centro que acopla el reconocimiento de bases y la escision del a Dn (Lee y otros (2005). Molecular Cell 20, 155- 166; Orlowski, J. y J. M. Bujnicki (2008). Nucleic Acids Res 36(11): 3552-69).

La secuencia primaria del dominio nucleasa de Clo051 entre las posiciones E389 e Y587 de la secuencia de sec. con num. de ident.: 17, es decir, la secuencia de la sec. con num. de ident.: 1, exhibe una distribucion unica de los residuos de arginina (R) y lisina (K) cargados positivamente y de los residuos de glutamato (E) y aspartato (D) cargados negativamente (Figura 13). Estos residuos constituyen un paisaje tridimensional de cargas dentro del dominio Clo051 que determina la estructura terciaria unica de esta nucleasa, como se muestra en el modelo estructural en la Figura 6. Determinados reemplazos de residuos polares versus no polares, o de residuos no polares contra residuos polares, por ejemplo en las posiciones S35 y/o R58 de la sec. con num. de ident.:1 (o S423 y R446 de la sec. con num. de ident.: 17), alteran la estructura tridimensional de la cadena proteica y pueden resultar en un aumento de la actividad nucleasa. Tales reemplazos de aminoacidos pueden realizarse mediante ensayos de prueba y error o pueden seguir hipotesis espedficas sobre el impacto estructural y funcional en el dominio nucleasa de Clo051. Alternativamente, un gran numero de variantes mutagenizadas aleatoriamente de la region codificante del dominio nucleasa de Clo051 pueden ensamblarse en una biblioteca mediante PCR mutagenico, propenso a errores. Esta biblioteca de moleculas mutantes puede analizarse para detectar la presencia de variantes hiperactivas de nucleasa mediante un ensayo de seleccion fenotfpico en celulas de E. coli,, levaduras o mairnferos que se acopla a una lectura de nucleasa funcional, por ejemplo, como se describio para la mejora de la recombinasa FLP (Buchholzy otros, Nat. Biotechnol. 16,657-62,1998). Tal seleccion funcional para variantes mejoradas de nucleasas puede resultar en el reemplazo de residuos unicos o multiples que conduce a un aumento de la actividad nucleasa en comparacion con la forma detipo silvestre de Clo051.

Ademas, se contemplan modalidades donde mas de un residuo de aminoacido P66, D67, D84 y/o K86 de la sec. con num. de ident.: 1 no estan modificados, tal como, por ejemplo, los tramos de aminoacidos, por ejemplo desde al menos P66 hasta al menos K86, al menos R64 hasta al menos Y88, al menos G62 hasta al menos E90, asf como tambien desde L60 hasta al menos Y92 de la sec. con num. de ident.: 1.

En una modalidad preferida de la invencion, la molecula de acido nucleico codifica, ademas, un dominio de union al ADN.

En esta modalidad, la molecula de acido nucleico de la invencion codifica una protema de fusion que tiene la actividad de una endonucleasa y comprende un dominio de union al ADN y un dominio de escision que comprende o consiste en el dominio endonucleasa novedoso. El termino "protema de fusion" es bien conocido en la tecnica y tiene el mismo significado en la presente descripcion. Espedficamente, se refiere a una protema generada mediante la union de dos o mas secuencias de acido nucleico diana, por ejemplo, genes que originalmente codifican protemas separadas, para crear un constructo de fusion. La traduccion de dicho constructo de fusion resulta en una protema unica con las propiedades funcionales derivadas de dichas protemas separadas. Las dos protemas que dan lugar a la protema de fusion pueden conectarse mediante un enlazador, tal como, por ejemplo, un peptido enlazador. En otras palabras, el dominio de union al ADN y el dominio de escision de las nucleasas pueden fusionarse directamente entre sf o pueden fusionarse a traves de un enlazador.

El termino "enlazador", como se usa de acuerdo con la presente invencion, se refiere a una secuela de aminoacidos (es decir, peptidos enlazadores) asf como tambien a enlazadores no peptfdicos.

Los peptidos enlazadores, como se contempla por la presente invencion, son peptidos o polipeptidos enlazadores de al menos 1 aminoacido en longitud. Preferentemente, los enlazadores son de 1 hasta 100 aminoacidos en longitud. Con mayor preferencia, los enlazadores son de 5 hasta 50 aminoacidos en longitud, e incluso con mayor preferencia, los enlazadores son de 10 hasta 20 aminoacidos en longitud. Es bien conocido por el experto en la tecnica que la naturaleza, es decir, la longitud y/o la secuencia de aminoacidos del enlazador puede modificar o potenciar la estabilidad y/o la solubilidad de la molecula. Por lo tanto, la longitud y la secuencia de un enlazador dependen de la composicion de las porciones respectivas de la protema de fusion.

El experto en la tecnica conoce los metodos para evaluar la idoneidad de diferentes enlazadores. Por ejemplo, las propiedades de la molecula pueden probarse facilmente mediante la evaluacion de la actividad nucleasa, asf como tambien la especificidad de union al a Dn de las porciones respectivas de la protema de fusion para usarse en el metodo de la invencion.

Se apreciara por el experto en la tecnica que cuando la protema de fusion se proporciona como una molecula de acido nucleico que codifica la protema de fusion en forma expresable, el enlazador es un peptido enlazador codificado, ademas, por dicha molecula de acido nucleico.

El termino "enlazador no peptidico", como se usa de acuerdo con la presente invencion, se refiere a grupos de enlace que tienen dos o mas grupos reactivos pero que excluyen los peptidos enlazadores como se definio anteriormente. Por ejemplo, el enlazador no peptfdico puede ser un polfmero que tiene grupos reactivos en ambos extremos, que se unen individualmente a grupos reactivos de las porciones individuales de la protema de fusion, por ejemplo, un extremo amino, un residuo de lisina, un residuo de histidina o un residuo de cistema. Los grupos reactivos del polfmero incluyen un grupo aldehndo, un grupo aldehndo propionico, un grupo aldehndo butilo, un grupo maleimida, un grupo cetona, un grupo vinil sulfona, un grupo tiol, un grupo hidrazida, un grupo carbonildimidazol (CDI) un grupo carbonato de nitrofenilo (NpC), un grupo trisilato, un grupo isocianato y derivados de succinimida. Los ejemplos de derivados de succinimida incluyen propionato de succinimidilo (SPA), acido succinimidil butanoico (SBA), carboximetilato de succinimidilo (SCM), succinimidil succinamida (SSA), succinimidil succinato (SS), succinimidil carbonato y N-hidroxi succinimida (NHS). Los grupos reactivos en ambos extremos del polfmero no peptfdico pueden ser iguales o diferentes. Por ejemplo, el polfmero no peptfdico puede tener un grupo maleimida en un extremo y un grupo aldetndo en otro extremo. Preferentemente, el enlazador es un peptido enlazador. Con mayor preferencia, el peptido enlazador consiste en siete residuos de glicina.

Ademas, la protema de fusion puede estar flanqueada en los extremos N o C terminal por secuencias adicionales no relacionadas a dichas protemas en la protema de fusion. De acuerdo con la presente invencion, una protema de fusion de la invencion comprende un dominio de union a ADN. El termino "dominio de union al ADN" tiene el mismo significado como se conoce en la tecnica y se refiere a un motivo/conformacion de secuencia dentro de una protema que se une a los motivos del ADN. Los dominios de protemas que pueden unirse espedficamente a una secuencia de acido nucleico incluyen, por ejemplo, repeticiones de dedos de zinc, el motivo helice-giro-helice (HTH) de los homeodominios, y el motivo cinta-helice-helice (RHH). La union espedfica se refiere a la union espedfica a una secuencia y es espedfica, cuando un dominio de union al ADN estadfsticamente solamente se une a una secuencia particular y no se une, o no se une esencialmente, a una secuencia no relacionada. El experto en la tecnica conoce bien las secuencias que codifican los dominios de union al ADN (Rohs y otros (2010). Annu. Rev. Biochem. 79, 233-269; Maeder y otros (2009). Nat. Protocols 10, 1471-1501).

En una modalidad mas preferida de la molecula de acido nucleico de la invencion, el dominio de union al ADN es un motivo efector TAL de una protema efectora TAL.

Esta modalidad se refiere a una molecula de acido nucleico que codifica, ademas, una nucleasa TAL. El termino "nucleasa TAL", como se usa en la presente descripcion, es bien conocido en la tecnica y se refiere a una protema de fusion que comprende un dominio de union al ADN, en donde el dominio de union al ADN comprende o consiste en motivos efectores TAL de una protema efectora TAL y el dominio de escision no espedfico de una nucleasa de restriccion. La protema de fusion de la invencion que, ademas, se emplea en el metodo de la invencion mas abajo retiene, o retiene esencialmente, la actividad enzimatica de la endonucleasa de la invencion. De acuerdo con la presente invencion, dicha actividad endonucleasa (ademas, denominada funcion) se retiene esencialmente si al menos se retiene el 60 % de la actividad biologica de la actividad endonucleasa. Preferentemente, se retiene al menos el 75 % o al menos el 80 % de la actividad endonucleasa. Mas preferido es que se retiene al menos 90 % tal como al menos 95 %, incluso mas preferido al menos 98 % tal como al menos 99 % de la actividad biologica de la endonucleasa. Lo mas preferido es que la actividad biologica se retenga completamente, es decir, hasta el 100 %. Ademas, de acuerdo con la invencion, se contemplan protemas de fusion que tienen una actividad biologica aumentada en comparacion con la endonucleasa cuando no esta fusionada a un dominio de union a ADN, es decir, mas del 100 % de la actividad. Los metodos para evaluar la actividad biologica de las endonucleasas (de restriccion) se conocen bien por el experto en la tecnica e incluyen, sin limitacion, la incubacion de una endonucleasa con ADN recombinante y el analisis de los productos de la reaccion mediante electroforesis en gel (Bloch KD.; Curr Protoc Mol Biol 2001; Capftulo 3:Unidad 3.2).

El termino "protema efectora TAL", como se usa en la presente descripcion, se refiere a protemas que pertenecen a la familia de protemas TAL (similar a activador de la transcripcion). Estas protemas se expresan por los patogenos bacterianos de las plantas del genero Xanthomonas. Los miembros de la gran familia de efectores TAL son factores clave de la virulencia de Xanthomonas y reprograman las celulas huesped mediante la imitacion de los factores de transcripcion eucarioticos. La patogenicidad de muchas bacterias depende de la inyeccion de protemas efectoras a traves de la secrecion de tipo III en celulas eucarioticas para manipular los procesos celulares. Las protemas efectoras TAL de Xanthomonas patogenicos de plantas son factores de virulencia importantes que actuan como activadores transcripcionales en el nucleo de la celula vegetal. PthXo1, una protema efectora TAL de unas Xanthomonas patogena de arroz, activa la expresion del gen del arroz Os8N3, que permite que Xanthomonas colonice las plantas de arroz. Las protemas efectoras TAL se caracterizan por un dominio central de repeticiones en tandem, es dedr, un dominio de union al ADN, asf como tambien senales de localizacion nuclear (NLS) y un dominio de activacion transcripcional acido. Los miembros de esta familia de efectores estan altamente conservados y difieren principalmente en la secuencia de aminoacidos de sus repeticiones y en el numero de repeticiones. El numero y el orden de las repeticiones en una protema efectora TAL determinan su actividad espedfica. Estas repeticiones son referidas en la presente descripcion como "motivos efectores TAL". Un miembro ilustrativo de esta familia de efectores, AvrBs3 de Xanthomonas campestris pv. vesicatoria, contiene 17,5 repeticiones e induce la expresion de los genes UPA (regulado positivamente por AvrBs3), que incluye el gen de resistencia Bs3 en plantas de pimiento (Kay, y otros 2005 Mol Plant Microbe Interact 18(8): 838-48; Kay, S. y U. Bonas 2009 Curr Opin Microbiol 12(1): 37-43). Las repeticiones de AvrBs3 son esenciales para la union al ADN de AvrBs3 y representan un tipo distinto de dominio de union al ADN. El mecanismo de reconocimiento del ADN en una secuencia espedfica se dilucido mediante estudios recientes de las protemas AvrBs3, Hax2, Hax3 y Hax4 que revelaron el codigo de reconocimiento del ADN de los efectores TAL (Boch, J., y otros 2009 Science 326: 1509-12).

Los motivos o repeticiones efectores Tal son motivos de secuencia de protema de 32 a 34 aminoacidos. Las secuencias de aminoacidos de las repeticiones son conservadas, excepto para dos residuos adyacentes altamente variables (en las posiciones 12 y 13) que determinan la especificidad hacia las bases del ADN A, G, C o T. En otras palabras, la union al ADN se realiza mediante el contacto de un nucleotido de la doble helice del ADN con los residuos variables en la posicion 12 y 13 dentro del motivo efector TAL de una protema efectora TAL particular (Boch, J., y otros 2009 Science 326: 1509 12). Por lo tanto, se encontro una correspondencia uno a uno entre las repeticiones secuenciales en las protemas efectoras TALy los nucleotidos secuenciales en el ADN diana. Cada motivo efector TAL reconoce principalmente un solo nucleotido dentro del sustrato de ADN. Por ejemplo, la combinacion de histidina en la posicion 12 y acido aspartico en la posicion 13 se une espedficamente a la citosina; la combinacion de asparagina en ambas, la posicion 12 y en la posicion 13 se une espedficamente a la guanina; la combinacion de asparagina en la posicion 12 e isoleucina en la posicion 13 se une espedficamente a la adenina y la combinacion de asparagina en la posicion 12 y la glicina en la posicion 13 se une espedficamente a la timina. La union a secuencias de ADN mas largas se logra mediante la union en tandem de varios de estos motivos efectores TAL para formar un "dominio de union al ADN de una protema efectora TAL". Por lo tanto, un dominio de union al ADN de una protema efectora TAL se refiere a los dominios de union al ADN que se encuentran en las protemas efectoras TAL de origen natural, asf como tambien a los dominios de union al ADN disenados para unirse a una secuencia de nucleotidos diana espedfica como se describio en los ejemplos mas abajo. El uso de tales dominios de union al ADN de las protemas efectoras TAL para la generacion de las protemas de fusion- motivo efector TAL/ nucleasaque reconocen y escinden una secuencia diana espedfica depende de la generacion adecuada de dominios de union al ADN de las protemas efectoras TAL que pueden reconocer espedficamente dicha diana particular. Los metodos para la generacion de dominios de union al ADN de las protemas efectoras TAL se conocen bien en la tecnica (Zhang y otros (2011). Nat Biotechol. 29, 149-153; Cermaky otros (2011). Nucleic Acis Res. April 14, identificador de PubMed 21493687).

Preferentemente, el dominio de union al ADN se deriva de los motivos efectores TAL que se encuentran en las protemas efectoras TAL de origen natural, tales como por ejemplo las protemas efectoras TAL seleccionadas del grupo que consiste en AvrBs3, Hax2, Hax3 o Hax4 (Bonas y otros 1989. Mol Gen Genet 218(1): 127-36; Kay y otros 2005 Mol Plant Microbe Interact 18(8): 838-48).

Se contemplan, de acuerdo con la presente invencion, protemas de fusion que se proporcionan como un dominio de union al ADN de una protema efectora TAL acoplada con un unico dominio nucleasa. Estas protemas monomericas pueden combinarse para actuar como un dfmero funcional para desarrollar actividad nucleasa a traves de la cooperacion de dos dominios nucleasa, cada uno de los cuales es parte de una protema de fusion.

Preferentemente, la nucleasa TAL de acuerdo con la presente invencion comprende mas de uno, es decir, varios motivos efectores TAL, tal como al menos 12 motivos efectores TAL, tal como, por ejemplo, al menos 14 o al menos 16 motivos efectores TAL. Con mayor preferencia, la nucleasa TAL comprende al menos 18 motivos efectores TAL. En otras palabras, el dominio de union al ADN de una protema efectora TAL dentro de dicha protema de fusion comprende al menos 18 motivos efectores TAL. En el caso de protemas de fusion que consisten en dfmeros, como se describio anteriormente, esto significa que cada monomero de protema de fusion comprende al menos nueve motivos efectores TAL. Los metodos para evaluar la especificidad de union al ADN de una protema de fusion de acuerdo con la presente invencion son conocidos por el experto en la tecnica e incluyen, sin limitacion, los ensayos de genes reporteros de la transcripcion y los ensayos de cambio de movilidad electroforetica (EMSA).

Preferentemente, el sitio de union de la protema de fusion es de hasta 500 nucleotidos, tal como hasta 250 nucleotidos, hasta 100 nucleotidos, hasta 50 nucleotidos, hasta 25 nucleotidos, hasta 10 nucleotidos tal como hasta 5 nucleotidos en el extremo 5' (es decir, 5') o en el extremo 3' (es decir 3') del nucleotidos(s) que es/son modificados de acuerdo con el metodo de la presente invencion como se detalla mas abajo.

En otra modalidad, la invencion se refiere a un vector que codifica la molecula de acido nucleico de la invencion.

El termino "vector" de acuerdo con la invencion significa, preferentemente, un plasmido, cosmido, virus, bacteriofago u otro vector usado, por ejemplo, convencionalmente en ingeniena genetica, que es portador de la molecula de acido nucleico de la invencion que codifica el peptido o la protema de fusion de la invencion. En consecuencia, la molecula de acido nucleico de la invencion puede insertarse en diversos vectores disponibles comercialmente. Los ejemplos no limitantes incluyen, vectores de plasmidos procarioticos, tales como los de las series pUC, pBluescript (Stratagene), las series pET de vectores de expresion (Novagen) o pCRTOPO (Invitrogen) y vectores compatibles con la expresion en celulas de mairnferos como pREP (Invitrogen), pcDNA3 (Invitrogen), pCEP4 (Invitrogen), pMCIneo (Stratagene), pXT1 (Stratagene), pSG5 (Stratagene), EBO-pSV2neo, pBPV-1, pdBPVMMTneo, pRSVgpt, pRSVneo, pSV2-dhfr, plZD35, pLXIN, pSIR (Clontech), pIRES-EGFP (Clontech), pEAK-10 (Edge Biosystems) pTriEx-Hygro (Novagen) y pCINeo (Promega). Los ejemplos para los vectores de plasmidos adecuados para Pichia pastoris comprenden, por ejemplo, los plasmidos pAO815, pPIC9K y pPIC3.5K (todos de Invitrogen).

La molecula de acido nucleico de la presente invencion mencionada anteriormente puede insertarse, ademas, en vectores de manera que se genere una fusion traduccional (adicional) con otra molecula de acido nucleico. Para este objetivo, puede aplicarse el PCR por extension de superposicion (por ejemplo Wurch, T., Lestienne, F., y Pauwels, P.J., A modified overlap extension PCR method to create chimeric genes in the absence of restriction enzymes, Biotechn. Techn. 12, 9, Sept. 1998, 653-657). Los productos que surgen de este proceso se denominan protemas de fusion y se describiran adicionalmente mas abajo. Las otras moleculas de acido nucleico pueden codificar una protema que puede, por ejemplo, aumentar la solubilidad y/o facilitar la purificacion de la protema codificada por la molecula de acido nucleico de la invencion. Los ejemplos no limitantes incluyen pET32, pET41, pET43. Los vectores pueden contener, ademas, un acido nucleico expresable adicional que codifica para una o mas chaperonas con el proposito de facilitar el plegamiento correcto de la protema. Los huespedes para la expresion bacteriana adecuados comprenden, por ejemplo, las cepas derivadas a partir de BL21 (tales como BL21 (DE3), BL21 (DE3)PlysS, BL21 (DE3)RIL, BL21 (DE3)PRARE) o Rosetta®.

Los plasmidos particularmente preferidos que pueden usarse para introducir el acido nucleico que codifica el polipeptido de la invencion, quetiene la actividad de una endonucleasa, en la celula huesped son: pUC18/l9 (Roche Biochemicals), pBluescript II (Alting-Mees, y otros (1992). Meth. Enzymol., 216, 483-495), pKK-177-3H (Roche Biochemicals), pBTac2 (Roche Biochemicals), pKK223-3 (Amersham Pharmacia Biotech), pKK-233-3 (Stratagene) y pET (Novagen).

Para las tecnicas de modificacion de vectores, ver Sambrooky Russel, 2001. Generalmente, los vectores pueden contener uno o mas ongenes de replicacion (ori) y sistemas de herencia para la clonacion o expresion, uno o mas marcadores para la seleccion en el huesped, por ejemplo, de resistencia a antibioticos, y uno o mas casetes de expresion. Los ongenes de replicacion adecuados incluyen, por ejemplo, los ongenes de replicacion Col E1, el SV40 viral y el M13.

Las secuencias codificantes insertadas en el vector pueden, por ejemplo, sintetizarse mediante metodos estandar, o aislarse a partir de fuentes naturales. La ligacion de las secuencias codificantes a elementos reguladores de la transcripcion y/o a otras secuencias codificantes de aminoacidos puede realizarse mediante el uso de metodos establecidos. Los elementos reguladores de la transcripcion (partes de un casete de expresion) que aseguran la expresion en celulas procarioticas o eucarioticas se conocen bien por los expertos en la tecnica. Estos elementos comprenden secuencias reguladoras que garantizan el inicio de la transcripcion (por ejemplo, codon de inicio de la traduccion, secuencias de terminacion de la transcripcion, promotores, potenciadores y/o aisladores), sitios internos de entrada ribosomal (IRES) y, opcionalmente, senales poli-A que garantizan la terminacion de la transcripcion y la estabilidad del transcrito. Los elementos reguladores adicionales pueden incluir potenciadores transcripcionales asf como tambien traduccionales, y/o regiones promotoras heterologas o asociadas naturalmente. Los elementos reguladores pueden ser elementos reguladores heterologos. Preferentemente, la molecula de acido nucleico de la invencion se une operativamente a tales secuencias de control de la expresion que permiten la expresion en celulas procarioticas o eucarioticas. El vector puede comprender, ademas, secuencias de nucleotidos que codifican senales de secrecion como elementos reguladores adicionales. Tales secuencias se conocen bien por el experto en la tecnica. Ademas, en dependencia del sistema de expresion usado, las secuencias lfder, capaces de dirigir el polipeptido expresado hacia un compartimento celular, pueden anadirse a la secuencia codificante de la molecula de acido nucleico de la invencion. Tales secuencias lfder se conocen bien en la tecnica. Los vectores disenados espedficamente permiten la transferencia de ADN entre diferentes huespedes, tales como entre las celulas bacterianas-fungicas o celulas bacterianas-animales.

La cotransfeccion con un marcador de seleccion, tal como kanamicina o genes de resistencia a la ampicilina para el cultivo en E. coli y otras bacterias, permite la identificacion y el aislamiento de las celulas transfectadas. Los marcadores de seleccion para el cultivo de celulas de marnfferos son los genes de resistencia dhfr, gpt, neomicina, e higromicina. Ademas, el acido nucleico transfectado puede amplificarse, para expresar grandes cantidades del polipeptido codificado. El marcador DHFR (dihidrofolato reductasa) es util para desarrollar lmeas celulares que portan varios cientos o incluso varios miles de copias del gen de interes. Otro marcador de seleccion util es la enzima glutamina sintasa (GS) (Fisher y otros, Infect Immun. 1991 Oct;59(10):3562-5; Bebbington y otros, Biotechnology (N Y). 1992 Feb;10(2):169-75).

Mediante el uso de tales marcadores, las celulas se cultivan en medio selectivo y se seleccionan las celulas con la mayor resistencia.

En otra modalidad, la invencion se refiere a una celula huesped que comprende, por ejemplo, como un resultado de la transformacion, transduccion, microinyeccion o transfeccion, la molecula de acido nucleico o el vector de la invencion.

Puede concebirse una diversidad de sistemas de expresion del huesped para expresar la secuencia codificante de la endonucleasa en una celula huesped mediante el uso de un vector adecuado.

La "celula huesped" de acuerdo con la invencion puede producirse mediante la introduccion de la molecula de acido nucleico o el vector(es) de la invencion en la celula huesped que, en su presencia, preferentemente, media la expresion de la molecula de acido nucleico de la invencion que codifica la endonucleasa de la invencion. El huesped a partir del cual se deriva la celula huesped puede ser cualquier celula procariotica o eucariotica.

Una celula huesped eucariotica adecuada puede ser una celula de vertebrado, una celula de anfibio, una celula de pez, una celula de insecto, una celula de hongo/levadura, una celula de nematodo o una celula vegetal. La celula de insecto puede ser una celula de Spodoptera frugiperda, una celula de Drosophila S2 o una celula de Spodoptera Sf9, la celula de hongo/levadura puede ser una celula de Saccharomyces cerevisiae, celula de Pichia pastoris o una celula de Aspergillus. Se prefiere que la celula de vertebrado sea una celula de mairnfero tal como una celula humana, CHO, COS, 293 o celulas de melanoma de Bowes. La celula vegetal se selecciona, preferentemente, independientemente de una celula de Anacardium, Anona, Arachis, Artocarpus, Asparagus, Atropa, Avena, Brassica, Carica, Citrus, Citrullus, Capsicum, Carthamus, Cocos, Coffea, Cucumis, Cucurbita, Daucus, Elaeis, Fragaria, Glycine, Gossypium, Helianthus, Heterocallis, Hordeum, Hyoseyamus, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Malus, Manihot, Majorana, Medicago, Nicotiana, Olea, Oryza, Panieum, Pannesetum, Passiflora, Persea, Phaseolus, Pistachia, Pisum, Pyrus, Prunus, Psidium, Raphanus, Ricinus, Secale, Senecio, Sinapis, Solanum, Sorghum, Theobromus, Trigonella, Triticum, Vicia, Vitis, Vignay Zea. La celula puede ser una parte de una lmea celular. La celula vegetal puede, por ejemplo, derivarse a partir de la rafz, la hoja, la corteza, la aguja, el tronco o el tallo.

Los procariotas adecuados (bacterias) utiles como huesped para la invencion son aquellas que se usan generalmente para la clonacion y/o la expresion, como E. coli (por ejemplo, las cepas de E coli BL21, HB101, DH5a, XL1 Blue, Y1090 y JM101), Salmonella typhimurium, Serratia marcescens, Burkholderia glumae, Pseudomonas putida, Pseudomonas fluorescens, Pseudomonas stutzeri, Streptomyces lividans, Lactococcus lactis, Mycobacterium smegmatis, Streptomyces o Bacillus subtilis. Los medios y condiciones de cultivo apropiados para las celulas huesped descritas anteriormente son conocidos en la tecnica.

Los ejemplos preferidos para que la celula huesped sea modificada mediante ingeniena genetica con la molecula de acido nucleico o el vector(es) de la invencion es una celula de levadura, E. coli y/o una especie del genero Bacillus (por ejemplo, B. subtilis). La celula huesped mas preferida es Bacillus spec..

En una modalidad adicional, la invencion se refiere a un metodo para producir una protema o fusion que tiene la actividad de una endonucleasa como se definio anteriormente en la presente descripcion que comprende las etapas: (a) cultivar la celula huesped de la invencion y (b) aislar la protema que se produce o la protema de fusion que tiene la actividad de dicha endonucleasa.

Las condiciones adecuadas para el cultivo de un huesped procariotico o eucariotico se conocen bien por el experto en la tecnica. Las condiciones adecuadas para cultivar E. coli DH18BAkat E (Invitrogen), Pichia pastoris o Aspergillus niger son, por ejemplo, proporcionadas en los ejemplos de la invencion. En general, las condiciones adecuadas para el cultivo de bacterias son las que facilitan el crecimiento de estas bajo aireacion, en medio Luria Bertani (LB). Para aumentar el rendimiento y la solubilidad del producto de expresion, el medio puede tamponarse o complementarse con aditivos adecuados conocidos porque mejoran o facilitan ambos. La E. coli puede cultivarse desde 4 a aproximadamente 37 °C, la temperatura exacta o la secuencia de temperaturas depende de la molecula que se va a expresar en exceso. En general, Aspergillus sp. puede crecerse sobre agar Sabouraud dextrosa, o agar de patata dextrosa a aproximadamente de 10 °C a aproximadamente 40 °C, y preferentemente, a aproximadamente 25 °C. Se conocen las condiciones adecuadas para los cultivos de levadura, por ejemplo de Guthrie y Fink, "Guide to Yeast Genetics and Molecular Cell Biology" (2002); Academic Pr Inc.. El experto en la tecnica es consciente, ademas, de todas estas condiciones y puede, adaptar estas condiciones aun mas a las necesidades de una especie huesped particular y a los requisitos del polipeptido expresado. En el caso de que un promotor inducible controle el acido nucleico de la invencion en el vector presente en la celula huesped, la expresion del polipeptido puede inducirse mediante la adicion de un agente inductor apropiado. Los protocolos y estrategias de expresion adecuados son conocidos por el experto en la tecnica.

En dependencia del tipo de celula y de sus requisitos espedficos, el cultivo de celulas de marnfferos puede realizarse, por ejemplo, en medio RpMI o DMEM que contiene FCS 10 % (v/v), L-glutamina 2mM y penicilina/estreptomicina 100 U/mL. Las celulas pueden mantenerse a 37 °C en una atmosfera saturada de agua, al 5 % de CO2.

Los protocolos de expresion adecuados para celulas eucarioticas se conocen bien por el experto en la tecnica y pueden retomarse, por ejemplo, de Sambrook, 2001.

Los metodos de aislamiento del polipeptido producido se conocen bien en la tecnica y comprenden, sin limitacion, las etapas de los metodos tales como cromatograffa de intercambio ionico, cromatograffa de filtracion en gel (cromatograffa de exclusion portamano), cromatograffa de afinidad, cromatograffa lfquida de alta presion (HPLC), HPLC de fase inversa, electroforesis en gel de disco o inmunoprecipitacion, ver, por ejemplo, Sambrook, 2001.

La etapa de aislamiento de protemas es, preferentemente, una etapa de la purificacion de protemas. La purificacion de protemas, de acuerdo con la invencion, especifica un proceso o una serie de procesos destinados a aislar mas aun el polipeptido de la invencion a partir de una mezcla compleja, preferentemente, para la homogeneidad. Las etapas de purificacion, por ejemplo, explotan las diferencias en el tamano de las protemas, las propiedades fisicoqmmicas y la afinidad de union. Por ejemplo, las protemas pueden purificarse de acuerdo con sus puntos isoelectricos mediante su paso a traves de un gel con un gradiente de pH o una columna de intercambio ionico. Ademas, las protemas pueden separarse de acuerdo con su tamano o peso molecular mediante cromatograffa de exclusion por tamano, o mediante el analisis de SDS-PAGE (electroforesis en gel de dodecil sulfato de sodio y poliacrilamida). En la tecnica, con frecuencia las protemas se purifican mediante el uso de 2D-PAGE y despues se analizan mas aun mediante la huella peptfdica para establecer la identidad de la protema. Esto es muy util para fines cientfficos y los lfmites de deteccion para las protemas son muy bajos, y para su analisis son suficientes las cantidades en nanogramos de protema. Ademas, las protemas pueden separarse por su polaridad/hidrofobicidad mediante cromatograffa lfquida de alto rendimiento o cromatograffa de fase inversa. Por lo tanto, los metodos para la purificacion de protemas se conocen bien por el experto en la tecnica.

Ademas, en una modalidad la invencion se refiere a una protema o protema de fusion que tiene la actividad de una endonucleasa codificada por la molecula de acido nucleico o vector de la invencion.

Las definiciones para las protemas o protemas de fusion que tienen la actividad de una endonucleasa codificada por la molecula de acido nucleico o el vector de la invencion, proporcionadas en las modalidades anteriores, pertenecientes a la molecula de acido nucleico o vector de la invencion se aplican explfcitamente, ademas, a esta modalidad.

Como una consecuencia de su actividad endonucleasa, otra modalidad de la invencion se refiere al uso de la protema o protema de fusion de la invencion para escindir una molecula de acido nucleico, por ejemplo, en uno de los metodos de la invencion descritos mas abajo.

Adicionalmente, la presente invencion se refiere, ademas, a un kit que comprende la molecula de acido nucleico, la protema y/o la protema de fusion de la invencion. Los diversos componentes del kit pueden empaquetarse en uno o mas contenedores, tales como uno o mas frascos. Los frascos pueden, ademas de los componentes, comprender conservantes o tampones para almacenamiento. Ademas, el kit puede contener las instrucciones para usar.

En otra modalidad, la invencion se refiere a un metodo in vitro para modificar una secuencia diana en el genoma de una celula eucariotica, el metodo comprende la etapa: (a) introducir en dicha celula la molecula de acido nucleico, el vector o la protema o protema de fusion como se define en las reivindicaciones.

El termino "modificar" como se usa de acuerdo con la presente invencion se refiere a manipulaciones genomicas aleatorias y en sitios espedficos que resultan en cambios en la secuencia de nucleotidos del genoma del huesped eucariotico. Cuando se introduce la protema de fusion de la invencion, se logra la modificacion en un sitio espedfico de dicha "secuencia diana" en el genoma a traves del dominio de union al ADN. Cuando solamente se introduce la protema de la invencion, la "secuencia diana" no es una secuencia espedfica, porque la endonucleasa novedosa no es espedfica de un sitio. Por lo tanto, la protema de la invencion puede usarse para introducir mutaciones aleatorias en un genoma, es decir, la "secuencia diana" se produce multiples veces en el genoma y no depende de un motivo espedfico de una secuencia. El material genetico que comprende estos cambios en su secuencia de nucleotidos es referido, ademas, en la presente descripcion como la "secuencia diana modificada" cuando la modificacion es en un sitio espedfico como, por ejemplo, en el caso de usar la protema de fusion de la invencion. El termino "modificacion" incluye, pero no se limita a, sustitucion, insercion y delecion de uno o mas nucleotidos dentro de la secuencia diana. En el proceso de recombinacion homologa, el producto final puede reflejar una delecion de secuencias. Como comprendera el experto en la tecnica, una recombinacion homologa, por otra parte, siempre incluye, ademas, la incorporacion de material genetico de la secuencia de ADN donante, que en esta modalidad, sin embargo, conduce a una delecion total. Se comprendera por el experto en la tecnica que, mediante la simple introduccion de roturas de doble hebra en el genoma de una celula, pueden introducirse modificaciones que son el resultado de una recombinacion homologa (en la presencia y ausencia de secuencias donantes exogenas) o una reparacion endogena del ADN, mecanismos tales como, por ejemplo, la reparacion de ADN mediante la union de extremos no homologos (NHEJ), que es propensa a la introduccion de pequenas deleciones en el sitio de la rotura de doble hebra en el curso de la ligadura de los extremos rotos.

El termino "sustitucion", como se usa en la presente descripcion, se refiere al reemplazo de nucleotidos con otros nucleotidos. El termino incluye, por ejemplo, el reemplazo de nucleotidos individuales que resultan en mutaciones puntuales. Dichas mutaciones puntuales pueden conducir a un intercambio de aminoacidos en el producto proteico resultante, pero ademas, pueden no reflejarse a nivel de los aminoacidos. El termino "sustitucion" contempla, ademas, las mutaciones que resultan en el reemplazo de multiples nucleotidos, tales como, por ejemplo, partes de genes, tales como partes de exones o intrones, asf como tambien el reemplazo de genes completos.

El termino "insercion" de acuerdo con la presente invencion se refiere a la incorporacion de uno o mas nucleotidos en una molecula de acido nucleico. El termino "insercion" contempla, ademas, la insercion de partes de genes, tales como partes de exones o intrones, asf como tambien la insercion de genes completos. Cuando el numero de nucleotidos insertados no es divisible portres, la insercion puede resultar en una mutacion con desplazamiento del marco de lectura dentro de una secuencia codificante de un gen. Tales mutaciones con desplazamiento del marco de lectura alteraran los aminoacidos codificados por un gen despues de la mutacion. En algunos casos, tal mutacion causara que la traduccion activa del gen encuentre un codon de parada prematuro, lo que resulta en una terminacion de la traduccion y en la produccion de una protema truncada. Cuando el numero de nucleotidos insertados es, en cambio, divisible por tres, la insercion resultante es una "insercion en el marco de lectura". En este caso, el marco de lectura permanece intacto despues de la insercion y la traduccion probablemente se completara si los nucleotidos insertados no codifican para un codon de parada. Sin embargo, debido a los nucleotidos insertados, la protema resultante contendra, en dependencia del tamano de la insercion, uno o varios aminoacidos nuevos que pueden afectar la funcion de la protema.

El termino "delecion" como se usa de acuerdo con la presente invencion se refiere a la perdida de nucleotidos o parte de genes, tales como exones o intrones, asf como tambien a genes completos. Como se definio con respecto al termino "insercion", la delecion de una cantidad de nucleotidos que no es divisible de manera equitativa entre tres, conducira a una mutacion con desplazamiento del marco de lectura que causa que todos los codones que se producen despues de la delecion se lean incorrectamente durante la traduccion, lo que produce, potencialmente, una protema gravemente alterada y, muy probablemente, no funcional. Si una delecion no resulta en una mutacion con desplazamiento del marco de lectura, es decir, debido a que el numero de nucleotidos delecionados puede dividirse en tres, la protema resultante no obstante se ve alterada, ya que carecera, en dependencia del tamano de la delecion, de varios aminoacidos que pueden afectar o efectuar la funcion de la protema.

Las modificaciones definidas anteriormente no se limitan a las regiones codificantes en el genoma, sino que pueden ocurrir, ademas, en regiones no codificantes del genoma diana, por ejemplo, en regiones reguladoras tales como elementos promotores, o potenciadores, o en intrones.

Los ejemplos de modificaciones del genoma diana incluyen, sin ser limitantes, la introduccion de mutaciones en un gen de tipo silvestre para analizar su efecto sobre la funcion del gen; el reemplazo de un gen completo con un gen mutado o, alternativamente, si la secuencia diana comprende mutaciones, la alteracion de estas mutaciones para identificar que mutacion es la causante de un efecto particular; la eliminacion de genes completos o protemas o la eliminacion de elementos reguladores de genes o protemas, asf como tambien la introduccion de asociados de fusion, tales como por ejemplo etiquetas de purificacion tales como la etiqueta his o la etiqueta tap, etcetera. En el ultimo caso, el termino "adicion" puede usarse, ademas, en lugar de "insercion" para describir la adicion preferente de una etiqueta a un extremo de un polipeptido mas que dentro de la secuencia de un polipeptido

El termino "celula eucariotica", como se usa en la presente descripcion, se refiere a cualquier celula de un organismo eucariotico unicelular o multicelular, que incluye las celulas de animales como los vertebrados y de los hongos y plantas. Preferentemente, pero sin limitacion, la celula es una celula de mamffero. El termino "celula de mairnfero", como se usa en la presente descripcion, se conoce bien en la tecnica y se refiere a cualquier celula que pertenece a un animal que se agrupa en la clase de mamfferos. El termino "celula", como se usa en relacion con la presente descripcion, puede referirse a una celula unica y/o aislada o a una celula que es parte de una entidad multicelular, tal como un tejido, un organismo o a una celula de otro cultivo. En otras palabras, el metodo puede realizarse in vivo, ex vivo o in vitro. El metodo de la invencion se realiza in vitro, como se define en las reivindicaciones. En dependencia del objetivo particular para lograrse a traves de la modificacion del genoma de una celula de mamffero, pueden usarse celulas de diferentes subclases de mamfferos, tales como prototerios o terios. Por ejemplo, dentro de la subclase de terios, preferentemente, celulas de animales de la subclase euteria, con mayor preferencia del orden primates, artiodactyla, perissodactyla, rodentia y lagomorpha se usan en el metodo de la invencion como se detalla mas abajo. Ademas, dentro de una especie, puede elegirse una celula para usar en el metodo de la invencion basado en el tipo de tejido y/o la capacidad para diferenciarse igualmente en dependencia del objetivo para lograrse al modificar el genoma. Tres categonas basicas de celulas conforman el cuerpo de los mamfferos: celulas germinales, celulas somaticas y celulas madre. Una celula germinal es una celula que da lugar a gametos y, por lo tanto, es continua a traves de las generaciones. Las celulas madre pueden dividirse y diferenciarse en diversos tipos de celulas especializadas, asf como tambien autorrenovarse para producir mas celulas madre. En los mamfferos hay dos tipos principales de celulas madre: celulas madre embrionarias y celulas madre adultas. Las celulas somaticas incluyen todas las celulas que no son gametos, gametocitos o celulas madre indiferenciadas. Las celulas de un mamffero pueden agruparse, ademas, porsu capacidad para diferenciarse. Una celula totipotente (conocida ademas como omnipotente) es una celula que es capaz de diferenciarse en todos los tipos de celulas de un organismo adulto, que incluyen el tejido placentario, tal como un cigoto (ovocito fecundado) y blastomeros posteriores, mientras que las celulas pluripotentes, tales como celulas madre embrionarias, no pueden contribuir al tejido extraembrionario tal como la placenta, pero tienen el potencial de diferenciarse en cualquiera de las tres capas germinales endodermo, mesodermo y ectodermo. Las celulas progenitoras multipotentes tienen el potencial de dar lugar a celulas de multiples, pero numero limitado de linajes celulares. Ademas, hay celulas oligopotentes que pueden desarrollarse solamente en unos pocos tipos de celulas y celulas unipotentes (a veces denominadas celulas precursoras) que pueden convertirse solamente en un tipo de celula. Hay cuatro tipos basicos de tejidos: tejido muscular, tejido nervioso, tejido conectivo y tejido epitelial del que pueden derivarse una celula que va a usarse en el metodo de la invencion, tal como por ejemplo, celulas madre hematopoyeticas o celulas madre neuronales. En la medida en que se prevean celulas humanas para usar en el metodo de la invencion, se prefiere que tal celula humana no se obtenga a partir de un embrion humano, en particular no a traves de metodos que impliquen la destruccion de un embrion humano. Por otra parte, las celulas madre embrionarias humanas estan a disposicion de los expertos en la tecnica, tal como las que se toman a partir de las lmeas de celulas madre embrionarias existentes, comercialmente disponibles. En consecuencia, en la presente invencion puede trabajarse con celulas madre embrionarias humanas sin necesidad de usar o destruir un embrion humano. Alternativamente, o en lugar de celulas madre embrionarias humanas, pueden usarse celulas pluripotentes que se asemejan a las celulas madre embrionarias tales como las celulas madre pluripotentes inducidas (iPS), cuya generacion se establece como estado de la tecnica (Hargus G y otros, Proc Natl Acad Sci U S A 107:15921-15926; Jaenisch R. y Young R., 2008, Cell 132:567-582; Saha K, y Jaenisch R., 2009, Cell Stem Cell 5:584-595).

El termino "moleculas de acido nucleico que codifican dicha protema o protema de fusion en forma expresable" se refiere a una molecula de acido nucleico que, al expresarse en una celula o un sistema libre de celulas, resulta en una protema funcional o protema de fusion de la invencion. Preferentemente, pero sin limitacion, dicho acido nucleico es ARNm. Alternativamente, pueden usarse el ADN que tiene senales de transcripcion apropiadas para permitir la expresion, o el ADNc.

La introduccion de la protema, protema de fusion, o de la molecula de acido nucleico que codifica dicha protema, y la protema de fusion en forma expresable dentro de una celula, pueden lograrse mediante los metodos conocidos en la tecnica, y depende de la naturaleza de dichas protemas o moleculas de acido nucleico. Por ejemplo, y en el caso de la introduccion de moleculas de acido nucleico, dicha introduccion puede lograrse mediante metodos basados en qmmicos (fosfato de calcio, liposomas, DEAE-dextran, polietilenimina, nucleofeccion), metodos no qmmicos (electroporacion, sonoporacion, transfeccion optica, electrotransferencia de genes, administracion hidrodinamica), metodos basados en partroulas (pistola de genes, magnetofeccion, impalefeccion) y metodos virales. Preferentemente, las moleculas de acido nucleico son para introducirse en el nucleo mediante metodos tales como, por ejemplo, microinyeccion o nucleofeccion. Los metodos para realizar la microinyeccion se conocen bien en la tecnica y se describen, por ejemplo, en Nagy y otros (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003. Manipulating the Mouse Embryo. Cold Spring Harbour, New York: Cold Spring Harbour Laboratory Press) asf como tambien en los ejemplos de la presente descripcion mas abajo. El experto en la tecnica entiende que, en dependencia del metodo de introduccion, puede ser ventajoso adaptar las moleculas de ADN. Por ejemplo, una molecula de ADN lineal puede ser mas eficiente en los eventos de recombinacion homologa cuando se usa la electroporacion como metodo para introducir dicha molecula de ADN en, por ejemplo, una celula de mairnfero, mientras que una molecula de ADN circular puede ser mas ventajosa cuando se inyectan las celulas.

Todas las definiciones y modalidades preferidas definidas anteriormente con respecto a la molecula de acido nucleico, protema o protema de fusion de la invencion se aplican, ademas, mutatis mutandis en el contexto del metodo de la invencion.

De acuerdo con la presente invencion, el termino "secuencia diana en el genoma" se refiere a la ubicacion genomica que se va a modificar por el metodo de la invencion. La "secuencia diana en el genoma" comprende, pero no se restringe a los nucleotidos sujetos a la modificacion particular. Ademas, y preferentemente con respecto a la protema de fusion de la invencion, el termino "secuencia diana en el genoma" comprende, ademas, las regiones para la union de secuencias homologas de una segunda molecula de acido nucleico. En otras palabras, el termino "secuencia diana en el genoma" comprende, ademas, la secuencia que flanquea/rodea el nucleotido(s) pertinente que va a modificarse. En algunos casos, el termino "secuencia diana" puede referirse, ademas, al gen completo que va a modificarse.

La union espedfica se definio anteriormente en la presente descripcion y garantiza que solamente las roturas de doble hebra se introduzcan dentro de dicha secuencia diana.

En una modalidad mas preferida del metodo de la invencion, la modificacion de dicha secuencia diana es mediante recombinacion homologa con una secuencia de acido nucleico donante, que comprende ademas la etapa: (b) introducir una molecula de acido nucleico en dicha celula, en donde dicha molecula de acido nucleico comprende dicha secuencia de acido nucleico donante, en donde dicha secuencia de ADN donante esta flanqueada hacia el extremo 5' por un primer elemento flanqueante y hacia el extremo 3' por un segundo elemento flanqueante, en donde dicho primer y segundo elementos flanqueantes son diferentes y en donde cada uno de dichos primer y segundo elementos flanqueantes son homologos a una secuencia continua de ADN a cada lado de la rotura de la doble hebra introducida en (a) del metodo de la invencion dentro de dicha secuencia diana en el genoma de dicha celula eucariotica.

El termino "recombinacion homologa", se usa de acuerdo con las definiciones proporcionadas en la tecnica. Por lo tanto, se refiere a un mecanismo de recombinacion genetica en el que dos hebras de ADN que comprenden secuencias de nucleotidos similares intercambian material genetico. Las celulas usan la recombinacion homologa, durante la meiosis, donde esta sirve para reorganizar el ADN para crear un conjunto totalmente unico de cromosomas haploides, pero ademas, para la reparacion del ADN danado, en particular para la reparacion de roturas de doble hebra. El mecanismo de recombinacion homologa se conoce bien por el experto en la tecnica y se ha descrito, por ejemplo, por Paques y Haber ( Paques F, Haber JE.; Microbiol Mol Biol Rev 1999; 63:349-404). En el metodo de la presente invencion, la recombinacion homologa de la secuencia donante se permite por la presencia de dicho primer y dicho segundo elemento flanqueante que se ubican hacia el extremo 5' (5') y hacia el extremo 3' (3'), respectivamente, de dicha secuencia de ADN donante cada uno de los cuales es homologo a una secuencia de ADN continua dentro de dicha secuencia diana.

De acuerdo con la presente invencion, el termino "secuencia de ADN donante" se refiere a una secuencia de ADN que sirve como un molde en el proceso de recombinacion homologa y que porta la modificacion que va a introducirse dentro la secuencia diana. Mediante el uso de esta secuencia de ADN donante como un molde, la informacion genetica, que incluye las modificaciones, se copia en la secuencia diana dentro del genoma de la celula por medio de recombinacion homologa. En los ejemplos no limitantes, la secuencia de acido nucleico donante puede ser esencialmente identica a la parte de la secuencia diana que va a reemplazarse, con la excepcion de un nucleotido que difiere y resulta en la introduccion de una mutacion puntual despues de la recombinacion homologa o esta puede consistir en un gen adicional previamente no presente en la secuencia diana. Es concebible que la naturaleza de la secuencia de ADN donante, es dedr, su longitud, composicion de bases, similitud con la secuencia diana, dependa de como se modificara la secuencia diana, asf como tambien el objetivo particular que se lograra mediante la modificacion de la secuencia diana. Los expertos en la tecnica entenderan que dicha secuencia de ADN donante esta flanqueada por secuencias que son homologas a las secuencias dentro de la secuencia diana para permitir que tenga lugar una recombinacion homologa que conduce a la incorporacion de la secuencia de ADN donante en el genoma de dicha celula. Ademas de ser homologos a una secuencia continua de ADN dentro del ADN genomico, el primer y el segundo elementos flanqueantes son diferentes para permitir que tenga lugar una recombinacion homologa dirigida.

El termino "homologo a una secuencia continua de ADN a cada lado de la rotura de doble hebra introducida en (a) del metodo de la invencion dentro de dicha secuencia diana", de acuerdo con la presente invencion, se refiere a regiones que tienen suficiente identidad de secuencia para asegurar la union espedfica a las secuencias diana que se encuentran hacia los extremos 5' y 3' de la ubicacion de la rotura de doble hebra. El termino "homologo" como se usa en la presente descripcion puede intercambiarse con el termino "identico" como se describe en la presente descripcion en otra parte con respecto a los niveles variables de identidad de secuencia. Los metodos para evaluar el nivel de identidad entre dos secuencias de acido nucleico se conocen bien en la tecnica y se describieron anteriormente en la presente descripcion. Estos metodos involucran programas, ademas de proporcionar un alineamiento de secuencia por pares, informan, ademas, el nivel de identidad de la secuencia (generalmente en porcentaje de identidad) y la probabilidad de que ocurra el alineamiento por azar (valor de P) y pueden usarse, ademas, para predecir la aparicion de la union espedfica.

Preferentemente, dicho primer y segundo elementos flanqueantes son "homologos a una secuencia de ADN continua dentro de dicha secuencia diana" (denominados en la tecnica, ademas, "brazos de homologfa") tienen una identidad de secuencia con la parte correspondiente de la secuencia diana de al menos 95 %, mas preferido al menos 97 %, mas preferido al menos 98 %, mas preferido al menos 99 %, incluso mas preferido al menos 99,9 % y el mas preferido 100 %. Las identidades de secuencia definidas anteriormente se definen solamente con respecto a aquellas partes de la secuencia diana que sirven como sitios de union para los brazos de homologfa, es decir, dicho primer y dicho segundo elementos flanqueantes. Por lo tanto, la identidad de secuencia global entre la secuencia diana completa y las regiones homologas de la molecula de acido nucleico de la etapa (b) del metodo de modificacion de una secuencia diana de la presente invencion puede diferir de las identidades de secuencia definidas anteriormente, debido a la presencia de la parte de la secuencia diana que va a reemplazarse por la secuencia de ADN donante.

Los elementos flanqueantes homologos a la secuencia diana comprendida en la molecula de ADN tienen una longitud de al menos 170 pb cada uno. Preferentemente, cada uno de los elementos tienen una longitud de al menos 250 nucleotidos, al menos 300 nucleotidos, al menos 400 nucleotidos, al menos 500 nucleotidos, tal como al menos 600 nucleotidos, al menos 750 pb de nucleotidos, con mayor preferencia al menos 1000 nucleotidos, tal como al menos 1500 nucleotidos, incluso con mayor preferencia al menos 2000 nucleotidos y con la maxima preferencia al menos 2500 nucleotidos. La longitud maxima de los elementos homologos a la secuencia diana comprendida en la molecula de acido nucleico depende del tipo de vector de clonacion usado y puede tener una longitud de hasta 20000 nucleotidos en plasmidos de alto numero de copias de E. coli que usan el origen de replicacion col El (por ejemplo, pBluescript) o hasta una longitud de 300000 nucleotidos cada uno en plasmidos que usan el origen del factor F (por ejemplo, en vectores BAC, tal como, por ejemplo, pTARBAC1).

Las moleculas de ADN que comprenden la secuencia de ADN donante y los elementos flanqueantes se modifican, necesariamente, si el sitio de union a la nucleasa espedfica de un sitio (protema de fusion) esta contenido sin interrupciones dentro de uno de los elementos flanqueantes y, preferentemente, si el sitio de union a la nucleasa espedfica de un sitio (protema de fusion) se interrumpe por la secuencia donante, es decir, una parte en cada uno de los elementos flanqueantes, de manera que la protema de fusion no introduzca una rotura de doble hebra en la secuencia del ADN donante como parte de una molecula de ADN. Cuando la protema de fusion es una TAL o una nucleasa dedo de zinc, esto puede lograrse, por ejemplo, mediante una modificacion ya sea en el motivo de union o de escision (ver Ejemplo 2, Figura 12).

Se apreciara por el experto en la tecnica que dicha molecula de ADN para introducirse en la celula en el item (b) del metodo de la invencion puede comprender toda una molecula de acido nucleico (secuencia) que codifica dicha protema de fusion en forma expresable y la molecula de acido nucleico que comprende la secuencia de acido nucleico donante y los elementos flanqueantes homologos a la secuencia diana. Alternativamente, la molecula de acido nucleico del item (b) puede ser una molecula de acido nucleico distinta, para introducirse adicionalmente a las moleculas de acido nucleico que codifican dicha protema de fusion en forma expresable del item (a).

En una modalidad preferida del metodo de la invencion se contempla, ademas, que dicha celula se analiza para la modificacion exitosa de dicha secuencia diana en el genoma.

Los metodos para analizar la presencia o ausencia de una modificacion se conocen bien en la tecnica e incluyen, sin limitacion, ensayos basados en la separacion ffsica de moleculas de acido nucleico, ensayos de secuenciacion, asf como tambien ensayos de escision y digestion, y analisis del ADN mediante la reaccion en cadena de la polimerasa (PCR).

Los ejemplos de ensayos basados en la separacion ffsica de moleculas de acido nucleico incluyen, sin limitacion, MALDITOF, electroforesis en gel de gradiente desnaturalizante y otros de tales metodos conocidos en la tecnica, ver por ejemplo Petersen y otros, Hum. Mutat. 20 (2002) 253-259; Hsia y otros, Theor. Appl. Genet. 111 (2005) 218-225; Tost and Gut, Clin. Biochem. 35 (2005) 335-350; Palais y otros, Anal. Biochem. 346 (2005) 167-175.

Los ejemplos de ensayos de secuenciacion comprenden, sin limitacion, los metodos de analisis de secuencia mediante secuenciacion directa, SSCP fluorescente en un secuenciador de ADN automatizado y pirosecuenciacion. Estos procedimientos son comunes en la tecnica, ver, por ejemplo, Adams y otros (Ed.), "Automated DNA Sequencing and Analysis", Academic Press, 1994; Alphey, "DNA Sequencing: From Experimental Methods to Bioinformatics", Springer Verlag Publishing, 1997; Ramon y otros, J. Transl. Med. 1 (2003) 9; Meng y otros., J. Clin. Endocrinol. Metab. 90 (2005) 3419-3422.

Los ejemplos de ensayos de escision y digestion incluyen, sin limitacion, ensayos de digestion de restriccion, tales como ensayos de polimorfismo de longitud de fragmentos de restriccion (ensayos de RFLP), ensayos de proteccion de RNasa, ensayos basados en metodos de escision qmmica y ensayos de escision de desapareamientos mediante enzimas, ver por ejemplo Youil y otros, Proc. Natl. Acad. Sci. U.S.A. 92 (1995) 87-91; Todd y otros, J. Oral Maxil. Surg. 59 (2001) 660 667; Amary otros, J. Clin. Microbiol. 40 (2002) 446-452.

Alternativamente, en vez de analizar las celulas para detectar la presencia o ausencia de la modificacion deseada, en particular, en el caso de la modificacion en una secuencia espedfica, las celulas modificadas exitosamente pueden seleccionarse mediante la incorporacion de marcadores de seleccion apropiados. Los marcadores de seleccion incluyen marcadores de seleccion positivos y negativos, que se conocen bien en la tecnica y se emplean habitualmente por el experto en la tecnica. Los ejemplos no limitantes de marcadores de seleccion incluyen dhfr, gpt, neomicina, higromicina, dihidrofolato reductasa, G418 o glutamina sintasa (GS) (Murphy y otros, Biochem J. 1991, 227:277; Bebbington y otros, Bio/Technology 1992, 10:169). Mediante el uso de estos marcadores, las celulas se cultivan en medio selectivo y se seleccionan las celulas con la mayor resistencia. Se contemplan, ademas, los marcadores de seleccion positiva/negativa combinados, que pueden incorporarse en el genoma diana mediante recombinacion homologa o integracion aleatoria. Despues de la seleccion positiva, el primer casete que comprende el marcador de seleccion positiva flanqueado por sitios de reconocimiento de recombinasa se intercambia mediante intercambio de casete mediado por recombinasa contra un segundo casete sin marcador. Despues, los clones que contienen el casete de intercambio deseado se obtienen mediante seleccion negativa.

En una modalidad preferida del metodo de la invencion, la celula se selecciona a partir del grupo que consiste en una celula de mairnfero o de vertebrado, una celula vegetal o una celula fungica.

En otra modalidad preferida del metodo de la invencion, la celula es un ovocito no humano.

Como se usa en la presente descripcion, el termino "ovocito" se refiere a la celula germinal femenina involucrada en la reproduccion, es decir, el ovulo o la celula huevo. De acuerdo con la presente invencion, el termino "ovocito" comprende ambos, los ovocitos antes de la fecundacion, asf como tambien los ovocitos fecundados que, ademas, se denominan cigotos. Por lo tanto, el ovocito antes de la fecundacion comprende solamente los cromosomas maternos, mientras que un ovocito despues de la fecundacion comprende los cromosomas maternos y paternos. Despues de la fecundacion, el ovocito permanece en un estado doble haploide durante varias horas, en ratones, por ejemplo, hasta 18 horas despues de la fecundacion. De acuerdo con la invencion, el ovocito puede ser no humano.

Ademas, se describe un metodo en donde el ovocito no humano es un ovocito fecundado. El termino "ovocito fecundado", como se usa en la presente descripcion, se refiere a un ovocito despues de la fusion con el esperma fecundante. Durante un penodo de muchas horas (tal como hasta 18 horas en ratones) despues de la fecundacion, el ovocito se encuentra en un estado doble haploide, que comprende un pronucleo haploide materno y un pronucleo haploide paterno. Despues de la migracion de los dos pronucleos juntos, sus membranas se rompen y los dos genomas se condensan en cromosomas, de esta manera se reconstituye un organismo diploide. Preferentemente, el ovocito de mamffero o aviar no humano usado en el metodo descrito es un ovocito de mamffero o aviar fecundado en el estado doble haploide.

En el caso de los ovocitos para usarse como celulas en el metodo de la invencion, la protema, la protema de fusion o la molecula de acido nucleico que codifica dicha protema o protema de fusion se introducen en el ovocito mediante microinyeccion. La microinyeccion en el ovocito puede realizarse mediante inyeccion en el nucleo (antes de la fecundacion), en el pronucleo (despues de la fecundacion) y/o mediante la inyeccion en el citoplasma (tanto antes como despues de la fecundacion). Cuando se emplea un ovocito fecundado, la inyeccion en el pronucleo se realiza, ya sea para un pronucleo, o para ambos pronucleos. La inyeccion de la nucleasa dedos-Tal o de un ADN que codifica la nucleasa dedos-Tal de la etapa (a) del metodo para modificar una secuencia diana de la presente invencion es, preferentemente, dentro del nucleo/pronucleo, mientras que la inyeccion de un ARNm que codifica la nucleasa dedos-Tal de la etapa (a) es, preferentemente, en el citoplasma. La inyeccion de la molecula de acido nucleico de la etapa (b) es, preferentemente, dentro del nucleo/pronucleo. Sin embargo, la inyeccion de la molecula de acido nucleico de la etapa (b) puede realizarse, ademas, en el citoplasma cuando dicha molecula de acido nucleico se proporciona como una secuencia de acido nucleico que tiene una senal de localizacion nuclear, para asegurar su suministro dentro del nucleo/pronucleo. Preferentemente, la microinyeccion se realiza mediante inyeccion tanto dentro del nucleo/pronucleo como en el citoplasma. Por ejemplo, la aguja puede introducirse dentro del nucleo/pronucleo y se inyecta una primera cantidad de la nucleasa dedos-Tal y/o la molecula de acido nucleico dentro del nucleo/pronucleo. Mientras se retira la aguja del ovocito, se inyecta una segunda cantidad de la nucleasa dedos-Tal y/o la molecula de acido nucleico en el citoplasma.

Los metodos para realizar la microinyeccion se conocen bien en la tecnica y se describen, por ejemplo, en Nagy y otros (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003. Manipulating the Mouse Embryo. Cold Spring Harbour, Nueva York: Cold Spring Harbour Laboratory Press) asf comotambien en los ejemplos de la presente descripcion mas abajo. Se prefiere, ademas, que la molecula de acido nucleico de la etapa (b) del metodo de la invencion se introduzca (ademas) dentro de la celula mediante microinyeccion.

En otra modalidad, la invencion se refiere a un metodo para producir un vertebrado no humano o un mairnfero no humano que porta una secuencia diana modificada en su genoma, el metodo comprende producir una celula no humana de acuerdo con los metodos descritos en la presente descripcion. La presente descripcion describe, ademas, la transferencia de una celula que se produce por el metodo de la invencion dentro de un huesped femenino pseudo embarazada.

El termino "transferencia de una celula que se produce por el metodo de la invencion dentro de un huesped femenino pseudo embarazada" incluye la transferencia de un ovocito fecundado pero, ademas, la transferencia de embriones de preimplantacion de, por ejemplo, la etapa de 2 celulas, 4 celulas, 8 celulas, 16 celulas y blastocisto (70 a 100 celulas). Dichos embriones de preimplantacion pueden obtenerse mediante el cultivo de la celula en condiciones apropiadas para que se convierta en un embrion de preimplantacion. Ademas, la inyeccion o fusion de la celula con un blastocisto son metodos apropiados para obtener un embrion de preimplantacion. Cuando la celula que se produce por el metodo de la invencion es una celula somatica, se requiere la derivacion de celulas madre pluripotentes inducidas antes de transferir la celula a un huesped femenino tal como, por ejemplo, antes de cultivar la celula o inyeccion o fusion de la celula con un embrion de preimplantacion. Los metodos para transferir un ovocito o un embrion preimplantado a una hembra pseudo embarazada se conocen bien en la tecnica y se describen, por ejemplo, en Nagy y otros, (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003. Manipulating the Mouse Embryo. Cold Spring Harbour, Nueva York: Cold Spring Harbour Laboratory Press).

Se contempla ademas, de acuerdo con el metodo para producir un vertebrado no humano o un mamffero no humano que porta una secuencia diana modificada en su genoma, que se realice una etapa de analisis de la modificacion genomica exitosa antes del trasplante en la hembra huesped. Como ejemplo no limitante, el ovocito puede cultivarse hasta la etapa de 2 celulas, 4 celulas o 8 celulas y una celula puede eliminarse sin destruir o alterar el embrion resultante. El analisis de la constitucion genomica, por ejemplo, la presencia o ausencia de la modificacion genomica, puede realizarse despues mediante el uso, por ejemplo, de PCR o de tecnicas de transferencia southern o cualquiera de los metodos descritos anteriormente en la presente descripcion. Tales metodos de analisis de genotipificacion exitoso antes del trasplante se conocen en la tecnica y se describen, por ejemplo, en Peippo y otros (Peippo J, Viitala S, Virta J, Raty M, Tammiranta N, Lamminen T, Aro J, Myllymaki H, Vilkki J.; Mol Reprod Dev 2007; 74:1373-1378).

Cuando la celula es un ovocito, el metodo para producir un vertebrado no humano o un mamffero no humano que porta una secuencia diana modificada en su genoma comprende (a) modificar la secuencia diana en el genoma de un ovocito de un vertebrado o mamffero de acuerdo con el metodo de la invencion. La presente descripcion describe, ademas, (b) transferir el ovocito que se obtiene en (a) a un huesped hembra pseudo embarazada; y, opcionalmente, (c) analizar la descendencia suministrada por el huesped hembra para detectar la presencia de la modificacion.

Para el metodo descrito para producir un vertebrado no humano o un mamffero no humano, se requiere la fecundacion del ovocito. Dicha fecundacion puede ocurrir antes de la modificacion de la secuencia diana en la etapa (a) de acuerdo con el metodo descrito para producir un vertebrado no humano o un mamffero no humano, es decir, puede usarse un ovocito fecundado para el metodo de modificacion de una secuencia diana. La fecundacion puede realizarse, ademas, despues de la modificacion de la secuencia diana en la etapa (a), es decir, puede usarse un ovocito no fecundado para el metodo de modificacion de una secuencia diana, en donde el ovocito se fecunda posteriormente antes de transferirlo a la hembra huesped pseudo embarazada.

La etapa de analisis para detectar la presencia de la modificacion en la descendencia suministrada por el huesped hembra proporciona la informacion necesaria acerca de si el vertebrado no humano o el mamffero no humano producido porta, o no, la secuencia diana modificada en su genoma. Por lo tanto, la presencia de la modificacion es indicativa de que dicha descendencia es portadora de una secuencia diana modificada en su genoma, mientras que la ausencia de la modificacion es indicativa de que dicha descendencia no es portadora de la secuencia diana modificada en su genoma. Los metodos de analisis para detectar la presencia o ausencia de una modificacion se detallaron anteriormente.

El vertebrado no humano o el mamffero no humano producido por el metodo descrito es, entre otras cosas, util para estudiar la funcion de los genes de interes y la expresion/resultado fenotfpico de las modificaciones del genoma en tales animales. Se contempla, ademas, que los mamfferos no humanos pueden emplearse como modelos de enfermedades y para evaluar agentes/composiciones terapeuticas. Adicionalmente, el vertebrado no humano o el mamffero no humano puede usarse, ademas, para la cna de ganado.

El metodo descrito para producir un vertebrado no humano o un mamffero no humano comprende, ademas, cultivar la celula para formar un embrion de preimplantacion o introducir la celula en un blastocisto antes de transferirla al huesped hembra pseudo embarazada. Los metodos para cultivar la celula para formar un embrion de preimplantacion o introducir la celula en un blastocisto se conocen bien en la tecnica y, por ejemplo, se describen en Nagy y otros, en el lugar citado.

El termino "introducir la celula en un blastocisto" como se usa en la presente descripcion, abarca la inyeccion de la celula en un blastocisto asf como tambien la fusion de una celula con un blastocisto. Los metodos para introducir una celula en un blastocisto se describen en la tecnica, por ejemplo en Nagy y otros, en el lugar citado.

La presente descripcion se refiere, ademas, a un animal vertebrado no humano o a un mairnfero no humano que se obtienen mediante los metodos descritos anteriormente.

En una modalidad preferida de los metodos de la invencion, la celula es de un mamffero no humano seleccionado del grupo que consiste en roedores, perros, felidos, primates, conejos, cerdos, o vacas o la celula es de un ave seleccionada del grupo que consiste en pollos, pavos, faisanes, patos, gansos, codornices y aves no voladoras, que incluyen avestruces, emues y casuarios, o la celula es de un pez tal como, por ejemplo, un pez cebra, salmon, trucha, carpa comun o carpa koi.

Todos los mamfferos, aves y peces descritos en la presente descripcion se conocen bien por los expertos en la tecnica y se definen taxonomicamente de acuerdo con la tecnica anterior y el conocimiento general comun de los expertos en la tecnica.

Los ejemplos no limitantes de "roedores" son ratones, ratas, ardillas, ardillas ralladas, ardilla de la tierra, puercoespines, castores, hamster, jerbos, cobayas, degus, chinchillas, perritos de las praderas y marmotas.

Los ejemplos no limitantes de "perros" incluyen los miembros de la subespecie canis lupus familiaris, asf como tambien lobos, zorros, chacales, y coyotes.

Los ejemplos no limitantes de "felidos" incluyen miembros de las dos subfamilias: las pantherinas, que incluyen leones, tigres, jaguares y leopardos y las felinas, que incluyen pumas, guepardos, gato cerval, linces, caracales, ocelotes y gatos domesticos.

El termino "primates", como se usa en la presente descripcion, se refiere a todos los monos, que incluyen, por ejemplo, cercopithecoid (mono del viejo mundo) o platyrrhine (mono del nuevo mundo), asf como tambien lemures, tarseros, simios y monos titf (Callithrixjacchus).

Con respecto a las modalidades caracterizadas en esta descripcion, en particular en las reivindicaciones, se pretende que cada modalidad mencionada en una reivindicacion dependiente se combine con cada modalidad de cada reivindicacion (independiente o dependiente) de la que depende dicha reivindicacion dependiente. Por ejemplo, en el caso de una reivindicacion independiente 1 que enumera 3 alternativas A, B y C, una reivindicacion dependiente 2 que enumera 3 alternativas D, E y F y una reivindicacion dependiente 3 de conformidad con las reivindicaciones 1 y 2 y que enumera 3 alternativas G, H y I, debe entenderse que la descripcion describe de manera inequvoca las modalidades correspondientes a las combinaciones A, D, G; A, D, H; A, D, I; A, E, G; A, E, H; A, E, I; A, F, G; A, F, H; A, F, I; B, D, G; B, D, H; B, D, I; B, E, G; B, E, H; B, E, I; B, F, G; B, F, H; B, F, I; C, D, G; C, D, H; C, D, I; C, E, G; C, E, H; C, E, I; C, F, G; C, F, H; C, F, I, a menos que se mencione espedficamente de cualquier otra manera.

De manera similar, y, ademas, en aquellos casos donde las reivindicaciones independientes y/o dependientes no enumeren alternativas, se entiende que si las reivindicaciones dependientes se refieren nuevamente a una pluralidad de reivindicaciones anteriores, se considera que cualquier combinacion de la materia cubierta de esta manera se describe explfcitamente. Por ejemplo, en el caso de una reivindicacion independiente 1, una reivindicacion dependiente 2 que se refiere nuevamente a la reivindicacion 1 y una reivindicacion dependiente 3 que se refiere nuevamente a las reivindicaciones 2 y 1, se deduce que la combinacion de la materia de las reivindicaciones 3 y 1 se describe de manera clara e inequvoca, al igual que la combinacion de la materia de las reivindicaciones 3, 2 y 1. En caso de que este presente, ademas, una reivindicacion dependiente 4 que se refiere a cualquiera de las reivindicaciones 1 a 3, se deduce que la combinacion de la materia de las reivindicaciones 4 y 1, de las reivindicaciones 4, 2 y 1, de las reivindicaciones 4, 3 y 1, asf como tambien de las reivindicaciones 4, 3, 2 y 1, se describen de manera clara e inequvoca.

Las Figuras muestran:

Figura 1: Vectores de expresion de Nucleasa-TAL.

La figura muestra la estructura y funcion de las protemas de fusion Nucleasa-TAL, que consiste en un dominio de union al ADN en una secuencia espedfica y un dominio de escision del ADN (nucleasa) no espedfico. El dominio de union al ADN puede ensamblarse a partir de los cuatro tipos de elementos peptfdicos de TAL, de 34 aminoacidos, que exhiben especificidad de union contra uno de los nucleotidos del ADN a traves de las posiciones de los aminoacidos 12 y 13 (Nl -A; HD - C; NG - T; NN - G). Despues de la union del dominio del elemento TAL a la secuencia del ADN diana seleccionada, el dominio nucleasa de la protema de fusion entra en contacto estrecho con la doble hebra del ADN, pero no escinde el ADN como un monomero de nucleasa. Solamente despues de la union de una segunda protema de fusion Nucleasa-TAL a una segunda secuencia diana de ADN ubicada hacia el extremo 3' con respecto al sitio de union de la primera protema de fusion, la doble hebra de ADN se escinde a traves de la cooperacion de los dos dominios nucleasa que estan en contacto estrecho.

Figura 2: Modificacion de las secuencias genomicas inducida por la Nucleasa-TAL.

La figura muestra un par de protemas de fusion Nucleasa-TAL que se unen en los extremos 5' y 3' con respecto al sitio diana seleccionado dentro de un gen diana genomico. Despues de la creacion de una rotura de doble hebra del ADN dentro del sitio diana, dos mecanismos competidores de reparacion del ADN se activan fuertemente en las celulas: i) mediante recombinacion homologa, en presencia de un vector de transformacion genica introducido externamente que comprende dos regiones de homologfa con el gen diana y una modificacion/mutacion genetica predisenada, la modificacion planeada previamente se copia a partir del vector de transformacion en el genoma; por esta via, cualquier modificacion genica dirigida (por ejemplo, inactivacion genica, reemplazo genico) puede colocarse en el genoma, ii) mediante la via de reparacion por la union de extremos no homologos (NHEJ), los extremos de ADN libres se unen por ligacion sin un molde de reparacion; por esta via, con frecuencia se pierde un numero variable de nucleotidos (sfmbolo del cuchillo) antes de la ligacion final y frecuentemente resulta en un alelo inactivado del gen diana.

Figura 3: Uso de Nucleasas-TAL para la transformacion genica en lmeas celulares de mairnferos y cigotos.

A: Para la generacion de modificaciones genicas en lmeas celulares de mamfferos, los vectores de transformacion de Nucleasa-TAL pueden transfectarse junto con, o sin, un vector espedfico de transformacion genica, en celulas en cultivo. Despues de la expresion de la nucleasa y la reparacion del ADN, una fraccion de las celulas tratadas contiene la alteracion genica deseada. Estas celulas pueden aislarse y cultivarse adicionalmente como una lmea celular modificada geneticamente pura. B: Despues de la microinyeccion del ARNm de Nucleasa-TAL, junto con o sin un vector de transformacion genica espedfico, dentro de ovocitos de mamfferos fecundados (cigotos, aislados de hembras de tipo silvestre, por ejemplo, ratones) puede introducirse directamente un alelo inactivado (KO) o un gen de reemplazo (Kl) en el genoma del embrion unicelular. Las hembras pseudo embarazadas suministran la descendencia a partir de ovocitos microinyectados. A la descendencia se le realiza una genotipificacion para detectar la presencia de la modificacion genica inducida. Los animales positivos se seleccionan para su reproduccion ulterior con el proposito de establecer una cepa modificada geneticamente.

Figura 4: Vectores de expresion de Nucleasa-TAL.

El vector de expresion Nucleasa-TAL pCAG-Tal-nucleasa contiene una region del promotor CAG y una unidad transcripcional que comprende, el extremo 5' de un par central de sitios de restriccion BsmBI, un codon de inicio de la transcripcion ATG (flecha), una secuencia de localizacion nuclear (NLS), una secuencia de etiqueta FLAG (FLAG), una secuencia enlazadora, un segmento codificante para 110 aminoacidos de la protema TAL AvrBs3 (AvrN) y sus repeticiones invariables Tal en el N-terminal (r0.5). En el extremo 3' de los sitios de restriccion BsmBI la unidad transcripcional contiene una repeticion Tal invariable en el extremo C-terminal (rx.5), un segmento codificante para 44 aminoacidos derivados de la protema Tal AvrBs3, unos sitios de restriccion Pmel y Mlul para la insercion de las regiones codificantes de la nucleasa y una secuencia senal de poliadenilacion (pA). Los segmentos de ADN codificantes para los elementos de repeticion TAL pueden insertarse en los sitios BsmBI del pCAG-Tal-nucleasa para la expresion de protemas de fusion Nucleasa-TAL variables. Para crear los vectores de expresion pArtTall-nucleasa el arreglo ArtTall de los elementos de repeticion TAL, que reconocen la secuencia diana especificada de 12 pb, se insertaron en los sitios BsmBI del pCAG-TAL-nucleasa. Cada repeticion Tal de 34 aminoacidos se representa como un cuadrado que indica el codigo de los aminoacidos de las repeticiones en las posiciones 12/13 que confieren la union a uno de los nucleotidos del ADN de la secuencia diana (NI > A, NG > T, HD > C, NN > G) mostrada anteriormente. A continuacion, las regiones codificantes del dominio nucleasa sintetica se insertaron en los sitios Pmel y Mlul del pCAG-ArtTal1-nucleasa para obtener los vectores de expresion: A:pCAG-ArtTal1-Alw que incluye el dominio nucleasa de la endonucleasa de restriccion Alwl, B: pCAG-ArtTal1-CleDORF que incluye el dominio nucleasa del gen CleDORF, C: pCAG-ArtTal1-Clo051 que incluye el dominio nucleasa del gen Clo051, D:pCAG-ArtTal1-Mly que incluye el dominio nucleasa de la endonucleasa de restriccion Mlyl, E: pCAG-ArtTal1-Pept071 que incluye el dominio nucleasa del gen Pept071, F: pCAG-ArtTal1-Sbf que incluye el dominio nucleasa de la endonucleasa de restriccion Sbfl, G: pCAG-ArtTal1-Sdal que incluye el dominio nucleasa de la endonucleasa de restriccion Sdal H: pCAG-ArtTal1-Sst que incluye el dominio nucleasa de la endonucleasa de restriccion Stsl, e I: pCAG-ArtTal1-Fok que incluye el dominio nucleasa de la endonucleasa de restriccion Fokl

Figura 5: Secuencia de aminoacidos de la protema Clo051

Secuencia de los 587 aminoacidos de la protema Clo051 en el codigo de una letra. Se indican la metionina en la posicion 1 (M1), la tirosina en la posicion 587 (Y587) y el residuo 199 del dominio nucleasa entre las posiciones E389 e Y587. Ademas, se destacan las posiciones D455, D472 y K474 que son caractensticas del sitio activo conservado de la superfamilia de enzimas 'PD-(D/E)XK' que interaccionan con el ADN.

Figura 6: Estructura predicha de la protema Clo051 y su dominio nucleasa.

La estructura terciaria de la protema Clo051 se predijo a partir de su secuencia de aminoacidos (Figura 5) mediante el uso del programa informatico I-TASSER. Las estructuras secundarias se muestran como regiones alfa-helicoidales y de hojas beta. Se destacan la metionina en la posicion 1 (M1), el residuo de glutamato 389 (E389) y la tirosina 587 (Y587). La cadena de protemas entre E389 e Y587 forma un dominio de plegamiento separado que actua como una nucleasa.

Figura 7: Plasmidos reporteros de Nucleasa-TAL-y ensayo reportero de nucleasa.

A: Los plasmidos reporteros Nucleasa-TAL contienen una region del promotor de CMV, una secuencia codificante de 400 pb para el segmento del extremo N-terminal de p-galactosidasa y un codon de parada. Esta unidad es seguida por una region diana de union a TAL que consiste en dos secuencias de reconocimiento orientadas inversas (subrayadas), separadas por una region espaciadora de 15 pb (NNN..), para el arreglo ArtTall (a), el arreglo TalRabl (b), el arreglo TalRab2 (c), o una region de union hnbrida compuesta por una secuencia de reconocimiento ArtTall y una TalRab2 (d). La region diana Nucleasa-TAL es seguida por la region codificante completa para p-galactosidasa y una senal de poliadenilacion (pA). Para evaluar la actividad nucleasa contra la secuencia diana un vector de expresion Nucleasa-TAL (Figura 4) se cotransfecto transitoriamente con su plasmido reportero correspondiente en celulas HEK 293. Despues de la expresion de la protema Nucleasa-TAL el plasmido reportero se abre mediante una rotura de doble hebra inducida por nucleasa dentro de la secuencia diana Nucleasa-TAL (sfmbolo de tijeras).

B: Las regiones de ADN adyacentes a la rotura de doble hebra son identicas en 400 pb y pueden alinearse y recombinarse (X) mediante la reparacion del ADN por recombinacion homologa. C: La recombinacion homologa de un plasmido reportero abierto resulta en un vector de expresion de p-galactosidasa funcional que produce la enzima p-galactosidasa. Despues de dos dfas, las celulas transfectadas se lisaron y la actividad de la enzima en el lisado se determino con un ensayo reportero de quimioluminiscencia. Los niveles de la emision de luz catalizada por el reportero se miden e indican la actividad de la Nucleasa-TAL en comparacion con las muestras que se transfectaron con el plasmido reportero solo.

Figura 8: Actividad de las protemas de fusion Nucleasa-TAL en celulas HEK 293.

Para evaluar la actividad nucleasa de las protemas de fusion de los dominio nucleasa-TAL, los vectores de expresion para las protemas ArtTal1-Alwl, -CleDORF, - Clo051, -Mlyl, -Fokl, -Pept071, -Sbfl, -Sdal, y -Stsl (Figura 4) se transfectaron juntos con el plasmido reportero ArtTall (Figura 7) en celulas HEK 293. La actividad nucleasa espedfica contra la secuencia diana del plasmido reportero conduce a la recombinacion homologa y a la expresion de p-galactosidasa. Dos dfas despues de la transfeccion, se lisaron las poblaciones celulares y se determino la actividad de la p-galactosidasa con un ensayo reportero de quimioluminiscencia. Los niveles de emision de luz se normalizaron en relacion con la actividad de un plasmido de expresion de luciferasa cotransfectado (pLuciferasa) y se muestran en comparacion con la actividad de un vector de expresion de p-galactosidasa control positivo. La barra para cada muestra transfectada representa el valor medio y la SD derivada de tres pocillos de cultivo transfectados a la par. A: La transfeccion del plasmido reportero ArtTall sin vector de expresion de nucleasa resulta en un bajo nivel de fondo de p-galactosidasa. La cotransfeccion de pCAG-ArtTal1-Alwl, -CleDORF, y -Mlyl con el plasmido reportero ArtTall no condujo a un aumento significativo de la expresion del reportero, lo que indica que las protemas de fusion ArtTal1-Alwl, -CleDORF, y -Mlyl no exhiben actividad nucleasa. Por el contrario, la cotransfeccion del plasmido reportero ArtTall y el plasmido pCAG-ArtTal1-Clo051 resulto en un fuerte aumento de la expresion del reportero, lo que indica que la protema de fusion ArtTal1-Clo051 exhibe actividad nucleasa espedfica de la secuencia diana en las celulas 293. B: En un experimento de transfeccion independiente, la cotransfeccion de pCAG-ArtTal1-Pept071, -Sbfl, -Sdal y -Sst con el plasmido reportero ArtTall no condujo a un aumento significativo de la expresion del reportero, en comparacion con el plasmido reportero ArtTall solo, lo que indica que las protemas de fusion ArtTal1-Pept071, -Sbfl, - Sdal, y -Stsl no exhiben actividad nucleasa. Por el contrario, la cotransfeccion de los plasmidos reportero ArtTall y pCAG-ArtTall-Fokl resulto en un aumento de la expresion del reportero, lo que indica la actividad nucleasa de la protema de fusion ArtTal1-Fokl en celulas 293.

Figura 9: Especificidad de la secuencia diana de la nucleasa ArtTal1-Clo051.

Para evaluar la especificidad de la nucleasa ArtTal1-Clo051 contra la secuencia diana predisenada en comparacion con las secuencias de ADN no relacionadas, el vector de expresion pCAG-ArtTal1-Clo051 se cotransfecto con el plasmido reportero ArtTall correspondiente o con los plasmidos reporteros TalRabl o TalRab2 (Figura 7), que contienen secuencias diana no relacionadas, en celulas HEK 293. La actividad nucleasa fuerte se desarrollo solamente en la combinacion espedfica del vector de expresion ArtTaI1-Clo051 junto con el plasmido reportero ArtTall, lo que indica que la nucleasa ArtTal1-Clo051 actua espedficamente contra la secuencia diana predisenada.

Figura 10: Caracterizacion de la cooperatividad de protemas de fusion nucleasa TAL-Clo051

A: Para evaluar la cooperatividad de los dominios nucleasa Clo051 de un par de protemas de fusion TAL-Clo051, los vectores de expresion para las protemas de fusion ArtTal1-Clo051 o TalRab2-Clo051 se cotransfectaron con el correspondiente plasmido reportero ArtTall o TalRab2 (Figura 7) y se comparo con la cotransfeccion con el plasmido reportero ArtTal1/TalRab2, que contiene una region diana tnbrida (Figura 7). La actividad nucleasa significativa se desarrollo solamente en la combinacion de vectores de expresion de Nucleasa-TAL con plasmidos reporteros que contienen dos copias identicas e inversas de la secuencia diana del arreglo TAL correspondiente, pero no con el plasmido reportero ArtTal1/TalRab2 que contiene solamente una secuencia de union unica de las protemas de fusion ArtTall Clo051 y TalRab2-Clo051. Este resultado indica que dos dominios nucleasa Clo051 deben cooperar para inducir una rotura de doble hebra del ADN, mientras que un unico dominio nucleasa Clo051 no actua como una nucleasa. B: La cotransfeccion del plasmido reportero ArtTall/TalRab2 con ambos vectores de expresion para ArtTal1-Clo051 y TalRab2-Clo051, pero no con ArtTal1-Clo051 o -Fok solo, resulta en una actividad nucleasa fuerte, en comparacion con la transfeccion del plasmido reportero ArtTal1/TalRab2. Este resultado indica que la actividad nucleasa y la induccion de roturas de doble hebra en la region diana se producen solamente despues de la union de dos protemas de fusion TAL-Clo051 y de la interaccion de un par de dominios nucleasa Clo051.

Figura 11: Diseno de un par de protemas de fusion TAL-Clo051 de acuerdo con la presente invencion, que reconoce el gen Rab38 de raton.

Nucleasa TAL que reconoce una secuencia diana dentro del exon 1 del gen de raton Rab38. El trinucleotido que representa el codon 19 esta subrayado. Se indica cada secuencia de 14 nucleotidos que se reconoce por una de las protemas de fusion TAL-Clo051 indicadas, RabChtTal1- y RabChtTal2-Clo051. Las dos secuencias diana de 14 pb flanquean una secuencia espaciadora central de 15 pb que se escinde por los dominios nucleasa Clo051.

Figura 12: Estrategia para la modificacion del gen de raton Rab38 en celulas ES y cigotos mediante el uso de protemas de fusion TAL-Clo051.

Dentro del exon 1 del gen de tipo silvestre Rab38 (Rab38 WT) se indica la posicion de los sitios de union para el par Nucleasa TAL RabChtTal1- y RabChtTal2-Clo051. El vector de transformacion Rab38-cht contiene una region de homologfa 5' de 942 pb y una region de homologfa 3' de 2788 pb que flanquean los sitios de reconocimiento TAL de Rab38. Dentro del exon 1 el cambio de dos nucleotidos dentro del codon 19 (GTA) de Rab38 produce una mutacion chocolate (cht) sin sentido que codifica para valina (Val) en lugar de la glicina (Gly) de tipo silvestre (WT), y elimina un sitio de restriccion BsaJI. En cada uno de los sitios adyacentes de reconocimiento TAL de Rab38 se introdujeron numerosas mutaciones silentes para evitar la union de las protemas TAL de Rab38 al vector de transformacion. La induccion de una rotura de doble hebra dentro del gen de tipo silvestre Rab38 por el par de protemas RabChtTal estimula la recombinacion homologa con el vector de transformacion Rab38-cht e integra la mutacion chocolate sin sentido y las mutaciones silentes en el genoma.

Figura 13: Aislamiento de mutantes hiperactivos de nucleasa Clo051.

La figura muestra la secuencia primaria del dominio nucleasa Clo051 entre las posiciones E389 e Y587. Se indica la distribucion de los residuos arginina (R) y lisina (K) (cuadrados solidos) cargados positivamente de y de los residuos glutamato (E) y aspartato (D) (drculos abiertos) cargados negativamente. Los triangulos indican las posiciones S423 y R446. Estos residuos constituyen un marco tridimensional de cargas dentro del dominio Clo051 que determina la estructura terciaria unica de esta nucleasa, como se modelo en la estructura de la Figura 6. Determinados reemplazos de residuos polares versus no polares o de residuos no polares contra residuos polares, por ejemplo en las posiciones 423 y 446, cambian la estructura tridimensional de la cadena proteica y resulta en una actividad nucleasa que trabaja mas eficientemente.

Figura 14: Actividad de la nucleasa ArtTal1-Clo051 sobre un reportero genomico en celulas HEK293 Las celulas HEK293 que poseen copias genomicas integradas del constructo reportero pCMV-Rab-Reporter(hygro) se transfectaron con pBluescript o pCAG.ArtTal1-Clo051. La actividad nucleasa espedfica contra la secuencia diana del reportero conduce a la recombinacion homologa y a la expresion de 3-galactosidasa. Dos dfas despues de la transfeccion, se fijaron las poblaciones celulares y se determino la fraccion de celulas que expresaban 3-galactosidasa mediante tincion histoqmmica con X-Gal. A: Cultivo de celulas reporteras tenidas con X-Gal despues de la transfeccion con pBluescript. B: Cultivo de celulas reporteras tenidas con X-Gal despues de la transfeccion con el vector de expresion de nucleasa pCAG-ArtTal1-Clo051.

Ejemplo 1: Construccion de vectores de expresion y reporteras para Nucleasa Tal y deteccion de la actividad nucleasa espedfica

Construccion de vectores de expresion Nucleasa-TAL

Para la expresion de nucleasa-TAL en celulas de mairnferos, disenamos el vector de expresion generico pCAG-TAL-nucleasa (sec. con num. de ident.: 3) (Figura 4), que contiene una region del promotor hfbrida CAG y una unidad transcripcional que comprende una secuencia codificante para un peptido N-terminal de 176 aminoacidos (sec. con num. de ident.: 4) de las protemas de fusion Nucleasa TAL, ubicada en el extremo 5' de un par de sitios de restriccion BsmBI. Esta region N-terminal incluye un codon de inicio de la transcripcion ATG, una secuencia de localizacion nuclear, una secuencia de etiqueta FLAG, una secuencia enlazadora rica en glicina, un segmento codificante para 110 aminoacidos de la protema Tal AvrBs3 y la repeticion Tal invariable del extremo N-terminal del efector TAL Hax3. En el extremo 3' de los sitios centrales BsmBI, la unidad transcripcional contiene 78 codones (sec. con num. de ident.: 5) que incluyen una repeticion TAL invariable del extremo C-terminal (34 aminoacidos) y 44 residuos derivados de la protema TAL AvrBs3, seguido por un sitio de restriccion Pmel y Mlul para la insercion de una region codificante de nucleasa y por una secuencia senal de poliadenilacion (pA). Los segmentos de ADN codificantes para los arreglos de repeticiones TAL, disenados para unir una secuencia diana de nucleasa TAL pueden insertarse en los sitios BsmBI de pCAG-Tal-nucleasa en el marco de lectura con las regiones codificantes de los extremos 5' y 3' para la expresion de protemas nucleasa TAL predisenadas.

Para generar los vectores TAL-nucleasa para la expresion en celulas de mairnferos insertamos un segmento de ADN sintetico con la region codificante de un arreglo de 12 repeticiones Tal, designado ArtTall (sec. con num. de ident.: 6), en los sitios BsmBI de pCAG-TAL-nucleasa, para derivar el plasmido pCAG-ArtTall-nucleasa (sec. con num. de ident.:

7). El elemento TAL en el arreglo ArtTall reconoce la secuencia diana de ADN artificial 5'-ATTCTGGGACGT-3' (Figura 4). En otro ejemplo insertamos un segmento de ADN sintetico con la region codificante de un arreglo de 14 repeticiones Tal, designado TalRab2 (sec. con num. de ident.: 8), en los sitios BsmBI de pCAG-TAL-nucleasa, para derivar el plasmido pCAG-TalRab2-nucleasa (sec. con num. de ident.: 9). El elemento TAL en el arreglo TalRab2 reconoce la secuencia diana 5'-GGTGGCCCGGTAGT-3' (Figura 7) que ocurre dentro del gen de raton Rab38. Las secuencias diana TAL se seleccionaron de manera que las regiones de union de las protemas TAL fueran precedidas por un nucleotido T. Siguiendo la secuencia hacia el extremo 3' de la T inicial en direccion 5'>3', los dominios de union al ADN espedficos de TAL se combinaron juntos en arreglos de 12 (ArtTall) (Figura 4), o 14 (TalRab2) elementos TAL. Cada motivo de elemento TAL consiste en 34 aminoacidos, la posicion 12 y 13 de los cuales determina la especificidad hacia el reconocimiento de A, G, C o T dentro de la secuencia diana. Para derivar los dominios de union al ADN del elemento TAL usamos el motivo efector TAL (repeticion) #11 de la protema Hax3 de Xanthomonas (Num. de acceso del GenBank AY993938.1 (LTPEq Vv AIAs NiGGKQALETv Qr LLPVLCQAHG) con los aminoacidos N12 e I13 para reconocer A, el motivo efector TAL (repeticion) #5 (LTPQQVVAIASHDGGKQALETVQRLLPVLCQAHG) derivado de la protema Hax3 con los aminoacidos H12 y D13 para reconocer C, y el motivo efector TAL (repeticion) #4 (LTPQQVVAIASNGGGKQALETVQRLLPVLCQAHG) de la protema Hax4 de Xanthomonas (Num. de acceso del GenBank: AY993939.1) con los aminoacidos N12 y G13 para reconocer T. Para reconocer un nucleotido diana G usamos el motivo efector TAL (repeticion) #4 de la protema Hax4 con el reemplazo de los aminoacidos 12 por N y 13 por N (LTPQQVVAIASNNGGKQALETVQRLLPVLCQAHG).

A continuacion, construimos protemas de fusion del dominio de union al ADN ArtTal1 con dominios de protemas derivado de nucleasas conocidas o putativas y evaluamos si esas protemas de fusion nucleasa-TAL son capaces de inducir una rotura en la doble hebra despues de unirse al ADN mediante la region de reconocimiento TAL. Para este proposito, insertamos segmentos de a Dn sintetico que comprenden las regiones codificantes de ocho dominios de nucleasa putativos y el dominio conocido de nucleasa de Fokl (sec. con num. de ident.: 10), en los sitios Pmel y Mlul del plasmido pCAG-ArtTal1-nucleasa. Entre los ocho dominios putativos de nucleasa seleccionamos dominios de las cinco enzimas de restriccion conocidas Alwl (sec. con num. de ident.: 11), Mlyl (sec. con num. de ident.: 12), Sbfl (sec. con num. de ident.: 13), Sdal (sec. con num. de ident.: 14) y Stsl (sec. con num. de ident.: 15). Ademas, seleccionamos dominios putativos de nucleasa detres genes microbianos hipoteticos, aun no caracterizados, designados en la presente como 'CleDORF' (sec. con num. de ident.: 16) (Secuencia de Referencia del NCBI: ZP_02080987.1, derivado a partir del genoma de Clostridium leptumDSM753), 'Clo051' (sec. con num. de ident.: 17) (Secuencia de Referencia del n Cb I: ZP_05132802.1, derivado a partir del genoma de Clostridium spec.7_2_43FAA) y 'Pept071' (sec. con num. de ident.: 18) (Secuencia de Referencia del NCBI: ZP_07399918.1, derivado a partir del genoma de Peptoniphilus duerdenii ATCC BAa -1640). Estas protemas se seleccionaron por los elementos de secuencia caractensticos que son compatibles con el sitio activo conservado de la superfamilia de enzimas 'PD-(D/E)XK' (Kosinski, J., y otros (2005). BMC Bioinformatics, 6,172) que interaccionan con el a Dn (ver Figura 6 para la protema Clo051). En particular, la protema Clo051 de 587 residuos puede clasificarse como un miembro de la familia de protema PD-(D/E)XK por la localizacion de los pares de aminoacidos P454/ D455 (motivo PD) y D472/ K474 (motivo DXK) (Figura 5). Para dilucidar si la protema Clo051 contiene un dominio nucleasa separado, realizamos una prediccion estructural tridimensional a partir de su secuencia de aminoacidos primaria mediante el uso del programa informatico I-TASSER (Roy, A. y otros (2010). Nat Protoc., 5(4):725-38). Como se muestra en la Figura 6 la protema Clo051 esta compuesta por dos dominios de protema. El dominio C-terminal de Clo051, que comienza aproximadamente con el residuo E389, contiene el motivo consenso de la familia PD-(D/E)XKy aparece como un dominio nucleasa no espedfico.

Para la expresion de estos dominios de protemas en celulas de marnfferos usamos regiones codificantes sinteticas optimizadas de acuerdo con el uso de codones en mamfferos e insertamos segmentos que comprenden los dominios nucleasa putativos de Alwl (sec. con num. de ident.: 19), CleDORF (sec. con num. de ident.: 20), Clo051 (sec. con num. de ident.: 1), Mlyl (sec. con num. de ident.: 21), Pept071 (sec. con num. de ident.: 22), Sbfl (sec. con num. de ident.: 23), Sdal (sec. con num. de ident.: 24), Stsl (sec. con num. de ident.: 25) y el dominio nucleasa conocido de Fokl (sec. con num. de ident.: 26) dentro de los sitios Pmel y Mlul del plasmido pCAG-ArtTal1-nucleasa, para derivar los vectores de expresion pCAG-ArtTal1-Alwl (sec. con num. de ident.: 27) (Figura 4a ), pCAG-ArtTal1-CleDORF (sec. con num. de ident.: 28) (Figura 4B), pCAG-ArtTal1-Clo051 (sec. con num. de ident.: 29) (Figura 4C), pCAG-ArtTal1-Mlyl (sec. con num. de ident.: 30) (Figura 4D), pCAG-ArtTal1-Pept071 (sec. con num. de ident.: 31) (Figura 4E), pCAG-ArtTal1-Sbfl (sec. con num. de ident.: 32) (Figura 4F), pCAG-ArtTal1-Sdal (sec. con num. de ident.: 33) (Figura 4g ), pCAG-ArtTal1-Stsl (sec. con num. de ident.: 34) (Figura 4h ), y pCAG-ArtTal1-Fokl (sec. con num. de ident.: 35) (Figura 4I). Estos vectores de expresion codifican para las protemas de fusion-TAL designadas como ArtTal1-Alwl (sec. con num. de ident.: 36), ArtTal1-CleDORF (sec. con num. de ident.: 37), ArtTal1-Clo051 (sec. con num. de ident.: 38), ArtTal1-Mlyl (sec. con num. de ident.: 39), ArtTal1-Pept071 (sec. con num. de ident.: 40), ArtTal1-Sbfl (sec. con num. de ident.: 41), ArtTal1-Sdal (sec. con num. de ident.: 42), ArtTal1-Stsl (sec. con num. de ident.: 43), y ArtTal1-Fokl (sec. con num. de ident.: 44).

Construccion de plasmidos reporteros de nucleasa TAL

Para determinar la actividad y la especificidad del dominio nucleasa TAL de las protemas de fusion en celulas de mairnferos, construimos plasmidos reporteros de nucleasa TAL que contienen dos copias de una secuencia diana de ADN TAL en orientacion inversa, separadas por una region espaciadora de 15 nucleotidos (Figuras 7a-d). Esta configuracion permite medir la actividad de un solo tipo de nucleasa t Al que interacciona como un homodfmero de dos moleculas de protemas que se unen al par inverso de las secuencias diana del plasmido reportero. Despues de la union al ADN y la interaccion de dos dominios nucleasas, el ADN del plasmido reportero se escinde dentro de la region espaciadora de 15 pb y exhibe una rotura de doble hebra.

Los plasmidos reporteros de nucleasa TAL contienen una region promotora de CMV, una secuencia de 400 pb que codifica el segmento N-terminal de p-galactosidasa y un codon de parada. Esta unidad es seguida por la region diana de nucleasa TAL (que consiste en dos secuencias de reconocimiento de orientacion inversa separadas por una region espaciadora de 15 pb) para las protemas de fusion ArtTall en el plasmido reportero ArtTall (sec. con num. de ident.: 45)(Figura. 7 a), por la secuencia diana no relacionada TalRabl en el plasmido reportero TalRabl (sec. con num. de ident.: 46) (Figura 7 b), por la region diana para las protemas de fusion TalRab2 en el plasmido reportero TalRab2 (sec. con num. de ident.: 47) (Figura 8 c), o una region diana tubrida que contiene una copia de las secuencias de reconocimiento ArtTall y TalRab2 en el plasmido reportero ArtTal1/TalRab2 (sec. con num. de ident.: 48) (Figura 8 d).

Dentro de estos plasmidos reporteros, las regiones diana de nucleasa TAL estan seguidas por la region codificante completa de la p-galactosidasa y una senal de poliadenilacion (pA). Para evaluar la actividad nucleasa contra la secuencia diana espedfica, un vector de expresion de nucleasa (Figura 4) se cotransfecto transitoriamente con su correspondiente plasmido reportero en celulas de mamfferos. Despues de la expresion de la protema nucleasa TAL, el plasmido reportero se abre mediante una rotura de doble hebra inducida por la nucleasa dentro de la secuencia diana de la nucleasa TAL (Figura 7 A ). Las regiones de ADN adyacentes a la rotura de doble hebra son identicas en 400 pb y pueden alinearse y recombinarse mediante la recombinacion homologa del proceso de reparacion del ADN (Figura 7 B). La recombinacion homologa de un plasmido reportero abierto resultara posteriormente en una region codificante de p-galactosidasa funcional transcrita a partir del promotor de CMV que conduce a la produccion de la protema p-galactosidasa (Figura 7 C). En los lisados de las celulas transfectadas, puede determinarse la actividad enzimatica de la p-galactosidasa mediante quimioluminiscencia y referir la actividad nucleasa de las protemas de fusion TAL.

Medicion de la actividad y especificidad de la Nucleasa-TAL en celulas 293 humanas

Para determinar la actividad y especificidad de las nucleasas TAL en celulas de m ai^eras, electroporamos un millon de celulas HEK 293 (ATCC #CRL-1573) (Graham FL, Smiley J, Russell WC, Nairn R., J. Gen. Virol. 36, 59-74, 1977) con 5 |jg de ADN plasmfdico de uno de los vectores de expresion de Nucleasa TAL (Figura 4) junto con 5 |jg de uno de los plasmidos reporteros de Nucleasa TAL (Figura 7). Ademas, cada muestra recibio 5 jg del plasmido de expresion de luciferasa de luciernaga pCMV-hLuc (sec. con num. de ident.: 49) y se ajusto a una cantidad total de ADN de 20 jg con el ADN plasmfdico pBluescript (pBS) (sec. con num. de ident.: 50). Despues de la transfeccion, las celulas se sembraron portriplicado en pocillos de una placa de cultivo de tejidos de6 pocillos y se cultivaron durante dos dfas antes de comenzar el analisis. Para el analisis, las celulas transfectadas de cada pocillo se lisaron y se determinaron individualmente las actividades de las enzimas p-galactosidasa y luciferasa de los lisados mediante el uso de los ensayos reporteros quimioluminiscentes de acuerdo con las instrucciones del fabricante (Roche Applied Science, Alemania) en un luminometro (Berthold Centro LB 960). Como control positivo transfectamos 5 jg del plasmido de expresion de pgalactosidasa pCMVp (sec. con num. de ident.: 51) con 15 jg de pBS, como control negativo se transfectaron 5 jg de pCMV-hLuc con 15 jg de pBS o 5 jg de pCMV-hLuc junto con 5 jg de un plasmido reportero de nucleasa TAL y 10 jg de pBS. Los valores de p-galactosidasa por triplicado de cada muestra se normalizaron en relacion con los niveles de actividad de luciferasa y el valor medio y la desviacion estandar de la actividad de p-galactosidasa se calcularon y expresaron en comparacion con el control positivo pCMVp. En este tipo de ensayo de recombinacion, el nivel de emision de luz catalizada por la p-galactosidasa refleja la escision y reparacion de los plasmidos reporteros y, de esta manera, indica la actividad de las nucleasas TAL.

Como se muestra en la Figura 8 la transfeccion del plasmido reportero ArtTal1 solo resulto en niveles de fondo de pgalactosidasa. La cotransfeccion del plasmido reportero ArtTal1 con los vectores de expresion pCAG-ArtTal1-Alwl, -CleDORF, -Mlyl, -Pept071, -Sbfl, -Sdal, y -Stsl no revelaron ninguna actividad nucleasa significativa de las protemas de fusion que codifican TAL (Figura 8), lo que indica que los dominios nucleasas seleccionados son incapaces de operar en combinacion con los elementos TAL de union al a Dn . En contraste, la cotransfeccion del plasmido reportero ArtTal1 con los vectores de expresion pCAG-ArtTal1-Clo051 (Figura 8A) y - Fokl (Figura 8B) resulto en un aumento significativo de la actividad reportera, lo que indica que los dominios de protemas seleccionados Fokl y Clo051 son capaces de funcionar como nucleasas en fusion con los elementos TAL de union al ADN.

Dado que en ensayos repetidos, las fusiones de TAL con el dominio Clo051 pareda mas activo en comparacion a las fusiones con el dominio nucleasa de Fokl, creemos que el dominio Clo051 es el mas adecuado para la construccion de Nucleasas TAL altamente activas.

Para definir si la nucleasa ArtTal1-Clo051 reconoce espedficamente su secuencia diana dentro del plasmido reportero ArtTal1 (Figura 7a), el pCAG-ArtTal1-Clo051 se cotransfecto con el correspondiente plasmido reportero ArtTal1 o con los plasmidos reporteros no relacionados TalRabl o TalRab2 (Figura 7b,c) en celulas HEK 293. Como se muestra en la Figura 9 se detecto actividad reportera aumentada significativamente solamente a partir de la combinacion espedfica de la nucleasa ArtTal-Clo051 con su correspondiente promotor, mientras que la cotransfeccion con plasmidos reporteros no relacionados no exhibe actividad nucleasa significativa. Estos resultados indican que el dominio nucleasa Clo05l en fusion con los elementos TAL de union al ADN actua en una secuencia diana de manera espedfica y que las secuencias diana no relacionadas no se procesan.

A continuacion, caracterizamos si el dominio nucleasa Clo051, como un monomero, induce roturas de doble hebra recombinogenicas o si es necesario la interaccion de dos dominios nucleasa como un dfmero. Para este proposito, construimos el plasmido reportero hnbrido ArtTal1/TalRab2-reportero (sec. con num. de ident.: 48) (Figura 7d) que contiene una secuencia de reconocimiento ArtTall en el extremo 5' de la region espaciadora y una secuencia de reconocimiento TalRab2 en el extremo 3' de la region espaciadora. El arreglo TalRab2 (sec. con num. de ident.: 8) esta compuesto por 14 elementos TAL que reconocen la secuencia diana 5'-GGTGGCCCGGTAGT-3'. El dominio nucleasa Clo051 se clono como una region codificante sintetica en los sitios Pmel y Mlul del plasmido pCAG-TalRab2-nucleasa (sec. con num. de ident.: 9) para derivar el vector de expresion pCAG-TalRab2-Clo051 (sec. con num. de ident.: 52) para la expresion de la protema TalRab2-Clo051 (sec. con num. de ident.: 53). Como se muestra en la Figura 10A la cotransfeccion de pCAG-ArtTal1-Clo051 junto con el plasmido reportero ArtTall resulto en una expresion genica significativa del reportero, lo que indica la actividad nucleasa espedfica de la protema de fusion ArtTal1-Clo051. Dado que los plasmidos reporteros ArtTall contienen dos secuencias de union ArtTall inversas, la actividad nucleasa de ArtTal1-Clo05l puede resultar a partir de la accion de una protema de fusion unica o de la accion combinada de dos moleculas. Para distinguir entre estas posibilidades el pCAGArtTal1-Clo051 se cotransfecto con el plasmido reportero ArtTal1/TalRab2 que contiene solamente una secuencia de union ArtTall. Como se muestra en la Figura 10A la nucleasa ArtTal1-Clo051 no exhibe actividad nucleasa significativa sobre el reportero ArtTal1/TalRab2, lo que indica que para inducir una rotura en la doble hebra de ADN los dos dominios nucleasa Clo051 deben interaccionar como un dfmero. Estos resultados se confirmaron con la nucleasa TalRab2-Clo051 que actua sobre su correspondiente plasmido reportero TalRab2 pero no sobre el plasmido reportero tnbrido ArtTal1/TalRab2 (Figura 10A). Como se esperaba, la protema de fusion ArtTal1-Fokl igualmente no exhibe actividad nucleasa sobre el reportero ArtTal1/TalRab2 (Figura 10B).

A continuacion, estudiamos si dos dominios nucleasa Clo051, que se fusionan a diferentes arreglos de los elementos TAL de union al ADN, son capaces, ademas, de interaccionar e inducir roturas en la doble hebra. Para este proposito, los vectores de expresion pCAG-ArtTal1-Clo051 y pCAG-TalRab2-Clo051 se cotransfectaron junto con el plasmido reportero ArtTal1/TalRab2 y los resultados se compararon con la cotransfeccion del pCAG-ArtTal1-Clo051 junto con el reportero ArtTal1/TalRab2. Como se muestra en la Figura 10B, la actividad nucleasa significativa sobre el reportero ArtTal1/TalRab2 se desarrollo solamente mediante la coexpresion de las nucleasas ArtTall- y TalRab2-Clo051, lo que indica que los dominios nucleasa Clo051 fusionados con diferentes arreglos de TAL son capaces de interaccionar e inducir una rotura en la doble hebra del ADN dentro de una region diana hnbrida que contiene las secuencias de reconocimiento de dos arreglos TAL de union al ADN distinguidos.

Ejemplo 2: Transformacion del gen de raton Rab38 en celulas ES y cigotos con nucleasas TAL-Clo051

Construccion de nucleasas TAL-Clo051 espedficas de Rab38 y un vector de transformacion

Para demostrar la funcionalidad de las protemas de fusion nucleasa-dominio efector TAL de union al ADN en celulas de mairnferos disenamos un par de protemas de fusion que reconocen una secuencia diana de ADN dentro del gen de raton Rab38 (Figura 11). Las dos protemas de fusion nucleasa-dominio efector TAL de union al ADN son destinadas a unirse junto a la region del ADN diana bipartita e inducir una rotura en la doble hebra en la region espaciadora para estimular la recombinacion homologa en el locus diana en celulas de m ai^eras.

El gen de raton Rab38 codifica la protema RAB38 que es un miembro de una familia de protemas conocidas portener un papel crucial en el transporte vesicular. En ratones mutantes chocolate (cht) el intercambio de un solo nucleotido en la posicion 146 (mutacion G > T) dentro del primer exon de Rab38 conduce al reemplazo de glicina por valina en el codon 19 (Loftus, S.K., y otros, Proc Natl Acad Sci USA, 2002. 99(7): p. 4471-6). Este reemplazo de aminoacido se ubica dentro del dominio de union a GTP conservado de RAB38 y afecta la clasificacion de la protema relacionada con la tirosinasa 1 (TYRP1) en los melanosomas de los melanocitos Rab38cht/Rab38cht. La TYRP1 es una glicoprotema de membrana melanosomal, que funciona como una enzima oxidasa 5,6-Dihidroxiindol-2-acido carbonico para producir melanina y como un proveedor de estabilidad estructural para la tirosinasa en el complejo enzimatico melanogenico. Se cree que TYRP1 transita desde la red trans-Golgi hasta los melanosomas en etapa II por medio de vesmulas recubiertas de clatrina. La cantidad reducida de TYRP1 ubicada correctamente conduce a un deterioro de la produccion de pigmento y al cambio del color del pelaje, de negro a marron similar al chocolate, en ratones Rab38cht/Rab38cht. Dado que se conoce que las mutaciones de los genes necesarios para la funcion de los melanocitos causan el albinismo oculocutaneo (OCD), tal como el smdrome de Hermansky-Pudlak en el hombre, el gen Rab38 es un locus candidato en los pacientes con OCD.

Nos propusimos introducir una fenocopia de la mutacion chocolate en el codon 19 de Rab38 mediante el uso de un par de nucleasas TAL (RabChtTal1- y RabChtTal2-Clo051) que cada una reconoce una secuencia diana de 14 pb ubicada en el extremo 5' y en el extremo 3' de una secuencia espaciadora de 15 pb dentro del exon 1 del gen Rab38 (Figura 11). Para derivar los vectores de expresion para las nucleasas sinteticas RabChtTal1 y RabChtTal2-Clo051, las regiones codificantes sinteticas para los dominios de union al ADN RabChtTall y RabChtTal2 compuestos de 14 elementos TAL y el dominio nucleasa Clo051 se insertaron en el vector pCAG-TAL-nucleasa. El plasmido resultante pCAG-RabChtTal1-Clo051 (sec. con num. de ident.: 54) codifica la protema de fusion RabChtTal1-Clo051 (sec. con num. de ident.: 55), y el plasmido pCAG-RabChtTal2-Clo051 (sec. con num. de ident.: 56) codifica la protema de fusion RabChtTal2-Clo051 (sec. con num. de ident.: 57).

Para la modificacion del gen Rab38 mediante recombinacion homologa en ovocitos fecundados, construimos el vector de transformacion genica pRab38-chtTAL (Figura 12) (sec. con num. de ident.: 58), que comprende dos regiones de homologfa que abarcan 942 y 2788 pb de la secuencia genomica que flanquean el exon 1 del gen de raton Rab38 (sec. con num. de ident.: 59). Para este proposito, los vectores con los brazos de homologfa 5' y 3' se amplificaron a partir del clon genomico BAC, RPCI-421G2 (derivado a partir del genoma de C57BL/6J, Imagenes GmbH, Berlin), mediante el uso de cebadores espedficos de PCR. Dentro de la secuencia del codon 19, introdujimos dos cambios de nucleotidos que modifican el codon 19 de la secuencia de tipo silvestre GGT, que codifica para glicina, en GTA, que codifica para valina. Esta nueva mutacion chocolate puede distinguirse de la mutacion chocolate de origen natural, que exhibe un solo intercambio de nucleotidos dentro del codon 19 (GTT) que codifica para valina (Loftus, S.K., y otros, Proc Natl Acad Sci U S A , 2002. 99(7): p. 4471-6). Ambos alelos mutantes chocolate pueden distinguirse adicionalmente del alelo de tipo silvestre mediante analisis de restriccion, ya que las mutaciones en el codon 19 eliminan un sitio de reconocimiento para la endonucleasa de restriccion BsaJI (Figura 12). La region de reconocimiento de las nucleasas TAL se ubica en el extremo 3' del codon 19 (Figura 11). Para la construccion de la region de homologfa 3' del vector de transformacion, cada secuencia de reconocimiento de 14 pb de la protema de fusion TAL se modifico adicionalmente mediante la introduccion de cambios de nucleotidos silentes que no alteran la secuencia de la protema RAB38 (Figura 12), para evitar el procesamiento potencial del vector de transformacion por las nucleasas TAL espedficas de Rab38.

Para la modificacion del gen Rab38 mediante recombinacion homologa en celulas ES de raton, modificamos el vector de transformacion genica pRab38-chtTAL (Figura 12) mediante la insercion de un gen de resistencia a neomicina, como un marcador de seleccion, en la region espaciadora de la region de reconocimiento de la nucleasa-TAL, para derivar el vector de transformacion pRab38-chtTAL-neo (sec. con num. de ident.: 60).

Transformacion del gen Rab38 en celulas ES y cigotos

Para demostrar la utilidad de las protemas RabChtTal1- y RabChtTal2-Clo051 para la transformacion genica en celulas de mairnferos (Figura 3) introdujimos los vectores de expresion o el ARNm codificante de las protemas junto con el vector de transformacion pRab38-chtTAL-neo en celulas ES de raton o con el vector pRab38-chtTAL en ovocitos fecundados de raton.

Para la transformacion en celulas ES transfectamos las celulas ES IDG3.2 (Hitz, C. y otros Nucleic Acids Res. 35, e90, 2007) con el vector de transformacion linealizado pRab38-chtTAL-neo junto con, o sin, los plasmidos de expresion de nucleasa TAL pCAG-RabChtTal1- y pCAG-RabChtTal2-Clo051. La transfeccion, seleccion, expansion y genotipificacion de los clones de celulas ES resistentes a neomicina se realizo de acuerdo con los procedimientos estandar de deteccion de genes diana como se describio (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003. Manipulating the Mouse Embryo. Cold Spring Harbour, New York: Cold Spring Harbour Laboratory Press). El analisis de los clones de celulas ES resistentes revelo que la expresion de las nucleasas TAL conduce a una tasa significativamente aumentada de recombinacion homologa en el gen Rab38 en celulas ES. Para la microinyeccion en ovocitos de raton fecundados, el vector de ADN circular pRab38-chtTAL se mezclo in vitro con el transcrito de ARNm codificante de las protemas RabChtTal1- y RabChtTal2-Clo051 en el tampon de inyeccion como se describio (Meyer, M., y otros, Proc Natl Acad Sci U S A . 107(34): p. 15022-6). El ARNm de TAL-nucleasa se prepara a partir de los plasmidos de expresion linealizados pCAG-RabChtTAl1- y pCAG-RabChtTal2-Clo051

Mediante la transcripcion in vitro a partir del promotor T7 mediante el uso del kit mMessage mMachine (Ambion) de acuerdo con las instrucciones del fabricante. El ARNm se modifico adicionalmente mediante la adicion de una cola de poli-A mediante el uso del kit de adicion de Poli(A) y se purifico con las columnas MegaClear de Ambion. Finalmente, el ARNm se precipito y disolvio en tampon de inyeccion.

Para aislar los ovocitos fecundados, los machos de la cepa C57BL/6 se aparean con hembras superovuladas de la cepa FVB. Para inducir la superovulacion las hembras FVB de tres semanas de edad, 2 dfas antes del apareamiento, se trataron con suero de yeguas prenadas 2.5 IU (PMS), y con gonadotropina corionica humana 2.5 IU (hCG) el dfa del apareamiento. Los ovocitos fecundados se aislaron de los oviductos de las hembras con tapon positivo y se microinyectaron en medio M2 (Sigma-Aldrich Inc Num. Cat. M7167) con el ARNm de nucleasa TAL y la preparacion del vector de transformacion pRab38-chtTAL, en uno de los pronucleos y el citoplasma de acuerdo con los procedimientos estandar (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003. Manipulating the Mouse Embryo. Cold Spring Harbour, New York: Cold Spring Harbour Laboratory Press).

Despues de la microinyeccion, los ARNm de nucleasa TAL se traducen en protemas que inducen una rotura de doble hebra en uno o en ambos alelos de Rab38 en una o mas celulas del embrion en desarrollo. Este evento estimula la recombinacion del vector de transformacion pRab38-chtTAL con un alelo Rab38 a traves de las regiones de homologfa presentes en el vector y conduce a la insercion en un sitio espedfico del codon mutante 19 en el genoma, lo que resulta en un alelo Rab38Fht portador de la mutacion chocolate (Figura 12). Los cigotos microinyectados setransfirieron a hembras pseudoprenadas para permitir su desarrollo ulterior en ratones vivos (Nagy A, Gertsenstein M, Vintersten K, Behringer R., 2003. Manipulating the Mouse Embryo. Cold Spring Harbour, New York: Cold Spring Harbour Laboratory Press). A partir de la descendencia resultante, se extrajo ADN genomico de las puntas de la cola para analizar la presencia del evento de recombinacion homologa deseado en el locus Rab38 mediante PCR. Este analisis se realizo mediante la amplificacion por PCR de la region genomica que abarca el exon 1. La presencia de un alelo Rab38cht puede reconocerse despues de la digestion de los productos del PCR con BsaJI, ya que la mutacion Rab38cht en el codon 19 conduce a la eliminacion de un sitio de restriccion BsaJI que esta presente en la secuencia de tipo silvestre.

En un experimento de este tipo, se analizaron ratones derivados de cigotos microinyectados mediante un ensayo de PCR de Rab38. Entre este grupo, la mayona de los ratones exhibieron los dos alelos del genotipo normal Rab38 de tipo silvestre, mientras que algunos individuos albergaban un alelo de la mutacion chocolate Rab38 predisenada, como lo indica la ausencia del sitio de restriccion BsaJI en el exon 1.

En conjunto, fue posible introducir una modificacion predisenada en la region codificante del gen Rab38 mediante recombinacion homologa asistida por la nucleasa TAL-Clo051 en celulas ES de raton y ovocitos fecundados.

Ejemplo 3: Aislamiento de mutantes hiperactivos de nucleasa Clo051.

Como se muestra en la Figura 13 la secuencia primaria del dominio nucleasa Clo051 entre las posiciones E389 e Y587 exhibe una distribucion unica de residuos de arginina (R) y lisina (K) cargados positivamente y de residuos de glutamato (E) y aspartato (D) cargados negativamente. Estos residuos componen un panorama tridimensional de cargas dentro del dominio Clo051 que determina la estructura terciaria unica de esta nucleasa, como se muestra en el modelo estructural en la Figura 6. Determinados reemplazos de residuos polares versus no polares o de residuos no polares contra residuos polares, por ejemplo en las posiciones 423 y 446, alteran la estructura tridimensional de la cadena proteica y puede resultar en un aumento de la actividad nucleasa.

Tales reemplazos de aminoacidos pueden realizarse mediante ensayos de prueba y error o pueden seguir hipotesis espedficas sobre el impacto estructural y funcional en el dominio nucleasa de Clo051. Alternativamente, un gran numero de variantes mutagenizadas aleatoriamente de la region codificante del dominio nucleasa Clo051 pueden ensamblarse en una biblioteca mediante PCR mutagenica. Esta biblioteca de moleculas mutantes puede analizarse para detectar la presencia de variantes de nucleasa hiperactiva mediante un ensayo de seleccion fenotfpica en celulas de levadura, de mairnferos o en E. coli que se acopla a una lectura de nucleasa funcional, por ejemplo, como se describio para la mejora de la recombinasa FLP (Buchholz y otros, Nat. Biotechnol. 16, 657-62, 1998).

Tal seleccion funcional para variantes mejoradas de nucleasas puede resultar en el reemplazo de, por ejemplo, el residuo 423 de una serina por una prolina y del residuo 446 de una arginina por un glutamato. Tales moleculas variantes pueden demostrar una actividad nucleasa superior en comparacion con la forma de tipo silvestre Clo051.

Ejemplo 4: Recombinacion inducida por nucleasa Clo051 de sustratos genomicos en celulas humanas

La accion de la nucleasa Clo051 se evaluo adicionalmente en celulas HEK293 humanas sobre un constructo reportero genomico integrado. Para este proposito, el plasmido reportero ArtTal1 (Figura 7) se modifico mediante la insercion de un gen de resistencia a higromicina en la cadena plasirndica. Ademas, el marco de lectura de la p-galactosidasa se fusiono con la region codificante del gen de resistencia a la neomicina, lo que resulta en el plasmido reportero pCMV-Rab-Reportero(hygro) (sec. con num. de ident.: 61). Para generar una lmea celular que albergara el constructo reportero en su genoma, se electroporo ADN plasirndico reportero linealizado en celulas HEK 293 humanas (ATCC #CRL-1573) (Graham FL, Smiley J, Russell WC, Nairn R., J. Gen. Virol. 36, 59-74, 1977) y se seleccionaron y aislaron los clones resistentes a higromicina. Uno de los clones resistentes, que no mostro actividad de fondo del gen reportero, 293ArtTal-Rep#2, se escogio para el trabajo posterior.

A continuacion, se transfectaron un millon de celulas reporteras con 5 |jg de ADN plasirndico del vector de expresion de nucleasa Tal, pCAG-ArtTal1-Clo051 (Figura 4) o con 5 jg del vector de clonacion no relacionado pBluescript como control negativo. Despues de la transfeccion, las celulas se sembraron en pocillos duplicados de una placa de cultivo de tejidos de 6 pocillos y se cultivaron durante dos dfas antes de comenzar el analisis. Para el analisis, las celulas transfectadas de cada pocillo se fijaron durante 10 minutos con formaldetudo al 4 % y se incubaron durante 4 horas con la solucion de tincion de X-Gal (K3(Felll(CN)6) 5 mM, K4(Fell(CN)6) 5 mM, MgCl2 2 mM, X-Gal (5-bromo-cloro-3-indoil-p-D-galactopiranosido) 1 mg/mL. Las celulas recombinadas que expresan el gen reportero se visualizaron mediante una tincion azul intracelular y se cuantificaron en imagenes fotograficas mediante el uso de la funcion de recuento de celulas del programa informatico ImageJ (disponible en el sitio web con la direccion http://imagej.nih.gov/ij). Como se muestra en la Figura 14A, la transfeccion con el plasmido de control pBluescript no resulto en celulas reporteras positivas (> 0,1 %, 0 celulas positivas de 1076 celulas contadas). En contraste, la transfeccion de pCAG-ArtTal-1 resulto en una fraccion sustancial de celulas que recombinaron la construccion reportera y expresaron p-galactosidasa (Figura 14 B). Segun se cuantifico a partir de imagenes fotograficas, 42,7 % de las celulas reporteras (227 celulas positivas de 531 celulas contadas) mostraron una recombinacion exitosa como lo indica la expresion del gen reportero. En conclusion, este

Claims

Reivindicaciones

1. Una molecula de acido nucleico que codifica

(I) un polipeptido quetiene la actividad de una endonucleasa, que es

(a) una molecula de acido nucleico que codifica un polipeptido que consiste en la secuencia de aminoacidos de la sec. con num. de ident.:1;

(b) una molecula de acido nucleico que consiste en la secuencia de nucleotidos de la sec. con num. de ident.: 2; (c) una molecula de acido nucleico que codifica una endonucleasa, cuya secuencia de aminoacidos es al menos 70 % identica a la secuencia de aminoacidos de la sec. con num. de ident.:1;

(d) una molecula de acido nucleico que consiste en una secuencia de nucleotidos que es al menos 50 % identica a la secuencia de nucleotidos de la sec. con num. de ident.: 2;

(e) una molecula de acido nucleico que es degenerada con respecto a la molecula de acido nucleico de (d); o (f) una molecula de acido nucleico correspondiente a la molecula de acido nucleico de cualquiera de (a) hasta (e) en donde T se reemplaza por U;

(II) un fragmento del polipeptido de (I) que tiene la actividad de una endonucleasa.

2. La molecula de acido nucleico de conformidad con la reivindicacion 1, en donde en (I)(c) en dicha secuencia de aminoacidos que tiene al menos 70 % de identidad de secuencia con respecto a la sec. con num. de ident.: 1 los residuos de aminoacidos P66, D67, D84 y/o K86 de la sec. con num. de ident.: 1 no estan modificados.

3. La molecula de acido nucleico de conformidad con la reivindicacion 1 o 2 que codifica, ademas, un dominio de union al ADN.

4. La molecula de acido nucleico de conformidad con la reivindicacion 3, en donde el dominio de union al ADN es un motivo efector TAL de una protema efectora TAL.

5. Un vector que comprende la molecula de acido nucleico de conformidad con cualquiera de las reivindicaciones 1 a 4.

6. Una celula huesped que comprende la molecula de acido nucleico de conformidad con cualquiera de las reivindicaciones 1 a 4 o el vector de conformidad con la reivindicacion 5.

7. Una protema o protema de fusion que tiene la actividad de una endonucleasa en donde dicha protema o protema de fusion esta codificada por la molecula de acido nucleico de conformidad con cualquiera de las reivindicaciones 1 a 4 o el vector de conformidad con la reivindicacion 5.

8. Un metodo para la modificacion in vitro de una secuencia diana en el genoma de una celula eucariotica, el metodo comprende la etapa:

(a) introducir en dicha celula la molecula de acido nucleico de conformidad con la reivindicacion 3 o 4, el vector de conformidad con la reivindicacion 5 o la protema o protema de fusion de conformidad con la reivindicacion 7.

9. El metodo de conformidad con la reivindicacion 8, en donde la modificacion de dicha secuencia diana es mediante recombinacion homologa con una secuencia de acido nucleico donante, que comprende, ademas, la etapa:

(b) introducir una molecula de acido nucleico en dicha celula, en donde dicha molecula de acido nucleico comprende dicha secuencia de acido nucleico donante, en donde dicha secuencia de ADN donante esta flanqueada en el extremo 5' por un primer elemento flanqueante y en el extremo 3' por un segundo elemento flanqueante, en donde dicho primer y segundo elementos flanqueantes son diferentes y en donde cada uno de dichos primer y segundo elementos flanqueantes son homologos a una secuencia de ADN continua sobre ambos lados de la doble hebra introducidas en (a) de conformidad con la reivindicacion 8 dentro de dicha secuencia diana en el genoma de dicha celula eucariotica.

10. El metodo de conformidad con las reivindicaciones 8 o 9, en donde dicha celula se analiza para determinar la modificacion exitosa de dicha secuencia diana en el genoma.

11. El metodo de conformidad con cualquiera de las reivindicaciones 8 a 10, en donde la celula se selecciona a partir del grupo que consiste en una celula de mairnfero o vertebrado, una celula vegetal o una celula de hongo.

12. El metodo de conformidad con cualquiera de las reivindicaciones 8 a 11, en donde la celula es un ovocito no humano.

Un metodo para producir un vertebrado no humano o un mairnfero no humano que porta una secuencia diana modificada en su genoma; el metodo que comprende producir una celula no humana de acuerdo con el metodo de conformidad con cualquiera de las reivindicaciones 9 a 12.

El metodo de conformidad con cualquiera de las reivindicaciones 8 a 13, en donde la celula se selecciona a partir del grupo que consiste en roedores, perros, felidos, primates, conejos, cerdos, vacas, pollos, pavos, faisanes, patos, gansos, codornices, avestruz, emues, casuarios y pez cebra.

Un metodo para producir la protema o protema de fusion de conformidad con la reivindicacion 7 que comprende las etapas: (a) cultivar la celula huesped de conformidad con la reivindicacion 6 y (b) aislar la protema o protema de fusion que se produce.