MXPA99004903A - Adn que codifica para delta-endotoxinas activascontra lepidopteros, y su uso - Google Patents

Adn que codifica para delta-endotoxinas activascontra lepidopteros, y su uso

Info

Publication number
MXPA99004903A
MXPA99004903A MXPA/A/1999/004903A MX9904903A MXPA99004903A MX PA99004903 A MXPA99004903 A MX PA99004903A MX 9904903 A MX9904903 A MX 9904903A MX PA99004903 A MXPA99004903 A MX PA99004903A
Authority
MX
Mexico
Prior art keywords
seq
nrrl
amino acid
cryl
polypeptide
Prior art date
Application number
MXPA/A/1999/004903A
Other languages
English (en)
Inventor
A Baum James
Jelen Gilmer Amy
Mettus Annemarie
Original Assignee
Monsanto Company
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Monsanto Company filed Critical Monsanto Company
Publication of MXPA99004903A publication Critical patent/MXPA99004903A/es

Links

Abstract

Se describen segmentos deácido nucleico novedosos de B. thuringiensis sintéticamente modificados que codifican delta-endotoxinas que tienen actividad insecticida contra insectos leditópteros;se describen también proteínas cristalinas sintéticas codificadas por esas secuencias novedosas de cido nucleico;se describen métodos para obtener y usar estos genes y proteínas, asícomo también métodos para la expresión recombinante y transformación de células hospederas adecuadas;las plantas transgénicas y células hospederas transformadas que expresan la endotoxina modificada, son también aspectos de la invención;se describen también métodos para modificar, alterar y mutadas regiones de bucle específicas ente las hélices alfa en el dominio 1 de estas proteínas cristalinas, incluyendo Cry1C, para producir genes cry* recombinantes diseñados por ingeniería genética, y las proteínas que codifican que tienen actividad insecticida mejorada;en modalidades preferidas, se describen los segmentosde amino cidos novedosos Cry1C* y las secuencias de cido nucleico cry1C modificadas que los codifican.

Description

ADN QUE CODIFICA DELTA-ENDOTOXINAS ACTIVAS CONTRA LEPIDÓPTEROS. Y SU USÓ¬ LO.- ANTECEDENTES DE LA INVENCIÓN La presente invención es una continuación en parte de la solicitud de patente estadounidense No. de serie 08/757,536, presentada el 27 de noviembre de 1996, cuyos contenidos totales quedan específicamente incorporados aquí mediante esta referencia. 1.1.- CAMPO DE LA INVENCIÓN La presente invención se refiere en general a los campos del control de insectos. Ciertas modalidades están relacionadas con métodos y composiciones que comprenden segmentos de ácido nucleico que codifican delta-endotoxinas derivadas de Bacillus thuringiensis. Se describe métodos para alterar las proteínas cristalinas Cryl mediante mutagénesis de las regiones de rizo entre las hélices alfa del dominio 1 de proteína o de la región de rizo entre la hélice alfa 7 del dominio 1 y el filamento beta 1 del dominio 2, para dar lugar a proteínas Cryl modificadas (Cryl*) que tienen actividad mejorada contra insectos lepidópteros. También se describe diversos métodos para fabricar y usar esas proteínas y esos segmentos de ácidos nucleicos, tratados recombinantemente por ingeniería,, que incluyen el desarrollo de células de plantas transgénicas y células anfitrionas recombinantes. 1.2.- DESCRIPCIÓN DE LA TÉCNICA RELACIONADA Se deriva la mayoría de los pesticidas microbianos muy ampliamente usados, de las bacterias Bacillus thuringiensis. B. Thuringiensis es una bacteria gram-positiva que produce proteínas cristalinas que son específicamente tóxicas para ciertos órdenes y especies de insectos. Se ha demostrado que muchas cepas diferentes de B. Thuringiensis producen proteínas cristalinas insecticidas. Las composiciones que incluyen cepas de B. Thuringiensis que producen proteínas insecticidas, han estado disponibles comercialmente y han sido usadas como insecticidad ambientalmente aceptables, debido a que son bastante tóxicos para el insecto de destino específico, pero son inocuos para plantas y otros organismos que no son los de destino. Se usa delta-endotoxinas para controlar una gran variedad de orugas y escarabajos comedores de hojas, así como mosquitos. B. Thuringiensis produce un cuerpo o cristal paraesporal proteináceo que es tóxico cuando lo ingiere un anfitrión insecto, susceptible. Por ejemplo, B. Thuringiensis, subespecie kurstaki HD-1 produce una inclusión cristalina que comprende delta-endotoxinas que son tóxicas para las larvas de numerosos insectos del orden de los lepidópteros (Schnepf y Whiteley, 1981 ). 1.2.1.- delta-ENDOTOXIN AS Las delta-endotoxinas son una gran colección de proteínas insecticidas producidas por B. Thuringiensis. Durante la última década, la investigación acerca de la estructura y la función de las toxinas de ß. Thuringiensis ha cubierto todas las principales categorías de toxinas, y si bien estas toxinas difieren en estructura específica y en función, se supone que hay similitudes generales en la estructura y en la función. Con base en el conocimiento acumulado de las toxinas de B. Thuringiensis, se ha creado un modo generalizado de acción de las toxinas de ß. Thuringiensis que incluye: ingestión por el insecto; solubilización en la tripa media del insecto (una combinación de estómago e intestino delgado), resistencia a las enzimas digestivas, algunas veces con digestión parcial que "activa" realmente la toxina, uniéndose a las células de la tripa media; formación de un poro en las células del insecto y la interrupción de la homeostasis celular (English y Slatin, 1992). 1.2.2.- GENES QUE CODIFICAN PROTEÍNAS CRISTALINAS Muchas de las delta-endotoxinas están relacionadas en diversos grados mediante similitudes en sus secuencias de aminoácido. Históricamente, las proteínas y los genes que las codifican estaban clasificadas en gran parte con base en su espectro de actividad insecticida. El resumen por Hófte y Whiteley (1989) discute los genes y las proteínas que habían sido identificadas en ß. Thuringiensis antes de 1990, y establece la nomenclatura y el esquema de clasificación que han sido aplicados tradicionalmente a los genes y proteínas de B. Thuringiensis. Los genes cryl codifican proteínas Cryl tóxicas para los lepidópteros. Los genes cryll codifican proteínas Cryl I que son tóxicas tanto para los lepidópteros como para los dípteros. Los genes crylll codifican proteínas Crylll, tóxicas para los coleópteros, mientras que los genes crylV codifican proteínas CrylV tóxicas para los dípteros. Con base en el grado de similitud de secuencia, se clasificó adicionalmente las proteínas en subfamilias; a las proteínas más fuertemente relacionadas dentro de cada familia se les asignó letras divisionales, como CrylA, CrylB, CryiC, etc. Las proteínas todavía más íntimamente relacionadas dentro de cada división, recibieron nombres como CrylCI , CrylC2, etc. Recientemente se ha propuesto una nueva nomenclatura que clasifica sistemáticamente las proteínas Cry con base en la homología de secuencia de aminoácidos, en lugar de por las especificidades del insecto de destino. Este esquema de clasificación está resumido en el cuadro I.
CUADRO I NOMENCLATURA REVISADA DE delta-ENDOTOXINA DE B. THURINGIENSIS A Adaptado de http://epunix.biols.susx.ac.uk/Home/ Neil Crickmore/Bt/index.html 1.2.3.- LAS PROTEÍNAS CRISTALINAS TIENEN UTILIDAD COMO BIOINSECTICIDAS La utilidad de las proteínas cristalinas bacterianas como insecticidas se extendió cuando se informó el primer aislamiento de la cepa de ß.
Thuringiensis tóxica para los coleópteros (Krieg y coautores, 1983: 1984). Se dice que esta cepta (descrita en la patente estadounidense 4,766,203, incorporada específicamente aquí mediante la referencia), designada B. Thuringiensis var.tenebrionis, es tóxica para las larvas de los insectos coleópteros Agelastica alni (coleóptero de hoja del aliso azul) y de Leptinotarsa decemlineata (coleóptero de la papa de Colorado). La patente US 5,024,837 también describe cepas híbridas de B. Thuringiensis var./ ursía /', que mostraban actividad contra insectos lepidópteros. La patente estadounidense 4,797,279 (que corresponde a EP 0221024) describe un híbrido de B. Thuringiensis que contiene un plásmido de B. Thuringiensis var. Kurstaki que codifica un gene que codifica una proteína cristalina tóxica para lepidópteros, y un plásmido de B. Thuringiensis tenebríonis que codifica un gene que codifica una proteína cristalina tóxica para coleópteros. La cepa híbrida de B. Thuringiensis produce proteínas cristalinas características de las formadas tanto por ß. Thuringiensis kurstaki como por B. Thuringiensis tenebrionis. La patente US 4,910,016, (que corresponde a EP 0303379) describe un aislado de ß. Thuringiensis identificado como B. Thuringiensis MT104, que tiene actividad insecticida contra coleópteros y lepidópteros. 1.2.4.- LAS ENDOTOXINAS CRY1 La caracterización de la proteína cristalina CrylAa de B. Thuringiensis y la clonación, secuenciación de ADN y expresión del gene que la codifica, han sido descritas (Schnepf y Whitely, 1981 ; Schnepf y coautores, 1985). En publicaciones relacionadas, y en las patentes US 4,448,885 y US 4,467,036 (incorporadas específicamente aquí mediante la referencia), se describe la expresión de la proteína cristalina CrylAa de ß. Thuringiensis en E. coli. Se ha descrito en la técnica anterior varios genes crylC. Se aisló un gene crylC truncado en el extremo 3', a partir de B. Thuringiensis, subespecie aizawai 7.29 por Sanchís y coautores (1988). La proteína truncada exhibió toxicidad hacia especies de espodópteros. La secuencia del gene crylC truncado y su proteína codificada fueron descritos en PCT WO 88/09812 y en Sanchís y coautores (1989). La secuencia de un gene crylC aislado de ß. Thuringiensis, subespecie entomocidus 60.5 fue descrita por Honee y coautores (1988). Este gene está reconocido como el gene holotipo crylC por Hófte y Whiteley (1989). La secuencia de un gene crylC también está descrita en la patente US 5,126,133. El gene crylC de B. Thuringiensis subespecie aizawai EG6346, contenido en los plásmidos pEG315 y pEG916, aquí descritos, codifica una proteína CrylC idéntica a la descrita en la patente anteriormente mencionada US 5,126,133. La proteína CrylC descrita por Sanchís y coautores (1989) y en PCT WO 88/09812, difiere de la proteína CrylC EG6346 en varias posiciones que pueden ser descritas como sustituciones dentro de la proteína EG6346 CrylC: CrylC N3661 , W376C, P377Q, A378R, P379H, P380H, V386G, R775A.
De manera significativa, las posiciones 376-380 de aminoácidos corresponden a los residuos de aminoácido predichos que estarían dentro de la región de rizo entre el filamento 6 de beta y el filamento 7 de beta de CrylC, utilizando la nomenclatura adoptada por Li y coautores (1991 ) para identificar estructuras dentro de Cry3A. Las comparaciones por bioanálisis entre la proteína CrylC de la cepa EG6346 y la proteína Cryl C de la cepa aizawai 7.29 no reveló diferencias significativas en la actividad insecticida contra S. Exigua, T. ni o P. xilostella. Estos resultados sugirieron que las dos proteínas CrylC exhibían la misma especificidad insecticida, a pesar de sus diferentes secuencias de aminoácido dentro de la región de rizo predicha entre el filamento 6 de beta y el filamento 7 de beta. Smith y Ellar (1994) informaron de la clonación de un gene crylC de la cepa HD229 de ß. Thuringiensis y demostraron que las sustituciones de aminoácido dentro de la región de rizo putativa entre el filamento 6 de beta y el filamento 7 de beta ("rizo beta 6-7") alteraban la especificidad insecticida de CrylC hacia Spodoptera frugiperda y Aedes aegypti, pero no mejoraban la toxicidad de CrylC hacia ninguna plaga de insectos. Los resultados paecieron estar en conflicto con la comparación por bioanálisis anteriormente citada, entre la proteína Cryl C de EG6346 y la proteína CrylC de aizawai 7.29, que no mostraron efecto de las sustituciones de aminoácido dentro dei rizo beta 6-7 de CrylC, sobre la especificidad insecticida. Consecuentemente, se secuenció de nuevo el gene crylC de la cepa aizawai 7.29, donde se informó de codones variantes para la región de toxina activa, por Sanchís y coautores (1989) y en PCT WO 88/09812. Los resultados de ese análisis de secuencia no revelaron diferencias en las secuencias de aminoácido de las toxinas activas de CrylC procedente de la cepa EG6346 y de CrylC de la cepa aizawai 7.29. Así pues, la técnica anterior acerca de la proteína CrylC de la cepa aizawai 7.29, a la luz de las comparaciones por bioanálisis anteriormente mencionadas, con la proteína CrylC de la cepa EG6346, enseñaba incorrectamente que las múltiples sustituciones de aminoácido dentro del rizo beta 6-7 de CrylC, no tenía efecto sobre la especificidad insecticida. Recientemente Smith y coautores (1996) informaron de errores de secuenciación no específicos en el gene crylC de aizawai 7.29. 1.2.5.- LAS TÉCNICAS GENÉTICAS MOLECULARES FACILITAN LA INGENIERÍA DE PROTEÍNAS.
La revolución en la genética molecular, durante la última década ha facilitado una aproximación lógica y ordenada a la ingeniería de las proteínas, con propiedades mejoradas. Los métodos de mutagénesis específica para el sitio y aleatoria, el advenimiento de las metodologías de la reacción en cadena de polimerasa (PCR™ , en español RCP), y los avances relacionados en este campo, han permitido la recolección extensiva de herramientas para cambiar tanto la secuencia de aminoácidos, como las secuencias genéticas subyacentes, para una variedad de proteínas de interés comercial, medicinal y agrícola.
Después del rápido aumento en el número y los tipos de proteínas cristalinas que han sido identificadas en la última década, los investigadores comenzaron a teorizar acerca del uso de dichas técnicas para mejorar la actividad insecticida de diversas proteínas cristalinas. En teoría, debe ser posible mejorar las delta-endotoxinas usando los métodos disponibles para los trabajos de ingeniería de las proteínas, en el arte, y era lógico suponer que sería posible aislar variantes mejoradas del tipo silvestre de proteínas cristalinas aisladas hasta esa fecha. Reforzando uno o más de los pasos mencionados con anterioridad, en el modo de acción de la toxina, las moléculas mejoradas deben proveer actividad incrementada y, por consiguiente, representar un avance en el campo. Si los residuos de aminoácido específicos en la proteína son identificados como responsables de un paso específico en el modo de acción, entonces se debe enfocar la acción sobre esos residuos para la mutagénesis, a fin de mejorar el funcionamiento. 1.2.6.- LOS ANÁLISIS ESTRUCTURALES DE LAS PROTEÍNAS CRISTALINAS La combinación de análisis estructurales de las toxinas de B. Thuringiensis, seguida por una investigación de la función de dichas estructuras, motivos y similares, ha enseñado que las regiones específicas de las endotoxinas de proteína cristalina, de una manera general, son responsables de las funciones particulares.
Por ejemplo, la estructura de Cry3A (Li y coautores, 1991 ) y de CrylAa (Grochulski y coautores, 1995), ¡lustraba que las delta-endotoxinas de Cryl y Cry3 tenían tres dominios distintos. Cada uno de esos dominios, en cierta medida, se ha determinado que ayuda en una función particular. Por ejemplo, el dominio 1 de Cry3B2 y de Cryl Ac ha sido encontrado responsable de la actividad del canal iónico, el paso inicial en la formación de un poro (Walters y coautores, 1993; Von Tersch y coautores, 1994). Se ha encontrado que los dominios 2 y 3 son responsables de la unión al receptor y de la especificidad insecticida (Aronson y coautores, 1995; Caramori y coautores, 1991 ; Chen y coautores, 1993; de Maagd y coautores, 1996; Ge y coautores, 1991 ; Lee y coautores, 1992; Lee y coautores, 1995; Lu y coautores, 1994; Smedley y Ellar, 1996; Smith y Ellar, 1994; Rajomohan y coautores, 1995; Rajomohan y coautores, 1996; Wu y Dean, 1996). Las regiones en el dominio 3 también pueden impactar sobre la actividad en el canal iónico de algunas toxinas (Chen y coautores, 1993, Wolfersberger y coautores, 1996). 1.3.- DEFICIENCIAS EN LA TECTINA ANTERIOR Desafortunadamente, aun cuando muchos laboratorios han intentado formar proteínas cristalinas mutadas, pocos han tenido éxito al formar proteínas cristalinas mutadas con toxicidad mejorada para los lepidópteros. En caso todos los ejemplos de toxinas de ß. Thuringiensis, tratadas por ingeniería genética, en la literatura, la actividad biológica de la proteína cristalina mutada no es mejor que la de la proteína de tipo silvestre y, en muchos casos, la actividad disminuye o es destruida del todo (Almond y Dean, 1993; Aronson y coautores, 1995; Chen y coautores, 1993; Chen y coautores, 1995; Ge y coautores, 1991 Kwak y coautores, 1995; Lu y coautores, 1994; Rajamohan y coautores, 1995 Rajamohan y coautores, 1996; Smedley y Ellar, 1996; Smith y Ellar, 1994 Wlfersberger y coautores, 1996; Wy y Aronson, 1992). Para una proteína cristalina que tenga aproximadamente 650 aminoácidos en la secuencia de su toxina activa, y la posibilidad de 20 diferentes aminoácidos en cada uno de esos sitios, la probabilidad de crear arbitrariamente una nueva estructura satisfactoria es remota, aun si se pudiera asignar una función general a un tramo de 250-300 aminoácidos. En realidad, la técnica anterior señalada más arriba con respecto a la mutagénesis del gene de proteína cristalina ha estado relacionada primariamente con el estudio de la estructura y la función de las proteínas cristalinas utilizando mutagénesis para alterar algún paso en el modo de acción, en lugar de con formar por ingeniería toxinas mejoradas. Sin embargo, existen varios ejemplos en la técnica anterior en los que se obtuvo mejoras en la actividad biológica preparando una proteína cristalina recombinante. Angsuthanasamnbat y coautores (1993) demostraron que un tramo de aminoácidos en la delta-endotoxina de Cry4B, tóxica para dípteros, es proteolíticamente sensible y, reparando este sitio, se incrementa al triple la toxicidad de esta proteína para los dípteros. En contraste, se informó que la eliminación del sitio de división por tripsina en la proteína Cry9C tóxica para los lepidópteros, no tenía efecto sobre la actividad insecticida (Lambert y coautores, 1996). En otro ejemplo, Wu y Dean (1966) demostraron que los cambios específicos en aminoácidos en los residuos 481-486 (dominio 2) en la proteína Cry3A, tóxica para los coleópteros, aumentaba la actividad biológica de esa proteína en 2.4 veces, contra un insecto de destino, presumiblemente alterando la unión de toxina. Finalmente, se ha informado que las proteínas Cryl quiméricas que contienen cambios de las secuencias de dominio 2 o dominio 3, exhiben toxicidad mejorada, pero no hay evidencia de que se haya mejorado la toxicidad para más de una plaga de insectos lepidópteros o que se haya retenido la actividad insecticida hacia otras plagas de lepidópteros (Caamori y coautores, 1991 ; Ge y coautores, 1991 , de Maagd y coautores, 1996). Con base en la técnica anterior, sería de esperar que los cambios que implican el dominio 2 o el dominio 3, cambiaran la especificidad del insecticida. La técnica anterior provee también ejemplos de mutantes de CrylA que contienen mutaciones que codifican sustituciones de aminoácido dentro de las hélices alfa predichas del dominio 1 (Wu y Aronson, 1992; Aronson y coautores, 1995; Chen y coautores, 1995). Ninguna de esas mutaciones dio por resultado actividad insecticida mejorada y muchas dieron por resultado una reducción en la actividad, en particular las que codifican sustituciones dentro de la hélice 5 predicha (Wu y Aronson, 1992). La mutagénesis extensiva de las regiones de rizo dentro del dominio 2 han demostrado que alteran la especificidad insecticida de Cryl C, pero no mejoran su toxicidad hacia ninguna plaga de insectos (Smith y Ellar, 1994). De manera similar, la mutagénesis extensiva de regiones de rizo en el dominio 2 y de estructuras de filamento beta, en el dominio 3 de las proteínas CrylA, no han podido producir mutantes de CrylA que tengan toxicidad mejorada (Aronson y coautores, 1995; Chen y coautores, 1993; Kwak y coautores, 1995; Smedley y Ellar, 1996; Rajamohan y coautores, 1995; Rajamohan y coautores, 1996). Estos resultados demuestran la dificultad en formar por ingeniería proteínas insecticidas mejoradas e ilustran que la ingeniería satisfactoria de las toxinas de B. Thuringiensis no sigue reglas simples y predecibles. Colectivamente, los éxitos limitados en la técnica para desarrollar toxinas sintéticas, con actividad insecticida mejorada, han dificultado el avance en esta área y confundido la investigación de endotoxinas mejoradas o proteínas cristalinas. Más que seguir reglas simples y predecibles, la ingeniería satisfactoria de una proteína cristalina mejorada puede implicar diferentes estrategias, dependiendo de la proteína cristalina que está siendo mejorada y de las plagas de insectos a las que se quiere combatir. Así pues, el procedimiento es sumamente empírico. Consecuentemente, la tecnología de ADN recombinante tradicional claramente no es experimentación rutinaria para proveer proteínas cristalinas insecticidas, mejoradas. De lo que se carece en la técnica anterior es de métodos racionales para producir proteínas cristalinas Cryl de B. Thuringiensis, tratadas por ingeniería genética, que tengan actividad insecticida mejorada y, en particular, toxicidad mejorada para una gran variedad de plagas de insectos lepidópteros. 2.O.- BREVE DESCRIPCIÓN DE LA INVENCIÓN La presente invención busca resolver éstos y otros inconvenientes inherentes a la técnica anterior, al proveer genes de delta-endotoxina Cryl de B. Thuringiensis, modificados por ingeniería genética y, en particular, genes crylC, que codifican proteínas cristalinas modificadas que tienen actividad insecticida mejorada contra lepidópteros. Están descritos métodos novedosos para construir proteínas Cryl sintéticas, secuencias de ácido nucleico modificadas sintéticamente, que codifican dichas proteínas, y las composiciones que se derivan de ellos. También están provistas construcciones de expresión cryl* sintéticas, y diversos métodos para usar los genes y vectores mejorados. En una modalidad preferida, la invención describe y reivindica proteínas CrylC* y genes crylC* que codifican las proteínas modificadas. Un segmento de ácido nucleico aislado, que codifica un polipéptido que tiene actividad insecticida contra lepidópteros, es un aspecto de esta invención. Dicho segmento de ácido nucleico es aislable de Bacillus thuringiensis NRRL B-21590, NRRL B-21591 , NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609 o NRRL B-21610 y, de preferencia codifica un polipéptido que comprende la secuencia de aminoácidos de SEQ ID NO: 2, SEQ ID NO: 4 SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61. Los segmentos de ácido nucleico ejemplares se hibridan específicamente a, o comprenden la secuencia de ácido nucleico de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60, o un complemento de ellas. En ciertas modalidades, dicho segmento de ácido nucleico puede estar enlazado operablemente a un promotor que expresa el segmento de ácido nucleico en una célula anfitriona. En esos casos, el segmento de ácido nucleico consta típicamente de un vector recombinante, tal como un plásmido, un cósmido, un fago, un fagémico, un cromosoma artificial viral, de baculovirus o bacteriano, o un cromosoma artificial de levadura. A su vez, se puede usar el segmento de ácido nucleico en un método de expresión recombinante para preparar un polipéptido recombinante, para preparar una planta transgénica resistente a los insectos, o para expresar el segmento de ácido nucleico en una célula anfitriona. Otro aspecto de la invención es una célula anfitriona que consta de uno o más segmentos de ácido nucleico descritos aquí, que codifica una proteína Cryl* modificada. Las células anfitrionas preferidas incluyen células bacterianas, como E. coli, B. Thuringiensis, B. Subtilis, B. Megaterium o células de Pseudomonas spp, siendo sumamente preferidas las células de B. Thuringiensis NRRL B-21590, NRRL B-21591 , NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609 y NRRL B-21610. Otra célula anfitriona preferida es una célula eucariótica, tai como una célula fungal, animal o vegetal; siendo sumamente preferidas las células vegetales, como de leguminosa, de árbol, de legumbre, de fruta, de baya, de nuez, de pasto, de cactus, de suculenta y de plantas ornamentales. Las células de planta transgénica, tales como las células de maíz, arroz, tabaco, papa, tomate, lino, cañóla, girasol, algodón, trigo, avena, cebada y centeno, son particularmente preferidas. Las células anfitrionas que producen uno o más de los polipéptidos que tienen actividad insecticida contra lepidópteros, las células anfitrionas que son útiles en la preparación de polipéptidos de toxina recombinante, y las células anfitrionas usadas en la preparación de una planta transgénica o en la generación de células de planta pluripotentes, representan aspectos importantes de la invención. Dichas células anfitrionas pueden tener uso particular en la preparación de una formulación de polipéptido insecticida, tal como un polipéptido que consiste de la secuencia de aminoácidos de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61 , y que es insecticidamente activa contra los lepidópteros. Una composición de polipéptido, como las descritas aquí, es particularmente conveniente para usarla en matar una célula de insecto y en la preparación de una formulación insecticida, tal como una formulación para rociar, protectora de plantas. Se puede preparar la composición de polipéptido cultivando una célula de B. Thuringiensis NRRL B-21590, NRRL B-21591 , NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609 o NRRL B-21610, bajo condiciones efectivas para producir una proteína cristalina de ß. Thuringiensis y obtener la proteína cristalina de ß. Thuringiensis, de la célula.
Se puede usar el polipéptido en un método para matar una célula de insecto. Este método generalmente comprende proveer a una célula de insecto una cantidad insecticidamente efectiva de la composición de polipéptido. Típicamente, la célula de insecto está comprendida dentro de un insecto, y el insecto muere por ingestión de la composición, directamente, o alternativamente, al ingerir una planta revestida con la composición, o al ingerir una planta transgénica que expresa la composición de polipéptido. Otra modalidad importante de la invención es un anticuerpo purificado que se une específicamente a un polipéptido que tiene la secuencia de aminoácidos de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61. Dichas composiciones de anticuerpo pueden ser fijadas operativamente a una etiqueta detectable, o están comprendidas dentro de un equipo de inmunodetección. Dichos anticuerpos encuentra uso particular en los métodos para detectar un polipéptido insecticida en una muestra biológica. El método implica generalmente poner en contacto una muestra biológica que se sospecha que contiene dicho polipéptido, con un anticuerpo, ajo condiciones efectivas para permitir la formación de complejos inmunológicos y detectar los complejos inmunológicos así formados. Una planta transgénica que tiene incorporado en su genoma un transgene que codifica un polipéptido que comprende la secuencia de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61 , representa también una modalidad importante de la presente invención. Dicha planta transgénica comprende de preferencia la secuencia de ácido nucleico de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ IC NO: 7, SEQ ID NO: 9 SEQ ID NO: 11 , SEQ ID NO: 58 O SEQ ID NO: 60. La progenie y las semillas de dicha planta y su progenie también son aspectos importantes de la invención. Un método para seleccionar un polipéptido Cryl que tiene actividad insecticida incrementada contra un insecto lepidóptero, que comprende someter a mutagénesis una población de polinucleótidos paa preparar una población de polipéptidos codificados por los polinucleótidos, y probar dicha población de polipéptidos e identificar un polipéptido que tiene uno o más aminoácidos modificados en una región de rizo del dominio 1 , o en una región de rizo entre el dominio 1 y el dominio 2, donde dicho polipéptido tiene actividad insecticida incrementada contra dichos insectos. Otra modalidad importante de la invención es un método para generar un polipéptido Cryl que tiene actividad insecticida incrementada contra un insecto lepidóptero. Dicho método comprende en general identificar en dicho polipéptido una región de rizo entre las hélices alfa adyacentes del dominio 1 o entre una hélice alfa del dominio 1 y un filamento beta del dominio 2; luego someter a mutagénesis el polipéptido en al menos uno o más aminoácidos de una o más de las regiones de rizo identificadas; y finalmente, probar el polipéptido mutagenizado para identificar un polipéptido que tiene actividad insecticida incrementada contra una plaga de lepidópteros.
Un método de someter a mutagénesis un polipéptico Cryl para incrementar la actividad insecticida del polipéptido contra un insecto lepidóptero, también está provisto por la invención. Este método comprende: predecir en dicho poiipéptido una secuencia de aminoácido contigua, que codifica una región de rizo entre hélices alfa adyacentes del dominio 1 , o entre una hélice alfa del dominio 1 y un filamento beta del dominio 2; efectuar la mutagénesis de uno o más de estos residuos de aminoácido, para producir una población de polipéptidos que tienen una o más regiones de rizo alteradas; probar la población de polipéptidos en cuanto a su actividad insectida contra los lepidópteros, e identificar un polipéptido en la población, que tiene actividad insecticida incrementada contra un insecto lepidóptero. En dichos métodos, la secuencia modificada de aminoácidos de preferencia comprende una región de rizo entre las hélices alfa 1 y 2a, las hélices alfa 2b y 3, las hélices alfa 3 y 4, las hélices alfa 4 y 5, las hélices alfa 5 y 6 o las hélices alfa 6 y 7, del dominio 1 ; o entre una hélice alfa 7 del dominio 1 y el filamento beta 1 del dominio 2. De preferencia, la región de rizo entre las hélices alfa 1 y 2a comprende una secuencia de aminoácido de alrededor del aminoácido 41 a alrededor del aminoácido 47 de una proteína Cryl . De igual manera, la región de rizo entre las hélices alfa 2b y 3 comprende una secuencia de aminoácido de alrededor del aminoácido 83 a alrededor del aminoácido 89 de una proteína Cryl , y la región de rizo entre las hélices alfa 3 y 4 comprende una secuencia de aminoácido de entre alrededor del aminoácido 118 y alrededor del aminoácido 124 de una proteína Cryl . La región de rizo entre las hélices alfa 4 y 5 de preferencia comprende una secuencia de aminoácido de alrededor del aminoácido 148 a alrededor del aminoácido 156 de una proteína Cryl , mientras que la región de rizo entre las hélices alfa 5 y 6 comprende una secuencia de aminoácido de alrededor del aminoácido 176 a alrededor del aminoácido 85 de una proteína Cryl . La región de rizo entre las hélices 6 y 7, de preferencia comprende una secuencia de aminoácidos de alrededor del aminoácido 217 a alrededor del aminoácido 222 de una proteína Cryl , mientras que la región de rizo entre la hélice alfa 7 del dominio 1 y el filamento beta 1 del dominio 2, de preferencia comprende una secuencia de aminoácido de alrededor del aminoácido 249 a alrededor del aminoácido 259 de una proteína Cryl . Las proteínas Cryl ejemplares incluyen: las proteínas cristalinas CrylA, Cryl B, CrylC, Cryl D, Cryl E, Cryl F, CrylG, Cryl H, Cryl l, CryU y CrylK; siendo las proteínas cristalinas sumamente preferidas: CrylAa, CrylAb, CrylAc, CiylAd, CrylAe, Cryl Ba, Cryl Bb, Cryl Bc, CrylCa, Cryl Cb, Cryl Da, Cryl Db, Cryl Ea, Cryl Eb, Cryl Fa, Cryl Fb, Cryl Hb, Cryl la, Cryl lB, CryUa y CryUb. Estas mutaciones de la región de rizo pueden incluir: cambiar uno o más aminoácidos a cualquier otro aminoácido, siempre y cuando la proteína resultante tenga actividad insecticida contra lepidópteros, incrementada. Los inventores han demostrado que las sustituciones ejemplares, tales como el cambio de uno o más residuos arginina por cualquier otro aminoácido, da por resultado polipéptidos que tienen actividad insecticida incrementada. Las sustituciones particularmente preferidas de residuos arginina incluyen las sustituidas por alanina, leucina, metionina, glicina o ácido aspártico. De igual manera, los inventores han demostrado que la sustitución de los residuos de lisina por cualquier otro aminoácido, tal como un residuo alanina, también dan por resultado toxinas insecticidamente activas. En realidad cualquiera de dichas modificaciones está contemplada por los inventores como útil, siempre y cuando la sustitución, adición, omisión o modificación de uno o más de los residuos de aminoácido en la región de rizo preferida, dé por resultado un polipéptido que tenga actividad insecticida mejorada, cuando se compara con un polipéptido Cryl no modificado. Los inventores contemplan que los mutantes combinatorios que están descritos en la presente tienen uso particular en la generación de un polipéptido que tiene una o más mutaciones en múltiples regiones de rizo o, alternativamente, en la generación de un polipéptido que tiene múltiples mutaciones, con una sola región de rizo. Dichos mutantes combinatorios, como los inventores lo han demostrado en la presente, frecuentemente dan por resultado polipéptidos mutagenizados que tienen actividad insecticida significativamente mejorada, con respecto a la secuencia no modificada, de tipo silvestre. Por supuesto, quien sea experto en la materia se dará cuenta de que estas modificaciones de aminoácido no necesariamente han de ser efectuadas en los propios polipéptidos (aunque la síntesis química de dichos polipéptidos sea bien conocida por los expertos en la materia), sino que se puede hacer por medio de mutagénesis de un segmento de ácido nucleico que codifique dicho polipéptido. Los medios para dicha mutagénesis de ADN están descritos aquí detalladamente, y los polipéptidos ejemplares construidos usando dichos métodos están descritos detalladamente en los ejemplos que vienen posteriormente en la presente. 2.1. - GENES CRY1 MUTAGENIZADOS Y POLIPÉPTIDOS Consecuentemente, la presente invención provee genes de proteína Cryl C mutagenizados y métodos para formar y usar dichos genes. Como se usa en la presente, el término "gene(s) de proteína CrylC mutagenizado(s)" significa que uno mo más genes han sido mutagenizados o alterados para contener una o más secuencias de nucleótidos que no están presentes en las secuencias de tipo silvestre, y que codifican las proteínas cristalinas CrylC mutantes (Cryl C*), que muestran actividad insecticida mejorada. De preferencia, las secuencias novedosas comprenden secuencias de ácido nucleico en las que por lo menos uno, de preferencia más de uno y, mmuy preferible, un número significativo de nucleótidos CrylC de tipo silvestre, han sido reemplazados por uno o más nucleótidos, o donde uno o más nucleótidos han sido añadidos a, u omitidos de, la secuencia de nucleótidos natural, con el propósito de alterar, añadir u omitir los aminoácidos correspondientes, codificados por la secuencia de aminoácidos así mutagenizada Por consiguiente, el resultado deseado es la alteración de la secuencia de aminoácidos de la proteína cristalina codificada para proveer toxinas que tienen actividad mejorada o alterada y/o especificidad comparada con la de la proteína de cristal no modificada. Se ha denominado las secuencias del gene crylC modificado crylC* por los inventores, mientras que las proteínas cristalinas Cryl C modificadas, codificadas en la presente, son denominadas proteínas Cryl C*. Contrario a las enseñanzas de la técnica anterior que han enfocado la atención sobre las hélices alfa de las proteínas cristalinas, como sitios para la ingeniería genética para mejorar la actividad de la toxina, la presente invención difiere notablemente al proveer métodos para crear regiones de rizo modificadas entre las hélices alfa adyacentes, dentro de uno o más de los dominios de la proteína. En una modalidad particular ilustrativa, los inventores han demostrado éxito notable en generar toxinas con actividad insecticida mejorada, utilizando estos métodos. En particular, los inventores han identificado regiones de rizo singulares dentro del dominio 1 de una proteína cristalina Cryl , que han sido seleccionados como destino para mutagénesis específica y aleatoria. En una modalidad preferida, los inventores han identificado las regiones de rizo predichas entre las hélices alfa 1 y 2a; las hélices alfa 2b y 3; las hélices alfa 3 y 4; las hélices alfa 4 y 5; las hélices alfa 5 y 6; las hélices alfa 6 y 7 y entre la hélice alfa 7 y el filamento beta 1 en las proteínas cristalinas Cryl . Utilizando CrylC como un modelo ejemplar, los inventores han generado sustituciones de aminoácido dentro de o adyacentes a esas regiones de rizo predichas, para producir toxinas CrylC* modificadas sintéticamente, que demostraron tener actividad insecticida mejorada. Al mutar residuos específicos dentro de esas regiones de rizo, los inventores fueron capaces de producir proteínas cristalinas sintéticas que retuvieron o que poseían actividad insecticida incrementada contra ciertas plagas de lepidópteros, incluyendo la larva de esciara S. Exigua. Se reivindica una proteína cristalina aislada de B. Thuringiensis que tiene una o más secuencias modificadas de aminoácidos en una o más regiones de rizo del dominio 1 , o entre la hélice alfa 7 del dominio 1 y el filamento beta 1 del dominio 2. Estas proteínas cristalinas sintéticamente modificadas tienen actividad insecticida contra insectos lepidópteros. Las secuencias cristalinas modificadas sintéticamente pueden ocurrir en una o más de las siguientes regiones de rizo: entre las hélices alfa 1 y 2a, las hélices alfa 2b y 3, las hélices alfa 3 y 4, las hélices alfa 4 y 5, las hélices alfa 5 y 6, ias hélices alfa 6 y 7 del dominio 1 , o entre la hélice 7 del dominio 1 y el filamento beta 1 del dominio 2. En una modalidad ilustrativa la invención comprende modificaciones que pueden ser efectuadas en o inmediatamente adyacentes a la región de rizo entre las hélices alfa 1 y 2a de una proteína CrylC. Esta región de rizo se extiende desde alrededor del aminoácido 42 a alrededor del aminoácido 46, extendiéndose los aminoácidos adyacentes desde alrededor del aminoácido 39 hasta alrededor del aminoácido 41 , y desde alrededor del aminoácido 47 a alrededor del aminoácido 49. La invención comprende también modificaciones que pueden ser efectuadas en o inmediatamente adyacentes a la región de rizo entre las hélices alfa 2b y 3 de una proteína Cryl C. Esta región de rizo se extiende desde alrededor del aminoácido 84 hasta alrededor del aminoácido 88, extendiéndose los aminoácidos adyacentes desde alrededor del aminoácido 81 a alrededor del aminoácido 83, y desde alrededor del aminoácido 89 a alrededor del aminoácido 91. La invención comprende también modificaciones que pueden ser efectuadas en o inmediatamente adyacentes a la región de rizo entre las hélices alfa 3 y 4 de una proteína CrylC. Esta región de rizo se extiende desde alrededor del aminoácido 119 a alrededor del aminoácido 123, extendiéndose los aminoácidos adyacentes desde alrededor del aminoácido 116 hasta alrededor del aminoácido 118, y desde alrededor del aminoácido 124 hasta alrededor del aminoácido 126. De igual manera, la invención comprende también modificaciones que pueden efectuarse en o inmediatamente adyacentes a la región de rizo entre las hélices alfa 4 y 5 de una proteína Cryl C. Esta región de rizo se extiende desde alrededor del aminoácido 149 a alrededor del aminoácido 155, extendiéndose los aminoácidos adyacentes desde alrededor del aminoácido 146 a alrededor del aminoácido 148, y desde alrededor del aminoácido 156 a alrededor del aminoácido 158. La invención comprende adicionalmente modificaciones que pueden ser efectuadas en o inmediatamente adyacentes a la región de rizo entre las hélices alfa 5 y 6 de una proteína Cryl C. Esta región de rizo se extiende desde alrededor del aminoácido 177 hasta alrededor del aminoácido 184, extendiéndose los aminoácidos adyacentes desde alrededor del aminoácido 174 hasta alrededor del aminoácido 176, y desde alrededor del aminoácido 185 hasta alrededor del aminoácido 187. Otro aspecto de la invención comprende modificaciones en la secuencia de aminoácidos que pueden ser efectuadas en o inmediatamente adyacentes a la región de rizo entre las hélices alfa 6 y 7 de una proteína CrylC. Esta región de rizo se extiende desde alrededor del aminoácido 218 a alrededor del aminoácido 221 , extendiéndose los aminoácidos adyacentes desde alrededor del aminoácido 215 a alrededor del aminoácido 217, y desde alrededor del aminoácido 222 a alrededor del aminoácido 224. De manera similar, la invención comprende también modificaciones en la secuencia de aminoácidos, que pueden ser efectuadas en o inmediatamente adyacentes a la región de rizo entre la hélice alfa 7 dei dominio 1 y el filamento beta 1 del dominio 2 de una proteína CrylC. Esta región de rizo se extiende desde alrededor del aminoácido 250 a alrededor del aminoácido 259, extendiéndose los aminoácidos adyacentes desde alrededor del aminoácido 247 a alrededor del aminoácido 249, y de alrededor del aminoácido 260 a alrededor del aminoácido 262. Además de las modificaciones de los péptidos Cryl C, también están disponibles las que tienen el beneficio de las enseñanzas de la presente para efectuar mutaciones en las regiones de rizo de proteínas que están relacionadas estructuralmente con CrylC. De hecho los inventores contemplan que cualquier proteína cristalina o péptido que tenga hélices que estén enlazadas entre sí por regiones de rizo, pueden ser alteradas usando los métodos aquí descritos, para producir proteínas cristalinas que tienen regiones de rizo alteradas. Por ejemplo, los inventores contemplan que las proteínas cristalinas Cryl particulares, en las que se pueden efectuar dichas modificaciones, incluyen las proteínas cristalinas CrylA, Cryl B, CrylC, Cryl D, Cryl E, Cryl F, Cryl G, Cryl H, Cryl l, CryU y Cryl K, que son conocidas en la técnica, así como otras proteínas cristalinas todavía no descritas ni caracterizadas, que pueden ser clasificadas como una proteína cristalina Cryl , con base en la similitud de aminoácidos con las proteínas Cryl conocidas. Las proteínas Cryl preferidas actualmente descritas, que están contempladas por los inventores para ser modificadas mediante los métodos aquí descritos, con el propósito de producir proteínas cristalinas que tengan actividad alterada, o especificidad alterada, incluyen, pero sin limitación a ellas: las proteínas cristalinas CrylAa, CrylAb, CrylAc, CrylAd, CiylAe, Cryl Ba, Ciyl Bb, Cryl Bc, CrylCa, CrylCb, Cryl Da, Cryl Db, Cryl Ea, Cryl Eb, Cryl Fa, Cryl Fb, Cryl Hb, Cryl la, Cryl lb, CryUa y CryUb; siendo particularmente preferidas las proteínas cristalinas CrylCa. Las modificaciones que pueden ser efectuadas en esas regiones de rizo, que están contempladas por los inventores como las muy preferidas al producir proteínas cristalinas con actividad insecticida mejorada incluyen, pero sin limitación a ellas, la sustitución de uno o más aminoácidos por uno o más aminoácidos no encontrados normalmente en el sitio particular de sustitución de la proteína de tipo silvestre. En particular, las sustituciones de uno o más residuos arginina por un residuo alanina, leucina, metionina, glicina o ácido aspártico, han demostrado ser particularmente útiles en la producción de dichas proteínas incrementadas. De igual manera los inventores han demostrado que las sustituciones de uno o más residuos lisina contenidos dentro de, o inmediatamente adyacentes a las regiones de rizo, con un residuo alanina, producen proteínas mutantes que tienen propiedades insecticidas deseables, no encontradas en la proteína original, o de tipo silvestre. Los residuos arginina particularmente preferidos en la proteína CrylC incluyen: Arg86, Arg148, Arg 180, Arg 252 y Arg 253, mientras que un residuo lisina particularmente preferido en CrylC es Lys219. Las proteínas mutantes que habían sido desarrolladas por los inventores, que demuestran la eficiencia y la eficacia de esta estrategia de mutagénesis incluyen las cepas Cry1 C-R148L, Cry1C-R148M, Cry1C-R148D, Cry1C-R148A, Cry1 C-R148G y Cry1C-R180A, descritas con detalle en la presente. Se describe y reivindica aquí un método para preparar una proteína cristalina modificada, que comprende generalmente los pasos de identificar una proteína cristalina que tiene una o más regiones de rizo entre hélices alfa adyacentes; introducir una o más mutaciones en al menos una de las regiones de rizo o, alternativamente, en los residuos de aminoácido que flanquean inmediatamente las regiones de rizo; y obtener entonces las proteínas cristalizas modificadas así producidas. Las proteínas cristalinas modificadas, obtenidas mediante dicho método, también son aspectos importantes de esta invención.
Conforme a la invención, se pueden hacer las sustituciones de base en la secuencia de nucleótidos crylC a fin de cambiar aminoácidos particulares dentro de o cerca de las regiones de rizo predichas de CrylC, entre las hélices alfa del dominio 1. Luego se puede analizar las proteínas Cryl C* resultantes en cuanto a la actividad bioinsecticida, utilizando las técnicas aquí descritas para identificar las proteínas que tienen actividad de toxina mejorada. Como una modalidad ilustrativa, los cambios en tres de dichos aminoácidos dentro de la región de rizo entre las hélices alfa 3 y 4 del dominio 1 , produjeron proteínas cristalinas modificadas con actividad insecticida '?o incrementada (Cry1C.499, Cry1C.563, Cry1 C.579). Como una segunda modalidad ilustrativa, una sustitución de alanina por un residuo arginina, dentro de o adyacente a la región de rizo entre las hélices alfa 4 y 5, produjo una proteína cristalina modificada con actividad insecticida incrementada (Cry1C-R148A). Si bien esta sustitución elimina un 15 sitio de división con tripsina potencial, dentro del dominio 1 , la digestión con tripsina de esta proteína cristalina modificada no reveló diferencias en la estabilidad proteolítica con respecto a la proteína CrylC natural. Como una tercera modalidad ilustrativa, una sustitución de alanina por un residuo arginina, dentro de o adyacente a la región de rizo entre las 2 o hélices alfa 5 y 6, la sustitución R180A en Cryl C (Cryl C-R180A) también elimina un sitio de división potencial con tripsina en el dominio 1 , pero esta sustitución no tiene efecto sobre la actividad insecticida. Así pues, los pasos en el modo de acción de la proteína CrylC impactados por estas sustituciones de aminoácido, no han sido determinados ni es obvio qué sustituciones deben ser hechas para mejorar la actividad insecticida. Debido a que las estructuras de Cry3A y CrylAa muestran una conservación notable de la estructura terciaria de proteína (Grochulski y coautores, 1995) y debido a que muchas de las proteínas cristalinas muestran identidad significativa de la secuencia de aminoácidos con la secuencia de aminoácidos de CrylC, dentro del dominio 1 , incluyendo las proteínas de las clases Cryl , Cry2, Cry3, Cry4, Cry5, Cry7, Cryd, Cry9, Cry10, Cry11 , Cry12, Cry13, Cry14 y Cry16 (cuadro 1 ) ahora, a la luz del descubrimiento sorprendente de los inventores, por primera vez, quienes sean expertos en la materia y que tengan el beneficio de las enseñanzas aquí descritas podrán aplicar ampliamente los métodos de la invención para modificar un anfitrión de proteínas cristalinas con actividad mejorada o especificidad alterada. Dichos métodos no solamente estarán limitados a las proteínas cristalinas descritas en el cuadro 1 , sino que también pueden ser aplicados a otras proteínas cristalinas relacionadas, incluyendo aquellas que todavía no han sido identificadas, que comprendan una o más regiones de rizo entre uno o más pares de hélices alfa adyacentes. En particular, dichos métodos pueden ser aplicados ahora a la preparación de proteínas cristalinas modificadas que tienen una o más alteraciones en las regiones de rizo del dominio 1. Adicionalmente, los inventores contemplan que se puede identificar regiones de rizo similares en otros dominios de proteínas cristalinas, que pueden ser modificados de manera similar por medio de mutagénesis específica al sitio o aleatoria, para generar toxinas que tengan actividad mejorada o, alternativamente, especificidad a los insectos, alterada. En ciertas aplicaciones, la creación de toxinas alteradas que tienen actividad incrementada contra uno o más insectos es conveniente. Alternativamente, puede ser conveniente utilizar los métodos aquí descritos para crear e identificar proteínas cristalinas alteradas, que son activas contra un espectro más amplio de insectos susceptibles a ellas. Los inventores contemplan adicionalmente que la creación de proteínas cristalinas quiméricas, que comprenden una o más regiones de rizo como las descritas aquí, puede ser conveniente para preparar "super" toxinas que tengan las ventajas combinadas de actividad insecticida incrementada y especificidad amplia concomitante. A la luz de la presente descripción, la mutagénesis de codones que codifiquen aminoácidos dentro de, o adyacentes a las regiones de rizo entre las hélices alfa del dominio 1 de estas proteínas, también pueden dar por resultado la generación de proteínas insecticidas relacionadas, que tengan actividad mejorada. Como un ejemplo ilustrativo, la alineación de secuencias de aminoácido de Cryl , que cubren ia región de rizo entre las hélices alfa 4 y 5, revela que varias proteínas Cryl contienen un residuo arginina en la posición homologa a R148 de Cryl C. Puesto que el mutante Cryl C R148A exhibe toxicidad mejorada contra varias plagas de lepidópteros, los inventores de la presente contemplan que sustituciones similares en esas otras proteínas Cryl también producirán proteínas insecticidas mejoradas. Si bien se ha descrito mutaciones ejemplares para tres de las regiones de rizo, que dan por resultado proteínas cristalinas que tienen toxicidad mejorada, los inventores contemplan que puedan hacerse mutaciones en las otras regiones de rizo u otras porciones de la toxina activa, que den lugar a proteínas cristalinas bioinsecticidamente funcionales. Todas esas mutaciones se considera que quedan dentro del alcance de la descripción de la presente. En una modalidad ilustrativa, se obtiene genes crylC* sometidos a mutagénesis, que codifican variantes de Cryl C* que se basan en general en la secuencia de CrylC de tipo silvestre, pero que tienen uno o más cambios incorporados en, o adyacentes a, las regiones de rizo en el dominio 1. Un ejemplo particular es un gene cry1C-R148A mutado (SEQ ID NO: 1 ) que codifica un CrylC*, con una secuencia de aminoácidos de SEQ ID NO: 2, en la que la arginina en la posición 148 ha sido reemplazada por alanina. En la segunda modalidad ilustrativa, los genes crylC* sometidos a mutagénesis codificarán variantes de CrylC* que en general se basan en la secuencia de CrylC de tipo silvestre, pero que tienen ciertos cambios. Un ejemplo particular es un gene cry1C-R180A mutado (SEQ ID NO: 5) que codifica un CrylC* con una secuencia de aminoácidos de SEQ ID NO: 6, en la que la arginina en la posición 180 ha sido reemplazada por alanina. En una tercera modalidad ilustrativa, los genes crylC* sometidos a mutagénesis, codificarán variantes de CrylC* que en general se basan en la secuencia de CrylC de tipo silvestre, pero que tienen ciertos cambios. Un ejemplo particular es un gene cry1C563 (SEQ ID NO: 7) que codifica un CrylC con una secuencia de aminoácidos de SEQ ID NO: 8, en la que las mutaciones en los residuos de ácido nucleico 354, 361 , 369 y 370, dieron por resultado mutaciones puntuales A a T, A a C, A a C y G a A, respectivamente. Estas mutaciones modificaron la secuencia de aminoácidos en las posiciones 118 (Glu a Asp), 121 (Asn a His) y 124 (Ala a Thr). Usando la convención de nomenclatura descrita anteriormente, también se pudo describir apropiadamente una mutación descrita como un mutante Cry1 C-E118D-N121 H-A124T. En una cuarta modalidad ilustrativa, los genes crylC* sometidos a mutagénesis, codificarán variantes de Cryl C* que se basan en general en la secuencia de CrylC de tipo silvestre, pero que tienen ciertos cambios. Un ejemplo particular es un gene cry1C579 mutado (SEQ ID NO: 9) que codifica un CrylC* con una secuencia de aminoácidos SEQ ID NO: 10, en la que las mutaciones en los residuos de ácido nucleico 353, 369 y 371 dieron por resultado mutaciones puntuales A a T, A a T y C a G, respectivamente. Estas mutaciones modificaron la secuencia de aminoácidos en las posiciones 118 (Glu a Val) y 124 (Ala a Gly). Usando la convención de nomenclatura anteriormente descrita, dicha mutación podría describirse apropiadamente como un mutante Cry1C-E118V-A124G. En una quinta modalidad ilustrativa, los genes crylC* sometidos a mutagénesis, codificarán variantes de Cryl C*, que se basan en general en la secuencia de Cryl C de tipo silvestre, pero que tiene ciertos cambios. Un ejemplo particular es un gene cry1C499 mutado (SEQ ID NO: 11) que codifica un CrylC* con una secuencia de aminoácidos de SEQ ID NO: 12, en ia que las mutaciones en los residuos de ácido nucleico 360 y 361 dieron por resultado mutaciones puntuales T a C y A a C, respectivamente. Estas mutaciones modificaron la secuencia de aminoácidos en la posición 121 (Asn a His).
Usando la convención de nomenclatura anteriormente descrita, dicha mutación también podría describirse apropiadamente como un mutante Cry1C-N121 H. En una sexta modalidad ilustrativa, los genes crylC* sometidos a mutagénesis codificarán variantes de CrylC*, que están basados, en general, en la secuencia de CrylC de tipo silvestre, pero que tienen ciertos cambios. Un ejemplo particular es un gene cry1C-R148D mutado (SEQ ID NO: 3) que codifica un Cryl C* con una secuencia de aminoácidos de SEQ ID NO: 4, en la que Arg en la posición 148 ha sido reemplazada por Asp. Los genes mutados de la presente invención también son definibles mediante genes en los que por lo menos una o más de las posiciones de codón contenidas dentro de o adyacentes a una o más de las regiones de rizo entre dos o más hélices alfa, contienen uno o más codones sustituidos. Es decir, contienen uno o más codones que no están presentes en el gene de tipo silvestre, en el sitio o los sitios particulares de la mutagénesis, y que codifican una o más sustituciones de aminoácido. En otras modalidades, los genes mutados tendrán por lo menos alrededor de 10%, alrededor de 15%, alrededor de 20%, alrededor de 25%, alrededor de 30%, alrededor de 35%, alrededor de 40%, alrededor de 45% o incluso alrededor de 50% o más, de las posiciones de codón, dentro de una región de rizo entre dos hélices alfa, sustituidas con uno o más codones que no están presentes en la secuencia de gene del tipo silvestre, en el sitio particular de mutagénesis y/o de sustitución de aminoácido. Los genes crylC* mutados, en los que por lo menos alrededor del 50%, 60%, 70%, 80%, 90% o más de las posiciones de codón, contenidas dentro de una región de rizo entre dos hélices alfa, ha sido alterada, también están contemplados como útiles en la práctica de la presente invención. También está contemplado como dentro del alcance de la invención, los mutantes combinatorios que contienen dos o más regiones de rizo modificadas; o, alternativamente, que contienen dos o más mutaciones dentro de una sola región de rizo; o, alternativamente, dos o más regiones de rizo modificadas dentro de cada dominio que contiene dos o más modificaciones. Los genes crylC* en los que se han efectuado las modificaciones en una combinación de dos o más hélices, por ejemplo, las hélices alfa 1 y 2a, las hélices alfa 2b y 3, las hélices alfa 3 y 4, las hélices alfa 4 y 5, las hélices alfa 5 y 6, las hélices alfa 6 y 7 y/o modificaciones entre la hélice alfa 7 y el filamento beta 1 , también son aspectos importantes de la presente invención. Como ejemplo ilustrativo, una proteína cristalina mutada que los inventores designan Cry1 C-R148A.563, contiene una sustitución de arginina por alanina en la posición 148, así como la incorporación de las mutaciones presentes en Cryl C.563. Dicha proteína cristalina mutada, por lo tanto, tendría modificada tanto la región de rizo alfa 3/4 como la región de rizo alfa 4/5. Por claridad, se pretende que "región de rizo alfa 3/4" signifique la región de rizo situada entre las hélices alfa 3a y 4a, mientras que una "región de rizo alfa 4/5" se pretende que signifique una región entre las hélices alfa 4a y 5a, etc. Otras hélices, y sus regiones de rizo correspondientes, han sido identificadas similarmente en toda esta memoria descriptiva. La figura 1 ilustra gráficamente la colocación de regiones de rizo entre las hélices para CrylC. Los genes crylC mutados, preferidos, de la invención, son aquellos genes que contienen ciertos cambios claves. Los ejemplos son los genes que comprenden sustituciones de aminoácido de Arg a Ala o Asp (particularmente en los residuos de aminoácido 86, 148, 180, 252 y 253); o de Lys a Ala o Asp (en particular en el residuo de aminoácido 219). Los genes mutados de la manera descrita por la invención, también pueden estar enlazados operativamente a otras secuencias de ácido nucleico codificadoras de proteína. Esto generalmente dará por resultado la producción de una proteína de fusión, después de la expresión de dicha construcción de ácido nucleico. Están contempladas proteínas de fusión tanto N-terminal como C-terminal. Virtualmente cualquier secuencia de ADN que codifique proteína o que codifique péptido, o combinaciones de ellas, puede fundirse a una secuencia de crylC* mutada a fin de codificar una proteína de fusión. Esto incluye secuencias de ADN que codifican péptidos de destino, proteínas para expresión recombinante, proteínas a las que se fija uno o más péptidos de destino, subunidades proteínicas, dominios de una o más proteínas cristalinas, y similares. En un aspecto, la presente invención describe y reivindica células anfitrionas que comprenden una o más proteínas cristalinas modificadas descritas aquí y, en particular, células de las cepas novedosas de B.
Thuringiensis EG11811 , EG11815, EG11740, EG11746, EG11822, EG11831 , EG11832 y EG11747, que comprenden segmentos de ADN recombinante que codifican proteínas cristalinas Cryl C* modificadas sintéticamente, con actividad insecticida mejorada, demostrada, contra miembros del orden de los lepidópteros. De igual manera, la invención describe y reivindica también cultivos de células de ß. Thuringiensis EG11811 , EG11815, EG11740, EG11746, EG11822, EG11831 , EG11832 y EG11747. Dichos cultivos de células deben ser cultivos biológicamente puros, que consisten de una sola cepa o, alternativamente, pueden ser co-cultivos de células que consisten de una o más cepas. Dichos cultivos de células pueden ser cultivados bajo condiciones en las que se co-cultive simultáneamente una o más cepas adicionales de B. Thuringiensis u otras cepas bacterianas, con uno o más de los cultivos descritos o, alternativamente, uno o más de los cultivos de células de la presente invención puede ser combinado con una o más cepas adicionales de ß. Thuringiensis u otras cepas bacterianas, después del cultivo independiente de cada una. Dichos procedimientos pueden ser útiles cuando se desea suspensiones de células que contengan dos o más proteínas cristalinas diferentes. Los cultivos de la presente han sido depositados bajo condiciones que garanticen que estará disponible el acceso a los cultivos durante el tiempo de trámite de esta solicitud de patente, a quien determine el Comisionado de Patentes y Marcas, y que esté facultado para ello, conforme a 37 C. F. R., secciones 1.14 y conforme a 35 U. S. C. Sección 122. Los depósitos están disponibles cuando se requiera por las leyes de patentes de países extranjeros, en donde se presente solicitudes correspondientes a la presente solicitud o su progenie. Sin embargo, se debe entender que la disponibilidad de un depósito no constituye una licencia para poner en práctica la presente invención, en derogación de los derechos de patente concedidos por la acción gubernamental. Adicionalmente, los depósitos de cultivo de la presente estarán almacenados y se pondrán a disponibilidad pública de acuerdo con lo estipulado '?o por el Tratado de Budapest para el Depósito de Microorganismos, o sea, estarán almacenados con todo el cuidado necesario para mantenerlos viables y no contaminados durante un periodo de cuando menos cinco años después de la solicitud más reciente para el acabado de una muestra del depósito; y en todo caso, durante un periodo de cuando menos 30 (treinta) años después de la fecha de depósito, o durante la vida vigente de cualquier patente que pueda expedirse, que describa los cultivos. El depositante reconoce la obligación de reemplazar los depósitos en caso de que la depositaría no esté en capacidad de proporcionar una muestra cuando se le requiera, debido a la condición de los depósitos. Todas las restricciones acerca de la disponibilidad al público de los depósitos de cultivo de la presente, serán retiradas irrevocablemente cuando se otorgue una patente que los describa. Los cultivos de las cepas dadas en el cuadro 2 fueron depositadas en la colección permanente del Agricultural Research Service Culture Collection, Northern Regional Research Laboratory (NRRL), bajo los términos del Tratado de Budapest.
CUADRO 2 CEPAS DEPOSITADAS CONFORME A LOS TÉRMINOS DEL TRATADO DE BUDAPEST 2.2.- MÉTODOS PARA PRODUCIR COMPOSICIONES DE PROTEINA CRY1C* Las proteínas cristalinas Cryl* modificadas de la presente invención son preparables mediante un procedimiento que generalmente comprende los pasos de: (a) identificar una proteína cristalina Cryl que tiene una o más regiones de rizo entre dos hélices alfa adyacentes o entre una hélice alfa y un filamento beta; (b) introducir una o más mutaciones en al menos una de estas regiones de rizo, y (c) obtener la proteína cristalina Cryl* modificada así producida. Tal como se describió más atrás, estas regiones de rizo ocurren entre hélices alfa 1 y 2, hélices alfa 2 y 3, hélices alfa 3 y 4, hélices alfa 4 y 5, hélices alfa 5 y 6 y hélices alfa 6 y 7 del dominio 1 de la proteína cristalina, y entre la hélice 7 del dominio 1 y el filamento beta 1 del dominio 2. Las proteínas cristalinas preferidas que son preparables mediante este procedimiento reivindicado incluyen las proteínas cristalinas que tienen la secuencia de aminoácidos SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6; SEQ ID NO. 8; SEQ ID NO: 10; SEQ ID NO: 12; SEQ ID NO: 59, o SEQ ID No. 61 ; y muy preferible, las proteínas cristalinas que son codificadas mediante la secuencia de ácido nucleico de SEQ ID NO: 1 , SEQ ID NO: 3 SEQ ID NO: 5, SEQ ID NO: 7, SQ ID NO: 9, SEQ ID NO:11 , SEQ ID NO: 58 o SEQ ID NO: 60; o una secuencia de ácido nucleico que se híbrida a la secuencia de ácido nucleico de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO. 60, bajo condiciones de estrictez moderadas a altas.
Un segundo método para preparar una proteína cristalina Cryl* modificada es una modalidad adicional de la invención. Este método generalmente comprende identificar una proteína cristalina Cryl que tiene una o más regiones de rizo; introducir una o más mutaciones en una o más de las regiones de rizo y obtener la proteína cristalina modificada, resultante. Las proteínas cristalinas Cryl* preferidas, preparables por cualquiera de estos métodos, incluyen las proteínas cristalinas CrylA*, Cryl B*, CrylC*, Cryl D*, Cryl E*, Cryl F*, Cryl G*, Cryl H*, Cryl l*, CryU* y Cryl K* y, más preferible, las proteínas cristalinas CrylAa*, CrylAb*, CrylAc*, CrylAd*, CrylAe*, Cryl Ba*, Cryl Bb*, Cryl Bc*, Cryl Ca*", Cryl Cb*, Cryl Da*, Cryl Db*, Cryl Ea*, Cryl Eb*, Cryl Fa*, Cryl Fb*, Cryl Hb*, Cryl la*, Cryl lb*, CryUa*, y CryUb*. Las proteínas sumamente preferidas incluyen las proteínas cristalinas Cryl Ca*, tales como las que comprenden la secuencia de aminoácidos SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 O SEQ ID NO: 61 ; y las codificadas por una secuencia de ácido nucleico que tienen la secuencia de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60; o una secuencia de ácido nucleico que se híbrida a la secuencia de ácido nucleico de SEQ ID NO: 1 ; SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60, bajo condiciones de estrictez moderada. Las secuencias de aminoácido, de péptido y de proteína, dentro del alcance de la presente invención, incluyen pero sin limitación a ellas, las secuencias señaladas en SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 y SEQ ID NO: 61 , y alteraciones en las secuencias de aminoácido que incluyen alteraciones, omisiones, mutaciones y sus homólogos. Las composiciones que comprenden alrededor de 0.5% a 99% en peso de la proteína cristalina, o más preferible, alrededor de 5% a 75% o alrededor de 25% a alrededor de 50% en peso de la proteína cristalina están provistas en la presente. Dichas composiciones pueden ser preparadas fácilmente usando técnicas de producción de proteínas y purificación de las mismas, bien conocidas por los expertos, y los métodos aquí descritos. Dicho procedimiento para preparar proteína cristalina Cryl C* comprende en general los pasos de cultivar una célula anfitriona que expresa la proteína CrylC* (tal como una célula de B. Thuringiensis NRLL B-21590, NRRL B-21591 , NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609, NRRL B-21610 o NRRL B-21592) bajo condiciones efectivas para producir la proteína cristalina y luego obtener la proteína cristalina así producida. La proteína puede estar presente dentro de células intactas y, de tai manera, puede no ser necesarios los pasos subsecuentes de aislamiento o purificación de la proteína. Alternativamente, se puede romper, tratar sónicamente, someter a lisis, esforzar o tratar por plasmólisis las células, para liberar la(s) proteína(s) cristalina(s), de los desechos de células remanentes. En esos casos, puede ser conveniente aislar, concentrar o purificar adicionalmente los cristales resultantes que contienen las proteínas antes del uso, por ejemplo, como en la formulación de composiciones insecticidas. La composición, finalmente, puede ser purificada para consistir casi por completo de la proteína pura o, alternativamente, ser purificada o aislada en grado tal, que la composición comprende la(s) proteína(s) cristalina(s) en una cantidad de entre alrededor de 0.5% y alrededor de 99% en peso, o en una cantidad de entre alrededor de 5% y alrededor de 90% en peso, o en una cantidad de entre alrededor de 25% y alrededor de 75% en peso, etc. 2.3.- VECTORES RECOMBINANTES QUE EXPRESAN LOS GENES CRY1 SOMETIDOS A MUTAGÉNESIS Una modalidad importante de la presente invención es un vector recombinante que comprende un segmento de ácido nucleico que codifica una o más proteínas cristalinas de ß. Thuringiensis que tiene una secuencia modificada de aminoácido en una o más regiones de rizo del dominio 1 , o entre la hélice alfa 7 del dominio 1 y el filamento beta del dominio 2. Dicho vector puede ser transferido a y reproducido en un anfitrión procariótico o eucariótico, prefiriéndose particularmente las células bacterianas como anfitriones procarióticos y prefiriéndose particularmente las células vegetales como anfitriones eucarióticos. Las modificaciones en la secuencia de aminoácido pueden incluir una o más regiones de rizo modificadas, entre las hélices alfa 1 y 2, las hélices alfa 2 y 3, las hélices alfa 3 y 4, las hélices alfa 4 y 5, las hélices alfa 5 y 6 o las hélices alfa 6 y 7 del dominio 1 , o entre la hélice alfa 7 del dominio 1 y el filamento beta 1 del dominio 2. Los vectores recombinantes preferidos son aquellos que contienen uno o más segmentos de ácido nucleico que codifican las proteínas cristalinas modificadas CrylA, Cryl B, Cryl C, Cryl D, Cryl E, Cryl F, CrylG, Cryl H, Cryl l, CryU o Cryl K. Los vectores recombinantes particularmente preferidos son aquellos que contienen uno o más segmentos de ácido nucleico que codifican las proteínas cristalinas modificadas CrylAa, CrylAb, CrylAc, CiylAd, CrylAe, Cryl Ba, Cryl Bb, CiylBc, Cryl Ca, CrylCb, Cryl Da, Dryl Db, Cryl Ea, Cryl Eb, Cryl Fa, Cryl Fb, Cryl Hb, Cryl la, Cryl ib, CryUa o CryUb, siendo particularmente preferidas las proteínas cristalinas modificadas CrylCa. En las modalidades preferidas, el vector recombinante comprende un segmento de ácido nucleico que codifica la secuencia de aminoácido SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 O SEQ ID NO: 61. Los segmentos de ácido nucleico fuertemente preferidos son aquellos que tienen la secuencia de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60. Otra modalidad importante de la invención es una célula anfitriona transformada que expresa uno o más de estos vectores recombinantes, la célula anfitriona puede ser procariótica o eucariótica, y se prefiere en particular las células que expresen el/los segmento(s) de ácido nucleico que comprenden el vector recombinante que codifica una o más proteínas cristalinas de ß. Thuringiensis que comprenden secuencias de aminoácido modificadas en una o más regiones de rizo del dominio 1 o entre la hélice alfa 7 del dominio 1 y el filamento beta 1 del dominio 2. Las células bacterianas son particularmente preferidas como anfitriones procarióticos, y las células de plantas son particularmente preferidas como anfitriones eucarióticos. En una modalidad importante, la invención describe y reivindica una célula anfitriona en donde las secuencias de aminoácido modificadas comprenden una o más regiones de rizo entre las hélices alfa 1 y 2, las hélices alfa 2 y 3, las hélices alfa 3 y 4, las hélices alfa 4 y 5, las hélices alfa 5 y 6 o las hélices alfa 6 y 7 del dominio 1 , o entre la hélice alfa 7 del dominio 1 y el filamento beta 1 del dominio 2. La célula anfitriona particularmente preferida es una que comprende la secuencia de aminoácido SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 SEQ ID NO: 12 SEQ ID NO: 59 o SEQ ID NO: 61 , y más preferible, una que comprende la secuencia de ácido nucleico de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9 SEQ ID NO: 11 , SEQ ID NO: 58, o SEQ ID NO: 60. Las células anfitrionas bacterianas, transformadas con un segmento de ácido nucleico que codifica una proteína cristalina CrylC modificada, de acuerdo con la presente invención, están descritas y reivindicadas aquí y, en particular, una célula de Bacillus thuringiensis que tiene los números de acceso de NRRL: NRRL B-21590, NRRL B-21591 , NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609 o NRRL B-21610.
En otra modalidad, la invención comprende un método para usar un segmento de ácido nucleico de la presente invención, que codifica un gene crylC*. El método comprende en general los pasos de: (a) preparar un vector recombinante en el que el gene crylC* está colocado bajo el control de un promotor; (b) introducir el vector recombinante en una célula anfitriona; (c) cultivar la célula anfitriona bajo condiciones efectivas para permitir la expresión de la proteína cristalina CrylC*, codificada por dicho gene crylC*; y (d) obtener la proteína cristalina Cryl C* expresada, o péptido. Se dispone de una variedad grande de maneras de introducir un gene de B. Thuringiensis que exprese una toxina en el microorganismo anfitrión, bajo condiciones que permitan el mantenimiento estable y la expresión del gene. Se puede proveer construcciones de ADN que incluyen las señales reguladoras de transcripción y de translación para expresión del gene de toxina, del gene de toxina bajo su control regulador y una secuencia de ADN homologa con una secuencia en el organismo anfitrión; con lo que ocurrirá integración, y/o un sistema de reproducción que es funcional en el anfitrión, de manera que ocurran la integración y el mantenimiento estable. Las señales de inicio de transcripción incluirán: un promotor y un sitio de comienzo del inicio de transcripción. En algunos casos, puede ser conveniente proveer la expresión reguladora de la toxina, donde la expresión de la toxina ocurrirá únicamente después de su liberación en el ambiente. Se puede lograr esto con operadores o con una región que se una a un activador; o incrementadores, que sean capaces de inducción por un cambio en el ambiente físico o químico del microorganismo. Por ejemplo, se puede emplear una región reguladora sensible a la temperatura, donde los organismos pueden ser desarrollados en el laboratorio sin expresión de una toxina, pero por liberación al ambiente, comenzaría la expresión. Otras técnicas pueden emplear un medio nutriente específico en el laboratorio, que inhiba la expresión de la toxina, donde el medio nutriente en el ambiente permitiría la expresión de la toxina. Para el inicio de la translación, estarán presentes un sitio de unión ribosómico y un codón de inicio. Se puede emplear varias manipulaciones para incrementar la expresión del ARN mensajero, en particular mediante el uso de un promotor activo, así como por el empleo de secuencias que incrementen la estabilidad del ARN mensajero. La región de terminación de la transcripción y de la translación implicará uno o más codones de alto, una región terminadora y, opcionaimente, una señal de poliadenilación. Se puede emplear una secuencia "conductora" hidrófoba en el extremo amino de la secuencia de poiipéptido trasladada, a fin de promover la secreción de la proteína a través de la membrana interna. En la dirección de transcripción, o sea, en la dirección 5' a 3' de la codificación o de la secuencia de sentido normal, la construcción comprenderá la región reguladora de transcripción, si la hay, y el promotor, donde la región reguladora puede estar 5' o 3' con respecto al promotor; el sitio de unión ribosómica, el codón de inicio, el gene estructura que tiene un marco de lectura abierta en fase con el codón de inicio; el/los codón(es) de alto, la secuencia de señal de poliadenilación, si la hay, y la región terminadora. Esta secuencia, como un doble filamento, puede ser usada por sí misma para la transformación de un microorganismo anfitrión, pero habitualmente estará incluida con una secuencia de ADN que comprende un marcador, donde la segunda secuencia de ADN puede estar unida a la construcción de expresión de ia toxina, durante la introducción del ADN en el anfitrión. Mediante un marcador se quiere decir un gene estructural que provee la selección de aquellos anfitriones que han sido modificados o transformados. El marcador normalmente proveerá la ventaja selectiva, por ejemplo, al proveer resistencia a biocidas, por ejemplo, resistencia a antibióticos o metales pesados, complementación, a fin de proveer prototropía a un anfitrión auxotrófico, o similares. De preferencia se emplea la complementación de manera que el anfitrión modificado no solamente pueda ser seleccionado, sino que además pueda ser competitivo en el campo. Se puede emplear uno o más marcadores en el desarrollo de las construcciones, así como para modificar el anfitrión. Se puede modificar adicionalmente los organismos proveyendo una ventaja competitiva contra otros microorganismos de tipo silvestre en el campo. Por ejemplo, se puede introducir genes que expresen agentes quelatadores de metal, por ejemplo, sideróforos, en el anfitrión, junto con el gene estructural que expresa la toxina. De esa manera, la expresión incrementada de un sideróforo puede proveer una ventaja competitiva para el anfitrión productor de la toxina, de manera que pueda competir efectivamente con los microorganismos de tipo silvestre y ocupar de manera estable un nicho en el medio ambiente.
Cuando no está presente un sistema de reproducción funcional, la construcción también incluirá una secuencia de por lo menos 50 pares de bases (pb), de preferencia al menos alrededor de 100 pb, más preferible, por lo menos alrededor de 1 ,000 pb y, habitualmente, no más de alrededor de 2,000 pb de una secuencia homologa con una secuencia presente en el anfitrión. De esa manera, se incrementa la probabilidad de una recombinación legítima, de manera que el gene sea integrado en el anfitrión y sea mantenido de manera estable por el anfitrión. Convenientemente, el gene de toxina estará muy próximo ai gene que provee la complementación así como al gene que provee la ventaja competitiva. Por consiguiente, en caso de que se pierda un gene de toxina, el organismo resultante probablemente también perderá el gene complementador y/o el gene que provee la ventaja competitiva, de manera que no será capaz de competir en el medio ambiene con el gene que retenga la construcción intacta. Está disponible un número grande de regiones reguladoras de transcripción, a partir de una gran variedad de microorganismos anfitriones, como bacterias, bacteriófagos, cianobacterias, algas, hongos y similares. Diversas regiones reguladoras de transcripción incluyen las regiones asociadas con el gene trp, con el gene lac, con el gene gal, los promotores lambdaL y lambdaR y el promotor tac; los promotores que ocurren naturalmente, asociados con el gene de delta-endotoxina, cuando es funcional en el anfitrión. Véase, por ejemplo, las patentes US 4,332,898, US 4,342,832 y US 4,356,270. La región de terminación puede ser la región de terminación normalmente asociada con la región de inicio de transcripción o con una región de inicio de transcripción diferente, siempre y cuando las dos regiones sean compatibles y funcionales en el anfitrión. Cuando se desea un mantenimiento episómico o una integración estables, se empleará un plásmido que tiene un sistema de reproducción que es funcional en el anfitrión. El sistema de reproducción puede ser derivado del cromosoma, un elemento episómico normalmente presente en el anfitrión o en un anfitrión diferente, o un sistema de reproducción procedente de un virus que es estable en el anfitrión. Está disponible un número grande de plásmidos, como pBR322, pACYC184, RSF1010, pR01614 y similares. Véase, por ejemplo, Olson y coautores (1982), Bagdasarian y coautores (1981 ), Baum y coautores, 1990 y las patentes US 4,356,270, US 4,362,817, US 4,371 ,625 y US 5,441 ,884, cada una de las cuales queda incorporada específicamente aquí, mediante la referencia. Se puede introducir el gene de B. thurigiensis entre la región de inicio de transcripción y de translación, y la región de terminación de transcripción y de translación, de manera que esté bajo el control regulador de la región de inicio. Esta construcción estará incluida en un plásmido que incluirá por lo menos un sistema de reproducción, pero puede incluir más de uno, cuando se emplea un sistema de reproducción para clonar durante el desarrollo del plásmido, y el segundo sistema de reproducción es necesario para funcionar en el anfitrión final. Adicionalmente, puede estar presente uno o más marcadores, que han sido descritos previamente. Cuando se desea integración, convenientemente el plásmido incluye una secuencia homologa con la genoma del anfitrión. Se puede aislar los transformantes de acuerdo con maneras convencionales, habituaimente empleando una técnica de selección que permite la selección del organismo deseado, como contra organismos sin modificar u organismos de transferencia, cuando están presentes. Los transformantes pueden ser probados entonces en cuanto a su actividad plaguicida. Si se desea, se puede eliminar selectivamente las secuencias de ADN indeseables o dependientes, de la bacteria recombinante, empleando sistemas de recombinación específicos para el sitio, como los descritos en la patente estadounidense 5,441 ,884 (incorporada específicamente aquí mediante la referencia). 2.4.- SEGMENTOS DE ADN DE crylC* SINTÉTICOS Un gene cryl* de ß. Thuringiensis que codifica una proteína cristalina que tiene actividad insecticida contra insectos lepidópteros, que comprende una secuencia modificada de aminoácido, en una o más regiones de rizo del dominio 1 o en una región de rizo entre el dominio 1 y el dominio 2, representa un aspecto importante de la invención. De preferencia el gene cryl* codifica una secuencia de aminoácido en la que se ha modificado una o más regiones de rizo con el propósito de alterar la actividad insecticida de la proteína cristalina. Como se describió más atrás, dichos dominios de rizo incluyen aquellos que están entre las hélices alfa 1 y 2, las hélices alfa 2 y 3, las hélices alfa 3 y 4, las hélices alfa 4 y 5, las hélices alfa 5 y 6 o las hélices alfa 6 y 7 del dominio 1 , o entre la hélice alfa 7 del dominio y y el filamento beta 1 del dominio 2 (figura 1 ). Los genes cryl* preferidos de la presente invención incluyen: crylA*, crylB*, crylC*, cryW*, crylE*, crylF*, crylG*", crylH*, cryll*, cryU*, y CrylK*; siendo los genes más altamente preferidos: crylAa*, crylAb*, crylAc*, crylAd*, crylAe*, crylBa*, crylBb*, crylBc*, crylCa*, crylCb*, crylDa*, crylDb*, crylEa*, crylEb*, crylFa*, crylFb*, crylHb*, crylla*, cryllb*, cry1Ja* y cryUb*. Conforme a la presente invención, las secuencias de ácido nucleico incluyen, y no están limitadas a ellas: el ADN, incluyendo, pero sin limitación a ellos, el cADN y el ADN genómico; los genes, el ARN, incluyendo, pero sin limitación a ellos, el mARN y el tARN; las secuencias de sentido opuesto, las nucleosidas y las secuencias de ácido nucleico adecuadas, como ias señaladas en SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 y SEQ ID NO: 60; y alteraciones en las secuencias de ácido nucleico, incluyendo alteraciones, omisiones, mutaciones y homólogos capaces de expresar las toxinas modificadas de B. thuringiensis de la presente invención. En una modalidad ilustrativa, los inventores usaron los métodos descritos aquí para producir genes crylCa* modificados, que tenían actividad insecticida mejorada contra lepidópteros. En estos ejemplos ilustrativos, se modificó las regiones de rizo cambiando uno o más residuos arginina a residuos alanina o ácido aspártico, tales como las mutaciones en los residuos arginina Arg 148 y Arg180. De tal manera, la presente invención está relacionada también con segmentos de ADN que están libres de ADN genómico total, y que codifican las proteínas cristalinas novedosas, modificadas sintéticamente, descritas en la presente. Los segmentos de ADN que codifican estas especies de péptido pueden demostrar que codifican proteínas, polipéptidos, subunidades, dominios funcionales y similares, de productos de genes relacionados con la proteína cristalina, u otros no relacionados. Adicionaimente, se puede sintetizar totalmente estos segmentos de ADN in vitro, utilizando métodos que son bien conocidos por los expertos en la materia. Tal como se usa aquí, el término "segmento de ADN" se refiere a una molécula de ADN que ha sido aislada libre de ADN genómico total de una especie particular. Por consiguiente, un segmentos de ADN que codifica una proteína cristalina o un péptido, se refiere a un segmento de ADN que contiene secuencias codificadoras de proteína cristalina, pero que está aislado de, o purificado a partir de, el ADN genómico total de las especies de las que se obtiene el segmento de ADN, que en el presente caso, es la genoma del género bacteriano Gram-positivo, Bacillus y, en particular, las especies de Bacillus conocidas como Bacillus thuringiensis. Están incluidos dentro del término "segmento de ADN" los segmentos de ADN y los fragmentos menores de dichos segmentos, y también los vectores recombinantes, incluyendo, por ejemplo, plásmidos, cósmidos, fagémidos, fagos, virus y similares.
De manera similar, un segmento de ADN que comprende un gene codificador de proteína cristalina, aislado o purificado, se refiere a un segmento de ADN que puede incluir, además de las secuencias que codifican el péptido, ciertos otros elementos tales como secuencias reguladoras, aisladas sustancialmente de otros genes o secuencias codificadoras de proteína, que ocurren naturalmente. En este sentido, se usa el término "gene" por simplificación, para referirse a una unidad funcional codificadora de proteína, polipéptido o péptido. Como lo entenderán los expertos en la materia, este término funcional incluye secuencias genómicas, secuencias de operón y segmentos menores de gene estructurados por ingeniería, que expresan o que pueden estar adaptados para expresar, proteínas, polipéptidos o péptidos. "Aislado sustancialmente de otras secuencias codificadoras" significa que el gene de interés, en este caso un gene que codifica una proteína cristalina de bacteria, forma la parte significativa de la región codificadora del segmento de ADN, y que el segmento de ADN no contiene porciones grandes de ADN codificador que ocurre naturalmente, tales como fragmentos grandes de cromosomas u otros genes funcionales o regiones codificadoras de operón. Por supuesto, esto se refiere al segmento de ADN que se aisló originalmente, y no excluye genes, genes recombinantes, enlazadores sintéticos o regiones codificadoras añadidos posteriormente al segmento por la mano del hombre. Las secuencias de ADN particularmente preferidas son las que codifican proteínas cristalinas Cry1C-R148A, Cry1 C-R148D, Cry1C-R180A, Cry1C499, Cry1C563 o Cry1C579, y en particular, genes crylC* como las secuencias de ácido nucleico cry1C-R148A, cry1C-R148D, cry1C-R180A, cry1C499, cry1C563 y cry1C579. En las modalidades particulares, la invención se relaciona con segmentos de ADN aislados, y con vectores recombinantes que incorporan secuencias de ADN que codifican una especie de péptido Cry que incluye dentro de su secuencia de aminoácido una secuencia de aminoácido esencialmente como se expone en SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61. El término "una secuencia esencialmente como se expone en SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61 " significa que la secuencia corresponde sustancialmente a una porción de la secuencia de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61 , y tiene relativamente pocos aminoácidos que no sean idénticos a, o un equivalente biológicamente funcional de, los aminoácidos de cualquiera de esas secuencias. El término "equivalente biológicamente funcional" es bien entendido en la técnica y está definido adicionalmente con detalle en la presente (véase, por ejemplo, ias modalidades ilustrativas). Consecuentemente, las secuencias que tienen entre alrededor de 70% y alrededor de 80%, o más preferible, entre alrededor de 81 % y alrededor de 90%, o todavía más preferible, entre alrededor de 91% y alrededor de 99% de identidad de secuencia de aminoácido o equivalencia funcional con los aminoácidos SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61 , serán secuencias que son "esencialmente como se expone en SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61". También se entenderá que las secuencias de aminoácido y de ácido nucleico pueden incluir residuos adicionales, como los aminoácidos N- o C-terminales, adicionales, o secuencias 5' o 3', y sin embargo, ser todavía esencialmente como se expone en una de las secuencias descritas aquí, siempre y cuando la secuencia satisfaga los criterios señalados más arriba, incluyendo el mantenimiento de actividad biológica de proteína, donde está contemplada la expresión de la proteína. La adición de secuencias terminales se aplica particularmente a las secuencias de ácido nucleico que, por ejemplo, pueden incluir diversas secuencias no codificadoras que flanquean las porciones 5' o 3' de la región codificadora, o pueden incluir diversas secuencias internas, es decir, intrones, que se sabe que ocurren dentro de los genes. Los segmentos de ácido nucleico de la presente invención, independientemente de la longitud de la propia secuencia codificadora, pueden ser combinados con otras secuencias de ADN, tales como promotores, señales de poliadenilación, sitios de enzima de restricción adicionales, sitios de clonación múltiples, otros segmentos codificadores y similares, de tai manera que su longitud total puede variar considerablemente. Por consiguiente, se contempla que se puede emplear un fragmento de ácido nucleico, casi de cualquier longitud, estando limitada la longitud total, de preferencia, por la facilidad de preparación y por el uso del protocolo de ADN recombinante pretendido. Por ejemplo, se puede preparar fragmentos de ácido nucleico que incluyan un tramo corto contiguo que codifique la secuencia de péptido expuesta en SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61 o que sea idéntica a o complementaria a las secuencias de ADN que codifican el péptido descrito en SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61 y, en particular, los segmentos de ADN descritos en SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 Y SEQ ID NO: 60. Por ejemplo, las secuencias de ADN, como alrededor de 14 nucleótidos, que tienen una longitud hasta de alrededor de 10,000 pares de bases (pb), alrededor de 5,000 pb, alrededor de 3,000 pb, alrededor de 2,000 pb, alrededor de 1 ,000 pb, alrededor de 500 pb, alrededor de 200 pb, alrededor de 100 pb, alrededor de 50 pb y alrededor de 14 pb (incluyendo todas las longitudes intermedias) también están contempladas como útiles. Se entenderá fácilmente que las "longitudes intermedias" en estos contextos significan cualquier longitud entre las escalas citadas, tales como 14, 15, 16, 17, 18, 19, 20, etc.; 21 , 22, 23, etc., 30, 31 , 32, etc., 50, 51 , 52, 53, etc., 10, 101 , 102, 103, etc., 150, 151 , 152, 153, etc., incluyendo todos los enteros entre 200-500, 500-1 ,000, 1 ,000-2,000, 2,000-3,000, 3,000-5,000 y hasta e inclusive las secuencias de alrededor de 10,000 nucleótidos, y similares.
También se entenderá que esta invención no está limitada a las secuencias particulares de ácido nucleico, que codifican péptidos de la presente invención, o que codifican la secuencia de aminoácidos de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61 , incluyendo las secuencias de ADN que están descritas particularmente en SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58, o SEQ ID NO: 60. Los vectores recombinantes y los segmentos de ADN aislados puede incluir, por lo tanto, de manera diversa, las propias regiones codificadoras de péptido, regiones codificadoras que llevan alteraciones o modificaciones seleccionadas en la región codificadora básica, o pueden codificar péptidos mayores que, no obstante, incluyan regiones codificadoras de péptido o puedan codificar proteínas o péptidos equivalentes biológicamente funcionales, que tengan secuencias de aminoácidos variantes. Los segmentos de ADN de la presente invención comprenden péptidos equivalentes biológicamente funcionales. Dichas secuencias pueden aparecer como consecuencia de redundancia de codón y equivalencia funcional, que se sabe que ocurren naturalmente dentro de las secuencias de ácido nucleico y las proteínas así codificadas. Alternativamente, se puede crear proteínas o péptidos funcionalmente equivalentes mediante la aplicación de tecnología de ADN recombinante, en la que se puede diseñar por ingeniería los cambios en la estructura de la proteína, con base en consideraciones de las propiedades de los aminoácidos que están siendo cambiados. Los cambios diseñados por el hombre pueden ser introducidos mediante la aplicación de técnicas de mutagénesis dirigida al sitio, por ejemplo, para introducir mejoras en la antigenicidad de la proteína, o mutantes de prueba, a fin de examinar la actividad al nivel molecular. Si se desea, se puede preparar también proteínas y péptidos de fusión, por ejemplo, cuando las regiones codificadoras de péptido están alineadas dentro de la misma unidad de expresión, con otras proteínas o péptidos que tengan las funciones deseadas, por ejemplo, para propósitos de purificación o de inmunodetección (por ejemplo, proteínas que puedan ser purificadas mediante cromatografía por afinidad y regiones codificadoras de etiqueta de enzima, respectivamente). Los vectores recombinantes forman otros aspectos de la presente invención. Están contemplados como vectores particularmente útiles aquellos vectores en los que la porción codificadora del segmento de ADN, ya sea que codifique una proteína de longitud completa, o un péptido menor, está colocada bajo el control de un promotor. El promotor puede tener la forma del promotor que está asociado naturalmente con un gene que codifica los péptidos de la presente invención, o se puede obtener aislando las secuencias 5' no codificadoras, situadas corriente arriba del segmento codificador o exón, por ejemplo, usando clonación recombinante y/o tecnología PCR™, con relación a las composiciones descritas en la presente. 2.5.- VECTORES RECOMBINANTES Y EXPRESIÓN DE LA PROTEINA En otras modalidades, está contemplado que se alcanzarán ciertas ventajas colocando el segmento de ADN codificador bajo el control de un promotor recombinante o heterólogo. Tal como se usa aquí, se pretende que un promotor recombinante o heterólogo se refiera a un promotor que normalmente no está asociado con un segmento de ADN que codifica una proteína cristalina o un péptido en su ambiente natural. Dichos promotores pueden incluir promotores normalmente asociados con otros genes y/o promotores aislados de cualquier célula bacteriana, viral, eucariótica o vegetal. Naturalmente, será importante emplear un promotor que dirija efectivamente la expresión del segmento de ADN en el tipo de célula, organismo o incluso animal seleccionado para la expresión. El uso de combinaciones de promotor y tipo de célula para la expresión de la proteína generalmente es conocido por los expertos en la técnica de la biología molecular; por ejemplo, véase Sambrook y coautores, 1989. Los promotores empleados pueden ser constitutivos o inducibles y pueden ser usados bajo las condiciones apropiadas para dirigir la expresión a alto nivel del segmento de ADN introducido, como es ventajoso en la producción a gran escala de proteínas recombinantes o de péptidos. Los sistemas promotores apropiados, contemplados para uso en la expresión a alto nivel, incluyen, pero sin limitación a él, el sistema vector de expresión Pichia (Pharmacia LKB Biotechnology).
Con respecto a las modalidades de expresión para preparar proteínas recombinantes y péptidos recombinantes, está contemplado que se use con suma frecuencia segmentos mayores de ADN; siendo muy preferidos los segmentos de ADN que codifican toda la secuencia del péptido. Sin embargo, se apreciará que el uso de segmento de ADN más cortos, para dirigir la expresión de péptidos cristalinos o de regiones de núcleo epitópicas, tales como las que pueden ser usadas para generar anticuerpos de proteína anticristalina, también quedan dentro del alcance de la presente invención. Los segmentos de ADN que codifican los antígenos de péptido de alrededor de 8 a 50 aminoácidos de longitud o, más preferible, alrededor de 8 a 30 aminoácidos de longitud, o todavía más preferible, alrededor de 8 a 20 aminoácidos de longitud, están contemplados como particularmente útiles. Dichos epítopes de péptido pueden ser secuencias de aminoácido que comprenden secuencias de aminoácido contiguas de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61. 2.6.- MÉTODOS PARA PREPARAR SEGMENTOS DE GENE crvV SOMETIDOS A MUTAGÉNESIS La presente invención comprende tanto métodos de mutagénesis específicos para el sitio, como mutagénesis aleatoria, del segmento de ácido nucleico que codifica una de las proteínas cristalinas aquí descritas. En particular, están descritos métodos para la mutagénesis aleatoria de segmentos de ácido nucleico que codifican las secuencias de aminoácido identificadas por estar en, o inmediatamente adyacentes a, una región de rizo del dominio 1 de la proteína cristalina, o entre la última hélice alfa del dominio 1 y el primer filamento beta del dominio 2. La mutagénesis de este segmento de ácido nucleico da por resultado una o más modificaciones a una o más regiones de rizo de la proteína cristalina codificada. Usando los métodos de análisis descritos aquí, se puede identificar entonces los mutantes que surgen de este procedimiento, que tienen propiedades insecticidas mejoradas o especificidad alterada, ya sea dentro dei orden o entre los órdenes. En una modalidad preferida, el segmento de ácido nucleico contiguo, sometido a mutagénesis aleatoria, codifica una secuencia de aminoácido en una región de rizo del dominio 1 o una secuencia de aminoácido modificada en una región de rizo entre el dominio 1 y el dominio 2 de una proteína cristalina de B. thuringiensis que tiene actividad insecticida contra insectos lepidópteros. De preferencia, la secuencia de aminoácido modificada comprende una región de rizo entre las hélices alfa 1 y 2, las hélices alfa 2 y 3, las hélices alfa 3 y 4, las hélices alfa 4 y 5, las hélices alfa 5 y 6 o las hélices alfa 6 y 7 del dominio 1 , o entre la hélice alfa 7 del dominio 1 y el filamento beta del dominio 2. Las proteínas cristalinas preferidas incluyen: CrylA, Cryl B, CrylC, Cryl D, Cryl E, Cryl F, CrylG, Cryl H, Cryl l, CryU y Cryl K, siendo particularmente preferidas las proteínas cristalinas CrylAa, CrylAb, CrylAc, CrylAd, CrylAe, Cryl Ba, Cryl Bb, Cryl Bc, Cryl Ca, CrylCb, Cryl Da, Cryl Db, Cryl Ea, Cryl Eb, Cryl Fa, Cryl Fb, Cryl Hb, Cryl la, Cryl Ib, Cryl Ja y Cryl Jb.
En una modalidad ilustrativa, se sometió a mutagénesis un segmento de ácido nucleico (SEQ ID NO. 7) que codifica una proteína cristalina CrylCa, en una región que corresponde aproximadamente al residuo 118 de aminoácido hasta el residuo 124 de aminoácido de ia proteína CrylCa (SEQ ID NO: 8). La CrylCa* modificada que resulta de la mutagénesis se denominó Cry1C563. En una segunda modalidad ilustrativa, se sometió a mutagénesis un segmento de ácido nucleico (SEQ ID NO. 9) que codifica una proteína cristalina CrylCa, en una región que corresponde aproximadamente al residuo 118 de aminoácido hasta el residuo 124 de aminoácido de la proteína CrylCa (SEQ ID NO: 10). La Cryl Ca* modificada que resulta de la mutagénesis se denominó Cryl C.579. En una tercera modalidad ilustrativa, se sometió a mutagénesis un segmento de ácido nucleico (SEQ ID NO. 11 ) que codifica una proteína cristalina Cryl Ca, en una región que corresponde aproximadamente al residuo 118 de aminoácido hasta el residuo 124 de aminoácido de la proteína CrylCa (SEQ ID NO: 12). La Cryl Ca* modificada que resulta de la mutagénesis se denominó Cry1C.499. Los medios para someter a mutagénesis un segmento de ADN que codifica una proteína cristalina que tiene una o más regiones de rizo en su secuencia de aminoácido, son bien conocidos por los expertos en la materia.
Las modificaciones a dichas regiones de rizo pueden hacerse mediante procedimientos de mutagénesis aleatorios o específicos para el sitio. Se puede modificar la región de rizo alterando su estructura por medio de la adición o la omisión de uno o más nucleótidos de la secuencia que codifica la región de rizo correspondiente, sin modificar. Se puede efectuar la mutagénesis de acuerdo con cualquiera de las técnicas conocidas en el arte, tal como, y sin limitación a ella, sintetizar un oligonucleótido que tenga una o más mutaciones dentro de la secuencia de una proteína cristalina particular. Un "anfitrión adecuado" es cualquier anfitrión que exprese Cry, tal como, y sin limitación a ellos, Bacillus thuringiensis y Escherichia coli. La selección en cuanto a actividad insecticida, en el caso de CrylC incluye, y no está limitada a, la actividad tóxica para los lepidópteros, que se puede seleccionar mediante técnicas conocidas en el arte. En particular, la mutagénesis específica para un sitio, es una técnica útil en la preparación de péptidos individuales, o proteínas o péptidos equivalentes, biológicamente funcionales, por medio de mutagénesis específica del ADN subyacente. La técnica provee adicionalmente una capacidad lista para preparar y probar variantes de secuencia, por ejemplo, que incorporan una o más de las consideraciones anteriores, introduciendo uno o más cambios en la secuencia de nucleótido, en el ADN. La mutagénesis específica para el sitio permite la producción de mutantes mediante el uso de secuencias específicas de oligonucleótido que codifican la secuencia de ADN de la mutación deseada, así como un número suficiente de nucleótidos adyacentes, para proveer una secuencia sensibilizadora de tamaño y complejidad de secuencia suficientes para formar un dúplex estable a ambos lados de la junta de omisión que está siendo atravesada. Típicamente, se prefiere un sensibilizador de alrededor de 17 a alrededor de 75 nucleótidos o más de largo, alterándose alrededor de 10 a alrededor de 25 o más residuos a ambos lados de la junta de la secuencia. En general, la técnica de la mutagénesis específica para el sitio es bien conocida en el arte, como lo ejemplifican diversas publicaciones. Como se apreciará, la técnica emplea típicamente un vector fago que existe en la forma de un solo filamento o de doble filamento. Los vectores típicos, útiles en la mutagénesis dirigida al sitio, incluyen vectores como el fago M13. Estos fagos pueden ser obtenidos fácilmente en el comercio y su uso generalmente es bien conocido por los expertos en la materia. También se emplea rutinariamente plásmidos de doble filamento en la mutagénesis dirigida al sitio, lo que elimina el paso de transferir el gene de interés de un plásmido a un fago. En general, la mutagénesis dirigida al sitio, conforme a la presente, se efectúa obteniendo primeramente un vector de un solo filamento, o fundiendo aparte un vector de dos filamentos un vector de doble filamento, que incluye dentro de su secuencia una secuencia de ADN que codifica el péptido deseado. Se prepara un sensibilizador de oligonucleótido que lleva la secuencia mutada deseada, en general de manera sintética. Este sensibilizador es fijado con el vector de un solo filamento y se somete a enzimas polimerizadoras de ADN, tales como el fragmento Klenow de polimerasa 1 de E. coii, a fin de completar la síntesis del filamento que lleva la mutación. De tal manera, se forma un heterodúplex en el que un filamento codifica la secuencia original no mutada y el segundo filamento lleva la mutación deseada. Este vector heterodúplex es usado entonces para transformar o transfectar células apropiadas, tales como las células de E. coli, y se selecciona los clones que incluyen los vectores recombinantes que llevan la disposicióin de secuencia mutada. Se diseñó un esquema de selección genética por Kunkel y coautores (1987) para enriquecer los clones que incorporan el oligonucleótido mutagénico. Alternativamente, el uso de PCR™ con enzimas termoestables, obtenibles en el comercio, como la polimerasa Taq puede incorporar un sensibilizador de oligonucleótido mutagénico en un fragmento amplificado de ADN que puede ser clonado entonces a un vector de clonación o de expresión apropiado. Los procedimientos de mutagénesis mediados por PCR™, de Tomic y coautores (1990) y de Upender y coautores (1995), dan dos ejemplos de esos protocolos. Un PCR™ que emplea una ligasa termoestable, además de una polimerasa termoestable, también puede ser usado para incorporar un oligonucleótido mutágeno fosforilado en un fragmento amplificado de ADN que puede ser clonado entonces a un vector de clonación o de expresión apropiado. El procedimiento de mutagénesis descrito por Michael (1994) da un ejemplo de dicho protocolo. En una modalidad preferida de la invención, se puede usar la mutagénesis dirigida al oligonucleótido, para insertar u omitir residuos de aminoácido dentro de una región de rizo. Por ejemplo, este oligonucleótido mutágeno podría ser usado para omitir un residuo prolina (P120) dentro del rizo alfa 3-4 de la proteína CrylC de EG6346 o la cepa 7.29 de aizawai: 5'-GCATTTAAAGAATGGGAAGAAGATAATAATCCAGCAACCAGGACCAGAG- 3' (SEQ ID NO: 13) De igual manera, se puede usar el oligonucleótido mutágeno para añadir un residuo alanina entre los residuos de aminoácido N121 y N122, dentro del rizo alfa 3-4 de la proteína Cryl C de EG6346 o la cepa 7.29 de aizawai: 5'-GCATTAAAGAATGGGÁAGAAGATCCTAATGCAAATCCAGCAACCAGGACC AGAG-3' (SEQ ID NO: 14) La preparación de las variantes de secuencia de los segmentos de ADN codificadores de péptido, seleccionados, utilizando la mutagénesis dirigida al sitio, es provista como un medio para producir especies potencialmente útiles, y no significa que se limite a ello, ya que hay otras maneras en las que se puede obtener ias variantes de secuencia de los péptidos y las secuencias de ADN que las codifican. Por ejemplo, se puede tratar los vectores recombinantes que codifican la secuencia de péptido deseado con agentes mutágenos, tales como hidroxiiamina, para obtener las variantes de secuencia. Como se usa aquí, el término "procedimiento de mutagénesis dirigida al oligonucleótido" se refiere a procedimientos dependientes de plantilla y a propagación mediada por vector, que dan por resultado un incremento en la concentración de una molécula específica de ácido nucleico con respecto a su concentración inicial, o un aumento en la concentración de una señal detectable, tal como la amplificación. Como se usa aquí, el término "procedimiento de mutagénesis dirigida al oligonucleótido" está destinado a referirse a un procedimiento que implica la extensión de una molécula sensibilizadora, en dependencia de la plantilla. El término "procedimiento dependiente de la plantilla" se refiere a una síntesis de ácido nucleico de una molécula de ARN o ADN, donde la secuencia del filamento de ácido nucleico recién sintetizado está dictada por las reglas bien conocidas de la formación de pares de bases complementarios (véase, por ejemplo, Watson, 1987). Típicamente, las metodologías mediadas por vector implican la introducción del fragmento de ácido nucleico en un vector de ADN o de ARN, la amplificación clonal del vector y la recuperación del fragmento amplificado de ácido nucleico. Los ejemplos de dichas metodologías están provistos por la patente US 4,237,224, específicamente incorporada aquí mediante la referencia, en su totalidad. Están disponibles numerosos procedimientos dependientes de la plantilla, para amplificar las secuencias de destino, que interesan, presentes en una muestra. Uno de los métodos de amplificación mejor conocidos es la reacción de cadena de polimerasa (PCR™) que está descrita detalladamente en las patentes US 4,683,194, 4,683,202 y 4,800,159, cada una de las cuales queda incorporada aquí mediante la referencia, en su totalidad. Brevemente, en la PCR™ se prepara dos secuencias sensibilizadoras que son complementarias de regiones en filamentos complementarios, opuestos, de la secuencia de destino. Se añade un exceso de trifosfatos de desoxinucleosida a una mezcla de reacción, junto con una ADN-polimerasa (por ejemplo, Taq polimerasa). Si está presente la secuencia de destino en una muestra, los sensibilizadores se unirán al destino y la polimerasa provocará que los sensibilizadores se extiendan a lo largo de la secuencia de destino, añadiendo nucleótidos. Al elevar y disminuir la temperatura de la mezcla de reacción, se disociarán los sensibilizadores extendidos dei destino, para formar productos de reacción; el exceso de sensibilizadores se unirá al destino y a los productos de reacción y se repite el procedimiento. De preferencia se puede efectuar un procedimiento de amplificación de PCR™ con transcriptasa inversa, a fin de cuantificar la cantidad de mARN amplificado. Las metodologías de la reacción en cadena de polimerasa son bien conocidas en la técnica. Otro método para amplificación es la reacción en cadena de ligasa (denominada RCL), descrita en la publicación de solicitud de patente europea No. 320,308, incorporada aquí mediante la referencia en su totalidad. En la RCL se prepara dos pares de sonda complementarios, y en presencia de la secuencia de destino, se unirá cada par a filamentos complementarios opuestos del destino, de manera que se topen. En presencia de una ligasa, los dos pares de sonda se enlazarán para formar una sola unidad. Mediante cambios cíclicos de temperatura, como en PCR™, las unidades ligadas, unidas, se disocian del destino y sirven entonces como "secuencias de destino" para la ligación de los pares excesivos de sonda. La patente estadounidense 4,883,750, incorporada aquí mediante la referencia en su totalidad, describe un método alternativo de amplificación, similar a RCL, para unir pares de sonda a una secuencia de destino. También se puede usar Qbeta Replicasa, descrita en la publicación de solicitud de patente internacional del TCP No. PCT/US87/00880, incorporada aquí mediante la referencia en su totalidad, como otro método de amplificación en la presente invención. En este método, se añade una secuencia reproductora de ARN que tiene una región complementaria de la de un destino, a una muestra, en presencia de una ARN-polimerasa. La polimerasa copiará la secuencia de reproducción, la que puede ser detectada entonces. También puede ser útil un método de amplificación isotérmico, en el que se utiliza endonucleasas de restricción y ligasas, es utilizado para obtener la amplificación de moléculas de destino que contienen 5'-[alfa-tio]trifosfatos de nucleótido en un filamento de un sitio de restricción (Walker y coautores, 1992, incorporada aquí mediante la referencia, en su totalidad) en la amplificación de ácidos nucleicos, en la presente invención. La amplificación por desplazamiento de filamento (SDA, acrónimo por su designación en inglés: Strand Displacement Amplification) es otro método para efectuar la amplificación isotérmica de ácidos nucleicos, que implica rondas múltiples de desplazamiento y síntesis de filamento, o sea, translación interrumpida. Un método similar, denominado reacción en cadena de reparación (RCR) es otro método de amplificación que puede ser útil en la presente invención, y que comprende fijar varias sondas en toda una región destinada para amplificación, seguida por una reacción de reparación en la que únicamente dos de las cuatro bases están presentes. Las otras dos bases pueden ser añadidas como derivados biotinilados, para facilitar la detección. Un enfoque similar es utilizado en SDA. Se puede detectar también las secuencias utilizando una reacción de sonda cíclica (CPR, acrónimo por su designación en inglés: Cyclic Probé Reaction). En la CPR se híbrida una sonda que tiene secuencias 3' y 5' de ADN no específicas para Cryl C y secuencias intermedias de ARN específico para la proteína Cryl C, al ADN que está presente en una muestra. Por hibridación, se trata la reacción con RNasaH y se libera, después de digestión, los productos de la sonda identificados como productos distintos que generan una señal. Se fija la plantilla original a otra sonda sometida a ciclos, y se repite la reacción. De esa manera, la CPR implica amplificar una señal generada por hibridación de una sonda a un ácido nucleico expresado, específico para crylC. Se puede utilizar otros métodos adicionales de amplificación, descritos en la solicitud de patente de la Gran Bretaña No. 2,202,328 y en la publicación de la solicitud de patente internacional del TCP No.
PCT/US89/01025, cada una de las cuales queda incorporada aquí mediante la referencia, en su totalidad, conforme a la presente invención. En la primera solicitud, se utiliza sensibilizadores "modificados" en una síntesis dependiente de plantilla y enzima, similar a RCP. Los sensibilizadores pueden ser modificados marcando con una porción de captura (por ejemplo, biotina) y/o una porción detectora (por ejemplo, enzima). En esta última solicitud, se añade un exceso de sondas marcadas a una muestra. En presencia de la secuencia de destino, se une la sonda y se divide catalíticamente. Después de la división, se libera la secuencia de destino intacta para ser unida por el exceso de sonda. La división de la sonda marcada señala la presencia de la secuencia de destino. Otros procedimientos de amplificación de ácido nucleico incluyen sistemas de amplificación a base de transcripción (TAS) (Kwoh y coautores, 1989; publicación de solicitud de patente internacional del TCP No. WO 88/10315, incorporada aquí mediante la referencia en su totalidad), incluyendo la amplificación basada en la secuencia de ácido nucleico (NASBA, acrónimo por su designación en inglés: Nucleic Acid Sequence Based Amplification) y 3SR. En la NASBA se puede preparar los ácidos nucleicos para amplificación mediante extracción normal con fenol/cloroformo, desnaturalización con calor de una muestra, tratamiento con regulador de lisis y columnas de minicentrífuga para el aislamiento de ADN y ARN, o extracción del ARN con cloruro de guanidinio. Estas técnicas de amplificación comprenden la fijación de un sensibilizador que tiene secuencias específicas para la proteína cristalina. Después de la polimerización, se digiere los híbridos de ADN/ARN con RNasa H, mientras que se vuelve a desnaturalizar las moléculas de ADN de doble filamento. En cualquier caso, el ADN de un solo filamento se vuelve totalmente de doble filamento mediante la adición de un segundo sensibilizador específico para la proteína cristalina, seguido por polimerización. Luego se transcribe de manera múltiple las moléculas de ADN de doble filamento, mediante una polimerasa, tal como T7 y SP6. En una reacción cíclica isotérmica, se transcribe de manera inversa los ARN a ADN de doble filamento, y nuevamente se transcribe contra una polimerasa, tal como T7 o SP6. Los productos resultantes, ya sea truncados o completos, indican secuencias específicas para la proteína cristalina. La publicación de la solicitud de patente europea No. 329,822, incorporada aquí mediante la referencia en su totalidad, describe un proceso de amplificación de ácido nucleico que comprende sintetizar cíclicamente ARN de un solo filamento ("ssARN"), ssADN y ADN de doble filamento ("dsADN"), que pueden ser usados de acuerdo con la presente invención. El ssARN es una primera plantilla para el primer oligonucleótido sensibilizador, que se alarga mediante transcriptasa inversa (ADN-polimerasa dependiente del ARN). Luego se retira el ARN del dúplex ADN:ARN resultante, mediante la acción de ribonucleasa H (RNasa H, una RNasa específica para ARN en un dúplex, con ADN o con ARN). El ssADN resultante es una segunda plantilla para un segundo sensibilizador, que incluye también las secuencias de un promotor de ARN-polimerasa (ejemplificada por ARN-polimerasa T7), 5' con respecto a su homología con su plantilla. Este sensibilizador es extendido entonces mediante ADN-polimerasa (ejemplificada por el fragmento largo "Klenow" de ADN_polimerasa I de E. coli), lo que da por resultado una molécula de ADN de doble filamento ("dsADN"), que tiene una ecuencia idéntica a la del ARN original entre los sensibilizadores, y que tiene adicionalmente, en un extremo, una secuencia promotora. Esta secuencia promotora puede ser usada mediante ARN-polimerasa apropiada para constituir muchas copias en ARN del ADN. Esas copias pueden ser reintroducidas entonces en el ciclo, lo que lleva a una amplificación muy viva. Con selección apropiada de las enzimas, esta amplificación puede hacerse de manera isotérmica, sin añadir enzimas en cada ciclo. Debido a la naturaleza cíclica de este proceso, se puede seleccionar la secuencia de partida paa que esté en la forma de ADN o bien de ARN.
La publicación de la solicitud de patente internacional del TCP No. WO/89/06700, incorporada aquí mediante la referencia en su totalidad, describe un esquema de amplificación de secuencia de ácido nucleico que se basa en la hibridación de una secuencia promotora/sensibilizadora a un ADN de un solo filamento ("ssADN"), seguida por la transcripción de muchas copias en ARN de la secuencia. Este esquema no es cíclico, es decir, no se produce nuevas plantillas a partir de las transcripciones en ARN resultantes. Otros métodos de amplificación incluyen "RACE" (Frohman, 1990) y "RCP de un solo lado" (Ohara, 1989), que son bien conocidos por los expertos en la materia. Los métodos basados en la ligación de dos (o más) oligonucleótidos en presencia de ácido nucleico, que tienen la secuencia del "di-oligonucleótido" resultante, amplificando de esa manera el di-oligonucleótido (Wu y Dean, 1996, incorporado aquí mediante la referencia en su totalidad) también pueden ser usados en la amplificación de las secuencias de ADN de la presente invención. 2.7.-VARIANTES RESISTENTES A FAGOS Para preparar variantes resistentes a fagos de los mutantes de B. thuringiensis se esparce una alícuota del lisato de fago sobre agar nutriente y se deja secar. Luego se aplica directamente sobre el lisato seco, una alícuota de la cepa bacteriana sensible al fago y se deja secar. Se incuba las placas a 30°C.
Se incuba durante dos días las placas y, en ese tiempo, se puede ver que crecen sobre el agar numerosas colonias. Algunas de esas colonias son recogidas y subcultivadas sobre placas de agar nutriente. Se prueba estos cultivos resistentes aparentes en cuanto a su resistencia al rayado cruzado con el lisato de fago. Se raya una línea de lisato de fago sobre la placa y se deja secar Luego se raya cultivos presuntamente resistentes, a través de la línea de fago. Los cultivos bacterianos resistentes no muestran lisis en ningún punto de la raya a través de la línea de fago después de incubar durante la noche a 30°C. Se reconfirma entonces la resistencia al fago extendiendo un tendido de cultivo resistente sobre una placa de gar nutriente. También se extiende la cepa sensible de la misma manera para que sirva como control positivo. Después de secar, se aplica una gota de lisato de fago al centro de la placa y se deja secar. Los cultivos resistentes no muestran lisis en el área en donde se ha colocado el lisato de fago, después de incubar durante 24 horas a 30°C. 2.8.- ANFITRIONES TRANSGENICOS/CELULAS TRANSFORMADAS QUE COMPRENDEN SEGMENTOS DE ADN DE CrvIC* La invención describe y reivindica también células anfitrionas, tanto naturales como formadas por ingeniería genética, que expresan los genes novedosos CrylC* para producir polipéptidos CrylC*. Los ejemplos preferidos de células anfitrionas bacterianas incluyen Bacillus thuringiensis NRRL B-21590, NRRL B-21591 , NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609 Y NRRL B-21610.
También están descritos los métodos de uso de dichas células para producir proteínas cristalinas CrylC*. Dichos métodos generalmente implican cultivar la célula anfitriona (tal como Bacillus thuringiensis NRRL B-21590, NRRL B-21591, NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609 O NRRL B-21610), bajo condiciones efecivas para producir una proteína cristalina Cryl C* y obtener la proteína cristalina CrylC* a partir de dicha célula. En otro aspecto más, la presente invención provee métodos para producir una planta transgénica que exprese un segmento de ácido nucleico que codifica las proteínas cristalinas recombinantes de la presente invención. El proceso de producir plantas transgénicas es bien conocido en la técnica. En general, el método comprende transformar una célula anfitriona adecuada con uno o más segmentos de ADN que contienen uno o más promotores enlazados operativamente a una región codificadora que codifica una o más de las proteínas cristalinas de Bacillus thuringiensis Cry1C-R148A, Cry1 C-R148G, Cry1C-R148M, Cry1C-R148L, Cry1C-R180A, Cry1C-R148D, Cry1C-R148D, Cry1C499, Cry1C563 y Cryl C.579. Dicha región codificadora está enlazada en general operativamente con una región terminadora de transcripción, con lo que el promotor es capaz de producir la transcripción de la región codificadora en la célula y, por consiguiente, proveer en la célula la capacidad de producir in vivo la proteína recombinante. Alternativamente, en casos en los que es conveniente controlar, regular o disminuir la cantidad de una proteína cristalina recombinante particular, en una célula transgénica particular, la invención provee también la expresión del mARN de sentido opuesto, de la proteína cristalina. El uso del mARN de sentido opuesto como medio para controlar o disminuir la cantidad de proteína de interés dada, en una célula, es bien conocido en este campo. Otro aspecto de la invención comprende una planta transgénica que expresa un gene o un segmento de gene que codifica una o más composiciones novedosas de polipéptido aquí descritas. Tal como se usa aquí, el término "planta transgénica" está destinado a referirse a una planta que tiene incorporadas secuencias de ADN, que incluyen, pero sin limitación a ellos, genes que quizás no estén presentes normalmente, secuencias de ADN que normalmente no son transcritas a ARN ni trasladadas a una proteína ("expresadas") ni ningún otro gene o secuencia de ADN que se desee introducir en la planta no transformada; tales como los genes que normalmente están presentes en la planta no transformada, pero que se desea manipular genéticamente, o hacer que tengan expresión alterada. Está contemplado que, en algunos casos, la genoma de una planta transgénica de la presente invención tendrá que se aumentada por medio de la introducción estable de uno o más transgenes codificadores de Cry1C-R148A, Cry1 C-R148D, Cry1 C-R148G, Cry1-C-R148M, Cry1-C-R148L, Cry1C-R180A, Cry1C499, CrylC.563 o Cry1C579, ya sean naturales, modificados sintéticamente o mutados. En algunos casos, se incorporará más de un transgene en la genoma de la célula de planta anfitriona, transformada. Tal es el caso cuando se incorpora más de un segmento de ADN codificador de proteína cristalina en la genoma de dicha planta. En determinadas situaciones, puede ser conveniente tener una, dos, tres, cuatro o incluso más proteínas cristalinas de B. thuringiensis (ya sea naturales o manipuladas recombinantemente por ingeniería) incorporadas y expresadas de manera estable en la planta transgénica transformada). Un gene preferido que puede ser introducido incluye, por ejemplo, una secuencia de ADN que codifica una proteína cristalina, de origen bacteriano y, particularmente, una o más de las descritas aquí, que son obtenidas de Bacillus spp. Las secuencias de ácido nucleico sumamente preferidas son las que son obtenidas de B. thuringiensis o cualquiera de aquellas secuencias que han sido tratadas genéticamente por ingeniería para disminuir o incrementar la actividad insecticida de la proteína cristalina en dicha célula anfitriona transformada. Los medios para transformar una célula vegetal y la preparación de una línea de células transgénica, son bien conocidos en la técnica y están discutidos en la presente. Los vectores, plásmidos, cósmidos, YACs (acrónimo por ei término en inglés Yeast Artificial Chromosomes = cromosomas artificiales de levadura) y segmentos de ADN para uso en la transformación de dichas células, por supuesto generalmente comprenderán operones, genes o secuencias derivadas de gene de la presente invención, ya sea naturales o derivadas sintéticamente y, en particular, las que codifican las proteínas cristalinas descritas. Estas construcciones de ADN pueden incluir adicionalmente estructuras tales como: promotores, incrementadores, polienlazadores o incluso secuencias de genes que tengan actividad reguladora positiva o negativa, sobre los genes particulares de interés que se desea. El segmento de ADN o el gene pueden codificar una proteína cristalina natural o modificada, que será expresada en las células recombinantes resultantes y/o que impartirán un fenotipo mejorado a la planta regenerada. Dichas plantas transgénicas pueden ser convenientes para disminuir la resistencia insecticida de una planta monocotiledónea o dicotiledónea, incorporando en dicha planta un segmento de ADN transgénico que codifica una proteína cristalina CrylC-R148A, Cry1 C-R148D, Cry1C,R148G, Cry1C-R148L, Cry1 C-R148M, Cry1 C-R180A, Cry1 C.499, Cry1C563 y/o CrylC.579, que es tóxica para los insectos lepidópteros. Las plantas particularmente preferidas incluyen los cereales, como maíz, trigo, cebada y avena; leguminosas, como soya, algodón; pastos de ornato y de pastura, plantas ornamentales, arbustos, árboles, legumbres, bayas, frutos y otros cultivos comerciaimente importantes, incluyendo plantas de jardín y plantas domésticas. En un aspecto relacionado, la presente invención comprende también una semilla producida por la planta transformada, una progenie de dicha semilla y una semilla producida por la progenie de la planta transgénica original, producida de acuerdo con el procedimiento anterior. Dicha progenie y dichas semillas tendrán uno o más transgenes de proteína cristalina, incorporados de manera estable en su genoma, y dichas plantas de progenie heredarán los tramos aportados por la introducción de un transgene estable en forma mendeliana. Todas esas plantas transgénicas que tienen incorporadas en su genoma segmentos de ADN transgénicos que codifican una o más de las proteínas cristalinas o polipéptidos Cry1 C-R148A, Cry1C-R148D, Cry1C-R148G, Cry1 C-R148M, Cry1C-R184L, Cry1 C-R180A, Cry1C499, Cry1C563 o Cry1C579, son aspectos de esta invención. Los transgenes particularmente preferidos para la práctica de la invención incluyen segmentos de ácido nucleico que comprenden uno o más de los genes cry1C-R148A, cry1C-R148D, crylC-R148G, cry1C-R148M, cry1C-r148L, cry1C-R180A, cry1C499, cry1C563 o cry 1C.579. 2.9.- COMPOSICIONES DE PROTEINA CRISTALINA COMO INSECTICIDAS Y MÉTODOS PARA SU USO Los inventores contemplan que las composiciones de proteína cristalina descritas en la presente tengan utilidad particular como insecticidas para aplicación tópica y/o sistémica a cultivos agrícolas, pastos, frutas y legumbres y plantas ornamentales. Se describe y reivindica una composición que comprende una cantidad insecticidamente efectiva de una composición de proteína cristalina CrylC*. La composición comprende de preferencia la secuencia de aminoácido de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID No. 10, SEQ ID NO: 12, SEQ ID NO: 59 O SEA ID NO: 61 , o sus equivalentes biológicamente funcionales. La composición insecticida también puede comprender una proteína cristalina CrylC* que es codificada por una secuencia de ácido nucleico que tiene la secuencia de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60; o, alternativamente, una secuencia de ácido nucleico que se híbrida a la secuencia de ácido nucleico de SEQ ID NO. 1 ; SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60, bajo condiciones de estrictez moderada. El insecticida comprende una célula de Bacillus thuringiensis NRRL B-21590, NRRL B-21591 , NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609 o NRRL B-21610, o un cultivo de esas células, o una mezcla de una o más células de ß. thuringiensis que expresa una o más de las proteínas cristalinas novedosas de la invención. En ciertos aspectos, puede ser conveniente preparar composiciones que contengan una pluralidad de proteínas cristalinas, ya sea naturales o modificadas, para el tratamiento de uno o más tipos de insectos susceptibles. Los inventores contemplan que cualesquiera métodos de formulación, conocidos por los expertos en la materia, pueden ser empleados utilizando las proteínas descritas aquí para preparar dichas composiciones bioinsecticidas. Puede ser conveniente formular preparaciones de células enteras, extractos de células, suspensiones de células, homogeneizatos de célula, lisatos de célula, sobrenadantes de célula, filtrados de célula o pellas de células, de un cultivo de células (de preferencia un cultivo de células bacterianas, como un cultivo de Bacillus thuringiensis NRRL B-21590, NRRL B-21591 , NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609 O NRRL B-21610) que exprese uno o más segmentos de ADN de crylC* para producir la(s) proteína(s) el/los péptido(s) Cryl C* codificados. Los métodos para preparar dichas formulaciones son conocidos por los expertos en la materia y pueden incluir, por ejemplo, desecación, liofilización, homogeneización, extracción, filtración, centrifugación, sedimentación o concentración de uno o más cultivos de células bacterianas, como células de Bacillus NRRL B-21590, NRRL B-21591 , NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B-21640 NRRL B-21609, o NRRL B-21610, que expresan el/los péptido(s) Cryl C*"de interés. En una modalidad preferida, la composición bioinsecticida comprende una suspensión que puede fluir en aceite, que comprende células bacterianas sometidas o no a iisis, esporas o cristales sometidas o no a lisis, que contienen una o más de las proteínas cristalinas novedosas aquí descritas. De preferencia las células son células de B. thuringiensis; sin embargo, cualquiera de dichas células anfitrionas bacterianas, que expresen segmentos de ácido nucleico novedosos, descritos en la presente y que produzcan una proteína cristalina, están contempladas como útiles, tales como Bacillus spp, que incluyen: ß. megateríum, B, subtilis, B. cereus, Escherichia spp., incluyendo: E. coli, y/o Pseudomonas spp., incluyendo P. cepacia, P. aeruginosa y P. fluorescens. Alternativamente, la suspensión que puede fluir en aceite puede consistir de una combinación de una o más de las siguientes composiciones: células bacterianas, esporas, cristales y/o proteínas cristalinas purificadas, sometidas o no a lisis.
En una segunda modalidad preferida, ia composición bioinsecticida comprende un granulo o polvo dispersable en agua. Ese granulo o polvo puede constar de células, esporas o cristales bacterianos, sometidos o no a lisis, que contienen una o más de las proteínas cristalinas novedosas aquí descritas. Las fuentes preferidas para esas composiciones incluyen células bacterianas, como células de B. thuringiensis; sin embargo, también están contempladas como útiles las bacterias de los géneros Bacillus, Escherichia y Pseudomonas, que han sido transformadas con un segmento de ADN descrito aquí, y que expresan ia proteína cristalina. Alternativamente, el granulo o polvo puede consistir de una combinación de una o más de las siguientes composiciones: células bacterianas sometidas o no a lisis; esporas, cristales y/o proteínas cristalinas purificadas. En una tercera modalidad importante, la composición bioinsecticida comprende un polvo humectable, aspersión, emulsión, coloide, solución acuosa u orgánica, polvo fino, pella o concentrado coloidal. Dicha composición puede contener células bacterianas sometidas o no a lisis, esporas, cristales o extractos de células, como se describió más arriba, que contienen una o más proteínas cristalinas novedosas aquí descritas. Las células bacterianas preferidas son células de B. thuringiensis; sin embargo, también están contempladas como útiles células de bacterias tales como B. megaterium,, B. subtilis, B. cereus, E. coli o Pseudomonas spp, transformadas con un segmento de ADN descrito aquí y que expresa la proteína cristalina. Dichas formas secas de las composiciones insecticidas pueden ser formuladas para disolverse inmediatamente cuando se humectan o, alternativamente, disolverse en una forma de liberación controlada, de liberación sostenida o dependiente de otra manera del tiempo.
Alternativamente, dicha composición puede consistir de una combinación de una o más de las siguientes composiciones: células bacterianas sometidas o no a lisis, esporas, cristales y/o proteínas cristalinas purificadas. En una cuarta modalidad importante, la composición bioinsecticida comprende una solución acuosa o suspensión acuosa o cultivo celular de células bacterianas sometidas o no a lisis, esporas, cristales o una mezcla de células bacterianas sometidas o no a lisis, esporas y/o cristales, tales como las descritas anteriormente, que contienen una o más de las proteínas cristalinas novedosas aquí descritas. Dichas soluciones acuosas o suspensiones acuosas pueden ser provistas como una solución concentrada de almacén, o solución maestra, que se diluye antes de la aplicación o, alternativamente, como una solución diluida, lista para aplicarla. Para esos , métodos que implican la aplicación de células bacterianas, el anfitrión celular que contiene el/los gene(s) de proteína cristalina, puede ser desarrollado en cualquier medio nutriente conveniente, donde la construcción de ADN provee una ventaja selectiva, que provee un medio selectivo de manera que sustancialmente la totalidad, o bien todas las células retengan el gene de ß. thuringiensis. Estas células pueden ser cosechadas entonces de acuerdo con formas convencionales. Alternativamente, se puede tratar las células antes de cosechar.
Cuando las composiciones insecticidas comprenden células, esporas y/o cristales de B. thuringiensis que contienen la(s) proteína(s9 cristalina(s) modificada(s) de interés, dichas composiciones pueden ser formuladas en una variedad de maneras. Pueden ser empleadas como polvos humectables, granulos o polvos finos, mezclando con diversos materiales inertes, como minerales inorgánicos (filosilicatos, carbonatos, sulfatos, fosfatos y similares), materiales botánicos (olotes pulverizados, cascaras de arroz, cascaras de nuez y similares). Las formulaciones pueden incluir adyuvantes esparcidores-espesadores, agentes estabilizadores, otros aditivos plaguicidas o agentes tensioactivos. Las formulaciones líquidas pueden ser de base acuosa o de base no acuosa, y pueden ser empleadas como espumas, suspensiones, concentrados emulsificables o similares. Los ingredientes pueden incluir agentes reoiógicos, agentes tensioactivos, emulsificantes, dispersantes o polímeros. Alternativamente, se puede preparar las proteínas cristalinas mutadas, derivadas de CrylC, mediante sistemas de expresión bacteriana naturales o recombinantes, in vitro, y aislados para aplicación de campo subsecuente. Dicha proteína puede estar en lisatos de célula cruda, suspensiones, coloides, etc., o, alternativamente, se puede purificar, retinar, regular y/o procesar adicionalmente, antes de formularla en una formulación biocida activa. De igual manera, bajo ciertas circunstancias, puede ser conveniente aislar cristales y/o esporas de los cultivos bacterianos que expresan la proteína cristalina y aplicar soluciones, suspensiones o preparaciones coloidales de dichos cristales y/o esporas, como la composición bioinsecticida activa. Otro aspecto importante de la invención es un método para controlar insectos lepidópteros que son susceptibles a las composiciones novedosas descritas aquí. Dicho método comprende generalmente poner en contacto el insecto o la población de insectos, la colonia, etc., con una cantidad insecticidamente efectiva de una composición de proteína cristalina CrylC*. El método puede utilizar proteínas cristalinas CrylC*, tales como las descritas en SEQ ID NO: 2 SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61 ; o sus equivalentes biológicamente funcionales. Alternativamente, el método puede utilizar una o más de las proteínas cristalinas CrylC* que son codificadas por las secuencias de ácido nucleico de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60, o por una o más secuencias de ácido nucleico que se hibridan a las secuencias de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60, bajo condiciones de estrictez moderada o mayor. Los métodos para identificar secuencias que se hibridan a las descritas, bajo condiciones moderadamente estrictas o muy estrictas, son bien conocidas por los expertos en la materia y están discutidas aquí. Independientemente del método de aplicación, se aplica la cantidad del componente o los componentes activos en una cantidad insecticidamente efectiva que variará dependiendo de factores tales como, por ejemplo, los insectos lepidópteros específicos que pueden ser controlados, la planta o cultivo específico que se va a tratar, las condiciones ambientales y el método, el régimen y la cantidad de aplicación de la composición insecticidamente activa. Las composiciones insecticidas descritas pueden ser preparadas formulando ya sea la célula bacteriana, el cristal y/o la suspensión de esporas, o el componente proteínico aislado con el portador deseado, agrícolamente aceptable. Se puede formular las composiciones antes de la administración en un medio apropiado, tal como en un portador liofilizado, secado por congelación, desecado o en un medio acuoso o en un diluyente adecuado, como una solución salina u otro regulador. Las composiciones formuladas pueden estar en la forma de un material en polvo fino o granulado, o como una suspensión en aceite (vegetal o mineral), o como emulsiones en agua o de aceite/agua, o como un polvo humectable, o una combinación con cualquier otro material portador adecuado para aplicación agrícola. Los portadores agrícolas adecuados pueden ser sólidos o líquidos y son bien conocidos en la técnica. El término "portador agrícolamente aceptable" cubre todos los adyuvantes, por ejemplo, los componentes inertes, los dispersantes, los agentes tensioactivos, los espesadores, los aglutinantes, etc., que son usados ordinariamente en la tecnología de formulación de insecticidas; éstos son bien conocidos por los expertos en la formulación de insecticidas. Se puede mezclar las formulaciones con uno o más adyuvantes sólidos o líquidos y se los puede preparar mediante diversos expedientes, por ejemplo, mediante mezclado homogéneo, combinación y/o molienda de la composición insecticida con adyuvantes adecuados, usando técnicas de formulación convencionales. Las composiciones insecticidas de la presente invención son aplicadas al medio ambiente del insecto lepidóptero al que se destinan, típicamente sobre el follaje de la planta o cultivo que se va a proteger, mediante métodos convencionales, de preferencia por aspersión. La concentración y ia duración de la aplicación insecticida se fijarán con respecto a condiciones específicas para la(s) plaga(s) particular(es), la cosecha o cosechas a tratar y las condiciones ambientales particulares. La razón proporcional de ingrediente activo a portador, naturalmente, dependerá de la naturaleza de la sustancia química, de la solubilidad y de la estabilidad de la composición insecticida, así como de la formulación particular contemplada. Otras técnicas de aplicación, por ejemplo, espolvoreo, rociado, remojo, inyección en la tierra, revestimiento de semillas, revestimiento de sementeras, aspersión, aireación, nebulización, atomización y similares, también son factibles y pueden ser necesarias bajo determinadas circunstancias, por ejemplo, con los insectos que provocan infestación en la raíz o el tallo, o para aplicaciones a vegetación delicada o a plantas ornamentales. Estos procedimientos de aplicación también son bien conocidos por los expertos en la materia. La composición insecticida de la invención puede ser usada en el método de la invención individualmente o en combinación con otros compuestos, incluyendo, sin limitación, a otros plaguicidas. El método de la invención puede ser usado también conjuntamente con otros tratamientos, tales como agentes tensioactivos, detergentes, polímeros o formulaciones de liberación controlada en tiempo. Las composiciones insecticidas de la presente invención pueden ser formuladas ya sea para uso sistémico o tópico. La concentración de la composición insecticida que se utiliza para aplicación ambiental, sistémica o foliar, variará ampliamente dependiendo de la naturaleza de la formulación particular, del medio de aplicación, de las condiciones ambientales y del grado de actividad biocida. Típicamente, la composición bioinsecticida estará presente en la formulación aplicada a una concentración de por lo menos alrededor de 1 % en peso y puede estar hasta e inclusive 99% en peso. Las formulaciones secas de las composiciones pueden ser de alrededor de 1% a 99% o más en peso de la composición, mientras que las formulaciones líquidas generalmente comprenderán alrededor de 1 % a 99% o más del ingrediente activo, en peso. Las formulaciones que comprenden células bacterianas intactas generalmente contendrán alrededor de 104 a alrededor de 1012 células/mg. Se puede administrar la formulación insecticida a una planta particular o a un área de blanco en una o más aplicaciones, según se necesite, con un régimen de aplicación en campo, típico, por hectárea, que va del orden de alrededor de 1 g a alrededor de 1 kg, 2 kg, 5 kg o más de ingrediente activo. 2.10.- EQUIVALENTES FUNCIONALES BIOLÓGICOS Se puede hacer cambios y modificaciones en la estructura de los péptidos de la presente invención y en los segmentos de ADN que los codifican, y obtener todavía una molécula funcional que codifica una proteína o un péptido con las características deseables. La siguiente es una discusión que se basa en el cambio de los aminoácidos de una proteína para crear un equivalente, o incluso una molécula de segunda generación, mejorada. En modalidades particulares de la invención, se contempla proteínas cristalinas mutadas, que serán útiles para aumentar la actividad insecticida de la proteína y, consecuentemente, incrementar la actividad insecticida y/o la expresión del transgene recombinante en una célula de plantas. Se puede lograr los cambios en el aminoácido cambiando los codones de la secuencia de ADN, conforme a los codones que aparecen en el cuadro 3.
CUADRO 3 Aminoácido Codones Alanina Ala A GCA GCC GCG GCU Cisteína Cys C UGC UGU Ácido aspártico Asp D GAC GAU Ácido glutámico Glu E GAA GAG Fenilalanina Phe F UUC UUU Glicina Gly G GGA GGC GGG GGU Histidina His H CAC CAU Isoleucina lie 1 AUA AUC AUU Lisina Lys K AAA AAG Leucina Leu L UUA UUG CUA CUC CUG CUU Metionina Met M AUG Asparagina Asn N AAC AAU Prolina Pro P CCA CCC CCG CCU Glutamina Gln Q CAA CAG Arginina Arg R AGA AGG CGA CGC CGG CGU Serina Ser S AGC AGU UCA UCC UCG UCU Treonina Thr T ACÁ ACC ACG ACU Valina Val V GUA GUC GUG GUU Triptofano Trp W UGG Tirosina Tyr Y UAC UAU Por ejemplo, ciertos aminoácidos pueden ser sustituidos por otros aminoácidos en una estructura de proteína, sin pérdida apreciable de la capacidad de unión interactiva con estructuras tales como, por ejemplo, regiones de unión con antígeno de los anticuerpos, o sitios de unión en moléculas de substrato. Puesto que es la capacidad interactiva y la naturaleza de una proteína lo que define esa actividad funcional biológica de la proteína, se pueden hacer ciertas sustituciones en la secuencia de aminoácido, en una secuencia de proteína y, por supuesto, su secuencia codificadora de ADN subyacente, y no obstante, obtener una proteína con propiedades similares. Así pues, se contempla ' por los inventores que se pueden hacer varios cambios en las secuencias de péptido de las composiciones descritas, o en secuencias de ADN correspondientes que codifican dichos péptidos, sin pérdida apreciable de su utilidad o actividad biológicas. Al efectuar dichos cambios, se puede considerar el índice hidropático de los aminoácidos. La importancia del índice hidropático del aminoácido al conferir a una proteína una función biológica interactiva, generalmente es comprendida en la técnica (Kyte y Doolittle, 1982, incorporado en la presente mediante la referencia). Se acepta que la naturaleza hidropática del aminoácido contribuye a la estructura secundaria de la proteína resultante, lo que, a su vez, define la interacción de la proteína con otras moléculas, por ejemplo, enzimas, substratos, receptores, ADN, anticuerpos, antígenos y similares. Se ha asignado a cada aminoácido un índice hidropático, sobre la base de su hidrofobicidad y sus características de carga (Kyte y Doolittle, 1982); éstas son: isoleucina (+4.5), valina (+4.2), leucina (+3.8), fenilalanina(+2.8), cisteína/cistina (+2.5), metionina (+1.9), alanina (+1.8), glicina (-0.4), treonina (-0.7), serina (-0.8), triptofano (-0.9), tirosina (-1.3), prolina (-1.6), histidina (-3.2), giutamato (-3.5), glutamina (-3.5), aspartato (-3.5), asparagina (-3.5), lisina (-3.9) y arginina (-4.5). Se sabe en la técnica que ciertos aminoácidos pueden ser sustituidos por otros aminoácidos que tengan un índice hidropático o anotación hidropática similar, y que todavía se obtiene como resultado una proteína con actividad biológica similar, es decir, se obtiene todavía una proteína funcionalmente equivalente biológica. Al efectuar dichos cambios se prefiere la sustitución de aminoácidos cuyos índices hidropáticos estén dentro de ±2 ; se prefiere en particular los que están dentro de ±1 y se prefiere todavía más particularmente los que están dentro de ±0.5. También se entiende en la técnica que la sustitución de aminoácidos similares se puede efectuar de manera efectiva, sobre la base de hidrofilicidad. La patente US 4,554,101 , incorporada aquí mediante la referencia, sea la que la máxima hidrofilicidad promedio local de una proteína, según lo dicta la hidrofilicidad de sus aminoácidos adyacentes, está correlacionada con una propiedad biológica de la proteína. Como se detalla en la patente estadounidense 4,554,101 , se ha asignado a los residuos de aminoácido los siguientes valores de hidrofiiicidad: arginina (+3.0), aspartato (+3.0 ± 1 ); glutamato (+3.0 ±1 ), serina (+0.3), asparagina (+0.2), glutamina (+0.2), glicina (0), treonina (-0.4), prolina (-0.5 ± 1), alanina (-0.5), histidina (-0.5), cisteína (-1.0), metionina (-1.3), valina (-1.5), leucina (-1.8), isoleucina (-1.8), tirosina (-2.3), fenilalanina (-2.5), triptofano (-3.4). Se entiende que se puede sustituir un aminoácido por otro que tenga un valor de hidrofilicidad similar y todavía obtener una proteína biológicamente equivalente y, en particular, una proteína inmunológicamente equivalente. En dichos cambios, la sustitución de los aminoácidos cuyos valores de hidrofilicidad estén dentro de ±2 son los preferidos, y los que están dentro de ±1 son particularmente preferidos, y los que están dentro de ±0.5 son todavía más particularmente preferidos. Como se señaló con anterioridad, las sustituciones de aminoácido, por io tanto, se basan generalmente en la similitud relativa de los sustituyentes de cadena lateral del aminoácido, por ejemplo, su hidrofobicidad, su hidrofilicidad, su carga, su tamaño y similares. Las sustituciones ejemplares que tienen en cuenta varias de las características precedentes, son bien conocidas por los expertos en la materia e incluyen: arginina y lisina; glutamato y aspartato; serina y treonina; glutamina y asparagina; y valina, leucina e isoleucina. 3.O.- BREVE DESCRIPCIÓN DE LOS DIBUJOS Los siguientes dibujos forman parte de la memoria descriptiva de la presente y están incluidos para demostrar adicionalmente ciertos aspectos de la presente invención. Se puede entender mejor la invención mediante referencia a uno o más de esos dibujos, en combinación con la descripción detallada de las modalidades específicas, presentada aquí. La figura 1 es un diagrama esquemático de la proteína cristalina CrylC de ß. thuringiensis; las hélices alfa están ilustradas por los rectángulos y están marcadas de acuerdo con la convención adaptada por Li y coautores (1991 ). Adoptando la convención de Li y coautores, los inventores de la presente han designado la hélice 2 comprendiendo dos porciones: la hélice 2a y la hélice 2b. La figura 2 muestra los mapas estructurales de pEG315, pEG916, pEG359 y p154. Las flechas con casillas y los segmentos indican genes o elementos de ADN funcionales. Las designaciones pTZ19u = vector pTZ19u de fagémido de E. coli; cat = gene de cloranfenicol (Cml)-acetiltransferasa; or¡43 y orißO = orígenes de reproducción del plásmido B. thuringiensis; crylC = gene de proteína cristalina insecticida crylC. Abreviaturas de sitio de restricción: Ag = Age! , Asp = >4sp718, Ba = ßamHI, Bb = Bbu\, Bg = BglW, Bln = Bln\, P = Pstl, S = Salí, X = Xho\. La escala 1 Kb se refiere únicamente al segmento de gene crylC. PEG315 dio lugar a pEG 1635 y pEG1636, que contienen las mutaciones Arg148Ala y Arg180Ala, respectivamente; pEG916 dio lugar a pEG370, pEG373 y pEG374, que contienen, respectivamente, las mutaciones cry1C563, cry1C579 y cry1C499. Estos mutantes están descritos detalladamente en la sección 5. La figura 3 muestra el mapa estructural de pEG345. Las flechas con casilla y los segmentos indican genes de elementos de ADN funcionales. Designaciones: pTZ19u = vector pTZ19u de fagémido de E. coli; cat = gene de Cm1-acetiltransferasa; or¡44 = origen de reproducción del plásmido de B. Thuringiensis; crylC = gene de proteína cristalina insecticida Cr1C. Abreviaturas de sitio de restricción: Ag = Age\, Asp = Asp718; Bb = Bbul, Bg = BglW, E = EcoRI, H = Hind\\\, Sm = Smal. La escala 1 Kb se refiere únicamente al segmento de gene crylC.
La figura 4 ilustra un diagrama de flujo que indica las mutaciones contenidas dentro del gene crylC codificado por pEG359 y las mutaciones contenidas dentro de los genes cry1C563, cry1C579 y crylC.499, generados por mutagénesis aleatoria. La figura 5 muestra el procedimiento de mutagénesis mediado por PCR™ usado para generar el mutante cry1C499, cry1C563 y cry1C579 en las cepas EG11747, EG11740 y EG11746, respectivamente. El asterisco denota las mutaciones incorporadas en la secuencia de gene crylC. Abreviaturas de sitios de restricción: Ag = Age\, Bb = ߣ>_vl y Bg = BglW. La figura 6 muestra la alineación de una región de rizo de 24 proteínas Cryl relacionadas. La figura 7 muestra mapas estructurales de los plásmidos pEG348 y pEG348A, codificadores de crylC. Las flechas con casilla y los segmentos indican genes de elementos de ADN funcionales. Designaciones: pTZ19u = vector fagémido pTZ19u de E. coli; tet = gene de resistencia a la tetraciclina; or¡60 = origen de reproducción del plásmido de B. thuringiensis; cry C = gene de proteína cristalina insecticida crylC; IRS = fragmento de ADN que contiene la región del sitio de resolución interna del transposón Tn5401. Abreviaturas de sitio de restricción: A = >4sp718; H = HindW\; Nsi = ?s/'l; Nsp = ?spI; P = Pst\; Sp = Sp 7l. La figura 8 ilustra mapas estructurales de los plásmidos pEG1641 y pEG1641?. Las flechas con casilla y los segmentos indican genes o elementos de ADN funcionales. Designaciones: pTZ19u = vector fagémido pTZ19u de E. coli; tet = gene de resistencia a la tetraciclina; orißO ) origen de reproducción del plásmido de B. Thuringiensis; crylC = gene de proteína cristalina insecticida cry C; IRS = fragmento de ADN que contiene la región de sitio de resolución interna del transposón Tn5407. Abreviaturas de sitio de restricción: A = ->4sp718; = HindW\; Nsi = ?/s/'l; Nsp = ?/spI; P = Psfl; Sp = Sph\. La figura 9 muestra el mapa estructural de pEG943. Las flechas con casilla y los segmentos indican genes o elementos de ADN funcionales. Designaciones: pTZ19u = vector fagémido pTZ19u de E coli; cat = gene de Cm1-acetiltransferasa; or¡44 - origen de reproducción del plásmido de B. Thuringiensis; crylC = gene de proteína cristalina insecticida crylC. Abreviaturas de sitio de restricción: Ag = Age\; Asp = Asp718; Bb = Bbul; Bg = BglW; E = EcoRl; H = HindU\; Nh = Nhel; Sm = Smal. La escala 1 Kb se refiere solamente al segmento de gene crylC. La figura 10 muestra el procedimiento PCR™ de extensión de traslape, usado para generar los mutantes combinatorios Cry1C-R148D, con sustituciones de aminoácido en el rizo alfa6-7. El asterisco denota las mutaciones incorporadas en la secuencia de gene crylC. La PCR™ con los sensibilizadores flanqueadores H y L, produjo una subpoblación de fragmentos que codifican ias mutaciones en el rizo alfa6-7, y que carecen del sitio Nhe\, derivado de la plantilla pEG943. Abreviaturas del sitio de restricción: Ag = Age\; Asp = / sp718; Bb = Bbul; Bg = BglW; E = EcoRI; H = HindWl; Nh = Nhel; Sm = Smal.
La figura 11 muestra el procedimiento PCR™ de extensión de traslape usado para generar las mutantes combinatorias Cry1C-R148D, con sustituciones de aminoácido en el rizo alfa5-6. El asterisco denota las mutaciones incorporadas en la secuencia de gene crylC. La PCR™ con los sensibilizadores flanqueadores H y L, produjo una subpoblación de fragmentos que codifican las mutaciones en el rizo alfa5-6, y que carecen del sitio Nhel, derivado de la plantilla pEG943. Abreviaturas de sitio de restricción: Ag = Agel; Asp = \sp718; Bb = Bbu\; Bg = BglW; E = EcoRI; H = Hindlll; Nh = Nhel, Sm = Smal 4.O.- DESCRIPCIÓN DE MODALIDADES ILUSTRATIVAS 4.1. - ALGUNAS VENTAJAS DE LA INVENCIÓN Los experimentos de mutagénesis con genes cryl han fallado en identificar proteínas cristalinas mutantes con actividad insecticida de amplio espectro, mejorada; es decir, con toxicidad mejorada hacia una variedad de especies de plagas de insectos. Puesto que los cultivos agrícolas están amenazados típicamente por más de una especie de plaga de insectos, en cualquier momento dado, las proteínas cristalinas mutantes deseables de preferencia son aquellas que exhiben mejoras en la toxicidad hacia múltiples especies de plagas de insectos. Las fallas previas en identificar dichos mutantes pueden atribuirse a la selección de los sitios buscados para la mutagénesis. Los sitios dentro del dominio 2 y del dominio 3 han sido los principales blancos de los esfuerzos previos en la mutagénesis de Cryl , primariamente debido a que se cree que esos dominios son importantes para la unión al receptor y para determinar la especificidad insecticida (Aronson y coautores, 1995; Chen y coautores, 1993; de Maagd y coautores, 1996; Lee y coautores, 1992; Lee y coautores, 1995; Lu y coautores, 1994; Smedley y Ellar, 1996; Smith y Ellar, 1994; Rajamohan y coautores, 1995; Rajamohan y coautores, 1996). En contraste, los inventores de la presente razonaron que la toxicidad de las proteínas Cryl y, específicamente, la toxicidad de la proteína CrylC, se puede mejorar contra una variedad más amplia de plagas de lepidópteros, al apuntar a regiones implicadas en la función del canal iónico en lugar de a las regiones de la molécula directamente involucradas en las interacciones con el receptor, o sea, los dominios 2 y 3. Consecuentemente, los inventores optaron por las regiones de destino dentro del dominio 1 de CrylC para la mutagénesis, con la esperanza de aislar mutantes de CrylC con toxicidad de amplio espectro, mejorada. En realidad, en la presente invención, están descritos mutantes CrylC que muestran toxicidad mejorada hacia diversas plagas de lepidópteros, incluyendo Spodoptera exigua, Spodoptera frugiperda, Trichoplusia ni y Heliothis virescens, al mismo tiempo que mantienen excelente actividad contra Plutella xilostella. Por lo menos una, y probablemente más de una hélice alfa del dominio 1 está implicada en la formación de los canales iónicos y los poros dentro del epitelio de tripa media del insecto (Gazit y Shai, 1993; Gazit y Shai, 1995). En lugar de apuntar para mutagénesis a las secuencias que codifican las hélices alfa del dominio 1 como otros lo habían hecho (Wu y Aronson, 1992; Aronson y coautores, 1995; Chen y coautores, 1995), los inventores de la presente optaron por apuntar exclusivamente a las secuencias que codifican residuos de aminoácido adyacentes a, o que quedan dentro de regiones de rizo predichas de Cryl C que separan a esas hélices alfa. Los residuos de aminoácido dentro de esas regiones de rizo o los residuos de aminoácido que coronan el extremo de una hélice alfa y que quedan adyacentes a esas regiones de rizo, pueden afectar las relaciones espaciales entre esas hélices alfa. Consecuentemente, la sustitución de estos residuos de aminoácido puede dar por resultado cambios sutiles en la estructura terciaria, o aun en la estructura cuaternaria, que impactan positivamente en la función del canal iónico. Los residuos de aminoácido en las regiones de rizo del dominio 1 están expuestos al solvente y, de tal manera, están disponibles para diversas interacciones moleculares. Alterar esos aminoácidos podría dar por resultado mayor estabilidad de la proteína, al eliminar u ocluir los sitios sensibles a la proteasa. Las sustituciones de aminoácido que cambian la carga superficial del dominio 1 podrían alterar la eficiencia del canal iónico o alterar las interacciones con la membrana de límite de cepillo o con otras porciones de la molécula de toxina, lo que permite que la unión o la inserción sean más efectivas. Al mutar residuos específicos dentro de esas regiones de rizo, los inventores estuvieron en capacidad de producir proteínas cristalinas sintéticas que retuviesen o incluso incrementasen la actividad insecticida contra insectos lepidópteros. Conforme a esta invención, se efectúan sustituciones de bases en los codones de crylC a fin de cambiar los codones particulares con las regiones de rizo de los polipéptidos y, en particular, en aquellas regiones de rizo que están entre las hélices alfa. Como una modalidad ilustrativa, los cambios en tres de dichos aminoácidos, dentro de la región de rizo entre las hélices alfa 3 y 4 del dominio 1 , produjeron proteínas cristalinas modificadas, con actividad insecticida incrementada. La actividad insecticida de una proteína cristalina dicta en último término el nivel de la proteína cristalina necesario para el control efectivo del insecto. La potencia de una proteína insecticida debe ser elevada al máximo cuanto sea posible, a fin de proveer su utilización económica y eficiente en el campo. La potencia incrementada de una proteína insecticida en una formulación de bioinsecticida sería de esperar que mejorara el funcionamiento de campo del producto bioinsecticida. Alternativamente, la potencia incrementada de una proteína insecticida en una formulación de bioinsecticida puede promover el uso de cantidades reducidas de bioinsecticida por área unitaria de cultivo tratado, permitiendo de ese modo el uso a costo muy efectivo del producto bioinsecticida. Cuando se expresa en la planta, la producción de las proteínas cristalinas con actividad insecticida mejorada puede esperarse que mejore la resistencia de la planta a las plagas de insectos susceptibles.
La proteína cristalina muy efectiva contra el gusano de esciara del betabel, Spodoptera exigua, es la proteína Cryl C, pero la toxicidad de esta toxina contra S exigua es alrededor de 40 veces menor que la toxicidad de CrylAc hacia el gusano de la infloración del tabaco, Heliothis virescens, y alrededor de 50 veces menor que la toxicidad de Cryl Ba hacia la polilla de lomo adiamantado, Plutella xylostella (Lambert y coautores, 1996).
Consecuentemente, existe la necesidad de mejorar la toxicidad de CrylC hacia S exigua, así como hacia otras plagas de lepidópteros. Se usó previamente la mutagénesis dirigida al sitio para sondear la función de regiones de rizo expuestas en dos superficies, encontradas en el dominio 2 de la proteína CrylC (Smith y Ellar, 1994). Si bien se encontró que las sustituciones de aminoácido dentro del dominio 2 afectaban la especificidad insecticida, no se obtuvo mutantes de CrylC con actividad insecticida mejorada. En contraste pronunciado con la técnica anterior, que se había enfocado en la generación de sustituciones de aminoácido dentro de las hélices alfa predichas del dominio 1 en CrylA, las estrategias de mutagénesis novedosas de la presente invención se enfocan sobre la generación de sustituciones de aminoácido en las posiciones cerca de o dentro de las regiones de rizo predichas que conectan las hélices alfa del dominio 1. Estas regiones de rizo están mostradas en la representación esquemática de los dominios de proteína cristalina mostrados en la figura 1. Al mutar residuos específicos dentro de esas regiones de rizo, los inventores fueron capaces de producir proteínas cristalinas sintéticas que retenían o poseían actividad insecticida incrementada contra determinadas plagas de lepidópteros, incluyendo el gusano de esciara del betabel, S exigua. Conforme a la invención, se efectúan sustituciones de bases en los codones de crylC a fin de cambiar ios codones particulares que codifican los aminoácidos dentro de, o cerca de las regiones de rizo predichas, entre las hélices alfa del dominio 1. Como una modalidad ilustrativa, los cambios en tres de dichos aminoácidos dentro de la región de rizo, entre las hélices alfa 3 y 4 del dominio 1 , produjeron proteínas cristalinas modificadas con actividad insecticida incrementada (Cry1 C499, CrylC.563, CrylC.579). Como una segunda modalidad ilustrativa una sustitución de alanina por un residuo arginina dentro de o adyacente a la región de rizo entre las hélices alfa 4 y 5, produjo una proteína cristalina modificada con actividad insecticida incrementada (Cry1 C-R148A). Si bien esta sustitución elimina un sitio potencial de división con tripsina dentro del dominio 1 , la digestión con tripsina, de esta proteína cristalina modificada, no reveló diferencias en la estabilidad proteolítica con respecto a la proteína Cryl C natural. Adicionalmente, la sustitución R180A en CrylC (Cry1 C-R180A) también elimina un sitio potencial de división con tripsina en el dominio 1 ; pero esta sustitución no tiene efecto sobre la actividad insecticida. Así pues, los pasos en el modo de acción de la proteína Cryl C, ¡mpactados por estas sustituciones de aminoácido, no han sido determinados ni tampoco es obvio que sea necesario efectuar sustituciones para mejorar la actividad insecticida. Muchas proteínas cristalinas muestran identidad de secuencia de aminoácidos significativa para la secuencia de aminoácidos CrylC dentro del dominio 1 , incluyendo las proteínas de las clases Cryl , Cry2, Cry3, Cry5, Cry5, Cry7, Cry8, Cry9, Cry10, Cry11 , Cry12, Cry13, Cry14 y Cry16, definidas por la nueva nomenclatura del gene cry (cuadro 1 ). Adicionalmente, las estructuras para Cryl llA (Cry3A) y CrylAa (CrylAa) muestran una conservación notable de la estructura terciaria de proteína (Grochuiski y coautores, 1995). De tal manera, se anticipa que la mutagénesis de los codones que codifican los aminoácidos dentro de, o cerca de las regiones de rizo entre las hélices alfa del dominio 1 , en estas proteínas, también pueden dar por resultado la generación de proteínas insecticidas mejoradas. En realidad, una alineación de las secuencias de aminoácido Cryl que se extienden en la región de rizo entre las hélices alfa 4 y 5, revela que varias proteínas Cryl contienen un residuo arginina en la posición homologa a R148 de Cryl C. Dado que el mutante Cry1 C-R148A exhibe toxicidad mejorada para varias plagas de lepidópteros, los inventores contemplan que sustituciones similares en esas otras proteínas Cryl también producirán proteínas insecticidas mejoradas. 4.2 MÉTODOS PARA PRODUCIR PROTEÍNAS CrvIC Las cepas de B. Thuringiensis descritas en la presente pueden ser cultivadas utilizando medios conocidos normales y técnicas de fermentación normales. Cuando se completa el ciclo de fermentación, se puede cosechar las bacterias, separando primeramente las esporas y cristales de B. Thuringiensis del caldo de fermentación, por medios bien conocidos en la técnica. Las esporas y los cristales recuperados de B. Thuringiensis pueden ser formulados a un polvo humectable, un concentrado líquido, granulos u otras formulaciones, mediante la adición de agentes tensioactivos, dispersantes, portadores inertes y otros componentes, para facilitar el manejo y la aplicación para plagas de destino particulares. Los procedimientos de formulación y de aplicación son todos bien conocidos en la técnica y son usados con cepas comerciales de B. Thuringiensis (HD-1 ) activas contra lepidópteros, por ejemplo, contra orugas. 4.3.- CÉLULAS ANFITRIONAS RECOMBINANTES PARA EXPRESAR LOS GENES crvIC* Se puede introducir las secuencias de nucleótido de la presente invención en una gran variedad de anfitriones microbianos. La expresión del gene de toxina da por resultado, directa o indirectamente, la producción intracelular y el mantenimiento del plaguicida. Con anfitriones adecuados, por ejemplo, Pseudomonas, se puede aplicar los microbios a los sitios de insectos lepidópteros, en los que proliferarán y serán ingeridos por los insectos. El resultado es un control de los insectos indeseables. Alternativamente, el microbio que aloja el gene de toxina puede ser tratado bajo condiciones que prolonguen la actividad de la toxina producida en la célula. Luego se puede aplicar la célula tratada al ambiente de la(s) plaga(s) de destino. El producto resultante retiene la toxicidad de la toxina de B. Thuringiensis.
Las células anfitrionas adecuadas, en las que se tratará las células que contienen el plaguicida para prolongar la actividad de la toxina en la célula, cuando se aplica la célula tratada después al ambiente de la(s) plaga(s) de destino, pueden incluir procariotes o eucariotes, estando limitadas normalmente a aquellas células que no produzcan sustancias tóxicas para los organismos superiores, como los mamíferos. Sin embargo, podría utilizarse organismos que produjesen sustancias tóxicas para los organismos superiores, cuando la toxina es inestable o cuando el nivel de aplicación es suficientemente bajo para evitar cualquier posibilidad de toxicidad para un anfitrión mamífero. Como anfitriones, serán de particular interés los procariotes y los eucariotes inferiores, como los hongos. Los procariotes ilustrativos, tanto Gram-negativos como Gram-positivos, incluyen las enterobacterias, como Escherichia, Erwinia, Shigella, Salmonella y Proteus los bacilos, las rizobiáceas, como Rhizobium; las espiriláceas, como las fotobacterias; Zymomonas, Serratia, Aeromonas, Vibrio, Desulfovibrio, Spirilum, las lactobaciláceas, las pseudomonadáceas, como Pseudomonas y Acetobacter; las azotobacteráceas, los actinomicetales y las nitrobacteráceas. Entre los eucariotes están los hongos, como los ficomicetos y los ascomicetos, que incluyen la levadura, como Saccharomyces y Schtzosacaromyces y los basidiomicetos; levadura, como Rhodotorula, Aureobasidium, Sporobalomyces, y similares. Las características de interés particular al selecciona una célula anfitriona para fines de producción, incluyen la facilidad de introducir el gene de ß. thuringiensis en el anfitrión, la disponibilidad de sistemas de expresión, la eficiencia de expresión, la estabilidad del pesticida en el anfitrión y la presencia de capacidades genéticas auxiliares. Las características de interés para uso como una microcápsula pesticida, incluyen las calidades protectoras para el pesticida, como paredes gruesas de célula, pigmentación y empaque intracelular o formación de cuerpos de inclusión; la afinidad para las hojas, la carencia de toxicidad para los mamíferos, lo atractivo para su ingestión por las plagas, la facilidad de matar y fijarse sin daños para la toxina, y similares. Otras consideraciones incluyen la facilidad de formulación y manipulación, la economía, la estabilidad durante el almacenamiento y similares. Los organismos anfitriones de interés particular incluyen las levaduras, como Rhodotorula sp., Aureobasidium sp, Saccharomyces sp y Sporobolomyces sp; organismos filoplanos, como Pseudomonas sp, Erwinia sp y Flavobacterium sp; u otros organismos, como Escherichia, Lactobacillus sp, Bacillus sp, Streptomyces sp y similares. Los organismos específicos incluyen: Pseudomonas aeruginosa, Pseudomonas fluorescens, Saccharomyces cereviciae, Bacillus thuringiensis, Escherichia coli, Bacillus subtilis, Bacillus megaterium, Bacillus cereus, Streptomyces lividans y similares. El tratamiento de la célula microbiana, por ejemplo, de un microbio que contiene el gene de la toxina de ß. thuringiensis, puede ser mediante medios químicos o físicos, o mediante una combinación de medios químicos y/o físicos, siempre y cuando la técnica no afecte perjudicialmente las propiedades de la toxina ni disminuya la capacidad celular al proteger la toxina. Los ejemplos de reactivos químicos son los agentes halogenadores, en particular los halógenos de número atómico 17-80. Más en particular, se puede usar yodo bajo condiciones moderadas, durante un tiempo suficiente para lograr los resultados deseados. Otras técnicas adecuadas incluyen el tratamiento con aldehidos, como formaldehído y glutaraldehído; anti-infectantes, como cloruro de zefirano y cloruro de cetilpiridinio; alcoholes, como isopropilo y etanol; diversos fijadores histológicos, como yodo de Lugol, fijador de Bouin y fijadores de Helly (véase, por ejemplo, Humason, 1967); o una combinación de agentes físicos (calor) y químicos que preserven y prolonguen la actividad de la toxina producida en la célula, cuando se va a administrar la célula al animal anfitrión. Los ejemplos de medios físicos son irradiación de longitud de onda corta, como radiación gamma y radiación X; congelación, irradiación UV, liofilización y similares. Las células empleadas usualmente estarán intactas y estarán sustancialmente en forma proliferante cuando son tratadas, en lugar de en forma de esporas; aunque, en algunos casos, se puede emplear esporas. _ Cuando se introduce el gene de la toxina de B. thuringiensis por medio de un vector adecuado, en el anfitrión microbiano, y se aplica dicho anfitrión ai ambiente en estado vivo, es esencial que se utilice ciertos microbios anfitriones. Los microorganismos anfitriones son seleccionados de entre los que se sabe que ocupan la "fitosfera" (filoplano, filosfera, rizosfera y/o rizoplano) de uno o más cultivos de interés. Se selecciona estos microorganismos de manera que sean capaces de competir satisfactoriamente en el ambiente particular (cultivo y otros habitáis del insecto) con los microorganismos de tipo silvestre, provean mantenimiento estable y expresión del gene que expresa el polipéptido pesticida, y convenientemente, provean protección mejorada del pesticida contra la degradación e inactivación ambientales. Se conoce un gran número de microorganismos que habitan el filoplano (la superficie de las hojas de las plantas) y/o la rizosfera (el suelo que rodea las raíces de las plantas), de una gran variedad de cultivos importantes. Estos microorganismos incluyen bacterias, algas y hongos. Son de interés particular los microorganismos como las bacterias, por ejemplo, los géneros Bacillus, Pseudomonas, Erwinia, Serratia, Klebsiella, Zanthomonas, Streptomyces, Rhizobium, Rhodopseudomonas, Methylophillus, Agrobacterium, Acetobacter, Lactobacillus, Arthrobacter, Azotobacter, Leuconostoc y Alcaligenes; hongos, particularmente levaduras, por ejemplo, los géneros Saccharomyces, Cryptococcus, Kluyveromyces, Sporobolomyces, Rhodotorula y Aureobasidium. Son de interés particular las especies bacterianas de fitosfera, como Pseudomonas syringae, Pseudomonas fluorescens, Serratla marcescens, Acetobacter xilinum, Agrobacterium tumefaciens, Rhodobacter sphaeroides, Xanthomonas campestris, Rhizobium melioti, Alcaligenes eutrophus y Azobacter vinlandii; y especies de levaduras de la fitosfera, como Rhodotorula rubra, R glutinis, R marina, R aurantiaca, Cryptococcus albidus, C diffluens, C laurentii, Saccharomyces rosei, S pretoriensis S cerevisiae, Sporobalomyces roseus, S odorus, Kluyveromyces veronae y Aureobasidium pollulans. 4.4.- DEFINICIONES Tai como se usa en la presente, las designaciones "Cryl" y "Cryl" son sinónimas, al igual que las designaciones "CrylC" y "Cryl C". De igual manera, los inventores han utilizado el término genérico CrylC* para denotar cualquiera y todas las variantes de Cryl C que comprenden secuencias de aminoácido modificadas en la región de rizo del dominio 1. De manera similar, crylC* está destinada a denotar cualquiera y todos los segmentos de ácido nucleico y/o los genes que codifican dichas proteínas CrylC* modificadas. Con igual intención, los inventores han usado los términos Cryl* para denotar cualquiera y todas las variantes de Cryl que comprenden secuencias de aminoácido modificadas en la región de rizo del dominio 1. Similarmente, cryl* está destinada a denotar cualquiera y todos los segmentos de ácido nucleico y/o los genes que codifican dichas proteínas Cryl* modificadas. Se usa una convención similar para describir las variantes de dominio de rizo modificado en cualquiera de las proteínas cristalinas relacionadas y los genes que las codifican. De conformidad con la presente invención, las secuencias de ácido nucleico incluyen, pero sin limitación, el ADN (incluyendo, sin limitación, el ADN genómico o extragenómico), los genes, el ARN (incluyendo, sin limitación, mARN y tARN), las nucieosidas y los segmentos adecuados de ácido nucleico, ya sea obtenidos de fuentes naturales, sintetizados químicamente, modificados o preparados de otra manea por la mano del hombre. Los siguientes vocablos y las siguientes frases tienen los significados que aparecen a continuación: Espectro amplio: se refiere a una gran variedad de especies de insectos. Actividad insecticida de espectro amplio: toxicidad hacia una gran variedad de especies de insectos. Expresión: La combinación de procesos intracelulares, que incluyen la transcripción y la translación sufridas por una molécula de ADN codificador, tal como un gene estructural, para producir un péptido. Actividad insecticida: toxicidad hacia los insectos. Especificidad insecticida: La toxicidad exhibida por una proteína cristalina hacia múltiples especies de insectos. Especificidad dentro del orden: La toxicidad de una proteína cristalina particular hacia las especies de insectos dentro de un orden de insectos (por ejemplo, el orden de los lepidópteros). Especificidad entre los órdenes: La toxicidad de una proteína cristalina particular hacia especies de insectos de diferentes órdenes (por ejemplo, los órdenes de los lepidópteros y los dípteros). CL 0: La concentración letal de la proteína cristalina que provoca el 50% de mortandad de los insectos tratados. CLg5: La concentración letal de la proteína cristalina que provoca el 95% de mortandad de los insectos tratados. Promotor: Un sitio de reconocimiento de una secuencia de ADN o un grupo de secuencias de ADN que provee un elemento de control de expresión para un gene estructural, y ai que se une específicamente la ARN- polimerasa e inicia la síntesis (transcripción) de ARN de ese gene. Regeneración: El proceso de crecer una planta a partir de una célula de planta (por ejemplo, el protoplasto o explante de una planta). Gene estructural: Un gene que es expresado para producir un polipéptido. Transformación: Un proceso de introducir una secuencia exógena de ADN (por ejemplo, un vector, una molécula de ADN recombinante) en una célula o protoplasto, en el que se incorpora el ADN exógeno en un cromosoma o es capaz de reproducción autónoma. Célula transformada: Una célula cuyo ADN ha sido alterado por la introducción de una molécula exógena de ADN en esa célula. Célula transgénica: Cualquier célula derivada o regenerada a partir de una célula transformada o derivada de una célula transgénica. Los ejemplos de células transgénicas incluyen los callos de planta derivados de una célula vegetal transformada y las células particulares, como hoja, raíz, tallo, por ejemplo, células somáticas o células reproductoras (germinales) obtenidas de una planta transgénica. Planta transgénica: Una planta o su progenie, derivada de una célula o protoplasto de planta transformado, donde el ADN de planta contiene una molécula exógena de ADN, que no estaba presente originalmente en una planta no transgénica, natural, de la misma cepa. Los términos "planta transgénica" y "planta transformada" algunas veces han sido usados en la técnica como términos sinónimos para definir una planta cuyo ADN contiene una molécula exógena de ADN. Sin embargo, se cree que es más científicamente correcto referirse a una planta regenerada o callo obtenidos de una célula de planta transformada o protoplasto transformado, como una planta transgénica, y que se seguirá en la presente ese uso. Vector: Una molécula de ADN capaz de reproducirse en una célula anfitriona y/o a la que se puede enlazar operativamente otro segmento de ADN, a fin de efectuar la reproducción del segmento fijado. Los piásmidos, fagémidos, cósmidos, fagos, virus, YAC's y BAC son ejemplos de vectores. 4.5.- SONDAS Y SENSIBILIZADORES En otro aspecto, la información de secuencia de ADN provista por la invención permite la preparación de secuencias relativamente cortas de ADN (o de ARN) que tienen la capacidad de hibridarse específicamente a secuencias de genes de los polinucleótidos seleccionados aquí descritos. En estos aspectos, las sondas de ácido nucleico de longitud apropiada son preparadas con base en una consideración de una secuencia seleccionada de gene de la proteína cristalina, por ejemplo, una secuencia tal como las mostradas en SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60. La capacidad de dichas sondas de ácido nucleico para hibridarse específicamente a una secuencia de gene que codifica la proteína cristalina tiende por sí misma a una utilidad particular en una variedad de ambientes. Es sumamente importante que las sondas puedan ser usadas en una variedad de análisis para detectar la presencia de secuencias complementarias en una muestra dada. En ciertas modalidades, es ventajoso usar sensibilizadores de oligonucleótido. La secuencia de dichos sensibilizadores es diseñada usando un polinucleótido de la presente invención para uso en detectar, amplificar o mutar un segmento definido de un gene de proteína cristalina de ß. thuringiensis, usando tecnología PCR™. Los segmentos de genes de proteína cristalina relacionados, procedentes de otras especies, también pueden ser amplificados mediante PCR™ utilizando dichos sensibilizadores. Para proveer algunas de las ventajas de acuerdo con la presente invención, una secuencia preferida de ácido nucleico, empleada para estudios o análisis de hibridación, incluye secuencias que son complementarias con al menos un tramo de una longitud de por lo menos 14 a 30, más o menos, de nucleótido, de una secuencia codificadora de proteína cristalina como los mostrados en SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60. Un tamaño de por lo menos 14 nucleótidos de largo ayuda a garantizar que el fragmento tendrá longitud suficiente para formar una molécula dúplex que sea a la vez estable y selectiva. Sin embargo, las moléculas que tienen secuencias complementarias en tramos mayores que 14 bases de largo, generalmente son las preferidas, fin de aumentar la estabilidad y la selectividad del híbrido y, de esa manera, mejorar la calidad y el grado de moléculas híbridas específicas obtenidas. Generalmente se preferirá diseñar las moléculas de ácido nucleico que tengan tramos complementarios de gene de 14 a 20 nucleótidos, o incluso mayores, cuando se desee. Dichos fragmentos pueden ser preparados fácilmente, por ejemplo, sintetizando directamente el fragmento por medios químicos, medíante la aplicación de tecnología de reproducción de ácido nucleico, tal como la tecnología PCR™ de las patentes US 4683,195 y US 4683,202, incorporadas aquí mediante la referencia, o extirpando fragmentos seleccionados de ADN de plásmidos recombinantes que contienen insertos apropiados y sitios de restricción adecuados. Un oligonucleótido particularmente preferido es el 63-mero identificado en SEQ ID NO: 18. El oligonucleótido es particularmente preferido para la preparación de secuencias mutagenizadas de ácido nucleico para producir toxinas con propiedades mejoradas. Se puede preparar oligonucleótidos mutágenos con sustituciones conocidas o aleatorias, por medio de métodos bien conocidos por los expertos en la materia. Dichos oligonucleótidos pueden ser provistos por firmas comerciales que efectúan síntesis a pedido del cliente. Consecuentemente, se puede usar una secuencia de nucleótidos de la invención por su capacidad para formar selectivamente moléculas dúplex con tramos complementarios del gene. Dependiendo de la aplicación contemplada, se deseará emplear condiciones variables de hibridación para obtener grados variables de selectividad de la sonda hacia la secuencia de destino o blanco. Para aplicaciones que requieran un grado elevado de selectividad, típicamente será conveniente emplear condiciones relativamente estrictas para formar los híbridos; por ejemplo, se seleccionará condiciones relativamente bajas de sal y/o alta temperatura, como las provistas por alrededor de 0.02 M a alrededor de 0.15 M de NaCI, a temperaturas aproximadas de 50°C a 70°C. Estas condiciones son particularmente selectivas y toleran, si acaso, poca desigualdad entre la sonda y la plantilla o filamento buscado. Por supuesto, para algunas aplicaciones, por ejemplo, cuando se desea preparar mutantes que emplean un filamento sensibilizador mutante, hibridado a una plantilla subyacente, o cuando se busca aislar una secuencia codificadora de proteína cristalina para especies relacionadas, equivalentes funcionales, o similares, típicamente serán necesarias condiciones de hibridación menos estrictas a fin de permitir la formación del heterodúplex. En esas circunstancias puede ser conveniente emplear condiciones tales como alrededor de 0.15M a alrededor de 0.9M de sal, a temperatura que varían de 20°C a alrededor de 55°C. De esa manera se puede identificar fácilmente las especies de hibridación cruzadas como señales de hibridación positiva con respecto a las hibridaciones de control. En todo caso, se apreciará generalmente que se pueden hacer más estrictas las condiciones mediante la adición de cantidades crecientes de formamida, lo que servirá para desestabilizar el dúplex híbrido en la misma medida en que se incremente la temperatura. Así pues se puede manipular fácilmente las condiciones de hibridación y, de tal manera, en general, será un método de selección que depende de los resultados deseados. 4.6.- LOS VECTORES DE EXPRESIÓN La presente invención contempla un vector de expresión que comprende un polinucleótido de la presente invención. Así pues, en una modalidad, un vector de expresión es una molécula de ADN aislada y purificada que comprende un promotor enlazado operativamente a una región codificadora que codifica un polipéptido de la presente invención; y dicha región codificadora está enlazada operativamente a una región terminadora de transcripción, con lo que el promotor efectúa la transcripción de la región codificadora. Tal como se usa aquí, el término "enlazado operativamente" significa que un promotor está conectado a una región codificadora de tal manera que la transcripción de esa región codificadora es controlada y regulada por ese promotor Los medios para enlazar operativamente un promotor a una región codificadora son bien conocidos en la técnica. En una modalidad preferida, la expresión recombinante de los ADN que codifican las proteínas cristalinas de la presente invención es preferible en una célula anfitriona de Bacillus. Las células anfitrionas preferidas incluyen ß. thuringiensis, B. megaterium, B. cereus, B. subtilis y bacilos relacionados; siendo sumamente preferidas las células anfitrionas de B. thuringiensis. Los promotores que funcionan en las bacterias son bien conocidos en la técnica. Un ejemplo de promotor preferido para las proteínas cristalinas de Bacillus incluye cualquiera de los promotores de gene de proteína cristalina conocidos, que incluyen los promotores de gene que codifican la proteína cristalina natural.
Alternativamente, se puede diseñar por ingeniería promotores de gene que codifican proteína cristalina mutagenizada o recombinante, por mano del hombre, y se los puede usar para promover la expresión de los segmentos novedosos de gene descritos aquí. En una modalidad alternativa, se lleva a cabo la expresión recombinante de los ADN que codifican las proteínas cristalinas de la presente invención utilizando una bacteria Gram-negativa transformada, tal como una célula anfitriona de E. coli o de Pseudomonas spp. Los promotores que funcionan en la expresión a alto nivel de polipéptidos de blanco en E. coli y otras células anfitrionas Gram-negativas, también son bien conocidos en la técnica. Cuando se va a usar un vector de expresión de la presente invención para transformar una planta, se selecciona un promotor que tiene la capacidad de efectuar la expresión en plantas. Los promotores que funcionan en plantas también son bien conocidos en la técnica. Son útiles en la expresión del polipéptido en plantas los promotores que son inducibles, virales, sintéticos, constitutivos, como los descritos (Poszkowski y coautores, 1989; Odell y coautores, 1985) y regulados temporalmente, regulados espacialmente y regulados espacio-temporalmente (Chau y coautores, 1989). También se selecciona un promotor por su capacidad para dirigir la actividad de transcripción de las células de planta transformada o de las plantas transgénicas, a la región codificadora. Los genes estructurales pueden ser impulsados por una variedad de promotores en los tejidos vegetales. Los promotores pueden ser casi constitutivos, como el promotor CaMV35S, o promotores específicos para ei tejido o específicos en cuanto a desarrollo, y afectar a las dicotiledóneas o a las monocotiledóneas. Cuando el promotor es un promotor casi constitutivo, como CaMV 35S, hay aumentos en la expresión de polipéptido en una variedad de tejidos de planta transformados (por ejemplo, callo, hoja, semilla y raíz). Alternativamente, los efectos de transformación pueden ser dirigidos a tejidos específicos de la planta, utilizando vectores de integración con la planta, que contienen un promotor específico para el tejido. Un promotor específico para el tejido, ejemplar, es el promotor de lectina, que es específico para el tejido de semilla. La proteína Lectina en las semillas de frijol soya es codificada por un solo gene (Leí) que únicamente es expresado durante la maduración de la semilla, y que representa alrededor de 2 a 5% del mARN total de la semilla. El gene de lectina y el promotor específico para la semilla han sido caracterizados plenamente y usados para dirigir la expresión específica para la semilla en plantas transgénicas del tabaco (vodkin y coautores, 1983; Lindstrom y coautores, 1990). Un vector de expresión que contiene una región codificadora que codifica un polipéptido de interés está diseñada para estar bajo el control del promotor de lectina y ese vector es introducido en las plantas usando, por ejemplo, un método de transformación de protoplasto (Dhir y coautores, 1991 ). La expresión del polipéptido está dirigida específicamente a las semillas de la planta transgénica.
Una planta transgénica de la presente invención, producida a partir de una célula de planta transformada con un promotor específico para el tejido, puede ser cruzada con una segunda planta transgénica desarrollada a partir de una célula de planta transformada con un promotor específico para un tejido diferente, para producir una planta transgénica híbrida que muestra los efectos de la transformación en más de un tejido específico. Los promotores ejemplares, específicos para tejido, son la sintetasa 1 de la sacarosa de maíz (Yang y coautores, 1990), la deshidrogenasa 1 de alcohol de maíz (Vogel y coautores, 1989), el complejo de cosecha ligera de maíz (Simpson, 1986), la proteína de choque térmico del maíz (Odell y coautores, 1985), la subunidad pequeña de RuBP-carboxilasa del chícharo (Poulsen y coautores, 1986; Cashmore y coautores, 1983); la mannopin-sintasa del plásmido Ti (Langridge y coautores, 1989), la nopalin-sintasa del plásmido Ti (Langridge y coautores, 1989); la calcona-isomerasa de petunia (Van Tunen y coautores, 1988), la proteína 1 rica en glicina de frijol (Keller y coautores, 1989), el transcripto Ca MV 35s (Odell y coautores, 1985) y la patatina de papa (Wenzler y coautores, 1989). Los promotores preferidos son el promotor del virus del mosaico de la coliflor (CaMV 35S) y el promotor de subunidad pequeña RuBP-carboxilasa de S-E9. La selección de qué vector de expresión y, finalmente, a qué promotor se enlazará operativamente una región codificadora de polipéptido, depende directamente de las propiedades funcionales deseadas, por ejemplo, de la ubicación y el tiempo de la expresión de la proteína, y de la célula anfitriona que va a ser transformada. Estas son limitaciones bien conocidas inherentes a la técnica de construir moléculas de ADN recombinante. Sin embargo, un vector útil en la práctica de la presente invención es capaz de dirigir la expresión de la región codificadora de polipéptido a la que está enlazado operativamente. Los vectores típicos, útiles para la expresión de genes en plantas superiores son bien conocidos en la técnica e incluyen vectores derivados del plásmido inductor de tumor (Ti) de Agrobacterium tumefaciens descrito (Rogers y coautores, 1987). Sin embargo, se sabe que otros varios sistemas de vector integradores de planta funcionan en plantas, incluyendo el vector de control de transferencia pCaMVCN descrito (Fromm y coautores, 1985). El plásmido pCaMVCN (obtenible de Pharmacia, Piscataway, NJ), incluye el promotor CaMV 35S del virus del mosaico de la coliflor. En las modalidades preferidas, el vector usado para expresar el polipéptido incluye un marcador de selección que es efectivo en una célula vegetal, de preferencia un marcador de selección de resistencia a fármaco. Un marcador preferido de asistencia a fármaco es el gene cuya expresión da por resultado resistencia a la kanamicina: o sea, el gene quimérico que contiene el promotor de nopalina-sintasa, neomicin-fosfotransferasa II de Tn5 (nptll) y la región 3' no trasladada de nopalina-sintasa, descrita (Rogers y coautores, 1988). La ARN-polimerasa transcribe una secuencia de ADN codificadora a través de un sitio en el que ocurre poliadenilación. Típicamente, las secuencias de ADN localizadas unos cuantos cientos de pares de bases corriente abajo del sitio de poliadenilación, sirven para terminar la transcripción.
Esas secuencias de ADN son denominadas aquí regiones de terminación de transcripción. Esas regiones son necesarias para la poliadenilación eficiente de ARN mensajero transcrito (mARN). Los medios para preparar los vectores de expresión son bien conocidos en la técnica. La expresión (vectores de transformación) usada para transformar plantas y los métodos para hacer esos vectores, están descritos en las patentes US 4,971 ,908, US 4,940,835, US 4,769,061 Y US 4,757,011 , cuya descripción queda incorporada aquí mediante la referencia. Esos vectores pueden ser modificados para incluir una secuencia codificadora de acuerdo con la presente invención. Se ha desarrollado una variedad de métodos para enlazar operativamente el ADN a vectores mediante extremos complementariamente coherentes, o extremos romos. Por ejemplo, se puede añadir tractos homopoliméricos complementarios al segmento de ADN que se va a insertar en el ADN del vector. Luego se unen el vector y los segmentos de ADN mediante ligadura de hidrógeno entre las colas o residuos homopoliméricos complementarios, para formar las moléculas de ADN recombinante. Una región codificadora que codifica un polipéptido que tiene la capacidad de conferir actividad insecticida a una célula, de preferencia es un gene codificador de proteína cristalina de B. thuringiensis Cry1C-R148A, CrylC- R180A, Cry1C.563, Cry1C.579 o Cry1C.499. En modalidades preferidas, dicho polipéptído tiene la secuencia de residuo de aminoácido de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10 o SEQ ID NO: 12, respectivamente, o un equivalente funcional de esas secuencias. Conforme a dichas modalidades, también se prefiere una región codificadora que comprende la secuencia de ADN de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: , SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60. 4.7.- SEGMENTOS DE ADN COMO SONDAS DE HIBRIDACIÓN Y SENSIBILIZADORES Además de su uso en dirigir la expresión de las proteínas cristalinas o los péptidos de la presente invención, las secuencias de ácido nucleico aquí contempladas también tienen una variedad de otros usos. Por ejemplo, también tienen utilidad como sondas o sensibilizadores en modalidades de hibridación de ácido nucleico. Como tales, se contempla que los segmentos de ácido nucleico que comprenden una región de secuencia que consiste de por lo menos una secuencia contigua de 14 nucleótidos de largo, que tenga la misma secuencia que, o que sea complementaria de, un segmento de ADN continuo, de 14 nucleótidos de largo, de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60, tendrá utilidad particular. Las secuencias idénticas o complementarias, contiguas, más largas, por ejemplo, las de alrededor de 20, 30, 40, 50, 100, 200, 500, 1 ,000, 2,000, 5,000, 10,000, etc. (incluyendo todas las longitudes intermedias y hasta e inclusive las secuencias de longitud completa), también serán útiles en ciertas modalidades. La capacidad de dichas sondas de ácido nucleico para hibridarse específicamente a secuencias codificadoras de proteína cristalina les permitirán detectar la presencia de secuencias complementarias, en una muestra dada. Sin embargo, están contemplados otros usos, que incluyen el uso de la información de secuencia para la preparación de sensibilizadores de especie mutante o sensibilizadores para uso en la preparación de otras construcciones genéticas. Las moléculas de ácido nucleico que tienen regiones de secuencia que consisten de los tramos de nucleótido contiguos 10-14, 15-20, 30, 50 o incluso 100-200 nucleótidos, más o menos, idénticos o complementarios con las secuencias de ADN de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60, están contemplados particularmente como sondas de hibridación para uso, por ejemplo, en manchado Southern y de Northern. Los fragmentos menores generalmente tendrán uso en modalidades de hibridación, en las que la longitud de la región complementaria contigua puede variar, como entre alrededor de 10-14 y alrededor de 100 o 200 nucleótidos, pero puede usarse tramos de complementariedad contiguos más largos, de acuerdo con la longitud de las secuencias complementarias que se desee detectar. El uso de una sonda de hibridación de alrededor de 14 nucleótidos de largo permite la formación de una molécula dúplex que es estable y selectiva.
Sin embargo las moléculas que tienen secuencias complementarias continuas en tramos mayores que 14 bases de largo, son generalmente preferidas; a fin de incrementar la estabilidad y la selectividad del híbrido, y de esa manera mejorar la calidad y el grado de las moléculas híbridas específicas obtenidas. Generalmente se preferirá diseñar moléculas de ácido nucleico que tengan tramos complementarios de gene de 15 a 20 nucleótidos contiguos, o incluso más largos, cuando se desee. Por supuesto, también se puede obtener fragmentos mediante otras técnicas tales como, por ejemplo, sometiendo a esfuerzo cortante mecánico o por digestión con enzimas de restricción. Los segmentos o fragmentos pequeños de ácido nucleico pueden ser preparados fácilmente, por ejemplo, sintetizando directamente el fragmento por medios químicos, como es práctica común utilizando el sintetizador de oligonucleótido automatizado.
También se puede obtener los fragmentos por aplicación de la tecnología de reproducción de ácido nucleico, tal como la tecnología PCR™ de la patente US 4,683,195 y US 4,683,202 (cada una de las cuales queda incorporada aquí mediante la referencia), introduciendo secuencias seleccionadas en vectores recombinantes para la producción recombinante y mediante otras técnicas de ADN recombinante, generalmente conocidas por los expertos en la materia de biología molecular. Consecuentemente, se puede usar secuencias de nucleótido de la invención por su capacidad para formar selectivamente moléculas dúplex con tramos complementarios de fragmentos de ADN. Dependiendo de la aplicación contemplada, será conveniente emplear condiciones variables de hibridación para obtener diversos grados de selectividad de la sonda hacia la secuencia de blanco o destino. Para aplicaciones que requieren elevada selectividad, típicamente será conveniente emplear condiciones relativamente estrictas, para formar los híbridos, por ejemplo, se seleccionará condiciones de relativamente poca sal y/o alta temperatura, como las provistas por alrededor de 0.02 M a alrededor de 0.15 M de NaCI, a temperaturas aproximadas de 50°C a 70°C.
Dichas condiciones selectivas toleran, si acaso, poca desigualdad entre la sonda y la plantilla o el filamento de destino, y serían particularmente adecuadas para aislar los segmentos de ADN que codifican la proteína cristalina. La detección de segmentos de ADN mediante hibridación es bien conocida por los expertos en la técnica, y las enseñanzas de las patentes estadounidenses 4,965,188 y 5,176,995 (cada una de las cuales queda incorporada aquí mediante la referencia) son ejemplares de los métodos de análisis por hibridación. Las enseñanzas, tales como las que se encuentran en los textos de Maloy y coautores, 1994, Segal, 1976, Prokp, 1991 y Kuby, 1994, son particularmente relevantes. Por supuesto, para algunas aplicaciones, por ejemplo, cuando se desea preparar mutantes que emplean un filamento sensibilizador mutante, hibridado a una plantilla subyacente, o cuando se busca aislar secuencias codificadoras de proteína cristalina de especies relacionadas, típicamente serán necesarios equivalentes funcionales o similares y condiciones de hibridación menos estrictas, a fin de permitir la formación del heterodúplex. En estas circunstancias, puede ser conveniente emplear condiciones como alrededor de 0.15M a alrededor de 0.9 M de sal, a temperaturas que van desde alrededor de °C a alrededor de 55°C. Las especies de hibridación cruzada pueden ser identificadas fácilmente como señales de hibridación positiva con respecto al control de las hibridaciones. En todo caso, generalmente se aprecia que se pueden hacer más estrictas las condiciones mediante la adición de cantidades crecientes de formamida, lo que sirve para desestabilizar el dúplex híbrido, así como para incrementar la temperatura. Así pues, se puede manipular fácilmente las condiciones de hibridación y, de tal manera, generalmente habrá un método de selección que depende de los resultados deseados. En ciertas modalidades será ventajoso emplear secuencias de ácido nucleico de la presente invención en combinación con un medio apropiado, tal como una etiqueta, para determinar la hibridación. Se conoce en la técnica una gran variedad de medios indicadores apropiados, que incluyen ligandos fluorescentes, radiactivos, enzimáticos u otros ligandos, tales como avidina/biotina, que son capaces de dar una señal detectable. En las modalidades preferidas, puede ser conveniente emplear una etiqueta fluorescente o una etiqueta de enzima, tal como ureasa, fosfatasa alcalina o peroxidasa, en lugar de los reactivos radiactivos u otros reactivos ambientalmente indeseables. En el caso de las etiquetas de enzima, se sabe que se puede utilizar substratos indicadores colorimétricos para proveer un medio visible al ojo humano o espectrofotométricamente, para identificar la hibridación específica, con muestras que contienen ácido nucleico complementarias. En general, está contemplado que las sondas de hibridación descritas aquí serán útiles tanto como reactivos en hibridación en solución como con modalidades que emplean una fase sólida. En las modalidades que implican una fase sólida, se adsorbe el ADN de prueba (o el ARN) o se fija de otra manera a una matriz seleccionada o una superficie seleccionada. Este ácido nucleico fijado, de un solo filamento, es sometido entonces a hibridación específica con sondas seleccionadas bajo condiciones deseadas. Las condiciones seleccionadas dependerán de las circunstancias particulares, basadas en criterios particulares requeridos (dependiendo, por ejemplo, del contenido de G+C, el tipo de ácido nucleico de destino, la fuente del ácido nucleico, el tamaño de la sonda de hibridación, etc.). Después de lavar la superficie hibridada, a fin de eliminar las moléculas de sonda no unidas específicamente, se detecta la hibridación específica, o incluso se cuantifica, por medio de la etiqueta. 4.8.- CARACTERÍSTICAS DE LAS PROTEÍNAS CrvIC* La presente invención provee polipéptidos novedosos que definen la totalidad o una porción de una proteína cristalina Cry1C-R180A, CrylC- R148A, Cry1C-R148D, Cry1 C-R148L, Cry1C-R148M, Cry1-C-R148G, Cry1C563, Cry1C499 o Cry1 C579, de ß. thuringiensis. En una modalidad preferida, la invención describe y reivindica una proteína Cry1 C-R148A purificada. La proteína Cry1 C-R148A comprende una secuencia de 1189 aminoácidos, que está dada en SEQ ID NO: 2. En una segunda modalidad, la invención describe y reivindica una proteína Cry1C-R148D. La proteína Cry1C-R148D comprende una secuencia de 1189 aminoácidos, que está dada en SEQ ID NO: 4. En una tercera modalidad, la invención describe y reivindica una proteína Cry1C-R180A. La proteína Cry1C-R180A comprende una secuencia de 1189 aminoácidos, que está dada en SEQ ID NO: 6. En una cuarta modalidad, la invención describe y reivindica una proteína Cry1C563. La proteína Cry1C563 comprende una secuencia de 1189 aminoácidos, que está dada en SEQ ID NO: 8. En una quinta modalidad, la invención describe y reivindica una proteína CrylC.579. La proteína Cryl C.579 comprende una secuencia de 1189 aminoácidos, que está dada en SEQ ID NO: 10. En una sexta modalidad, la invención describe y reivindica una proteína Cry1C499. La proteína Cry1 C499 comprende una secuencia de 1189 aminoácidos, que está dada en SEQ ID NO: 12. 4.9.- NOMENCLATURA DE LAS PROTEÍNAS CRY* Los inventores han asignado arbitrariamente las designaciones Cry1C-R148A, Cry1 C-R148D, Cry1 C-R148L, Cry1C-R148M, Cry1C-148G, Cry1 C-r180A, Cryl C.563, Cryl C.579 y Cryl C.499, a las proteínas novedosas de la presente invención. De igual manera, se ha asignado las designaciones arbitrarias: cry1C-R148A, cry1C-R148D, cry1C-148L, cry1C-R148M, crylC-R148G, cry1C-R180A, cryl C.563, cry1C379 y CrylC.499 a las secuencias de ácido nucleico novedosas, que codifican estos polipéptidos, respectivamente. Si bien se puede hacer la asignación formal de las designaciones de gene y de proteína, basadas en la nomenclatura revisada de las endotoxinas de proteína cristalina (cuadro 1 ) por ei Comité sobre la nomenclatura de B. thuringiensis cualesquiera re-designaciones de las composiciones de la presente invención también están contempladas totalmente dentro del alcance de la descripción presente. 4.10.- CÉLULAS ANFITRIÓN AS TRANSFORMADAS Y PLANTAS TRANSGENICAS También se contempla una bacteria, una célula de levadura o una célula de planta, o una planta transformada con un vector de expresión de la presente invención. También se contempla una bacteria transgénica, una célula de levadura, una célula vegetal o una planta derivada de dicha célula transformada o transgénica. Los medios para transformar bacterias y células de levadura son bien conocidos en la técnica. Típicamente, los medios de transformación son similares a los medios bien conocidos usados para transformar otras bacterias o levaduras, tales como E. coli o Saccharomyces cerevisiae. Los métodos para la transformación de ADN de las células vegetales incluyen transformaciones de planta mediadas por Agrobacterium, transformación de protoplasto, transferencia de gene al polen, inyección en los órganos reproductores, inyección en embriones inmaduros y bombardeo con partículas. Cada uno de estos métodos tiene distintas ventajas y desventajas. Así, un método particular para introducir los genes en una cepa de planta particular, no necesariamente puede ser el más efectivo para otra cepa de planta, pero es bien sabido qué métodos son útiles para una cepa de plantas en particular. Hay muchos métodos para introducir segmentos de ADN transformadores en células, pero no todos son adecuados para suministrar ADN a células de plantas. Se cree que los métodos adecuados incluyen virtualmente cualquier método mediante el cual se puede introducir ADN en una célula, tal como mediante infección con Agrobacterium, suministro directo de ADN, tal como, por ejemplo, mediante transformación de protoplastos mediada por PEG (Omirulleh y coautores, 1993), mediante absorción de ADN mediada por desecación/inhibición, mediante electroporación, por agitación con fibras de carburo de silicio, por aceleración de partículas revestidas con ADN, etc. En ciertas modalidades, se prefiere los métodos de aceleración e incluyen, por ejemplo, bombardeo con microproyectiles y similares. La tecnología para la introducción de ADN en células es bien conocida por los expertos en la materia. Se ha descrito cuatro métodos generales para suministrar un gene en células: (1 ) métodos químicos (Graham y van de Eb, 1973; Zatloukal y coautores, 1992); (2) métodos físicos, como microinyección (Capecchi, 1980), electroporación (Wong y Neumann, 1982; From y coautores, 1985) y el cañón de genes (Johnston y Tang, 1994; Fynan y coautores, 1993); (3) vectores virales (Clapp, 1993; Lu y coautores, 1993; Eglitis y Anderson, 1988a; 1988b); y (4) mecanismos mediados por receptor (Curiel y coautores, 1991 ; 1992; Wagner y coautores, 1992). 4.10.1 ELECTROPORACION La aplicación de pulsos eléctricos breves, de alto voltaje, a una variedad de células animales y vegetales, conduce a la formación de poros de tamaño de nanómetros, en la membrana de plasma. Se toma directamente el ADN en el citoplasma de células, ya sea a través de estos poros o como consecuencia de la redistribución de los componentes de membrana que acompaña al cierre de los poros. La electroporación puede ser extremadamente eficiente y puede ser usada tanto para la expresión transitoria de genes de clones, como para el establecimiento de líneas de células que llevan copias integradas del gene de interés. La electroporacion, en contraste con la transfección mediada por fosfato de calcio y fusión de protoplasto, frecuentemente da lugar a líneas de células que llevan una, o a lo sumo unas cuantas, copias del ADN ajeno. La introducción de ADN por medio de electroporación es bien conocida por los expertos en la materia. En este método, ciertas enzimas que degradan la pared de la célula, tal como las enzimas que degrada la pectina, son empleadas para hacer las células receptoras de destina más susceptibles a la transformación por electroporación, que las células sin tratar. Alternativamente, las células receptoras son vueltas más susceptibles a la transformación mediante vulneración mecánica. Para efectuar la transformación mediante electroporación, se puede emplear tejidos friables, como un cultivo en suspensión de células o callo embriógeno o, alternativamente, se puede transformar los embriones inmaduros u otros tejidos organizados, directamente. Se podría degradar parcialmente las paredes de célula de las células seleccionadas, exponiéndolas a enzimas degradadoras de pectina (pectoliasas) o lacerando mecánicamente de manera controlada. Dichas células serán entonces receptoras para la transferencia de ADN por electroporación, que se puede efectuar en esta etapa, y luego se identifica las células transformadas mediante una selección adecuada o un protocolo de selección que depende de la naturaleza del ADN recién incorporado. 4.10.2.- EL BOMBARDEO CON MICRO PARTÍCULAS Otro método ventajoso para suministrar segmentos de ADN transformador a células vegetales es el bombardeo con microproyectiles. En este método se puede revestir partículas con ácidos nucleicos y suministrarlas a células mediante una fuerza propulsora. Las partículas ejemplares incluyen las que consisten de tungsteno, oro, platino y similares. Una ventaja del bombardeo con microproyectiles, además de ser un medio efectivo para transformar establemente de manera reproducible los monocotiledones, es que no se necesita ni el aislamiento de los protoplastos (Cristou y coautores, 1988) ni la susceptibilidad a la infección por Agrobacterium. Una modalidad de un método para suministrar ADN en células de maíz, mediante aceleración, es un sistema de suministro de partículas biolíticas, que se puede usar para impulsar partículas revestidas con ADN o células a través de un tamiz, tal como un tamiz de acero inoxidable o Nytex, sobre una superficie de filtro cubierta con células de maíz cultivadas en suspensión. El tamiz dispersa las partículas de manera que no son suministradas a las células receptoras en agregados grandes. Se cree que un tamiz que se intercala entre el aparato proyector y las células que van a ser bombardeadas, reduce el tamaño del agregado de proyectil y puede contribuir a una frecuencia de transformación mayor, al reducir el daño infligido a las células receptoras por proyectiles que sean demasiado grandes.
Para el bombardeo, las células en suspensión de preferencia son concentradas en filtros o en un medio de cultivo sólido. Alternativamente, los embriones inmaduros u otras células de destino pueden disponerse en un medio de cultivo sólido. Las células que van a ser bombardeadas son dispuestas a una distancia apropiada por debajo de la placa detenedora de macroproyectiles. Si se desea, se puede colocar uno o más tamices entre el dispositivo de aceleración y las células que van a ser bombardeadas. Mediante el uso de técnicas señaladas aquí, se puede obtener hasta 1000 o más focos de células que expresan transitoriamente un gene marcador. El número de células en un foco que expresa el producto de gene exógeno, 48 horas después del bombardeo, frecuentemente varía de 1 a 10, y promedia de 1 a 3. En la transformación por bombardeo, se puede elevar al óptimo las condiciones de cultivo previas al bombardeo, y los parámetros de bombardeo, para producir los números máximos de transformantes estables. Tanto los parámetros físicos como los biológicos para ei bombardeo son importantes en esta tecnología. Los factores físicos son aquellos que implican manipular el ADN/precipitado de microproyectil, o los que afectan el vuelo y la velocidad de los macroproyectiles o de los microproyectiles. Los factores biológicos incluyen todos los pasos involucrados en la manipulación de las células antes de e inmediatamente después del bombardeo, el ajuste osmótico de las células de blanco para ayudar a aliviar el trauma asociado con el bombardeo y también la naturaleza del ADN transformador, tal como el ADN linealizado o los plásmidos superenrollados intactos. Se cree que las manipulaciones previas al bombardeo son especialmente importantes para la transformación exitosa de embriones inmaduros. Consecuentemente, está contemplado que se puede desear el ajuste de diversos parámetros de bombardeo en estudios a baja escala, para elevar totalmente al óptimo las condiciones. Se puede desear particularmente ajustar los parámetros físicos, como la distancia de intersticio, la distancia de vuelo, la distancia de tejido y la presión de helio. Se puede reducir al mínimo también los factores de reducción de trauma (TRF, acrónimo por su designación en inglés: Trauma Reduction Factor), modificando las condiciones que influyen en el estado fisiológico de las células receptoras y que, por lo tanto, pueden influir en las eficiencias de transformación e integración. Por ejemplo, el estado osmótico, la hidratación del tejido y la etapa de subcultivo o el ciclo de célula de las células receptoras, pueden ser ajustados para la transformación óptima. La ejecución de otros ajustes de rutina es conocida por los expertos en la técnica, a la luz de la presente descripción. 4.10.3.- LA TRANSFERENCIA MEDIADA POR AGROBACTERIUM La transferencia mediada por Agrobacterium es un sistema ampliamente aplicable para introducir genes en las células vegetales, debido a que el ADN puede ser introducido en tejidos de vegetales enteros, derivando de esa manera la necesidad de regeneración de una planta intacta a partir de un protoplasto. El uso de vectores integradores vegetales, mediados por Agrobacterium, para introducir el ADN en células vegetales, es bien conocido en la técnica. Véase, por ejemplo, los métodos descritos (Fraley y coautores, 1985; Rogers y coautores, 1987). Adicionalmente, la integración del Ti-ADN es un proceso relativamente preciso que da por resultado pocos reacomodos La región de ADN que se va a transferir está definida por las secuencias limítrofes y habitualmente se inserta el ADN de intercalación e? la genoma vegetal, como se describió (Spielmann y coautores, 1986; Jorgensen y coautores, 1987). Los modernos vectores de transformación de Agrobacterium son capaces de reproducirse en E. coli, así como en Agrobacterium, lo que permite las manipulaciones convenientes que están descritas (Klee y coautores, 1985). Además, los recientes avances tecnológicos en vectores para la transferencia de genes mediada por Agrobacterium ha mejorado la disposición de los genes y los sitios de restricción en los vectores, para facilitar la construcción de vectores capaces de expresar diversos genes codificadores de polipéptido. Los vectores descritos (Rogers y coautores, 1987) tienen regiones de multi-enlazador convenientes, flanqueadas por un promotor y un sitio de poliadenilación para la expresión directa de genes codificadores de polipéptido insertados, y son adecuados para los propósitos de la presentes. Adicionalmente, se puede usar para la transformación Agrobacterium que contiene tanto genes Ti armados como desarmados. En esas cepas vegetales, en las que es eficiente la transformación mediada por Agrobacterium, es el método seleccionado, debido a la naturaleza fácil y definida de la transferencia de gene.
La transformación, mediada por Agrobacterium, de discos de hoja y otros tejidos, como cotiledones e hipocotiles, parece estar limitada a plantas que infestan naturalmente los organismos Agrobacterium. La transformación mediada por Agrobacterium es muy eficiente en las plantas dicotiledóneas. Pocas monocotiledóneas parecen ser anfitriones naturales para Agrobacterium, si bien ias plantas transgénicas han sido producidas en espárragos, utilizando vectores de Agrobacterium como los descritos /Bytebier y coautores, 1987). Por consiguiente, los granos de cereal comercialmente importantes, tales como arroz, maíz y trigo, habitualmente deben ser transformados utilizando métodos alternativos. Sin embargo, como se mencionó con anterioridad, la transformación de espárragos usando Agrobacterium también puede ser lograda (véase, por ejemplo, Bytebier y coautores, 1987). Una planta transgénica, formada utilizando métodos de transformación con Agrobacterium contiene típicamente un solo gene en un cromosoma. Las plantas transgénicas pueden denominarse heterozigóticas por el gene añadido. Sin embargo, dado que el uso de la palagra "heterozigoto" habitualmente implica la presencia de un gene complementario en el mismo lugar del segundo cromosoma de un par de cromosomas, y que no existe dicho gene en una planta que contiene un gene adicional, como aquí, se cree que es más preciso nombrar a dicha planta como un segregante independiente, debido a que el gene exógeno añadido se segrega independientemente durante la mitosis y la meiosis.
Se prefiere más una planta transgénica que sea homozigótica por el gene estructural añadido, es decir, una planta transgénica que contiene dos genes añadidos: un gene en el mismo lugar en cada cromosoma de un par de cromosomas. Se puede obtener una planta transgénica homozigótica acoplando sexualmente (de manera independiente) una planta transgénica segregante independiente que contiene un solo gene añadido, germinando algunas de las semillas producidas y analizando las plantas resultantes producidas en cuanto a la actividad incrementada de carboxilasa, con respecto a un control (natural, no transgénico) o una planta transgénica segregante, independiente. Se debe entender que también se puede acoplar dos plantas transgénicas diferentes para producir productos que contienen dos genes exógenos adicionales, que segregan independientemente. El cultivo independiente de la progenie apropiada puede producir plantas que sean homozigóticas para ambos genes exógenos adicionales, que codifican un polipéptido de interés. El retrocruce con una planta antecesora y el cruce exógeno con una planta no transgénica también están contemplados. La transformación de los protoplastos de planta se puede lograr utilizando métodos basados en la precipitación de fosfato de calcio, tratamiento con polietilenglicol, electroporación y combinaciones de esos tratamientos (véase, por ejemplo, Potrykus y coautores, 1985; Lorz y coautores, 1985; Fromm y coautores, 1985; Uchimiya y coautores, 1986; Callis y coautores, 1987; Marcotte y coautores, 1988).
La aplicación de estos sistemas a diferentes cepas de plantas depende de la capacidad para regenerar esa cepa de planta particular a partir de protoplastos. Los métodos ilustrativos para la regeneración de cereales a partir de protoplastos están descritos (Fujimura y coautores, 1985; Toriyama y coautores, 1986; Yamada y coautores, 1986; Abdullah y coautores, 1986). Para transformar cepas de planta que no pueden ser regeneradas satisfactoriamente a partir de protoplastos, se puede utilizar otras maneras de introducir ADN en células o tejidos intactos. Por ejemplo, la regeneración de cereales a partir de embriones inmaduros o explantes se puede efectuar como se describió (Vasil, 1988). Además, se puede utilizar el "cañón de partículas" o la tecnología de microproyectiles de alta velocidad (Vasil, 1992). Utilizando esta última tecnología, se lleva el ADN a través de la pared de la célula y hacia el citoplasma, sobre la superficie de partículas metálicas pequeñas, como se describió (Klein y coautores, 1987; Klein y coautores, 1988; McCabe y coautores, 1988). Las partículas metálicas penetran a través de varias capas de células y, de tal manera, permiten la transformación de células dentro de los explantes de tejido. 4.10.4.- EXPRESIÓN DE GENE EN PLANTAS Debido al hecho de que el uso del codón de planta se parezca más cercanamente al de los humanos y otros organismos superiores que a los organismos unicelulares, tales como las bacterias, los genes bacterianos sin modificar frecuentemente son expresados deficientemente en células de plantas transgénicas. La preferencia general aparente para el contenido de GC en la posición 3 del codón, ha sido descrita detalladamente por Murray y coautores (1990). Los 207 genes de planta descritos en ese trabajo permiten la compilación de las preferencias del codón por los aminoácidos presentes en las plantas. Esos autores describen la diferencia entre el uso del codón en las monocotiledóneas y en las dicotiledóneas, así como las diferencias entre los genes codificados en cloroplasto y aquellos que están codificados en el núcleo. Utilizando las tablas de frecuencia de codón provistas, los expertos en la técnica pueden diseñar por ingeniería dicha secuencia bacteriana para expresión en plantas, modificando las secuencias de ADN para proveer una desviación de codón para G o C en la tercera posición. La referencia provee una lista exhaustiva de tablas para guiar a los geneticistas moleculares en la preparación de secuencias de gene sintéticas que codifican los polipéptidos de la invención, y que son expresados en células vegetales transformadas de una manera adecuada para permitir la síntesis del polipéptido de interés en la planta. Un trabajo similar de Diehn y coautores (1996) detalla la modificación de las secuencias de gene derivadas de procarióticos, necesarias para permitir la expresión en las plantas. lannacone y coautores (1997) describen la transformación de la planta huevo con un gene de B. thuringiensis manipulado genéticamente por ingeniería, que codifica una endotoxina de la clase cry3. Utilizando secuencias que evitan las secuencias de poliadenilación, las secuencias ATTA y los sitios de empalme, se construyó un gene sintético que permitía la expresión de la toxina codificada in planta. La expresión de las proteínas heterólogas en tabaco transgénico ha sido descrita por Rouwendal y coautores (1997). Utilizando un gene sintético, se creó la desviación para C+G del codón en la tercera posición, para permitir la expresión del gene codificador de proteína fluorescente, verde aguamarina in planta. Fütterer y Hohn (1996) describen los efectos de la secuencia de mARN, las secuencias delanteras, los mensajes policistrónicos y el motivo interno del sitio de unión ribosómico, sobre la expresión en las plantas. La modificación de dichas secuencias, mediante la construcción de genes sintéticos, permitió la expresión de los mARN virales en células de plantas transgénicas. La preparación de plantas transgénicas que expresan genes que codifican proteínas no naturales (como proteínas cristalinas de P. thuringiensis) se está volviendo un paso crítico en la formulación de variedades de plantas que expresan genes de resistencia a ios insectos. En los últimos años la investigación considerable ha producido herramientas para la manipulación de genes codificadores de endotoxina, para permitir la expresión de sus proteínas codificadas in planta. Los científicos han demostrado que mantener un nivel significativo de una especie de mARN en una planta, frecuentemente es un factor crítico. Desafortunadamente, las causas de bajos niveles en estado sostenido, de proteínas extrañas que codifican mARN, son muchas. Primero, puede no ocurrir la síntesis de ARN de longitud completa, a una frecuencia elevada. Esto, por ejemplo, podría ser causado por la terminación prematura del ARN durante la transcripción, o debido a procesamiento inesperado del mARN durante la transcripción. En segundo lugar, se puede producir ARN de longitud completa en la célula de la planta, pero luego puede ser procesado (empalmado, con adición de poliA) en el núcleo, de una manera que cree un mARN no funcional. Si no se sintetiza apropiadamente el ARN, se termina y se poliadenila, no se puede mover al citoplasma para la translación. De manera similar, en el citoplasma, si los mARN tienen vidas medias reducidas (que son determinadas por su secuencia primaria o secundaria) se producirá insuficiente producto proteínico. Además, hay un efecto cuya magnitud es incierta, de la eficiencia de translación sobre la vida media del mARN. Adicionalmente, cada molécula de ARN se pliega a una estructura particular, o quizás una familia de estructuras, que es determinada por su secuencia. La estructura particular de cualquier ARN podría conducir a mayor o menor estabilidad en el citoplasma. La estructura per se probablemente también es una determinante del procesamiento de mARN en el núcleo. Desafortunadamente es imposible predecir, y casi imposible determinar, la estructura de cualquier ARN (excepto por el Tarn) in vitro o in vivo. Sin embargo, es probable que cambiar dramáticamente la secuencia del ARN tenga un efecto grande sobre su estructura plegada. Es probable que la estructura per se o aspectos particulares de la estructura, también tengan un papel en la determinación de la estabilidad del ARN. Para resolver esas limitaciones en la expresión de gene ajeno o extraño, los investigadores han identificado secuencias particulares y señales particulares en los ARN que tienen el potencial para tener un efecto específico sobre la estabilidad del ARN. En ciertas modalidades de la invención, por lo tanto, hay el deseo de elevar al óptimo la expresión de los segmentos descritos de ácido nucleico, in planta. Un método particular para hacerlo es mediante alteración del gene bacteriano para eliminar las secuencias o motivos que disminuyen la expresión en una célula de planta transformada. El proceso de ingeniería para una secuencia codificadora para la expresión óptima ¡n planta frecuentemente se denomina "plantificar" una secuencia de ADN. Las secuencias particularmente problemáticas son aquellas que son ricas en A+T. Desafortunadamente, puesto que B. thuringiensis tiene una genoma rica en A+T, las secuencias de gene de proteína cristalina natural frecuentemente deben ser modificadas para la expresión óptima en una planta. El motivo de secuencia ATTTA (o AUUUA, que también aparece en el ARN) ha estado implicado como una secuencia desestabilizadora en el mARN de células de mamíferos (Shaw y Kamen, 1986). Muchos mARN de corta vida tienen regiones 3' no trasladadas, ricas en A+T, y esas regiones frecuentemente tienen la secuencia ATTTA, algunas veces presente en copias múltiples o como multímeros (por ejemplo A l I I ATTTA...). Shaw y Kamen mostraron que la transferencia del extremo 3' de un mARN inestable a ARN estable (globina o VA1 ) disminuía dramáticamente la vida media del ARN. Mostraron adicionalmente que un pentámero de ATTTA tenía un efecto desestabilizador profundo sobre un mensaje estable, y que esta señal podría ejercer su efecto si estuviese ubicada en el extremo 3' o dentro de la secuencia codificadora. Sin embargo, el número de secuencias ATTTA y/o el contexto de la secuencia en que ocurren, también parecen ser importantes ai determinar si funcionan como secuencias desestabilizadoras. Shw y Kamen mostraron que un trímero de ATTTA tenía mucho menos efecto que un pentámero sobre la estabilidad del mARN, y que un dímero o un monómero no tenían efecto sobre la estabilidad (Shaw y Kamen, 1987). Nótese que los multímeros de ATTTA, como un pentámero, automáticamente crean una región rica en A+T. Se demostró que esto era un efecto citoplásmico, no nuclear. En otros mARN inestables, la secuencia ATTTA puede estar presente solamente en una copia, pero frecuentemente está contenida en una región rica en A+T. De un dato a otro procedentes de células animales, parece que ATTTA, por lo menos en algunos contextos, es importante en estabilidad, pero todavía no es posible predecir qué ocurrencias de ATTTA son elementos desestabilizadores, o si cualquiera de esos efectos es probable que se vea en plantas. Algunos estudios sobre la degradación del mARN en células animales también indican que la degradación del ARN puede comenzar, en algunos casos, con ataque nucleolítico en las regiones ricas en A+T. No está claro si estas divisiones ocurren en las secuencias ATTTA. También hay ejemplos de mARN que tienen estabilidad diferencial, dependiendo del tipo de célula en la que se expresan o de la etapa dentro del ciclo de la célula, en la que se expresan. Por ejemplo, los mARN de histona son estables durante la síntesis del ADN, pero inestables si se interrumpe la síntesis del ADN. El extremo 3' de algunos mARN de histona parece ser el responsable de ese efecto (Pandey y Marzluff, 1987). No parece estar mediado por ATTTA, ni tampoco está claro que controle la estabilidad diferencial de este mARN. Otro ejemplo es la estabilidad diferencial del mARN de IgG en los linfocitos B, durante la maduración de la célula B (Genovese y Milcarek, 1988). Un ejemplo final es la inestabilidad de un mARN de globina beta-talesémico mutante. En las células de médula ósea, donde normalmente se expresa este gene, el mARN mutante es inestable, mientras que el mARN de tipo silvestre es estable. Cuando se expresa el gene mutante en HeLa o en células L in vitro, el mARN mutante no muestra inestabilidad (Lim y coautores, 1992). Estos ejemplos proveen todos evidencia de que la estabilidad del mARN puede ser mediada por factores específicos para el tipo de célula o para el ciclo de la célula. Adicionalmente, este tipo de inestabilidad todavía no está asociado con secuencias específicas. Dadas estas ¡ncertidumbres, no es posible predecir qué ARN son probablemente inestables en una célula dada. Además, aun el motivo ATTA puede actuar diferencialmente, dependiendo de la naturaleza de la célula en la que está presente el ARN. Shaw y Kamen (1987) han informado que la activación de la proteína quinasa C puede bloquear la degradación mediada por ATTTA. Además de una sarta de poliadenilato para el extremo 3', es común para la mayoría de los mARN eucarióticos, tanto vegetales como animales.. El punto de vista actualmente aceptado de adición de poliA es que el transcripto naciente se extiende más allá del extremo 3' maduro. Están contenidas dentro de este transcripto señales para la poliadenilación y la formación apropiada del extremo 3'. Este procesamiento en el extremo 3' implica la división del mARN y la adición de poiiA al extremo 3' maduro. Buscando las secuencias de consenso cerca del tracto poli A en los mARN vegetal y animal, ha sido posible identificar secuencias de consenso que aparentemente están involucradas en la adición de poliA y en la división del extremo 3'. Las mismas secuencias de consenso parecen ser importantes para ambos procesos. Estas señales son típicamente una variación de la secuencia AATAAA. En células animales, algunas variantes de esta secuencia, que son funcionales, han sido identificadas; en las células vegetales, parece haber un rango extendido de secuencias funcionales (Wickens y Stephenson, 1984: Dean y coautores, 1986). Debido a que todas estas secuencias de consenso son variaciones de AATAAA, todas son secuencias ricas en A+T. Esta secuencia se encuentra típicamente 15 a 20 pb antes del tracto poliA en un mARN maduro. Los estudios en células animales indican que esta secuencia está implicada tanto en la adición de poliA como en la maduración de 3'. Las mutaciones dirigidas al sitio, en esta secuencia, pueden alterar estas funciones (Conway y Wickens, 1988; Wickens y coautores, 1987). Sin embargo, también se ha observado que también se requiere secuencias hasta de 50 a 100 pb 3' con respecto a la señal de poliA putativa; es decir, un gene que tiene un AATAAA normal, pero que ha sido reemplazado o alterado corriente abajo, no queda apropiadamente poliadeniiado (Gil y Proudfoot, 1984; Sadofsky y Alwine, 1984; McDevin y coautores, 1985). Es decir, la propia señal de poliA no es suficiente para el procesamiento completo y apropiado.
Tampoco se sabe que se necesite de secuencias específicas corriente abajo, además de la señal de poliA, o de que haya una secuencia específica que tenga esta función. Por lo tanto, el análisis de secuencia solamente puede identificar las señales de poliA potenciales. En los mARN que ocurren naturalmente que están normalmente poliadeniladas, se ha observado que la alteración del proceso, ya sea al alterar la señal de poliA u otras secuencias en el mARN, puede tener profundos efectos en el nivel del mARN funcional. Esto se ha observado en los mARN que ocurren naturalmente, con resultados que son hasta ahora específicos para el gene. Se ha demostrado que en los mARN naturales, es importante la poliadenilación apropiada en la acumulación de mARN, y que la alteración de este proceso puede afectar significativamente los niveles de mARN. Sin embargo, hay insuficiente conocimiento como para predecir el efecto de los cambios en un gene normal. En un gene heterólogo es todavía más difícil predecir las consecuencias. Sin embargo, es posible que los sitios putativos identificados sean disfuncionales. Es decir, esos sitios pueden no actuar como sitios de poliA apropiados, sino más bien funcionar como sitios aberrantes que dan lugar a mARN inestables. En sistemas celulares animales, AATAAA es, con mucho, la señal muy común identificada en los mARN, corriente arriba de la poliA, pero por lo menos se ha encontrado cuatro variantes (Wickens y Stephenson, 1984). En las plantas no se ha efectuado mucho análisis, pero está claro que se puede usar secuencias múltiples similares a AATAAA. Los sitios de planta en el cuadro 4, denominados mayores o menores, se refieren únicamente al estudio de Dean y coautores (1986), que analizaron solamente tres tipos de genes de planta. La designación de sitios de poliadenilación como mayores o menores únicamente se refiere a la frecuencia de su ocurrencia como sitios funcionales, en genes que ocurren en la naturaleza, que habían sido analizados. En el caso de las plantas, ésta es una base de datos muy limitada. Es difícil predecir con alguna certeza que un sitio designado mayor o menor sea más o menos probablemente una función parcial o completamente, cuando se encuentra en un gene heterólogo, tai como los que codifican las proteínas cristalinas de la presente invención.
CUADRO 4 SITIOS DE POLIADENILACION EN GENES DE PLANTAS PA AATAAA Sit o de consenso mayor P1A AATAAT Sit o de planta mayor P2A AACCAA Sit o de planta menor P3A ATATAA Sit o de planta menor P4A AATCAA Siti o de planta menor P5A ATACTA Siti o de planta menor P6A ATAAAA Siti o de planta menor P7A ATGAAA Siti o de planta menor P8A AAGCAT Sitio de planta menor P9A ATTAAT Sitio de planta menor P10A ATACAT Sitio de planta menor P11A AAAATA Sitio de planta menor P12A ATTAAA Sitio animal menor P13A 1155AA Sitio animal menor P14A AATACA Sitio animal menor P15A CATAAA Sitio animal menor La presente invención provee un método para preparar genes sintéticos de planta; genes que expresan su producto de proteína a niveles significativamente más altos que los genes de tipo silvestre, que eran empleados comúnmente en la transformación de plantas, hasta ahora. En otro aspecto, la presente invención provee también genes sintéticos novedosos de plantas, que codifican dichas proteínas no vegetales. Como se describe más arriba, la expresión de genes de B. thuringiensis naturales en plantas, frecuentemente es problemática. La naturaleza de las secuencias codificadoras de los genes de B. thuringiensis los distingue de los genes vegetales, así como de otros muchos genes heterólogos expresados en plantas. En particular, los genes de B. thuringiensis son muy ricos (alrededor de 62%) en adenina (A) y timina (T), mientras que los genes vegetales y la mayoría de los demás genes bacterianos que han sido expresados en plantas, tienen aproximadamente de 45 a 55% de A+T.
Debido a ia degeneración del código genético y del número limitado de selecciones de codón para cualquier aminoácido, la mayoría del A+T "en exceso" de las secuencias codificadoras estructurales de algunas especies de Bacillus, se encuentra en la tercera posición de los codones. Es decir, los genes de algunas especies de Bacillus tienen A o T como el tercer nucleótido en muchos codones. Así, el contenido de A+T en parte puede determinar la tendencia al uso de codón. Además, es claro que los genes evolucionan para la máxima función en el organismo en el que se desarrollan. Esto significa que las secuencias de nucleótido particulares, encontradas en un gene procedente de un organismo, en donde pueden no jugar ningún papel, excepto codificar un tramo particular de aminoácidos, tienen el potencial de ser reconocidos como elementos de control de gene en otro organismo (como los promotores o terminadores de transcripción, sitios de adición de poliA, sitios de empalme de intrón o señales de degradación específica de mARN). Quizás es sorprendente que dichas señales mal interpretadas no sean un aspecto más común de la expresión de gene heterólogo; pero esto puede explicarse en parte por el contenido relativamente homogéneo de A+T (alrededor de 50%) en muchos organismos. Este contenido de A+T más la naturaleza del código genético, impone restricciones ciaras sobre la probabilidad de que ocurra alguna secuencia de oligonucleótido particular. Así, un gene de E. coli con un contenido de A+T de 50% es mucho menos probable que contenga cualquier segmento rico en A+T, particular, que un gene de B. thuringiensis.
Típicamente, para obtener expresión a alto nivel de los genes de S- endotoxina en plantas, la secuencia codificadora estructural existente ("gene estructural") que codifica la S-endotoxina, se modifica mediante la eliminación de secuencias de ATTTA y señales de poliadenilación putativas mediante mutagénesis dirigida al sitio del ADN que comprende el gene estructural. Es muy preferible que sustancialmente la totalidad de las señales de poliadenilación y de las secuencias de ATTTA sean eliminadas, si bien se observa niveles de expresión incrementados con sólo la eliminación parcial de cualquiera de las secuencias arriba identificadas. Alternativamente, si se prepara un gene sintético que codifique la expresión de la proteína de la presente, se selecciona codones que eviten la secuencia ATTA y las señales de poliadenilación putativas. Para fines de la presente invención, las señales de poliadenilación putativas incluyen, pero sin que necesariamente se limiten a ellas: AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT AAAATA, ATTAAA, AATTAA, AATACA, y CATAAA. Al reemplazar las secuencias de ATTTA y las señales de poliadenilación, se utiliza de preferencia codones que eviten los codones que se encuentran raramente en las genomas vegetales. Se explora la secuencia de ADN seleccionada para identificar regiones con más de cuatro nucleótidos de adenina (A) o de timina (T) consecutivos. Se explora las regiones A+T para buscar señales potenciales de poliadenilación en la planta. Si bien la ausencia de cinco o más nucleótidos A o T consecutivos elimina la mayoría de las señales de poliadenilación, si hay más de una señal de poliadenilación menor, dentro de los diez nucleótidos de separación uno de otro, entonces la secuencia de nucleótidos de esa región se altera de preferencia para eliminar esas señales, al mismo tiempo que se mantiene la secuencia de aminoácidos codificada, original. El segundo paso es considerar los alrededor de 15 a alrededor de , más o menos, residuos de nucleótido que rodean la región rica en A+T, identificada en el paso 1. Si el contenido de A+T de la región circundante es menor que 80%, se debe examinar la región en búsqueda de señales de poliadenilación. La alteración de la región con base en las señales de poliadenilación depende (1 ) del número de señales de poliadenilación presentes; y (2) de la presencia de una señal de poliadeniiación mayor en la planta. La región extendida es examinada en cuanto a la presencia de señales de poliadenilación de planta. Se elimina las señales de poliadenilación mediante mutagénesis dirigida al sitio, de la secuencia de ADN. La región extendida también es examinada en búsqueda de copias múltiples de la secuencia ATTTA, que también son eliminadas por mutagénesis. Se prefiere igualmente que las regiones que comprenden muchas bases A+T consecutivas, o muchas bases G+C, sean alteradas, puesto que se predice que esas regiones tendrán una mayor probabilidad de formar estructuras de horquilla, debido a su auto-complementariedad. Por consiguiente, la inserción de pares de bases heterogéneas reduciría la probabilidad de la formación auto-complementaria de una estructura secundaria, lo que se sabe que inhibe la transcripción y/o la translación en algunos organismos. En la mayoría de los casos, se puede reducir al mínimo los efectos adversos utilizando secuencias que no contengan más de cinco A+T o G+C consecutivos. 4.11.- MÉTODOS PARA PRODUCIR PLANTAS TRANSGÉNICAS RESISTENTES A LOS INSECTOS El transformar una célula anfitriona adecuada, tal como una célula vegetal, con un segmento que contiene el gene crylC* recombinante, la expresión de la proteína cristalina codificada (o sea, una proteína cristalina bacteriana o un polipéptido que tiene actividad insecticida contra lepidópteros) puede dar por resultado la formación de plantas resistentes a los insectos. A manera de ejemplo, se puede utilizar un vector de expresión que contiene una región codificadora para una proteína cristalina de B. thuringiensis y un marcador seleccionable apropiado para transformar una suspensión de células vegetales embriónicas, tales como células de trigo o de maíz, utilizando un método tal como bombardeo con partículas (Maddock y coautores, 1991 ; Vasil y coautores, 1992) para suministrar el ADN aplicado sobre microproyectiles, a las células receptoras. Luego se regenera las plantas transgénicas a partir de los callos embriónicos transformados, que expresan las proteínas insecticidas. También se puede lograr la formación de plantas transgénicas utilizando otros métodos de transformación de células, que son conocidos en la técnica, como la transferencia de ADN mediada por Agrobacterium (Fraley y coautores, 1983). Alternativamente, se puede introducir ADN en plantas por transferencia directa de ADN en el polen (Zhou y coautores, 1983; Hess, 1987; Luo y coautores, 1988), inyectando el ADN en los órganos reproductores de una planta (Peña y coautores, 1987) o por inyección directa de ADN en las células de embriones inmaduros, seguida por ia rehidratación de los embriones desecados (Neuhaus y coautores, 1987, Benbrook y coautores, 1986). La regeneración, el desarrollo y el cultivo de plantas a partir de transformantes de protoplasto de una sola planta, o de varios explantes transformados, son bien conocidos en la técnica (Weissbach y Weissbach, 1988). Esta regeneración y este proceso de desarrollo incluyen típicamente los pasos de seleccionar células transformadas, cultivar esas células individualizadas mediante las etapas habituales de desarrollo embriónico, hasta la etapa de plántulas enraizadas. Los embriones transgénicos y las semillas son regenerados de manera similar. Los brotes enraizados transgénicos resultantes son plantados posteriormente en un medio apropiado para el desarrollo de la planta, por ejemplo, en tierra. El desarrollo de las plantas de regeneración que contienen el gene exógeno ajeno, que codifica un polipéptido de interés introducido por Agrobacterium, procedente de explantes de hoja, se puede lograr mediante métodos bien conocidos en la técnica, tales como los descritos (Horsch y coautores, 1985). En este procedimiento se cultiva los transformantes en presencia de un agente de selección y en un medio que induce la regeneración de brotes en la cepa de planta que se está transformando, tal como se describe (Fraley y coautores, 1983). Este procedimiento produce típicamente brotes dentro de dos a cuatro meses, y estos brotes son transferidos entonces a un medio apropiado, inductor de raíz, que contiene el agente selectivo y un antibiótico para prevenir el desarrollo de bacterias. Los brotes que han enraizado en presencia del agente selectivo para formar plántulas, son trasplantados entonces a tierra u otros medios, para permitir la producción de raíces. Estos procedimientos pueden variar, dependiendo de la cepa de planta particular empleada; siendo bien conocidas en la técnica esas variaciones. De preferencia las plantas regeneradas son auto-polinizadas para proveer plantas transgénicas homozigóticas, como se discutió más atrás. De otra manera, se cruza ei polen obtenido de las plantas regeneradas con plantas desarrolladas de semillas agronómicamente importantes, de preferencia de líneas de cruzamiento interno. Inversamente, se utiliza polen de plantas de esas líneas importantes, para polinizar las plantas regeneradas. Una planta transgénica de la presente invención, que contiene un polipéptido deseado, es cultivada usando métodos bien conocidos por los expertos en la materia. Una planta transgénica de esta invención, de tal manera, tiene una cantidad incrementada de una región codificadora (por ejemplo, un gene crylC*) que codifica el polipéptido CrylC* de interés. Una planta transgénica preferida es un segregante independiente y puede transmitir el gene y su actividad a su progenie. Una planta transgénica más preferida es homozigótica para ese gene, y transmite el gene a la totalidad de su descendencia, por apareamiento sexual. La semilla de una planta transgénica puede ser desarrollada en el campo o en invernadero, y dar por resultado plantas transgénicas sexualmente maduras que se auto-polinizan para generar plantas de criadero verdadero. La progenie de esas plantas se vuelven líneas de crianza verdaderas, que son evaluadas, por ejemplo, en cuanto a su capacidad insecticida incrementada contra insectos lepidópteros, de preferencia en el campo, bajo una variedad de condiciones ambientales. Los inventores contemplan que la presente invención tendrá utilidad particular en la creación de plantas transgénicas de interés comercial, incluyendo diversos pastos de campo, trigo, maíz, arroz, cebada, avena, una variedad de plantas ornamentales y legumbres, así como numerosos árboles y plantas que dan nueces y frutos. 4.12.- MÉTODOS PARA PRODUCIR PROTEÍNAS CrvIC* QUE TIENEN MUTACIONES MÚLTIPLES Se puede construir mutantes CrylC que contienen sustituciones en múltiples regiones de rizo, mediante varias técnicas. Por ejemplo, se puede cambiar fácilmente las secuencias de genes sumamente relacionados, utilizando la técnica basada en RCP, descrita por Stemmer (1994). Alternativamente, si están disponibles sitios de restricción adecuados, se puede combinar las mutaciones de un gene crylC con las mutaciones de un segundo gene crylC, mediante metodologías de subclonación rutinarias. Si no está disponible un sitio de restricción adecuado, se puede generar por mutagénesis dirigida al oligonucleótido, utilizando cualquier cantidad de procedimientos conocidos por los expertos en la técnica. Alternativamente, la RCP de extensión por empalme-traslape (Horton y coautores, 1989) puede ser usada para combinar las mutaciones en diferentes regiones de rizo de CrylC. En este procedimiento se puede fijar fragmentos de ADN traslapantes, mediante RCP y que contienen diferentes mutaciones, dentro de sus secuencias únicas, y se los puede usar como plantilla para la amplificación, utilizando sensibilizadores flanqueadores para generar una secuencia de gene híbrido. Finalmente, se puede combinar los mutantes crylC mediante el simple uso de un mutante crylC como plantilla para la mutagénesis dirigida al oligonucleótido, utilizando cualquier cantidad de protocolos, como los descritos en la presente. 4.13.- LAS RIBOZIMAS Las ribozimas son moléculas de ARN enzimáticas que dividen especies particulares de mARN. En ciertas modalidades, los inventores contemplan la selección y utilización de ribozimas capaces de dividir los segmentos de ARN de la presente invención, y su uso para reducir la actividad de los mARN de blanco, en tipos de células o tejidos particulares. Se conoce en la actualidad seis variedades básicas de ARN enzimático que ocurren en la naturaleza. Cada una puede catalizar las ligaduras fosfodiéster del ARN in trans (y, de tal manera, pueden dividir otras moléculas de ARN) bajo condiciones fisiológicas. En general, los ácidos nucleicos enzimáticos actúan uniéndose primeramente a un ARN de destino. Dicha unión ocurre por medio de la porción de unión de destino de un ácido nucleico enzimático, que se mantiene muy próximo a una porción enzimática de la molécula, que actúa para dividir el ARN de destino. Así pues, el ácido nucleico enzimático reconoce primeramente el ARN de destino y luego se une a él, mediante formación de pares de bases complementarios y una vez unido al sitio correcto, actúa enzimáticamente para cortar el ARN de destino. La división estratégica de dicho ARN de destino destruirá su capacidad para dirigir la síntesis de una proteína codificada. Después que se ha unido un ácido nucleico enzimático y ha dividido su ARN de destino, es liberado del ARN para buscar otro blanco y poder unirse a nuevos blancos y dividirlos, repetidamente. La naturaleza enzimática de una ribozima es ventajosa con respecto a muchas tecnologías, tales como la tecnología de sentido opuesto (en la que una molécula de ácido nucleico simplemente se une a un destino de ácido nucleico para bloquear su translación), puesto que la concentración de ribozima necesaria para efectuar un tratamiento terapéutico es menor que la de un oligonucleótido de sentido opuesto. Esta ventaja refleja la capacidad de la ribozima para actuar enzimáticamente. Así pues, una sola molécula de ribozima es capaz de dividir muchas moléculas de ARN de destino. Adicionalmente, la ribozima es un inhibidor sumamente específico, dependiendo la especificidad de inhibición no únicamente del mecanismo de formación de pares de bases para la unión al ARN de blanco, sin también del mecanismo de división del ARN de blanco o destino. Las solas desigualdades o las sustituciones de bases, cerca del sitio de división, pueden eliminar por completo la actividad catalítica de una ribozima. Las desigualdades similares en las moléculas de sentido opuesto no previenen su acción (Woolf y coautores, 1992). Así pues, la especificidad de acción de una ribozima es mayor que la de un oligonucleótido de sentido opuesto que se una al mismo sitio de ARN. Se puede formar la molécula de ácido nucleico enzimático en un motivo de cabeza de martillo, horquilla, un delta-virus de hepatitis, un intrón de grupo l o un ARN de RMasaP (en asociación con una secuencia de guía de ARN) o ARN de neurospora VS. Los ejemplos de motivos de cabeza de martillo están descritos por Rossi y coautores (1992); los ejemplos de motivos de horquilla están descritos por Hampel y coautores (patente europea EP 0360257), Hampel y Tritz (1989), Hampel y coautores (1990) y Cech y coautores (patente US 5,631 ,359; un ejemplo de motivo de delta-virus de hepatitis está descrito por Perrotta y Been (1992); un ejemplo de motivo RNasa P está descrito por Guerrier-Takada y coautores (1983); un motivo de ribozima de ARN de neurospora VS está descrito por Collins (Saville y Collins, 1990, Saille y Collins, 1991; Collins y Olive, 1993); y un ejemplo del intrón del grupo I está descrito por Cech y coautores (patente US 4,987,071). Todo lo que es importante en una molécula de ácido nucleico enzimático de esta invención es que tenga un sitio de unión de substrato específico, que sea complementario con una o más de las regiones de ARN del gene de destino, y que tenga secuencias de nucleótido dentro de o que rodeen al sitio de unión de substrato, que imparte una actividad divisora de ARN a la molécula. Así pues, las construcciones de ribozima no necesitan estar limitadas a los motivos específicos aquí mencionados. La invención provee un método para producir una clase de agentes divisores enzimáticos que exhiben un grado elevado de especificidad para el ARN de un destino deseado. De preferencia selecciona como blanco la molécula de ácido nucleico enzimático a una región de secuencia sumamente conservada, de un mARN de destino, de tal manera que el tratamiento específico de una enfermedad o condición puede proveerse con uno o varios ácidos nucleicos enzimáticos. Dichas moléculas de ácido nucleico enzimático pueden ser suministradas exógenamente a células específicas, cuando se requiera. Alternativamente, se puede expresar las ribozimas a partir de vectores de ADN o ARN que son suministrados a células específicas. Los motivos pequeños de ácido nucleico enzimático (por ejemplo, de la estructura de cabeza de martillo o de horquilla), pueden ser usados para el suministro exógeno. La estructura simple de esas moléculas aumenta la capacidad del ácido nucleico enzimático para invadir regiones de destino de la estructura de mARN. Alternativamente, se puede expresar moléculas de ARN catalíticas dentro de células, a partir de promotores eucarióticos (por ejemplo, Scanlon y coautores, 1991 ; Kashani-Sabet y coautores, 1992; Dropulic y coautores, 1992; Weerasinghe y coautores, 1991 ; Ojwang y coautores, 1992; Chen y coautores, 1992; Sarver y coautores, 1990). Los expertos en la materia se darán cuenta de que se puede expresar cualquier ribozima en células eucarióticas, a partir del vector de ADN apropiado. La actividad de dichas ribozimas pueden aumentarse mediante su liberación del transcripto primario, mediante una segunda ribozima (Draper y coautores, publicación de la solicitud de patente internacional No. WO 93/23569, y Sullivan y coautores, publicación de la solicitud de patente internacional No. WO 94/02595, ambas incorporadas aquí en su totalidad mediante esta referencia; Ohkawa y coautores, 1992; Taira y coautores, 1991 ; Ventura y coautores, 1993). Las ribozimas pueden ser añadidas directamente, o se las puede formar a complejo con lípidos catiónicos, complejos lípidos, se las puede empacar dentro de liposomas o se las puede suministrar de otra manera a las células de destino o blanco. El ARN o los complejos de ARN pueden ser administrados localmente a tejidos relevantes ex vivo o in vivo, mediante inyección, inhalación de aerosol, bomba de infusión o venda tubular elástica, con o sin incorporación en biopolímeros. Se puede diseñar las ribozimas como se describió en Draper y coautores (publicación de la solicitud de patente internacional No. WO 93/23569) o Sullivan y coautores (publicación de la solicitud de patente internacional No. WO 94/02595) y sintetizarlas para ser probadas in vitro e in vivo, como se describe. Dichas ribozimas también pueden ser elevadas al óptimo para suministrarlas. Aunque se dan ejemplos específicos, quienes sean expertos en la materia reconocerán que se puede utilizar blancos de ARN equivalentes en otras especies, cuando sea necesario. Se puede analizar individualmente las ribozimas de cabeza de martillo o de horquilla mediante plegamiento en computadora (Jaeger y coautores, 1989) para determinar si las secuencias de ribozima se pliegan a su estructura secundaria apropiada. Aquellas ribozimas que tienen interacciones intramoleculares desfavorables entre los brazos de unión y el núcleo catalítico, son eliminadas de la consideración. Se puede seleccionar las longitudes variables del brazo de unión para elevar al óptimo la actividad. En general, por lo menos 5 bases en cada brazo son capaces de unirse a, o interactuar de otra manera con, el ARN de destino. Se puede diseñar las ribozimas del motivo de cabeza de martillo o de horquilla para fijarse a varios sitios en el mensaje de mARN, y se las puede sintetizar químicamente. El método de síntesis usado sigue el procedimiento para la síntesis normal de ARN, como lo describió Usman y coautores (1987), y Scaringe y coautores (1990), y utiliza grupos protectores y acopladores comunes para el ácido nucleico, como dimetoxitritilo en el extremo 5' y fosforamiditas en el extremo 3'. Los rendimientos del acoplamiento por pasos promedio típicamente son de más de 98%. Se puede sintetizar las ribozimas de horquilla en dos partes y se las puede fijar para reconstruir una ribozima activa (Chowrira y Burke, 1992). Se puede modificar extensamente las ribozimas para incrementar la estabilidad, mediante modificación con grupos resistentes a la nucleasa, por ejemplo, 2'-amino, 2'-C-alilo, 2'-fluoro, 2'-o-metilo, 2'-H (para un resumen, véase Usman y Cedergren, 1992). Se puede purificar las ribozimas mediante electroforesis en gel, utilizando métodos generales, o por cromatografía en líquido a alta presión, y suspensión de nuevo en agua.
Se puede elevar al óptimo la actividad de la ribozima alterando la longitud de los brazos de unión de ribozima, o sintetizando químicamente ribozimas con modificaciones que prevengan su degradación por las ribonucleasas del suero (ver, por ejemplo, la publicación de solicitud de patente internacional No. WO 92/07065; Perrault y coautores, 1990; Pieken y coautores, 1991 ; Usman y Cedergren, 1992; la publicación de solicitud de patente internacional No. WO 93/15187, la publicación de solicitud de patente internacional No. WO 91/03162; la publicación de solicitud de patente europea No. 92110298.4, la patente US 5,334,711 y la publicación de solicitud de patente internacional No. WO 94/13688, que describen diversas modificaciones que pueden ser hechas en las porciones azúcar de las moléculas de ARN enzimático), modificaciones que incrementan su eficiencia en células, y la eliminación de las bases de tallo II para acortar los tiempos de síntesis de ARN y reducir los requisitos químicos. Sullivan y coinventores (publicación de solicitud de patente internacional No. WO 94/02595) describe los métodos generales para suministrar moléculas de ARN enzimáticas. Las ribozimas pueden ser administradas a células mediante una variedad de métodos conocidos por quienes estén familiarizados con la técnica, que incluyen, pero sin restricción a ellos: encapsulación en liposomas, por iontoforesis o por incorporación en otros vehículos, como hidrogeles, ciclodextrinas, nanocápsulas biodegradables y microesferas bioadhesivas. Para algunas indicaciones, se puede suministrar directamente las ribozimas ex vivo a células o tejidos con o sin los vehículos mencionados anteriormente. De manera alternativa, se puede suministrar locaimente la combinación de ARN/vehículo mediante inhalación directa, por inyección directa o mediante el uso de un catéter, bomba de infusión o venda tubular elástica. Otras rutas de suministro incluyen, pero sin limitación a ellas: inyección intravascular, intramuscular, subcutánea o articular; inhalación en aerosol, oral (forma de tableta o de pildora), tópica, sistémica, ocular, intraperitoneal y/o intratecal. Se da descripciones más detalladas del suministro de ribozimas y su administración en Sullivan y coinventores (publicación de solicitud de patente internacional No. WO 94/02595) y Draper y coinventores (publicación de solicitud de patente internacional NO. WO 93/23569), que han sido incorporadas aquí mediante esta referencia. Otro medio para acumular concentraciones elevadas de una o más ribozimas dentro de las células, es incorporar las secuencias de ribozima en un vector de expresión de ADN. La transcripción de las secuencias de ribozima son impulsadas desde un promotor para ARN-polimerasa I eucariótica (pol I), ARN-polimerasa II (pol II) o ARN-polimerasa III (pol III). Se expresará transcriptos de polll o pollll a niveles altos en todas las células; los niveles de un promotor pol II dado en un tipo dado de célula dependerá de la naturaleza de las secuencias reguladoras de gene (incrementadores, silenciadores, etc.), presentes en las inmediaciones. También se puede usar promotores de ARN-polimerasa procariótíca siempre y cuando se exprese la enzima ARN-polimerasa procariótica en células apropiadas (Elroy-Stein y Moss, 1990, Gao y Huang, 1993; Lieber y coautores, 1993; Zhou y coautores, 1990). Las ribozimas expresadas a partir de dichos promotores pueden funcionar en células de mamífero (por ejemplo, Kashani-Saber y coautores, 1992; Ojwang y coautores, 1992; Chen y coautores, 1992; Yu y coautores, 1993; L'Huillier y coautores, 1992; Lisziewicz y coautores, 1993). Se puede incorporar dichas unidades de transcripción en una variedad de vectores para introducirlas en células de mamífero, incluyendo, pero sin restricción a ellos: vectores de ADN plásmido, vectores de ADN viral (tales como adenovirus o vectores adeno-asociados), o vectores de ARN viral (como retroviral, de virus forestal semliki, vectores de virus sindbis). Se puede usar las ribozimas de esta invención como herramientas de diagnóstico para examinar tendencias genéticas y mutaciones dentro de líneas de células o tipos de células. También se las puede usar para determinar niveles de la molécula de ARN de destino. La relación íntima entre la actividad de ribozima y la estructura del ARN de destino permite la detección de mutaciones en cualquier región de la molécula que alteren la formación de pares de bases y la estructura tridimensional del ARN de destino. Utilizando múltiples ribozimas descritas en esta invención, se puede mapear los cambios de nucleótido que sean importantes para la estructura de ARN y la función in vitro, así como en células y tejidos. Se puede usar la división de los ARN de destino con ribozimas para inhibir la expresión de gene y definir el papel (esencialmente) de productos de gene especificados, en células y tipos de células particulares. 4.14.- AISLAMIENTO DE GENE HOMOLOGO Y DE FRAGMENTOS DE GENE Los genes y las delta-endotoxinas de acuerdo con la presente invención incluyen no únicamente las secuencias de longitud completa descritas aquí, sino también fragmentos de esas secuencias, o proteínas de fusión que retienen la actividad insecticida característica de las secuencias ejemplificadas específicamente en la presente. Debe ser evidente para las personas expertas en la materia que las delta-endotoxinas insecticidas pueden ser identificadas y obtenidas mediante diversos medios. Se puede obtener los genes específicos, o sus porciones, de un depósito de cultivo, o se los puede construir sintéticamente, por ejemplo, mediante el uso de una máquina de genes. Las variaciones de estos genes pueden ser construidas fácilmente usando técnicas normales para formar mutaciones puntuales. También se puede hacer fragmentos de esos genes utilizando exonucieasas comercialmente disponibles, o endonucleasas de acuerdo con procedimientos comunes y corrientes. Por ejemplo, se puede utilizar enzimas, como ßa/31 o la mutagénesis dirigida al sitio, para recortar sistemáticamente los nucleótidos de los extremos de estos genes. También se puede obtener genes que codifiquen los fragmentos activos, utilizando una variedad de otras enzimas de restricción. Se puede usar proteasas para obtener directamente fragmentos activos de esas delta-endotoxinas. También se puede aislar delta-endotoxinas equivalentes y/o genes que codifiquen esas delta-endotoxinas equivalentes, a partir de cepas de Bacillus y/o bancos de ADN utilizando las enseñanzas dadas aquí. Por ejemplo, se puede usar anticuerpos para las delta-endotoxinas descritas y reivindicadas aquí, para identificar y aislar otras delta-endotoxinas, de entre una mezcla de proteínas. Específicamente, se puede crear anticuerpos para las porciones de las delta-endotoxinas que son muy constantes y muy distintas de otras delta-endotoxinas de ß. thuringiensis. Estos anticuerpos pueden ser usados entonces para identificar específicamente delta-endotoxinas equivalentes, con actividad insecticida características, mediante inmunoprecipitación, inmunoanálisis enlazado a enzima (ELISA) o manchado Western. Otro método para identificar las delta-endotoxinas y los genes de la presente invención es mediante el uso de sondas de oligonucleótido. Estas sondas son secuencias de nucleótidos que tienen una etiqueta detectable. Como es bien sabido en la técnica, si se híbrida la molécula de sonda y la muestra de ácido nucleico, formando una unión fuerte entre las dos moléculas, puede suponerse razonablemente que la sonda y la muestra son esencialmente idénticos. La etiqueta detectable de la sonda proveer un medio para determinar, de una manera conocida, si ha ocurrido hibridación. Ese análisis de sonda provee un método rápido para identificar los genes de delta-endotoxina formicidas, de la presente invención. Se puede sintetizar los segmentos de nucleótido que son usados como sondas, de acuerdo con la presente invención mediante el uso de sintetizadores de ADN, utilizando procedimientos comunes y corrientes. En el uso de los segmentos de nucleótido como sondas, se etiqueta la sonda particular con cualquier etiqueta adecuada, conocida por los expertos en la materia, incluyendo las etiquetas radiactivas y no radiactivas. Las etiquetas radiactivas incluyen 32P, 1 5l, 35S, y similares. Se puede construir una sonda etiquetada con un isótopo radiactivo a partir de una secuencia de nucleótido, complementaria de la muestra de ADN, mediante una reacción de translación de fractura, utilizando una DNasa y ADN-polimerasa. Luego se puede combinar la sonda y la muestra en una solución reguladora de hibridación, y mantenerlas a temperatura apropiada hasta que ocurra la fijación. Posteriormente se lava la membrana hasta que esté libre de materiales extraños, dejando la muestra y las moléculas de sonda unidas, detectadas y cuantificadas típicamente por autorradiografía y/o conteo por destello en líquido. Las etiquetas no radiactivas incluyen, por ejemplo, ligandos como biotina o tiroxina, así como enzimas como hidrolasas o peroxidasas, o los diversos quimioluminiscentes, como luciferina, o compuestos fluorescentes, como fluoresceína y sus derivados. También se puede etiquetar la sonda en ambos extremos con diferentes tipos de etiqueta, para facilitar la separación, como, por ejemplo, usando una etiqueta isotópica en el extremo mencionado arriba y una etiqueta de biotina en el otro extremo. La formación dei dúplex y la estabilidad dependen de la complementariedad entre los dos filamentos de un híbrido y, como se hizo notar antes, se puede tolerar un cierto grado de desigualdad o desajuste. Por lo tanto, las sondas de la presente invención incluyen mutaciones (tanto individuales como múltiples), omisiones, inserciones de las secuencias descritas y sus combinaciones; en las que dichas mutaciones, inserciones y omisiones permiten la formación de híbridos estables con los polinucleótidos de blanco que interesan. Se puede producir las mutaciones, inserciones y omisiones en una secuencia dada de polinucleótido de muchas maneras, mediante métodos actualmente conocidos por quienes tengan experiencia ordinaria en esta materia, y quizás por otros métodos que puedan llegarse a conocer en el futuro. Las variaciones potenciales en las sondas, que se mencionaron, se deben, en parte, a la redundancia del código genético. Debido a la redundancia del código genético, o sea, más de un nucleótido codificador, se puede utilizar una tripleta (codón) para la mayoría de los aminoácidos usados para formar las proteínas. Por consiguiente, diferentes secuencias de nucleótido pueden codificar un aminoácido particular. Así pues, las secuencias de aminoácido de las delta-endotoxinas de B. thuringiensis y los péptidos pueden ser preparados mediante secuencias de nucleótido equivalentes, que codifican la misma secuencia de aminoácido de la proteína o el péptido. Consecuentemente, la presente invención incluye dichas secuencias de nucleótido equivalentes. También las secuencias inversas o complementarias son un aspecto de la presente invención, y pueden ser usadas fácilmente por las personas expertas en la materia. Además, se ha demostrado que las proteínas de estructura identificada y función identificada, pueden ser construidas cambiando la secuencia de aminoácido, si dichos cambios no alteran la estructura secundaria de la proteína (Kaiser y Kezdy, 1984). Así pues, la presente invención incluye mutantes de la secuencia de aminoácido ¡lustrada aquí, que no alteren la estructura secundaria de proteína, o que si se altera la estructura, se retenga sustancialmente la actividad biológica. Adicionaimente, la invención incluye también mutantes de organismos que alojan la totalidad o parte de una delta-endotoxina que codifica un gene de la invención. Se puede formar dichos mutantes mediante técnicas bien conocidas por las personas expertas en la materia. Por ejemplo, se puede usar irradiación UV para preparar mutantes de organismos anfitriones. De igual manera, dichos mutantes pueden incluir células anfitrionas esporógenas, que también pueden ser preparadas mediante procedimientos bien conocidos en la técnica. .0 EJEMPLOS Los siguientes ejemplos están incluidos para demostrar las modalidades preferidas de la invención. Quienes sean expertos en la materia apreciarán que las técnicas descritas en los ejemplos que siguen, representan las técnicas descubiertas por el inventor para funcionar bien en la práctica de la invención; y de tal manera, se puede considerar que constituyen los modos preferidos de ponerla en práctica. Sin embargo, a la luz de la presente descripción, los expertos en la materia apreciarán que puede hacerse muchos cambios en las modalidades específicas que están descritas, y todavía obtener un resultado igual o similar, sin salirse del espíritu y alcance de la invención. .1.- EJEMPLO 1 PREPARACIÓN DE PLANTILLAS PARA MUTAGÉNESIS ALEATORIA En la figura 2 se muestra ios mapas estructurales para los plásmidos pEG315 y pEG916 de crylC. Se aisló el gene crylC contenido en esos plásmidos, de la cepa EG6346 de ß. thuringiensis, subespecie aizawai, descrita primeramente por Chambers y coautores (1991). Se clono un fragmento Sa/l-ßamHI de alrededor de 4 Kb, que contenía el gene crylC intacto, a partir de EG6346, en los sitios únicos Xhol y ßamHI del vector de vaivén pEG854, descrito por Baum y coautores (1990) para producir pEG315. PEG916 es un derivado de pEG853 (también descrito por Baum y coautores, 1990), que contiene el mismo fragmento del gene crylC y una región terminadora de transcripción 3', derivada del gene crylF, descrito por Chambers y coautores (1991). PEG345 (figura 3) es un derivado de pEG597 (también descrito por Baum y coautores, 1990), que contiene el gene crylC de la cepa 7.290 de ß. thuringiensis, subespecie aizawai, descrita por Sanchís y coautores (1989) y descrita en la solicitud de patente europea No. EP 295156A1 y en la publicación de solicitud de patente internacional No. WO 88/09812. Ambos genes son casi idénticos con el gene de holotipo crylC descrito por Honee y coautores (1988). Las técnicas de ADN recombinante empleadas son familiares para los expertos en la materia de manipular y clonar fragmentos de ADN, y se las emplea conforme a las enseñanzas de Maniatis y coautores (1982) y de Sambrook y coautores (1989). Se introdujo una mutación de desplazamiento de marco en el gene crylC de pEG916, en el codón 118. Por analogía con las estructuras cristalinas publicadas para CrylAa y Cry3A, se predijo que el residuo ácido glutámico (E) en esta posición quedaba dentro de, o inmediatamente adyacente a, la región de rizo, entre las hélices alfa 3 y 4 del dominio 1 de CrylC, el sitio de destino o blanco para la mutagénesis aleatoria. Este gene mutado puede ser usado como una plantilla para la mutagénesis dirigida al oligonucleótido, usando un sensibilizador mutágeno que corrija la mutación de desplazamiento de marco, garantizando así que la mayoría de los clones recuperados que codifican las moléculas de protoxina de longitud completa, tengan incorporado el oligonucleótido mutágeno. Se introdujo la mutación de desplazamiento de marco por medio de un protocolo de mutagénesis mediada por PCR™ usando los inicialdores de digonucleótidos A, B y C y las plantillas pEG916 (FIG. 2) como la pantilla de DN. El protocolo de mutagénesis descrito por (Michael, 1994) se basa en el uso de una ligasa termoestable para incorporar un oligonucleótido mutágeno fosforilado en un fragmento de ADN amplificado. La secuencia de ADN de estos sensibilizadores está mostrada a continuación: Sensibilizador A: (SEQ ID NO: 15): 5'-CCCGATCGGCCGCATGC-3' Sensibilizador B: (SEQ ID NO: 16) 5'-GCATTTAAAGAATGGGAAGGGATCCTAGGAATCCAGCAACCAGGACCAG AG-3' Sensibilizador C: (SEQ ID NO: 17) 5'-GAGCTCTTGTTAAAAAAGGTGTTCCAGATC-3' Se diseñó el oligonucleótido mutágeno, sensibilizador B, para incorporar un sitio de restricción ßamHI y Blnl, además de la mutación de desplazamiento de marco en el codón 118 (figura 4). Se resolvió el producto obtenido de PCR™ mediante electroforesis de un gel de agarosa-TAE y se purificó usando el equipo Geneclean II® (Bio 101 , Inc., La Jolla, CA), siguiendo el protocolo sugerido por el fabricante. Se digirió el fragmento de ADN purificado con las enzimas de restricción Agel y Bbul. También se digirió pEG916 con las enzimas de restricción Agel y Bhul, y se resolvió los fragmentos de ADN restringidos mediante electroforesis en gel de agarosa y se purificó el fragmento vector tal como se describió más arriba. Se ligó el fragmento de ADN amplificado y el fragmento vector pEG916, entre sí, con ligasa T4 y se usó la reacción de ligación para transformar la cepa EG10368 de B. thuringiensis, acristalífera (descrita en la patente US 5,322,687) a resistencia de Cm1 , utilizando el procedimiento de electroporación descrito por Mettus y Macaluso (1990). Se seleccionó los transformantes individuales y muchos fueron determinados como acristalíferos, mediante microscopía con contraste de fases, de los cultivos esporulados. Se aisló los piásmidos recombinantes de los transformantes de B. thuringiensis usando el procedimiento de lisis alcalina descrito por Maniatis y coautores (1982). La incorporación de la mutación de desplazamiento de fase, en el crylC también fue indicada por la presencia de los sitios ßamHI y Blnl, determinados mediante el análisis con enzima de restricción de los plásmidos recombinantes aislados de los transformantes de EG10368. El plásmido recombinante que incorpora la mutación de desplazamiento de marco y los sitios de restricción ßamHI y Blnl, fue designado pEG359 (figura 2 y figura 4). Se introdujo pEG359 en la cepa DHdalfa anfitriona de E. coli, mediante transformación, utilizando células competentes congeladas y procedimientos obtenidos de GIBCO BRL (Gaithersburg, MD, E. U. A.). Se modificó adicionalmente pEG359, purificado de E coli, utilizando el procedimiento de lisis alcalina (Maniatis y coautores, 1982), mediante digestión con la enzima de restricción BglW, y religación del fragmento vector con T4 ligasa. Se usó la reacción de ligación para transformar la cepa anfitriona DHdalfa de E. coli como más arriba. El plásmido resultante, designado p154 (figura 2) contiene una omisión de las secuencias de gene crylC corriente abajo del único sitio BglW en crylC. .2.- EJEMPLO 2 MUTAGÉNESIS ALEATORIA DE LOS NUCLEÓTIDOS 352-372 EN crvIC Se efectuó la mutagénesis de los nucleótidos 352-372, que codifican la región de rizo putativa entre las hélices alfa 3 y 4 del dominio 1 de CrylC, conforme al método "Megaprimer" mediado por PCR™, que se describió (Upender y coautores, 1995), utilizando los sensibilizadores A de oligonucleótido (SEQ ID No. 15), C (SEQ ID NO: 17) y D (SEQ ID NO: 18): Sensibilizador D: (SEQ ID NO: 18) 5'-GCATTTAAAGAATGGGAANNNNNNNNNNNNNNNNNNNNNACCAGGACCAGAGTAATTGAT CGC-3' N(20, 21 , 23, 28, 29, 31 , 32 y 39) = 82% de A; 6% de G, C, T; N (25, 26, 34, 35 y 38) = 82% de C, 6% de G, T, A; N (19, 22 y 37) = 82% de G; 6% de C, T, A; N (24, 27, 39, 33, y 36) = 82% de T, 6% de G, C, A. Los números entre paréntesis corresponden a las posiciones anteriores en SEQ ID NO: 18, donde el primer G es la posición número 1. El sensibilizador mutágeno D corrige la mutación de desplazamiento de marco y elimina los sitios ßa HI y Bln , introducidos en pEG359. Para lograr esta mutagénesis, se sintetizó primero el megasensibilizador mediante amplificación por PCR™ del ADN de pEG315 (figura 2), utilizando el sensibilizador mutágeno D y el sensibilizador opuesto C (figura 5). Se purificó el fragmento de ADN amplificado, resultante, mediante electroforesis en gel, como se describió más arriba, y se usó en una segunda PCR™, utilizando sensibilizadores A y C y p154 como plantilla. Debido a que la plantilla p154 contiene una omisión de la región complementaria al sensibilizador C (figura 5), ei inicio de la PCR™ incorpora el ADN mutágeno. Se aisla el producto de PCR™ resultante y se purifica siguiendo la electroforesis en gel, en agarosa y 1X TAE, como se describió anteriormente.
Se digirió el fragmento de ADN con las enzimas de restricción Agel y Bbu , para dar extremos pegajosos, adecuados para clonación, y con las enzimas ßamHI y Blnl para eliminar cualquier ADN de plantilla p154 residual. Se digirió el pEG359 con Agel y Bbul y se ligó el fragmento vector con la preparación de ADN amplificado, restringido. Se usó la reacción de ligación para transformar la cepa Sure™ de E. coli (Stratagene Cloning Systems, La Jolla, CA, E. U. A) a resistencia a la ampicilina (Amp) (AmpR), utilizando un procedimiento de transformación común y corriente. Se raspó las colonias AmpR de las placas y se las desarrolló durante 1-2 horas a 37°C en caldo de Luria con 50 µg/ml de Amp. Se aisló el ADN plásmido de este cultivo, utilizando el procedimiento de lisis alcalina descrito arriba, y se lo utilizó para transformar EG 10368 de ß. thuringiensis a resistencia a Cml (CmlR), mediante electroporación. Se formó placas de los transformantes sobre placas de agar de almidón que contenía 5 µg/ml de Cml y se incubó a 25-30°C. El análisis con enzima de restricción de los ADN plásmidos aislados de los transformantes formadores de cristal, indicó que alrededor del 75% de los transformantes había incorporado el oligonucleótido mutágeno en el sitio de destino (nt 352-32). Es decir, alrededor del 75% de los transformantes formadores de cristal había perdido los sitios ßamHI y Blnl en el sitio de destino o de blanco en el crylC. .3.- EJEMPLO 3 MUTAGÉNESIS DE RESIDUOS ARG EN EL DOMINIO 1 DE CrvIC Se reemplazó los residuos arginina dentro de las regiones potenciales de rizo del dominio 1 de CrylC, por residuos alanina, utilizando mutagénesis dirigida al oligonucleótido. La eliminación de esos residuos arginina puede reducir la proteólisis de la proteína toxina, mediante proteasas parecidas a tripsina, en la tripa media de los lepidópteros, puesto que se sabe que la tripsina abre las ligaduras péptido inmediatamente C-terminales a la arginina y a la lisina. Se sustituyó los residuos arginina en las posiciones de aminoácido 148 y 180 en la secuencia de aminoácido de CrylC, por residuos alanina. El protocolo de mutagénesis mediado por PCR™ usado, descrito por Michael (1994), se basa en el uso de una ligasa termoestable para incorporar un oligonucleótido mutágeno fosforilado en un fragmento de ADN amplificado. La mutagénesis de R148 empleó el sensibilizador mutágeno E (SEQ ID NO: 19) y los sensibilizadores A flanqueadores (SEQ ID NO: 15) y el sensibilizador F (SEQ ID NO: 20). La mutagénesis de R180 empleó el sensibilizador mutágeno G (SEQ ID NO: 21) y los sensibilizadores flanqueadores A (SEQ ID NO: 15) y F (SEQ ID NO: 20). Ambos estudios de PCR™ emplearon ADN de pEG315 (figura 2) como la plantilla de crylC. Se diseñó el sensibilizador E para eliminar un sitio Asull dentro de la secuencia de nucleótidos de crylC de tipo silvestre. Se diseñó el sensibilizador G para introducir un sitio Hlndll dentro de la secuencia de nucleótidos de crylC.
Sensibilizador E (SEQ ID NO: 19): 5'-GGGCTACTTGA GGGACATTCCTTCGTTTGCAATTTCTGGATTTGAAGT ACCCC-3' Sensibilizador F (SEQ ID NO: 20): 5'-CCAAGAAAATACTAGAGCTCTTGTTAAAAAAGGTGTCC-3' Sensibilizador G (SEQ ID NO: 21): 5'-GAGATTCTGTAATTTTTGGAGAAGCATGGGGGTTGACAACGATAAATGTC-3' Los productos obtenidos a partir de PCR™ fueron purificados después de electroforesis en gel de agarosa, utilizando el procedimiento Geneclean II® y reamplificados usando los sensibilizadores opuestos A y F y procedimientos de PCR™ comunes y corrientes. Se digirió los productos de PCR™ resultantes con las enzimas de restricción Bhul y Agel. Se digirió pEG314, que contenía el gene crylC intacto de EG6346, con las enzimas de restricción Bbul y Agel. Se resolvió los fragmentos restringidos mediante electroforesis con gel de agarosa en 1X TAE, se purificó el fragmento vector pEG315 usando el procedimiento Genecleanll® y, subsecuentemente, se ligó a los fragmentos de ADN amplificados, obtenidos de la mutagénesis, utilizando T4 ligasa. Se usó las reacciones de ligación para transformar DHdalfa™ de E. coli a resistencia a Amp, utilizando métodos de transformación comunes y corrientes.
Se seleccionó los transformantes en placas Luria que contenían 50 µg/ml de Amp. Se aisló los ADN plásmidos de los transformantes de E. coli generados por la mutagénesis de R148, para transformar EG10368 de B. thuringiensis a CmlR, utilizando el procedimiento de electroporación descrito por Mettus y Macaluso (1990). Se seleccionó los transformantes en placas Luria que contenían 3 µg/mi de Cml. Aproximadamente el 75% de los transformantes EG10368, generados por la mutagénesis de R148, había perdido el sitio Asull, lo que indicaba que el sensibilizador E de oligonucleótido mutágeno había sido incorporado en el gene crylC. Se seleccionó un transformante, designado EG11811 para estudio adicional. Aproximadamente el 25% de los transformantes de E. coli, generados por la mutagénesis con R180, contenía el nuevo sitio Hindll introducido por el sensibilizador G de oligonucleótido mutágeno, lo que indica que el oligonucleótido mutágeno había sido incorporado en el gene crylC. El ADN plásmido de uno de dichos transformantes, fue usado para transformar la cepa anfitriona EG10368 de B. thuringiensis a CmlR, mediante electroporación, como antes. Uno de los transformantes resultantes fue designado EG11815. Se repitió la mutagénesis de R148 usando el gene crylD contenido en el plásmido pEG345. El plásmido pEG345 (figura 2) contiene el gene crylC de ß. thuringiensis, subespecie aizawai, cepa 7.29 (Sanchís y coautores, 1989, solicitud de patente europea EP 295156 A1 ; publicación de solicitud de patente internacional No. WO 88/09812). La mutagénesis de R148 empleó el sensibilizador mutagénico E (SEQ ID NO: 19), los sensibilizadores flanqueadores H (SEQ ID NO: 52) y F (SEQ ID NO: 20) y el plásmido pEG345, como fuente de la plantilla de ADN de crylC. Se diseñó el sensibilizador E para eliminar un sitio Asull dentro de la secuencia crylC de tipo silvestre. Sensibilizador H: 5'-GGATCCCTCGAGCTGCAGGAGC-3' (SEQ ID NO: 52). Se obtuvo el ADN de plantilla crylC de una PCR™ utilizando los sensibilizadores opuestos H y F y el plásmido pEG345 como plantilla. Luego se usó este ADN como plantilla para la reacción de mutagénesis mediada por PCR™, que empleó los sensibilizadores flanqueadores H y F y el oligonucleótido E mutágeno, utilizando el procedimiento descrito por Michael (1994). Se digirió los productos de PCR™ resultantes con las enzimas de restricción Bbul y Agel. Se resolvió los fragmentos de ADN restringidos mediante electroforesis en gel de agarosa en IX TAE y se purificó el fragmento crylC amplificado, utilizando el procedimiento Geneclean II ®. De manera similar se digirió el plásmido pEG345 con las enzimas de restricción Bbul y Agel, se resolvió mediante electroforesis en gel de agarosa, en IX TAE y se purificó el fragmento vector pEG345 utilizando el procedimiento Geneclean II®. Se ligó los fragmentos de ADN purificados entre sí utilizando T4 ligasa y se los usó para transformar DHdalfa de E. coli usando un procedimiento de transformación común y corriente. Se seleccionó los transformantes en placas de Luria que contenían 50 µg/ml de Amp. Aproximadamente el 50% de los transformantes DHdalfa generados por mutagénesis con R148 había perdido el sitio AsuW, lo que indica que el sensibilizador _E de oligonucleótido mutágeno había sido incorporado en el gene crylC. El ADN plásmido de un transformante fue usado para transformar B thuringiensis EG10368 a CmlR, usando el procedimiento de electroporación descrito por Mettus y Macaluso (1990). Se seleccionó los transformantes en placas de Luria que contenían 3 µg/ml de cloranfenicol. Se designó uno de los transformantes EG11822. Se reemplazó también el residuo arginina en la posición 148 del aminoácido con aminoácidos aleatorios. Esta mutagénesis de R148 empleó el sensibilizador mutagénico I (SEQ ID NO: 53), los sensibilizadores flanqueadores H (SEQ ID NO: 52) y F (SEQ ID NO: 20) y el plásmido pEG345 como la fuente de la plantilla de ADN de crylC. También se diseñó el sensibilizador I para eliminar un sitio Asull, dentro de la secuencia de crylC de tipo silvestre: Sensibilizador I (SEC ID NO: 53): 5'-GGGCTACTTGAAAGGGACATTCCTTCGTTNNNATTTCTGGATTTGAAGT ACCCC-3' N (31 , 32, 33) = 25% de A,25% de C, 25% de G, 25% de T. Se obtuvo el ADN de plantilla de crylC de una PCR ™ usando los sensibilizadores opuestos H y F y el plásmido pEG345 como plantilla. Luego se usó este ADN como plantilla para una reacción de mutagénesis mediada por PCR™, que empleó los sensibilizadores flanqueadores H y F y el oligonucleótido I mutágeno, utilizando el procedimiento descrito por Michael (1994). Se digirió los productos de PCR™ resultantes con las enzimas de restricción ß¿>ül y Agel.
Se resolvió los fragmentos de ADN restringidos mediante electroforesis con gel de agarosa en IX TAE y se purificó el fragmento crylC usando el procedimiento Geneclean II®. De manera similar, se digirió el plásmido pEG345 con las enzimas de restricción ߣ>ul y Agel, se resolvió mediante electroforesis con gel de agarosa en IX TAE y se purificó ei fragmento vector pEG345 usando el procedimiento Geneclean II®. Se ligó los fragmentos de ADN purificados entre sí utilizando ligasa T4 y se los usó para transformar DHdalfa de E. coli a resistencia a la ampicilina, utilizando un procedimiento de transformación común y corriente. Se seleccionó los transformantes en placas de Luria que contenían dO µg/ml de ampicilina. Se reunió entre sí los transformantes DHdalfa y se preparó el ADN plásmido usando el procedimiento de lisis alcalina. Se usó el ADN plásmido de DHdalfa para transformar EG10368 de B. thuringiensis a CmlR, utilizando el procedimiento de electroporación descrito por Mettus y Macaluso (1990). Se seleccionó los transformantes que exhibían un fenotipo opaco en placas de agar de almidón que contenían 3 µg/ml de cloranfenicol, lo que indica producción de proteína cristalina. Aproximadamente el 90% de los transformantes de EG10368 generados por la mutagénesis de R148, había perdido el sitio Asull, lo que indica que ei sensibilizador I del oligonucleótido mutágeno había sido incorporado en el gene crylC. .4.- EJEMPLO 4 EVALUACIÓN POR BIOANÁLISIS DE LAS TOXINAS Cry1C« Se desarrolló transformantes EG10368 que contenían genes mutantes crylC en el medio C2, descrito por Donovan y coautores (1988) durante 3 días a 25°C o hasta que estaba totalmente esporulado y se sometió a lisis. Se usó las suspensiones de esporas-cristal de Cryl C recuperadas de los cultivos C2 agotados, para evaluación por bioanálisis contra larvas nonatas de Spodoptera exigua y larvas de tercera etapa de Plutella xilostella. Se desarrolló transformantes EG 10368 que alojan mutantes CrylC mediante mutagénesis aleatoria, en 2 ml de medio C2 y se los evaluó en tamices de bioanálisis de una sola dosis. Se diluyó cada cultivo con 10 ml de 0.00d% de Tritón X-100® y se sembró 25 µl de estas diluciones en 4 ml adicionales de 0.005% de Tritón X-100® para obtener la dilución apropiada para los tamices de bioanálisis. Se aplicó tópicamente 50 µl de esta dilución a 32 concavidades que contenían 1.0 ml de dieta artificial por concavidad (área de superficie 175 mm2). Se colocó en cada una de las concavidades tratadas una sola larva nonata (S. exigua) o larva de 3a etapa (P. xilostella) y se cubrió la bandeja con una tira de mylar perforada, clara. Se anotó la mortandad de larvas después de 7 días de alimentar a 28-30°C y se expresó el porcentaje de mortandad como la razón del número de larvas muertas al número total de larvas tratadas.
Se identificó tres transformantes EG10368, designados EG11740, EG11746 y EG11747, por mostrar actividad insecticida incrementada contra Spodoptera exigua en tamices de bioanálisis duplicados. Se designó las variantes putativas de CrylC en cepas EG 11740, EG11746 y EG 11747, Cryl C.563, Cry1 C479 y Cryl C.499, respectivamente. Estas tres variantes contienen sustituciones de aminoácido dentro de la región de rizo entre las hélices alfa 3 y 4 de CrylC. Se desarrolló EG11740, EG11746 y EG11747, así como EG11726 (que contiene el gene crylC de tipo silvestre, procedente de la cepa EG6346) en el medio de cultivo C2, durante 3 días a 25°C. Se centrifugó los cultivos y se lavó las pellas de espora/cristal tres veces en 2X volúmenes de agua destilada y desionizada. Se suspendió la pella final en un volumen original de Tritón X-100 al 0.005% y se cuantificó la proteína cristalina mediante SDS-PAGE, como fue descrito por Brussock y Currier (1990). Se modificó el procedimiento para eliminar el paso de neutralización con 3M de HEPES. Se preparó ocho concentraciones de delta-endotoxina de las preparaciones de espora/cristal, mediante dilución seriada en Tritón X-100 al 0.005% y se aplicó tópicamente cada concentración a concavidades que contenían 1.0 ml de dieta artificial. Se marcó la mortandad de larvas después de 7 días de alimentar a 23-30°C (32 larvas por cada concentración de delta-endotoxina). Se expresó la mortandad como los valores CL5o y CL95, de acuerdo con la técnica de Daum (1970), la concentración de proteína CrylC (ng/concavídad), que provoca mortandad de 60% y de 9d%, respectivamente (cuadro d, cuadro 6 y cuadro 7). Las cepas EG11740 (Cry1 C.463) y EG 11746 (Cry1C479) exhibieron valores tres veces inferiores de CL95, que la cepa de control EG11726 (CrylC) contra S. exigua mientras que retuvo un nivel comparable de actividad contra P. xilostella. EG 11740 y EG 11746 también exhibieron valores CL50 significativamente menores contra S. exigua.
CUADRO 5 BIOANÁLISIS DE MUTANTES 3-4 DE RIZO ALFA EN CrvIC, UTILIZANDO LARVAS DE SPODOPTERA EXIGUA La concentración de proteína Cryl C que provoca el dO% de mortandad, expresada en ng de proteína cristalina por concavidad de 17d mm2.
Resultados de 3 a 7 series de bioanálisis duplicados. La concentración de proteína CrylC que provoca el 95% de mortandad, expresada en ng de proteína cristalina por concavidad de 175 mm2.
Resultados de 3 a 7 series de bioanálisis duplicados. Intervalos de confianza de 95%.
CUADRO 6 BIOANÁLISIS UTILIZAN DO LARVAS DE PLUTELLA XILOSTELLA 1 La concentración de proteína CrylC que provoca el 50% de mortandad, expresada en ng de proteína cristalina por concavidad de 175 mm2. Resultados de 3 a 7 series de bioanálisis duplicados. 2 La concentración de proteína CrylC que provoca el 95% de mortandad, expresada en ng de proteína cristalina por concavidad de 175 mm2. Resultados de 3 a 7 series de bioanálisis duplicados. 3 Intervalos de confianza de 95%. Se desarrolló las cepas mutantes de CrylC EG11811 (CrylC-R148A) y EG11815 (Cry1C-R180A) en medio C2 y se evaluó usando el mismo procedimiento de bioanálisis cuantitativo en ocho dosis. Las actividades insecticidas de CrylC y Cry1C-R180A contra S. exigua y P. xilostella no fueron significativamente diferentes. Sin embargo, Cry1C-R148A exhibió una CL50 3.6 veces menor y una CL95 3.7 veces menor, contra S. exigua, cuando se comparó con la endotoxina original Cryl C (cuadro 7). Cry1 C-R148A y Cryl C exhibieron actividad insecticida comparable contra P. xilostella (cuadro 6).
CUADRO 7 BIOANÁLISIS DE Crv1C.R148A UTILIZANDO LARVAS DE SPODOPTERA EXIGUA 1 La concentración de proteína CrylC que provoca el 60% de mortandad, expresada en ng de proteína cristalina por concavidad de 175 mm2. Resultados de 3 a 7 series de bioanálisis duplicados. 2 La concentración de proteína Cryl C que provoca el 95% de mortandad, expresada en ng de proteína cristalina por concavidad de 175 mm2. Resultados de 3 a 7 series de bioanálisis duplicados. 3 Intervalos de confianza de 95%. Se cultivó similarmente las cepas mutantes de CrylC EG11811 (Cry1C-R148A), EG11740 (Cry1C.d63) y EG11726 (que produce el tipo silvestre de CrylC), y se las evaluó en bioanálisis utilizando larvas neonatas de Trichoplusia ni. Las actividades insecticidas de Cry1C-R148A y CrylC.663 contra T. ni exhibieron una CL50 y una CL95 inferiores, cuando se las compara con EG11726 (cuadro 8).
CUADRO 8 BIOANÁLISIS UTILIZANDO LARVAS DE TRICHOPLUSIA NI Concentración de proteína CrylC que provoca el 50% de mortandad, expresada en ng de proteína cristalina por concavidad de 175 mm2.
Resultados de una serie de bioanáiisis duplicados. Concentración de proteína Cryl C que provoca el 95% de mortandad, expresada en ng de proteína cristalina por concavidad de 175 mm2.
Resultados de una serie de bioanálisis duplicados. Intervalos de confianza de 95%.
Las comparaciones de bioanálisis con otros insectos lepidópteros reveló mejoras adicionales en las propiedades de Cry1C463 y Cry1C-R148A, particularmente en la toxicidad hacia el gusano de esciara otoñal Spodoptera frugiperda (cuadro 9). Las dosis informadas en el cuadro 8 son como sigue: 10,000 ng/concavidad, para A. ípsilon, H, virescens, H. Zea, O. Nubilalis y S. frugiperda.
CUADRO 9 COMPARACIONES DE BIOANÁLISIS CON OTROS INSECTOS LEPIDÓPTEROS + = 29-49% de mortandad ++ = dO-74% de mortandad +++ = 7d-100% de mortandad.
Se evaluó transformantes EG10368 que alojan mutantes aleatorios en la posición R148 de CrylC, en bioanálisis en un tamiz de una dosis contra S. exigua, como se describió antes. Se identificó cinco mutantes de CrylC con actividad mejorada sobre CrylC de tipo silvestre. Luego se evaluó los mutantes en bioanálisis de ocho dosis contra S. exigua, como se describió anteriormente. Los cinco mutantes de CrylC dieron una CL5o significativamente inferior a Cryl C de tipo silvestre (cuadro 10), comparable con EG11822 (R148A). Un mutante, designado EG11832 (Cry1C-R148D) dio una CL50 y una CL95 significativamente menores que EG11822, lo que indica una toxicidad adicionalmente mejorada hacia S. exigua.
CUADRO 10 BIOANÁLISIS USANDO LARVAS DE SPODOPTERA EXIGUA 1 Concentración de proteína CrylC que provoca dO% de mortandad, expresada en ng de proteína cristalina por concavidad de 17d mm2. Resultados de una serie de bioanálisis duplicados. 2 Concentración de proteína CrylC que provoca 9d% de mortandad, expresada en ng de proteína cristalina por concavidad de 17d mm2.
Resultados de una serie de bioanálisis duplicados. 3 Intervalos de confianza de 9d%. 4 Resultados de dos series de bioanálisis duplicados. 5.5.- EJEMPLO 5 ANÁLISIS DE SECUENCIA DE LAS MUTACIONES crvIC Se aisló plásmidos recombinantes de los transformantes EG10368, utilizando el método de lisis alcalina (Maniatis y coautores, 1982). Se introdujo los plásmidos obtenidos de los transformantes en la cepa DHdalfa™ anfitriona de E. coli, mediante transformación competente de célula, y se usó como plantilla para secuenciación de ADN, utilizando el equipo secuenciador de ADN Sequenase® v2,9 (U. S. Biochemical Corp., Cleveland, OH). El análisis de secuencia del plásmido pEG3d9 (figura 4, SEQ ID NO. 24) reveló la mutación de desplazamiento de marco esperada en el codón 118 y los sitios de restricción ßamHI y Bfnl, introducidos por el sensibilizador B oligonucleótido mutágeno (SEQ ID NO: 16). El análisis de secuencia del gene cryl C.563 en el plásmido pEG370 (figura 4: SEQ ID NO: 2d) reveló sustituciones de nucleótido en las posiciones 354, 361 , 369 y 370, que dieron por resultado mutaciones puntuales A a T, A a C, A a C y G a A, respectivamente. Las mutaciones dieron por resultado sustituciones de aminoácido en CrylC.663 (figura 4, SEQ ID NO: 26) en las posiciones 118 (E a D), 121 (N a H) y 124 (A a T). El análisis de secuencia del gene Cru1 C.579 en el plásmido pEG373 (figura 4: SEQ ID NO: d4) reveló sustituciones de nucleótido en las posiciones 3d3, 369 y 371 , que dieron por resultado mutaciones puntuales A a T, A a T y C a G, respectivamente. Estas mutaciones dieron por resultado sustituciones de aminoácido en Cry1C.d79 (figura 4, SEQ ID NO: dd) en las posiciones 118 (E a V) y 124 (A a G). El análisis de secuencia del gene cry1C499 en el plásmido pEG374 (figura 4, SEQ ID NO: 66) reveló sustituciones de nucleótido en las posiciones 361 y 361 , que dieron por resultado mutaciones puntuales T a C y A a C, respectivamente. Estas mutaciones dieron por resultado una sustitución de aminoácido en Cryl C.499 (figura 4, SEQ ID NO: 67) en la posición 121 (N a H). El análisis de secuencia de los genes crylC en EG11811 y EG11822 confirmó la sustitución de alanina por arginina en la posición 148 (SEQ ID NO: 1 ; SEQ ID NO: 2). Las sustituciones de nucleótido C442G y G443C produjeron el codón GCA, que codifica alanina. El análisis de secuencia de los mutantes aleatorios R148 indica cambios de R148 a ácido aspártico, metionina, leucina y glicina. De tal manera, una variedad de sustituciones de aminoácido por el residuo arginina de carga positiva, en la posición 148 en CrylC, da por resultado toxicidad mejorada.
Ninguna de esas sustituciones puede ser considerada como cambio conservador. Alanina, leucina y metionina son aminoácidos no polares; ácido aspártico es un aminoácido de carga negativa y la glicina es un aminoácido sin carga; todos poseen cadenas laterales menores que la de la arginina. Todos estos aminoácidos, excepto el ácido aspártico, difieren significativamente (±2 unidades) de la arginina, utilizando los índices hidropático y de hidrofilicidad descritos más atrás. La cepa que aloja el gene cry1C-R148D fue designada EG11832. La secuencia de nucleótido del gene cry1C-R148D está mostrada en SEQ ID NO: 3; y la secuencia de aminoácido está mostrada en SEQ ID NO: 4. Las sustituciones de nucleótido C442G, G443A y A444C produjeron el codón GAC, que codifica ácido aspártico. El mutante Cry1C-R148D, designado EG11832, exhibe una CL50 alrededor de 6.d veces menor y una CL95 alrededor de 8 veces menor, en bioanálisis, contra S. exigua cuando se compara con la cepa CrylC de tipo silvestre. .6.- EJEMPLO 6 RESUMEN DE MUTANTES crylC* Los mutantes crylC de la presente invención están resumidos en el cuadro 11.
CUADRO 11 RESUMEN DE CEPAS CnÁC* .7.- EJEMPLO 7 CONSTRUCCIÓN DE CEPAS DE B. THURINGIENSIS QUE CONTIENEN MPULTIPLES GENES c/v ADEMÁS DE crylC Y crv1C-R148A Se puede usar la cepa EG4923-4 anfitriona de ß. thuringiensis como una cepa anfitriona para los genes crylC naturales y mutantes de la presente invención. La cepa EG4923-4 contiene tres genes crylAc y un gene cry2A en plásmidos naturales, y exhibe excelente actividad insecticida contra una variedad de plagas de lepidópteros. Se introdujo plásmidos recombinantes que contienen los genes de proteína cristalina crylC y cry1C-R148A derivados originalmente de la cepa 7.290 de aizawai, en el fondo de cepa EG4923-4, utilizando el procedimiento de electroporación descrito por Mettus y Macaluso (1990). Se designó los plásmidos recombinantes que contenían crylC y crylC-R148A pEG348 (figura 7) y pEG1641 (figura 8), respectivamente, y fueron de estructura similar a los plásmidos cryl descritos en la patente US 6,441 ,884 (específicamente incorporada aquí mediante la referencia). Se aisló los transformantes de cepa EG4923-4 que contenían los plásmidos pEG348 y pEG1641 , en placas Luria que contenían 10 µg/ml de tetraciclina. Se aisló los ADN plásmidos recombinantes de los transformantes, mediante el procedimiento de lisis alcalina descrito por Baum (1996) y se confirmó mediante análisis de enzima de restricción. Se confirmó adicionalmente las formaciones de plásmido de los transformantes, mediante el procedimiento de análisis de Eckhardt en gel de agarosa, descrito por González Jr y coautores (1982). Se designó los derivados recombinantes EG4923-4, EG4923-4/pEG348 y EG4923-4/pEG1641. .8.- EJEMPLO 8 MODIFICCIÓN DE EG4923-4(pEG348 Y EG4923-4/pEG1641 PARA ELIMINAR LOS ELEMENTOS DE ADN EXTRAÑOS PEG348 y pEG1641 contienen copias duplicadas de un sitio de recombinación específico para el sitio, o un sitio de resolución interna (IRS) que sirve como substrato para una reacción de recombinación específica para el sitio, in vivo, mediada por la Tnpl recombinasa del transposón Tr5401 (descrito en Baum, 1995). Esta reacción de recombinación específica al sitio, descrita en la patente estadounidense 5,441 ,884, da por resultado la omisión del ADN que no sea de B. thuringiensis, o de elementos de ADN extraños, de los plásmidos recombinantes que codifican la proteína cristalina. Estas cepas de B. thuringiensis recombinantes, resultantes, están libres de elementos de ADN extraños, un aspecto conveniente para las cepas genéticamente manipuladas por ingeniería, para uso como bioinsecticidas para aplicación por rociado. Se modificó las cepas EG4923-4/pEG348 y EG4923-4/pEG1641 utilizando este sistema de recombinación específico para el sitio (SSR) in vivo, para generar dos nuevas cepas (cuadro 12), designadas EG7841-1 (alias EG11730) y EG7841-2 (alias EG11831). Se designó los plásmidos recombinantes en las cepas EG7841-1 y EG7841-2 como pEG348? y pEG1641?, respectivamente.
CUADRO 12 CEPAS DE B. THURINGIENSIS RECOMBINANTES EJEMPLO 9 MUTANTES COMBINATORIOS DE CrvIC EN LAS POSICIONES DE AA 148 Y 219 Se usó como plantilla ei gene cry1C-R148A en pEG1639 y el gene cry1C-R148Den pEG1642, para estudios adicionales de mutagénesis, destinados a obtener mejoras adicionales en la actividad insecticida. En un ejemplo se reemplazó el residuo lisina en la posición 219 (K219) por un residuo alanina, utilizando el protocolo de mutagénesis a base de PCR™, descrito por Michael (1994) y el sensibilizador oligonucleótido mutágeno J: Sensibilizador J (SEQ ID NO: 62) 5'-CGGGGATTAAATAATTTACCGGCTAGCACGTATCAAGATTGGATAAC-3' El sensibilizador J incorpora también un sitio Nhel único (subrayado en lo anterior) que puede ser usado para distinguir el gene original del gene mutante, mediante análisis con enzima de restricción. Las reacciones de mutagénesis mediadas por PCR™ emplearon los sensibilizadores flanqueadores H (SEQ ID NO: 62) y F (SEQ ID NO: 20), el sensibilizador oligonucleótido mutágeno J (SEQ ID NO: 62) y pEG1639 (cryl C-R148A) como plantilla. En estas reacciones se incluyó d unidades de Taq Extender™ (Stratagene) para mejorar la eficiencia de la amplificación con la Taq polimerasa. Se resolvió los productos amplificados, de la reacción de mutagénesis, mediante electroforesis con gel de agarosa, y se extirpó el fragmento de ADN amplificado que incorporaba el sensibilizador oligonucleótido mutágeno J, del gel y se purificó usando el procedimiento Geneclean II®. Se dividió el fragmento de ADN con las endonucleasas de restricción ßbul y Agel. A fin de subclonar el fragmento de restricción Bbul-Agel crylC y expresar el gene mutante de crylC en ß. thuringiensis, se dividió el plásmido pEG34d de crylC (figura 3) con ßj ul y Agel, se trató con fosfatasa alcalina intestinal de ternera (Boehringen Mannheim Corp.) y se resolvió los fragmentos de ADN resultantes mediante electroforesis en gel de agarosa. Se extirpó del gel el fragmento vector mayor y se purificó usando el procedimiento Geneclean II®. Se ligó subsecuentemente el fragmento vector pEG345 al fragmento crylC amplificado, recuperado de la reacción de mutagénesis, y se usó los productos de ligación para transformar células de E. coli Sure™ (Stratagene) a resistencia a la ampicilina, utilizando electroporación. Se aisló las colonias individuales recuperadas de placas Luria que contenían 50 µg/ml de ampicilina, y se inoculó en cultivos de 3 ml que contenían 1X de infusión de cerebro y corazón, glicerol al 0.5% (BHIG), y 50 µg/ml de ampicilina.
Se preparó los ADN plásmidos a partir de los cultivos en caldo utilizando el método de lisis alcalina, se digirió con la enzima de restricción Nhel y se resolvió mediante electroforesis en gel de agarosa para distinguir los clones que incorporan la secuencia mutágena de sensibilizador J y, por consiguiente, codificar la sustitución alanina en la posición 219. Se confirmó la incorporación de la secuencia mutante en cry1C-R148A mediante análisis de secuencia de ADN. Se usó ADN plásmidos de cuatro clones de E. coll recombinantes para transformar la cepa EG10368 de B. thuringiensis acristalífera, a resistencia al cioranfenicol, utilizando electroporación. Se confirmó la transferencia del plásmido recombinante a EG10368 mediante análisis de enzima de restricción de los ADN plásmidos recuperados de los transformantes de EG10368. Se seleccionó una colonia resistente al cloranfenicol y se la designó EG12111. Se designó el gene crylC en EG12111 cry1C-R148A K219A (SQ ID NO: 68) y se designó la proteína cristalina codificada Cry1 C-R148A K219A (SEQ ID NO: 59). Se hizo la misma sustitución en Cry1C-R148D, utilizando los mismos procedimientos, pero usando como plantilla pEG1642 (cryl C-R148D) para la reacción de mutagénesis mediada por PCR™. Se utilizó los productos de ligación para transformar células de E. coli DHdalfa, a resistencia a la ampiciiina, usando procedimientos de transformación comunes y corrientes. Se preparó ADN plásmidos a partir de cultivos en caldo de clones seleccionados, resistentes a la ampiciiina, usando el método de lisis alcalina, digeridos con la enzima de restricción Nhel y se resolvió mediante electroforesis en gel de agarosa para distinguir ios clones que incorporan la secuencia mutágena del sensibilizador J y, por consiguiente, codificar la sustitución de alanina en la posición 219. La incorporación de la secuencia mutante en cry1C-R148D fue confirmada por el análisis de secuencia de ADN. Los plásmidos recombinantes de tres clones mutantes fueron usados para transformar la cepa EG10368 de B. thuringiensis acristalífera, a resistencia al cloranfenicol, utilizando electroporación. Se confirmó la transferencia del piásmido recombinante a EG10368 mediante análisis con enzima de restricción de los ADN plásmidos recuperados de los transformantes EG10368. Se selecciono una colonia resistente al cloranfenicol y se la designó EG12121. Se designó al gene crylC en EG12121 como cry1C-R148D K219A (SEQ ID NO: 60) y se designó la proteína cristalina codificada como Cry1C-R148D K219A (SEQ ID NO: 61). El plásmido cryl recombinante en EG12121 fue designado pEG943 (figura 9). Se desarrolló las cepas EG12115 (Cryl C de tipo silvestre), EG11822 (Cry1C-R148A), EG12111 (Cry1C-R148A K219A), EG11832 (CrylC-R148D) y EG12121 (Cry1C-R148D K219A), en un medio C2 como se describió en el ejemplo 4. Se usó las suspensiones cristalinas de espora-Cryl C, recuperadas de los cultivos en C2 agotados, para evaluación por bioanálisis contra larvas neonatas de Spodoptera exigua y de Trichoplusia ni, como se describió en el ejemplo 4. En dos series de bioanálisis de ocho dosis, duplicados, contra S. Exigua, no fueron distinguibles ias proteínas EG12111 y EG12121 Cryl C de las proteínas EG11822 y EG11832 Cryl C, respectivamente.
En los bioanálisis contra T. ni, sin embargo, se observó mejoras adicionales en la toxicidad para los mutantes combinatorios (cuadros 12 y 13).
CUADRO 13 EVALUACIÓN POR BIOANÁLISIS DEL MUTANTE COMBINATORIO CRY1C- R148A K219A CONTRA LARVAS NEONATAS DE TRICHOPLUSIA NI 1 Concentración de proteína CrylC que provoca el 60% de mortandad, expresada en ng de proteína cristalina por concavidad de 176 mm2 2 Intervalos de confianza de 95%.
CUADRO 14 EVALUACIÓN POR BIOANÁLISIS DEL MUTANTE COMBINATORIO CRY1C- R148D K219A CONTRA LARVAS NEONATAS DE TRICHOPLUSIA NI 1 Concentración de proteína CrylC que provoca 50% de mortandad, expresada en ng de proteína cristalina por concavidad de 175 mm2 2 Intervalos de confianza de 95%.
EJEMPLO 10 MUTANTES COMBINATORIOS CRY1C-R148D QUE CONTIENEN OTRAS SUSTITUCIONES EN EL RIZO ALFA6-7 Se construyó mutantes combinatorios adicionales usando crylC-R148D K219A, contenido en pEG943, como plantilla para la mutagénesis mediada por PCR™. Se usó una modificación del procedimiento de extensión por traslape PCR™ (Horton y coautores, 1989), para generar esos mutantes combinatorios (figura 10). Brevemente, se efectuó una PCR™ usando pEG943 como plantilla y los sensibilizadores opuestos H (SEQ ID NO: 52) y F (SEQ ID NO: 20). El fragmento de ADN amplificado contenía la mutación R148D, así como el sitio de restricción único Nhel, que marca las sustituciones de nucleótido que codifican la mutación K219A en el rizo alfa6-7. Se efectuó la PCR usando Taq polimerasa y Taq Extender™ y siguiendo el protocolo recomendado por Stratagene. Se amplificó un segundo fragmento de ADN mediante PCR™ usando pEG943 como plantilla, y el sensibilizador oligonucleótido mutágeno K (SEQ ID NO: 63) y el sensibilizador opuesto L (SEQ ID NO: 64). En este caso, se efectuó PCR™ usando la polimerasa termoestable Deep Vent™ y siguiendo el protocolo recomendado por New England Biolabs, Inc.
Sensibilizador K (SEQ ID NO: 63) d'-CGGGGATTAAATAATTTACCGAAANNAACGTATCAAGATTGGATAAC-3' N (25) = 50% de C, 50% de G; N (26) = 33.3% de C, 33.3% de G, 33.3% de A. Sensibilizador L: (SEQ ID NO: 64): 5'-GAATAGCACTCATCAAAGGTACC-3' El sensibilizador K mutágeno incorporó ias mutaciones en el codón para serina (S) en la posición 220 de Cryl C. Se predicen seis diferentes sustituciones de aminoácido a partir del procedimiento de mutagénesis: (arginina (R), alanina (A), ácido glutámico (E), glutamina (Q), glicina (G) y prolina (P). El sensibilizador mutágeno K también elimina el único sitio Nhel en pEG943 y restablece el residuo lisina en la posición 219. Así pues, los ciones crylC que incorporan este sensibilizador y que contienen sustituciones en S220, pueden distinguirse del gene de plantilla cry1C-R148A K219A por la pérdida del sitio Nhel. Se purificó los fragmentos de ADN amplificados después de electroforesis en gei de agarosa usando el procedimiento Geneclean 11®. Para efectuar ia extensión de traslape PCR™, se mezcló cantidades aproximadamente equimolares de los dos fragmentos ADN, entre sí, y se los amplificó usando los sensibilizadores flanqueadores H (SEQ ID NO: 52) y L (SEQ ID NO: 64). La fijación de los filamentos complementarios de los dos fragmentos de ADN permite la extensión de sus extremos 3' (figura 10). Los filamentos totalmente extendidos pueden servir entonces como plantillas para la amplificación, usando los sensibilizadores flanqueadores. Se purificó el fragmento de ADN amplificado, resultante, después de electroforesis en gel de agarosa, utilizando el procedimiento Geneclean II® y se digirió con las endonucleasas de restricción ß¿>ul y Agel. Se purificó el fragmento de restricción Bbul-Agel que contenía la porción 5' del gene crylC, después de electroforesis con gel de agarosa, usando el procedimiento Geneclean II®. A fin de subclonar este fragmento de restricción y de expresar los genes mutantes crylC en B. thuringiensis, se dividió el plásmido crylC pEG943 (figura 9) con Bbul, Nhel y Agel; se trató con fosfatasa alcalina intestinal de ternera y se resolvió los fragmentos de ADN resultantes mediante eiectroforesis en gel de agarosa. Se extirpó el fragmento vector del gel y se purificó usando el procedimiento Geneclean II®. Subsecuentemente se ligó ei fragmento vector pEG943 a los fragmentos de cry 1 Camplificados procedentes de la PCR™ de extensión por traslape, y se usó los productos de ligación para transformar células de E. coli Sure™ (Stratagene) a resistencia a la ampicilina, utilizando electroporación. Se cosechó varios cientos de colonias resistentes a la ampicilina, de placas Luria que contenían 50 µg/ml de ampicilina, se suspendió en 10 mi de caldo Luria que contenía 50 µg/ml de ampicilina, y se dejó desarrollar a 37°C durante una hora, con agitación. Se aisló plásmidos recombinantes del cultivo utilizando el procedimiento de lisis alcalina. Se digirió aproximadamente 0.1 a 1.0 microgramos de preparación de plásmido crylC con Nhel para linealizar las moléculas plásmidas que alojan el sitio Nhel de pEG943. Luego se usó la preparación de plásmido para transformar la cepa acristalífera de B. thuringiensis EG10640 a resistencia al cloranfenicol, utilizando electroporación. Debido a que los ADN lineales no transforman eficientemente B. thuringiensis, el paso de división con Nhel garantiza que virtualmente todos los clones recuperados de la transformación, codifiquen las sustituciones en la posición 220 y la lisina en la posición 219. Se transfirió colonias resistentes al cloranfenicol, individuales, a agar de almidón o placas Luria que contenían 3 µg/ml de cloranfenicol. Para confirmar la transferencia de los plásmidos crylC a EG 10640, se inoculó clones individuales en 3 mi de BHIG que contenía 3 µg/ml de cloranfenicol y se desarrolló a 30°C hasta que los cultivos fueron turbios. Se aisló los ADN plásmidos de los cultivos en caldo usando el método de lisis alcalina y se confirmó la identidad del plásmido mediante análisis con enzima de restricción. Se designó a los mutantes de Cry1 C-R148D que contienen sustituciones en S220, Cry1C-pr66-1 , -2, -3, etc. También se generó sustituciones de aminoácido en las posiciones de aminoácido 217, 218, 219, 221 y 222 en CrylC, utilizando este procedimiento y los siguientes sensibilizadores oligonucleótidos mutágenos: Posición 217: Sensibilizador M (SEQ ID NO: 65): 5'-CGGGGATTAAATAATNNACCGAAAAGCACGTATCAAGATTGGATAAC-3' N(16) = 50% de C, 50% de G; N(17) = 33.3% de C, 33.3% de G, 33.3% de A.
Posición 218: Sensibilizador N (SEQ ID NO: 66) 5'-CGGGGATTAAATAATTTANNAAAAAGCACGTATCAAGATTGGATAAC-3' N (19) = 50% de C, 50% de G; N (20) = 33.3% de C, 33.3% de G, 33.3% de A.
Posición 219: Sensibilizador O (SEQ ID NO: 67): 5'-CGGGGATTAAATAATTTACCGNNAAGCACGTATCAAGATTGGATAAC-3' N (22) = 50% de C, 50% de G; N (23) = 33.3% de C, 33.3% de G; 33.3% de A.
Posición 221 : Sensibilizador P (SEQ ID NO: 68): 5'-GGATTAAATAATTTACCGAAAAGCNNATATCAAGATTGGATAACATATAATCG-3' N (25) = 50% de C, 60% de G; N (26) = 33.3% de C, 33.3% de G, 33.3% de A.
Posición 222: Sensibilizador Q (SEQ ID NO: 69): 5'-GGATTAAAT TTTACCGAAAAGCACGNNACAAGATTGGATAACATATAATCG-3' N (28) = 50% de C, 50% de G; N (29) = 33.3% de C, 33.3% de G, 33.3% de A. El cuadro 15 presenta una lista de los mutantes CrylC que se espera se deriven del procedimiento de mutagénesis.
CUADRO 15 RESUMEN DE MUTANTES CRY1 C-R148P, RIZO ALFA6-7 Posición Aminoácido SensibiSustituciones de Designación del de de tipo lizador aminoácido mutante aminoácid silvestre predichas o 217 Leucina M R, E, Q , A, G, P CrylC pr67-l, - 2, -3, etc. 218 Prolina N R, E, Q, A, G, P CrylC pr65-l, - 2, -3, etc. 219 Lisina O R, E, Q, A, G, P CrylC pr70-l, - 2 , -3 , etc . 221 Treonina P R, E, Q, A, G, P CrylC pr68-l, - 2, -3, etc. 222 Tirosxna Q R, E, Q, A, G, P CrylC pr69-l, - 2, -3, etc.
EJEMPLO 11 MUTANTES COMBINATORIOS CRY1 C-R148D, RIZO ALFA5-6 Se usó un procedimiento PCR™ de extensión por traslape, similar, para generar mutantes Cryl C R148D, que contenían sustituciones de aminoácido en el rizo alfad-6, incluyendo las posiciones de aminoácido 178-184. Los sensibilizadores oligonucleótidos mutágenos usados para generar las mutaciones que codifican las sustituciones en el rizo alfad-6, aparecen en la siguiente lista. Posición 178: Sensibilizador R (SEQ ID NO: 70): 5'-GATTCTGTAATTTTTNNAGAAAGATGGGGATTGACAACGATAAATGTCAATG-3' N (16) = 50% de C, 50% de G; N (17) = 33.3% de C, 33.3% de G, 33.3% de A.
Posición 179: Sensibilizador S (SEQ ID NO: 71 ): '-GATTCTGTAA I I I I I GGANNAAGATGGGGATTGACAACGATAAATGTCAATG-3' N (19) = 60% de C, 60% de G N (20) = 33.3% de C, 33.3% de G, 33.3% de A.
Posición 180: Sensibilizador T (SEQ ID NO: 72): '-GATTCTGTAA I I I I I GGAGAANNATGGGGATTGACAACGATAAATGTCAATG-3' N (22) = 60% de C, 60% de G; N (23) = 33.3% de C, 33.3% de G, 33.3% de A.
Posición 181 : Sensibilizador U (SEQ ID NO: 73): '-TCTGTAATTTTTGGAGAAAGANNAGGATTGACAACGATAAATGTCAATGAAAAC-3' N (22) = 60% de C, 60% de G; N (23) = 33.3% de C, 33.3% de G, 33.3% de A.
Posición 182: Sensibilizador V (SEQ ID NO: 74): '-TAAI I I I I GGAGAAAGATGGNNATTGACAACGATAAATGTCAATGAAAAC-3' N (22) = 60% de C, 50% de G; N (23) = 25% de C, 25% de G, 25% de A, 25% de T.
Posición 183: Sensibilizador W (SEQ ID NO: 75): '-GTAATTTTTGGAGAAAGATGGGGANNAACAACGATAAATGTCAATGAAAAC-3' N (25) = 60% de C, 50% de G; N (26) = 25% de C, 25% de G, 25% de A, 25% de T.
Posición 184: Sensibilizador X (SEQ ID NO: 76): 5'-GTAA I I I I I GGAGAAAGATGGGGATTGNNAACGATAAATGTCAATGAAAAC-3' N (28) = 50% de C, 50% de G; N (29) = 25% de C, 25% de G, 25% de A, 25% de T. Se llevó a cabo primeramente una PCR™ usando los sensibilizadores opuestos H (SEQ ID NO: 62) y F (SEQ ID NO: 20) y ei plásmido pEG943, como plantilla, para generar un fragmento de ADN que contenía las mutaciones R148D y K219A, así como el sitio de restricción único Nhel, que marca la mutación K219A (figura 10). A fin de generar los fragmentos crylC que alojan las mutaciones de rizo aifad-6, se operó las PCR usando un sensibilizador mutágeno (por ejemplo, el sensibilizador R) y el sensibilizador opuesto L (SEQ ID NO: 64) (figura 11 ). Se purificó los fragmentos de ADN amplificados, después de electroforesis en gel de agarosa, utilizando el procedimiento Geneglean II®. Para la PCR™ de extensión por traslape, se mezcló cantidades aproximadamente equimolares de los dos fragmentos de ADN y se amplificó usando los sensibilizadores flanqueadores H (SEQ ID NO: 52) y L (SEQ ID NO: 64). Se digirió los productos de amplificación con las enzimas de restricción Bbul y Agel, se subclonó los fragmentos resultantes Bbul-Agel crylC en un vector de expresión crylC, y se construyó los transformantes EG10650 de ß. thuringiensis como se describió en el ejemplo 10. El cuadro 16 resume los mutantes de CrylC predichos del procedimiento de mutagénesis.
CUADRO 16 RESUMEN DE MUTANTES CRY1C-R148D RIZO ALFA5-6 EJEMPLO 12 EVALUACIÓN POR BIOANÁLISIS DE LOS MUTANTES COMBINATORIOS CRY1C-R148D Se desarrolló transformantes EG10650 que contenían los genes crylC en medio C2; se recuperó las suspensiones de espora-proteína cristalina y se efectuó bioanálisis de una dosis contra larvas neonatas de S. Exigua y T ni, como se describió en el ejemplo 4. Se usó ia cepa EG11832 (Cry1C-R148D) como cepa de control en estos bioanálisis. Se ajustó típicamente las diluciones de las suspensiones de espora-cristal, para obtener la mortandad de 20-40% con la cepa EG11832. Los tamices de una sola dosis, duplicados, de los mutantes combinatorios Cry1 C-R148D identificaron diversos mutantes con mortandad incrementada. Se desarrolló dieciséis de estos mutantes nuevamente en medio C2 y se cuantificó sus proteínas cristalinas CrylC como se describió en el ejemplo 4. Se llevó a cabo bioanálisis de una sola dosis contra S. Exigua usando 50 ng de proteína Cryl C por concavidad de dieta. Se efectuó bioanálisis de una ola dosis contra T. ni usando 25 ng de proteína CrylC por concavidad de dieta. Los resultados de esos bioanálisis están mostrados en el cuadro 17. También se probó muestras triplicadas de la cepa de control EG11832 (Cry1 C-R148D). Varios mutantes combinatorios Cry1 C-R148D muestran toxicidad incrementada (aproximadamente al doble) contra S. Exigua cuando se compara con EG11832 (Cry1 C-R148D). Varios de esos mutantes, incluyendo Cryl C 7-3, Cryl C 66-19 y Cryl C 69-24, también mostraron excelente toxicidad para T. ni.
CUADRO 17 TOXICIDAD DE MUTANTES COMBINATORIOS CRY1C R148D CONTRA TRICHOPLUSIA NI Y SPODOPTERA EXIGUA Porcentaje de mortandad obtenido utilizando 25 ng de proteína crylC por concavidad de dieta de 175 mm2, 64 larvas por análisis. Porcentaje de mortandad obtenido utilizando 60 ng de proteína CrylC por concavidad de dieta de 17d mm2, 64 larvas por análisis. .13.- EJEMPLO 13 SECUENCIAS DE AMINOÁCIDO DE LAS PROTEÍNAS CRISTALINAS MODIFICADAS 3.1.- SECUENCIA DE AMINOÁCIDO DE CRY1 C-R148A (SEQ ID NO: 2) Met Glu Glu Asn Asn Gln Asn Gln Cys lie Prc Tyr Asn Cys Leu Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg ie Ser Thr Gly Asn Ser Ser lie Asp l e Ser Leu Ser Leu Val Glr. Phe Leu Val Ser Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu lie Asp Phe Val Trp Gl/ lie Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln lie Glu Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn lis Tyr Val Glu Ala Phe Lys Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Thr Arg Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He Pro Ser Phe Ala He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He Phe Gly Glu Arg Trp Gly Leu Thr Thr He Asr. Val Asn Glu Asn Tyr Asn Arg Leu He Arg His He Asp Glu Tyr Ala Asp Kis Cys Ala Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asr. Arg Arg Tyr Pro I] Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Asp Pro Leu He Asn Phe Asn Pro G n Leu Gln Ser Val Ala Glr. Leu Pro Thr Phe Asn Val Met Glu Ser Ser Ala He Arg Asn Pro K s Leu Fhe Asp He Leu Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly H?.=. Arg Val He Ser Ser Leu He Gly Gly Gly Asn He Thr Ser Pro He Tyr Gly Arg Glu Ala Asr. Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Prc Pro Phe Asn Leu Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Gl- Leu Pro Pro Glu Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser Kis Arg Leu Cys His Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro Glu Arg He Asr. Gln He Pro Leu Val Lys C-ly Phe Arg Val Trp Gly Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Asp He Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu sin Val A£n He Asn Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Pr.í Arg Tyr .Ala Ser Ser Arg Asp Ala Arg Val He Val Leu Thr Gly Ser Thr G v Val Gly Gly Glr. Val Ser Val Asn Met Pro Leu e Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Thr Aso Pr.e Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp He i.» be: lu Gln Pro Leu Phe Gly Ala Gly Ser He Ser Ser Leu Z-.-? le Asp Lys He Glu Ha He Leu Ala Asp Ala Thr Glu Ala Glv Ser Asp Leu Glu Arg Ala Glr. Lys Ala Val Asn Ala Phe Thr Ser -er Asn Gln He Gly Leu Lys Thr Asp '/al Tnr Asp He Asp G n Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Pr. Leu Asp Giu Lys Arg Glu Leu Ser Glu Lys Val Lys Kis Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Glr. Asp Pro Asr. Phe Arg < _ le Asn rg Gln Pro Asp Arg Gly Trp Arg Gly Ser Tnr Asp He ' He Gln 31y Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu : ,'a A.sp Glu Cys T'/r Pro Thr Tyr Leu Tyr G n Lys He Asp Glu Ser _jV3 Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Giy Tyr T - Asp Ser Gln Asp Leu Glu He Tyr Leu lie Arg Tyr Asn Ala Lys His Glu He Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala GIr- Ser Prc He Gly Lys Cys Gly Glu Pro Asn Arg Cys A.la Pro H s Leu Glu Trp Asr.
Pro As Leu Asp Cys Ser Cys Arg Asp G_y Glu — T 3 Cys Ala Hl? Hl? Ser Hl? Kis Pne Thr Le Asp He Asp — Gl C/? Tnr A.sp Leu Asn Glu Asp Leu G Val Trp Val He Pne ?_? S He Lys Thr Gln Asp Gly Kis Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Prc Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Val Asp Thr Asn He Ala Met He HlS Ala Ala Asp Lys Arg Val His Arg He Arg Glu Ala Leu Pro Glu Leu Ser Val J.—5 Pro Gly Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Pne Thr Ala Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val He Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr He Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val A y Pro Asn Asn Thr Val Tnr Cys Asn Asn Tyr Thr Gly Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Glr. Gly Tyr Asp Glu Ala Tyr G-y Asn Asn Pro Ser Val Pro Ala Asp Tvr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Giy Arg Arg Giu Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Giy Tyr Val Thr Lys Asp Leu Glu -^ ^ Phe Pro Glu Tnr Asp Lys Val Trp He Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu Leu Leu Ket Glu Glu .- SECUENCIA DE AMINOÁCIDO DE CRY1C-4148D (SEQ ID NO: 4 Met Glu Giu Asn Asn Gln Asn Gln Cys ?le Pro Tyr Asn Cys Leu Ser Asn Pro Giu Glu Val Leu Leu Asp Gly Glu Arg He Ser Thr Giy Asn Ser Ser He Asp He Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu He Asp Phe Val Trp Gly He Val Gl Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu Gln Leu He Asn Giu Arg He Ala Glu Phe Ala Arg Asn Ala Ala lie Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe. Asr. He Tyr Glu Ala Phe Lys Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Thr Arg Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He Pro Ser Phe Asp _ 1e Ser Giy Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Glp Ala Ala .Acm Leu His Leu Ala lis Leu Arg Asp Ser Val He Phe Gi Giu ?1* ~ T p iy Leu Thr Thr He Asn Val Asn Giu Asn Tyr Asn Arg Leu Arg u - 2 He Asp Glu Tyr Ala Asp Hl? '.'? Ala Asn Thr Tvr As Arg .j * y Leu Asn Asn Leu Pro Lys Ser Thr Tyr Glr. Asp Trp 1 i= Thr Tyr Ajn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp He Ala Zi-.e Pr-.e Pro Asn Tyr Asp Asn Arg Arg Tvr Pro He Glr. Pro Val Gl H:? 1¿J Arg Glu . a— T'.'r Thr Asp P o Leu He Asn Ph--- Asn I rc '.-. Leu G1-. Ser Val A.ia Gin Leu Pro ~hr Phe Asn Val He- JIU Ser Zsr Ala p= Arg Asn Pro Kis Leu Phe As He Leu Asn Asn Leu T He Phe Thr Asp Trp Phe Ser- Val Giy Arg Asn Phe Tyr rt,-.-. Gly r- ' . . His Arg Val He Ser Ser Leu He Gi Gly Giy A?? He Thr Ser Pro 1_e Tyr Giy Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn —V Pro Val Phe Arg V-v Leu Ser ??? Pro Thr Leu Arg Leu Leu la Glr. Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Giu Giy '.' l Giu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Glv Arg Gl Thr Val Asp Ser Leu ™ - Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro Arg Glu Giy Tyr Ser Hl? Arg Leu _V3 HI? Ala Thr P e Val Glr, Arg Ser Gly Thr Pro Phe Leu Thr Thr Giy Val Val Phe Ser Trp Th His Arg Ser Ala Leu Thr Asn Thr He Asp Pro Glu Arg He Asn Gin lie Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val X ? Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu Arg Arg Asn Thr P.ie Gly Asp Phe Val Ser Leu G_n Val Asn He Asn Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val li Val Leu Thr Gly Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser . a— Asn Me: Pro Leu Gln Lys Thr Met Glu He Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Giu Gln Pro Leu Phe Giy Ala Gly Ser He Ser Ser Gly Giu Leu Tyr He Asp Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn Glr. He Gly Leu Lys Thr Asp Val Thr Asp Tvr His He Asp Gin Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Giu Lys Arg Glu Leu Ser Glu Lys Val Lys Hl? Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Giu Leu Arg Gly Tyr He Glu As Ser Gin Asp Leu Giu He Tyr Leu He Arg Tyr Asn ?_ Lys His Glu He Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He Gly Lys Cys Gly Giu Pro Asn Arg Cys Ala Pro Kis Leu Glu Trp Asn Pro Asp Leu As Cys Ser Cys Arg Asp Gly Giu Lys Cys Ala Kis His Ser H s Kis Phe Thr Leu Asp He Asp Val Gl Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val lie Phe Lys He Lys Thr Gln Asp Gly Kis Ala Arg Leu Asr. Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Lys -L-V"S Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala Lys Giu Ser Val Asp Ala Leu Phe Val Asn Ser Gin Tyr Asp Arg Leu Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val His Arg He Arg Glu Ala Tyr Leu Pro Giu Leu Ser Val He Pro Gly Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Giy Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Gly Kl? Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val He Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Giy Arg Tyr He Leu Arg Val Thr Ala Tyr Ly? Glu Gly Tyr Gly Glu Gly Cys Val Thr He Hl? Glu He Glu Asp Asr. Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro A?? Asn Thr Val Thr Cys A.sn Asn Tyr Thr Gly Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Tpr Ser --rg Asn Gln Giy Tyr Asp Glu Ala Tyr Gly A.s Asn Pro Ser al Prc Ala Asp Tyr Ala Ser Val Tyr Glu Giu Lys Ser Tyr Thr Asp Gl .-i Arg Giu Asn Pro Cys Glu Ser Arg Tyr Gly Asp Tyr Thr P o Leu p " A Giy Tyr Val Thr Lys Asp Leu Tyr Phe Pro Gl Thr «.S Lys Val Trp He Glu He Gl Glu rn . v Glu Gly Thr Phe He Val Asp Val Glu Leu Leu Leu Met Gia Glu .- SECUENCIA DE AMINOÁCIDOS DE CRY1C-R180A (SEQ ID NO: 6) Mee Glu Glu Asn Asn Gin Asn Gln Cys t? ß - 's Leu Ser Asn Pro Giu Glu Val Leu Leu Asp Gly Glu A.rg He Sel- Tnr Gly Asn Ser Ser He Asp He Ser Leu Ser Leu Val Glr. Pne Leu Val Ser Asn Phe Val Pro Gly Gly Giy Phe Leu Val Giy Asp Pne Val Trp Gly He Val Gly Pro Ser Gln Trp Asp Ala Leu Val Gln He Glu Gln Leu He Asp Glu Arg He Ala Glu Phe .«._a Arg Asn Ala Ala He Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asr. He Tyr Val Glu Ala Phe Lys Glu Trp Glu Giu Asp Pro Asn Asn Pro Ala Thr Arg Thr Arg Val He Asp Arg Phe Arg He Leu Asp Giy Leu Leu Giu Arg Asp He Pro Ser Phe Arg He Ser Gly Phe Glu Val Prc Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn Leu Hl? Leu Ala He Leu Arg A.s Ser Val He Phe Gly Glu Ala Trp Gly Leu Thr Thr He A=n Val Asn Glu Asn Tyr Asn Arg Leu He Arg His He Asp Glu Tyr Ala Asp H s Cys Ala Asn Thr Tyr Asn Arg Gly Leu A?? Asn Leu Pro Lys Ser Thr Tyr Gin Asp Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Leu Thr Val Leu Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He Gln Pro Val Gly Gin Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Glu Ser Ser Ala He Arg Asn Pro Kis Leu Phe Asp He Leu Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His Arg Val He Ser Ser Leu He Gly Gly Gly Asn He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Giy Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Prc Pro Glu Asp Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro Glu Arg He Asn Gin He Pro Leu Val Lys Gly Phe Arg Val Trp Gly Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu Arg Arg Asn Thr Phe Gl Asp Phe Val Ser Leu Gln Val Asn He Asn Ser Pro He Thr Glr. Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Giy Val Gly Giy Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Ket Glu He Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro As He He Gly He Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Glu Leu Tyr He Asp Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr Kis He Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Giu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Giy He Asn Arg Gln Pro Asp Arg Giy Trp Arg Giy Ser Thr Asp He Thr He Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Ly? Ala Tyr Thr Arg Glu Leu Arg Gly Tyr He Glu Asp Ser Gln Asp Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys His Glu He Val Asr.
Val Pro Thr Gly Ser Leu Trp Pro Leu Ser Ala Gir. Ser Pro He Gly Lys Cys Giy Glu Pro Asn Arg Cys Ala Pro Kis Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg As Gly Giu Lys Cys Ala H s His Ser Hl? Hl? Phe Tir* Leu Asp Asp Val Giy Cys Thr Asp Leu Asn Glu As Leu Gly Val Trp Val He Phe Lys He Lys Tnr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Giy Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gin Leu Glu Thr Asn He Val Tyr Lys Glu Ala Lys Glu Ser Val Asp A.a Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Val Asp Thr Asn He Ala Met He His Ala Ala Ase Lys Arg Val His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly Val Asn Ala Ala He Pne Glu Glu Leu Glu Gly Arg He Fhe Thr Ala Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asr. Giy .Asp Pne Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Gly Kis Val Asp Val Glu Glu Gln Asn Asr. His Arg Ser Val Leu val He Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr He Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Giy Cys Val Thr He His Glu He Giu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Giu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly Thr Gln Glu Glu Tyr Giu Gly Thr Tyr Thr Ser Arg Asr. Gln Gly Tyr Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro A.la A.sp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tvr ' Thr • Asp Gly Arg Arg Glu Asn Pro Cys Giu Ser Asn Arg Giy ' Tyr Giy - Aspi Tyr Thr Pro Leu Pro A a Giy Tyr Val Thr Lys Asp Leu Glu Phe : Pro Glu Thr Asp Lys Val Trp He Glu He Gly Glu Thr Glu Gly - Thr - Phe He Val Asp Ser Val Glu Leu Leu Leu Met Giu Glu .4.- SECUENCIA DE AMINOÁCIDO DE CRY1 C.563 (SEQ ID NO: 8) Met Glu Glu Asn As Gln Asn Gln Cys He Pro Tyr Asn Cys Leu Ser Asn Pro Glu Glu Val Leu Leu Asp Giy Glu Arg He Ser Thr Gly Asn Ser Ser He As He Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn Phe Val Pro Gly Gly Giy Phe Leu Val Gly Leu He Asp Phe Val Trp Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu Gln Leu He As Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala Phe Lys Glu Trp Glu Asp Asp Pro H s Asn Pro Thr Thr Arg Thr Arg Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He • Pro Ser Phe Arg He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He Phe Gly Glu Arg Trp Gly Leu Thr Thr He Asn Val Asn Giu Asp Tyr Asn Arg Leu He Arg H_S lie Asp Glu Tyr Ala Asp His Cys A-.a Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tvr Glr. A?p Trp He Thr Tyr Asn A.rg Leu Arg Arg As Leu Thr Leu Thr Val Leu Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He Gln Pro Val Gly Gin Leu Thr Arg Giu Val Tyr Thr Asp Pro Leu He Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Giu Ser Ser Ala He Arg Asn Pro His Leu Phe As He Leu Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Giy Gly His Arg Val He Ser Ser Leu He Gly Giy Gly Asn He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg Gly Val Gl Gly Val Glu Phe Ser Thr Prc Thr Asn Ser Pne Thr Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val ?ro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys Hl? Ala Thr Phe Val Gln Arg C ^T Gly Thr Pro Phe Leu Thr Thr G1y Val Val Phe Ser Trp Thr Kis Arg Ser Ala Thr Leu Thr Thr Asp Pro Glu Arg He Asn Gin 1."3 Pro Leu Val Lys Gly Phe Arg Val Trp Gl Gly Thr Ser Val He Giy Pro Gly Phe Thr Gly Gly Asp 1s Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val A.on He Asn Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val I le Val Leu Thr Gly Ala Ala Ser Val Giy Giy Gir. Val Ser Val Asn Met Pro Leu Gln Lys Thr Ket Giu He Giy Giu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp He lie G y He Ser Glu Gln Pro Leu Fhe Gly Ala Gly Ser He Ser Ser Gly Glu Leu Tyr —i ".s Asp Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val A?G. Ala Leu Phe Tnr Ser Ser Asn Glr. He Gly Leu Lys Thr Asp Val Thr Asp Tyr Hl? He A-sp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Giu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Ai g Leu Ser Asp Glu Arg Asn Lea Leu Glr. As Pro Asn Phe Arg Gly He Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Giy Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gl . Leu Arg Gly Tyr He Glu A.sp Ser Gin Asp Leu Giu He Tyr Leu He Arg Tyr Asn Ala Lys H ? Glu He Val Asn Val Pro Giy Thr Gly Ser Leu Trp Prc Leu Ser Ala Gln Ser Pro He Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro H ? Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln A?D Gly Hl? Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gin Tyr Asp Arg Leu Gln Val Aap Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val Kis Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Ala Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn Asn Gly Leu Lea Cys Trp Asn Val Lys Gly H s Val Asp Val Glu Glu Gln Asn Asn Hl? Arg Ser Val Leu Val He Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Glv Tyr He Leu Arg Val Thr Ala Tyr LV? Glu Gly Tyr Gly Glu Gly Cys Val Thr He His Giu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys A.sn Asn Tyr Thr Gly Thr Gln Glu Tyr Glu Gly Asn Gln Giy Tyr Asp Glu Ala T-.-r Gly Asn Asn Pro Ser Val Pro A.la Asp Tyr Ala Ser Val Tyr Gia Gi Lys Ser Tyr Thr Asp 31 y Arg A.rg Glu Asn Pro Cys Glu Ser Asn Ara Giy Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val Thr Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He Glu He Giy GÍJ Thr Glu Gly Thr Pne He Val Asp Ser Val Glu Leu Leu Leu Met Giu Glu .- SECUENCIA DE AMINOÁCIDO DE CRY1C.579 (SEQ ID NO: 10) Met Glu Glu Asn Asn Gln Asn Gln Cys He Pro Tyr Asn Cy? Leu Ser Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg He Ser Thr Giy Asn Ser Ser He Asp He Ser Leu Ser Leu Val Glr. Phe Leu Val Ser Asn Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu H° Asp Phe Val Trp Gly He Val Giy Pro Ser Gln Trp Asp Ala Phe Leu Val Glr. He Glu Gln Leu He Asn Glu Arg He Ala Giu Phe Ala Arg Asn Ala Ala He Alaf Asn Leu Gi a G " Leu Gly Asn Asr. Glu Ala Phe Lys Glu Trp Gla Val Asp Pro Asr. A=n Pro Thr Arg Thr Arg Val He Asp Arg Phe Arg He Leu Asp J-V Leu Leu Glu Arg Asp He Pro Ser Phe Arg He Ser Giv Phe Gl Val Prc Leu Leu Ser Val Tyr Ala Gin Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He Phe Gly Giu Arg Trp Gly Leu Thr He Asn Val Asn Glu Asr. Tyr Asn Arg Leu He Arg Hl? He Asp Giu y A_a. ---?P Kis C/s Ala Asn Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys er Thr Tvr Gln Asp Trp He Thr Tyr Asn Arg Leu Arg Arg A.sp Leu T ~ Leu Thr Val Leu Asp He Ala Ala Phe Phe Pro Asn Tvr Asp Asr. Arg Arg Tyr Prc He Gln Pro Val Gly Glr. Leu Thr Arg Giu .a Tyr Thr Asp Pro Leu He Asn Phe Asn Pro Gln Leu Gln Ser Va_ Ala Gln Leu Prc Thr Phe Asn Val Met Glu Ser Ser Ala He Arg A?G. Pro Kis Leu Phe Asp He Leu Asn Asn Leu Thr Phe Thr Asp Trp Pne Ser Val ..y ?rg Asn Phe Tyr Trp Gly Gly His Arg Val He Ser Ser Leu He / Gly Gly Asn He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Glr. Glu Pro Pro Arg Ser Phe Thr Pne Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe As Leu Arg Gly Val Glu Gly Val Giu Phe Ser Thr Pro Asn Ser Phe Thr Tyr Arg Giy Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Pro Arg Glu Gly Tvr Ser His Arg Leu Cys His Ala Thr Pne Val Gln Arg Ser Giy Thr _?ro_ Phe Leu Thr Thr Gly Val Val Phe Ser Trp Thr Kis Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro Glu Arg lie Asn Gln He Pro Leu Val Lys Giy ??s Arg Val Trp Gly Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Giy Asp He Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn He Asn Ser Pro He Thr Gin Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val He Val Leu Thr Giy Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Glr. Lys Thr Met Glu He Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr ""-.r Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Giy He Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Glu Leu Tyr He Asp Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu P-ü? Thr Ser Ser Asn Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr Kis He Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Giu Phe Cys Leu Asp Glu Lys Arg Giu Leu Ser Giu Lys Val Lys His Ala Ly? Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Giy He Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Gly Asp Asp Val Phe Lys Giu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu Cys Tyr Pro Thr Tyr Leu Gln Lys He Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg m. tv. Glu Leu Arg Gly Tyr He Glu Asp Ser Gin Asp Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys Kis Glu He Val Asn Val Pro Gl Thr Giy Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He Giy Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro K s Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser Hl? His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn Glu A?p Leu Gly Val Trp Val He Phe Lys He Lvs Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu L?s Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu .-V3 Lys Trp Arg Asp Lys Arg Glu Ly? Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala Lys Giu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Val Asp Thr Asn He Ala Met He His Ala Asp Lys Arg Val His Arg He Arg Giu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly Val Asn Ala Ala He Phe Glu Glu Leu Giu Gly Arg He Phe Thr Ala Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Gly H s Val A.sp Val Glu Glu Gln Asn Asr. Hl? Arg Ser Val Leu Val He Pro Glu Trp Giu Ala Glu Val Ser Glr. Giu Val Arg Val Cys Pro Gly Arg '- " V vr I"e Leu Arg Val Tyr C-i Gl Tyr Gly Gl Jiy -* "3 '. a_ Thr He His Glu He Glu Asp Asn Thr Asp Glu Leu Lys Fhe Ser Asn Cys Val Glu Glu Glu Val Tvr Pro A.sn Asn Thr Val ~u,- Cys .—-sn Asr. Tvr Thr Gly Thr Glr. Glu Glu Tyr Giu Gly Thr Tyr Thr Ser Arg Asr. Gln Giy Tyr Asp Glu Ala Tvr Gl Asn Asn Pro Ser Val Pro Asp Tvr Ala Ser Val Tyr Glu Glu Lys Ser Tvr Thr Asp Gly Arg A.r Glu Asn Pro Cys Glu Ser Asr. Arg Gl Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr A.sp Lys Val Trp He Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Giu Leu Leu Leu Met Glu Glu .6.- SECUENCIA DE AMINOÁCIDO DE CRY1C.499 (SEQ ID NO: 12) Met Glu Giu Asn Asr. Gln Asn Gin Cys He Pro —..„ A.sn Cys Leu Ser Asn Pro Glu Glu Val Leu Leu Asp G?y Giu Arg 1le Ser Thr Gly Asn Ser Ser He Asp He Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn Phe Val Pro Gly Gly Giy .Phe Leu Val Gly Leu lie Asp Phe Val Trp Gly He Val Gly Pro Ser Gln Tro Asp Ala Phe Leu Val Glr. He Glu Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn lie Tyr Val Glu Ala Phe Lys Glu Trp Giu Glu Asp Pro His Asn Pro Ala Thr Arg Thr Arg Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He Pro Ser Phe Arg He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He Phe Giy Glu Arg Trp Gly Leu Thr Thr He Asn Val Asn Glu Asn Tyr Asn Arg Leu He Arg Hl? He Asp Glu Tyr Ala Asp His Cys Ala Asn Thr Tyr Aan Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tvr Gln Asp Trp He Tr~- Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu Asp He Aia Ala Phe Phe Pro Asn Tyr Asp Asn ,?rg Arg Tyr Pro He Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr rr . y. Asp Pro Leu He Asn Phe Asn Pro Gin Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn Val Met Giu Ser Ser Ala He Arg Asn Pro His Leu Phe Asp He Leu Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe Tyr Trp Gly Gly His Arg Val He Ser Ser Leu He Gly Gly Asn He Thr Ser Pro lie Tyr Gly Arg Glu Ala Asn Gin Glu Pro Pro Arg Ser Phe Thr Phe Asr. Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr Leu Arg Leu Leu Glr. Gin Pro Trp Pro Ala Pro Pro Phe A.sn Leu Arg Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp Asn Ser Val Pro Prc Arg Glu Giy Tyr Ser His Arg Leu Cys His Ala Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu —r- Thr Gly Val Val Phe Ser Trp Thr H s Arg Ser Ala Thr Leu Thr Asn. Thr He Asp Pro Glu Arg He Asn Gin He Pro Leu Val Lys Gly Fhe A.rg Val Trp Gly Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gl -i. y Asp He Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn He Asn Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tvr Ala Ser Ser Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ss * Thr Giy Val Gly Gly Gin Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu He Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Giy He Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Glu Leu Tyr He Asp Lys He Giu He He Leu Ala Asp Ala Thr Phe U— Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr H s He Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Giu Phe Cys Leu Asp Glu Lys Arg Giu Leu Ser Giu Lys Val Lys His Ala Lys Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Asr. Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Asp He Thr He Gln. Gly Gly As Asp Val ??s Lys Giu Asr. Tyr Val Thr Leu Pro "* • * Thr Val Asp Glu Cys Tyr Pro Thr - - Leu Tyr Gln Lys He Asp C! • * Ser Lys Leu Lys Ala Tvr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Gin Asp Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys Hx= Glu He Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Pro He Gly Lys Cys Gly Glu Pro Asn Arg Ala Pro 113 Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys VS Ala Hia His Ser Kis Kis Phe Thr Leu j\sp He Asp Val Gl Cys Thr Asp Leu Asn Glu Asp Leu Gl Val Trp Val He Phe Lys He Lys Tnr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Gla Phe Leu Glu Gi L s Pro Leu Leu Gly Glu Ala Leu Al Arg Val Lys Arg Ala Gl- Lys Lys Trp Arg Asp Lys Arg Gl- Lys Leu Gin Leu Glu Thr Asn l = Val T Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Val Asp Tnr Asr. He Ala Met He His Ala Asp Lys Arg Val Hl? Arg He Arg Gia Ala Tyr Leu Pro Glu Leu Ser* Val He Pro Gly Val Asn Ala Ala He Phe Glu Giu Leu Glu Gly Arg He Phe Thr Ala Tyr Ser Leu Tyr A?p Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn Asn Gly Le- Leu Cys Trp Asn Val Lys Giy His Val Asp Val Glu Glu Gln Asn Asn Kis Arg Ser val Leu Val He Pro Trp Glu Ala Glu Val Ser Gin G- Val Arg Val Cys Pro Gly Arg Tyr He Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Glu He He His Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Glu Asn Cys Glu Val Val Glu Tyr Pro Asr. Asn Thr Val Thr Cys Asn Asn Thr Tyr Thr Gln Gly Glu Glu Tyr Gia Gly Thr Tyr Thr Ser A.rg Asn Asp Gl Gly Glu Ala Tyr Tyr Gi/ Asn Asn Pro Ser Val Pro Ala Asp Val Tyr Tyr Ala Glu Ser Glu Lys Ser Tyr Thr Asp Gly Arg Arg Glu Glu Asn Ser Pro Asn Arg Cys Gly Tyr Giy Asp Tyr Thr Pro Leu Pro Val Ala Thr Gly Lys Tvr Asp Leu Gla Tyr Phe Pro Glu Thr Asp Lys Glu Val Trp He Gly He Glu Thr Glu Gly Thr Phe He Val Asp Leu Ser Val Leu Met Glu Leu Giu Glu .14.- EJEMPLO 14 SECUENCIAS DE ÁCIDO NUCLEICO DE LOS GENES QUE CODIFICAN PROTEÍNAS CRISTALINAS MODIFICADAS CRY1C* 14.1.- SECUENCIA DE ÁCIDO NUCLEICO DE CRY1C-R148A (SEQ ID NO: 1) ATGGAGGAAAATAATCAAAATCAATGCATACCTTACAATTGTTTAAGTAATCCTGAAGAAGTACTTTTGGAT GGAGAACGGATATCAACTGGTAATTCATCAATTGATATTTCTCTGTCACTTGTTCAGTTTCTGGTATCTAAC TTTGTACCAGGGGGAGGATTTTTAGTTGGATTAATAGATTTTGTATGGGGAATAGTTGGCCCTTCTCAATGG GATGCATTTCTAGTACAAATTGAACAATTAATTAATGAAAGAATAGCTGAATTTGCTAGGAATGCTGCTATT GCTAATTTAGAAGGATTAGGAAACAATTTCAATATATATGTGGAAGCATTTAAAGAATGGGAAGAAGATCCT AATAATCCAGCAACCAGGACCAGAGTAATTGATCGCTTTCGTATACTTGATGGGCTACTTGAAAGGGACATT CCTTCGTTTGCAATTTCT'-GATTTG AGTACCCCTTTTATCCGTTTATGCTCAAGCGGCCAATCTGCATCTA GCTATATTAAGAGATTCTGTAATTTTTGGAGAAAGATGGGGATTGACAACGATAAATGTCAATGAAAACTAT AATAGACTAATTAGGCATATTGATGAATATGCTGATCACTGTGCAAATACGTATAATCGGGGATTAAATAAT TTACCGAAATCTACGTATCAAGATTGGATAACATATAATCGATTACGGAGAGACTTAACATTGACTGTATTA GATATCGCCGCTTTCTTTCCAAACTATGACAATAGGAGATATCCAATTCAGCCAGTTGGTCAACTAACAAGG GAAGTTTATACGGACCCATTAATTAATTTTAATCCACAGTTACAGTCTGTAGCTCAATTACCTACTTTTAAC GTTATGGAGAGCAGCGCAATTAGAAATCCTCATTTATTTGATATA.TTGAATA?TCTTACAATCTTTACGGAT TGGTTTAGTGTTGGACGCAATTTTTATTGGGGAGGACATCGAGTAATATCTAsCCTTATAGGAGGTGGTAAC ATAACATCTCCTATATATGGAAGAGAGGCGAACCAGGAGCCTCCAAGATCCTTTACTTTTAATGGACCGGTA TTTAGGACTTTATCAAATCCTACTTTACGATTATTACAGCAACCTTGGCCAGCGCCACCATTTAATTTACGT GGTGTTGAAGGAGTAGAATTTTCTACACCTACAAATAGCTTTACGTATCGAGGAAGAGGTACGGTTGATTCT TTAACTGAATTACCGCCTGAGGATAATAGTGTGCCACCTCGCGAAGGATATAGTCATCGTTTATGTCATGCA ACTTTTGTTCAAAGATCTGGAACACCTTTTTTAACAACTGGTGTA.GTATTTTCTTGGACGCATCGTAGTGCA ACTCTTACAAATACAATT3ATHAGAGAGAATTAATCAAATACCTTTAGTGAAAGGATTTAGAGTTTGGGGG GTATCTCTACAAGTCAATATTAATTCACC?ATTACCCAAAGATACCGTTTAAGATTTC3TTACGCTTCCAGT AGGGATGCACGAGTTATAGTATTAAC GGA3CGGCATCCAC.AGGA.GTGGGAGGCCAAGTTAGTGTAAATA.TG CCTCTTCAGAAAACTATGGAAATAGGGGAGAACTTAACATCTA3AACATTTAGATA.TACCGATTTTAGTAAT CCTTTTTCATTTA.3AGCT?ATCCAGATATAATTGGGATAA.3T3AACAACCTCTATTTGGTGCAGGTTCTATT AGTAGCGGTGAACTTTATATASATAAAATTGAAATTATTCTAG CAGATG AACATTTGAAGCAGAATCTGA'-1 TTAGAAAGAGCACAAAAGGCGCTGAATGCCCTGTTTACTTCTTCCAATCAAATCGG&rTAAAAACCGATGTG ACGGATTATCATATTGATCAA3TATCCAATTTAGTGGATTGTTTATCAGATGAATTTTGTCTGGATGAAAAG CGAGAATTGTCCGAGAAAGTC.AAACATG C3AAGCGACTCAGT3ATGAGCGGAATTTACTTCAAGATCCAAAC TTCAGAGGGATCAATAGACAACCAGACCGTGGCTGGAGAGGAAGTACAGATATTACCATCCAAGGAGGAGAT GACGTATTCAAAGAGAATTACGT CjACACTACCGGGTACCGTT rATGAGTGCTATCCAACGTATTTATATCAG AAAATAGATGAGTCGAAATTA_A.AAGCTTATACCC3TTATGAATTAAGAGGGTATATCGAAGj\TAGTCAAGAC TTAGAAATCTATTTGATCC3TTACAATGC.AAAACACGAAATAGTAAATGT3CCAGGCACGGGTTCCTTATGG CCGCTTTCAGCCCAAAGTCC'"?ATCCGAAAGTGTGGAGAACC3.-'--..TCGATGCGCG'-' ^?CACCTTGAATGGAAT CATGCAAGACTA33GAATCTAGA3TTTCTC3AAGAGAAAC3ATTATTAGGGGAAGCACTAGCTCGTGTGAAA AGAGCG3AGAAGAAsTG3A3A3ACA-AACGAGAGAAACTGCA3TT3GAAACAAATATTsTTTATAAAGAGGCA AAAGAATCTGTAGATGCTTT?TTTGTAAACTCTCAATATGATA3ATTACAAGTGGATACGAACATCGCAATG ATTCATGCGGCAGATAAACGC3TTCATAGAATCCGGGAAGC3TATCTGCCAGAGTTGTCTGTGATTCCAGGT GTCAATGCGGCCATTTTCGAAGAATTAGAGGGACGTATTTTTACAGCGTATTCCTTATATGATGCGAGAAAT GTCATTAAAAATGGCGATTTC.-^ATAATGGCTTATTATGCTGGAACGTGAAAGGTCATGTAGATGTAGAAGAG CAAAACAACCACCGTT333TCCTT3TTATCCCAGAATGGGAGGCAGAAGTGTCACAAGAGGTTCGTGTCTGT CCAGGTCGTGGCTATATCCTTC3TGTCACAGCATATAAAGAGGGATATGGAGAGGGCTGCGTAACGATCCAT GAGATCGAAGACAATACAGACGAACTGAAATTCAGCAACTGTGTAGAAGAGGAAGTATATCCAAACAACACA GTAACGTGTAATAATTATACT3GGACTCAAGAAGAATATGAGGGTACGTACACTTCTCGTAATCAAGGATAT GACGAAGCCTATGGTAATAACCCTTCCGTACCAGCTGATTACGCTTCAGTCTATGAAGAAAAATCGTATACA GATGGACGAAGAGAGAATCCTT3TGAATCTAACAGAGGCTATGGGGATTACACACCACTACCGGCTGGTTAT GTAACAAAGGATTTAGAGTACTTCCCAGAGACCGATAAGGTATGGATTGAGATCGGAGAAACAGAAGGAACA TTCATCGTGGATAGCGTGGAATTACTCCTTATGGAGGAA ..14.2.- SECUENCIA DE ÁCIDO NUCLEICO DE CRY1C-R148D (SEQ ID NO: 31 ATGGAGGAAAATAATCAAAATCAATGCATACCTTACAATTGTTTAAGTAATCCTGAAGAAGTACTTTTGGAT GGAGAACGGATATCAACTGGTAATTCATCAATTGATATTTCTCTGTCACTTGTTCAGTTTCTGGTATCTAAC TTTGTACCAGGGGGAGGATTTTTAGTTGGATTAATAGATTTT3TATGGG3AATAGTTGGCCCTTCTCAATGG GATGCATTTCTAGTACAAATTGAACAATTAATTAATGAAAGAATAGCTGAATTTGCTAGGAATGCTGCTATT GCTAATTTAGAAGGATTAGGAAACAATTTCAATATATATGTGGAAGCATTTAAAGAATGGGAAGAAGATCCT AATAATCCAGCAACCAGGACCAGAGTAATTGATCGCTTTCGTATACTT3ATGGGCTACTTGAAAGGGACATT CCTTCGTTTGACATTTCTGGATTTGAAGTACCCCTTTTATCCGTTTATGCTCAAGCGGCCAATCTGCATCTA GCTATATTAAGAGATTCTGTAATTTTTGGAGAAAGATGGGGA.TTGACAAC3ATAAATGTCAATGAAAACTAT AATAGACTAATTAGGCATATT3ATGAATATGCTGATCACTGTGCAAATACGTATAATCGGGGATTAAATAAT TTACCGAAATCTACGTATCAAGATTGGATAACATATAATCGATTACGGAGAGACTTAACATTGACTGTATTA GATATCGCCGCTTTCTTTCCAAACTATC-ACAATAGGAGATATCCAATTCAGCCAGTTGGTCAACTAACAAGG GAAGTTTATACGGACCCATTAATTAATTTTAATCCACAGTTACAGTCTGTAGCTCAATTACCTACTTTTAAC GTTATGGAGAGCAGCGCAATTAGAAATCCTCATTTATTTGATATATTGAATAATCTTACAATCTTTACGGAT TGGTTTAGTGTTGGACGCAATTTTTATTGGGGAGGACATCGAGTAATATCTAGCCTTATAGGAGGTGGTAAC ATAACATCTCCTATATATGGAAGAGAGGCsAACCAGGAGCCTCCAAGATCCTTTACTTTTAATGGACCGGTA TTTAGGACTTTATCAAATCCTACTTTACGATTATTACAGCAACCTTGGCCAGCGCCACCATTTAATTTACGT GGTGTTGAAGGAGTAGAATTTTCTACACCTACAAATAGCTTTACGTATCGAGGAAGAGGTACGGTTGATTCT TTAACTGAATTACCGCCTGAGGATAATAGTGTGCCACCTCGCGAAGGATATAGTCATCGTTTATGTCATGCA ACTTTTGTTCAAAGATCTGGAACACCTTTTTTAACAACTGGTGTAGTATTTTCTTGGACGCATCGTAGTGCA ACTCTTACAAATACAATTGATCCAGAGAGAATTAATCAAATACCTTTAGTGAAAGGATTTAGAGTTTGGGGG GGCACCTCTGTCATTACAGGACCAGGATTTACAGGAGGGGATATCCTTCGAAGAAATACCTTTGGTGATTTT GTATCTCTACAAGTCAATATTAATTCACCAATTACCCAAAGATACCGTTTAA3ATTTCGTTACGCTTCCAGT AGGGATGCACGAGTTATAGTA.TTAACAGGAGCGGCATCCACAGGAGTG3GAGGCCAAGTTAGTGTAAATATG CCTCTTCAGAAAACTATGGAAATAGGGGAGAACTTAACATCTA.GAACATTTA3ATATACCGATTTTAGTAAT CCTTTTTCATTTA.GAGCTAATCCAGATATAATTGGGATAAGTGAACAACCTCTATTTGGTGCAGGTTCTATT AGTAGCGGTGAACTTTATATA.GATAAAATTGAAATTATTCTAGCAGATGCAACATTTGAAGCAGAATCTGAT TTAGAAAGAGCACAAAAGGC3GTGAAT3CCCTGTTTA.CTTCTTCCAATCAAATCGGGTTAAAAACCGATGTG ACGGATTATCATATTGATCAAGTATCCAATTTAGTGGATTGTTTATCAGAT3AATTTTGTCTGGATGAAAAG CGAGAATTGTCCGAGAAAGTCAAACATGCGAAGCGACTCAGTGATGAGCGG.AATTTACTTCAAGATCCAAAC TTCAGAGCGATCAATAGACAACCAG, .3GTGGCTGGAGAGGAA3TACAGATATTACCATCCAAGGAGGAGAT GACGTATTCAAAGAGAATTACGTCACACTACCGGGTACCGTTGATGAGT3CTATCCAACGTATTTATATCAG AAAATAGATGAGTCGAAATTAAAAGCTTATACCCGTTATGAATTAAGAGGGTATATCGAAGATAGTCAAGAC TTAGAAATCTATTTGATCC3TTACAAT3CAAAACACGAAATA3TAAAT3T3CCAGGCACGGGTTCCTTATGG CCGCTTTCAGCCCAAAGTCCAATCGGAAAGTGTGGAGAACCGAATCGATGC3CGCCACACCTTGAATGGAAT CCTGATCTAGATTGTTCCT3CAGAGACGGGGAAAAATGTGCA3ATCATTCCCATCATTTCACCTTGGATATT GATGTTGGATGTACAGAGTTAAATGAGGACTTAGGTGTATGG3TGATATTCAAGATTAAGACGCAAGA.TGGC CATGCAAGACTAGGGAATCTAGAGTTTCTCGAAGAGAAACCATTATTAGGGG.AAGCACTAGCTCGTGTGAAA AGAGCGGAGAAGAAGTGGAGAGACAAACGAGAGAAACTGCAGTTGGAAACAAATATTGTTTATAAAGAGGCA AAAGAATCTGTAGATGCTTTATTTGTAAACTCTCAATATGATAGATTAC.AAGTGGATACGAACATCGCAATG ATTCATGCGGCAGATAAACGCGTTCATAGAATCCGGGAAGCGT.ATCTGCCAGAGTTGTCTGTGATTCCAGGT GTCAATGCGGCCATTTTCGAAGAATTAGAGGGACGTATTTTTACAGCGTATTCCTTATATGATGCGAGAAAT GTCATTAAAAATGGCGATTTCAATAATGGCTTATTATGCTGGAACGTGAAAGGTCATGTAGATGTAGAAGAG CAAAACAACCACCGTTCG3TCCTTGTTATCCCAGAATGGGAGGCAGAA3TGTCACAAGAGGTTCGTGTCTGT CCAGGTCGTGGCTATATCCTTCGTGTCACAGCATATAAAGAGGGATATGGAGAGGGCTGCGTAACGATCCAT GAGATCGAAGACAATACAGACGAACTGAAATTCAGCAACTGTGTAGAAGAGGAAGTATATCCAAACAACACA GTAACGTGTAATAATTATACTGGGACTCAAGAAGAATATGAGGGTACGTACACTTCTCGTAATCAAGGATAT GACGAAGCCTATGGTAATAACCCTTCCGTACCAGCTGATTACGCTTCAGTCTATGAAGAAAAATCGTATACA GATGGACGAAGAGAGAATCCTTGTGAATCTAACAGAGGCTATGGGGATTACACACCACTACCGGCTGGTTAT G AACAAAGGATTTAGAGTACTTCCCAGAGACCGATAAGGTATG3ATTGAGATCGGAGAAACAGAAGGAACA TTCATCGTGGATAGCGTGGAATTACTCCTTATGGAGGAA .14.3.- SECUENCIA DE ÁCIDO NUCLEICO DE CRY1C-R180A (SEQ ID NO- ) ATGGAGGAAAATAATCAAAATCAATGCATACCTTACAATTGTTTAAGTAATCCTGAAGAAGTACTTTTGGAT GGAGAACGGATATCAACTGGTAATTCATCAATTGATATTTCTCTGTCACTTGTTCAGTTTCTGGTATCTAAC TTTGTACCAGGGGGAGGATTTTTAGTTGGATTAATAGATTTTGTA.TGGGGAATAGTTGGCCCTTCTCAATGG GATGCATTTCTAGTACAAATTGAACAATTAATTAATGAAAGAATAGCTGATTTGCTAGGAATGCTGCTATT GCTAATTTAGAAGGATTAGGAAACAATTTCAATATATATGTGGAAGCATTTAAAGAATGGGAAGAAGATCCT AATAATCCAGCAACCAGGACCAGAGTAATTGATCGCTTTCGTATACTTGATGGGCTACTTGAAAGGGACATT CCTTCGTTTCGAATTTCTGGATTTGAAGTACCCCTTTTATCCGTTTATGCTCAAGCGGCCAATCTGCATCTA GCTATATTAAGAGATTCTGTAATTTTTGGAGAAGCATGGGGGTTGACAACGATAAATGTCAATGAAAACTAT AATAGACTAATTAGGCATATTGATGAATATGCTGATCACTGTGCAAATACGTATAATCGGGGATTAAATAAT TTACCGAAATCT; 3TATCAAGATTGGATAACATATAATCGATTACGGAGAGACTTAACATTGACTGTATTA GATATCGCCGCTTTCTTTCCAAACTATGACAATAGGAGATATCCAATTCAGCCAGTTGGTCAACTAACAAGG 3AAGTTTATACGGACCCATTAATTAATTTTAATCCACAGTTACA3TCTGTAGCTCAATTACCTACTTTTAAC GTTATGGAGAGCAGCGCAATTAGAAATCCTCATTTATTTGATATATTGAATAATCTTACAATCTTTACGGAT TGGTTTAGTGTTGGACGCAATTTTTATTGGGGAGGACATCGAGTAATATCTAGCCTTATAGGAGGTGGTAAC TAACATCTCCTATATATGGAAGAGAGGCGAACCAGGAGCCTCCAAGATCCTTTACTTTTAATGGACCGGTA TTTAGGACTTTATCAAATCCTACTTTACGATTATTACAGCAACCTTGGCCAGCGCCACCATTTAATTTACGT GGTGTTGAAGGAGTAGAATTTTCTACACCTACAAATAGCTTTACGTATCGAGGAAGAGGTACGGTTGATTCT TTAACTGAATTACCGCCTGAGGATAATAGTGTGCCACCTCGCGAAGGATATAGTCATCGTTTATGTCATGCA ACTTTTGTTCAAAGATCTGGAACACCTTTTTTAACAACTGGTGTAGTATTTTCTTGGACGCATCGTAGTGCA ACTCTTACAAATACAATTGA.TCCAGAGAGAATTAATCAAATACCTTTAGTGAAAGGATTTAGAGTTTGGGGG GGCACCTCTGTCATTACAGGACCAGGATTTACAGGAGGGGATATCCTTCGAAGAAATACCTTTGGTGATTTT GTATCTCTACAAGTCAATATTAATTCACCAATTACCCAAAGATACCGTTTAAGATTTCGTTACGCTTCCAGT AGGGATGCACGAGTTATAGTATTAACAGGAGCGGCATCCACAGGAGTGGGAGGCCAAGTTAGTGTAAATATG CCTCTTCAGAAAACTATGGAAATAGGGGAGAACTTAACATCTAGAACATTTAGATATACCGATTTTAGTAAT CCTTTTTCATTTAGAGCTAATCCAGATATAATTGGGATAAGTGAACAACCTCTATTTGGTGCAGGTTCTATT AGTAGCGGTGAACTTTATATAGATAAAATTGAAATTATTCTAGCAGATGCAACATTTGAAGCAGAATCTGAT TTAGAAAGAGCACAAAAGGCG3TGAATGCCCTGTTTACTTCTTCCAATCAAATCGGGTTAAAAACCGATGTG ACGGATTATCATATTGATCAAGTATCCAATTTAGTGGATTGTTTATCAGATGAATTTTGTCTGGATGAAAAG C3AGAATTGTCCGAGAAAGTCAAACATGCGAAGCGACTCAGTGATGAGCGGAATTTACTTCAAGATCCAAAC TTCAGAGGGATCAATAGACAACCAGACCGTGGCTGGAGAGGAA3TACAGATATTACCATCCAAGGAGGAGAT GACGTATTCAAAGAGAATTACGTCACACTACCGGGTACCGTTG.ATGAGTGCT.ATCCAACGTATTTATATCAG AAAATAGATGAGTCGAAATTAAAAGCTTATACCCGTTATGAATTAAGAGG3TATATCGAAGATAGTCAAGAC TTAGAAATCTATTTGA.TCCGTTACAATGCAAAACACGAAATAGTAAATGT3CCAGGCACGGGTTCCTTATGG CCGCTTTCAGCCC.AAAGTCCAATCGGAAAGTC"GGAGAACC3AATCGATGCGC3CCACACCTTGAATGGAAT CCTGATCTAGATTGTTCCTGCAGAGACGGGGAAAAATGTGCACATCATTCCCATCATTTCACCTTGGATATT GATGTTGGATGTACAGACTTAAATGAGGACTTAGGTGTATGGGTGATATTCAAGATTAAGACGCAAGATGGC CATGCAAGACTAGGGAATCTAGAGTTTCTCGAAGAGAAACCA.TTATTAGGGGAAGCACTAGCTCGTGTGAAA AGAGCGGAGAAGAAGTGGAGAGACAAACGAGAGAAACTGCAGTTGGAAACAAATATTGTTTATAAAGAGGCA AAAGAATCTGTAGATGCTTTATTTGTAAACTCTCAATATGATA3ATTACAAGTGGATACGAACA.TCGCAATG ATTCATGCGGCAGATAAAC3C3TTCATAGAATCCGGGAAGCGTATCTGCCAGAGTTGTCTGTGATTCCAGGT GTCAATGCGGCCATTTTCGAAGAATTAGAGGGACGTATTTTTACAGCGTATTCCTTATATGATGCGAGAAAT GTCATTAAAAAT _3CGATTT; VTAATGGCTTATTATC GGAACGTGAAAGGTCATGTAGATGTAGAAGA, CAAAACAACCACCGTTCGGTCCTTGTTATCCCAGAATGGGAGGCAGAAGTGTCACAAGAGGTTCGTGTCTGT CCAGGTCGTGGCTATATCCTTCGTGTCACAGCATATAAAGAGGGATATGGAGAGGGCTGCGTAACGATCCAT GAGATCGAAGACAATACAGACGAACTGAAATTCAGCAACTGTGTAGAAGAGGAAGTATATCCAAACAACACA GTAACGTGTAATAATTATACTGGGACTCAAGAAGAATATGAGGGTACGTACACTTCTCGTAATCAAGGATAT GACGAAGCCTATGGTAATAACCCTTCCGTACCAGCTGATTAC3CTTCAGTCTATGAAGAAAAATCGTATACA GATGGACGAAGAGAGAATCCTTGTGAATCTAACAGAGGCTATGGGGATTACACACCACTACCGGCTGGTTAT GTAACAAAGGATTTAGAGTACTTCCCAGAGACCGATAAGGTATGGATTGAGATCGGAGAAACAGAAGGAACA TTCATCGTGGATAGCGTGGAATTACTCCTTATGGAGGAA 4.4.- SECUENCIA DE ÁCIDO NUCLEICO DE CRY1 C.563 (SEQ ID NO: 7) ATGGAGGAAAATAATCAAAATCAATGCATACCTTACAATTGTTTAAGTAATCCTGAAGAAGTACTTTTGGAT GGAGAACGGATATCAACTGGTAATTCATCAATTGATATTTCTCTGTCACTTGTTCAGTTTCTGGTATCTAAC TTTGTACCAGGGGGAGGATTTTTAGTTGGATTAATAGATTTTGTATGGGGAATAGTTGGCCCTTCTCAATGG GATGCATTTCTAGTACAAATTGAACAATTAATTAATGAAAGAATAGCTGAATTTGCTAGGAATGCTGCTATT GCTAATTTAGAAGGATTAGGAAACAATTTCAATATATATGTGGAAGCATTTAAAGAATGGGAAGATGATCCT CATAATCCCACAACCAGGACCAGAGTAATTGATCGCTTTCGTATACTTGATGGGCTACTTGAAAGGGACATT CCTTCGTTTCGAATTTCTGGATTTGAAGTACCCCTTTTATCCGTTTATGCTCAAGCGGCCAATCTGCATCTA GCTATATTAAGAGATTCTGTAATTTTTGGAGAAAGATGGGGATTGACAACGATAAATGTCAATGAAAACTAT AATAGACTAATTAGGCATATTGATGAATATGCTGATCACTGTGCAAATACGTATAATCGGGGATTAAATAAT TTACCGAAATCTACGTATCAAGATTGGATAACATATAATCGATTACGGAGAGACTTAACATTGACTGTATTA GATATCGCCGCTTTCTTTCCAAACTATGACAATAGGAGATATCCAATTCAGCCAGTTGGTCAACTAACAAGG GAAGTTTATACGGACCCATTAATTAATTTTAATCCACAGTTACAGTCTGTAGCTCAATTACCTACTTTTAAC GTTATGGAGAGCAGCGCAATTAGAAATCCTCATTTATTTGATATATTGAATAATCTTACAATCTTTACGGAT TGGTTTAGTGTTGGACGCAATTTTTATTGGGGAGGACATCGAGTAATATCTAGCCTTATAGGAGGTGGTAAC ATAACATCTCCTATATATGGAAGAGAGGCGAACCAGGAGCCTCCAAGATCCTTTACTTTTAATGGACCGGTA TTTAGGACTTTATCAAATCCTACTTTACGATTATTACAGCAACCTTGGCCAGCGCCACCATTTAATTTACGT GGTGTTGAAGGAGTAGAATTTTCTACACCTACAAATAGCTTTACGTATCGAGGAAGAGGTACG3TTGATTCT TTAACTGAATTACCGCCTGAGGATAATAGTGTGCCACCTCGCGAAGGATATAGTCATCGTTTATGTCATGCA ACTTTTGTTCAAAGATCTGGAACACCTTTTTTAACAACTGGTGTAGTATTTTCTTGGACGCATCGTAGTGCA ACTCTTACAAATACAATTGATCCAGAGAGAATTAATCAAATACCTTTAGTGAAAGGATTTAGAGTTTGGGGG GGCACCTCTGTCATTACAGGACCAGGATTTACAGGAGGGGATATCCTTCGAAGAAATACCTTTG3TGATTTT GTATCTCTACAAGTCAATATTAATTCACCAATTACCCAAAGATACCGTTTAAGATTTCGTTACGCTTCCAGT AGGGATGCACGAGTTATAGTATTAACAGGAGCGGCATCCACAGGAGTGGGAGGCCAAGTTAGTGTAAATATG CCTCTTCAGAAAACTATGGAAATAGGGGAGAACTTAACATCTAGAACATTTAGATATACCGATTTTAGTAAT CCTTTTTCATTTAGAGCTAATCCAGATATAATTGGGATAAGTGAACAACCTCTATTTGGTGCAGGTTCTATT AGTAGCGGTGAACTTTATATAGATAAAATTGAAATTATTCTAGCAGATGCAACATTTGAAGCAGAATCTGAT TTAGAAAGAGCACAAAAGGCGGTGAATGCCCTGTTTACTTCTTCCAATCAAATCGGGTTAAAAACCGATGTG ACGGATTATCATATTGATCAAGTATCCAATTTAGTGGATTGTTTATCAGATGAATTTTGTCTGGATGAAAAG CGAGAATTGTCCGAGAAAGTCAAACATGCGAAGCGACTCAGTGATGAGCGGAATTTACTTCAAGATCCAAAC TTCAGAGGGATCAATAGACAACCAGACCGTGGCTGGAGAGGAAGTACAGATATTACCATCCAAGGAGGAGAT GACGTATTCAAAGAGAATTACGTCACACTACCGGGTACCGTTGATGAGTGCTATCCAACGTATTTATATCAG AAAATAGATGAGTCGAAATTAAAAGCTTATACCCGTTATGAATTAAGAGGGTATATCGAAGATA.GTCAAGAC TTAGAAATCTATTTGATCCGTTACAATGCAAAACACGAAATAGTAAATGTGCCAGGCACGGGTTCCTTATGG CCGCTTTCAGCCCAAAGTCCAATCGGAAAGTGTGGAGAACC3AA.TCGATGCGCGCCACACCTT3AATGGAAT CCTGATCTAGATTGTTCCTGCAGAGACGGGGAAAAATGTGCACATCATTCCCATCATTTCACCTTGGATATT GATGTTGGATGTACAGACTTAAATGAGGACTTAGGTGTATGGGTGATATTCAAGATTAAGACGCAAGATGGC CATGCAAGACTAGGGAATCTAGAGTTTCTCGAAGAGAAACCATTATTAGGGGAAGCACTAGCTCGTGTGAAA AGAGCGGAGAAGAAGTGGAGAGACAAACGAGAGAAACTGCAG7T3GAAACAAATATTGTTTATAAAGAGGCA AAAGAATCTGTAGATGCTTTATTTGTAAACTCTCAATATGATAGATTACAAGTGGATACGAACATCGCAATG ATTCATGCGGCAGATAAACGCGTTCATAGAATCC3GGAAGCGTATCTGCCAGAGTTGTCTGTGATTCCAGGT GTCAATGCGGCCATTTTCGAAGAATTAGAGGGACGTATTTTTACAGCGTATTCCTTATATGATGCGAGAAAT GTCATTAAAAATGGCGATTTCAATAATGGCTTATTATGCTGGAACSTGAAAGGTCATGTAGATGTAGAAGAG CAAAACAACCACCGTTCGGTCCTTGTTATCCCAGAATGGGAGGCAGAAGT3TCACAAGAGGTTCGTGTCTGT CCAGGTCGTGGCTATATCCTTCGTGTCACAGCATATAAAGAGGGATATGGA3AGGGCTGCGTAACGATCCAT GAGATCGAAGACAATACAGACGAACTGAAATTCAGCAACTGTGTAGAAGAGGAAGTATATCCAAACAACACA GTAACGTGTAATAATTATACTGGGACTCAAGAAGAATATGAGGGTACGTACACTTCTCGTAATCAAGGATAT GACGAAGCCTÁTGGTAATAACCCTTCCGTACCAGCTGATTACGCTTCAGTCTATGAAGAAAAATCGTATACA GATGGACGAAGAGAGAATCCTTGTGAATCTAACAGAGGCTATGGGGATTACACACCACTACCGGCTGGTTAT GTAACAAAGGATTTAGAGTACTTCCCAGAGACCGATAAGGTATGGATTGAGATCGGAGAAACAGAAGGAACA TTCATCGTGGATAGCGTGGAATTACTCCTTATGGAGGAA .14.5.- SECUENCIA DE ÁCIDO NUCLEICO DE CRY1 C.579 (SEQ ID NO: 9) ATGGAGGAAAATAATCAAAAT3AATGCATACCTTACAATTGTTTAAGTAATCCTGAAGAAGTACTTTTGGAT GGAGAACGGATATCAACTG3TAATTCATCAATTGATATTTCTCT3TCACTTGTTCAGTTTCTGGTATCTAAC TTTGTACCAGGGGGAGGATTTTTAGTTGGATTAATAGATTTTGTATGGGGAATAGTTGGCCCTTCTCAATGG GATGCATTTCTAGTACAAATTGAACAATTAATTAATGAAAGAATAGCTGAATTTGCTAGGAATGCTGCTATT GCTAATTTAGAAGGATTAGGAAACAATTTCAATATATATGTGGAAGCATTTAAAGAATGGGAAGTAGATCCT AATAATCCTGGAACCAGGACCACAGTAATTGATCGCTTTCGTATACTTGATGGGCTACTTGAAAGGGACATT CCTTCGTTTCGAATTTCTGGATTGGA?GTACCCCTTTTATCCGTTTATGCTCAAGCGGCCAATCTGCATCTA GCTATATTAAGAGATTCTGTAATTTTTGGAGAAAGATGGGGATTGACAACGATAAATGTCAATGAAAACTAT AATAGACTAATTAGGCATATTGATGAATATGCTGATCACTGTGCAAATACGTATAATCGGGGATTAAATAAT TTACCGAAATCTACGTATCAA3ATTGGATAACATATAATCGATTACGGAGAGACTTAACATTGACTGTATTA GATATCGCCGCTTTCTTTCCAAACT?TGACAATAGGAGATATCCAATTCAGCCAGTTGGTCAACTAACAAGG GAAGTTTATACGGACCCATTAATTAATTTTAATCCACAGTTACAGTCTGTAGCTCAATTACCTACTTTTAAC GTTATGGAGAGCAGCGCAATTAGAAATCCTCATTTATTTGATATATTGAATAATCTTACAATCTTTACGGAT TGGTTTAGTGTTGGACGCAATTTTTATTGGGGAGGACATCGAGTAATATCTAGCCTTATAGGAGGTGGTAAC ATAACATCTCCTATATATGGAAGAGAGGCGAACCAGGAGCCTCCAAGATCCTTTACTTTTAATGGACCGGTA TTTAGGACTTTATCAAATCCTACTTTACGATTATTACAGCAACCTTGGCCAGCGCCACCATTTAATTTACGT GGTGTTGAAGGAGTAGAATTTTCTACACCTACAAATAGCTTTACGTATCGAGGAAGAGGTACGGTTGATTCT TTAACTGAATTACCGCCTGA33ATAATAGTGTGCCACCTCGCGAAGGATATAGTCATCGTTTATGTCATGCA ACTTTTGTTCAAAGATCTG3AACACCTTTTTTAACAACTGGTGTAGTATTTTCTTGGACGCATCGTAGTGCA ACTCTTACAAATACAATTGATCCAGAGAGAATTAATCAAATACCTTTAGTGAAAGGATTTAGAGTTTGGGGG GGCACCTCTGTCATTACA33ACCAGGATTTACAGGAGGGGATATCCTTCGAAGAAATACCTTTGGTGATTTT GTATCTCTACAAGTCAATATTAA.TTCACCAATTACCCAAAGATACCGTTTAAGATTTCGTTACGCTTCCAGT AGGGATGCACGAGTTATAGT?TTAACAGGAGCGGCATCCACAGGAGTG3GAGGCCAAGTTAGTGTAAATATG CCTCTTCAGAAAACTATGGAAA7AG3GGAGAACTTAACATCTAGAACATTTAGATATACCGATTTTAGTAAT CCTTTTTCATTTAGAGCTAATCCAGATATAATTGGGATAAGTGAACAACCTCTATTTGGTGCAGGTTCTATT AGTAGCGGTGAACTTTATATAGATAAAATTGAAATTATTCTAGCAGATGCAACATTTGAAGCAGAATCTGAT TTAGAAAGAGCACAAAAGGCCGTGAATGCCCTGTTTACTTCTTCCAATCAAATCGGGTTAAAAACCGATGTG ACGGATTATCATATTGATCAAGTATCCAATTTAGTGGATTGTTTATCAGATGAATTTTGTCTGGATGAAAAG CGAGAATTSTCCGAGAAAGTCAAACATGCGAAGCSACTCAGTGATGAGCGGAATTTACTTCAAGATCCAAAC TTCAGAGGGATCAATAGACAACCAGACCGTGGCTGGAGAGGAAGTACAGATATTACCATCCAAGGAGGAGAT GACGTATTCAAAGAGAATTACGTCACACTACCGGGTACCGTTGATGAGTGCTATCCAACGTATTTATATCAG AAAATAGATGAGTCGAAATT.AAAAGCTTATACCCGTTATGAATTAAGAGGGTATATCGAAGATAGTCAAGAC TTAGAAATCTATTTGATCC3TTACAATGCAAAACACGAAATAGTAAATGT3CCAGGCACGGGTTCCTTATGG CCGCTTTCAGCCCAAAGTCCAATC3GAAAGTGTGGAGAACC3AATCGATGCGCGCCACACCTTGAATGGAAT CCTGATCTAGATTGTTCCT3CAGAGACGGGGAAAAATGTGCACATCATTCCCATCATTTCACCTTGGATATT GATGTTGGATGTACAGACTTAA?T3AGGACTTA3GT3TATGGGTGATATTCAAGATT.AAGACGCAAGATGGC CATGCAAGACTAGGGAATCTAGAGTTTCTCGAAGAGAAACCATT.ATTAGGGGAAGCACTAGCTCGTGTGAAA AGAGCGGAGAAGAAGTG3AGAGACAAACGAGAGAAACTGCAGTT3GAAACAAATATT3TTTATAAAGAGGCA AAAGAATCTGTAGATGCTTTATTT3TAAACTCTCAATATGATAGA.TTACAAGTG3ATACGAACATCGCAATG ATTCATGCGGCAGATAAAC3C3TTCATAGAATCCGGGAAGCGTATCTGCCAGAGTTGTCTGTGATTCCAGGT GTCAATGCGGCCATTTTCCAAGAATTAGAGGGACGTATTTTTACAGC3TATTCCTTATATGATGCGAGAAAT GTCATTAAAAATGGCGATTTCAATAATGGCTT.ATTATGCTGGAACGTGAAAGGTCATGTAGATGTAGAAGAG CAAAACAACCACCGTTC3GTCCTTGTTATCCCAGAATGG3AG3CAGAAGTGTCAC.AAGAGGTTCGTGTCTGT CCAGGTCGTGGCTATATCCTTC3TGTCACAGCATATAAAGAGG3ATATGGAGA3G3CTGCGTAACGATCCAT GAGATCGAAGACAATACAGACGAACTGAAATTCAGCAACT3TGTAGAAGAGGAAGTATATCCAAACAACACA GTAACGT3TAATAATTATACTGGGACTCAAGAA3AATATGAGG3TACGTACACTTCTC3TAATCAAGGATAT GACGAAGCCTATGGTAATAACCCTTCCGTACCAGCTGATTACGCTTCAGTCT.ATGAAGAAAAATCGTATACA GATGGACGAAGAGAGAATCCTTGTGAATCTAACAGAGGCTAT33GGATTACACACCACTACCGGCTGGTTAT GTAACAAAGGATTTAGAGTACTTCCCAGAGACCGATAAGGTATG3ATTGAGATC3GAGAAACAGAAGGAACA TTCATCGTGGATAGCGTGGAATTACTCCTTATGGAGGAA .- SECUENCIA DE ÁCIDO NUCLEICO DE CRY1C.499 (SEQ ID NO: 11) ATGGAGGAAAATAATCAAAATCAATGCATACCTTACAATT3TTTA_AGTAATCCTGAAGAAGTACT TTTGGATGGAGAACGGATATCAACTGGTAATTCATCAATTGATA.TTTCTCTGTCACTTGTTCAGT TTCTGGTATCTAACTTTGTACCAGGGGGAGGATTTTTAGTTGGATTAATAGATTTTGTATGGGGA ATAGTTGGCCCTTCTCAATGGGATGCATTTCTAGTACAAATTGAACAATTAATTAATGAAAGAAT AGCTGAATTTGCTAGGAATGCTGCTATTGCTAATTTAGAAGGATTAGGAAACAATTTCAATATAT ATGTGGAAGCATTTAAAGAATGGGAAGAAGATCCCCATAATCCAGCAACCAGGACCAGAGTAATT GATCGCTTTCGTATACTTGATGGGCTACTTGAAAGGGACATTCCTTCGTTTCGAATTTCTGGATT TGAAGTACCCCTTTTATCCGTTTATGCTCAAGCGGCCAATCTGCATCTAGCTATATTAAGAGATT CTGTAATTTTTGGAGAAAGATGGGGATTGACAACGATAAATGTCAATGAAAACTATAATAGACTA ATTAGGCATATTGATGAATATGCTGATCACTGTGCAAATACGTATAATCGGGGATTAAATAATTT ACCGAAATCTACGTATCAAGATTGGATAACATATAATCGATTACGGAGAGACTTAACATTGACTG TATTAGATATCGCCGCTTTCTTTCCAAACTATGACAATAGGAGATATCCAATTCAGCCAGTTGGT CAACTAACAAGGGAAGTTTATACGGACCCATTAATTAATTTTAATCCACAGTTACAGTCTGTAGC TCAATTACCTACTTTTAACGTTATGGAGAGCAGCGCAATTAGAAATCCTCATTTATTTGATATAT TGAATAATCTTACAATCTTTACGGATTGGTTTAGTGTTGGACGCAATTTTTATTGGGGAGGACAT CGAGTAATATCTAGCCTTATAGGAGGTGGTAACATAACATCTCCTATATATGGAAGAGAGGCGAA CCAGGAGCCTCCAAGATCCTTTACTTTTAATGGACCGGTATTTAGGACTTTATCAAATCCTACTT TACGATTATTACAGCAACCTTGGCCAGCGCCACCATTTAATTTACGTGGTGTTGAAGGAGTAGAA TTTTCTACACC ACAAATAGCTTTACGTATCGAGGAAGAGGTACGGTTGATTCTTTAACTGAATT ACCGCCTGAGGATAATAGTGTGCCACCTCGCGAAGGATATAGTCATCGTTTATGTCATGCAACTT TTGTTCAAAGATCTGGAACACCTTTTTTAACAACTGGTGTAGTATTTTCTTGGACGCATCGTAGT GCAACTCTTACAAATACAATTGATCCAGAGAGAATTAATCAAATACCTTTAGTGAAAGGATTTAG AGTTTGGGGGGGCACCTCTGTCATTACAGGACCAGGATTTACAGGAGGGGATATCCTTCGAAGAA ATACCTTT3GTGATTTTGTATCTCTACAAGTCAATATTAATTC.ACCAATTACCCAAAGATACCGT TTAAGATTTCGTTACGCTTCCAGTAGGGATGCACGAGTTATAGTATTAACAGGAGCGGCATCCAC AGGAGTGGGAGGCCAAGTTAGTGTAAATATGCCTCTTCAGAAAACTATGGAAATAGGGGAGAACT TAACATCTAGAACATTTAGATATACCGATTTTAGTAATCCTTTTTCATTTAGAGCTAATCCAGAT ATAATTGGGATAAGTGAACAACCTCTATTTGGTGCAGGTTCTATTAGTAGCGGTGAACTTTATAT AGATAAAATTGAAATTATTCTAGCAGATGCAACATTTGAAGCA3AATCTGATTTAGAAAGAGCAC AAAAGGCGGTGAATGCCCTGTTTACTTCTTCCAATCAAATCGGGTTAAAAACCGATGTGACGGAT TATCATATTGATCAAGTATCCAATTTAGTGGATTGTTTATCAGATGAATTTTGTCTGGATGAAAA GCGAGAATTGTCCGAGAAAGTCAAACATGCGAAGCGACTCAGTGATGAGCGGAATTTACTTCAAG ATCCAAACTTCAGAGGGATCAATAGACAACCAGACCGTGGCTGGAGAGGAAGTACAGATATTACC ATCCAAGGAGGAGATGACGTATTCAAAGAGAATTACGTCACACTACCGGGTACCGTTGATGAGTG CTATCCAACGTATTTATATCAGAAAATAGATGAGTGGAAATTAAAAGCTTATACCCGTTATGAAT TAAGAGGGTATATCGAAGATAGTCAAGACTTAGAAATCTATTTGATCCGTTACAATGCAAAACAC GAAATAGTAAATGTGCCAGGCACGGGTTCCTTATGGCCGCTTTC.AGCCCAAAGTCCAATCGGAAA GTGTGGAGAACCGAATCGATGCGCGCCACACCTTGAATGGAATCCTGATCTAGATTGTTCCTGCA GAGACGGGGAAAAATGTGCACATCATTCCCATCATTTCACCTT3GATATT3ATGTTGGATGTACA GACTTAAATGAGGACTTAGGTGTATGGGTGATATTCAAGATTAAGACGCAAGATGGCCATGCAAG ACTAGGGAATCTAGAGTTTCTCGAAGAGAAACCATTATTAGGGGAAGCACTAGCTCGTGTGAAAA GAGCGGAGAAGAAGTGGAGAGACAAACGAGAGAAACTGCAGTTG3AAACAAATATTGTTTATAAA GAGGCAAAAGAATCT3TAGATGCTTTATTTGTAAACTCTCAATAT3ATAGATTACAAGTGGATAC GAACATCGCAATGATTCATGCGGCAGATAAACGCGTTCATAGAATCCGGGAAGCGTATCTGCCAG AGTTGTCT3TGATTCCAGGTGTCAATGCGGCCATTTTCGAAGAATTAGAGGGACGTATTTTTACA GCGTATTCCTTATATGATGCGAGAAATGTCATTAAAAATGGCGATTTCAATAATGGCTTATTATG CTGGAACGTGAAAGGTCATGTAGATGTAGAAGAGCAAAACAACCACCGTTCGGTCCTTGTTATCC CAGAATGGGAGGCAGAAGTGTCACAAGAGGTTCGTGTCTGTCCA3GTCGT3GCTATATCCTTCGT GTCACAGCA.TATAAAGAGGGATATGGAGAGGGCTGCSTAACGATCCATGAGATCGAAGACAATAC AGACGAACTGAAATTCAGCAACTGTGTAGAAGAGGAAGTATATCCAAACAACACAGTAACGTGTA ATAATTATACTGGGACTCAAGAAGAATATGAGGGTACGTACACTTCTCGTAATCAAGGATATGAC GAAGCCTATGGTAATAZ.CCCTTCCGTACCAGCTGATTACGCTTCAGTCTATGAAGAAAAATCGTA TACAGATGGACGAAGAGAGAATCCTTGTGAATCTAACAGAGGCTATGGGGATTACACACCACTAC CGGCTGGTTATGTAACAAAGGATTTAGAGTACTTCCCAGAGACC3ATAAGGTATGGATTGAGATC GGAGAAACAGAAGGAACATTCATCGTGGATAGCGTGGAATTACT3CTTATGGAGGAA 5.15.- EJEMPLO 15 AISLAMIENTO DE PLANTAS TRANSGÉNICAS RESISTENTES A LAS VARIANTES DE Crv* .15.1.- CONSTRUCCIÓN DEL GENE DE PLANTA La expresión de un gene vegetal que existe en forma de ADN de doble filamento implica la transcripción del ARN mensajero (mARN) de un filamento del ADN, por la enzima ARN-polimerasa, y el procesamiento subsecuente del transcripto primario de mARN dentro del núcleo. Este procesamiento comprende una región 3' no trasladada que añade nucleótidos de poliadeniiato al extremo 3' del ARN. Se regula la transcripción de ADN a mARN por medio de una región del ADN usualmente denominada "promotora". La región promotora contiene una secuencia de bases que señala a la ARN-polimerasa que se asocie con el ADN y que inicie la transcripción de mAN utilizando uno de ios filamentos de ADN como plantilla, para formar un filamento correspondiente de ARN. Se ha descrito en la literatura numerosos promotores que son activos en células vegetales. Dichos promotores pueden ser obtenidos de plantas o de virus de plantas e incluyen, pero sin limitación a ellos: los promotores de la nopalina-sintasa (NOS) y de la octopina-sintasa (OCS) (que son llevados en plásmidos inductores de tumor de Agrobacterium tumefaciens), los promotores 19S y 5S del virus del mosaico de la coliflor (CaMV), el promotor inducible por luz, de la subunidad pequeña de la carboxilasa de a,5-bisfosfato de ribuiosa (ssRUBISCO, un polipéptido de planta muy abundante) y el promotor 35S del virus del mosaico Figwort (FMV). Todos estos promotores han sido usados para crear diversos tipos de construcciones de ADN que han sido expresadas en plantas (véase, por ejemplo, la patente US 5,463,175, incorporada específicamente aquí mediante la referencia). El promotor particular seleccionado debe ser capaz de provocar suficiente expresión de la secuencia codificadora de enzima para dar por resultado la producción de una cantidad efectiva de proteína. Una serie de promotores preferidos son los promotores constitutivos, como los promotores CaMV35S o FMV36S que producen niveles altos de expresión en la mayoría de los órganos de plantas (patente US 6,378,619, incorporada específicamente aquí mediante esta referencia). Otra serie de promotores preferidos son los promotores incrementados o específicos de raíz, como el promotor 4 as-1 derivado de CaMV, o el promotor POX1 del trigo (patente estadounidense 5,023,179, específicamente incorporada aquí mediante esta referencia; Hetig y coautores, 1991 ). Los promotores incrementados o específicos de raíz serían particularmente preferidos para el control del gusano de raíz del maíz, (Diabroticus spp) en plantas de maíz transgénicas. Los promotores usados en las construcciones de ADN (es decir, genes de planta quiméricos) de la presente invención, pueden ser modificados, si se desea, para afectar sus características de control. Por ejemplo, se puede ligar el promotor CaMV35S a la porción del gene ssRUBISCO que reprime la expresión de ssRUBISCO en ausencia de la luz, para crear un promotor que es activo en las hojas, pero no en las raíces. Se puede usar el promotor quimérico resultante como se describió aquí. Para los fines de esta descripción, la frase promotor "CaMV3dS" incluye así las variaciones del promotor CaMV3dS, por ejemplo, los promotores derivados por medio de ligación con regiones operadoras, mutagénesis aleatoria o controlada, etc. Adicionalmente, se puede alterar los promotores para que contengan "secuencias incrementadoras" múltiples, para ayudar a elevar la expresión del gene. Ei ARN producido por una construcción de ADN de la presente invención, también contiene una secuencia frontal d'-no trasladada. Esta secuencia puede ser derivada del promotor seleccionado para expresar el gene, y se puede modificar específicamente, de manera que incremente la translación del mARN. También se puede obtener las regiones 5' no trasladadas a partir de genes eucarióticos adecuados, o a partir de una secuencia sintética de gene. La presente invención no está limitada a construcciones en las que la región no trasladada es derivada de la secuencia 5' no trasladada que acompaña a la secuencia promotora. Para expresión óptima en plantas monocotiledóneas, como el maíz, se debe incluir también un intrón en la construcción de expresión de ADN. Este intrón típicamente estaría colocado cerca del extremo d' del mARN en la secuencia no trasladada. Se podría obtener el intrón a partir de, pero sin limitación a ellos, una serie de intrones que consisten del intrón hsp70 de maíz (patente US 6,424,412, específicamente incorporada aquí mediante la referencia) o el intrón Actldel arroz (McEIroy y coautores, 1990). Como se muestra más adelante, el intrón hsp70 del maíz es útil en la presente invención. Como se hizo notar antes, la región 3' no trasladada de los genes de planta quimérica de la presente invención contienen una señal de poliadenilación que funciona en plantas para provocar la adición de los nucleótidos de adenilato al extremo 3' del ARN. Los ejemplos de las regiones 3' preferidas son: (1 ) las regiones 3' transcritas, no trasladadas, que contienen la señal de poliadenilato, de genes plásmidos inductores de tumor (Ti) de Agrobacterium, tales como el gene de la nopalina-sintasa (NOS) y (2) los genes de planta, tales como el gene de chícharo ssRUBISCO E9 (Fischhoff y coautores, 1987). .12.2.-TRANSFORMACIÓN Y EXPRESIÓN DE LA PLANTA Se puede insertar un transgene quimérico que contiene una secuencia codificadora estructural de la presente invención, en la genoma de una planta, mediante cualquier método adecuado, tales como los detallados aquí. Los vectores de transformación de planta, adecuados, incluyen los derivados de un plásmido Ti de Agrobacterium tumefaciens, así como los descritos, por ejemplo, por Herrera-Estrella (1983), Bevan (1983), Klee (1986) y la publicación de solicitud de patente europea No. EP0120616. Además de los vectores de transformación de planta derivados de los plásmidos Ti o inductores de raíz (Ri) de Agrobacterium, se puede usar métodos alternativos para insertar las construcciones de ADN de esta invención en células vegetales. Dichos métodos pueden comprender, por ejemplo, el uso de liposomas, electroporación, sustancias químicas que aumentan la absorción libre de ADN, suministro de ADN libre mediante bombardeo con microproyectiles y transformación utilizando virus o polen (Fromm y coautores, 1986; Armstrong y coautoers, 1990; Fromm y coautores, 1990). .15.3.- CONSTRUCCIÓN DE VECTORES DE EXPERSION DE PLANTA. PARA TRANSGENES cry* Para la expresión eficiente de las variantes cry* descritas aquí, en plantas transgénicas, el gene que codifica las variantes debe tener una composición de secuencia adecuada (Diehn y coautores, 1996). Para colocar un gene cry* en un vector adecuado para la expresión en plantas monocotiledóneas (o sea, bajo el control del promotor 3dS incrementado del virus de mosaico de la coliflor, y enlazarlo al intrón hsp70, seguido por el sitio de poliadenilación con nopalina-sintasa, como en la patente US 6,424,412, incorporada específicamente aquí mediante esta referencia), se digiere el vector con enzimas apropiadas, como Ncol y EcoRI. Luego se somete a electroforesis la banda mayor de vector, de aproximadamente 4.6 Kb; se purifica y se liga con ligasa de ADN T4 al fragmento de restricción apropiado que contiene el gene cry* plantificado. Se transforma entonces la mezcla de ligación en colonias resistentes a carbenicilina, de E. coli y se recupera el ADN plásmido mediante procedimientos de minipreparación de ADN. Se puede someter entonces el ADN a análisis con endonucleasa de restricción, con enzimas tales como Ncol y EcoRl 'untas), Notl y Pstl para identificar los clones que contienen la secuencia codificadora del gene cry* fundida al intrón hsp70 bajo el control del promotor CaMV3dS incrementado). Para colocar el gene en un vector adecuado para la recuperación de plantas establemente transformadas y resistentes a los insectos, se puede aislar el fragmento de restricción de pMON33708, que contiene la secuencia codificadora de lisina-oxidasa, fundida al intrón hsp70 bajo el control del promotor CaMV3dS incrementado; por medio de electroforesis en gel y purificación. Este fragmento puede ser ligado entonces con un vector, como pMON30460, tratado con Notl y fosfatasa alcalina intestinal de ternera (pMON30460 contiene la secuencia codificadora de neomicina-fosfotransferasa, bajo el control del promotor CaMV3dS). Luego se puede obtener las colonias resistentes a la kanamicina mediante la transformación de esta mezcla de ligación en E. coli y se puede identificar las colonias que contienen el plásmido resultante mediante digestión con la endonucleasa de restricción de los ADN de minipreparación de plásmido. Se puede usar las enzimas de restricción, como Notl, EcoRV, Hindlll, Ncol, y Bglll, para identificar ios clones apropiados que contienen el fragmento de restricción apropiadamente insertado en el sitio correspondiente de pMON30460, en una orientación tal, que ambos genes estén en tándem (o sea, que el extremo 3' del cásete de expresión del gene cry* esté enlazado al extremo 5' del cásete de expresión nptll). Luego se confirma la expresión de la proteína Cry* por ei vector resultante, en protoplastos de planta, mediante electroporación dei vector en los protoplastos, seguida por manchado de proteína y análisis ELISA. Se puede introducir este vector en el ADN genómico de embriones de planta, tales como maíz, mediante bombardeo con cañón de partículas, seguido por selección en paramomicina para obtener plantas de maíz que expresan el gene cry* esencialmente como se describió en la patente US 6,424.412, incorporada específicamente aquí mediante esta referencia. En ese ejemplo se introdujo el vector por co-bombardeo con plásmido conferidor de resistencia a la higromicina, en escudetes de embrión inmaduro (ÍES, acrónimo por su designación en inglés: Immature Embryo Scutella) de maíz, seguidos por selección en higromicina y regeneración. Luego se identifica las l'r.eas de plantas transgénicas que expresan la proteína Cry*, y a ,, continuación se identifican mediante análisis ELISA. Subsecuentemente se prueba la semilla de progenie de esos eventos, en cuanto a protección contra la alimentación a insectos susceptibles. 6.0- REFERENCIAS Las siguientes referencias, en la medida en que proveen detalles ejemplares de procedimiento u otros detalles suplementarios a ios expuestos en la presente, quedan específicamente incorporadas en la presente mediante la referencia. Patente US 4,237,224, expedida el 2 de diciembre de 1980.
Patente US 4,332.898, expedida el 1 de junio de 1982. Patente US 4,342,832, expedida el 3 de agosto de 1982. Patente US 4,356,270, expedida el 26 de octubre de 1982.
Patente US 4,362,817, expedida el 7 de diciembre de 1982. Patente US 4,371 ,625, expedida el 1 de febrero de 1983.
Patente US4 ,488,885, expedida el 15 de mayo de 1984. Patente US 4,467,036, expedida el 21 de agosto de 1984.
Patente US 4,554,101 , expedida el 19 de noviembre de 1985.
Patente US 4,683,195, expedida el 28 de julio de 1987. Patente US 4,683,202, expedida el 28 de julio de 1987. Patente US 4,757,011 , expedida el 12 de julio de 1988. Patente US 4,766,203, expedida el 23 de agosto de 1988.
Patente US 4,769,061 , expedida el 6 de septiembre de 1988.
Patente US 4,797,279, expedida el 10 de enero de 1989. Patente US 4,800,159, expedida el 24 de enero de 1989.
Patente US 4,883,750, expedida el 28 de noviembre de 1989.
Patente US 4,910,016, expedida el 20 de marzo de 1990.
Patente US 4,940,835, expedida el 23 de febrero de 1990.
Patente US 4,965,188, expedida el 23 de octubre de 1990. Patente US 4,971 ,908, expedida el 20 de noviembre de 1990 Patente US 4,987,071 , expedida el 22 de enero de 1991.
Patente US 5,023,179, expedida el 11 de junio de 1991. Patente US 5,024,837, expedida el 18 de junio de 1991.
Patente US 5,126,133, expedida el 30 de junio de 1992. Patente US 6,176,995, expedida el 15 de octubre de 1991 Patente US 5,322,687, expedida el 21 de junio de 1994. Patente US 5,335,711 , expedida el 2 de agosto de 1994. Patente US 5,380,831 , expedida el 10 de enero de 1995. Patente US 5,424,412, expedida el 13 de junio de 1995. Patente US 5,441 ,884, expedida el 15 de agosto de 1995. Patente US 5,463,175, expedida el 31 de octubre de 1995. Patente US 5,500,365, expedida el 19 de marzo de 1996. Publicación de solicitud de patente internacional No. PCT/ US87/00880.
Publicación de solicitud de patente internacional No.PCT/US89/01025.
Publicación de solicitud de patente internacional No. WO 88/09812.
Publicación de solicitud de patente internacional No. WO 88/10315.
Publicación de solicitud de patente internacional No. WO 89/06700. Publicación de solicitud de patente internacional No. WO 91/03162.
Publicación de solicitud de patente internacional No. WO 92/07065.
Publicación de solicitud de patente internacional No. WO 92/110298.4.
Publicación de solicitud de patente internacional No. WO 93/07278.
Publicación de solicitud de patente internacional No. WO 93/15187 Publicación de solicitud de patente internacional No. WO 93/23569.
Publicación de solicitud de patente internacional No. WO 94/02595.
Publicación de solicitud de patente internacional No. WO 94/13688.
Publicación de solicitud de patente europea No. EP 0120516.
Publicación de solicitud de patente europea No. 295156A1. Publicación de solicitud de patente europea No. 320,308. Publicación de solicitud de patente europea No. 329,822. Solicitud de patente de la Gran Bretaña No. 2202328. Abdullah el al. Biotechnology, 4:1087, 1986. Adami and Nevins, In: RNA Processing, Cold Spring Harbor Laboratory, p. 26, 1988 Adang, et al, In: Molecular Strategies for Crop Protection, Alan R. Liss, Inc., pp. 345-353, 1987. Almond and Dean. Biochemistry, 32:1040-1046. 1993. Angsuthanasamnbat et ai. FEMS Microbiol. Lett.. 1 1 1 :255-262. 1993. Aronson. Wu, and Zhang. "Mutagenesis of specificin and toxicity regions of a Bacillus //zwripg/e.jsw protoxin gene", ./. Bacterial. 177:4059-4065. 1995. Bagdasarian et al.. Gene. 16:237. 1981. Barton. et al . Plant Physiol.. 85: 1 103-1109. 1987. Baum el al.. ?ppl. Environ Microbio!.. 56:3420-3428. 1990. Baum, J. Bacterial.. 177:4036-4042, 1995. Benbrook et al.. In: Proceedings Bio Expo 1986. Butterworth. Stoneham, MA. pp. 27-54. 1986. Bevan, M. et al. Nature, 304:184, 1983. Bolivar et al.. Gene. 2:95. 1977. Brady and Wold. In: RNA Processing, Cold Spring Harbor Laboratory, p. 224. 1988. Brown. Nucí. Acids Res.. 14(24):9549, 1986. Brussock and Currier. "Use of sodium dodecyl sulfate-polyacrylamide gel electrophoresis to quantify Bacillus thuringiensis d-endotoxins." liv Analytical Chemislry of Bacillus thurmgiensis. eds.. Hickle and Fitch. The American Chemical Society, pp. 78-87, 1990. Bytebier e/ a/.. Proc. Nati. Acad. Sci. USA, 84:5345. 1987. Callis and Walbot. Genes and Develop.. 1 :1183-1200,1987. Capecchi. "High efficiency transformation by direct microinjection of DNA into culturcd mammalian cells." Cell, 22(2):479-488. 1980.
Caramori. Albertim. Gahzzi. In vivo gcncrauon of hybrids between two Bacillus thuringiensis insect-toxin-encoding genes. Gene, 98:37-44. 1991. Cashmore et al. In. Gen. Eng. o f Plants. Plenum Press, New York, 29-38. 1983. Chambers et al. Appl. Environ Microbiol. , 173:3966-3976, 1991. Chau et al.. Science. 244: 174- 1 1 , 1 89. Chen et al. Nuc Acids Res.. 20:4581 -9, 1992. Chen. Curtiss. Alcántara. Dean.. "Mutations in domain I of Bacillus thuringiensis d-endotoxin CrylAb reduce the irreversible binding of toxin to Manduca sexta brush border membrane vesicles." J. Biol. Chem., 270:6412-6419. 1995. Chen. Lee. Dean. "Site-directed mutations in a highly conserved región of Bacillus thuringiensis d-endotoxin affect inhibition of short circuit current across Bombyx mori midguts," Proc.
Nati Acad. Sci. USA. 90:9041-9045. 1993. Chowrira and Burke. Nucí. Acids Res.. 20:2835-2840. 1992 Clapp. "Somatic gene therapy into hematopoietic cells. Current status and future implications." Clin. PerinatoL 20( 1): 155-168, 1993. Conway and Wickens. In: RNA Processing. Cold Spring Harbor Laboratory. p. 40. 1988. Cornellssen et al. EMBO J . 5( I ):37-40. 1986. Cristou et ai. Plant Physiol. 87:671-674. 1988. Curiel. ?garwal. Wagner. Cottcn. "?denovirus enhancement of transferrin-polyiysine-mediated gene delivery." Proc. Nati. Acad. Sci. USA,, 88(19):8850-8854. 1991. Curiel. Wagner. Cotten. Birnstiel. Agarwal. Li. Loechel. Hu, "High-efficiency gene transfer mediated by adenovirus coupled to DNA-polylysine complexes," Hum. Gen. Ther., 3(2): 147-154, 1992. Daar ct al, In: RNA Processing, Cold Spring Harbor Laboratory. p. 45. 1988. de Maagd. Kwa. van der Klei, Yamamoto. Schippcr. Vlak. Stiekema. Bosch. "Domain III substitution in Bacillus thuringiensis delta-endotoxin Cry?A( b) results in superior toxicity for Spodoptera exigua and altered membrane protein recognition." Appl. Environ.
Microbioi. 62: 1537-1543. 1996. Dean ct al. Nucí. Acids Res.. 14(5):2229. 1986. Dedrick et ai, J Biol Chem.. 262( I :9098-1 106. 1987.
Dhir et al. Piara Cell Reporis. 10:97. 1991. Diehn. De Rocher. Green. "Problcms that can limit the expressi?n of foreign genes in plants: Lessons to be leapied from B.t. toxin genes." In: Genetic Engineering. ed. Setlow, Plenum Press. N.Y., Vol. 18. 1996. Donovan et al.. J. Biol Chem.. 263( 1 ):561 -567, 1988. Doyle et al. 1 Biol. Chem.. 261 (20): 9228-9236. 1986. Dropulic et al. , J. \ "irol . 66: 1432-41. 1992. Earp and Ellar. Nucí. Acids Res.. 15:3619. 1987. Eglitis and Anderso, "Retroviral vectors for introduction of genes into mammalian cells." Biotechniques 6(7):608-614. 1988. Eglitis. Kantoff. Kohn, Karson. Moen. Lothrop. Blaese. Anderson. " Retro viral-mediated gene transfer into hemopoietic cells," Adv. Exp. Med. Biol., 241 : 19-27, 1988a. Elionor er a/., Mol. Gen. Genet., 218:78-86, 1989. Elroy-Stein and Moss, Proc. Nati. Acad. Sci. USA, 87:6743-7. 1990. English and Slatin, Insect Biochem. Mol. Biol. , 22: 1 -7. 1992. Fischhoff er a/.. Bio/Technology. 5:807. 1987. Fraley et al., Biotechnology, 3 :629. 1985. Fraley et al, Proc. Nati. Acad. Sci. USA. 80:4803. 1983. Fraley et al, Bio/Technology, 3 :629-635. 1985. Frohman, Jn: PCR Protocols, A Guide to Melhods and Applications. Academic Press. XVIII Ed.. 1990. Fromm. Taylor. Walbot, Nature. 319:791-793. 1986. Fromm, Taylor, Walbot. "Expression of genes transferred into monocot and dicot plant cells by electroporation," Proc. Nati. Acad. Sci. USA, 82(17):5824-5828. 1985. Fujimura et al. Plant Tissue Culture Letters. 2:74, 1985. Fütterer and Hohn. "Translation in plants - rules and exceptions." Plant Mol. Biol.. 32:159-189, 1996. Fynan. Webster. Fuller. Haynes. Santoro. Robinson. "DNA vaccines: protective immunizations by parenteral. mucosal. and gene gun inoculations." Proc. Nati. Acad. Sci. USA 90(24): 1 1478-1 1482. 1993. Gallego and Nadal-Ginard. Jn: RNA Processing, Cold Spring Harbor Laboratory, p. 61. 1988. Gao and Huan», Nucí. Acids Res.. 21 :2867-72. 1993.
Gazit and Shai. "The assembly and organization of the a5 and o.7 hélices from the pore-forming domain of Bacillus thuringiensis d-cn?otoxin." J. Biol. Chem.. 270:2571 -2578, 1995. Gazit and Shai. "Structural and functional characterization of the co segment of Bacillus thuringiensis d-endotoxin." Biochemistry. 32:3429-3436. 1993. Ge. Rivers. Milne. Dean. "Functional domains of Bacillus thurmgiensis insecticidal crystal proteins: refinement of Heliothis virescens and Trichoplusia ni specificity domains on Cry??(c)." J. Biol. Chem.. 266: 1 7954-17958, 1991. Genovese and Milcarek. n: RNA Processing. Cold Spring Harbor Laboratory, p. 62, 1988. Gil and Proudfoot. Nature . 3 12:473, 1984. González Jr. et al. Proc. Nati Acad. Sci USA. 79:695 1 -6955, 1982. Goodall et al, Jn: RNA Processing, Cold Spring Harbor Laboratory, p. 63, 1988. Graham and van der Eb, "Transformation of rat cells by DNA of human adenovirus 5," Virology 54(2):536-539, 1973. Grochuiski, Masson, Borisova, Pusztai-Carey. Schwartz. Brousseau, Cygler, "Bacillus thuringiensis CrylA(a) insecticidal toxin: crystal structure and channel formation," J. Mol. Biol.. 254:447-464, 1995. Gross et al, Jn: RNA Processing, Cold Spring Harbor Laboratory. p. 128, 1988. Hampson and Rottman. In: RNA Processing. Cold Spring Harbor Laboratory, p. 68. 1988. Hanley and Schuler. Nucí. Acids Res.. 16( 14):7159. 1988. Harlow and Lañe. Jn: Anub?dies: A ÍMboratory Manual. Cold Spring Harbor Laboratory, Cold Spring Harbor. NY. 1988. Helfman and Ricci. Jn: RNA Processing, Cold Spring Harbor Laboratory. p. 219. 1988. Herrera-Estrella et al., Nature, 303:209, 1983. Hertig et al. "Sequence and tissue-specifie expression of a putative peroxidase gene from wheat (Triticum aestivum L.)," Plant Mol. Biol., 16( 1 ): 171 -174. 1991. Hess. Intern Rev. Cytol, 107:367, 1987. Hoekema eí al. Molecular and Cellular Biology. 7:2914-2924. 1987. Hofte and Whiteley. Microbiol. Rev.. 53 :242-255. 1989. Holland et al.. Biochemistry. 17:4900, 1978. Honee et al . Nucí. Acids Res.. 16( 13 ), 1988.
Honee. van der Salm. Visser. Nucí. Acids Res.. 16:6240. 1988. Horsch et al.. Science. 227: 1229- 123 1. 1985. Horton et al . Gene. 77:61-68. 1989. Humason. In: Animal Tissue Techmques. W. II. Freeman and Co.. 1967. lannacone. Grieco. Cellini. "Specific sequence modifications of a ct_v3B endotoxin gene results in high levéis ?f expression and insect resistance." Plant. Mol. Biol. , 34:485-496, 1997. Jaeger ei al . Proc. Nati Acad. Sci. USA. 86: 7706-771 . 1989. Jarret e/ -//.. /// Vitro. 17:825. 1981 . Jarret ct al. Physiol Plan!. 49: 177. 1980. Johnston and Tang. "Gene gun transfection of animal cells and genetic immunization." Methods Cell. Biol.. 43(?):353-365, 1994. Jorgensen et al . Mol. Gen. Genet.. 207:471 , 1987. Kaiser et al , "Amphiphilic secondary structure: design of peptide hormones," Science, 223(4*33):249-255. 1984. Kashani-Saber et al, Antisense Res. Dev., 2:3-15, 1992. Kay et al, Science, 236: 1299-1302, 1987. Keller et ai, EMBO J.. 8: 1309-14, 1989. Kessler et al, Jn: RNA Processing, Cold Spring Harbor Laboratory. p. 85, 1988. Klee et al, Bio/Technology, 3:637, 1985. Klee et ai. Bio/Technology. 3:637-642, 1985. Klein et al , Nature. 327:70. 1987. Klein et al , Proc Nati. Acad. Sci. USA. 85:8502-8505. 1988. Kozak. Nature. 308:241-246. 1984. Krebbers et al.. Plant Molecular Biology. 1 1 :745-759, 1988. Krieg et al, Anzeiger fur Schadlingskunde Pflanzenschutz Umweltschutz. 57: 145-150, 1984. K?eg et al., Z. ang Ent.. 96:500-508, 1983. Kuby, In: Immunology 2nd Edition, W. H. Freeman & Company. NY, 1994. Kunkel et al, Methods Enzymol, 154:367-382, 1987. Kunkel. Proc. Nati. Acad. Sci. USA. 82:488-492, 1985. Kwak. Lu, Dean. "Exploration of receptor binding of Bacillus thuringiensis toxins." Mem. Inst.
Oswaldo. 90:75-79. 1995.
Kwoh et al. Proc. Nati. Acad. Sci, USA. 86(4): 1 173- 1 177. 1 89. Kyte and Doolittle. J. Mol. Biol.. 157: 105-132, 1982. Lambert. Buysse. Decock. Jansens. Piens. Sacy, Seupnck. Yan Audenhove. Van Rie. Van Vliet.
Peferoen. "A Bacillus thuringiensis insecticidal crystal protein with a high activity against members o the family Noctuidac," Appl. Environ. Microbio!.. 62:80-86, 1996. Langridge et al . Proc Nati. Acad. Sci. USA. 86:3219-3223. 1 89. Lee. Young. Dean. "Domain III exchanges of Bacillus ihuringiensis CrylA toxins ai?ect binding to different gypsy moth midgut receptors." Biochem Biophys. Res. Commun.. 216:306- 312, 1995. Lee. Milne, Ge. Dean. "Location of a Bombyx morí receptor binding región on a Bacillus thuringiensis d-endotoxin." J. Biol. Chem.. 267:31 15-3121. 1992. L?uillier et al, EMBO J., 1 1 :441 1 -8. 1992. U et al. Nature, 353:815-821, 1991. Lieber et al, Methods Enzymol, 217:47-66. 1993. Lindstrom et al, Developmental Genetics, 11:160, 1990. Lisziewicz e/ a/., Proc. Nati. Acad. Sci. U.S.A.. 90:8000-4, 1993. Lorz et al. Mol. Gen. Genet.. 199:178. 1985. Lu, Rajamohan, Dean. "Identification of amino acid residues of Bacillus thuringiensis d- endotoxin CrylAa associated with membrane binding and toxicity to Bombyx ori.." J.
Bacterio!.. 176:5554-5559. 1994. Lu, Xiao. Clapp. Li. Broxmeyer. "High efficieney retroviral mediated gene transduction into single isolatcd immature and replatable CD34Í3-) hematopoietic stem/progenitor cells from human umbilical cord blood." . Exp. Med.. 178(6 :2089-2096. 1993. Ivíacaluso and Mettus, J. Bacterio!.. 173: 1353-1356. 1991. Madd?ck et al. Third International Congress of Plant Molecular Biology, Abstract 372, 1991. Maloy et al., Jn: Microbial Genetics. 2nd Edition, Jones and Bartlett Publishers, Boston, MA, 1994. Maloy, Jn: Experimental Techniques in Bacterial Genetics. Jones and Bartlett Publishers. Boston. MA. 1990. Maniatis et al. Jn: Molecular Cloning: a Laboratory Manual. Cold Sppng Harbor Laboratory.
Cold Spring Harbor. NY., 1982.
Marcotte et al.. Nature. 335:454. 1988. Marrone _>/ a/.. J. Econ. Enlomo! . 78-290-293. 1985. Marzluff and Pandey. Jn: RNA Processing. Cold Spring Harbor I.aboratory. p. 244. 1988. McCabe et al. Biotechnology. 6.923. 1988. McCormick et al, Plant C 'cll Reports. 5: 1 -84. 1986. McDevitt el al. Ce 11, 37:993-999. 1984. Mettus and Macaluso, Appl Environ. Microbiol.. 56: 1 128-1 134. 199n Michael. Biotechnique . 16:410-412. 1994. Murashige and Skoog, Physiol. Plant. 15:473. 1962. Murray. Lotzer. Eberle. "Codon usage in plant genes." N cí. Acids Res.. 17:(2)477-493. 1989.
Neuhaus e/ a/.. Theor. Appl Genet.. 75:30. 1987. Odell et al. Nature. 313:810. 1985. Odell et ai. Nature. 313:810, 1985. Obzta et al, Proc. Nati. Acad. Sci. USA. 86(15):5673-5677, 1989. Ohkawa et al, Nucí. Acids Symp. Ser., 27: 15-6, 1992. Ojwang et al, Proc. Nati Acad. Sci. USA. 89: 10802-6, 1992. Olson et al. J. Bacteria . 150:6069. 1982. Omirulleh et al.. JHant Molecular Biology, 21 :415-428, 1993. Pandey and Marzluff, Jn. RNA Processing, Cold Spring Harbor Laboratory, p. 133, 1987. Pena el al, Nature, 325:274, 1987. Perrault et al. Nature. 344:565, 1990. Pieken et al. , Science. 253:314. 1991. Poszkowski et ai. EMBO J.. 3:271 . 1989. Potrykus et al., Mol. Gen. Genet., 199: 183, 1985. Poulsen e/ fl/., Afo/. Gen. Genet., 205: 193-200. 1986. Prokop and Bajpai, "Recombinant DNA Technology I," Ann. N. Y. Acad. Sel, Vol. 646, 1991.
Proudfoot el al, Jn: RNA Processing, Cold Spring Harbor Laboratory, p. 17, 1987. Rajamohan. Alcántara. Lee, Chen, Curtiss. Dean, "Single amino acid changes in domain II of Bacillus thuringiensis CrylAb d-endotoxin affect irreversible binding to Manduca sexta midgut membranc vesicles." J. Bactenol, 177:2276-2282. 1995. Rajamohan. Cotrill. Gould, Dean. "Role of domain II. loop 2 residues oí Bacillus thuringiensis CrylAb d-endotoxin in reversible and irreversible binding to Manduca sexta and Heliothis virc cens. " J Biol. Chem., 271 :2390-2397. 1996. Reines et l.. J. Mol. Biol, 196:299-312, 1987. Rogers et ai.. Jn: Methods For Plan! Molecular Biology. A. Weissbach and H. Weissbach. eds.. Academic Press Inc.. San Diego. CA. 1988. Rogers el al, Methods Enzymol . 153:253-277. 1987. Rouwendal, Mendes. Wolbert. De Boer. "Enhanced expression in tobaccoo of the gene encoding green fluorescent protein by modification of its codon usage." Plant Mol. Biol., 33:989- 999, 1997. Sadofsky and Alwine. Molecular and Cellular Biol?gy, 4(8): 1460- 1468, 1984. Sambrook et al. Jir Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory.
Cold Spring Harbor. NY. 1989. Sanchis. Lereclus. Menou. Chaufaux, Lecadet. Mol. Microbiol., 2:393-404, 1988. Sanchis, Lereclus. Menou. Chaufaux. Guo. Lecadet. Mol. Microbiol., 3:229-238. 1989. Sanders et al.. Nucí. Acids Res.. 15(4): 1543, 1987. Sarver et al. "Ribozymes as potential anti-HlV-1 therapeutic agents." Science, 247:1222-1225. 1990. Scanlon et al, Proc. Nati. Acad. Sci. USA. 88: 10591 -5. 1991. Scaringe et l.. Nucí Acids Res., 18:5433-5441. 1990. Schnepf and Whitely. Proc. Nati Acad. Sci. USA. 78:2893-2897. 1981. Schnepf e/- /.. J Biol Chem.. 260:6264-6272. 1985. Sch ler et al.. Nucí Acids Res.. 10(24):8225-8244. 1982. Segal, In: Biochemical Calculatwns, 2nd Edition. John Wiley & Sons. New York, 1976. Shaw and Kamen. Cell. 46:659-667. 1986. Shaw and Kamen, Jn: RNA Processing, Cold Spring Harbor Laboratory, p. 220, 1987. Simpson, Science. 233:34, 1986. Smedley and Ellar. "Mutagenesis o f three surface-exposed loops of a Bacillus thuringiensis insecticidal toxin reveáis residues important for toxicity, receptor recognition and possibly membrane insertion." Microbiology. 142: 1617-1624. 1996. Smith and Ellar. "Mutagenesis of tvvo surface-exposed loops of the Bacillus thuringiensis CrylC d-endotoxin affeets insccticidal specificity," Biochem. J., 302:61 1-616. 1994.
Smith. Merrick. Bone. Ellar. Appl. Environ. Microbiol.. 62:680-684. 1996. Spielmann et al. Mol Gen. Genet.. 205:34, 1986. Stemmer. "DNA shuffling by random fragmentation and reassembly: in vitro recombination for molecular evolution." Proc. Nati Acad. Sci. U. S. A.. 91 Í22): 10747- 10751. 1994. Tmrsi et al.. Nucí. Acids Res.. 19:5125-30. 1991. Tomic ct l. Nucí. Acids Res.. 12: 1656. 1990. Toriyama et !.. Theor. Appl. Genet. , 73:16, 1986. Trolindcr and C -odin. Plant Cell Reports, 6:231-234. 1987. Tsurushita and Korn. Jn: RNA Processing, Cold Spring Harbor Laboratory, p. 215, 1987. Tumer el al, Nucleic Acids Reg.. 14:8. 3325. 1986. Uchímiya t'/ tf/.. ?/ü/. Gen. Genet.. 204:204. 1986. Upender ef a/., Biotechniques, 18:29-31. 1995. Usman and Cedergren. Trends in Biochem. Sci., 17:334, 1992. Vaeck et al, Nature. 328:33, 1987. Van Tunen et al. EMBO J., 7:1257, 1988. Vasil et al, "Herbicide-resistant fertile transgenic wheat plants obtained by microprojectile bombardment of regenerable embryogenic callus," Biotechnology, 10:667-674, 1992. Vasil, Biotechnology, 6:397. 1 88. Velten and Schell, Nucí. Acids Res., 13:6981 -6998, 1985. Nelte et al, EMBO J., 3:2723-2730, 1984. Ventura et ai, Nucí. Acids Res., 21 :3249-55, 1993. Visser et l., Mol. Gen. Genet., 212:219-224, 1988. Vodkin et al, Cell. 34: 1023. 1983. Vogel et al., J. Cell Bi?chem.. Suppl.. 13D:312. 1989. Von Tersch et al.. Appl. Environ. Microbiol., 60:371 1 -3717, 1994. Wagner. Zatloukal. Cotten, Kirlappos, Mechtler, Curiel. Birnstiel. "Coupling of adenovirus to transferrin-poIylysine/DNA complexes greatly enhances receptor-mediated gene delivery and expression of transfected genes," Proc. Nati. Acad. Sci. USA, 89(13):6099-6103, 1992. Walker el al, Proc. Nati. Acad. Sci. USA, 89(l ):392-396. 1992. Waltets et al., Biochem. Biophys. Res. Commun., 196:921 -926. 1993. Watson et al., In: Molecular Biology of the Gene, 4th Ed.. W. A. Benjamín, Inc.. Menlo Park.
CA, 1987.
Webb e/ /., Plant Sci Letters, 30: 1 , 1983. Weerasinghe et al. J Virol.. 65:5531 -4, 1991. Weissbach and Weissbach. ///. Methods for Plant Molecular Biology. Academic Press, Inc.. San Diego, C A. 1988. Wenzler et al.. Plant Mol. Biol.. 12:41 -50. 1989. Wickens and Stephenson. Science. 226:1045. 1984. Wickens et al. Jn: RNA Processing, Cold Spring Harbor Laboratory. p. 9. 1987. Wiebauer e/ a/.. Molecular and Celiular Biology, 8C5):2042-2051. 1988. Wolfersberger e/ a/.. í/7/ /. Environ Microbiol., 62:279-282. 1996. Wong and Neumann. "Electric field mediated gene transfer." Biochim. Biophys. Res. Commun. 107(2):584-587. 1982. Wu and ?ronson. "Localized mutagenesis defines regions of the Bacillus thuringiensis d- endotoxin involved in toxicity and specificity." J. Biol. Chem.. 267:231 1-2317. 1992. Wu and Dean, "Functional significance of loops in the receptor binding domain of Bacillus thuringiensis CrylIlA d-endotoxin.." J. Mol. Biol.. 255:628-640, 1996. Yamada et al. Plant Cell Rep., 4:85. 1986. Yamamoto and I izuka. A rch. Biochem Biophys.. 227(1 ):233-241. 1983. Yang et al. Proc. Nati Acad. Sci. USA. 87:4144-48. 1990. Yu et al, Proc. Nati Acad. Sci. USA, 90:6340-4, 1993. Zatloukal. Wagner. Cotten. Phillips. Plank. Steinlein. Curiel. Birnstiel. "Transferrinfection: a highly efficicnt way to express gene construets ín eukaryotic cells." Ann N Y Acad. Sci.. 660: 136-153. 1992. Zhou et al. Methods Enzymol. 101 :433. 1983.
Todas las composiciones y todos los métodos descritos y reivindicados aquí pueden ser hechos y ejecutados sin experimentación indebida, a la luz de la presente descripción. Si bien se ha descrito las composiciones y los métodos de esta invención en términos de las modalidades preferidas, será aparentes para quienes sean expertos en la materia que puede aplicarse variaciones en las composiciones y en los métodos, así como en los pasos o en la secuencia de pasos del método aquí descrito, sin salirse del concepto, del espíritu ni del alcance de la invención. De manera más específica, será aparente que ciertos agentes que están relacionados química y fisiológicamente, pueden reemplazar a los agentes descritos aquí, con tal de que se obtenga los mismos resultados o resultados similares. Todos esos sustitutos y todas esas modificaciones similares, aparentes para los expertos en la materia, se considera que están dentro del espíritu, el alcance y el concepto de la invención, tal como se define en las reivindicaciones que vienen al final. 7.O.- LISTADO DE LAS SECUENCIAS (1 ) INFORMACIÓN GENERAL: (i) SOLICITANTE: (A) NOMBRE: Ecogen, Inc. (B) DOMICILIO: 2005 Cabot Boulevard West (C) CIUDAD: Langhorne (D) ESTADO: Pennsylvania (E) PAÍS: E. U. A. (F) CÓDIGO POSTAL (ZIP) 19047-3023. (¡i) TÍTULO DE LA INVENCIÓN: PLANTAS TRANSGÉNICAS QUE EXPRESAN delta-ENDOTOXINAS ACTIVAS CONTRA LEPIDÓPTEROS, (iii) NUMERO DE SECUENCIAS: 76 (iv) FORMA QUE SE PUEDE LEER EN COMPUTADORA: (A) TIPO DE MEDIO: disco flexible. (B) COMPUTADORA: PC compatible con IBM (C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) PROGRAMA DE APLICACIÓN: Patentln emisión #1.0, versión # 1.30 (EPO) (vi) DATOS DE SOLICITUD PREVIA: (A) NÚMERO DE SOLICITUD: US 08/757,636 (B) FECHA DE PRESENTACIÓN. 27 de noviembre 1996. (2) INFORMACIÓN PARA SEQ ID NO: 1 : (¡) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 3567 pares de bases (B) TIPO: ácido nucleico (C) NÚMERO DE FILAMENTOS: uno solo (D) TOPOLOGÍA: lineal (ix) ASPECTO (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1...3567 (x) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO: 1 : ATG GAG GAA AAT AAT CAA AAT CAA TGC ATA CCT TAC AAT TGT TTA AGT 48 Met Giu Glu Asn Asn Gln Asn Gln Cys lie Pro Tyr Asn Cys Leu Ser 1 5 10 15 AAT CCT GAA GAA GTA CTT TTG GAT GGA GAA CGG ATA TCA ACT GGT AAT 96 Asn Pro Glu Glu V=l Leu Leu Asp Gly Giu Arg lie Ser Thr Gly Asn 20 25 30 TCA TCA ATT GAT ATT TCT CTG TCA CTT GTT CAG TTT CTG GTA TCT AAC 144 Ser Ser He Asp He Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn 35 40 45 TTT GTA CCA GGG GGA GGA TTT TTA GTT GGA TTA ATA GAT TTT GTA TGG 192 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 GGA ATA GTT GGC CCT TCT CAA TGG GAT GCA TTT CTA GTA CAA ATT GAA 240 Gly He Val Giy Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu 65 70 75 80 CAA TTA ATT AAT GAA AGA ATA GCT GAA TTT GCT AGG AAT GCT GCT ATT 288 Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 GCT AAT TTA GAA GGA TTA GGA AAC AAT TTC AAT ATA TAT GTG GAA GCA 336 Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala xoo 105 110 TTT AAA GAA TGG GAA GAA GAT CCT AAT AAT CCA GCA ACC AGG ACC AGA 384 Phe Lys Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Thr Arg 115 120 125 GTA ATT GAT CGC TTT CGT ATA CTT GAT GGG CTA CTT GAA AGG GAC ATT 432 Val He Asp Arg Phe A.rg He Leu Asp Giy Leu Leu Glu A.rg Asp He 130 135 140 CCT TCG TTT GCA ATT TCT GGA TTT GAA GTA CCC CTT TTA TCC GTT TAT 480 Pro Ser Phe Ala He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 GCT CAA GCG GCC AAT CTG CAT CTA GCT ATA TTA AGA GAT TCT GTA ATT 528 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 TTT GGA GAA AGA TGG GGA TTG ACÁ ACG ATA AAT GTC AAT GAA AAC TAT 576 Phe Gly Glu Arg Trp Gly Leu Thr Thr He Asn Val Asn Glu Asn Tyr 180 185 190 AAT AGA CTA ATT AGG CAT ATT GAT GAA TAT GCT GAT CAC TGT GCA AAT 624 Asn Arg Leu He Arg His He Asp Glu Tyr Ala Asp Kis Cys Ala Asn 195 200 205 ACG TAT AAT CGG GGA TTA AAT AAT TTA CCG AAA TCT ACG TAT CAA GAT 672 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp 210 215 220 TGG ATA ACÁ TAT AAT CGA TTA CGG AGA GAC TTA ACÁ TTG ACT GTA TTA 720 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 GAT ATC GCC GCT TTC TTT CCA AAC TAT GAC AAT AGG AGA TAT CCA ATT 768 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp As Arg Arg ryr Pro He 245 250 255 CAG CCA GTT GGT CAA CTA ACÁ AGG GAA GTT TAT ACG GAC CCA TTA ATT 816 Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 AAT TTT AAT CCA CAG TTA CAG TCT GTA GCT CAA TTA CCT ACT TTT AAC 864 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 GTT ATG GAG AGC AGC GCA ATT AGA AAT CCT CAT TTA TTT GAT ATA TTG 912 Val Met Glu Ser Ser Ala He Arg Asn Pro His Leu Phe Asp He Leu 290 295 300 AAT AAT CTT ACÁ ATC TTT ACG GAT TGG TTT AGT GTT GGA CGC AAT TTT 960 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe 305 310 315 320 TAT TGG GGA GGA CAT CGA GTA ATA TCT AGC CTT ATA GGA GGT GGT AAC 1008 Tyr Trp Gly Gly Hrs Arg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 ATA ACÁ TCT CCT ATA TAT GGA AGA GAG GCG AAC CAG GAG CCT CCA AGA 1056 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Giu Pro Pro Arg 340 345 350 TCC TTT ACT TTT AAT GGA CCG GTA TTT AGG ACT TTA TCA AAT CCT ACT 1104 Ser Phe Thr Phe Asn Giy Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 TTA CGA TTA TTA CAG CAA CCT TGG CCA GCG CCA CCA TTT AAT T.A CGT 1152 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 GGT GTT GAA GGA GTA GAA TTT TCT ACÁ CCT ACÁ AAT AGC TTT ACG TAT 1200 Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 CGA GGA AGA GGT ACG GTT GAT CT TTA ACT GAA TTA CCG CCT GAG GAT 1248 Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 AAT AGT GTG CCA CCT CGC GAA GGA TAT AGT CAT CGT TTA TGT CAT GCA 1296 Asn Ser Val Pro Pro Arg Giu Gly Tyr Ser His Arg Leu Cys H¿s Ala 420 425 430 ACT TTT GTT CAA AGA TCT GGA ACÁ CCT TTT TTA ACÁ ACT GGT GTA GTA 1344 Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu T,ar Tnr Gly Val Val 435 440 445 TTT TCT TGG ACG CAT C3T AGT GCA ACT CTT ACÁ AAT ACÁ ATT GAT CCA 1392 Phe Ser Trp Thr K^? Arg Ser Ala Thr Leu Thr Asr. Thr He Asp Pro 450 455 460 GAG AGA ATT AAT CAA ATA CCT TTA GTG AAA GGA TTT AGA GTT TGG GGG 1440 Glu Arg He Asn Gl.i He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 GGC ACC TCT GTC ATT ACÁ GGA CCA GGA TTT ACÁ GGA GGG GAT ATC CTT 1488 Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu 485 490 495 CGA AGA AAT ACC TTT GGT GAT TTT GTA TCT CTA CAA GTC AAT ATT AAT 1536 Arg Arg Asn Thr Phe Giy Asp Phe Val Ser Leu Gin Val Asn He Asn 500 505 510 TCA CCA ATT ACC CAA AGA TAC CGT TTA AGA TTT CGT TAC GCT TCC AGT 1584 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Pne Arg Tyr Ala Ser Ser 515 520 525 AGG GAT GCA CGA GTT ATA GTA TTA ACÁ GGA GCG GCA TCC ACÁ GGA GTG 1632 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val 530 535 540 GGA GGC CAA GTT AGT GTA AAT ATG CCT CTT CAG AAA ACT ATG GAA ATA 1680 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gin Lys Thr Met Giu He 545 550 555 560 GGG GAG AAC TTA ACÁ X ^T AGA ACÁ TTT AGA TAT ACC GAT TTT AGT AAT 1728 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 CCT TTT TCA TTT AGA GCT AAT CCA GAT ATA ATT GGG ATA AGT GAA CAA •1776 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Giu Gln 580 585 590 CCT CTA TTT GGT GCA GT TCT ATT AGT AGC o - GAA CTT TAT ATA GAT 1824 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Glu Leu Tyr He Asp 595 600 605 AAA ATT GAA ATT ATT CTA GCA GAT GCA ACÁ TTT GAA GCA GAA TCT GAT 1872 Lys He Glu He He Leu Ala Asp Ala Thr Phe Giu Ala Glu Ser Asp 610 615 620 TTA GAA AGA GCA CAA AAG GCG GTG AAT GCC CTG TT ACT TCT CC AAT 1920 Leu Glu Arg Ala Glr. Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 640 CAA ATC GGG TTA AAA ACC GAT GTG ACG GAT TA.T CAT ATT GAT CAA GTA 1968 Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr Kis He Asp Gln Val 645 650 655 TCC AAT TTA GTG GAT TGT TTA TCA GAT GAA TGT GAT GAA AAG 2016 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 CGA GAA TTG TCC GAG AAA GTC AAA CAT GCG AAG CGA CTC AGT GAT GAG 2064 Arg Glu Leu Ser Giu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu 675 680 685 CGG AAT TTA CTT CAA GAT CCA AAC TTC AGA GGG AAT AGA CAA CCA 2112 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg / I_e Asr. Arg Gln Pro 690 695 700 GAC CGT GGC TGG AGA GGA AGT ACÁ GAT ATT ACC ATC CAA GGA GGA GAT 2160 Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Gly Asp 705 710 715 720 GAC GTA TTC AAA GAG AAT TAC GTC ACÁ CTA CCG GGT ACC GTT GAT GAG 2208 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu 725 730 735 TGC TAT CCA ACG TAT TTA TAT CAG AAA ATA GAT GAG TCG AAA TTA AAA 2256 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys 740 745 750 GCT TAT ACC CGT TAT GAA TTA AGA GGG TAT ATC GAA GAT AGT CAA GAC 2304 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Gln Asp 755 760 765 TTA GAA ATC TAT TTG ATC CGT TAC AAT GCA AAA CAC GAA ATA GTA AAT 2352 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys His Glu He Val Asn 770 775 780 GTG CCA GGC ACG GGT TCC TTA TGG CCG CTT TCA GCC CAA AGT CCA ATC 2400 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He 785 790 795 800 GGA AAG TGT GGA GAA CCG AAT CGA TGC GCG CCA CAC CTT GAA TGG AAT 2448 Gly Lys Cys Giy Glu Pro Asn Arg Cys Ala Pro Kis Leu Glu Trp Asn 805 810 815 CCT GAT CTA GAT TGT TCC TGC AGA GAC GGG GAA AAA TGT GCA CAT CAT 2496 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His 820 825 830 TCC CAT CAT TTC ACC TTG GAT ATT GAT GTT GGA TGT ACÁ GAC TTA AAT 2544 Ser His His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 GAG GAC TTA GGT GTA TGG GTG ATA TTC AAG ATT AAG ACG CAA GAT GGC 2592 Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 860 CAT GCA AGA CTA GGG AAT CTA GAG TTT CTC GAA GAG AAA CCA TTA TTA 2640 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 GGG GAA GCA CTA GCT CGT GTG AAA AGA GCG GAG AAG AAG TGG AGA GAC 2688 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 ' 895 AAA CGA GAG AAA CTG CAG TTG GAA ACÁ AAT ATT GTT TAT AAA GAG GCA 2736 Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 AAA GAA TCT GTA GAT GCT TTA TTT GTA AAC TCT CAA TAT GAT AGA TTA 2784 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu 915 920 925 CAA GTG GAT ACG AAC ATC GCA ATG ATT CAT GCG GCA GAT AAA CGC GTT 2832 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 CAT AGA ATC CGG GAA GCG TAT CTG CCA GAG TTG TCT GTG ATT CCA GGT 2880 His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 950 955 960 GTC AAT GCG GCC ATT TTC GAA GAA TTA GAG GGA CGT ATT TTT ACÁ GCG 2928 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 TAT TCC TTA TAT GAT GCG AGA AAT GTC ATT AAA AAT GGC GAT TTC AAT 2976 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn 980 985 990 AAT GGC TTA TTA TGC TGG AAC GTG AAA GGT CAT GTA GAT GTA GAA GAG 3024 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu 995 1000 1005 CAA AAC AAC CAC CGT TCG GTC CTT GTT ATC CCA GAA TGG GAG GCA GAA 3072 Gln Asn Asn His Arg Ser Val Leu Val He Pro Giu Trp Glu Ala Glu 1010 1015 1020 GTG TCA CAA GAG GTT CGT GTC TGT CCA GGT CGT GGC TAT ATC CTT CGT 3120 Val Ser Gln Giu Val Arg Val Cys Pro Giy Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 GTC ACÁ GCA TAT AAA GAG GGA TAT GGA GAG GGC TGC GTA ACG ATC CAT 3168 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 GAG ATC GAA GAC AAT ACÁ GAC GAA CTG AAA TTC AGC AAC TGT GTA GAA 3216 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 GAG GAA GTA TAT CCA AAC AAC ACÁ GTA ACG TGT AAT AAT TAT ACT GGG 3264 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 ACT CAA GAA GAA TAT GAG GGT ACG TAC ACT TCT CGT AAT CAA GGA TAT 3312 Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln G_y Tyr 1090 1095 1100 GAC GAA GCC TAT GGT AAT AAC CCT TCC GTA CCA GCT GAT TAC GCT TCA 3360 Asp Glu Ala Tyr Gly Asn Asr. Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 GTC TAT GAA GAA AAA TCG TAT ACÁ GAT GGA CGA AGA GAG AAT CCT TGT 3408 Val Tyr Glu Giu Lys Ser Tyr Thr Asp Gly Arg Arg Glu Asr. Pro Cys 1125 1130 1135 GAA TCT AAC AGA GGC TAT GGG GAT TAC ACÁ CCA CTA CCG GCT GGT TAT 3456 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 GTA ACÁ AAG GAT TTA GAG TAC TTC CCA GAG ACC GAT AAG GTA TGG ATT 3504 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He 1155 1160 1165 GAG ATC GGA GAA ACÁ GAA GGA ACÁ TTC ATC GTG GAT AGC GTG GAA TTA 3552 Glu He Gly Glu Thr Glu Giy Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 CTC CTT ATG GAG GAA 3567 Leu Leu Met Giu Glu 1185 (2) INFORMACIÓN PARA SEQ ID NO: 2: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1189 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (¡i) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 2: Met Glu Glu Asn Asn Gln Asr. Gln Cys He Pro Tyr Asn Cys Leu Ser 1 5 10 15 Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg He Ser Thr Gly Asn 20 25 30 Ser Ser He Asp He Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn 35 40 45 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu 65 70 75 80 Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 Ala Asn Leu Glu Gly Leu Giy Asn Asn Phe Asn He Tyr Val Glu Ala 100 105 110 Phe Lys Giu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Thr Arg 115 120 125 Val He Asp Arg Phe Arg lie Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 Pro Ser Phe Ala He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 Ala Gln Ala Ala Asn Leu Kis Leu Ala He Leu Arg A.sp Ser Val He 165 170 175 Phe Gly Glu Arg Trp Gly Leu Thr Thr He Asn Val Asn Glu Asn Tyr 180 185 190 Asn Arg Leu He Arg Kis He Asp Glu Tyr Ala Asp His Cys Ala Asn 195 200 205 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp 210 215 220 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He 245 250 255 Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 Val Met Glu Ser Ser Ala He Arg Asn Pro Kis Leu Phe Asp He Leu 290 295 300 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe 305 310 315 320 Trp Gly Gly His Arg Val He Ser Ser Leu He Giy Gly Gly Asn 325 330 335 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Giu Pro Pro Arg 340 345 350 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 Gly "Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 Arg Giy Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser Kis Arg Leu Cys H s Ala 420 425 430 Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 31y Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu 485 490 495 Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gin Val Asn He Asn 500 505 510 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser 515 520 525 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val . 530 535 540 Gly Gly Gin Val Ser Val Asn Met Pro Leu Gin Lys Thr Met Glu He 545 550 555 560 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Giy Glu Leu Tyr He Asp 595 600 605 Lys He Glu lie He Leu Ala Asp Ala Thr Phe Giu Ala Glu Ser Asp 610 615 620 Leu Glu Arg Ala Gin Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 640 Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr Kis He Asp Gln Val 645 650 655 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu 675 680 685 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Gly Asp 705 710 715 720 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu 725 730 735 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys 740 745 750 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Gln Asp 755 760 765 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys His Glu He Val Asn 770 775 780 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He 785 790 795 800 Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro Kis Leu Glu Trp Asn 805 810 815 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His 820 825 830 Ser His His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 bou His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Glr. Tyr Asp Arg Leu 915 920 925 Gln Val Asp Thr Asn He Ala Met He Kis Ala Ala Asp Lys Arg Val 930 935 940 His Arg He Arg Glu Ala Tyr _eu Pro Glu Leu Ser Val He Pro Gly 945 950 955 960 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn 980 985 990 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu 995 1000 1005 Gln Asn Asn H s Arg Ser Val Leu Val i: e Pro Glu Trp Giu Ala Glu 1010 1015 1020 Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 Val Thr Ala Tyr Lys Glu Giy Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Giy Arg Arg Glu Asn Pro Cys 1125 1130 1135 Glu Ser Asn Arg Gly Tyr Giy Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He l ó5 1160 1165 Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 Leu Leu Met Glu Glu 1185 (2) INFORMACIÓN PARA SEQ ID NO: 3: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 3567 pares de bases (B) TIPO: ácido nucleico (C) NÚMERO DE FILAMENTOS: uno solo (D> TOPOLOGÍA: lineal (ix) ASPECTO: (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1...3567 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 3: ATG GAG GAA AAT AAT CAA AAT CAA TGC ATA CCT TAC AAT TGT TTA AGT 48 Met Giu Glu Asn Asn Gln Asn Gln Cys He Pro Tyr Asn Cys Leu Ser 1 5 10 15 AAT CCT GAA GAA GTA CTT TTG GAT GGA GAA CGG ATA TCA ACT GGT AAT 96 Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg He Ser Thr Gly Asn 20 25 30 TCA TCA ATT GAT ATT TCT CTG TCA CTT GTT CAG TTT CTG GTA TCT AAC 144 Ser Ser He Asp He Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn 35 40 45 TTT GTA CCA GGG GGA GGA TTT TTA GTT GGA TTA ATA GAT TTT GTA TGG 192 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu He Asp Phe Val Tro 50 55 60 GGA ATA GTT GGC CCT TCT CAA TGG GAT GCA CTA GTA CAA ATT GAA 240 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu 65 70 75 80 CAA TTA ATT AAT GAA AGA ATA GCT GAA TTT GCT AGG AAT GCT GCT ATT 288 Gln Leu He Asn Giu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 GCT AAT TTA GAA GGA TTA GGA AAC AAT TTC AAT ATA TAT GTG GAA GCA 336 Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala 100 105 110 TTT AAA GAA TGG GAA GAA GAT CCT AAT AAT CCA GCA ACC AGG ACC AGA 384 Phe Lys Glu Trp Giu Glu Asp Pro Asn Asn Pro Ala Thr Arg Thr Arg 115 120 125 GTA ATT GAT csc CGT ATA CTT GAT GGG CTA CTT GAA AGG GAC ATT 432 Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 CCT TCG TTT GAC ATT GGA TTT GAA GTA CCC CTT TTA TCC GTT TAT 480 Pro Ser Phe Asp He Ser Gly Phe Glu Val Prc Leu Leu Ser Val Tyr 145 150 155 160 GCT CAA GCG GCC AAT CTG CAT CTA GCT ATA TTA AGA GAT TCT GTA ATT 528 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 TTT GGA GAA AGA TGG GGA TTG ACÁ ACG ATA AAT GTC AAT GAA AAC TAT 576 Phe Gly Glu Arg Trp Gly Leu Thr Thr He Asn Val Asn Giu Asn Tyr 180 185 190 AAT AGA CTA ATT AGG CAT ATT GAT GAA TAT GAT CAC TGT GCA AAT 624 Asn Arg Leu He Arg His He Asp Glu Tyr Ala Asp His Cys Ala Asn 195 200 205 ACG TAT AAT CGG GGA TTA AAT AAT TTA CCG AAA TCT ACG TAT CAA GAT 672 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Ly? Ser Thr Tyr Gin Asp 210 215 220 TGG ATA ACÁ TAT AAT CGA TTA CGG AGA GAC TTA ACÁ TTG ACT GTA TTA 720 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 GAT ATC GCC GCT TTC TTT CCA AAC TAT GAC AAT AGG AGA TAT CCA ATT 768 Asp He Ala Ala Phe Phe Pro Asn Tyr A.sp Asn Arg Arg Tyr Pro He 245 250 255 CAG CCA GTT GGT CAA CTA ACÁ AGG GAA GTT TAT ACG GAC CC? TTA ATT 816 Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tvr Thr Asp Pro Leu He 260 265 270 AAT TTT AAT CCA CAG TTA CAG TCT GTA GCT CAA TTA CCT ACT TT AAC 864 Asn Phe Asn Pro Glr. Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 GTT ATG GAG AGC AGC GCA ATT AGA AAT CCT CAT TTA TTT GAT ATA TTG 912 Val Met Glu Ser Ser Ala He Arg Asn Pro His Leu Phe Asp He Leu 290 295 300 AAT AAT CTT ACÁ ATC TTT ACG GAT TGG TTT AGT GTT GGA AAT TTT 960 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn 305 310 315 320 TAT TGG GGA CAT CGA GTA ATA TCT AGC CTT ATA GGA GGT AAC 1008 Tyr Trp Gly Gly His Arg Val He Ser Ser Leu lie Giy Gly Gly Asn 325 330 335 ATA ACÁ TCT CCT ATA TAT GGA AGA GAG GCG AAC CAG GAG CCT CCA AGA 1056 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg 340 345 350 TCC TTT ACT TTT AAT GGA CCG GTA TTT AGG ACT TTA TCA AAT CCT ACT 1104 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 TTA CGA TTA TTA CAG CAA CCT TGG CCA GCG CCA CCA TTT AAT TTA CGT 1152 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe As Leu Arg 370 375 380 GGT GTT GAA GGA GTA GAA TTT TCT AC CCT ACÁ AAT AGC TT ACG TAT 1200 Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 CGA GGA AGA GGT ACG GTT GAT TCT TTA ACT GAA TTA CCG CCT GAG GAT 1248 Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 AAT AGT GTG CCA CCT CGC GAA GGA TAT AGT CAT CGT TTA TGT CAT GCA 1296 Asn Ser Val Pro Pro Arg Giu Gly Tyr Ser His Arg Leu Cys His Ala 420 425 430 ACT TTT GTT CAA AGA TCT GGA ACÁ CCT TTT TTA ACÁ ACT GTA GTA 1344 Thr Phe Val Gin Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 TTT TCT TGG ACG CAT CGT AGT GCA ACT CTT ACÁ AAT ACÁ ATT GAT CCA 1392 Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 GAG AGA ATT AAT CAA ATA CCT TTA GTG AAA GGA TTT AGA GTT TGG GGG 1440 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 GGC ACC GTC ATT ACÁ GGA CCA GGA TTT ACÁ GGA GGG GAT ATC CTT 1488 Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu 485 490 495 CGA AGA AAT ACC TT GGT GAT TTT GTA TCT CTA CAA GTC AAT ATT AAT 1536 Arg Arg Asn Thr Phe Giy Asp Phe Val Ser Leu Gln Val Asn He Asn 500 505 510 2"66 TCA CCA ATT ACC CAA AGA TAC CGT TTA AGA TTT CGT TAC GCT TCC AGT L584 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Ala Ser Ser 515 520 525 AGG GAT GCA CGA GTT ATA GTA TTA ACÁ GGA GCG GCA CC ACÁ GGA GTG 1632 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Tnr Gly Val 5JU 535 540 GGA GGC CAA GTT AGT GTA AAT ATG CCT CTT CAG AAA ACT ATG GAA ATA 1680 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu He 545 550 555 560 GGG GAG AAC TTA ACÁ TCT AGA ACÁ TTT AGA TAT ACC GAT TTT AGT AAT 1728 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr As Phe Ser Asn 565 570 575 CCT TTT TCA TTT AGA GCT AAT CCA GAT ATA ATT GGG ATA AGT GAA CAA 1776 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 CCT CTA TTT GGT GCA GGT TCT ATT AGT AGC GGT GAA CTT TAT ATA GAT 1824 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Glu Leu Tyr He Asp 595 600 605 AAA ATT GAA ATT ATT CTA GCA GAT GCA ACÁ TTT GAA GCA GAA TCT GAT 1872 Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp 610 615 620 TTA GAA AGA GCA CAA AAG GCG GTG AAT GCC CTG TTT ACT TCT TCC AAT 1920 Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 640 CAA ATC GGG TTA AAA ACC GAT GTG ACG GAT TAT CAT ATT GAT CAA GTA 1968 Gin He Gly Leu Lys Thr Asp Val Thr Asp Tyr His He As Gln Val 645 650 655 TCC AAT TTA GTG GAT TGT TTA TCA GAT GAA TTT TGT CTG GAT GAA AAG 2016 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 CGA GAA TTG TCC GAG AAA GTC AAA CAT GCG AAG CGA CTC AGT GAT GAG 2064 Arg Glu Leu Ser Glu Lys Val Lys HlS Ala Lys Arg Leu Ser Asp Glu 675 680 685 CGG AAT TTA CTT CAA GAT CCA AAC TTC AGA GGG ATC AAT AGA CAA CCA 2112 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 GAC CGT GGC X *JO AGA GGA AGT ACÁ GAT ATT ACC ATC CAA GGA GGA GAT 2160 Asp Arg Gly Trp Arg Gly Ser Tnr Asp He Thr He Gln Giy Gly Asp 705 710 715 720 GAC GTA TTC AAA GAG AAT TAC GTC ACÁ CTA CCG GGT ACC GTT GAT GAG 2208 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly k v Val Asp Glu 725 730 735 TGC TAT CCA ACG TAT TTA TAT CAG AAA ATA GAT GAG TCG AAA TTA AAA 2256 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys 740 745 750 GCT TAT ACC CGT TAT GAA TTA AGA GGG TAT ATC GAA GAT AGT CAA GAC 2304 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Gln Asp 755 760 765 TTA GAA ATC TAT TTG ATC CGT TAC AAT GCA AAA CAC GAA ATA GTA AAT 2352 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys His Giu He Val Asn 770 775 780 GTG CCA GGC ACG GGT TCC TTA TGG CCG CTT TCA GCC CAA AGT CCA ATC 2400 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He 785 790 795 800 GGA AAG TGT GGA GAA CCG AAT CGA TGC GCG CCA CAC CTT GAA TGG AAT 2448 Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His Leu Glu Trp Asn 805 810 815 CCT GAT CTA GAT TGT TCC TGC AGA GAC GGG GAA AAA TGT GCA CAT CAT 2496 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His 820 825 830 TCC CAT CAT TTC ACC TTG GAT ATT GAT GTT GGA TGT AC GAC TTA AAT 2544 Ser Kis His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 GAG GAC TTA GGT GTA TGG GTG ATA TTC AAG ATT AAG ACG CAA GAT GGC 2592 Glu Asp Leu Gly Val Trp Val lie Phe Lys He Lys Thr Gln Asp Gly 850 855 860 CAT GCA AGA CTA GGG AAT CTA GAG TTT CTC GAA GAG AAA CCA TTA TTA 2640 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 GGG GAA GCA CTA GCT CGT GTG AAA AGA GCG GAG AAG AAG TGG AGA GAC 2688 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 AAA CGA GAG AAA CTG CAG TTG GAA ACÁ AAT ATT GTT TAT AAA GAG GCA 2736 Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 AAA GAA TCT GTA GAT GCT TTA TTT GTA AAC TCT CAA TAT GAT AGA TTA 2784 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu 915 920 925 CAA GTG GAT ACG AAC ATC GCA ATG ATT CAT GCG GCA GAT AAA CGC GTT 2832 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 CAT AGA ATC CGG GAA GCG TAT CTG CCA GAG TTG TCT GTG ATT CCA GGT 2880 His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 950 955 960 GTC AAT GCG GCC ATT TTC GAA GAA TTA GAG GGA CGT ATT TTT ACÁ GCG 2928 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 TAT TCC TTA TAT GAT GCG AGA AAT GTC ATT AAA AAT GGC GAT TTC AAT 2976 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Giy Asp Phe Asn 980 985 990 AAT GGC TTA TTA TGC TGG AAC GTG AAA GGT CAT GTA GAT GTA GAA GAG 3024 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly Kis Val Asp Val Glu Glu 995 1000 1005 CAA AAC AAC CAC CGT TCG GTC CTT GTT ATC CCA GAA TGG GAG GCA GAA 3072 Gln Asn Asn His Arg Ser Val Leu Val He Pro Glu Trp Glu Ala Glu 1010 1015 1020 GTG TCA CAA GAG GTT CGT GTC TGT CCA GGT CGT GGC TAT ATC CTT CGT 3120 Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Giy Tyr He Leu Arg 1025 1030 1035 1040 GTC AC GCA TAT AAA GAG GGA TAT GGA GAG GGC TGC GTA ACG ATC CAT 3168 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 GAG ATC GAA GAC AAT ACÁ GAC GAA CTG AAA TTC AGC AAC TGT GTA GAA 3216 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 GAG GAA GTA TAT CCA AAC AAC ACÁ GTA ACG TGT AAT AAT TAT ACT GGG 3264 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 ACT CAA GAA GAA TAT GAG GGT ACG TAC ACT TCT CGT AAT CAA GGA TAT 3312 Thr Gln Glu Glu Tyr Glu Giy Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 GAC GAA GCC TAT GGT AAT AAC CCT TCC GTA CCA GCT GAT TAC GCT TCA 3360 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 GTC TAT GAA GAA AAA TCG TAT ACÁ GAT GGA CGA AGA GAG AAT CCT TGT 3408 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg Giu Asn Pro Cys 1125 1130 1135 GAA TCT AAC AGA GGC TAT GGG GAT TAC ACÁ CCA CTA CCG GCT GGT TAT 3456 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 GTA ACÁ AAG GAT TTA GAG TAC TTC CCA GAG ACC GAT AAG GTA TGG ATT 3504 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He 1155 1160 1165 GAG ATC GGA GAA ACÁ GAA GGA ACÁ TTC ATC GTG GAT AGC GTG GAA TTA 3552 Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 ¡CTC CTT ATG GAG GAA 3567 'Leu Leu Met Glu Glu 1185 (2) INFORMACIÓN PARA SEQ ID NO: 4: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1189 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (¡i) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 4: Met Glu Glu Asn Asn Gln Asn Gln Cys lie Pro Tyr Asn Cys Leu Ser 1 5 10 15 Aen Pro Glu Glu Val Leu Leu Asp Gly Glu Arg He Ser Thr Gly Asn 20 25 30 Ser Ser He Asp He Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn 35 40 45 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu 65 70 75 80 Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 Ala Asn Leu Giu Gly Leu Gly Asn Asn Phe Asn He Tyr Val Giu Ala 100 105 110 Phe Lys Giu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Thr Arg 115 120 125 Val He Asp Arg Phe Arg He Leu Asp Giy Leu Leu Glu Arg Asp He 130 135 140 Pro Ser Phe Asp He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 Phe Giy Glu Arg Trp Gly Leu Thr Thr He Asn Val Asn Glu Asn Tyr 180 185 190 Asn Arg Leu He Arg Kis He Asp Glu Tyr Ala Asp His Cys Ala Asn 195 200 205 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gin Asp 210 215 220 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 * 230 235 240 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He - 245 250 255 Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 26C 265 270 Asn Phe Asn Pro Glr. Leu Gln Ser Val Ala Glr. Leu Pro Thr Phe Asn 275 280 285 Val Met Glu Ser Ser Ala He Arg Asn Pro His Leu Phe Asp He Leu 290 295 300 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe 305 310 315 320 Tyr Trp Gly Gly His Arg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Giu Pro Pro Arg 340 345 350 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser H s .Arg Leu Cys His Ala 420 425 430 Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 Gly Thr Ser Val He Thr Gly Pro Giy Phe Thr Gly Gly Asp He Leu 485 490 495 Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu 3in Val Asn He Asn 500 505 510 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg T/r Ala Ser Ser 515 520 525 Arg Asp Ala Arg Val He Val Leu Tnr Giy Ala Ala Ser Thr Gly Val 530 535 540 Gly Gly Glr. Val Ser Val Asn Met Pro Leu Gip lys Thr Met Glu He 545 550 555 560 Gly Glu Asn Leu Tnr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gin 580 585 590 Pro Leu Phe Gly A_a Gly Ser He Ser Ser Gly Glu Leu Tyr He Asp 595 600 605 Lys He Glu lie He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp 610 615 620 Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 640 Gln He Glv Leu Lys Thr Asp Val Thr Asp Tyr His He Asp Gln Val 645 650 655 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 Arg Glu Leu Ser Glu Lys Val Lys Kis Ala Lys Arg Leu Ser Asp Glu 675 680 685 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 Asp Arg Gly Trp Arg Glv Ser Thr Asp He Thr He Gln Gly Gly Asp 705 710 715 720 Asp Val Phe Lys Giu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu 725 730 735 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys 740 745 750 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Gln Asp 755 760 765 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Ly? His Glu He Val Asn 770 775 780 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He '785 790 795 800 Gly Lys Cys Giy Glu Pro Asn Arg Cys Ala Pro Kis Leu Glu Trp Asn 805 810 815 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His 820 825 830 Ser His His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 860 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 Gly Giu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 Ly? Arg Glu Lys Leu Gln Leu Giu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu 915 920 925 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 950 955 960 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly A?p Phe Asn 980 985 990 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly Kis Val Asp Val Glu Glu 995 1000 1005 Gln Asn Asn His Arg Ser Val Leu Val He Pro Glu Trp Glu Ala Glu 1010 1015 1020 Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 Glu Giu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 Thr Gln Glu Glu Tyr Glu Gly Thr Tyr rhr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys 1125 H30 1135 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala G. y Tyr 1140 1145 1150 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He 1155 1160 1165 Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 Leu Leu Met Glu Glu 1185 '10 (2) INFORMACIÓN PARA SEQ ID NO: 5: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 3567 pares de bases 15 (B) TIPO: ácido nucleico (C) NÚMERO DE FILAMENTOS: uno solo (D) TOPOLOGÍA: lineal (ix) ASPECTO: (A) NOMBRE/CLAVE: CDS 20 (B) UBICACIÓN: 1...3567 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 5: 27.4.
ATG GAG GAA AAT AAT CAA AAT CAA TGC ATA CCT TAC AAT TGT TTA AGT 48 Met Glu Glu Asn Asn Gln Asn Gln Cys He Pro Tyr Asn Cys Leu Ser 1 5 10 15 AAT CCT GAA GAA GTA CTT TTG GAT GGA GAA CGG ATA TCA ACT GGT AAT 96 Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg He Ser Thr Gly Asn 20 25 30 TCA TCA ATT GAT ATT TCT CTG TCA CTT GTT CAG TTT CTG GTA TCT AAC 144 Ser Ser He Asp He Ser Leu Ser Leu Val Gin Phe Leu Val Ser Asn 35 40 45 TTT GTA CCA GGG GGA GGA TTT TTA GTT GGA TTA ATA GAT TTT GTA TGG 192 Phe Val Pro Gly Giy Gly Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 GGA ATA GTT GGC CCT TCT CAA TGG GAT GCA TTT CTA GTA CAA ATT GAA 240 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln lie Glu 65 70 75 80 CAA TTA ATT AAT GAA AGA ATA GCT GAA TTT GCT AGG AAT GCT GCT ATT 288 Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 '10 GCT AAT TTA GAA GGA TTA GGA AAC AAT TTC AAT ATA TAT GTG GAA GCA 336 Ala Asn Leu Glu Giy Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala 100 105 110 TTT AAA GAA TGG GAA GAA GAT CCT AAT AAT CCA GCA ACC AGG ACC AGA 384 Phe Lys Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr A.rg Thr Arg 115 120 125 GTA ATT GAT CGC TTT CGT ATA CTT GAT GGG CTA CTT GAA AGG ATT 432 Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 15 CCT TCG TTT CGA ATT TCT GGA TTT GAA GTA CCC CTT TTA TCC 480 Pro Ser Phe Arg He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 GCT CAA GCG GCC AAT CTG CAT CTA GCT ATA TTA AGA GAT TCT GTA ATT 528 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 ' 170 175 TTT GGA GAA GCA TGG GGG TTG ACÁ ACG ATA AAT i AC TAT 576 Phe Gly Glu Ala Trp Gly Leu Thr Thr He Asn Val Asn Glu Asn Tvr 180 185 190 20 AAT AGA CTA ATT AGG CAT ATT GAT GAA TAT GCT GAT CAC TGT GCA AAT 624 Asn Arg Leu He Arg His He Asp Glu Tyr Ala Asp His Cys Ala Asn 195 200 205 ACG TAT AAT CGG GGA TTA AAT AAT TTA CCG AAA ACG TAT CAA GAT 672 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp 210 215 220 TGG ATA ACÁ TAT AAT CGA TTA CGG AGA GAC TTA ACÁ TTG ACT GTA TTA 720 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 GAT ATC GCC GCT TC TTT CCA AAC TAT GAC AAT AGG AGA TAT CCA ATT 768 Asp He Ala Ala Phe Pne Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He 245 250 255 CAG CCA GTT GG i CAA CTA ACÁ AGG GAA GTT TAT ACG GAC CCA TTA ATT 816 Gln Pro Val Gly Glr. Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 AAT TTT AAT CCA TTA CAG TCT GTA GC . TTA CCT ACT X —T AAC 864 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 GTT ATG GAG AGC AGC GCA ATT AGA AAT CCT CAT TTA TTT GAT ATA TTG 912 Val Met Glu Ser Ser Ala He Arg Asn Pro His Leu Phe Asp He Leu 290 295 300 AAT AAT CTT ACÁ ATC TT ACG GAT TGG TTT AGT GTT GGA CGC AAT TTT 960 Asn Asn Leu Thr He Phe Thr As Trp Phe Ser Val Gly Arg Asn Phe 305 310 315 320 TAT TGG GGA GGA CAT CGA GTA ATA TCT AGC CTT ATA GGA GGT GGT AAC 1008 Tyr Trp Gly Gly His Arg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 ATA ACÁ TCT CCT ATA TAT GGA AGA GAG GCG GAG CCT CCA AGA 1056 He Thr Ser Pro He Tyr Gly Arg Giu Ala Asn Gln Giu Pro Pro Arg 340 345 350 TCC TTT ACT TT AAT GGA CCG GTA TTT AGG ACT TTA TCA AAT CCT ACT 1104 Ser Phe Thr Fhe Asn Gly Pro Val e e Arg Tr.r Leu Ser Asn Pro Thr 355 360 365 TTA CGA TTA TTA CAG CAA CCT TGG CCA GCG CCA CCA TTT AAT TTA CGT 1152 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Pne Asn Leu Arg 370 375 380 GGT GTT GAA GGA GTA GAA TTT TCT ACÁ CCT AAT AGC TTT ACG TAT 1200 Gly Val Glu Giy Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 CGA GGA AGA ACG GTT GAT TCT TTA ACT GAA TTA CCG CCT GAG GAT 1248 Arg Gly Arg Gly Thr Val ASp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 AAT AGT GTG CCA CCT CGC GAA GGA TAT AGT CAT CGT TTA TGT CAT GCA 1296 Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser K s Arg Leu Cys His Ala 420 425 430 ACT TTT GTT CAA AGA TCT GGA ACÁ CCT TTT TTA ACÁ ACT GGT GTA GTA 1344 Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 TTT TCT TGG ACG CAT CGT AGT GCA ACT CTT ACÁ AAT ACÁ ATT GAT CCA 1392 Phe Ser Trp Thr H s Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 GAG AGA ATT AAT CAA ATA CCT TTA GTG AAA GGA TTT AGA GTT TGG GGG 1440 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 GGC ACC TCT GTC ATT ACÁ GGA CCA GGA TTT ACÁ GGA GGG GAT ATC CTT 1488 Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu 485 490 495 CGA AGA AAT ACC TTT GGT GAT TTT GTA TCT CTA CAA GTC AAT ATT AAT 1536 Arg Arg Asn Thr Phe Giy Asp Phe Val Ser Lea Gin Val Asn He Asn 500 505 510 TCA CCA ATT ACC CAA AGA TAC CGT TTA AGA TTT CGT TAC GCT TCC AGT 1584 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser 515 520 525 AGG GAT GCA CGA GTT ATA GTA TTA ACÁ GGA GCG GCA TCC ACÁ GGA GTG 1632 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val 530 535 540 GGA GGC CAA GTT AGT GTA AAT ATG CCT CTT CAG AAA ACT ATG GAA ATA 1680 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu He 545 550 555 560 GGG GAG AAC TTA ACÁ TCT AGA ACÁ TTT AGA TAT ACC GAT TTT AGT AAT 1728 Gly Gla Asn Leu Thr Ser Arg Thr Phe Arg T ,-r Thr Asp Pie Ser Asn 565 570 575 CCT TTT TCA TTT AGA GCT AAT CCA GAT AT; Al GGG ATA AGT GAA CAA 1776 Pro Phe Ser Phe Arg Ala Asn Pro Asp :ií i: .= Giy He Ser Glu Gln 580 585 590 CCT CTA TTT GGT GCA GGT TCT ATT AGT AGC GGT GAA CTT TAT ATA GAT 1824 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Glu Leu Tyr He Asp 595 600 605 AAA ATT GAA ATT ATT CTA GCA GAT GCA ACÁ TTT GAA GCA GAA TCT GAT 1872 Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp 610 615 620 TTA GAA AGA GCA CAA AAG GCG GTG AAT GCC CTG TTT ACT TCT TCC AAT 1920 Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Pne Thr Ser Ser Asn 625 630 635 640 ATC GGG TTA AAA ACC GAT GTG ACG GAT TAT CAT ATT GAT CAA GTA 1968 He Gly Leu Lys Thr Asp Val Thr Asp Tyr H s He Asp Gln Val 645 650 655 AAT TTA GTG GAT TGT TTA TCA GAT GAA TTT TGT CTG GAT GAA AAG 2016 Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 CGA GAA TTG TCC GAG AAA GTC AAA CAT GCG AAG CGA CTC AGT GAT GAG 2064 Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu 675 680 685 AAT TTA CTT CAA GAT CCA AAC TTC AGA GGG ATC AAT AGA CAA CCA 2112 Asn Leu Leu Gln Aso Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 CGT GGC TGG AGA GGA AGT ACÁ GAT ATT ACC ATC CAA GGA GGA GAT 2160 Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Giy Asp 710 715 720 GTA TTC AAA GAG AAT TAC GTC ACÁ CTA CCG GGT ACC GTT GAT GAG 2208 --3C Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Giy Thr Val Asp Glu 725 730 735 TAT CCA ACG TAT TTA TAT CAG AAA ATA GAT GAG AAA TTA AAA 2256 Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Gla S; Lys Leu Lys 740 745 750 TAT ACC CGT TAT GAA TTA AGA GGG TAT ATC GAA GAT AGT CAA GAC 2304 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu A.sp Ser Gln Aso 755 760 765 GAA ATC TAT TTG ATC CGT TAC AAT GCA AAA CAC GAA ATA GTA AAT 2352 Glu He Tvr Leu He Arg Tyr Asn Ala Lys His Glu He Val Asn 770 775 780 CCA GGC ACG GGT TCC TTA TGG CCG CTT TCA GCC CAA CCA ATC 2400 . ax Pro Glv Thr Gly Ser Leu Tro Pro Leu Ser Ala Gln Ser Pro He -a; 790 795 800 AAG TGT GGA GAA CCG AAT CGA TGC GCG CCA CAC CTT GAA TGG AAT 2448 Lys Cys Giy Glu Pro Asn Arg Cys Ala Pro Kis Leu Giu Trp Asn 805 810 815 GAT CTA GAT TGT TCC TGC AGA GAC GGG GAA AAA TGT GCA CAT CAT 2496 Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lvs Cvs Ala His His 820 825 830 CAT CAT TTC ACC TTG GAT ATT GAT GTT GGA TGT ACÁ GAC TTA AAT 2544 Hl? His Phe Thr Leu Asp He Asp Val Gly Cys Tr.r Asp Lea Asn 835 840 845 GAC TTA GGT GTA TGG GTG ATA TTC AAG CAA GAT GGC 2592 Asp Leu Glv Val Tro Val He Phe Lys He Lys Thr Gln Asp Giy 850 855 860 CAT GCA AGA CTA GGG AAT CTA GAG TTT CTC GAA GAG AAA CCA TTA TTA 2640 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 GGG GAA GCA CTA GCT CGT GTG AAA AGA GCG GAG AAG AAG TGG AGA GAC 2688 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 AAA CGA GAG AAA CTG CAG TTG GAA AC AAT ATT GTT TAT AAA GAG GCA 2736 Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 AAA GAA TCT GTA GAT GCT TTA TTT GTA AAC TCT CAA TAT GAT AGA TTA 2784 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu 915 920 925 CAA GTG GAT ACG AAC ATC GCA ATG ATT CAT GCG GCA GAT AAA CGC GTT 2832 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 CAT AGA ATC CGG GAA GCG TAT CTG CCA GAG TTG TCT GTG ATT CCA GGT 2880 His Arg He Arg Giu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 950 955 960 GTC AAT GCG GCC ATT TTC GAA GAA TTA GAG GGA CGT ATT TTT ACÁ GCG 2928 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 TAT TCC TTA TAT GAT GCG AGA AAT GTC ATT AAA AAT GGC GAT TTC AAT 2976 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Giy Asp Phe Asn 980 985 990 AAT GGC TTA TTA TGC TGG AAC GTG AAA GGT CAT GTA GAT GTA GAA GAG 3024 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu 995 1000 1005 CAA AAC AAC CAC CGT TCG GTC CTT GTT ATC CCA GAA TGG GAG GCA GAA 3072 Gln Asn Asn His Arg Ser Val Leu Val He Pro Glu Trp Gla Ala Glu 1010 1015 1020 GTG TCA CAA GAG GTT CGT GTC TGT CCA GGT CGT GGC TAT A.TC CTT CGT 3120 Val Ser Gin Glu Val Arg Val Cys Pro Giy Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 GTC ACÁ GCA TAT AAA GAG GGA TAT GGA GAG GGC TGC GTA ACG ATC CAT 3168 Val Thr Ala Tyr Lys Giu Gly Tyr Gly Glu Gly Cys Val Tnr He His 1045 1050 1055 GAG ATC GAA GAC AAT ACÁ GAC GAA CTG AAA TTC AGC AAC TGT GTA GAA 3216 Glu He Giu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn C/s Val Glu 1060 1065 1070 GAG GAA GTA TAT CCA AAC AAC ACÁ GTA ACG TGT AAT AAT TAT ACT GGG 3264 Glu Giu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 ACT CAA GAA GAA TAT GAG GGT ACG TAC ACT TCT CGT AAT CAA GGA TAT 3312 Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 GAC GAA GCC TAT GGT AAT AAC CCT TCC GTA CCA GCT GAT TAC GCT TCA 3360 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 GTC TAT GAA GAA AAA TCG TAT ACÁ GAT GGA CGA AGA GAG AAT CCT TGT 3408 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys 1125 1130 1135 GAA TCT AAC AGA GGC TAT GGG GAT TAC ACÁ CCA CTA CCG GCT GGT TAT 3456 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 GTA ACÁ AAG GAT TTA GAG TAC TTC CCA GAG ACC GAT AAG GTA TGG ATT 3504 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He 1155 1160 1165 GAG ATC GGA GAA ACÁ GAA GGA ACÁ TTC ATC GTG GAT AGC GTG GAA TTA 3552 Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 CTC CTT ATG GAG GAA 3567 Leu Leu Met Glu Glu 1185 (2) INFORMACIÓN PARA SEQ ID NO: 6: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1189 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ü) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 6: Met Glu Glu Asn Asr. Gln Asn Gin Cys He Pro Tyr Asn Cys Leu Ser 1 5 10 15 Asn Pro Glu Glu Val Leu Leu Asp Gly Giu Arg He Ser Thr Gly Asn 20 25 30 Ser Ser He Asp lie Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn 35 40 45 Phe Val Pro Gly Giy Gly Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 Gly He Val Giy Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu 65 70 75 80 Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 Ala Asn Leu Giu Gly Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala 100 105 110 Phe Lys Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Thr Arg 115 120 125 Val He As Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 Pro Ser Phe Arg He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 Phe Gly Glu Ala Trp Gly Leu Thr Thr He Asn Val Asn Glu Asn Tyr 180 185 190 28 : Asn Arg Leu He Arg H s He Asp Glu Tyr Ala A.sp His Cys Ala Asn 195 200 205 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp 210 215 220 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He 245 250 255 Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 Val Met Glu Ser Ser Ala He Arg Asn Pro K s Leu Phe Asp He Leu 290 295 300 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe 305 310 315 320 Tyr Trp Gly Gly His Arg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gin Giu Pro Pro Arg 340 345 350 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser H s Arg Leu Cys His Ala 420 425 430 Thr Pne Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 3ly Thr Ser Val He Thr Gly Pro Gly Phe Thr Giy Gly Asp He Leu 485 490 495 Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn He Asn 500 505 510 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe .Arg Tyr Ala Ser Ser 515 520 525 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val 530 535 540 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu He 545 550 555 560 Giy Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Glu Leu Tyr He Asp 595 600 605 Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp 610 615 520 Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 525 630 635 640 Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr Kis He Asp Gln Val 645 650 655 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys A.rg Leu Ser Asp Glu 675 680 685 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Gly Asp 705 710 715 720 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu 725 730 735 •Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Giu Ser Lys Leu Lys 740 745 750 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Gln Asp 755 760 765 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys His Glu He Val Asn 770 775 780 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He 785 790 795 800 Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His Leu Glu Trp Asn 805 810 815 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His 820 825 830 Ser Hís His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 860 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu 915 920 925 Gln Val Asp Thr Asn 1 Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 9950 955 960 Val Asn Ala Ala He ?ne Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn 980 985 990 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Giu Glu 995 1000 1005 Gln Asn Asn His Arg Ser Val Leu Val He Pro Glu Trp Glu Ala Glu 1010 1015 1020 Val Ser Gln Giu Val Arg Val Cys Pro Gly Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 Val Thr Ala Tyr Lys Giu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 Thr Gin Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser H05 1110 1115 n20 Val Tyr Glu Giu Lys Ser Tyr Thr Asp Gly A.rg Arg Glu Asn Pro Cys 1125 1130 1135 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 H45 1150 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He 1155 1160 1165 Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 Leu Leu Met Giu Glu 1185 (2) INFORMACIÓN PARA SEQ ID NO: 7: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 3567 pares de bases (B) TIPO: ácido nucleico (C) NO. DE FILAMENTOS: uno solo (D) TOPOLOGÍA: lineal (ix) ASPECTO (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1...3567 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 7: ATG GAG GAA AAT AAT CAA AAT CAA TGC ATA CCT TAC AAT TGT TTA AGT 48 Met Glu Glu Asn Asn Gln Asn Gln Cys He Pro Tyr Asn Cyz Leu Ser 1 5 10 15 AAT CCT GAA GAA GTA CTT TTG GAT GGA GAA CGG ATA TCA ACT GGT AAT 96 Asn Pro Giu Giu Val Leu Leu Asp Giy Glu Arg He Ser Thr Giy Asn 20 25 30 TCA TCA ATT GAT ATT TCT CTG TCA CTT GTT CAG TT CTG GTA TCT AAC 144 Ser Ser He Asp He Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn 35 40 45 TT GTA CCA GGG GGA GGA TTT TTA GTT GGA TTA ATA GAT TTT GTA TGG 192 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 GGA ATA GTT GGC CCT TCT CAA TGG GAT GCA TTT CTA GTA CAA ATT GAA 240 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gin He Glu 65 70 75 80 CAA TTA ATT AAT GAA AGA ATA GCT GAA TTT GCT AGG AAT GCT GCT ATT 288 Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 GCT AAT TTA GAA GGA TTA GGA AAC AAT TTC AAT ATA TAT GTG GAA GCA 336 Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala 100 105 110 TTT AAA GAA TGG GAA GAT GAT CCT CAT AAT CCC AGG ACC AGA 384 Phe Lys Glu Trp Glu A.sp Asp Pro His Asn Pro Thr Arg Thr Arg 115 120 125 '10 GTA ATT GAT CGC CGT ATA CTT GAT GGG CTA r"r»t> GAA AGG GAC ATT 432 Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 CCT TCG TTT CGA ATT TCT GGA TTT GAA GTA CCC CTT TTA TCC GTT TAT 480 Pro Ser Phe Arg He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 GCT CAA GCG GCC AAT CTG CAT CTA GCT ATA TTA GAT TCT GTA ATT 528 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 15 TTT GGA GAA A.GA TGG GGA ACÁ ACG ATA AAT GTC GAA AAC TAT 576 Phe Gly Giu Arg Trp Gly Leu Thr Thr He Asn Val Asn Giu Asn Tyr 180 185 190 AAT AGA CTA ATT AGG " ATT GAT GAA TAT GCT GAT CAC GCA AAT 624 Asn Arg Leu He Arg Hl? He Asp Glu Tyr Ala Asp His Cys Ala Asn 195 200 205 ACG TAT AAT CGG GGA TTA AAT AAT TTA CCG AAA CT ACG TAT CAA GAT 672 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp 210 215 220 20 TGG ATA ACÁ TAT AAT CGA TTA CGG AGA GAC TTA ACÁ TTG ACT GTA TTA 720 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 GAT ATC GCC TTC TTT CCA AAC TAT GAC AAT ?GA TAT CCA ATT 768 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asr. Arg Arg Tyr Pro He 245 250 255 CAG CCA GTT GGT CAA CTA ACÁ AGG GAA GTT TAT v-G GAC CCA TTA ATT 816 Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 AAT TT AAT CCA CAG TTA CAG CT GTA GCT CAA TTA CCT TT AAC 864 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 GTT rtTG GAG AGC AGC GCA ATT AGA AAT CCT CAT X 1? TTT GAT ATA TTG 912 Val Met Glu Ser Ser Ala He Arg Asn Pro His Leu Phe Asp He Leu 290 295 300 AAT AAT CTT ACÁ ATC TTT ACG GAT TGG TTT AGT GTT GGA CGC AAT TTT 960 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe 305 310 315 320 TAT TGG GGA GGA CAT GTA ATA AGC CTT ATA GGA GGT GGT AAC 1008 Tyr Trp Gly Gly His Arg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 ATA ACÁ TCT CCT ATA TAT GGA AGA GAG GCG G-M AGA L056 He Thr Ser Pro He Tyr Gly Arg Giu Ala Asn Gln Glu .-TD Pro Arg 340 345 350 TCC TTT ACT TTT AAT GGA CCG GTA TTT AGG ACT Tlrt TCA AAT CCT ACT 1104 Ser Phe Thr Phe Asn Giy Pro val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 TTA CGA TTA TTA CAG CAA CCT TGG CCA GCG CCA CCA ^ AAT TTA CGT 1152 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 GGT GTT GAA GGA GTA GAA TTT TCT ACÁ CCT ACÁ AAT AGC TTT ACG TAT 1200 Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 CGA GGA AGA GGT ACG GTT GAT TCT TTA ACT G/%r-. GAG GAT 1248 Arg Gly Arg Gly Thr Val Asp Ser Lea Thr Glu Leu Pro Pro Glu Asp 405 410 415 AAT AGT GTG CCA CCT CGC GAA GGA TAT AGT CAT GCA 1296 Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys HlS Ala 420 425 430 ACT TTT GTT CAA AGA TCT GGA ACÁ CCT TTT TTA ACÁ ACT GG *, GTA GTA 1344 Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Lea Thr Thr Giy Val Val 435 440 445 TT TGG ACG CAT CGT AGT GCA ACT CTT AC AAT AC GAT CCA 1392 Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 GAG AGA ATT AAT CAA ATA CCT TTA GTG AAA GGA TTT AGA GTT TGG GGG 1440 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 GGC ACC TCT GTC ATT ACÁ GGA CCA GGA TTT ACÁ GGA GGG GAT ATC CTT 1488 Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu 485 490 495 CGA AGA AAT ACC f"J" GGT GAT TTT GTA TCT CTA CAA GTC AAT ATT AAT 1536 Arg Arg Asn Thr Phe Giy Asp Phe Val Ser Leu Gin Val Asn He Asn 500 505 510 TCA CCA ATT ACC CAA AGA TAC CGT TTA AGA TTT CGT TAC GCT TCC AGT 1584 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser 515 520 525 AGG GAT GCA CGA GTT ATA GTA TTA ACÁ GGA GCG GCA TCC ACÁ GGA GTG 1632 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val 530 535 540 GGA GGC CAA GTT AGT GTA AAT ATG CCT CTT CAG AAA ACT ATG GAA ATA 1680 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu He 545 550 555 560 GGG GAG AAC TTA ACÁ TCT AGA ACÁ TTT AGA TAT ACC GAT TTT AGT AAT 1728 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg T ÍG Thr Asp Phe Ser Asn 565 570 575 CCT TTT TCA TTT AGA GCT AAT CCA GAT ATA ATT GGG ATA AGT GAA CAA 1776 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 CCT CTA TTT GGT GCA GGT TCT ATT AGT AGC GGT GAA CTT TAT ATA GAT 1824 Pro Leu Phe Gly Ala Giy Ser He Ser Ser Gly Glu Leu Tyr He Asp 595 600 605 AAA ATT GAA ATT ATT CTA GCA GAT GCA ACÁ TTT GAA GCA GAA TCT GAT 1872 Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp 610 615 620 TTA GAA AGA GCA CAA AAG GCG GTG AAT GCC V TT" ACT mr,m TCC AAT 1920 Leu Glu Arg Ala Gin Ly? Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 640 CAA ATC GGG TTA AAA ACC GAT GTG ACG GAT TAT CAT ATT GAT CAA GTA 1968 Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr His He Asp Gln Val 645 650 655 TCC AAT TTA GTG GAT TGT TTA TCA GAT GAA TT TGT CTG GAT GAA AAG 2016 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 CGA GAA TTG TCC GAG AAA GTC AAA CAT GCG AAG CGA CTC AGT GAT GAG 2064 Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu 675 680 685 CGG AAT TTA CTT CAA GAT CCA AAC TC AGA ATC AAT AGA CAA CCA 2112 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 GAC CGT AGA GGA AGT ACÁ GAT ATT ACC ATC CAA GGA GGA GAT 2160 Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Gly Asp 705 710 715 720 GAC GTA TTC AAA GAG AAT TAC GTC ACÁ CTA CCG GGT ACC GTT GAT GAG 2208 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu 725 730 735 TGC TAT CCA ACG TAT TTA TAT CAG AAA ATA GAT GAG TCG AAA TTA AAA 2256 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys 740 745 750 GCT TAT ACC CGT TAT GAA TTA AGA TAT ATC GAA GAT AGT CAA GAC 2304 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Gln Asp 755 760 765 TTA GAA ATC TAT ATC CGT TAC AAT GCA AAA CAC GAA ATA GTA AAT 2352 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys His Glu He Val Asn 770 775 780 GTG CCA GGC ACG TCC TTA TGG CCG CTT TCA GCC CAA AGT CCA ATC 2400 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He 785 790 795 800 GGA AAG TGT GGA GAA CCG AAT CGA TGC GCG CCA CAC GAA TGG AAT 2448 Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His Leu Glu Trp Asn 805 810 815 CCT GAT CTA GAT TGT TCC TGC AGA GAC GGG GAA AAA TGT GCA CAT CAT 2496 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly GlU Lys Cys Ala His HlS 820 825 830 TCC CAT CAT TTC ACC TTG GAT ATT GAT GTT GGA TGT ACÁ GAC TTA AAT 2544 Ser His His Phe Thr Leu Asp He Asp Val Gly cys Thr Asp Leu Asn 835 840 845 GAG TTA GGT GTA TGG ATA TTC AAG ATT AAG ACG CAA GAT GGC 259: Glu ASp Leu Gly Val Trp Val He Phe Lys He Lys Tnr Gln Asp Gly 850 855 860 CAT GCA AGA CTA GGG AAT CTA GAG TTT CTC GAA GAG A-AA CCA TTA TTA 2640 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 GGG GAA GCA CTA GCT CGT GTG AAA AGA GCG GAG A G AAG TGG AGA GAC 2688 Gly Glu Ala Leu A a Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 AAA CGA GAG AAA CTG CAG TTG GAA ACÁ AAT ATT GTT TAT AAA GJ?G GCA 2736 Lys Arg Giu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 AAA GAA TCT GTA GAT GCT TTA TTT GTA AAC TCT CAA TAT GAT AGA TTA 2784 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Asp Arg Leu 915 920 925 CAA GTG GAT ACG AAC ATC GCA ATG ATT CAT GCG GCA GAT AAA CGC GTT 2832 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 CAT AGA ATC CGG GAA GCG TAT CTG CCA GAG TTG TCT GTG ATT CCA GGT 2880 His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 950 £" 960 GTC AAT GCG GCC ATT TTC GAA GAA TTA GAG GGA CGT ATT TTT ACÁ GCG 2928 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 TAT TCC TTA TAT GAT GCG AGA AAT GTC ATT AAA AAT GGC GAT TTC AAT 2976 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn 980 985 990 AAT GGC TTA TTA TGC TGG AAC GTG AAA GGT CAT GTA GAT GTA GAA GAG 3024 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu 995 1000 1005 CAA AAC AAC CAC CGT TCG GTC CTT GTT ATC CCA GAA TGG GAG GCA GAA 3072 Gln Asn Asn H = Arg Ser Val Leu Val He Pro Giu Trp Glu Ala Glu 1010 1015 1020 GTG TCA CAA GAG GTT CGT GTC TGT CCA GGT CGT GGC TAT ATC CTT CGT 3120 Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 GTC ACÁ GCA TAT AAA GAG GGA TAT GGA GAG GGC TGC GTA ACG ATC CAT 3168 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 GAG ATC GAA GAC AAT ACÁ GAC GAA CTG AAA TTC AGC AAC TGT GTA GAA 3216 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 GAG GAA GTA TA.T CCA AAC AAC ACÁ GTA ACG TGT AAT AAT TAT ACT GGG 3264 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 ACT CAA GAA GAA TAT GAG GGT ACG TAC ACT TCT CGT AAT CAA GGA TAT 3312 Thr Gln Giu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 GAC GAA GCC TAT GGT AAT AAC CCT TCC GTA CCA GCT GAT TAC GCT TCA 3360 Asp Glu Aia Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 GTC TAT GAA GAA AAA TCG TAT ACÁ GAT GGA CGA AGA GAG AAT CCT TGT 3408 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg Giu Asn Pro Cys 1125 1130 1135 GAA TCT AAC AGA GGC TAT GGG GAT TAC ACÁ CCA CTA CCG GCT GGT TAT 3456 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 GTA ACÁ AAG GAT TTA GAG TAC TTC CCA GAG ACC GAT AAG GTA TGG ATT 3504 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He H55 1160 * 1165 GAG ATC GGA GAA ACÁ GAA GGA ACÁ TTC ATC GTG GAT AGC GTG GAA TTA 3552 Glu He Gly Glu Thr Glu Gly Thr Phe He Val ASD Ser Val Giu Leu 1170 H75 uso CTC CTT ATG GAG GAA 3567 Leu Leu Met Glu Glu 1185 (2) INFORMACIÓN PARA SEQ ID NO: 8: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1189 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteína (iii) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 8: Met Glu Glu Asn Asn Gln Asn Gln Cys He Pro Tyr Asn Cys Leu Ser 1 5 10 15 Asn Pro Glu Glu Val Leu Leu Asp Gly Giu Arg He Ser Thr Gly Asn 20 25 30 Ser Ser He Asp He Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn 35 40 45 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu 65 70 75 80 Gln Leu lie Asn Glu Arg He Ala Giu Phe Ala Arg Asn Ala Ala He 85 90 95 Ala Asn Leu Glu Giy Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala 100 105 lio Phe Lys Glu Trp Gla Asp Asp Pro His Asn Pro Thr Thr Arg Thr Arg 115 120 125 Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 Pro Ser Phe Arg He Ser Giy Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 Phe Gly Glu Arg Trp Giy Leu Thr Thr He Asr. Val Asn Glu Asn Tyr 180 185 190 Asn Arg Leu He Arg His He Asp Glu Tyr Ala Asp His Cys Ala Asn 195 200 205 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp 210 215 220 Trp lie Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He 245 250 255 Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 Val Met Giu Ser Ser Ala He Arg Asn Pro Kis Leu Phe Asp He Leu 290 295 300 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gxy Arg Asn Phe 305 310 315 320 Tyr Trp Gly Gly His Arg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg 340 345 350 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 Gly Val Glu Gly Val Giu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala 420 425 430 Thr Phe Val Gin Arg Ser Gly Thr Pro Pne Leu Thr Thr Gly Val Val 435 440 445 Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 Glu'Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 Gly Thr Ser Val He Thr Giy Pro Giy Phe Thr Gly Gly Asp He Leu 485 490 495 Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn He Asn 500 505 510 Ser Pro He Thr Glr. Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser 515 520 525 Arg As,.. Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val 530 535 540 Gly Gly Gln Val Ser Val Asn Mee Pro Leu Gln Lys Thr Met Glu He 545 550 555 560 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Giy He Ser Glu Gln 580 585 590 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Glu Leu Tyr He Asp 595 600 605 Lys He Glu lie He Leu Ala Asp Ala Thr Phe Giu Ala Glu Ser Asp 610 615 620 Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 640 Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr His He Asp Gln Val 645 650 655 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 Arg Glu Leu Ser Giu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu 675 680 685 Arg Asn Leu Leu Glr. Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Giy Gly Asp 705 710 715 720 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Prc Gly Thr Val Asp Glu 725 730 735 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys 740 745 750 Ala Tyr Thr Arg Tyr Glu Leu Arg Giy Tyr He Giu Asp Ser Gln Asp 755 760 765 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys Kis Glu He Val Asn 770 775 780 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser A.ia Gln Ser Pro He 785 790 795 800 Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His Leu Glu Trp Asn 805 810 815 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His 820 825 830 Ser His His Phe Thr Leu Asp He Asp Val Giy Cys Thr Asp Leu Asn 835 04.0 845 Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 860 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Giu Lys Lys Trp Arg Asp 885 890 895 Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu 915 920 925 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 950 955 960 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn 980 985 990 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly Kis Val Asp Val Giu Glu 995 1000 1005 Gln Asn Asn His Arg Ser Val Leu Val IIe Pro Glu Trp Glu 1010 Ala Glu 1015 1020 Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr He Leu Arg 1025 1030 1035 104 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr II 1045 e His 1050 1055 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe 1060 Ser Asn Cys Val Glu 1065 1070 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 Thr Gln Glu Glu Tyr Glu Giy Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg Giu Asn Pro Cys 112 = L130 1135 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He 1155 1160 1165 Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 Leu Leu Met Glu Glu 1185 (2) INFORMACIÓN PARA SEQ ID NO: 9 (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 3567 pares de bases (B) TIPO: ácido nucleico (C) No. DE FILAMENTOS: uno solo (D) TOPOLOGÍA: lineal (ix) ASPECTO: (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1...3567 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 9: ATG GAG GAA AAT AAT CAA AAT CAA TGC ATA CCT AAT TGT TTA AGT 48 Met Glu Glu Asn Asn Gln Asn Gln Cys He Pro Tyr Asn Cys Leu Ser 1 5 10 15 AAT CCT GAA GAA GTA CTT TTG GAT GGA GAA CGG ? TCA GGT AAT 96 Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Z.2.e Ser Thr Gly Asn 20 25 30 TCA TCA ATT GAT ATT TCT CTG TCA CTT GTT TT CTG GTA TCT AAC 144 Ser Ser He Asp He Ser Leu Ser Leu Val Gln Pne Leu Val Ser Asn 35 40 45 Til GTA CCA GGG GGA TT TTA GTT GGA TTA ATA GAT TTT GTA TGG 192 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Le^ Asp Phe Val Trp 50 55 60 GGA ATA GTT GGC CCT TCT CAA GAT GCA TT CTA GTA CAA ATT GAA 240 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Lea Val Gln He Glu 65 70 75 80 CAA TTA ATT AAT GAA AGA ATA GCT GAA TTT GCT rtUU AAT GCT GCT ATT 288 Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 GCT AAT TTA GAA GGA TTA GGA AAC AAT AAT ATA TAT GTG GAA GCA 336 Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala 100 105 110 TTT AAA GAA TGG GAA GTA GAT CCT AAT AAT CCT GGA ACC AGG ACC AGA 384 Phe Lys Glu Trp Glu Val Asp Pro Asn Asn Pro Gly Thr Arg Thr Arg 115 120 125 GTA ATT GAT CGC TTT CGT ATA CTT GAT GGG CTA GAA AGG GAC ATT 432 Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 CCT TCG TTT CGA ATT TCT GGA TTT GAA GTA CCC CTT TTA TCC GTT TAT 480 Pro Ser Phe Arg He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 GCT CAA GCG GCC AAT CTG CAT CTA GCT ATA TTA AGA GAT TCT GTA ATT 528 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 TT GGA GAA AGA GGA TTG ACÁ ACG ATA AAT GTC AAT GAA AAC TAT 576 Phe Gly Gla Arg Trp Gly Leu Thr Thr He Asn Val Asn Glu Asn Tyr 180 185 190 '10 AAT AGA CTA ATT AGG CAT ATT GAT GAA TAT GCT GAT CAC TGT GCA AAT 624 Asn Arg Leu He Arg His He Asp Glu Tyr Ala Asp HlS Cys Ala Asn 195 200 205 ACG TAT AAT CGG GGA TTA AAT AAT TTA CCG AAA TCT ACG TAT CAA GAT 672 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp 210 215 220 TGG ATA ACÁ TAT AAT CGA TTA CGG AGA GAC TTA ACÁ TTG ACT GTA TTA 720 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 15 GAT ATC GCC C CCA AAC TAT GAC AAT AGA TAT CCA ATT 768 Asp He Ala Ala Pne Pne Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He 245 250 255 CAG CCA GTT GGT CAA CTA ACÁ AGG GAA GTT TAT ACG GAC CCA TTA ATT 816 Gln Pro Val Gly Gin Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 AAT TTT AAT CCA CAG TTA CAG TCT GTA GCT CAA TTA . .'?. ACT TTT AAC 864 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Glr. Leu Pro Thr Phe Asn 275 280 285 GTT ATG GAG AGC Au? GCA ATT AGA AAT CCT CAT TTA TTT GAT ATA 20 TTG 912 val Met Glu Ser Ser Ala He Arg Asn Pro Hl? Leu Phe Asp He Leu 290 295 300 AAT AAT CTT ACÁ ATC TT ACG GAT TGG TTT AGT - - GGA CGC AAT tr" 960 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Giy Arg Asn Phe 305 310 315 320 TAT TGG GGA GGA CAT CGA GTA ATA TCT AGC CTT ATA GGA GGT GGT AAC 1008 Tyr Trp Giy Gly KlS Arg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 ATA ACÁ TCT CCT ATA TAT GGA AGA GAG GCG AAC CAG GAG CCT CCA AGA 1056 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg 340 345 350 TCC TTT ACT TTT AAT GGA CCG GTA TTT AGG ACT TTA TCA AAT CCT ACT 1104 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 TTA CGA TTA TTA CAG CAA CCT TGG CCA GCG CCA CCA TTT AAT TTA CGT 1152 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 330 GGT GTT GAA GGA GTA GAA TTT TCT ACÁ CCT ACÁ AAT AGC TT ACG TAT 1200 Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 CGA GGA AGA GGT ACG GTT GAT TCT TTA ACT GAA TTA CCG GAG GAT 1248 Arg Gly Arg Giy Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 AAT AGT GTG CCA CCT CGC GAA GGA TAT AGT CAT CGT TTA TGT CAT GCA 1296 Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala 420 425 430 ACT TTT GTT CAA AGA TCT GGA ACÁ CCT TTT TTA ACÁ ACT GGT GTA GTA 1344 Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 t,r r TCT TGG ACG CAT CGT AGT GCA ACT CTT ACÁ AAT ACÁ ATT GAT CCA 1392 Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 GAG AGA ATT AAT CAA ATA TTA GTG AAA GGA TTT GTT GGG 1440 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 GGC ACC TCT GTC ATT ACÁ GGA CCA GGA TTT AC GGG GAT ATC CTT 1488 Gly Thr Ser Val He rhr Gly Pro Gly Phe Thr Gly Gl Asp He Leu 485 490 495 CGA AGA AAT ACC TT GGT GAT TTT GTA CTA CTC AAT ATT AAT 1536 Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gin Val Asn He Asn 500 505 510 TCA CCA ATT ACC CAA AGA TAC CGT TTA AGA TTT CGT TAC TCC AGT 1584 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser 515 520 525 AGG GAT GCA GTT ATA C-TA TTA ACÁ GGA GCG GCA TCC AC GGA GTG 1632 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val 530 535 540 GGA GGC CAA GTT AGT GTA AAT ATG CCT CTT CAG AAA ACT ATG GAA ATA 1680 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu He 545 550 555 560 GGG GAG AAC TTA ACÁ TCT AGA ACÁ TTT AGA TAT ACC GAT TTT AGT AAT 1728 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 CCT TTT TCA TTT AGA GCT AAT CCA GAT ATA ATT GGG ATA AGT GAA CAA 1776 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 CCT CTA TTT GGT GCA GGT TCT ATT AGT AGC GGT GAA CTT TAT ATA GAT 1824 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Giu Leu Tyr He Asp 595 600 605 AAA ATT GAA ATT ATT CTA GCA GAT GCA ACÁ TTT GAA GCA GAA TCT GAT 1872 Lys He Glu He He Leu Ala Asp Ala Thr Phe GlU Ala Glu Ser Asp 610 615 620 TTA GAA AGA GCA CAA AAG GCG GTG AAT GCC CTG TT ACT TCC AAT 1920 Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 6- 0 CAA ATC GGG TTA AAA ACC GAT GTG ACG GAT TAT CAT ATT GAT CAA GTA 1968 Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr His He Asp Gln Val 645 650 655 TCC AAT TTA GTG GAT TGT TTA TCA GAT GAA TTT TGT CTG GAT GAA AAG 2016 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 CGA GAA TTG TCC GAG AAA GTC AAA CAT GCG AAG CGA CTC AGT GAT GAG 2064 Arg Glu Leu Ser Glu Lys Val Lys HlS Ala Lys Arg Leu Ser Asp Glu 675 680 685 CGG AAT TTA CTT CAA GAT CCA AAC TTC AGA GGG ATC AAT AGA CAA CCA 2112 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gin Pro 690 695 700 GAC CGT GGC TGG AGA GGA AGT ACÁ GAT ATT ACC A C CAA GGA GGA GAT 2160 Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr li Gln Gly Gly Asp 705 710 715 720 GAC GTA TTC AAA GAG AAT TAC GTC ACÁ CTA CCG GGT ACC GTT GAT GAG 2208 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu 725 730 735 TGC T CCA ACG TAT TTA TAT CAG AAA ATA GAT GAG TCG AAA TTA AAA 2256 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He ASD Glu Ser Lys Leu Lys 740 745 750 GCT TAT ACC CGT TAT GAA TTA AGA GGG TAT ATC GAA GAT AGT CAA GAC 2304 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Gln As 755 760 765 TTA GAA ATC TAT TTG cst TAC AAT GCA AAA GAA ATA GTA AAT 2352 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys Kis Glu He Val Asn 770 775 780 GTG CCA GGC ACG GGT CC TTA TGG CCG CTT TCA GCC CAA AGT CCA ATC 2400 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He 785 790 795 800 GGA AAG TGT GGA GAA ccs AAT CGA TGC GCG CCA CAC CTT GAA TGG AAT 2448 Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His Leu Glu Trp Asn 805 810 815 CCT GAT CTA GAT TGT CC TGC AGA GAC GGG GAA AAA TGT GCA CAT CAT 2496 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His 820 825 830 TCC CAT CAT TTC ACC TTG GAT ATT GAT GTT GGA TGT ACÁ GAC TTA AAT 2544 Ser His His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 GAG GAC TTA GGT GTA GTG ATA TTC AAG ATT AAG ACG CAA GAT GGC 2592 Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 860 CAT GCA AGA CTA GGG AAT CTA GAG TTT CTC GAA GAG AAA CCA TTA TTA 2640 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 GGG GAA GCA CTA GCT CGT GTG AAA AGA GCG GAG AAG AAG TGG AGA GAC 2688 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 AAA CGA GAG AAA CTG CAG TTG GAA ACÁ AAT ATT GTT TAT AAA GAG GCA 2736 Lys Arg Glu Lys Leu Gin Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 AAA GAA TCT GTA GAT TTA T"T"p GTA AAC TCT TAT GAT AGA TTA 2784 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gin Tyr Asp Arg Leu 915 920 925 CAA GTG GAT ACG AAC GCA ATG ATT CAT GCG GCA GAT AAA CGC GTT 2832 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 CAT AGA ATC CGG GAA GCG TAT CTG CCA GAG TTG tt,rr GTG ATT CCA GGT 2880 His Arg He Arg Glu Ala Tyr Leu Pro Giu Leu Ser Val He Pro Gly 945 950 955 960 GTC AAT GCG GCC ATT TC GAA GAA TTA GAG GGA CGT ATT TTT ACÁ GCG 2928 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 TAT TCC TTA TAT GAT GCG AGA AAT GTC ATT AAA AAT GGC GAT TTC AAT 2976 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn 980 985 990 AAT GGC TTA TTA TGC TGG AAC GTG AAA GGT CAT GTA GAT GTA GAA GAG 3024 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly Kis Val Asp Val Glu Glu 995 1000 1005 CAA AAC AAC CAC CGT TCG GTC CTT GTT ATC CCA GAA TGG GAG GCA GAA 3072 Gln Asn Asn His Arg Ser Val Leu Val He Pro Glu Trp Glu Ala Glu 1010 1015 1020 GTG TCA CAA GAG GTT CGT GTC TGT CCA GGT CGT GGC TAT ATC CTT CGT 3120 Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 GTC ACÁ GCA TAT AAA GAG GGA TAT GGA GAG GGC TGC GTA ACG ATC CAT 3168 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 GAG ATC GAA GAC AAT ACÁ GAC GAA CTG AAA TTC AGC AAC TGT GTA GAA 3216 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Pne Ser Asn Cys Val Glu 1060 1065 1070 GAG GAA GTA TAT CCA AAC AAC ACÁ GTA ACG TGT AAT AAT TAT ACT GGG 3264 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr C\ s Asn Asn Tyr Thr Gly 1075 1080 1085 ACT CAA GAA GAA TAT GAG GGT ACG TAC ACT TCT CGT AAT CAA GGA TAT 3312 Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 GAC GAA GCC TAT GGT AAT AAC CCT TCC GTA CCA GCT GAT TAC GCT TCA 3360 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 GTC TAT GAA GAA AAA TCG TAT ACÁ GAT GGA CGA AGA GAG AAT CCT TGT 3408 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys 1125 1130 1135 GAA TCT AAC AGA GGC TAT GGG GAT TAC ACÁ CCA CTA CCG GCT GGT TAT 3456 Giu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 GTA ACÁ AAG GAT TTA GAG TAC TTC CCA GAG ACC 3.AT AAG GTA TGG ATT 3504 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp L .-s 1 Trp He 1155 1160 1165 GAG ATC GGA GAA ACÁ GAA GGA ACÁ TTC ATC GTG GAT AGC GTG GAA TTA 3552 Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 CTC CTT ATG GAG GAA 3567 Leu Leu Met Glu Glu 1185 (2).- INFORMACIÓN PARA SEQ ID NO: 10: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1189 aminoácidos (B) TIPO: aminoácido (D).-TOPOLOGÍA: lineal, (ii).- TIPO DE MOLÉCULA: proteína (xi).- DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 10 Met Glu Glu Asn Asn Gln Asn Gln Cys He Pro "yr Asn Cys Leu Ser 1 5 10 15 Asn P.:o ulu Glu Val Leu Leu Asp Gly Glu Arg He Ser Thr Gly Asn 20 25 30 '10 Ser Ser He Asp He Ser Leu Ser Leu Val Gln P.-.e Leu Val Ser Asn 35 40 45 Phe Val Pro Giy Gly Gly Phe Leu Val Gly Leu A?P Phe Val Trp 50 55 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe -=u Val Gln He Glu 65 70 75 80 Glr. Leu He Asn Glu Arg He Ala Glu Phe Ala .Arg Asn Ala Ala He 85 90 95 Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala 100 105 110 Phe Lys Glu Trp Glu Val Asp Pro Asn Asn Pro ly Thr Arg Thr Arg 115 120 125 Val He Asp Arg Phe Arg lie Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 Pro Ser Phe Arg He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu rg Asp Ser Val He 165 170 175 Phe Gly Giu Arg Trp Gly Leu Thr Thr He Asn Asn Glu Asn Tyr 180 185 190 Asn Arg Leu He Arg His He Asp Glu Tyr Ala Asp His Cys Ala Asn 195 . 200 205 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp 210 215 220 Trp He Thr Tyr Asr. Arg Leu Arg Arg Asp Leu T r Leu Thr Val Leu 225 230 235 240 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He 245 250 255 Gin Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Glr. Leu Pro Thr Phe Asn 275 280 285 Val Met Glu Ser Ser Ala He Arg Asn Pro His Leu Phe Asp He Leu 290 295 300 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Giy Arg Asn Phe 305 310 315 320 Tyr Trp Gly Gly Kis Arg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gin Glu Pro Pro Arg 340 345 350 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 Leu Arg Leu Leu Gln Gin Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 Gly Val Giu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His A.rg Leu Cys His Ala 420 425 430 Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Giy Gly Asp He Leu 485 490 495 Arg Arg Asn Thr Phe Giy Asp Phe Val Ser Leu Gln Val Asn He Asn 500 505 510 Ser Pro He Thr Gin Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser 515 520 525 Arg Asp Ala Arg Val He Val Leu Thr Giy Ala Ala Ser Thr Gly Val 530 535 540 Gly Gly _ln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Giu He 545 550 555 560 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Giu Leu Tyr He Asp 595 600 605 Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp 610 615 620 Leu Glu Arg Ala Gin Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 640 Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr His He Asp Gln Val 645 650 655 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu 675 680 685 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Giy Asp 705 710 715 720 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu 725 730 735 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys 740 745 750 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Gln A?p 755 760 765 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys His Glu He Val Asn 770 775 780 Val Pro Giy Thr Gly Ser Leu Trp Pro Leu Ser A.ia Gln Ser Pro He 785 790 795 800 Gly Lys Cys Giy Glu Pro Asn Arg Cys Ala Pro Kis Leu Glu Trp Asn 805 810 815 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His 820 825 830 Ser His Kis Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 860 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn lie Val Tyr Lys Glu Ala 900 905 910 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu 915 920 925 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 His Arg He Arg Glu Ala Tyr Leu Pro Giu Leu Ser Val He Pro Gly 945 950 955 960 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn 980 985 990 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu 995 1000 1005 Gln Asn Asn His Arg Ser Val Leu Val He Pro Glu Trp Glu Ala Glu 1010 1015 1C20 Val Ser Gln Glu Val Arg Val Cys Pro Giy Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 " 1050 1055 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 Thr Gin Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp 'Tyr Ala Ser 1105 1110 1115 * 1120 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg Giu Asn Pro Cys 1125 1130 1135 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro leu Pro Ala Gly Tyr 1140 1145 1150 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He H55 1160 1165 Glu He Giy Giu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 Leu Leu Met Glu Glu 1185 (2).- INFORMACIÓN PARA SEQ ID NO: 11 : (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 3567 pares de bases (B) TIPO: ácido nucleico (C) No. DE FILAMENTOS: uno solo (D).- TOPOLOGÍA: lineal (ix).- ASPECTO: (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1...3567 (xi).- DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 11. ATG GAG GAA AAT AAT CAA AAT CAA TGC ATA CCT TAC AAT TGT TTA AGT 48 Met Glu Giu Asn Asn Gln Asn Gln Cys He Pro Tyr Asn Cys Leu Ser 1 5 10 15 AAT CCT GAA GAA GTA CTT TTG GAT GGA GAA CJ.J ACT GGT AAT 96 Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg He Ser Thr Giy Asn 20 25 30 TCA TCA ATT GAT ATT TCT CTG TCA CTT GTT CAG TTT GTA AAC 144 Ser Ser He Asp He Ser Leu Ser Leu Val Gin Phe Leu Val Ser Asn 35 40 45 TTT GTA CCA GGG GGA GGA TTT TTA GTT GGA TTA ATA GAT TTT GTA TGG 192 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 GGA ATA GTT CCT TCT CAA TGG GAT GCA TTT CTA GTA CAA ATT GAA 240 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu 65 70 75 80 CAA TTA ATT AAT GAA AGA ATA GCT GAA TTT GCT AGG AAT GCT GCT ATT 288 Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 GCT AAT TTA GAA GGA TTA GGA AAC AAT TTC AAT ATA TAT GTG GAA GCA 336 Ala Asn Leu Glu Giy Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala 100 105 110 TTT AAA GAA TGG GAA GAA GAT CCC CAT AAT CCA GCA ACC AGG ACC AGA 384 Phe Lys Glu Trp Glu Glu Asp Pro Kis Asn Prc Ala Thr Arg Thr Arg 115 120 125 GTA ATT GAT CGC TTT CGT ATA CTT GAT GGG CTA CTT GAA AGG GAC ATT 432 Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu. Arg Asp He 130 135 140 CCT TCG TTT CGA ATT TCT GGA TTT GAA GTA CCC CTT GTT TAT 480 Pro Ser Phe Arg lie Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 GCT CAA GCG GCC AAT CTG CAT CTA GCT ATA TTA AGA GAT TCT GTA ATT 528 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 TTT GGA GAA AGA TGG GGA TTG ACÁ ACG ATA AAT GTC AAT GAA AAC TAT 576 Phe Gly Glu Arg Trp Giy Leu Thr Thr He Asn Val Asn Giu Asn Tyr 180 185 190 AAT AGA CTA ATT AGG CAT ATT GAT GAA TAT GCT GAT CAC TGT GCA AAT 624 Asn Arg Leu He Arg His He Asp Glu Tyr Ala Asp His Cys Ala Asn 195 200 205 ACG TAT AAT CGG GGA TTA AAT AAT TTA CCG AAA TCT ACG TAT CAA GAT 672 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp 210 215 220 TGG ATA ACÁ TAT AAT CGA TTA CGG AGA GAC TTA ACÁ TTG ACT GTA TTA 720 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 GAT ATC GCC GCT TTC TTT CCA AAC TAT GAC AAT AGG AGA TAT CCA ATT 768 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He 245 250 255 CAG CCA GTT GGT CAA CTA ACÁ AGG GAA GTT TAT ACG GAC CCA TTA ATT 816 Gln Pro Val Gly Gin Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 AAT ttt A CCA CAG TTA CAG TCT GTA GCT CAA TTA CCT ACT TTT AAC 864 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 GTT ATG GAG AGC AGC GCA ATT AGA AAT CCT CAT TTA TTT GAT ATA TTG 912 Val Met Glu Ser Ser Ala He Arg Asn Pro His Leu Phe Asp He Leu 290 295 300 AAT AAT CTT ACÁ ATC TTT ACG GAT TGG TTT AGT GTT GGA CGC AAT TTT 960 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe 305 ' 310 315 320 TAT TGG GGA GGA CAT CGA GTA ATA TCT AGC CTT ATA GGA GGT GGT AAC 1008 Tyr Trp Gly Gly H s A.rg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 ATA ACÁ TCT CCT ATA TAT GGA AGA GAG GCG AAC CA.G GAG CCT CCA AGA 1056 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg 340 345 350 TCC TTT ACT TTT AAT GGA CCG GTA TTT AGG ACT TTA TCA AAT CCT ACT 1104 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 TTA CGA TTA TTA CAG CAA CCT TGG CCA GCG CCA CCA TTT AAT TTA CGT 1152 Leu Arg Leu Leu Glr. Gin Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 GGT GTT GAA GGA GTA GAA TTT TCT ACÁ CCT ACÁ AAT AGC TTT ACG TAT 1200 Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 CGA GGA AGA GGT ACG GTT GAT TCT TTA ACT GAA TTA CCG CCT GAG GAT 1248 Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 AAT AGT GTG CCA CCT CGC GAA GGA TAT AGT CAT CGT TTA TGT CAT GCA 1296 Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala 420 425 430 ACT TTT GTT CAA AGA TCT GGA ACÁ CCT TTT TTA ACÁ ACT GGT GTA GTA 1344 Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 TTT TCT TGG ACG CAT CGT AGT GCA ACT CTT ACÁ AAT ACÁ ATT GAT CCA 1392 Phe Ser Trp Thr H s Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 GAG AGA ATT AAT CAA ATA CCT TTA GTG AAA GGA TTT AGA GTT TGG GGG L440 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 GGC ACC TCT GTC ATT ACÁ GGA CCA GGA TTT ACÁ GGA GGG GAT ATC CTT 1488 Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu 485 490 495 CGA AGA AAT ACC TTT GGT GAT TTT GTA TCT CTA CAA GTC AAT ATT AAT 1536 Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn He Asn 500 505 510 TCA CCA ATT ACC CAA AGA TAC CGT TTA AGA TTT CGT TAC GCT TCC AGT 1584 Ser Pro He Thr Gin Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser 515 520 525 AGG GAT GCA CGA GTT ATA GTA TTA ACÁ GGA GCG GCA TCC ACÁ GGA GTG 1632 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val 530 535 540 GGA GGC CAA GTT AGT GTA AAT ATG CCT CTT CAG AAA ACT ATG GAA ATA 1680 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu He 545 550 555 560 GGG GAG AAC TTA ACÁ TCT AGA ACÁ TTT AGA TAT ACC GAT TTT AGT AAT 1728 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 CCT TTT TCA TTT AGA GCT AAT CCA GAT ATA ATT GGG ATA AGT GAA CAA 1776 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 CCT CTA TTT GGT GCA GGT TCT ATT AGT AGC GGT GAA CTT TAT ATA GAT 1824 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Giu Leu Tyr He Asp 595 600 605 AAA ATT GAA ATT ATT CTA GCA GAT GCA ACÁ TTT GAA GCA GAA TCT GAT 1872 Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp 610 615 620 TTA GAA AGA GCA CAA AAG GCG GTG AAT GCC CTG TTT ACT TCT TCC AAT 1920 Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 640 CAA ATC GGG TTA AAA ACC GAT GTG ACG GAT TAT CAT ATT GAT CAA GTA 1968 Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr Kis He Asp Gln Val 645 650 655 TCC AAT TTA GTG GAT TGT TTA TCA GAT GAA TTT TGT CTG GAT GAA AAG 2016 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 CGA GAA TTG TCC GAG AAA GTC AAA CAT GCG AAG CGA CTC AGT GAT GAG 2064 Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu 675 680 685 CGG AAT TTA CTT CAA GAT CCA AAC TTC AGA GGG ATC AAT AGA CAA CCA 2112 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 GAC CGT GGC TGG AGA GGA AGT ACÁ GAT ATT ACC ATC CAA GGA GGA GAT 2160 Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gin Gly Gly Asp 70E 7. 715 720 GAC GTA TTC AAA GAG AAT TAC GTC ACÁ CTA CCG GGT ACC GTT GAT GAG 2208 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu 725 730 735 TGC TAT CCA ACG TAT TTA TAT CAG AAA ATA GAT GAG TCG AAA TTA AAA 2256 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys 740 745 750 GCT TAT ACC CGT TAT GAA TTA AGA GGG TAT ATC GAA GAT AGT CAA GAC 2304 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Glr. Asp 755 760 765 TTA GAA ATC TAT TTG ATC CGT TAC AAT GCA AAA CAC GAA ATA GTA AAT 235: Leu Giu He Tyr Leu He Arg Tyr Asn Ala Lys Kis Glu He Val Asn 770 775 780 GTG CCA GGC ACG GGT TCC TTA TGG CCG CTT TCA GCC ^A AGT CCA ATC 2400 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala n ¿ r Pro He 785 790 795 800 GGA AAG TGT GGA GAA CCG AAT CGA TGC GCG CCA CA CTT GAA TGG AAT 2448 Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro H s Leu Glu Trp Asn 805 810 815 CCT GAT CTA GAT TGT TCC TGC AGA GAC GGG GAA AAA TGT GCA CAT CAT 2496 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His 820 825 830 TCC CAT CAT TTC ACC TTG GAT ATT GAT GTT GGA TGT ACÁ GAC TTA AAT 2544 Ser His His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 GAG GAC TTA GGT GTA TGG GTG ATA TTC AAG ATT AAG ACG CAA GAT GGC 2592 Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 360 CAT GCA AGA CTA GGG AAT CTA GAG TTT CTC GAA GAG AAA CCA TTA TTA 2640 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Giu Lys Pro Leu Leu 865 870 875 880 GGG GAA. GCA CTA GCT CGT GTG AAA AGA GCG GAG AAG AAG TGG AGA GAC 2688 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 AAA CGA GAG AAA CTG CAG TTG GAA ACÁ AAT ATT GTT TAT AAA GAG GCA 2736 Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 AAA GAA TCT GTA GAT GCT TTA TTT GTA AAC TCT CAA TAT GAT AGA TTA 2784 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu 915 920 925 CAA GTG GAT ACG AAC ATC GCA ATG ATT CAT GCG GCA GAT AAA CGC GTT 2832 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 CAT AGA ATC CGG GAA GCG TAT CTG CCA GAG TTG TCT GTG ATT CCA GGT 2880 His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 950 955 960 GTC AAT GCG GCC ATT TTC GAA GAA TTA GAG GGA CGT ATT TTT AC GCG 2928 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 TAT TCC TTA TAT GAT GCG AGA AAT GTC ATT AAA AAT GGC GAT TTC AAT 2976 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn 980 985 990 AAT GGC TTA TTA TGC TGG AAC GTG AAA GGT CAT 3TA GAT GTA GAA GAG 3024 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His /al Asp Val Glu Giu 995 1000 1005 CAA AAC AAC CAC CGT TCG GTC CTT GTT ATC CCA GAA TGG GAG GCA GAA 3072 Gln Asn Asn His Arg Ser Val Leu Val He Prc Glu Trp Glu Ala Glu 1010 1015 1020 GTG TCA CAA GAG GTT CGT GTC TGT CCA GGT CGT GGC TAT ATC CTT CGT 3120 Val Ser Gln Glu Val Arg Val Cys Pro Giy Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 GTC ACÁ GCA TAT AAA GAG GGA TAT GGA GAG GGC TGC GTA ACG ATC CAT 3168 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 GAG ATC GAA GAC AAT ACÁ GAC GAA CTG AAA TTC AGC AAC TGT GTA GAA 3216 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 GAG GAA GTA TAT CCA AAC AAC ACÁ GTA ACG TGT AAT AAT TAT ACT GGG 3264 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 ACT CAA GAA GAA TAT GAG GGT ACG TAC ACT TCT CGT AAT CAA GGA TAT 3312 Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gin Gly Tyr 1090 1095 1100 GAC GAA GCC TAT GGT AAT AAC CCT TCC GTA CCA GCT GAT TAC GCT TCA 3360 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 GTC TAT GAA GAA AAA TCG TAT ACÁ GAT GGA CGA AGA GAG AAT CCT TGT 3408 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys 1125 1130 1135 GAA TCT AAC AGA GGC TAT GGG GAT TAC ACÁ CCA CTA CCG GCT GGT TAT 3456 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 GTA ACÁ AAG GAT TTA GAG TAC TTC CCA GAG ACC GAT AAG GTA TGG ATT 3504 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He 1155 1160 1165 GAG A.TC GGA GAA ACÁ GAA GGA ACÁ TTC ATC GTG GAT AGC GTG GAA TTA 3552 Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 CTC CTT ATG GAG GAA 3567 Leu Leu Met Glu Glu 1185 (2).- INFORMACIÓN PARA SEQ ID NO: 12: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1189 aminoácidos (B).-TIPO: aminoácido (D).-TOPOLOGÍA: lineal, (ii).- TIPO DE MOLÉCULA: proteína, (xi).- DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 12: Met Glu Glu Asn Asn Gln Asn Glr. Cys He Pro Tyr Asn Cys Leu Ser 1 5 10 15 Asn Pro Glu Glu Val Leu Leu Asp Giy Glu Ara He Ser Thr Gly Asn 20 25 30 Ser Ser j._e Asp He Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn 40 45 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu , 65 70 75 80 Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala 100 105 110 Phe Lys Glu Trp Glu Glu Asp Pro His Asn Pro Ala Thr Arg Thr Arg 115 120 125 Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 Pro Ser Phe Arg He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 Phe Gly Glu Arg Trp Gly Leu Thr Thr He Asn Val Asn Glu Asn Tyr 180 . 185 190 Asn Arg Leu He Arg His He Asp Glu Tyr Ala Aep His Cys Ala Asn 195 200 205 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Lys Ser Thr Tyr Gln Asp 210 215 220 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He 245 250 255 Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 Val Met Glu Ser Ser Ala He Arg Asn Pro Kis Leu Phe Asp He Leu 290 295 300 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser '/ai Gly Arg Asn Phe 305 310 315 320 Tyr Trp Gly Gly His Arg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 lie Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg 340 345 350 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Giu Leu Pro Pro Glu Asp 405 410 415 Asn Ser Val Prc Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala 420 425 430 Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu 485 490 495 Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn He Asn 500 505 510 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser 515 520 525 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val 530 535 540 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gin Lys Thr Met Glu He 545 550 555 560 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 Pro Leu Phe Giy Ala Giy Ser He Ser Ser Gly Glu Leu Tyr He Asp 595 600 605 Ly? He Glu He He Leu Ala Asp Ala Thr Phe Giu Ala Glu Ser Asp 610 615 620 Leu Glu Arg Ala Gin Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 . 640 Gln He Gly Leu Lys Thr Asp Val Thr A?p Tyr Kis He Asp Gln Val 645 650 655 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu 675 680 685 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 Asp Arg Gly Trp Arg Gly Ser Thr Asp I] e Thr He Gln Gly Gly Asp 705 710 715 720 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Giy Thr Val Asp Glu 725 730 735 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys 740 745 750 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Gln Asp 755 760 765 Leu Glu He Tyr Leu lie Arg Tyr Asn Ala Lys His Glu He Val Asn 770 775 780 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He 785 790 795 800 Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Prc His Leu Glu Trp Asn 805 810 815 Pro Asp Leu Aso Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His 820 825 830 Ser His His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 860 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Giu Lys Lys Trp Arg Asp 885 .890 895 Lys Arg Glu Lys Leu Gln Leu Giu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gin Tyr Asp Arg Leu 915 920 925 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 950 955 960 Val Asn Ala Ala He Phe Giu Glu Leu Glu Giy Arg He Phe Thr Ala 965 970 975 Tyr Ser Leu Tyr Asp Ala Arg Asn Val lie Lys Asn Gly Asp Phe Asn 980 985 990 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu 995 1000 1005 Gln Asn Asn His Arg Ser Val Leu Val He Pro Glu Trp Glu Ala Glu 1010 1015 1020 Val Ser Gln Glu Val Arg Val Cys Pro Gly «.rg Gly Tyr lie Leu Arg 1025 1030 1035 1040 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser I 1105 1110 1115 1 20 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys 1125 1130 1135 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He 1155 1160 H65 Glu He Gly Giu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 H80 Leu Leu Met Glu Glu 1185 (2).- INFORMACIÓN PARA SEQ ID NO: 13: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 49 pares de bases (B) TIPO: ácido nucleico (C) No. DE FILAMENTOS: uno solo (D) TOPOLOGÍA: lineal (xi.- DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 13: GCATTTAAAG AATGGGAAGA AGATAATAAT CCAGCAACCA GGACCAGAG 49 (2).- INFORMACIÓN PARA SEQ ID NO: 14: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 55 pares de bases (B) TIPO: ácido nucleico (C) No. DE FILAMENTOS: uno solo (D) TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 14: GCATTTAAAG AATGGGAAGA AGATCCTAAT GCAAATCCAG CAACCAGGAC CGAG 55 (2).- INFORMACIÓN PARA SEQ ID NO: 15: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 17 pares de bases (B) TIPO: ácido nucleico (C) No. DE FILAMENTOS: uno solo (D) TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 15: CCCGATCGGC CGCATGC 17 (2).- INFORMACIÓN PARA SEQ ID NO: 16: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 51 pares de bases (B).-TIPO: ácido nucleico (C).- No. DE FILAMENTOS: uno solo (D). -TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 16: GCATTTAAAG AATGGGAAGG GATCCTAGGA ATCCAGCAAC CAGGACCAGA G 51 (2).- INFORMACIÓN PARA SEQ ID NO: 17: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 30 pares de bases (B).-TIPO: ácido nucleico (O No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 17: GAGCTCTTGT TAAAAAAGGT GTTCCAGATC 30 (2).- INFORMACIÓN PARA SEQ ID NO: 18: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 62 pares de bases (B).-TIPO: ácido nucleico (C).- No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (ix).- ASPECTO: (A).- NOMBRE/CLAVE: base modificada (B).- UBICACIÓN: 19...39 (D).- OTRA INFORMACIÓN: /nota = "N = G, A, T o C" (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 18: GCATTTAAAG AATGGGAANN NNNNNNNNNN NNNNNNNNNA CCAGGACCAG AGTAATTGAT CG 60 CG 62 (2).- INFORMACIÓN PARA SEQ ID NO: 19: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 55 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 19: GGGCTACTTG AAAGGGACAT TCCTTCGTTT GCAATTTCTG GATTTGAAGT ACCCC 55 (2).- INFORMACIÓN PARA SEQ ID NO: 20: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 39 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 20: CCAAGAAAAT ACTAGAGCTC TTGTTAAAAA AGGTGTTCC 39 (2).- INFORMACIÓN PARA SEQ ID NO: 21 : (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 21 : GAGATTCTGT AATTTTTGGA GAAGCATGGG GGTTGACAAC GATAAATGTC 50 (2).- INFORMACIÓN PARA SEQ ID NO: 22: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 63 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 22: GCATTTAAAG AATGGGAAGA AGATCCTAAT AATCCAGCAA CCAGGACCAG AGTAATTGAT 60 CGC 63 (2).- INFORMACIÓN PARA SEQ ID NO: 23: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 7 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 23: Glu Asp Pro Asn Asn Pro Ala 1 5 (2).- INFORMACIÓN PARA SEQ ID NO: 24: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 61 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 24: GCATTTAAAG AATGGGAAGG GATCCTAGGA ATCCAGGAAC CAGGACCAGA G 51 (2).- INFORMACIÓN PARA SEQ ID NO: 2d: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 63 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 25: GCATTTAAAG AATGGGAAGA TGATCCTCAT AATCCCACAA CCAGGACCAG AGTAATTGAT 60 CGC 63 (2).- INFORMACIÓN PARA SEQ ID NO: 26: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 7 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 26: Asp Asp Pro His Asn Pro Thr 1 5 (2).- INFORMACIÓN PARA SEQ ID NO: 27: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 7 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 27: Val Asp Pro Asn Asn Pro Gly 1 5 (2).- INFORMACIÓN PARA SEQ ID NO: 28: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 28: Thr Asn Pro Ala Leu Arg Glu Glu Met Arg He Gln Phe Asn Asp Met - 5 ?o 15 Asn Ser Ala Leu Thr Thr Ala He Pro Leu Leu Ala Val Gln Asn Tyr 20 25 ' 30 Gln Val Pro Leu Leu Ser Val Tyr Val Gln Ala Ala Asn Leu His Leu 35 40 45 Ser Val 50 (2).- INFORMACIÓN PARA SEQ ID NO: 29: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D). -TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 29: Thr Asn Pro Ala Leu Thr Glu Glu Met Arg He Glr. Phe Asn Asp Met 1 5 10 15 Asn Ser Ala Leu Thr Thr Ala He Pro Leu Phe Thr Val Gln Asn Tyr 20 25 30 Gln Val Pro Leu Leu Ser Val Tyr Val Gln Ala Ala Asn Leu Hls Leu 35 40 45 Ser Val 50 (2).- INFORMACIÓN PARA SEQ ID NO: 30: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 30: Thr Asn Pro Ala Leu Arg Glu Glu Met Arg He Gln Phe Asn Asp Met ! 5 10 15 Asn Ser Ala Leu Thr Thr Ala He Pro Leu Phe Ala Val Gln Asn Tyr 20 25 30 Gln Val Pro Leu Leu Ser Val Tyr Val Glr. Ala Ala Asn Leu His Leu 35 40 45 Ser Val 50 (2).- INFORMACIÓN PARA SEQ ID NO: 31 : (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 31 : Thr Asn Pro Ala Leu Arg Giu Glu Met Arg He Gln Phe Asn Aso Met 1 10 15 Asn Ser Ala Leu Thr Thr Ala He Pro Leu Phe Thr Val Gln Asn Tyr 20 25 30 Gln Val Pro Leu Leu Ser Val Tyr Val Glr. Ala Val Asn Leu His Leu 35 40 45 Ser Val 50 (2).- INFORMACIÓN PARA SEQ ID NO: 32: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 32: Thr Asn Pro Ala Leu Arg Glu Glu Met Arg He Gln Phe Asn Asp Met 1 5 10 15 Asn Ser Ala Leu Thr Thr Ala He Pro Leu Phe Ala Val Gln Asn Tyr 20 25 30 Gin Val Pro Leu Leu Ser Val Tyr Val Gln Ala Ala Asn Leu H s Leu 35 40 45 Ser Val (2).- INFORMACIÓN PARA SEQ ID NO: 33: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 33: Asn Asn Ala Gln Leu Arg Glu A?P Val Arg He Arg Phe Ala Asn Thr 1 5 10 15 Asp Asp Ala Leu He Thr Ala He Asn Asn Pne Thr Leu Thr Ser Phe 20 25 30 Glu He Pro Leu Leu Ser Val Tyr Val Gln Ala Ala Asn Leu His Leu 35 40 45 Ser Leu 50 (2).- INFORMACIÓN PARA SEQ Id NO: 34: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 60 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 34: Asn Asn Ala Gln Leu Arg Glu Asp Val Arg He Arg Phe Ala Asn Thr 1 5 10 15 ASP Asp Ala Leu He Thr Ala He Asn Asr. Phe Thr Leu Thr Ser Phe 20 25 30 Glu He Pro Leu Leu Ser Val Tyr Val Gin Ala Ala Asn Leu His Leu 35 40 45 Ser Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 35: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 35: Asn Asn Pro Ala Ser Gln Glu Arg Val Arg Thr Arg Phe Arg Leu Thr 1 5 10 15 Asp Asp Ala He Val Thr Gly Leu Pro Thr Leu Ala He Arg Asn Leu 20 25 30 Glu Val Val Asn Leu Ser Val Tyr Thr Gin Ala Ala Asn Leu His Leu 35 40 45 Ser Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 36: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 36: Asn Asn Pro Gla Thr Arg Thr Arg Val H= Asp Arg Pne Arg He Leu 1 5 10 15 Asp Gly Leu Leu Glu Arg Asp He Pro Ser Pne Arg He Ser Gly Pne 20 25 30 Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn Leu His Leu 35 40 45 Ala He 50 (2).- INFORMACIÓN PARA SEQ ID NO: 37: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 60 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPClÓN DE LA SECUENCIA: SEQ ID NO: 37: Asp Asn Pro Val Thr Arg Thr Arg Val Val Asp Arg Phe Arg He Leu 1 5 ^0 15 Asp Gly Leu Leu Glu Arg Asp He Pro Ser Phe Arg He Ala Gly Phe 20 25 30 Glu Val Pro Leu Leu Ser Val Tyr Ala Gln Ala Ala Asn Leu His Leu 35 40 45 Ala He 50 (2).- INFORMACIÓN PARA SEQ ID NO: 38: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 60 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 38: Thr Asn Pro Ala Leu Lys Glu Glu Met Arg Thr Gln Phe Asn Asp Met 1 5 10 15 Asn Ser He Leu Val Thr Ala He Pro Leu Phe Ser Val Gln Asn Tyr 25 30 Gin Val Pro Phe Leu Ser Val Tyr Val Gln Ala Ala Asn Leu His Leu 35 40 45 Ser Val 50 (2).- INFORMACIÓN PARA SEQ ID NO: 39: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 60 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 39: Thr Asn Pro Ala Leu Arg Glu Glu Met Arg He Gln Phe Asn Asp Met 1 5 10 15 Asn Ser Ala Leu Thr Thr Ala He Pro Leu Phe Ser Val Gln Gly Tyr 20 25 30 Glu He Pro Leu Leu Ser Val Tyr Val Gln Ala Ala Asn Leu His Leu 40 45 Ser Val 50 (2).- INFORMACIÓN PARA SEQ ID NO: 40: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 60 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 40: Thr Asn Pro Ala Leu Arg Glu Glu Met Arg He Gln Phe Asn Asp Met 1 5 ?o _ 15 Asn Ser Ala Leu He Ihr Ala He Pro Leu Phe Arg Val Gln Asn Tyr 20 25" 30 Glu Val Ala Leu Leu Ser Val Tyr Val Gln A.la Ala Asn Leu His Leu 35 40 45 Ser He 50 (2).- INFORMACIÓN PARA SEQ ID NO: 41 : (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 60 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 41 : Ser Asn Pro Ala Leu Arg Glu Glu Met Arg Tnr Gln Phe Asn Val Met 1 5 10 15 Asn Ser Ala Leu He Ala Ala He Pro Leu Leu Arg Val Arg Asn Tyr 20 25 30 Glu Val Ala Leu Leu Ser Val Tyr Val Glr. Ala Ala Asn Leu H s Leu 35 40 45 i Ser Val 50 (2).- INFORMACIÓN PARA SEQ ID NO: 42: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 60 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 42: Asn Asn Glu Ala Leu Gln Gln Asp Val Arg Asn Arg Phe Ser Asn Thr 1 5 10 15 Asp Asn Ala Leu He Thr Ala He Pro He Leu Arg Giu Gln Gly Phe 20 25 30 Glu He Pro Leu Leu Ser Val Tyr Val Gln Ala Ala Asn Leu His Leu 40 45 Ser Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 43: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 60 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 43: Asn Asn Glu Ser Leu Gln Gln Asp Val Arg Asn Arg Phe Ser Asn Thr 10 15 Asp Asn Ala Leu He Thr Ala He Pro He Leu Arg Glu Gin Gly Phe 20 25 30 Glu He Pro Leu Leu Thr Val Tyr Val Glr. Ala Ala Asn Leu His Leu 35 40 45 Ser Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 44: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 44: Asp Asn Glu Ala Ala Lys Ser Arg Val He Asp Arg Phe Arg He Leu 1 5 10 15 Asp Gly Leu He Glu Ala Asn He Pro Ser Phe Arg He He Gly Phe 20 25 30 GIu~Val~Pro Leu~Leu Ser Val Tyr Val Gln Ala Ala Asn Leu His Leu 35 40 45 Ala Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 45: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 45: Asp Asn Thr Ala Ala Arg Ser Arg Val Thr Glu Arg Phe Arg He He 1 5 10 15 Asp Ala Gln He Glu Ala Asn He Pro Ser Phe Arg He Pro Gly Phe 20 25 30 Glu Val Pro Leu Leu Ser Val Tyr Ala Gin Ala Ala Asn Leu His Leu 35 40 45 Ala Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 46: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 60 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 46: ASP Asp Ala Ara Thr Arg Ser Val Leu Tyr Thr Gln Tyr He Ala Leu 1 * " 5 1C 1 Glu Leu Asp Phe Leu Asn Ala Met Pro Lea Phe Ala lie Arg Asn Gln 20 25 30 Glu Val Pro Leu Leu Met Val Tyr Ala Glr. Ala Ala Asn Leu H s Leu 35 40 45 Leu Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 47: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 47: Asn Asp Ala Arg Ser Arg Ser He He Leu Glu Arg Tyr Val Ala Leu 1 5 10 15 Glu Leu Asp He Thr Thr Ala He Pro Leu Phe Arg He Arg Asn Glu 20 25 30 Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His Leu 35 40 45 Leu Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 48: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 48: Asn Asp Ala Arg Ser Arg Ser He He Leu Glu Arg Tyr Val Ala Leu 1 5 10 15 Glu Leu Asp He Thr Thr Ala He Pro Leu Phe Arg He Arg Asn Glu 20 25 30 Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu KÍ? Leu 35 40 45 Leu Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 49: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 49: Asn Asp Ala Arg Ser Arg Ser He He Are Glu Arg Tyr He Ala Leu 1 5 10 15 Glu Leu Asp He Thr Thr Ala He Pro Leu Phe Ser He Arg Asn Glu 20 25 30 Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His Leu 35 40 45 Leu Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 50: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 50: Asn Asn Thr Arg Ala Arg Ser Val Val Lys Ser Gln Tyr He Ala Leu 1 5 10 15 Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe Ala Val Ser Giy Glu 20 25 30 Glu Val Pro Leu Leu Pro He Tyr Ala Glr. Ala Ala Asn Leu His Leu 35 40 45 Leu Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 51 : (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 51 : Asn Asn Thr Arg Ala Arg Ser Val Val Lys Asn Gln Tyr He Ala Leu l - 10 15 Glu Leu Met Phe Val Gln Lys Leu Pro Ser Phe Ala Val Ser Gly Glu 20 25 30 Glu Val Pro Leu Leu Pro He Tyr Ala Glr. Ala Ala Asn Leu His Leu 35 40 45 Leu Leu 50 (2).- INFORMACIÓN PARA SEQ ID NO: 52: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 22 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 52: GGATCCCTCG AGCTGCAGGA GC 22 (2).- INFORMACIÓN PARA SEQ ID NO: 53: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 56 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (ix) Aspecto: (A) Nombre/Clave: (B) Ubicación: 31..33 (D) Otra lnformación:/nota="N=C,A,ToG" (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 53: GGGCTACTTG AAAGGGACAT TCCTTCGTTT NNNATTTCTG GATTTGAAGT ACCCC 55 (2).- INFORMACIÓN PARA SEQ ID NO: 54: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A). -LONGITUD: 63 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 54: GCATTTAAAG AATGGGAAGT AGATCCTAAT AATCCTGGAA CCAGGACCAG AGTAATTGAT 60 CGC 63 (2).- INFORMACIÓN PARA SEQ ID NO: 5d: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 7 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: dd: Val Asp Pro Asn Asn Pro Gly 1 5 (2).- INFORMACIÓN PARA SEQ ID NO: 56: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 63 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 56: GCATTTAAAG AATGGGAAGAAGATCCCCATAATCCAGCAACCAGGACCAGAGTAATTGAT 60 CGC 63 (2).- INFORMACIÓN PARA SEQ ID NO: 57: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 7 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 57: Glu Asp Pro His Asn Pro Ala 1 5 (2).- INFORMACIÓN PARA SEQ ID NO: 58: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 3567 (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (ix).-ASPECTO: (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1...3567 (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 58: ATG GAG GAA AAT AAT CAA AAT CAA TGC ATA CC. --C AAT TGT TTA AGT 48 Met Glu Glu Asn Asn Cln Asn Gin Cys 11^ Prc -r Asn Cys Leu Ser 1 5 10 15 AAT CCT GAA GAA GTA CTT TTG GAT GGA GAA CGG ATA TCA ACT GGT AAT 96 Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg He Ser Thr Gly Asn 20 25 30 TCA TCA ATT ATT TCT CTG TCA CTT GTA TCT AAC L44 Ser Ser He Asp He Ser Leu Ser Leu Val —p. Phe Leu Val Ser Asn 35 40 45 TTT GTA CCA GGG GGA GGA TTT TTA GTT GGA nir. GAT TTT GTA TGG 192 Phe Val Pro Gly Giy Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 GGA ATA GTT GGC CCT TCT CAA TGG GAT GCA CTA GTA CAA ATT GAA 240 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Leu val Gln He Glu 65 70 75 80 CAA TTA ATT AAT GAA AGA ATA GCT GAA TTT GCT AAT GCT GCT ATT 288 Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 GCT AAT TTA GAA GGA TTA GGA AAC AAT AAT ATA TAT GTG GAA GCA 336 Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn He Tyr Val Glu Ala 100 105 110 TTT AAA GAA TGG GAA GAA GAT CCT AAT AAT CCA GCA ACC AGG ACC AGA 384 Phe Lys Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Thr Arg 115 120 125 GTA ATT GAT CGC TTT CGT ATA CTT GAT GGG CTA CTT GAA AGG GAC ATT 432 Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 CCT TCG TTT GCA ATT TCT GGA TTT GAA GTA CCC CTT TTA TCC GTT TAT 480 Pro Ser Phe Ala He Ser Gly Pne Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 GCT CAA GCG GCC AAT CTG CAT CTA GCT ATA TTA AGA GAT TCT GTA ATT 528 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 TTT GGA GAA AGA TGG GGA TTG ACÁ ACG ATA AAT GTC AAT GAA AAC TAT 576 Phe Gly Glu Arg Trp Gly Leu Thr Thr He Asn Val Asn Glu Asn Tyr 180 185 190 AAT AGA CTA ATT AGG CAT ATT GAT GAA TAT GCT GAT CAC TGT GCA AAT 624 Asn Arg Leu He Arg Hl? He A?P Glu Tyr Ala Asp His Cys Ala Asn 195 200 205 ACG TAT AAT CGG GGA TTA AAT AAT TTA CCG GCT AGC ACG TAT CAA GAT 672 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Ala Ser Thr Tyr Gln Asp 210 215 220 TGG ATA ACÁ TAT AAT CGA TTA CGG AGA GAC TTA TTG ACT GTA TTA 720 Trp He Thr Tyr Asn Arg Leu Arg Arg Aso Leu Thr Leu Thr Val Leu 225 230 235 240 GAT ATC GCC GCT TTC TTT CCA AAC TAT GAC AAT AGA TAT CCA ATT 768 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He 245 250 255 CAG CCA GTT GGT CAA CTA ACÁ AGG GAA GTT TAT ACG GAC CCA TTA ATT 816 Gln Pro Val Giy Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 AAT AAT CCA CAG TTA CAG GTA GCT CAA TTA CCT ACT TTT AAC 864 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 GTT ATG GAG AGC AGC GCA ATT AGA AAT CCT CAT TTA """ GAT ATA TTG 912 Val Met Glu Ser Ser Ala He Arg Asn Pro His Leu Phe Asp He Leu 290 295 300 AAT AAT CTT ACÁ ATC TT ACG GAT TGG TTT AGT GTT GGA CGC AAT TTT 960 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe 305 310 315 320 TAT TGG GGA GGA CAT CGA GTA ATA TCT AGC CTT ATA GGA GGT GGT AAC 1008 Tyr Trp Gly Gly His Arg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 ATA ACÁ TCT CCT ATA TAT GGA AGA GAG GCG AAC GAG CCT CCA AGA 1056 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg 340 345 350 TCC TTT ACT TT AAT GGA CCG GTA TTT AGG ACT TTA TCA AAT CCT ACT 1104 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 TTA CGA TTA TTA CAG CAA CCT TGG CCA GCG CCA CCA TTT AAT TTA CGT 1152 Leu Arg Leu Leu GIn Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 GGT GTT GAA GGA GTA GAA TTT TCT ACÁ CCT ACÁ AAT A.GC TTT ACG TAT 1200 Gly Val Glu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 CGA GGA AGA GGT ACG GTT GAT TTA ACT GAA TTA CCG CCT GAG GAT 1248 Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 AAT AGT GTG CCA CCT csc GAA GGA TAT AGT CAT TTA -GT CAT GCA 1296 Asn Ser Val Pro Pro Arg Giu Gly Tyr Ser Kis Arg Leu Cys His Ala 420 425 430 ACT TTT GTT CAA AGA TCT GGA ACÁ CCT TTT TTA ACÁ ACT GGT GTA GTA 1344 Thr Phe Val Gln Arg Ser Giy Thr Pro Phe Leu Thr Thr Giy Val Val 435 440 445 TTT TCT TGG ACG CAT CGT AGT GCA ACT CTT ACÁ r^ T ACÁ ATT GAT CCA 1392 Phe Ser Trp Thr Kis Arg Ser Ala Thr Leu Thr Asr. Thr He Asp Pro 450 455 460 GAG AGA ATT AAT CAA ATA CCT TTA GTG AAA GGA TT AGA GTT TGG GGG 1440 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 GGC ACC TCT GTC ATT ACÁ GGA CCA GGA TTT AC. GGA GGG GAT ATC CTT 1488 Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu 485 490 495 CGA AGA AAT ACC TTT GGT GAT TTT GTA TCT CTA CAA GTC AAT ATT AAT 1536 Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn He Asn 500 505 510 TCA CCA ATT ACC CAA AGA TAC CGT TTA AGA TTT CGT TAC GCT TCC AGT 1584 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser 515 520 525 AGG GAT GCA CGA GTT ATA GTA TTA ACÁ GGA GCG GCA TCC ACÁ GGA GTG 1632 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val 530 535 540 GGA GGC CAA GTT AGT GTA AAT ATG CCT CTT CAG AAA ACT ATG GAA ATA 1680 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu He 545 550 555 560 GGG GAG AAC TTA ACÁ TCT AGA ACÁ AGA TAT ACC GAT TTT AGT AAT 1728 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 CCT TTT TCA TTT AGA GCT AAT CCA GAT ATA ATT GGG ATA AGT GAA CAA 1776 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 CCT CTA TTT GGT GCA GGT TCT ATT AGT AGC i GAA CTT TAT ATA GAT 1824 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Glu Leu Tyr He Asp 595 600 605 AAA ATT GAA ATT ATT CTA GCA GAT GCA ACÁ TTT GAA GCA GAA TCT GAT 1872 Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp 610 615 620 TTA GAA AGA GCA CAA AAG GCG GTG AAT GCC CTG TTT ACT TCT TCC AAT 1920 Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Pne Thr Ser Ser Asn 625 630 635 640 CAA ATC GGG TTA AAA ACC GAT GTG ACG GAT TAT CAT ATT GAT CAA GTA 1968 Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr His He Asp Gln Val 645 650 655 TCC AAT TTA GTG GAT TGT TTA TCA GAT GAA TTT TGT CTG GAT GAA AAG 2016 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 CGA GAA TTG TCC GAG AAA GTC AAA CAT GCG AAG CGA CTC AGT GAT GAG 2064 Arg Glu Leu Ser Glu Ly? Val Lys His Ala Lys Arg Leu cer A?p Glu 675 680 685 CGG AAT TTA CTT CAA GAT CCA AAC ? AGA GGG ATC AAT AGA CAA CCA 2112 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 GAC CGT GGC TGG AGA GGA AGT ACÁ GAT ATT ACC ATC CAA GGA GGA GAT 2160 Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Gly Asp 705 710 715 720 GAC GTA TTC AAA GAG AAT TAC GTC ACÁ CTA CCG 33T ACC GTT GAT GAG 2208 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu 725 730 735 TAT CCA ACG TAT TTA TAT CAG AAA ATA GAT GAG TCG AAA TTA AAA 2256 Cvs Tyr Pro Thr Tyr Lea Tyr Gln Lys He Asp Glu Ser Lys Leu Lys 740 745 750 GCT TAT ACC CGT TAT GAA TTA AGA GGG TAT ATC GAA GAT AGT CAA GAC 2304 Ala Tyr Thr Arg Tyr Gia Leu Arg Giy Tyr He Glu Asp Ser Gln Asp 755 760 765 TTA GAA ATC TAT TTG ATC CGT TAC AAT GCA AAA CAC GAA ATA GTA AAT 2352 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys His Glu He Val Asn 770 775 780 GTG CCA GGC ACG GGT TCC TTA TGG CCG CTT TCA. GCC CAA AGT CCA ATC 2400 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He 785 790 795 800 GGA AAG TGT GGA GAA CCG AAT CGA TGC GCG CCA CAC CTT GAA TGG AAT 2448 Gly Lys Cys Gly Giu Pro Asn Arg Cys Ala Pro H ? Leu Glu Trp Asn 805 810 815 GAT CTA GAT TGT TCC TGC AGA GAC GGG GAA AAA X l GCA CAT CAT 2496 Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lvs Cys Ala His His 820 825 830 TCC CAT CAT TTC ACC TTG GAT ATT GAT GTT GGA TGT ACÁ GAC TTA AAT 2544 Ser HI? His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 GAG GAC TTA GGT GTA TGG GTG ATA TTC AAG ATT AAG ACG CAA GAT GGC 2592 Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 860 CAT GCA AGA CTA GGG AAT CTA GAG TTT CTC GAA GAG AAA CCA TTA TTA 2640 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 GGG GAA GCA CTA GCT CGT GTG AAA AGA GCG GAG AAG AAG TGG AGA GAC 2688 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 AAA CGA GAG AAA CTG CAG TTG GAA ACÁ AAT ATT GTT TAT AAA GAG GCA 2736 ys Ar9 Glu Lys Leu Gln Leu Giu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 AAA GAA TCT GTA GAT GCT TTA TTT GTA AAC TCT CAA TAT GAT AGA TTA 2784 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Glr. Tyr Asp Arg Leu 915 920 925 CAA GTG GAT ACG AAC ATC GCA ATG ATT CAT GCG GCA GAT AAA CGC GTT 2832 Gln Val Asp Thr Asn He Ala Met He H s Ala Ala Asp Lvs Arg Val 930 935 940 CAT AGA ATC CGG GAA GCG TAT CTG CCA GAG TTG TCT GTG ATT CCA GGT 2880 His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 950 955 960 GTC AAT GCG GCC ATT TTC GAA GAA TTA GAG GGA CGT ATT TTT ACÁ GCG 2928 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 TAT TCC TTA TAT GAT GCG AGA AAT GTC ATT AAA AAT GGC GAT TTC AAT 2976 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn 980 985 990 AAT GGC TTA TTA TGC TGG AAC GTG AAA GGT CAT GTA GAT GTA GAA GAG 3024 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu 995 1000 1005 CAA AAC AAC CAC CGT TCG GTC CTT GTT ATC CCA GAA TGG GAG GCA GAA 3072 Gln Asn Asn His Arg Ser Val Leu Val He Pro Giu Trp Glu Ala Glu 1010 1015 1020 GTG TCA CAA GAG GTT CGT GTC TGT CCA GGT CGT GGC TAT ATC CTT CGT 3120 Val Ser Gln Glu Val Arg Val Cys Pro Giy Arg Giy Tyr He Leu Arg 1025 1030 1035 1040 GTC ACÁ GCA TAT AAA GAG GGA TAT GGA GAG GGC TGC GTA ACG ATC CAT 3168 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 GAG ATC GAA GAC AAT ACÁ GAC GAA CTG AAA TTC AGC AAC TGT GTA GAA 3216 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 GAG GAA GTA TAT CCA AAC AAC ACÁ GTA ACG TGT AAT AAT TAT ACT GGG 3264 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 ACT CAA GAA GAA TAT GAG GGT ACG TAC ACT TCT CGT AAT CAA GGA TAT 3312 Thr Gln Gla Giu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 GAC GAA GCC TAT GGT AAT AAC CCT TCC GTA CCA GC" GAT TAC GCT TCA 3360 Asp Glu Ala Tyr Giy Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 GTC TAT GAA GAA AAA TCG TAT ACÁ GAT GGA CGA AGA GAG AAT CCT TGT 3408 Val Tyr Glu Giu Lys Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys 1125 1130 1135 GAA TCT AAC AGA GGC TAT GGG GAT TAC ACÁ CCA CTA CCG GCT GGT TAT 3456 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 GTA ACÁ AAG GAT TTA GAG TAC TTC CCA GAG ACC GAT AAG GTA TGG ATT 3504 Val Thr L-'s Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He 1155 1160 1165 GAG ATC GGA GAA ACÁ GAA GGA ACÁ TTC ATC GTG GAT AGC GTG GAA TTA 3552 Glu He Gly Glu Thr Glu Gly Thr Pne He Val Asp Ser Val Glu Leu 1170 1175 1180 CTC CTT ATG GAG GAA Leu Leu Met Glu Giu 3567 1185 (2).- INFORMACIÓN PARA SEQ ID NO: 59 (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 1189 aminoácidos (B).-TIPO: aminoácido (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (ii).-TIPO DE MOLÉCULA: proteína (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 59: Met Glu Glu Asn Asn Gln Asn Gln Cys He Pro Tyr Asn Cys Leu Ser 1 5 10 15 Asn Pro Glu Glu Val Leu Leu Asp Gly Giu Arg He Ser Thr Gly Asn 20 25 30 Ser Ser He Asp He Ser Leu Ser Leu Val Gin Phe Leu Val Ser Asn 35 40 45 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 Gly He Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu 65 70 75 80 Gln Leu He Asn Giu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asr. He Tyr Val Glu Ala 100 105 110 Phe Lys Glu Trp Glu Glu Aso Pro Asn Asn Pro Ala Thr Arg Thr Arg 115 120 125 Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 Pro Ser Phe Ala He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 Phe Gly Glu Arg Trp Gly Leu Thr Thr He Asn Val Asn Glu Asn Tyr 180 185 190 Asn Arg Leu He Ara Kis He Asp Glu Tyr Ala Asp His Cys Ala Asn 195 200 205 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Ala Ser Thr Tyr Glr. Asp 210 215 220 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg Arg Tyr Pro He 245 250 255 Gln Pro Val Gly Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 Val Met Glu Ser Ser Ala He Arg Asn Pro His Leu Phe Asp He Leu 290 295 300 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe 305 310 315 320 Tyr Trp Gly Gly His Arg Val lie Ser Ser Leu He Gly Gly Gly Asn 325 330 335 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Glr. Glu Pro Pro Arg 340 345 350 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 Gly Val Giu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 Arg Gly Arg Gly Thr Val Aso Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys Kis Ala 420 ' 425 430 Thr Phe Val Gln Arg Ser Giy Thr Pr Phe Leu Thr Thr Gly Val Val 435 440 445 Phe Ser Trp Thr Kis Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 Glu Arg He Asn Glr. He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu 485 490 495 Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn He Asn 500 505 510 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser 515 520 525 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val 530 535 540 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu He 545 550 555 560 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 Pro Leu Phe Gly Ala Gly Ser lie Ser Ser Gly Giu Leu Tyr He Asp 595 600 605 Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp 610 615 520 Leu Giu Arg Ala Gin Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 640 Gln He Gly Leu L/s Thr Asp Val Thr Asp Tyr Kis He Asp Gln Val 645 650 655 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu 675 680 685 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 Asp Arg Gly Trp Arg Gly Ser Thr Aso He Thr He Gin Gly Giy Asp 705 710 715 720 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Prc Gly Tnr Val Asp Glu 725 730 735 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Gla Ser Lys Leu Lys 740 745 750 Ala Tyr Thr Arg Tyr Glu Leu Arg Giy Tyr He Gla Asp Ser Gin Asp 755 760 765 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys His Glu He Val Asn 770 775 780 Val Pro Gly Thr Gi/ Ser Leu "rp Pro Leu Ser Ala Gln Ser Pro He 785 790 795 800 Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Prc Kis Leu Glu Trp Asn 805 81C 815 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His Kis 820 825 830 Ser His His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 Glu Aso Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Aso Gly 850 855 860 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Gla Glu Lys Pro Leu Leu 865 870 875 880 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 Lys Arg Glu Ly? Leu Gin Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gin Tyr Asp Arg Leu 915 920 925 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 Hl? Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 950 955 960 Val Asn Ala Ala He Phe Giu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn 980 985 990 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu 995 1000 1005 Gln Asn Asn His Arg Ser Val Leu Val He Pro Glu Trp Glu Ala Glu 1010 1015 1020 Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe SÍ Asn Cys Val Glu 1060 1065 1070 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser A.rg Asn Gln Gly Tyr 1090 1095 1100 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 Val Tyr Glu Glu Lys Ser ryr Thr Asp Gly Arg Arg Glu Asn Pro Cys 1125 1130 1135 Glu Ser Asn Arg Giy Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He 1155 1160 1165 Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 Leu Leu Met Glu Glu 1185 (2).- INFORMACIÓN PARA SEQ ID NO: 60: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 3567 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (ix).-ASPECTO: (A) NOMBRE/CLAVE: CDS (B) UBICACIÓIN: 1...3567 (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 60: ATG GAG GAA AAT AAT CAA AAT CAA TGC ATA CCT TAC AAT TGT TTA AGT 48 Met Glu Glu Asn Asn Gin Asn Gln Cys He Pro Tyr Asn Cys Leu Ser 1 5 10 15 AAT CCT GAA GAA GTA CTT TTG GAT GGA GAA CGG ATA TCA ACT GGT AAT 96 Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg He Ser Thr Gly Asn 20 25 30 TCA TCA ATT GAT ATT TCT CTG TCA CTT GTT CAG TTT CTG GTA TCT AAC 144 Ser Ser He Aso He Ser Leu Ser Leu Val Gin Pne Lea Val Ser Asn 35 40 45 TTT GTA CCA GGG GGA GGA TTT TTA GTT GGA ATA GAT GTA TGG 192 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu ie Asp Phe Val Trp 50 55 60 GGA ATA GTT GGC C " TCT CAA TGG GAT GCA TT CT.A GTA CAA ATT GAA 240 Gly He Val Gly Pro Ser Gin Trp Asp Ala Phe Leu Val Gln He Glu 65 70 75 80 CAA TTA ATT .AAT GAA AGA ATA GCT GAA TTT GCT AAT GCT ATT 288 Gln Leu He Asn Gla Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 GCT AAT TTA GAA GGA TTA GGA AAC AAT TTC AAT ATA TAT GAA GCA 336 Ala Asn Leu Glu Gly Leu Gly Asn Asn Phe Asn He .yr Val Glu Ala 100 105 110 TTT AAA GAA TGG GAA GAA GAT CCT AAT AAT CCA GCA ACC AGG ACC AGA 384 Phe Lys Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Arg Thr Arg 115 120 125 GTA ATT GAT CGC TTT CGT ATA CTT GAT GGG CTA CTT GAA AGG GAC ATT 432 Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 CCT TCG TTT GAC ATT TCT GGA TTT GAA GTA CCC CTT TTA rcc GTT TAT 480 Pro Ser Phe Asp He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 GCT CAA GCG GCC AAT CTG CAT CTA GCT ATA TTA AGA GAT TCT GTA ATT 528 Ala Gln Ala Ala Asn Leu HlS Leu Ala He Leu Arg Asp Ser Val He 165 170 175 TTT GGA GAA AGA TGG GGA TTG ACÁ ACG ATA AAT GTC AAT GAA AAC TAT 576 Phe Gly Glu Arg Trp Giy Leu Thr Thr He Asn Val Asn Glu Asn Tyr 180 185 190 AAT AGA CTA ATT AGG GAA TAT GCT GAT CAC GCA AAT 624 Asn Arg Leu He Arg Kl? He Asp Gla Tvr Ala Asp His Cys Ala Asn 195 200 205 ACG TAT AAT CGG GGA TTA AAT AAT TTA CCG GCT AGC ACG TAT CAA GAT 672 Thr Tyr Asn Arg Giy Leu Asn Asn Leu Pro Ala Ser Thr Tyr Gln Asp 210 215 220 TGG ATA ACÁ TAT AAT CGA TTA CGG AGA GAC TTA ACÁ TTG ACT GTA TTA 720 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 GAT ATC GCC GCT TTT CCA AAC TAT GAC AAT AGG AGA TAT CCA ATT 768 Asp He Ala Ala Phe Phe Pro Asn Tyr A?p Asn Arg Arg Tyr Pro He 245 250 255 CAG CCA GTT GGT CAA CTA ACÁ AGG GAA GTT TAT ACG GAC CCA TTA ATT 816 Gln Pro Val Gly Gln Leu '"h Arg Glu Val Tyr Thr Asp Pro Leu He 260 265 270 AAT AAT CCA CAG TTA CAG TCT GTA GCT CAA TTA A.CT TTT AAC 864 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 GTT ATG GAG AGC AGC GCA ATT AGA AAT CCT TTA TT GAT ATA TTG 912 Val Met Glu Ser Ser Ala He Arg Asn Pro His Leu Phe Asp He Leu 290 295 300 AAT AAT CTT ACÁ ATC TT ACG GAT TGG TTT AGT C-TT r.r,r. JO AAT TTT 960 Asn Asn Leu Thr He Phe T Asp Trp Phe Ser Val Gly Arg Asn Phe 305 310 315 320 TAT TGG GGA GGA CAT CGA GTA ATA TCT AGC CTT ATA GGA GGT GGT AAC 1008 Tyr Trp Gly Gly Hl? Arg Val He Ser Ser Leu He Glv Gly Gly Asn 325 330 335 ATA ACÁ TCT CCT ATA TAT GGA AGA GAG GCG AAC GAG CCT CCA AGA 1056 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gin Glu Pro Pro Arg 340 345 350 CC TTT ACT TTT AAT GGA CCG GTA TT AGG ACT TTA TCA AAT CCT ACT 1104 Ser Phe Thr Phe Asn Giy Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 TTA CGA TTA TTA CAG CAA CCT TGG CCA rlj-.*r—.r. CCA CCA TTT AAT TTA CGT 1152 Leu Arg Leu Leu Gln Glr. Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 GGT GTT GAA GGA GTA GAA TT TCT ACÁ CCT ACÁ n T AGC TTT ACG TAT 1200 Gly Val Glu Gly Val Glu Pne Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 CGA GGA AGA GGT ACG GTT GAT TCT TTA ACT GAA TTA CCG CCT GAG GAT 1248 Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 AAT AGT GTG CCA CCT CGC GAA GGA TAT AGT CAT CGT TTA TGT CAT GCA 1296 .Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala 420 425 430 TTT GTT CAA AGA TCT GGA ACÁ CCT TT TTA ACT GGT GTA GTA 1344 Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 TT TCT TGG ACG CAT CGT AGT GCA ACT CTT ACÁ AAT ACÁ ATT GAT CCA 1392 Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 GAG AGA ATT AAT CAA ATA CCT TTA GTG AAA GGA TTT AGA GTT TGG GGG 1440 Glu Arg He A?? Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 ACC TCT GTC ATT ACÁ GGA CCA GGA TTT ACÁ GGG GAT ATC CTT 1488 — y Thr Ser Val He Thr Giy Pro Gly Phe Thr iy C-ly Asp He Leu 485 490 495 CGA AGA AAT ACC TTT GGT GAT TTT GTA TCT Inrt GTC AAT ATT AAT 1536 Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu G n Val Asn He Asn 500 505 510 TCA CCA ATT ACC CAA AGA TAC CGT TTA AGA TTT CGT TAC GCT TCC AGT 1584 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Pne Arg Tyr Ala Ser Ser 515 520 525 AGG GAT GCA CGA GTT ATA GTA TTA ACÁ GGA GCG GCA TCC ACÁ GGA GTG 1632 Arg Asp Ala Arg Val He Val Leu Thr Giy Ala Ala Ser Thr Giy Val 530 535 =40 GGA GGC CAA GTT AGT GTA AAT ATG CCT CTT CAG AAA ACT ATG GAA ATA 1680 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu He 545 550 555 560 GGG GAG AAC TTA ACÁ TCT AGA ACÁ TTT AGA TAT ACC GAT TTT AGT AAT 1728 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 CCT TTT TCA TTT AGA GCT AAT CCA GAT ATA ATT GGG ATA AGT GAA CAA 1776 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 CCT CTA TTT GGT GCA GGT TCT ATT AGT AGC GGT GAA CTT TAT ATA GAT 1824 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Giu Leu Tyr He Asp 595 600 605 AAA ATT GAA ATT ATT CTA GCA GAT GCA ACÁ TTT GAA GCA GAA TCT GAT 1872 Ly? He Glu He He Leu Ala A?P Ala Thr Phe Glu Ala Glu Ser Asp 610 615 620 TTA GAA AGA GCA CAA AAG GCG GTG AAT GCC CTG TTT ACT TCT TCC AAT 1920 Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 640 CAA ATC GGG TTA AAA ACC GAT GTG ACG GAT TAT CAT ATT GAT CAA GTA 1968 Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr H s He Asp Gln Val 645 650 655 TCC AAT TTA GTG GAT TGT TTA TCA GAT GAA TTT TGT CTG GAT GAA AAG 2016 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 CGA GAA TTG TCC GAG AAA GTC AAA CAT GCG AAG CGA CTC AGT GAT GAG 2064 Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu 675 680 685 CGG AAT TTA CTT CAA GAT CCA AAC TTC AGA GGG ATC AAT AGA CAA CCA 2112 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Glr. Pro 690 695 700 GAC CGT GGC TGG AGA GGA AGT ACÁ GAT ATT ACC ATC CAA GGA GGA GAT 2160 Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Gly Asp 705 710 715 720 GAC GTA TTC AAA GAG AAT TAC GTC ACÁ CTA CCG GGT ACC GTT GAT GAG 2208 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu 725 730 735 TGC TAT CCA ACG TAT TTA TAT CAG AAA ATA GAT GAG TCG AAA TTA AAA 2256 Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Giu Ser Lys Leu Lys 740 745 750 GCT TAT ACC CGT TAT GAA TTA AGA GGG TAT ATC GAA GAT AGT CAA GAC 2304 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Giu Asp Ser Gln Asp „ 760 765 TTA GAA ATC TAT TTG ATC CGT TAC AAT GCA AAA CAC GAA ATA GTA AAT 2352 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys His Glu He Val Asn 770 775 780 GTG CCA GGC ACG GGT TCC TTA TGG CCG CTT TCA GCC CAA AGT CCA ATC 2400 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He 785 790 795 800 GGA AAG TGT GGA GAA CCG AAT CGA TGC GCG CCA CAC CTT GAA TGG AAT 2448 Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His Leu Glu Trp Asn 805 810 815 CCT GAT CTA GAT TGT TCC TGC AGA GAC GGG GAA AAA TGT GCA CAT CAT 2496 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His 820 825 830 TCC CAT CAT TTC ACC TTG GAT ATT GAT GTT GGA TGT ACÁ GAC TTA AAT 2544 Ser His His Phe Thr Leu Asp He Asp Val Gly Cys Thr Asp Leu Asn 835 840 845 GAG GAC TTA GGT GTA TGG GTG ATA TTC AAG ATT AAG ACG CAA GAT GGC 2592 Glu Asp Leu Gly Val Trp Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 860 CAT GCA AGA CTA GGG AAT CTA GAG TTT CTC GAA GAG AAA CCA TTA TTA 2640 His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu 865 870 875 880 GGG GAA GCA CTA GCT CGT GTG AAA AGA GCG GAG AAG AAG TGG AGA GAC 2688 Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 AAA CGA GAG AAA CTG CAG TTG GAA ACÁ AAT ATT GTT TAT AAA GAG GCA 2736 Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 AAA GAA TCT GTA GAT GCT TTA TTT GTA AAC TCT CAA TAT GAT AGA TTA 2784 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu 915 920 925 CAA GTG GAT ACG AAC ATC GCA ATG ATT CAT GCG GCA GAT AAA CGC GTT 2832 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 CAT AGA ATC CGG GAA GCG TAT CTG CCA GAG TTG TCT GTG ATT CCA GGT 2880 His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 95C 955 960 GTC AAT GCG GCC ATT TTC GAA GAA TTA GAG GGA CGT ATT TTT ACÁ GCG 2928 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 TAT TCC TTA TAT GAT GCG AGA AAT GTC ATT AAA AAT GC-C GAT TTC AAT 2976 Tyr Ser Leu Tyr Asp Ala Arg Asr. Val He Lys Asn Gly A?p Phe A?? 980 985 990 AAT GGC TTA TTA TGC TGG AAC GTG AAA GGT CAT GTA GAT GTA GAA GAG 3024 Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu 995 1000 1005 CAA AAC AAC CAC CGT TCG GTC CTT GTT ATC CCA GAA TGG GAG GCA GAA 3072 Gln Asn Asn His Arg Ser Val Leu Val He Pro Giu Trp Glu Ala Glu 1010 1015 1020 GTG TCA CAA GAG GTT CGT GTC TGT CCA GGT CGT GGC TAT ATC CTT CGT 3120 Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 GTC ACÁ GCA TAT AAA GAG GGA TAT GGA GAG GGC TGC GTA ACG ATC CAT 3168 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 GAG ATC GAA GAC AAT ACÁ GAC GAA CTG AAA TTC AGC AAC TGT GTA GAA 3216 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 GAG GAA GTA TAT CCA AAC AAC ACÁ GTA ACG TGT AAT AAT TAT ACT GGG 3264 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 ACT CAA GAA GAA TAT GAG GGT ACG TAC ACT TCT CGT AAT CAA GGA TAT 331-Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 GAC GAA GCC TAT GGT AAT AAC CCT TCC GTA CCA GCT GAT TAC GCT TCA 3360 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala A?p Tyr Ala Ser 1105 1110 1115 1120 GTC TAT GAA GAA AAA TCG TAT ACÁ GAT GGA CGA AGA GAG AAT CCT TGT 3408 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys 1125 1130 1135 GAA TCT AAC AGA GGC TAT GGG GAT TAC ACÁ CCA CTA CCG GCT GGT TAT 3456 Glu Ser Asn Arg Giy Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr 1140 1145 1150 GTA ACÁ AAG GAT TTA GAG TAC TTC CCA GAG ACC GAT AAG GTA TGG ATT 3504 Val Thr Lys Asp Leu Glu Tyr Phe Pro Giu Thr Asp Lys Val Trp He 1155 1160 1165 GAG ATC GGA GAA ACÁ GAA GGA ACÁ TTC ATC GTG GAT AGC GTG GAA TTA 3552 Glu He Gly Glu Thr Glu Gly Thr Phe He Val Asp Ser Val Glu Leu 1170 1175 1180 CTC CTT ATG GAG GAA 3567 Leu Leu Met Glu Glu 1185 (2) INMACIÓN PARA SEQ ID NO: 61 : (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 1189 aminoácidos (B).-TIPO: aminoácido (D).-TOPOLOGÍA: lineal (ii).-TIPO DE MOLÉCULA: proteína (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 61 : Met Glu Glu Asn Asn 3,-r. Asn Gln Cys He Pro Tyr Asn Cys Leu Ser 1 5 10 15 Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg He Ser Thr Giy Asn 20 25 30 Ser Ser He Asp He Ser Leu Ser Leu Val Gln Phe Leu Val Ser Asn 40 45 Phe Val Pro Gly Gly Gly Phe Leu Val Gly Leu He Asp Phe Val Trp 50 55 60 Gly He Val Giy Pro Ser Gln Trp Asp Ala Phe Leu Val Gln He Glu 65 70 75 80 Gln Leu He Asn Glu Arg He Ala Glu Phe Ala Arg Asn Ala Ala He 85 90 95 Ala Asn Leu Glu Giy Leu Gly Asn Asn Phe Asr. He Tyr Val Glu Ala , 100 105 110 Phe Lys Glu Trp Glu Glu Asp Pro Asn Asn Pro Ala Thr Arg Thr Arg 115 120 125 Val He Asp Arg Phe Arg He Leu Asp Gly Leu Leu Glu Arg Asp He 130 135 140 Pro Ser Phe Asp He Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr 145 150 155 160 Ala Gln Ala Ala Asn Leu His Leu Ala He Leu Arg Asp Ser Val He 165 170 175 Phe Gly Glu Arg Trp Gly Leu Thr Thr He Asn Val A?? Glu Asn Tyr 180 185 190 Asn Arg Leu lie Arg His He Asp Glu Tyr Ala Asp K s Cys Ala Asn 195 200 205 Thr Tyr Asn Arg Gly Leu Asn Asn Leu Pro Ala Ser Thr Tyr Gln Asp 210 215 220 Trp He Thr Tyr Asn Arg Leu Arg Arg Asp Leu Thr Leu Thr Val Leu 225 230 235 240 Asp He Ala Ala Phe Phe Pro Asn Tyr Asp Asn Arg A.rg Tyr Pro He 245 250 255 Gln Pro Val Gly Gin Leu Thr Arg Giu Val Tyr Thr Asp Pro Leu He 260 265 270 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Glr. Leu Pro Thr Phe Asn 275 280 285 Val Met Glu Ser Ser Ala He Arg Asn Pro H s Leu Phe Asp He Leu 290 295 300 Asn Asn Leu Thr He Phe Thr Asp Trp Phe Ser Val Gly Arg Asn Phe 305 310 315 320 Tyr Trp Gly Gly His Arg Val He Ser Ser Leu He Gly Gly Gly Asn 325 330 335 He Thr Ser Pro He Tyr Gly Arg Glu Ala Asn Gln Glu Pro Pro Arg 340 345 350 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 Leu Arg Leu Leu Gln Gln Pro Trp Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 Gly Val Giu Gly Val Glu Phe Ser Thr Pro Thr Asn Ser Phe Thr Tyr 385 390 395 400 Arg Gly Arg Gly Thr Val Asp Ser Leu Thr Glu Leu Pro Pro Glu Asp 405 410 415 Asn Ser Val Pro Pro Arg Glu Gly Tyr Ser His Arg Leu Cy? His Ala 420 425 430 Thr Phe Val Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 Phe Ser Trp Thr His Arg Ser Ala Thr Leu Thr Asn Thr He Asp Pro 450 455 460 Glu Arg He Asn Gln He Pro Leu Val Lys Gly Phe Arg Val Trp Gly 465 470 475 480 Gly Thr Ser Val He Thr Gly Pro Gly Phe Thr Gly Gly Asp He Leu 485 490 495 Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln Val Asn He Asn 500 505 510 Ser Pro He Thr Gln Arg Tyr Arg Leu Arg Phe Arg Tyr Ala Ser Ser 515 520 525 Arg Asp Ala Arg Val He Val Leu Thr Gly Ala Ala Ser Thr Gly Val 530 535 540 Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys Thr Met Glu He 545 550 555 560 Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr Asp Phe Ser Asn 565 570 575 Pro Phe Ser Phe Arg Ala Asn Pro Asp He He Gly He Ser Glu Gln 580 585 590 Pro Leu Phe Gly Ala Gly Ser He Ser Ser Gly Glu Leu Tyr He Asp 595 600 605 Lys He Glu He He Leu Ala Asp Ala Thr Phe Glu Ala Glu Ser Asp 610 615 620 Leu Glu Arg Ala Glr. Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn 625 630 635 640 Gln He Gly Leu Lys Thr Asp Val Thr Asp Tyr His He Asp Gln Val 645 650 655 Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 660 665 670 Arg Giu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu 675 680 685 Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly He Asn Arg Gln Pro 690 695 700 Asp Arg Gly Trp Arg Gly Ser Thr Asp He Thr He Gln Gly Gly Asp 705 710 715 720 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Prc Gly Thr Val Asp Glu 725 730 735 Cy? Tyr Pro Thr Tyr Leu Tyr Gln Lys He Asp Glu Ser Lys Leu Lys 740 745 750 Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr He Glu Asp Ser Gln Asp 755 760 765 Leu Glu He Tyr Leu He Arg Tyr Asn Ala Lys His Glu He Val Asn 770 775 780 Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro He 785 790 795 800 Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His Leu Glu Trp Asn 805 810 815 Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Giu Lys Cys Ala His His 820 825 830 Ser His His Phe Thr Leu Asp He Asp Val Gl\ Cys Tnr Asp Leu Asn 835 840 845 Glu Asp Leu Gly Val Tr Val He Phe Lys He Lys Thr Gln Asp Gly 850 855 860 His Ala Arg L<=>u Gly Asn Leu Glu Phe Leu Giu Glu Lys Pro Leu Leu 865 870 875 880 Giy Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp 885 890 895 Lys Arg Giu Lys Leu Gln Leu Glu Thr Asn He Val Tyr Lys Glu Ala 900 905 910 Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gin Tyr Asp Arg Leu 915 920 925 Gln Val Asp Thr Asn He Ala Met He His Ala Ala Asp Lys Arg Val 930 935 940 His Arg He Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val He Pro Gly 945 950 955 960 Val Asn Ala Ala He Phe Glu Glu Leu Glu Gly Arg He Phe Thr Ala 965 970 975 Tyr Ser Leu Tyr Asp Ala Arg Asn Val He Lys Asn Gly Asp Phe Asn 980 985 990 Asn Giy Leu Leu Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu 995 1000 1005 Gln Asn Asn His Arg Ser Val Leu Val He Pro Glu Trp Glu Ala Glu 1010 1015 1020 Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr He Leu Arg 1025 1030 1035 1040 Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr He His 1045 1050 1055 Glu He Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu 1060 1065 1070 Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly 1075 1080 1085 Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln Gly Tyr 1090 1095 1100 Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser 1105 1110 1115 1120 Val Tyr Glu Glu Lys Ser Tyr Thr Asp Giy Arg Arg Glu Asn Pro Cys 1125 1130 1135 Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu ro AA-¡ Gly Tyr 1140 1145 1150 Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp He 1155 1160 1165 Glu He Gly Glu Thr Glu Giy Thr Phe He Val Asp Ser Val Giu Leu 1170 1175 1180 Leu Leu Met Glu Glu 1185 (2).- INFORMACIÓN PARA SEQ ID NO: 62: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 47 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 62: CGGGGATTAA ATAATTTACC GGCTAGCACG TATCAAGATT GGATAAC 47 (2).- INFORMACIÓN PARA SEQ ID NO: 63: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 46 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 63: CGGGGATTAA ATAATTTACC GAAAAACGTA TCAAGATTGG ATAAC 45 (2).- INFORMACIÓN PARA SEQ ID NO: 64: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 23 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 64: GGATAGCACTCATCAAAGGTACC 23 (2).- INFORMACIÓN PARA SEQ ID NO: 6d: (í).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 45 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 65: CGGCGATTAA ATAATACCGA AAAGCACGTA TCAAGATTGG ATAAC 45 (2).- INFORMACIÓN PARA SEQ ID NO: 66: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 45 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRlPCIÓN DE LA SECUENCIA: SEQ ID NO: 66: CGGGGATTAA ATAATTTAAA AAAGCACGTA TCAAGATTGG ATAAC 45 (2).- INFORMACIÓN PARA SEQ ID NO: 67: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 45 pares de bases (B). -TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 67: CGGGGATTAA ATAATTTACC GAAGCACGTA TCAAGATTGG ATAAC 45 (2).- INFORMACIÓN PARA SEQ ID NO: 68: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 51 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 68: GGATTAAATA ATTTACCGAA AAGCATATCA AGATTGGATA ACATATAATC G 51 (2).- INFORMACIÓN PARA SEQ ID NO: 69: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 51 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 69: GGATTAAATA ATTTACCGAA AAGCACGACA AGATTGGATA ACATATAATC G 51 (2).- INFORMACIÓN PARA SEQ ID NO: 70: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 70: GATTCTGTAA I I I I lAGAAA GATGGGGATT GACAACGATA AATGTCAATG 50 (2).- INFORMACIÓN PARA SEQ ID NO: 71: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 71 : GATTCTGTAA I I I I I GGAAA GATGGGGATT GACAACGATA AATGTCAATG 50 (2).- INFORMACIÓN PARA SEQ ID NO: 72: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 50 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 72: GATTCTGTAA TTTTTGGAGA AATGGGGATT GACAACGATA AATGTCAATG 50 (2).- INFORMACIÓN PARA SEQ ID NO: 73: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 52 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 73: TCTGTAATTT TTGGAGAAAG AAGGATTGAC AACGATAAAT GTCAATGAAA AC 52 (2).- INFORMACIÓN PARA SEQ ID NO: 74: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 49 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 74: GTAATTTTTG GAGAAAGATG GATTGACAAC GATAAATGTC AATGAAAAC 49 (2).- INFORMACIÓN PARA SEQ ID NO: 75: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 49 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 75: GTAATTTTTG GAGAAAGATG GGGAAACAAC GATAAATGTC AATGAAAAC 49 (2).- INFORMACIÓN PARA SEQ ID NO: 76: (i).- CARACTERÍSTICAS DE LA SECUENCIA: (A).-LONGITUD: 49 pares de bases (B).-TIPO: ácido nucleico (C).-No. DE FILAMENTOS: uno solo (D).-TOPOLOGÍA: lineal (xi).-DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 76: GTAATTTTTG GAGAAAGATG GGGATTGAAC GATAAATGTC AATGAAAAC 49

Claims (62)

NOVEDAD DE LA INVENCIÓN REIVINDICACIONES
1.- Un segmento de ácido nucleico de alrededor de 3567 a alrededor de 10,000 nucleótidos de largo, caracterizado porque comprende un gene de delta-endotoxina que codifica un polipéptido que comprende la secuencia de aminoácido de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61.
2.- El segmento de ácido nucleico de conformidad con la reivindicación 1, caracterizado además porque el segmento de ácido nucleico codifica un polipéptido que tiene actividad insecticida contra lepidópteros.
3.- El segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado además porque el segmento de ácido nucleico es aislable de Bacillus thuringiensis EG12111 , EG12121, NRRL B-21590, NRRL B-21591 , NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609 o NRRL B-21610.
4.- El segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado además porque ei segmento de ácido nucleico se híbrida específicamente a un segmento de ácido nucleico que tiene la secuencia de SEQ ID NO: 1 , SEQ ID NO: 3, SEA ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60, o un complemento del mismo.
5.- El segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado además porque el segmento de ácido nucleico comprende la secuencia de ácido nucleico de SEQ ID NO: 1 ,
SEQ ID NO: 3, SEQ ID NO: d, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60, o un complemento del mismo. 6.- El segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado además porque está definido adicionalmente como un segmento de ADN.
7.- El segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado además porque dicho segmento de ácido nucleico está enlazado operablemente a un promotor que expresa el segmento de ácido nucleico en una célula anfitriona.
8.- El segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado además porque está incluido dentro de un vector recombinante.
9.- El segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado además porque está incluido dentro de un plásmido, cósmido, fago, fagémido, viral, baculovirus, cromosoma artificial bacteriano o un vector recombinante de cromosoma artificial de levadura.
10.- El segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado además porque se utiliza en un método de expresión recombinante para preparar un polipéptido recombinante.
11.- El segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado además porque se usa en la preparación de una planta transgénica resistente a los insectos.
12.- Un método para usar un segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado porque comprende expresar dicho segmento de ácido nucleico en una célula anfitriona y recolectar el polipéptido expresado.
13.- El uso de un segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones 1 a 11 , en la preparación de una composición de polipéptido recombinante.
14.- El uso de un segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones 1 a 11 , en la generación de un vector para uso en la producción de una planta transgénica resistente a los insectos.
15.- El uso de un segmento de ácido nucleico de conformidad con cualquiera de las reivindicaciones 1 a 11 , en la generación de una planta transgénica resistente a los insectos.
16.- Una célula anfitriona, caracterizada porque comprende un segmento de ácido nucleico conforme a cualquiera de las reivindicaciones 1 a 11.
17.- La célula anfitriona de conformidad con la reivindicación 16, caracterizada además porque la célula anfitriona es una célula bacteriana.
18.- La célula anfitriona de conformidad con la reivindicación 16 o 17, caracterizada además porque dicha célula es una célula de E. coli, B. thuringiensis, B. subtilis, B. megaterium o de Pseudomonas spp. 19.- La célula anfitriona de conformidad con cualquiera de las reivindicaciones 16 a 18, caracterizada además porque dicha célula es una célula de B. thuringiensis EG12111 , EG12121 , NRRL B-21590, NRRL B-21591,
NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B- 21609 o NRRL B-21610.
20.- La célula anfitriona de conformidad con la reivindicación 16, caracterizada además porque dicha célula es una célula eucariótica.
21.- La célula anfitriona de conformidad con la reivindicación 20, caracterizada además porque dicha célula es una célula vegetal.
22.- La célula anfitriona de conformidad con la reivindicación 20 o 21, caracterizada además porque dicha célula es una célula de grano, árbol, legumbre, fruto, baya, nuez, pasto, cactus, suculenta o planta ornamental.
23.- La célula anfitriona de conformidad con cualquiera de las reivindicaciones 20 o 22, caracterizada además porque dicha célula es una célula de maíz, arroz, tabaco, papa, tomate, lino, cañóla, girasol, algodón, trigo, avena, cebada o centeno.
24.- La célula anfitriona de conformidad con cualquiera de las reivindicaciones 20 a 23, caracterizada además porque dicha célula está comprendida dentro de una planta transgénica.
25.- La célula anfitriona de conformidad con cualquiera de las reivindicaciones 20 a 24, caracterizada además porque dicha célula produce un polipéptido que tiene actividad insecticida contra lepidópteros.
26.- La célula anfitriona de conformidad con cualquiera de las reivindicaciones 16 a 25, caracterizada además porque se usa en la expresión de un polipéptido recombinante.
27.- La célula anfitriona de conformidad con cualquiera de las reivindicaciones 16 a 25, caracterizada además porque se usa en la preparación de una planta transgénica.
28.- El uso de una célula anfitriona de conformidad con cualquiera de las reivindicaciones 16 a 25, en la generación de células de plantas pluripotentes.
29.- El uso de una célula anfitriona de conformidad con cualquiera de las reivindicaciones 16 a 25, en la preparación de una formulación de polipéptido insecticida.
30.- Una composición, caracterizada porque comprende un polipéptido aislado que comprende la secuencia de aminoácido de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SQ ID NO: 59 o SEQ ID NO: 61.
31.- La composición de conformidad con la reivindicación 30, caracterizada además porque el polipéptido es insecticidamente activo contra lepidópteros.
32.- La composición de conformidad con la reivindi-cación 30 o 31 , caracterizada además porque el polipéptido es aislable de Bacillus thuringiensis
EG12111 , EG12121 , NRRL B-21590, NRRL B-21591 , NRRL B-21592, NRRL i B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609 o NRRL B-21610. 5 33.- La composición de conformidad con cualquiera de las reivindicaciones 30 a 32, caracterizada además porque el polipéptido constituye alrededor de 0.5% a 99% en peso de la composición.
34.- La composición de conformidad con cualquiera de las reivindicaciones 30 a 33, caracterizada además porque el polipéptido constituye 10 alrededor de 50% a 99% en peso de la composición.
35.- Una composición, caracterizada porque comprende un polipéptido preparable mediante un procedimiento que comprende los pasos de: (a) cultivar una célula de B. thuringiensis EG12111 , EG12121 , NRRL B-21590, NRRL B-21591 , NRRL B-21592, NRRL B-21638, NRRL B-21639, NRRL B- 15 21640, NRRL B-21609 o NRRL B-21610, bajo condiciones efectivas para producir una composición que comprende un polipéptido de B. thuringiensis; y (b) obtener dicha composición a partir de ia célula.
36.- Una composición de conformidad con cualquiera de las reivindicaciones 30 a 35, para uso en dar muerte a una célula de insecto. 20
37.- El uso de una composición de conformidad con cualquiera de las reivindicaciones 30 a 36, en la preparación de una formulación insecticida.
38.- El uso de una composición de conformidad con cualquiera de las reivindicaciones 30 a 36, en la preparación de una formulación para rociar, protectora de plantas.
39.- Un método para preparar una proteína cristalina de B. thuringiensis, caracterizado porque comprende: (a) cultivar una célula de B. thuringiensis EG12111 , EG12121 , NRRL B-21590, NRRL B-21591 , NRRL B-21692, NRRL B-21638, NRRL B-21639, NRRL B-21640, NRRL B-21609 o NRRL B-21610, bajo condiciones efectivas para producir una proteína cristalina de B. thuringiensis; y (b) obtener dicha proteína cristalina de B. thuringiensis, de dicha célula.
40.- Un método para matar una célula de insecto, caracterizado porque comprende proveer a una célula de insecto una cantidad insecticidamente efectiva de una composición de conformidad con cualquiera de las reivindicaciones 30 a 36.
41.- El método de conformidad con la reivindicación 40, caracterizado además porque la célula de insecto está incluida dentro de un insecto.
42.- El método de conformidad con la reivindicación 41 , caracterizado además porque el insecto ingiere dicha composición al ingerir una planta revestida con esa composición.
43.- El método de conformidad con la reivindicación 41 o 42, caracterizado además porque ei insecto ingiere dicha composición al ingerir una planta transgénica que expresa dicha composición.
44.- Un anticuefo purificado, caracterizado porque se une específicamente a un polipéptido que comprende la secuencia de aminoácido de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61.
45.- El anticuerpo de conformidad con la reivindicación 44, caracterizado además porque está fijado operativamente a una etiqueta detectable.
46.- Un equipo de ¡nmunodetección, caracterizado porque comprende, en un contenedor adecuado, un anticuerpo de conformidad con la reivindicación 44 o 45, y un reactivo de inmunodetección.
47.- Un método para detectar un polipéptido insecticida en una muestra biológica, caracterizado porque comprende poner en contacto una muestra biológica que se sospecha que contiene dicho polipéptido insecticida, con un anticuerpo de acuerdo con cualquiera de las reivindicaciones 44 a 46, bajo condiciones efectivas para permitir la formación de inmunocomplejos; y detectar los inmunocompiejos así formados.
48.- Una planta transgénica, caracterizada porque tiene incorporado en su genoma un transgene que codifica un polipéptido que comprende la secuencia de aminoácido de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 59 o SEQ ID NO: 61.
49.- La planta transgénica de conformidad con la reivindicación 48, caracterizada además porque el transgene comprende la secuencia de ácido nucleico de SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11 , SEQ ID NO: 58 o SEQ ID NO: 60.
50.- La progenie de la planta de conformidad con la reivindicación 48 o 49.
51.- La semilla de la planta o de la progenie de cualquiera de las reivindicaciones 48 a 50.
52.- Una planta procedente de la semilla de la reivindicación 51.
53.- Un método para seleccionar un polipéptido Cryl que tiene actividad insecticida incrementada contra un insecto lepidóptero, caracterizado porque comprende: someter a mutagénesis una población de polinucleótidos para preparar una población de polipéptidos codificados por los polinucleótidos y probar dicha población de polipéptidos; e identificar un polipéptido que tiene uno o más aminoácidos modificados, en una región de rizo del dominio 1 , o en una región de rizo entre el dominio 1 y el dominio 2; donde el polipéptido tiene actividad insecticida incrementada contra los insectos.
54.- Un método para generar un polipéptido Cryl que tiene actividad insecticida incrementada contra un insecto lepidóptero, caracterizado porque comprende los pasos de: (a) identificar en el polipéptido una región de rizo entre hélices alfa adyacentes del dominio 1 , o entre una hélice alfa del dominio 1 y un filamento beta del dominio 2; (b) someter a mutagénesis el polipéptido en al menos uno o más aminoácidos de una o más de dichas regiones de rizo identificadas; y (c) probar el polipéptido sometido a mutagénesis, para identificar un polipéptido que tiene actividad insecticida incrementada contra esos insectos lepidópteros.
55.- Un método para someter a mutagénesis un polipéptido Cryl para aumentar la actividad insecticida del polipéptido contra un insecto lepidóptero; caracterizado dicho método porque comprende los pasos de: (a) predecir en el polipéptido una secuencia de aminoácido que codifica una región de rizo entre hélices alfa adyacentes del dominio 1 o entre una hélice alfa del dominio 1 y un filamento beta del dominio 2; (b) someter a mutagénesis uno o más de los residuos de aminoácido en la secuencia de aminoácido contigua, para producir una población de polipéptidos que tienen una o más regiones de rizo alteradas; (c) probar la población de polipéptidos para actividad insecticida contra el insecto lepidóptero; y (d) identificar en esa población un polipéptido que tiene actividad insecticida incrementada contra el insecto lepidóptero.
56.- El método de conformidad con cualquiera de las reivindicaciones 53 a 55, caracterizado además porque dicha secuencia de aminoácido modificada comprende una región de rizo entre las hélices alfa 1 y 2a, las hélices alfa 2b y 3, las hélices alfa 3 y 4, las hélices alfa 4 y 5, las hélices alfa 5 y 6 o las hélices alfa 6 y 7 del dominio 1 ; o entre la hélice alfa 7 del dominio 1 y el filamento beta 1 del dominio 2.
57.- El método de conformidad con cualquiera de las reivindicaciones 63 a 66, caracterizado además porque la región de rizo entre las hélices alfa y 2a comprende una secuencia de aminoácido de alrededor de alrededor del aminoácido 41 a alrededor del aminoácido 47 de una proteína Cryl ; dicha región de rizo entre las hélices alfa 2b y 3 comprende una secuencia de aminoácido desde alrededor del aminoácido 83 a alrededor del aminoácido 89 de una proteína Cryl; dicha región de rizo entre las hélices alfa 3 y 4 comprende una secuencia de aminoácido de alrededor del aminoácido 118 a alrededor del aminoácido 124 de una proteína Cryl ; dicha región de rizo entre las hélices alfa 4 y 5 comprende una secuencia de aminoácido desde alrededor del aminoácido 148 a alrededor del aminoácido 156 de una proteína Cryl ; dicha región de rizo entre las hélices alfa 5 y 6 comprende una secuencia de aminoácido desde alrededor del aminoácido 176 a alrededor del aminoácido 85 de una proteína Cryl; dicha región de rizo entre las hélices alfa 6 y 7 comprende una secuencia de aminoácido desde alrededor del aminoácido 217 a alrededor del aminoácido 222 de una proteína Cryl ; y dicha región de rizo entre la hélice alfa 7 del dominio 1 y el filamento beta 1 del dominio 2, comprende una secuencia de aminoácido desde alrededor del aminoácido 249 hasta alrededor del aminoácido 259 de una proteína Cryl .
58.- El método de conformidad con la reivindicación 57, caracterizado además porque la proteína Cryl es una proteína cristalina CrylA, CrylB, CrylC, CrylD, CrylE, CrylF, CrylG, CrylH, Cryl l, CryU o Cryl K.
59.- El método de conformidad con la reivindicación 57 o 58, caracterizado además porque la proteína Cn/1 es una proteína cristalina CrylAa, CrylAb, CrylAc, CrylAd, CrylAe, CrylBa, CrylBb, CrylBc, CrylCa, CrylCb, CrylDa, Cry1Db,m CrylEa, CrylEb, CrylFa, CrylFb, CrylHb, Cryl la, Cryllb, Cr Ua o CryUb. 313
60.- El método de conformidad con cualquiera de las reivindicaciones 53 a 59, caracterizado además porque la región de rizo comprende un residuo arginina sustituido por un residuo alanina, leucina, metionina, glicina o ácido aspártico, o un residuo lisina sustituido por un residuo alanina.
61.- El método de conformidad con cualquiera de las reivindicaciones 53 a 59, caracterizado además porque el residuo de aminoácido modificado comprende Lys219, Arg86, Arg148, Arg180, Arg252 o Arg2d3.
62.- El método de conformidad con cualquiera de las reivindicaciones 63 a 61 , caracterizado además porque el polipéptido es un polipéptido Cry1C-R148L, Cry1 C-R148M, Cry1C-R148D, Cry1 C-R148D-K219A, Cry1C-R148A, Cry1 C-R148A-K219A, Cry1C-R148G, Cryl C.563, Cryl C.579 o Cryl C.499.
MXPA/A/1999/004903A 1996-11-27 1999-05-26 Adn que codifica para delta-endotoxinas activascontra lepidopteros, y su uso MXPA99004903A (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08757536 1996-11-27

Publications (1)

Publication Number Publication Date
MXPA99004903A true MXPA99004903A (es) 2000-05-01

Family

ID=

Similar Documents

Publication Publication Date Title
US6541448B2 (en) Polypeptide compositions toxic to anthonomus insects, and methods of use
AU745431B2 (en) DNA encoding lepidopteran-active delta-endotoxins and its use
US6593293B1 (en) Lepidopteran-active Bacillus thuringiensis δ-endotoxin compositions and methods of use
DE69730730T2 (de) Delta-endotoxine mit breitem spektrum
AU769939B2 (en) Coleopteran-toxic polypeptide compositions and insect-resistant transgenic plants
CA2314429C (en) Insect-resistant transgenic plants and methods for improving .delta.-endotoxin activity against target insects
BRPI9915828B1 (pt) construto de dna, microorganismo transgênico, bem como métodos de controle e eliminação de inseto lepidóptero ou coleóptero
MXPA99004903A (es) Adn que codifica para delta-endotoxinas activascontra lepidopteros, y su uso